
1.医学统计学:是指导人们如何对科学探索活动进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助人们揭示疾病或现象发生、发生在规律,为预防疾病、促进健康提供客观依据。
2.同质:除了实验因素外,影响被研究指标的非实验因素相同。
变质:在同质的基础上被观察个体之间的差异。
总体:根据研究目的确定的、同质的全部研究对象。
样本:根据随机化的原则,从总体中抽出的有代表性的一部分观察单位组成的子集。
参数:总体的统计指标。
统计量:样本的统计指标。
随机抽样误差(简称为抽样误差):从同一总体中抽样,得到某变量值的统计量和总体参数之间的差别,称为~。该误差不可避免。
概率:是描述随机事件发生可能性大小的度量。常用P表示,P值在0~1之间。
小概率事件:P≦0.05或P≦0.01随机事件,称为小概率事件,即发生概率很小。统计学上认为一次抽样是不可能发生的。
3.数值变量资料:即计量资料,用定量的方法对观察单位进行测量得到的资料称为~
分类变量资料:即计数资料,用定性的方法得到的资料。
等级资料:不能精确测量,反能根据相对大小分为几个等级。
变 数值变量 计量资料
量 二分类变量 计数资料 资料类型
类 分类变量 无序分类变量
型 多分类变量 有序分类变量 等级资料
无序分类变量:无轻重好坏之分,如血型(O、A、B、AB)。
有序分类变量:有轻重好坏之分,如治愈病人的1个和98个是不一样的。
4.医学统计学工作基本步骤有4个:设计②搜集资料③整理④分析资料
第八章 数值变量资料的统计描述
1.频数分布表及其制作:计算极差:又称为全距,是最大值与最小值之差②决定分组、组段、和组距:分组:通常分为8~15组,常用分为10组。组距:相邻两组段下线值之差。③列表标记 对称分布 正偏态(右偏态)
2. 频数分布类型 偏态分布 负偏态(左偏态)
集中趋势指标
算术平均数:总体均数(μ),样本均数( )。适用:呈正态分布(或近似正态或对
称分布。
几何平均数(G):适用:当一组观察值为非对称分布、其差距较大时,用均数表示其平均水平会受少数特大或特小值影响②数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。公式:
中位数(M):适用:当资料呈明显偏态分布②资料一端或两端无确定数值(如大于或小于某数值)③资料的分布情况不清楚
百分位数(Px):公式:
三种平均数的特点
算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。--正态分布
几何均数:一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。
中位数:不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。--偏态分布
3.离散趋势指标
全距(R):一组数据最大值与最小值之差。
四分位数间距(Q):适用:偏态分布 公式:Q≒P75-P25
方差和标准差:总体方差(2 ),样本方差(S2)。公式:
变异系数(CV):常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。公式:
对应的集中趋势和离散趋势
正态分布:均数 标准差
偏态分布:中位数 四分位数间距
4.对于任何一个均数和标准差分别为—与—的正态分布,都可以通过变量的标准正态变换。
(称为正态差),使之成为标准正态分布。
μ表明总体重心所在,是位置参数;标准差σ表示测量值的距离,σ小—瘦高;σ大—矮胖
5.正态分布基本特征:正态曲线在横轴上方,且均数所在处最高②正态分布以均数为
中心,左右对称③正态分布有两个参数,即均数与标准差,标准正态分布非均数和标准差分别为0和1④正态曲线在,标准正态分布在±1处各有一个拐点⑤正态分布的面积分布有一定的规律性。
6.标准正态分布:
7.
8.医学参考值范围:绝大多数个体的取值所在的范围。
决定取单侧还是双侧:单侧或双侧是根据指标的实际用途而定,指标(如红细胞、白
细胞)过高或过低均为异常则取双侧,双侧界限值:P97.5,P2.5;指标仅过高或过低为异常,则取单侧,单侧界限值:P95,P5。
第九章 数值变量资料的统计推断
1、熟悉抽样误差的概念
抽样误差的概念:统计学上把由抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数之间的差异称为抽样误差
均数的抽样误差:统计学上把由抽样造成的样本均数与总体均数之间的差异或者各个样本均数之间的差异称为~~~
2、掌握均数标准误的计算
,实际中σ是未知的,常用。t分布:
3、熟悉标准差与均数标准误的区别和联系
联系:当n一定时标准差大,标准误也大
| 标准误 | 标准差 | |
| 定义 | 反应抽样误差 | 反应个体差异 |
| 用途 | 总体均数可信区间进行统计学检验 | 医学参考值范围计算标准误 |
5、掌握总体均数可信区间估计的计算方法及其适用条件:
统 参数估计 点(值)估计:使用样本统计量(如均数 )作为对总体参数(如总体均数μ)的
计 估计值。
推 区间估计:是根据选定的置信度(或可靠度,用概率表示)估计总体均数
断 所在的区间(a<μ<b),a和b是区间的上下界。
假设检验
在估计总体均数的置信区间时,可能估计错误,其概率用表示,估计正确的概率是1,也称为置信度。根据一定的置信度估计得到的区间,称为置信区间,置信度常用95%~99%。
6、熟悉参考值范围和总体均数可信区间的区别
| 区别点 | 总体均数可信区间 | 参考值范围 |
| 含义 | 按预先给定的概率,确定未知参数μ的可能范围,实际上,一次抽样算得的可信区间要么包含了总体均数,要么不包括,但可以说:当α=0.05 | “正常人”的解剖,生理,生化某项指标的波动范围。 |
| 特征 | 总体均数可能所在的范围 | 个体值的波动范围 |
| 计算公式 | 未知n较小: 已知 或未知但n﹥60 | 正态分布: 偏态分布: |
| 用途 | 总体均数的区间估计 | 绝大多数(如95%)观察对象某项指标的分布范围 |
建立假设,确定检验水准: H0:µ= µ0 H1:µ≠µ0 =0.05
②选定检验方法,计算检验统计量t值: = ,S= ,n=
③确定P值,作出推断结论:
P﹥0.05,按α=0.05,检验水准,不拒绝H0,差异无统计学意义;尚不能认为……不同或不等。
P≦0.05,按α=0.05检验水准,拒绝绝H0,差异有统计学意义;尚不能认为……相同或相等。
8、掌握t检验和u检验的应用条件和计算
t 检验\":"font-weight:700检验应用条件:数值变量②性③正态性④方差齐同(S大≤2S小)两样本均数比较时,要求两样本总体方差相等( σ12= σ22)⑤组数≤2
⑥σ已知:u检验;
σ未知:n≥50 ,u检验;n<50 ,t检验
常见的配对设计主要有以下情形:
①自身比较:同一受试对象处理前后或不同部位测定值的比较(目的是判断此处理有无作用)
②同一受试对象(或样品)分别接受两种不同的处理。(目的是比较不同方法之间的差异)
③成对设计:将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。
(目的是比较不同方法之间的差异)特点:每对中的两个观测值不
单个样本的t/u检验:又称单样本均数t检验(one sample t test), 目的是检验样本均数所代表的未知总体均数μ是否与已知总体均数μ0相等。已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。
建立假设,确定检验水准: H0:µ= µ0 H1:µ≠µ0 =0.05
②选定检验方法,计算检验统计量t值: = ,S= ,n=
③确定P值,作出推断结论:…………
配对样本均数t/u检验:
建立假设,确定检验水准: H0: μd=0该药对血浆胆固醇无影响。
H1: μd≠0 该药对血浆胆固醇有影响。α=0.05
②选定检验方法,计算检验统计量t值:
③确定P值,作出推断结论:…………………
两个 u检验:两个大样本均数的比较(n>50)
样本均数 建立假设,确定检验水准: H0:µ1= µ2 H1:µ1≠µ2 =0.05
比较t/u ②选定检验方法,计算检验统计量u值:
检验: ③确定P值,作出推断结论:…………
t检验:两个小样本均数的比较(n﹤50)
建立假设,确定检验水准: H0:µ= µ0 H1:µ≠µ0 α=0.05
②选定检验方法,计算检验统计量t值:
……组:n1=~ 1 =~ S1=~~
……组:n2=~ 2=~ S2=~~
③确定P值,作出推断结论:……………
9、熟悉假设检验的注意事项:资料必须合乎随机化抽样原则②选用的假设检验方法应符合其应用条件③实际差别大小与统计意义的区别④进行假设检验时,对差异有无显著性或有无统计意义的判断不能绝对化⑤假设检验的单侧检验与双侧检验的正确选择
10、理解两类错误:类错误:拒绝了实际正确的H0; 概率用α表示;
类错误:不拒绝实际上不成立的H0,概率用表示
第一十章分类变量的统计描述
1.掌握常用相对数的计算及其意义:
相对数两个有联系指标之比。意义:消除基数影响,便于事物间的比较。
构成比:又名比例。指事物内部某一组成部分的观察单位数与该事物各组成部分观
相 察单位总数之比。
对 构成比有两个主要特点:各部分构成比的合计等于1,事物内部某一部分的构成
数 比发生变化,其它部分的构成比也相应地发生变化。
率:又称频率指标,又称为强度相对数,表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度
比:又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几,通常用倍数或分数表示。 特点:两个指标性质可以不同。
| 构成比 | 率 |
| 1.各部分可直接相加 | 各率不可直接相加。 |
| 2.各部分之和等于100%。 | 总率不一定等于各率之和。 |
| 3.某部分变化,其它部分随之变化 | 某率的变化,不影响其它各率。 |
计算相对数的分母不宜过小(分母不应太小,一般不能小于30例,小则直接叙述)
分析时不能以构成比代替率正确计算平均率相互比较时应注意可比性
样本率或构成比应进行假设检验。
3.掌握标准化法的意义和基本思想
当需要对两个或多个总率(或总均数)进行对比。若两组或两组以上资料内部构成分布不同时,不能直接比较总指标而得出结论,应考虑标准化。
标准化法的基本思想:在两个及以上总率进行对比时,为了消除资料在年龄、性别或其它有关指标内部构成不同的影响,而选用某一标准人群加以校正,分别计算标化率后再作对比的方法称为率的标准化。
4.熟悉直接法计算标化率
| 方法1 | 甲 地 | 乙 地 | |||
| 年龄组(岁) | 标准人口数 | 原死亡率‰ | 预期死亡数 | 原死亡率‰ | 预期死亡数 |
| (1) | (2) | (3) | (4)=(2)×(3) | (5) | (6)=(2) ×(5) |
| 0~ | |||||
| 20~ | |||||
| 合计 | ② | ③ | ④ | ⑤ | ⑥ |
乙地标准化死亡率:⑥\②
| 方法2 | 甲 地 | 乙 地 | |||
| 年龄组 (岁) | 标准人口数构成比 | 原死亡率‰ | 分配死亡率 | 原死亡率‰ | 分配死亡率 |
| (1) | (2) | (3) | (4))=(2)×(3) | (5) | (6)=(2)×(5) |
| 0~ | |||||
| 20~ | |||||
| 合计 | ② | ③ | ④ | ⑤ | ⑥ |
乙地标准化死亡率:⑥
5.熟悉应用标准化时的注意事项:标化是针对总率进行的;②选用的标准不同,计算的标化率也不同 ;③各组分率大小交叉出现,不宜采用标化④.两样本标准化率是样本值,存在抽样误差,应作假设检验。检验方法比较麻烦。一般参考书上也没有。⑤如不计算标准化率,而分别比较各组的率,也可得出正确结论,但不能比较总率的大小。
第十一章
1.熟悉率的抽样误差及总体率的估计:从同一个总体中随机抽出观察数相等的多个样本,样本率与总体率、各样本率之间往往会有差异,这种差异被称作率的抽样误差。率的抽样误差用率的标准误表示 。
总体率的估计:
.点估计:不考虑抽样误差π=p
.区间估计:按一定得置信度,用样本率估计总体率所在范围
.查表法②.正态近似法1:n>50,np>5,且n(1-p)>5(例患病人数和不患病人数均大于5)
总体率()95%的可信区间:p1.96sp
2.熟悉率的u检验
.样本率与总体率的比较:条件: n>50,np>5,且n(1-p)>5
.建立假设,确定检验水准:H0:π=π0 ; H1:π≠π0; α=0.05
②.选择检验方法,计算检验统计量
③.确定P值,作出结论…………
两个样本率的比较:条件:n1>50, n1p1>5, 且 n1(1-p1)>5
n2>50, n2p2>5, 且 n2(1-p2)>5
.建立假设,确定检验水准:H0:π1=π2 ; H1:π1≠π2 ;α=0.05
②确定检验方法,计算检验统计量
③确定P值,作出结论……
3.掌握χ2检验的基本思想:小概率反证法。(自己看看书P191)
4.掌握四格表资料的适用条件,掌握四格表资料的χ2检验及校正方法的计算
凡是两个率或构成比资料都可以看做四格表资料。目的:推断两个总体率(构成比)是否有差别。
四格表资料的一般形式
| 组别 | 阳性数 | 阴性数 | 合计 |
| A组 | A | b | a+b |
| B组 | C | d | c+d |
| 合计 | A+c | b+d | a+b+c+d |
.建立假设,确定检验水准:H0:π1=π2 ; H1:π1≠π2 ;α=0.05
.选择检验方法,计算检验统计量
不校正:n ≥ 40,T ≥5,不校正公式
校正:n≥40,1 ≤ T <5,校正公式
确定P值,作出结论:
5.熟悉行*列表资料性χ2检验
6.掌握配对资料的χ2检验的计算
.建立假设,确定检验水准:H0:π1=π2 ; H1:π1≠π2 ;α=0.05
.选择检验方法,计算检验统计量
若b+c≥40,不校正 : 。若b+c<40,校正:
确定P值,作出结论:…………
7.熟悉行列表χ2检验时的注意事项
预防医学概论
1.预防医学:是医学的一门应用学科,它以个体和确定的群体为对象,目的是保护、促进和维护健康,预防疾病、失能和夭折。
2.预防医学特点:⒈工作对象:个体和群体着眼于:健康和无症状患者研究重点:影响健康的因素与人群健康的关系采取的对策:更具积极的预防作用和更大的效益研究方法:注重微观和宏观相结合
3.健康是身体、心理和社会适应的完好状态,而不仅是没有疾病和虚弱。
4. 三级预防:一级预防即病因预防或根本性预防二级预防即临床前期预防三级预防即临床预防
营养学
1.营养:是指人体摄取、消化、吸收和利用食物中营养物质以满足机体生理需要的生物学过程。
2.营养素:是指食物中可给人体提供能量、机体构成成分和组织修复以及生理调节功能的化学成分。主要包括:蛋白质、脂类、碳水化合物 、矿物质、维生素、水6种。
3.必需氨基酸: 是人体不能合成或合成速度不能满足机体需要,必须从食物中直接获得的氨基酸。共9种:异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、苏氨酸、色氨酸、颉氨酸、组氨酸(婴儿)
多数蛋白质的含氮量约16%。测定的食物的含氮量×6.25=食物中蛋白质含量
蛋白质的功能:构成人体成分、调节生理功能、供给能量
氨基酸模式:是指某种蛋白质中各种必需氨基酸的构成比例。
蛋白质缺乏:水肿、消瘦;蛋白质过多:高脂肪、能量过剩,加重肝肾负担。
食物来源:优质单蛋白质食物来源主要有牛奶、鸡蛋、瘦肉、鱼类和大豆,非优质蛋白质的食物来源主要是粮谷类食物。
4.脂类:功能:供给能量构成人体细胞和组织供给人体必需脂肪酸促进脂溶性纤维素的吸收
必需脂肪酸:必需脂肪酸是指人体不可缺少而 自身不能合成,必须由食物供给的脂 肪酸。如亚油酸、-亚麻酸。
5.碳水化合物功能:供给能量构成人体身体组织保肝解毒作用节约蛋白质及防止酸中毒提供膳食纤维
膳食纤维的主要生理功能:① 增强肠蠕动、防止习惯性便秘② 降低血清胆固醇水平
③调节血糖④控制体重
维生素A食物来源:动物肝脏、蛋黄、鱼肝油。植物性食物中的类胡萝卜素在体内可转化成维生素A。类胡萝卜素富含于黄绿色蔬菜如胡萝卜、西兰花、菠菜及水果中的芒果、杏、柿子等。
维生素D食物来源:主要存在于各种功能油料种子及植物油中,如麦胚牙、芝麻油、花生油及坚果类和深绿色蔬菜中。
维生素B1食物来源:富含较丰富的如谷类、豆类、瘦肉等,尤其是粗杂粮。
维生素B2食物来源:动物内脏、奶类、蛋类。
维生素C食物来源:新鲜的蔬菜及水果,特别是青椒、番茄、柑橘等果蔬中含量丰富。
6.矿物质生理功能:① 构成人体组织的重要成分② 维持细胞渗透压、酸碱平衡和神经肌肉的兴奋性③ 构成酶的辅基、激素、维生素、蛋白质和核酸的成分
常量元素:占人体总重量的0.01%以上的矿物质被称为常量元素。
钙:是构成骨骼和牙齿的主要成分。维持神经与肌肉活动。促进酶的活性。
参与凝血过程、激素分泌、维持体液酸碱平衡和细胞内胶质的稳定。
抑制钙吸收的因素:植酸(粮食)和草酸(蔬菜)、膳食纤维、脂肪消化不良、某些碱性药物(苏打、黄连素、四环素等)
促进钙吸收的因素:Vit D、乳糖、某些氨基酸、磷肽、某些抗生素(青霉素、氯霉素等)
铁吸收的促进因素:① VC、有机酸②单糖 ③肉因子不包括鸡④ 贮存量低,需要量高,吸收率升高(孕妇)⑤ 核黄素缺乏
铁吸收的抑制因素:① 植酸盐,草酸盐,磷酸盐,碳酸盐(粮谷、蔬菜)② 多酚类物质,如鞣酸(茶叶、咖啡)③ 胃酸缺乏或过多服用抗酸药物④贮存量多⑤锌过多(竞争吸收
水:成人每日水的需求量约为2500ml
7.流行病学:研究人群中疾病和健康状态的分布及影响因素,以及防治疾病和促进健康的策略与措施的科学。
8 死亡率 = 一定时期内某病死亡人群\总人口
病死率 = 一定时期内某病死亡人群\病例总数
发病率 = 某病新增加病例数 \\ 总人口
患病率 = 某病新旧病例数 \\ 总人口
9.散发:是指某病在一定地区内的发病率呈历年来一般水平。
流行:是指一个地区某病发病率明显超过历来的散发发病率水平。
大流行:即疾病蔓延迅速,涉及地域广,往往在比较短的期间内越过省界、国界甚至州界,而形成大流行。
10.疾病 地区分布:国家间及国家内的分布城乡分布
的三间 时间分布:短期波动季节性周期性长期变异
人群分布:性别年龄职业种族和民族行为
11.描述性研究:
现况调查:调查现在有关疾病与健康的相关情况。
