预约成功
职业卫生统计基础
一、职业卫生常用统计指标
(一)发病(中毒)率
表示在观察期内,可能发生某种疾病(或中毒)的一定人群中新发生该病(中毒)的频率。

在通常情况下,发病率的分母泛指一般平均人口数。
发病率(中毒率)是反映某病(中毒)在人群中发生频率大小的指标,常用于衡量疾病的发生,研究疾病发生的因果关系和评价预防措施的效果。
(二)患病率
表示在某时点检查时可能发生某病的一定人群中患有某病的病人总数。

其中某病病例总数包括新病例和旧病例,凡患该病的一律统计在内。同一人不应同时成为同一疾病的两个病例。
这一指标最适用于病程较长的疾病的统计研究,用于衡量疾病的存在,反映某病在一定人群中的流行规模或水平。
(三)病死率
在规定的观察时间内,某病患者中因该病而死亡的频率。
上式分母中患病情况不同,指标的概念也不同。如住院病人的病死率,分母为住院人数。某一地区某病病死率的分母则包括该地区所有患该病的病人。故医院的病死率不能代表地区的病死率。
(四)粗死亡率
也称普通死亡率,是指某年平均每千名人口中的死亡数。

粗死亡率和粗出生率一样,具有资料易获得、计算简单的优点,但其高低受人口年龄构成的影响,故只能粗略地反映人口的死亡水平,不能用来衡量和评价一个国家的卫生文化水平。
二、职业卫生调查设计
(一)调查研究的特点
研究过程中没有人为的施加干预措施,而是客观地观察记录某些现象的现状及其相关特征;在调查中,欲研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究区别于实验研究的重要特征;混杂因素的控制常借助于标准化法、分层分析、多因素统计分析等方法;调查研究多采用问卷调查,容易产生误差和偏倚,应特别注意设计技巧和质量控制。
(二)调查设计的主要用途
调查设计又称为横断面研究或横断面调查或现况研究,用于了解某一特定时间横断面上特定作业场所中职业危害因素或人群职业病的分布情况。
(三)调查设计的基本原则与内容
1.明确调查目的并将其具体化到指标
明确调查目的是调查研究各个环节中最核心的问题。确定调查目的时应注意的是要了解总体参数还是研究相关联系。指标要精选,尽量用客观、灵敏、精确的定量指标。
2.确定调查对象和观察单位
根据调查目的确定调查对象,即要确定调查总体及其同质范围,观察单位可为人、物、群体、地区等。
3.确定并选择调查方法
根据调查目的和要求确定并选择调查方法,有以下几种:
(1)普查(overall survey)。对总体中所有的观察单位进行调查,一般用于了解总体在某一特定“时点”上的情况,如年中人口数、时点患病率。在医学领域的适用范围是:
①发病率较高的疾病;②具有灵敏度和特异度较高的检查或诊断方法;③普查方法便于操作、易于接受;④具有实施条件。
(2)抽样调查(sampling survey)。是医学研究中最常用的方法,是通过随机抽样方法从总体中随机抽取一定数量具代表性的观察单位组成的样本进行调查,然后根据样本信息来推断总体特征。
(3)典型调查。亦称案例调查。即对事物进行全面了解的基础上,有目的选择典型的人和单位进行调查。如调查几个卫生先进或后进单位,用于总结经验教训。
4.确定样本含量
样本含量依据抽样方法的不同而不同,可参考有关的统计学书籍。
5.确定资料的搜集方式
(1)直接观察法:直接观察、检查、测量。
(2)采访法:调查者直接或间接与被调查者交谈,又分访谈、信访和开调查会3种。
6.确定观察指标
结合调查的实际问题,将调查目的转化为具体的调查指标。
(四)常用的抽样方法
1.单纯随机抽样
将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。
优点:操作简单,均数、率及相应的标准误计算简单。
缺点:总体较大时,难以一一编号。
2.系统抽样
又称机械抽样、等距抽样。即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等问距,从每一部分各抽取一个观察单位组成样本。
优点:易于理解、简便易行。
缺点:总体有周期或增减趋势时,易产生偏性。
3.整群抽样
总体分群,再随机抽取几个群组成样本,群内全部调查。
优点:便于组织、节省经费。
缺点:抽样误差大于单纯随机抽样。
4.分层抽样
先按对观察指标影响较大的某种特征,将总体分为若干个类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。
优点:样本代表性好,抽样误差减少。
以上4种基本抽样方法都属单阶段抽样,实际应用中常根据实际情况将整个抽样过程分为若干阶段来进行,称为多阶段抽样。
各种抽样方法的抽样误差一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。
三、职业卫生常用的统计分析方法
职业危害资料的统计分析与其他资料一样,应按照资料类型和统计分析方法条件的要求进行。
(一)计量资料的统计分析
计量资料可采用集中趋势和离散趋势指标计算,f检验、u检验、方差分析、秩和检验、相关与回归,下面以常用的t检验和u检验为例进行介绍。
1.t检验和u检验
t检验和“检验就是统计量为f,u的假设检验,两者均是常见的计量资料假设检验方法。当样本含量n较大(如n>30)时,样本均数符合正态分布,故可用u检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。
(1)样本均数与总体均数比较的t检验。样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数μ与已知的某一总体均数μ0。(常为理论值或标准值)有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随机抽查了25名健康男性,求得其脉搏均数为74.27次/分,标准差为6.0 次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。
上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:
1)建立假设
H0:μ=μ0=72次/分,H1:μ>μ0,检验水准为单侧0.05。
2)计算统计量。进行样本均数与总体均数比较的,t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。
3)确定概率,作出判断。以自由度”(样本含量n减1)查£界值表,0.025 应注意的是,当样本含量n较大时,可用u检验代替t检验。
(2)配对设计的t检验。配对设计是一种比较特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和非自身配对之分。配对设计资料的t检验实际上是用配对差值与总体均数“0”进行比较,即推断差数的总体均数是否为“0”。故其检验过程与样本均数与总体均数比较的t检验类似,即:
1)建立假设
H0:μd=0,即差值的总体均数为“0”,H1:μd >0或μd <0,即差值的总体均数不为“O”,检验水准为0.05。
2)计算统计量。进行配对设计t检验时t值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。
3)确定概率,作出判断。以自由度v(对子数减1)查t界值表,若P<0.05,则拒绝H0,接受H1,若P≥0.05,则还不能拒绝H0。
(3)成组设计两样本均数比较的t检验。成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种t检验也没有大的差别,只是假设的表达和t值的计算公式不同。
两样本均数比较的t检验,其假设一般为:H0:μ1=μ2,即两样本来自的总体均数相等,H1:μ1 >μ2或μ1 <μ2,即两样本来自的总体均数不相等,检验水准为0.05。
计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。
应注意的是当样本含量n较大时(如大于100时)可用u检验代替t检验,此时u值的计算公式较t值的计算公式要简单的多。
(4)t检验的应用条件和注意事项。两个小样本均数比较的t检验有以下应用条件:
1)两样本来自的总体均符合正态分布。
2)两样本来自的总体方差齐。
故在进行两小样本均数比较的t检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“l”。若接近“1”,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。
若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行t检验,对其他资料可用t’检验或秩和检验进行分析。
(二)计数资料的统计分析
计数资料可采用的分析方法有相对数计算、二项分布、x2检验,下面以x2检验为例进行介绍。
1.x2检验
卡方检验是用途很广的一种假设检验方法。这里主要介绍它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
(1)卡方检验基本思想。在分类资料统计分析中常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如表8―3,问两组发癌率有无差别?
52,19;39,3是表8-3中最基本的数据,因此表8―3资料又被称之为四格表资料。
卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71×91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
(2)四格表资料的卡方检验。四格表资料的卡方检验用于进行两个率或两个构成比的比。
1)专用公式。若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=(ad一bc)×n[(a+b)(c+d)(a+c)(b+d)],自由度v=(行数一1)(列数一1)。
2)应用条件。要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。
(3)行×列表资料的卡方检验
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1)专用公式。R行C列表资料卡方检验的卡方值
2)应用条件。要求每个格子中的理论频数T均大于5或1 (4)列联表资料的卡方检验。同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。
①R×C列联表的卡方检验。R×C列联表的卡方检验用于R×C列联表的相关分析,卡方值的计算和检验过程与行×列表资料的卡方检验相同。
②2×2列联表的卡方检验:
2×2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。
当用一般四格表的卡方检验计算时,卡方值
此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值
等时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同R×C表的卡方检验相同。
编辑推荐: