短信预约提醒成功
次数分布
一、次数分配的概念
在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分配称为次数分配。
分配在各组的单位数叫次数或频数。
各组次数与总次数的比率叫频率或比率。各比率之和为100或1即Σ=1。
将各组组别与次数依次排列而形成的数列叫次数分配数列,简称分配数列。
二、分配数列的编制
1.种类
①属性分配数列:
按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。
②变量分配数列
按数量标志分组而形成的数列叫变量分配数列,简称变量数列。
1)单项式变量分组数列
是按每个变量值分别列组而形成的数列。
2)组距式变量数列
把各变量值按照一定组距进行分组而形成的数列。如:上例某班学生统计考试成绩表。
在组距数列中,表示各组界限的变量值称为组限,50―60,60―70等。其中较小的变量值称为下限,50,60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距, 组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。
a.等距分组
各组的组距均相等。
特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。
次数密度=次数/组距,其作用 主要用于消除各组组距不相等而造成的现象分布的影响。
b.不等距分组
各组组距不相等。
特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,因此必须消除组距对其分布的影响即需计算次数密度。
在编制组距式变量数列时,常常会遇到这样的情况,如:学生成绩的分布
60分以下
60―70
70―80等
又如:学生人数的分布
30人以下
30―60
60人以上等
这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算?
下开口的组中值=上限-1/2邻组组距
上开口的组中值=下限+下限1/2邻组组距
2.变量数列的编制
程序:①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列)
a.离散型变量
由于离散型变量各变量值之间以整数断开,变量值之间有明显的界限,上下限都可以用准确的数值表示,组限非常清楚。
如:某校按学生人数分组,其组限为:
100人以下
101―200
201―300
301―400
401人以上
b.连续型变量
由于连续型变量各变量值之间可做无限分割,有小数存在,上下限不能用两个确定的值表示,只能用前一组的上限与本组的下限为同一数值表示。如:上例考试成绩
统计实际工作中,虽然变量区分连续型变量与离散型变量,但为了计算,绘图等的方便,保证整体单位不出现重复、遗漏。可采用连续型变量的形式代替离散型变量。
对于连续型变量,在确定组限时,有一原则可循,即“上组限不在内”原则:各组只包括本组下限变量值的单位,不包括本组上限变量值的单位。
3.编制统计表
如上例40人考试成绩分为5组,组距为10,组限可以为:
50―60,60―70,…,90―100
可以使考试成绩的优、良、中、及、不及格的特征体现出来。