短信预约提醒成功
第四部分 统 计
第二十一章 统计数据的整理与显示
二、数值型数据的整理与显示
(一)数据的分组
分组的方法
分类方法 |
定义 |
适用范围 |
单变量值分组 |
把每一个变量值作为一组 |
通常只适合于离散变量且变量值较少的情况。 |
组距分组 |
将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 |
连续变量或变量值较多的情况 |
采用组距分组的步骤:
第一步,确定分组组数
确定分组组数的要求是:(1)划分的组数,既不应太多也不应太少;(2)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;(3)采用的分组办法,要能够充分显示客观现象本身存在的状态。
关于统计分组组数问题,斯特基给出的计算公式为:(了解即可)
确定组限时应注意:(1)第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点;(2)特别需要或不得已的情况除外,最好不要使用开口组;(3)组限应取得美观些,按数字偏好,组限值应能被5除尽,且一般要用整数表示。
第六步,确定各组观察值出现的频数
凡观察值落在某一区间的,就计发生一次,最后统计各组观察值发生的总次数。采用组距分组时,需要遵循“不重不漏”的原则。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事项。
例题:
1组距分组适用于下列情况( )。
A离散变量 B变量值较少 C连续变量 D变量值较多 E分类数据
『正确案』CD
2上限值与下限值的平均数称为( )。
A组中值 B组平均数 C组距 D组数
『正确案』A
3在组距分组中,确定分组组数须考虑( )。
A组数尽可能少 B组数尽可能多
C尽量保证组间资料的差异性 D尽量保证组内资料的同质性
E组数应能被5除尽
『正确案』CD
4(2006年、2008年)在对数据实行等距分组的情况下,组距与组数的关系是( )。
A无任何关系 B反比关系 C正比关系 D组距总是组数的5倍
『正确案』B
5为解决“不重”的问题,统计分组时习惯上规定( )。
A“不重不漏” B“组限值应能被 5除尽” C“下组限不在内” D“上组限不在内”
『正确案』D
6(2007年)对一组数据进行分组,各组的组限依次是“10~20”、“20~30”、“30~40”、“40~50”、“50~60”、“60~70”。在以上这组数据中,50这一数值( )。
A由于恰好等于组限,不需要分在某一组中 B分在“50~60”一组中
C分在“40~50”一组中 D分在“40~50”或“50~60”任意一组中都可以
『正确案』B
7(2008年)将一批数据进行分组,各组的组限依次是“110~120”、“120~130”、“130~140” 、“140~150” 、“150~160”,按统计分组的规定,140这一数值( )。
A不计算在任何一组 B分在“140~150”这一组中
C分组“130~140”这一组中 D分在“130~140”或“140~150”均可
『正确案』B