导航
短信预约 统计师考试动态提醒 立即预约

请输入下面的图形验证码

提交验证

短信预约提醒成功

初级统计师考《统计相关知识》:统计数据的预处理

|0·2013-03-04 13:43:22浏览0 收藏0
摘要 数据的预处理是在分组或分类之前对数据所做的审核、筛选和排序等。

     相关链接:初级统计师《统计相关知识》第二章:统计资料收集方法

  统计数据的整理

  数据搜集来之后,要对其进行加工整理,以使之系统化、条理化,符合统计分析的要求。数据整理通常包括数据的预处理、分组或分类、汇总等,其中,编制频数分布是统计整理的重要内容。

  一、数据的预处理

  数据的预处理是在分组或分类之前对数据所做的审核、筛选和排序等。

  (一)数据的审核与筛选

  来自不同渠道的统计数据和不同类型的统计数据,在审核的内容和方法上也有差别。对于由直接调查取得的原始数据,要从完整性和准确性两方面去审核。完整性审核就是检查应调查的单位或个体有否遗漏,调查项目填写是否齐全等。准确性审核,一是看数据是否真实,与实际有无出入;二是看数据的登录、计算等是否有误。逻辑检查和计算检查是审核数据准确性的两种方法。逻辑检查就是从定性角度去看数据是否有悖逻辑,相互矛盾之嫌,故多用于审核名类数据和顺序数据。比如,中学文化程度的人所填的职业是大学教师,这就不符合逻辑了。计算检查是审核调查表中的各项数据在计算结果和计算方法上有无错误,故多用于对区间数据和比数据的审核。例如,检查各分项数字之和是否等于相应的合计数,各组频数之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同等。

  对于通过其他渠道取得的第二手数据,除了审核其完整性和准确性之外,还应审核其适用性和时效性。第二手数据可以来自多种渠道,有些数据可能是为特定目的,通过专门调查而取得的,或者是已经按特定目的的需要做了加工整理。对于这种数据,使用者首先应弄清数据的来源、口径以及有关背景材料,不能盲目生搬硬套。而且,有些时效性较强的问题,若取得的数据过于滞后,就失去了研究的意义,一般来说,应尽可能使用最新的统计数据。

  对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。

  (二)数据的排序

  数据排序就是按一定顺序将数据排列,其目的是为了便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。排序还有助于对数据检查、纠错,为重新分组或归类提供依据。在某些场合,排序本身就是分析的目的之一,例如,美国的《财富》杂志每年都要排出世界500强企业,通过这一信息,经营者不仅能知道本企业所处的地位和差距,还可以了解到竞争对手的状况,从而有效地制定本企业的发展规划和战略目标。

  名类数据,如果是字母型数据,排序有升序与降序之分,升序更常见些,因为升序跟字母的自然排列相同;如果是汉字型数据,排列方式很多,比如按汉字的首位拼音字母排列,这与字母型数据的排序完全一样,也可按笔画顺序,其中也有笔画多少的升序与降序之分。交替运用不同方式排序,在汉字型数据的检查、纠错中十分有用。区间数据和比数据的排序只有两种,即递增和递减。设一组数据为 ,递增排序后可表示为: ;递减排序后可表示为: 。排序后的数据亦称为顺序统计量(Order statistics)。无论是定性数据还是定量数据,其排序均可借助计算机完成。

   各省(区、市)统计专业技术资格考试办公室联系方式一览表

    2013初/中级统计师《统计相关知识》知识点汇总

    2013年统计师考试报考条件

    2013年统计师考试招生简章    全国2012年统计师考试成绩查询汇总

    2013年统计师考试报名时间预估    2012年统计师考试考后交流专区

    

展开剩余
资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved