短信预约提醒成功
套餐推荐:2014统计师保过班|招生计划
数据来源与搜集数据的方法
一.数据的来源
从使用者的角度看,统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。
(一) 数据的直接来源――原始数据
搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。
1. 统计调查
统计调查是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织地向客观实际搜集资料的过程。通过统计调查得到的数据,一般称为观测数据。
2. 实验法
实验法是直接获得统计数据的又一重要来源。通过实验法得到的数据就是实验数据。
实验法不仅是一种搜集数据的方式,也是一种重要的研究方式。它是通过有意识地改变或控制某些输入变量,观察其他输出变量的变化,从而达到对事物本质或相互联系的认识。未来观察对输入变量的控制是否导致了输出变量的改变,在实验中,往往需要将研究对象分为两个组,一个是实验组,一个是对照组,对实验组的输入变量加以控制或改变,而对照组则不加控制,根据两组的输出结果,可以看到输入变量对输出变量的影响。
运用实验法要注意的是:首先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识的挑选的。其次,实验组和对照组还应当匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。
不论是统计调查还是实验,所搜集的数据都是原始数据,这是统计数据最基本的来源。
(二)数据的间接来源――次级数据
虽然统计数据的搜集主要是指对原始数据的搜集,后面介绍的统计调查的方法也是围绕搜集原始资料展开的,但数据的收集实际上不仅包括对原始数据的收集也包括对次级数据(第二手收据)的收集,在很多情况下,统计研究都是在掌握次级数据的基础上进行的。
次级数据是指由其他人搜集和整理得到的统计数据。这种来自他人调查整理基础上的数据我们把它称为数据的间接来源。
数据的间接来源有:(1)公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。(2)尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构为公开发布的调查结果数据。需注意的是,如果公开引用未公开发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
恰当地运用间接数据在实际中往往能够节约时间和费用,取得较好的成果和效益,因此,成为许多统计研究人员在进行实证分析时的首选数据来源。但在应用时要注意:(1)是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据。(2)引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。