叙述统计数据质量的影响因素
统计数据质量误差普遍存在,根据其产生的原因可分为三大类:调查准备工作不充分引起的误差,数据搜集阶段发生的误差,资料整理过程中产生的误差。 在进行一次统计调查时,通常事先要做的工作是,制定调查方案,确定将使用的基本概念和定义,拟定调查表,规定调查时间,明确采集资料的方式。这一阶段容易产生的问题是:对正确了解调查对象有帮助的某些重要的特征被忽视;概念的提法和定义不妥当,如总体规定模糊,结果把本应该包括在统计范围之内的调查单位排除在外,把本不应该包括在统计范围之内的调查单位错误地纳入进来;调查项目和统计指标界定不清晰,造成误解;抽样程序和方法不合适,造成样本的系统性偏差;调查难以填写等。 数据搜集阶段可能产生误差的情况有:调查员没有经过适当的培训,不能胜任工作,对调查意图和发出的指令理解得不透不准,从而造成等级的遗漏或重复;在自己的工作中掺进个人的一些看法和意见,误导被调查人偏离方案要求做出回答;交流方式生硬,人为指导紧张气氛,导致被调查人拒绝回答问题;一味追求工作进度,发生登记差错。从被调查者角度看,可能担心个人的材料被用于统计以外的目的而故意给出不实回答;不愿合作敷衍应对,造成随意填报;此外还有被调查人员的知识背景、社会背景、情感背景等产生的回答不实的问题。 在实际搜集资料阶段,采用搜集资料的具体方式不同,也会产生不同甚至差别很大的结果,如邮报可能会导致较高的不回答率。如果使用的测量工具不合适,获得准确的数据也是不可能的。 数据处理阶段还会发生许多新的差错,比如编码、打孔、录入、分类、汇总、计算等过程中出现的错误。