样本轮换

科技工作者之家 2020-11-17

中国劳动力调查需要进行样本轮换。样本轮换的主要原因有两个:一个是长期调查会造成样本老化,即被调查户产生厌倦情绪,不愿意积极配合或者有意无意地提供不完全正确的资料;另一个是样本轮换可以提高估计量的精度,比如利用前期调查资料作为辅助信息采用回归估计可以提高估计量的精度。

原因样本轮换是指在连续调查过程中,每隔一定时间轮换部分或全部的被调查户。之所以要进行样本轮换,主要是由于以下几个原因。

第一,长期调查常会造成样本老化。由于调查时间过久,调查总体变化较大,样本对总体的代表性逐渐降低。一方面,样本中包括不了新增户(如新始户、外地迁入户);另一方面,对老住户的代表性也在减弱。因为随着城区的不断扩大,原抽样框中不可能包括新增居民区。

第二,长期调查会影响被调查者的合作态度。居民家庭收入调查是以自愿为基础的,调查的顺利与否在很大程度上取决于被调查者的合作态度。当对调查单位时间拖得太长,就有可能遭到拒绝或产生应付心理而影响调查的结果。

第三,长期调查有可能会影响被调查者的行为。即使被调查者愿意,但长期调查也有可能出现影响其经济活动和生活方式的问题,从而使被调查户的资料失去代表性。例如,在居民家庭收入调查中,居民本来并不注意家庭生活费收支情况,但当长期登记家庭生活费收支账后,对生活开支加以控制或有意识地购买某类商品,这样,调查所取得的资料的代表性就下降了。

在抽样设计时,是否替换样本、替换多少样本是设计人员经常面临的问题。应在明确调查目的的前提下,考虑替换样本单位会带来多大的抽样误差,同时还要考虑调查的经费是否许可。不断替换样本要增加经费开支,因此,有些调查机构常从节省经费角度出发,当非替换不可时才考虑替换问题。1

两级样本轮换的比较对于采用多阶段抽样设计的劳动力调查,实践中可能会遇到一个问题,即随着对最终抽样单元的样本轮换,某些上级抽样单元内没有新的最终抽样单元可供轮换。对于这种情形,绝大部分国家和地区仅仅是被动地更换掉这些上级抽样单元。当大部分上级抽样单元内有足够的最终抽样单元时,这种做法不会造成太大问题,但当大部分上级抽样单元内没有足够的最终抽样单元时,这种做法显然有失妥当。世界上,日本劳动力调查和中国台湾地区人力资源调查。这两个调查均是月度调查。很好地解决了这个问题。简单地说,它们对上级抽样单元也实施样本轮换。这种既对最终抽样单元实施样本轮换又对上级抽样单元实施样本轮换的做法称为“两层次样本轮换”。2

应用举例中国劳动力调查的样本轮换在两个层次上进行,即不仅轮换调查小区,而且轮换村级单元。对于村级单元的轮换,居委会采用“9 in”的样本轮换模式,村委会采用4 in的样本轮换模式。调查小区的轮换稍微复杂一些,详述如下。

居委会中调查小区的轮换居委会中调查小区的轮换采用2-2-2模式,即每个调查小区连续接受两个季度的调查,然后暂时退出样本休息两个季度,接着再次进入样本接受两个季度的调查,最后永久退出样本。就整个样本而言,每季度都进入一个新的调查小区,永久退出一个老的调查小区,进入一个经过半年休息期的调查小区,退出一个需要休息半年的调查小区。在这种样本轮换设计下,每个月都有四分之一的调查小区第一次接受调查,四分之一的调查小区第二次接受调查,四分之一的调查小区第三次接受调查,四分之一的调查小区第四次接受调查。

从样本拼配情况看,相邻两个季度之间样本拼配率是50%,相邻两年的相同季度之间样本拼配率也是50%。

村委会中调查小区的轮换在农村,若某个劳动力没有地,则统计为失业,否则,就统计为就业。根据目前中国的土地政策“增人不增地,减人不减地”,同一农村劳动力的就业与失业状况若干年内保持不变,所以村委会中调查小区的轮换采用“1 in”模式,即一个调查小区只调查一次。

从样本拼配情况看,连续两个季度之间调查小区没有重复,连续两年的相同季度之间调查小区也没有重复。2

本词条内容贡献者为:

任毅如 - 副教授 - 湖南大学

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。