当前位置: 首页 > 常见问题 > 家庭关系库

CFPS小课堂 | 穿过大半个中国去寻你:如何在CFPS数据中界定流动人口

来源:时间:2022-05-12 04:13阅读:

自上世纪80年代末起的大规模人口流动是当代中国社会的一个重要变迁之一,也是人口学研究的热门议题之一,而流动人口的研究也向数据采集提出了更高的要求。在界定流动人口、获得相对完整的抽样框、联系和访问受访对象、提高应答率等方面,对流动人口的调查的难度均高于对常住居民的调查。也许正是由于这些困难,虽然从上世纪90年代起国内已有许多研究机构或学者参与到流动人口的调查数据采集中来,但这些数据大多数是采用非概率抽样或限于局部地区的小样本。直到近年才开始有一些调查项目使用居住地地图法抽样框进行概率抽样来获得流动人口的样本,CFPS就是其中之一。

 

1、流入地抽样 VS 流出地抽样

 

流入地调查

 

大多数采集流动人口的数据都属于流入地抽样,即抽样框或受访对象是从流入地获得。如中国家庭住户调查 (CHIP)的流动人口样本、卫计委的流动人口动态监测调查等。流入地调查虽然能够相对方便地接触到流动人口,但对流动人口总体的代表性却存在问题:

 

首先,由于大多数流入地(概率)抽样的对象都是在流入地居住满一定期限的家庭户,这一抽样方式难以捕捉居住在工地工棚、临时住宅、集体宿舍的流动人口,这会在整体上低估流动人口的规模,而居住在家庭户的流动人口与居住在非家庭户的流动人口在特征上很可能有较大差别。

 

其次,流入地抽样的数据只包括已经发生外出的人口样本,未包括在农村的留守者和回流者。因此,这类数据通常只能比较不同的外出者之间的差异。这极大限制了对流动发生或持续的因素、流动人口选择性等重要问题的研究。

 

其三,流入地调查易将(特定)城市作为抽样地点,易忽略乡—乡迁移和乡—镇迁移。

 

流出地调查

 

极少的既有调查是从流出地抽取及判断流动人口。与流入地抽样相比,流出地抽样的好处之一是不受限于流动者在流入地的居住类型;另则是留守者、返乡者和流出者的样本可互为对比群体。

 

但是流出地调查也有其缺陷:首先,许多流出者的信息只能通过代答方式采集,信息缺失多、准确性差、不丰富。其次,举家迁移者难以进入流出地抽样框。

 

2、CFPS的数据采集特色

 

CFPS对研究流动人口有如下数据优势:

 

首先,CFPS的调查对象囊括家庭中经济上联系在一起的所有成员,即便一些家庭成员由于外出离家或拒访而没有完成个人问卷,这些成员只要经济上与原家庭联系在一起,就必须登记在册,其基本的社会人口信息会通过代答的采集。这一做法不仅保证了家庭结构的完整性,也提高了样本的代表性。CFPS界定出来的家庭人口与2010年全国人口普查短表的性别-年龄结构非常吻合。

 

其次,CFPS采用城乡一体的抽样框,其样本同时覆盖城镇和农村地区,据此,用户既可以从农村作为流出地的样本中获得外出家庭成员的信息,也可以从城市作为流入地的样本中获得外来人口的信息。这一设计弥补了流入地抽样调查的缺陷。

 

再次,CFPS可以从多个问卷来源界定外出/外来人员,据此界定出来的流动状态更全面,也更可靠。

 

3、如何用CFPS界定流动人口

 

基于2010年基线调查,CFPS问卷可以有三种界定流动人口的方式,这三种界定的并集可作为流动人口的最终定义:

 

(1)家庭成员问卷采集了每名家庭成员离家与否的状态、离家原因及去向。用户可将离家原因为“外出打工 ”且外出地与原家庭所在地不在同一区县的离家者定义为流动人员。

 

(2)家庭经济问卷询问了家中哪些成员外出打工,并提问了打工所在地等信息。该数据反映的是受访人主观界定的外出打工者。用户可将被列于家庭外出打工的名单上,且打工所在地与原家庭所在地不在同一区县的家庭成员界定为流动人员。

 

(3)个人问卷采集了所有成人和少儿受访者的户口所在地,若个人户口所在地和调查时的居住地不在同一区县,则其被界定为流动人员。 

 

在逻辑上,家庭成员问卷和家庭经济问卷均是从流出地角度定义流动人口,这些流动人口在流入地既可能居住于家庭户,也可能居住于工棚、临时住宅,或集体宿舍。个人问卷使用户口所在地和调查居住地的信息是从流入地角度定义流动人口。这些流动人口主要是在流入地安家的人,这一角度尤其能捕捉到全家外出的家庭,因为这些家庭已不存在于流入地的样本框中。

 

因此,合并三个问卷的信息界定流动人员,同时兼顾了流出地和流入地视角,弥补了基于流入地抽样调查遗漏居住在非家庭户中流动人口的问题,也弥补了基于流出地抽样的调查难以捕捉全家外出情况的问题。

 

下表展示了CFPS2010年三个不同问卷来源定义的流动人员在全国再抽样样本中的比例(经抽样权数调整)。我们对三种界定取并集,将符合三种问卷界定之一者算作流动人口,由此得到的流动人口占全部人口的比例为16.7%,这一比例与“六普”的跨区县人户分离的比例(16.45%)非常接近。

 

 

上表还展示了CFPS不同问卷界定的外出成员的基本社会人口特征。我们可以看到,家庭成员问卷和家庭经济问卷界定的流动人口特征较为接近,相比之下,个人问卷界定的流动人口中女性比例较高、平均年龄较大、教育年限较高、已婚比例较高、职业地位较高。一般来讲,符合上述特征的流动者更有条件居住在家庭户中,因此更可能被流入地调查抽中。

 

上述对流入地界定(个人问卷)和流出地界定(家庭成员和家庭经济问卷)的流动人口特征的差异印证了前面提到的流入地抽样的问题:在流入地界定流动人口,不仅低估了流动人口的总量,而且其样本特征存在偏误。

 

4、CFPS采集流动人口数据的持续努力

 

自2012年起,CFPS启动了异地追访和个人代答问卷,即便外出离家人员无法在原家庭地址接受访问,CFPS也不会轻易放弃对这些人员的个人访问,而会组织访员到其流入地对这些人员面访或启用电访。

 

自2014年起,CFPS的个人问卷引入日历法(EHC)地址模块,全面采集两次访问之间受访人住址的变动,这一方面在迁移/流动数据采集的精度和准确性上有了更大的提高,也为用户未来能利用CFPS研究个人或家庭迁移史/流动史奠定数据基础。

 

2016年,CFPS加大了对电访的开发和实践力度,这将提高流动人口的追访率积累更多的条件和经验。  

 

 

 

请您关注CFPS公众号,阅读更多CFPS小课堂:ISSS_CFPS

上一篇: CFPS小课堂 | 家庭成员的定义

下一篇: CFPS小课堂 | 家庭变迁与追踪调查 • 用户手册篇(一)