当前位置: 首页 > 常见问题 > 家庭关系库

Q&A

来源:时间:2022-05-12 02:41阅读:

Q:如何连接子女与父母的信息?

A:如果只需要父母或子女的基本信息(如年龄、婚姻、学历、户口、在家状态等),可直接从家庭成员

关系库中查找;对于存在个人问卷的子女与父母,通过家庭成员关系库先找出父母或子女的 pid,再从

个人问卷库中通过pid来连接,获得其它信息。

 

Q:2010年家庭问卷中,如何确定户主?

A:CFPS中每个样本的家庭成员都是同等的,没有户主的概念。研究者可根据特定的研究需要进行相应的

处理。

 

Q:少儿数据库中是否有代答人变量?

A:2010年少儿库中,具体的代答人变量为waproxy,变量中的内容为代答人在家庭内的成员顺序号。

2012年少儿库中,具体的代答人变量为kz1_b_1和kz1_b_3,变量中的内容为代答人在家庭内的成员顺

序号。

 

Q:2010年CFPS成人问卷数据库共有样本33600份,2014年变成了37147份,2014年成人PID与2010

年成人PID相同的样本25618份。也就是追踪到2014年的时候就丢失了7982份,是这样吗?另外一个问

题是,2014年与2010年PID不相同的成人样本11529份,那么这11529份样本来自哪里?2018年成人

数据库PID与2010年成人数据库PID相同的样本量20169份,也就是相比较于2010年有13431份样本丢

失,这些丢失的样本去了哪里呢?

A:CFPS为追踪调查,但每轮次访到的个人不尽相同,这里面除了有你提及到的样本流失之外,还有其他因

素,譬如样本死亡(这些样本会在家庭关系库中体现,但无个人问卷,因此不会出现在个人库);之前年

的核心成员在调查年份并非核心成员,不满足CFPS个人问卷访问条件;样本在追访范围之外(出境、

入狱等)。而多出的一些样本也有多种情况,譬如之前年份有可能访问不成功但此轮访问成功;当前年份

新进样本等等。建议您阅读CFPS用户手册以及家庭关系库了解有关CFPS家庭成员界定以及追访的相关

信息。

 

Q:在CFPS2016中,“fml2016_count ”2016年家庭成员人口数和“familysize16”家庭人口规模

(综合变量),这两个变量有些家庭是不同的,那么哪个能代表家庭规模呢?通过家庭纯收入和人均家庭

收入,我推断出的家庭人口是“fml2016_count ”2016年家庭成员人口数这一变量,所以用家庭规

模这一变量时,应采用哪个变量呢?

A:familysize16是项目组工作人员后期清理数据时根据清理之后的家庭关系来判断的家庭规模;

而fml2016_count是在访问现场时系统根据问卷的原始回答自动生成的家庭规模。我们计算人均家庭纯收

入时采用了fml2016_count是因为现场受访者是根据fml2016_count中所包含的人员来回答经济问卷的。

 

Q:我想知道2010年及以后每个追踪样本是否在2010-2018年每个年份上是否生育了孩子以及生育孩子的

年份,这个可以通过历年追踪数据获得吗?如果可以的话如何获得这个数据?

A:生育子女情况需要通过2010-2016家庭关系库查看,里面后缀为_c1到_c10的变量是每个家庭成员的

子女相关信息。可以通过其出生年进行判断。2018年关系库尚未发布,预计今年夏季发布。

 

Q:在2016年数据中,变量为抑郁情绪pn401-pn420,希望在该变量上对少儿与父母的数据进行匹配,

问该如何操作?更确切的说,根据pid与fid,如何实现少儿与父母的一一对应?

A:2016年家庭关系库中有每一位家庭成员的pid_f和pid_m,分别代表其父母的pid。可以根据pid_f和

pid_m在2016年承认库中寻找相应的pid,如果在成人库中存在,说明其父母有有效的个人问卷,可以

实现少儿问卷和其父母问卷的链接。

 

Q:我看到2010年的成人库中有个qb_1问题为“兄弟姐妹数量”,请问为何这个问题在2012年就不

见了?我想搞清楚样本“是否为独生子女”这个状况,请问从2010-2018的样本库中,是否有能弄清

这个状况的变量?

A:有关兄弟姐妹数的计算,可以参考我们公众号上CFPS小课堂的一篇推送文章:

http://www.isss.pku.edu.cn/cfps/cjwt/cfpsxkt/1295286.htm

 

Q: 性别、年龄、户口、婚姻等变量同时存在于个人库与家庭关系库,如年龄分别为age和tbly_a_p,

性别为gender_update与tb2_a_p,婚姻状况为marriage_last_update与tb3_a18_p,户口为

qa301与hukou_a18_p,应该如何选取正确的变量?

A: 家庭关系库中的数据来自家庭问卷回答人,对于其他家庭成员是代答;个人库中的数据来自个人的

答。因为来源不同,所以数据会存在存在一些不一致的地方。对于性别、年龄和婚姻,我们在跨年

个人核心变量库中为用户做了整理,您可以参考这个库中的数值。

有关该库的介绍,请查看如下推送:https://mp.weixin.qq.com/s/jm6OacrGZ2G7pcs1G3w9eg  

 

Q: 由于2014年成人库里并没有子女数量这一变量,是否可以利用家庭关系库里孩1是否健在、

孩2是否健在……这一类变量,“是”则赋值为1,其余赋值为0,求出对应个人的子女数量呢?

A: 有关子女数计算,请您查阅如下技术报告:

http://www.isss.pku.edu.cn/cfps/docs/20180927132642843455.pdf

上一篇: 下面没有链接了

下一篇: CFPS小课堂 | 关系库父母相关变量缺失原因解析