当前位置: 首页 > 常见问题 > 家庭关系库

CFPS小课堂 | 数据使用 Q&A

来源:时间:2022-05-12 04:23阅读:

CFPS在2012年和2016年使用的B套问卷包含记忆测试和数列测试,这套问卷的设计原型来自于美国健康与退休调查(Health and Retirement Study, HRS)。在记忆测试中,访员给受访者读出10个在生活中常见的词语(山、米饭、河流等),受访者在听完全部10个词语后立即回忆访员读出的词语,此次回忆所得分数称为即时记忆得分。再过五分钟后,访员会要求受访者再次回忆刚才听到的10个词语,此次回忆所得分数称为延迟记忆得分。在计算得分时,答对的词语总数为记忆得分,不对回忆词语的顺序做要求。

 

Q:我下载的Stata数据打开为何会出现乱码?

A:x项目组在2019年末更新了数据平台的所有数据集,除2011年为Stata13版的数据,其他数据均为Stata14版本。

 

Q:为何2014年数据库里没有“金融知识”模块的数据?

A:“金融知识”模块的内容属于合作单位的搭车模块,应合作方要求延期发布。

 

Q:为何某变量出现大量的“-8”(不适用)?

A:CFPS中的不适用有很多情况。一般而言,“-8”不适用是由于问卷逻辑跳转造成的,可以查看问题前方的红色【CAPI】字样,详情可参考微信文章《请不要问我,我“不知道”,我“拒绝回答”》。

 

Q:多选题对应的变量如何理解?

A:例如2010成人卷的qa7“您参加了以下哪些组织”,该问题包含14个备选项(可多选),故设置qa7_s_1- qa7_s_14。其中,qa7_s_1为用户选择的第1个组织,qa7_s_2为用户选择的第2个组织,其他选项依次类推。

 

Q: 问卷中“过去12个月”与“过去一年”的提问有什么区别?

A:如果提问的是“过去12个月”,则按照调查时间起向前追溯一年;如果提问的是“过去一年”“去年”,则按照上一年的1月1日至12月31日。

 

Q:问卷中有自答、代答、面访、电访多种问卷,为何在数据库中找不到代答和电访的某些变量?

A:CFPS发布的数据已经经过清理,我们会综合考虑自答、代答、电访、面访的问卷问题统一相同问题的变量名,一般会优先采用面访自答的变量名。

 

Q:家庭关系库样本数量为何大于成人库于少儿库之和?

A:在实地调查中,由于被访者拒答或者其他原因可能造成没有个人问卷的情况,故家庭库样本数与成人和少儿之和不相等。

 

Q:为何同一个pid会在不同的家庭里出现?

A:这种情况只会在2012年及之后调查的家庭关系库中出现,说明受访者与原家庭经济上独立,归属到另一个家庭了。详细情况可以查看CFPS2012的清理报告。

 

Q:家庭问卷中,如何确定户主?

A:CFPS中每个样本的家庭成员都是同等的,没有户主的概念。研究者可根据特定的研究需要结合数据库中的其它变量进行相应的处理。

 

Q:我在网上看到了2008、2009、2010、2011、2012、2014年的数据,为什么没有2013年的数据?2015年的数据何时发布?

A:2008、2009年为CFPS全国正式调查的预调查。2010年开始CFPS开始全国基线,之后每两年一次全样本追踪。所以,你说为什么没有2013和2015。。。至于让人误解的2011年维护调查,小编真的想说,有时间多看看官网吧。。。

 

小贴士1:如何快速找到需要的变量

最便捷的方法是根据问卷中的变量名或者题号搜索,一般能找到需要的变量;如果找不到,还可以使用问卷题目中的关键字搜索;实在找不到,还是邮件服务邮箱吧,说不定,你找错了数据库,或者,这个变量还暂时没有发布。

 

 

 

请您关注CFPS公众号,阅读更多CFPS小课堂:ISSS_CFPS

上一篇: CFPS小课堂 | 如何计算兄弟姐妹数

下一篇: CFPS小课堂 | 人员类型