当前位置: 首页 > 常见问题 > 缺失值

CFPS小课堂 | 数据使用Q&A(2020:1)

来源:时间:2022-05-12 04:33阅读:

 

在家办公的这段时间里,小编发现疫情没有影响用户们分析CFPS数据的热情。我们在回复和整理数据用户邮件时发现,近期用户问题很多具有共性,主要是CFPS2018家庭关系库何时更新,地址数据在哪获取,数值中的-8怎么理解等。

 

从本周起,小编将根据近期用户邮箱中的典型问题定期推送数据使用Q&A系列,将过去一到两周内我们的用户邮箱收到的问题和我们的解答与所有用户分享。希望这些有共性的问题能加深您对CFPS数据的理解,减少数据使用误区。

 

数据动态相关

 

Q:今年一月份最新上传的cfps2018persony_202001文件,我看到跟cfps2018person_201911里面的变量是一样的,想问您一下最新上传的这个文件是有什么新的内容吗?

A:persony是个人代答的数据,person是个人自答的相关数据,两个数据集所含绝大部分变量不同,具体信息请参考调查问卷的个人自答和个人代答部分。

 

Q:请问CFPS2018年的家庭关系数据库公布了吗?在CFPS网站和北大Opendata网站都没有找到参访者之间的家庭关系数据。

A:CFPS2018家庭关系库还在清理中,预计今年夏季发布。

 

Q:最新2018年的数据中的权重变量在文件夹中没有找到这个变量,是因为目前还没有更新吗或者是在另外的文件夹中。如果没有更新大概什么时间会更新呢?

A:是的,现在权重变量还在清理当中,我们预计于今年夏季公布相关数据,最新信息请您关注CFPS官方公众号ISSS_CFPS。

 

缺失值相关

      

Q:请问在2018年成人数据库中(文件名:cfps2018person_201911),关于变量符号为qi301_s_1,标签为参保项目1的值为-8(不适用)是为什么?

A:qi301_s_1代表受访者在这道题选择的是第一个参保项目,-8是因为部分受访者没有跳入这道题。可以通过仔细阅读调查问卷的相关模块发现,以下{}涉及到的部分受访者都没有跳入这道题。

问卷跳转

I 部分 退休与养老

【CAPI】按照以下规则跳转:

{#1 若 age<16,跳至 F 部分;}

#2 若 16<=age <45,跳至 I3 部分;

#3 若 age>=45 且 retire =1,跳至 I2 部分。

#4 其他情况,继续提问 I1 部分。

I202 QI202”税后领退休金数额(元/月)”包括各种补贴在内,您现在税后每月共领取多少“【CAPI】加载离退休金”及“【CAPI】加载各类养老保险”?________1..100,000 元/月

【CAPI】{#1 若 I202=“不知道”或拒绝回答,继续提问 I203;否则,跳至 F 部分。}

 

Q:关于互联网使用这部分的数据有大量的“不适用”,请问这是因为这部分人没有参加关于互联网部分的调查,还是需要从前几轮互联网相关调查的数据进行补充呢?

A:关于互联网使用和职业编码的-8,建议您仔细阅读我们的调查问卷,关注相关逻辑跳转。譬如问卷中的下列内容说明只有U201=1或 U202=1的受访者才会回答后续的互联网使用情况这一模块。

问卷跳转

【CAPI】U201=1 或 U202=1,继续提问 U700;否则,跳至 U8。
U700 QU700"互联网使用情况引语"以下我们将了解“【CAPI】加载您/你”一般情况下使用互联网的频率。

 

Q:您好,请问2016数据取值出现-9代表什么含义?

A:答:-9是不属于系统跳转(-8)、受访户拒绝回答(-2)或者不知道(-1)之类的其他缺失原因的缺失,有可能是访问系统的一些问题造成(譬如受访者本应回答这一道题,但由于各种原因没有跳到这道题)。一般来说涉及到-9的样本量较小。

 

Q:数据库中存在大量的“不适用”,比如:2018年成人库中工作单位性质一列,存在大量的“不适用”,但是我查看原始问卷发现,针对这一问题有1-9个选项,那“不适用”是怎么造成的?怎么调整呢?

A:有关数据集中的“不适用”,请先阅读我们微信公众号“中国家庭追踪调查”中有关缺失数据的相关说明,如还有进一步问题再与我们联系。
http://www.isss.pku.edu.cn/cfps/cjwt/cfpsxkt/1295293.htm

 

地址相关

 

Q:您好,请问CFPS数据中的区县编码countyID的对应表,可以在哪里获取呢?因为本人在进行当前主题研究的时候,需要知道区县编码所对应的实际区县名称。

A:关于地址数据问题,请参考我们的相关说明,并根据研究需要进行申请。

http://www.isss.pku.edu.cn/cfps/sjzx/xzsj/index.htm鉴于目前的疫情状态,保密机审批和使用暂缓,其他各类申请正常处理。

 

收入和支出相关

 

Q:请问CFPS数据2012年的收入变量是sg418est吗?如果是,数据调整过物价没?如果没有,如何调整物价?

A:收入变量建议使用我们的综合变量,个人和家庭层面的收入都有。详情请参考CFPS的用户手册中关于收入综合变量的说明,详情请见http://www.isss.pku.edu.cn/cfps/wdzx/yhsc/index.htm

 

其他相关

 

Q:Can I ask which one between 0 and 1 in 'GENDER' refers to female in the 2010 wave?

A:"1" refers to males for the gender variable. All format labels can be found in our codebooks through the following link:  http://www.isss.pku.edu.cn/cfps/en/documentation/data2/index.htm

 

Q:本人在论文中需要使用CFPS2010年的数据。由于一些原因,只能使用2010年11月之前完成访问的样本。但是我发现数据中缺乏该样本的受访时间,请问有什么办法可以获得或者逼近呢?

A:数据集中有两个变量CYEAR和CMONTH分别表示该样本数据采集的年份和月份。

 

Q:我在使用CFPS的数据写我的博士论文的时候遇到了无法把CSCO职业代码转码国际标准ISCO88的问题,技术报告里提到的CFPStoISCO.do 和 iscoocc.ado 这两个关键性的命令集在网上找不到。我想问一下,不知道能不能帮忙提供一下相关的命令集呢?或者可否告诉我应该找哪位老师申请这两组命令集?

A:请在项目网站“数据文档”这个页面与2010年相关的部分查找。http://www.isss.pku.edu.cn/cfps/wdzx/sjwd/index.htm

 

 

 

请您关注CFPS公众号,阅读更多CFPS小课堂:ISSS_CFPS

上一篇: CFPS小课堂 | 请不要问我,我“不知道”,我“拒绝回答”......

下一篇: 下面没有链接了