当前位置: 首页 > 常见问题 > 其他

Q&A

来源:时间:2022-05-12 02:45阅读:

Q:在论文和其它的文献中怎么引用CFPS?

A:请在任何使用CFPS数据的地方进行数据来源标示。具体格式如下:“本论文(书)使用数据全部

(部分)来自北京大学和国家自然科学基金资助、北京大学中国社会科学调查中心执行的中国家庭追

踪调查。”英文为 "The data are from China Family Panel Studies (CFPS), funded by Peking

University and the Nationl Natural Science Foundation of China. The CFPS is maintained

by the Institute of Social Science Survey of Peking University "。

 

Q:“数据更新说明”显示2010年本科就读信息(变量QC306)发布,为何在最新版数据里找不到相关变

量?

A:C306问题经后期整理后以collegetype变量对外发布,位于最新版2010成人数据库的末尾。

 

Q:2010年的慢性疾病数据对外发布了么,为何找不到?

A:2010年成人库的慢性疾病信息,我们目前以编码的形式对外发布。对应的变量名称为QP501ACODE、

QP501BCODE,为方便查阅,您可对照Codebook

 

Q:2010年多选题对应的变量如何理解?可否举例说明?

A:例如2010成人卷的qa7“您参加了以下哪些组织”,该问题包含14个备选项(可多选),故设置

qa7_s_1- qa7_s_14。其中,qa7_s_1为用户选择的第1个组织,qa7_s_2为用户选择的第2个组织,其他

选项依次类推。

 

Q:Can I ask which one between 0 and 1 in 'GENDER' refers to female in the 2010 wave?

A:"1" refers to males for the gender variable. All format labels can be found in our

codebooks through the following link:

 http://www.isss.pku.edu.cn/cfps/en/documentation/data2/index.htm

 

Q:本人在论文中需要使用CFPS2010年的数据。由于一些原因,只能使用2010年11月之前完成访问的样

本。但是我发现数据中缺乏该样本的受访时间,请问有什么办法可以获得或者逼近呢?

A:数据集中有两个变量CYEAR和CMONTH分别表示该样本数据采集的年份和月份。

 

Q:我无法把CSCO职业代码转码国际标准ISCO88的问题,技术报告里提到的CFPStoISCO.do 和

iscoocc.ado 这两个关键性的命令集在网上找不到。我想问一下,不知道能不能帮忙提供一下相关的命令

呢?或者可否告诉我应该找哪位老师申请这两组命令集?

A:请在项目网站“数据文档”这个页面与2010年相关的部分查找。

http://www.isss.pku.edu.cn/cfps/wdzx/sjwd/index.htm

 

Q:我在贵项目2016年少儿数据库(数据名称为cfps2016child_201709.dta)时,不知道如何确定少儿问

中“辅导孩子作业”的人(问卷中代码为WF4)与“辅导孩子作业时长”(问卷中代码为WF401)之间应

该如何进行匹配。在少儿数据库中表示“辅导孩子作业”的人的变量有5个,依次从wf4_s_1至wf4_s_5;

表示“辅导孩子作业时长”的变量有13个,依次为wf401_a_1至wf401_a_12,wf401_a_31。

A:wf4_s_i代表辅导人的pid,其中i与受访者人选择的顺序有关,受访者报的第一位辅导人员pid则在

wf4_s_1中,以此类推。而wf401_a_i则是根据家庭成员列表PID_A_N中N的位置,譬如WF401_A_2对应

的是该样本家庭成员中PID_A_2这个人辅导孩子作业的时长。所以如果你想知道100021103这个pid辅导

作业时长的话,需要看这个在pid_a_n中的相应位置,然后找到相应的wf401_a_i。目前的设置用起来对

于用户来说确实有一定难度,我们计划在下轮更新时将401系列变量进行调整,让其与wf4_s系列变量一

一对应。

 

Q:请问在成人数据库中,关于最高学历为“高中/中专/技校/职高”,有进一步细分吗?我看到在教育史中

变量描述“上哪类高中”,但是这一数据不全,有很多最高学历为高中阶段的个体,在“上哪类高中”

显示为“不适用”。请问怎样操作才能对最高学历为高中阶段的进行细分呢?具体分成普高、职高、中

专、技校。

A:最高学历是一个综合变量,它的信息可以来自于往期调查数据也可能来自当期调查数据。譬如针对一位

我们在往期调查中已经采集过教育信息的老人,我们在当轮次调查中不会再重复采集其教育信息。而教育

史“上哪类高中”的信息只针对今年新采集学历相关信息的受访者也有有效值。如果你想知道其他样本的

学校类型,你可以尝试在其他期数据中提取。

 

Q:正式版数据中是否有关于被试所在学校科类的信息呢,以大学为例,师范类、农林类、综合类、军事

类、质类等?

A:正式版中被包括学校分类信息(譬如重点院校、普通院校),学校的分类中不体现学科信息。

 

Q:关于个人问卷中工作状态的确认方面的数据,想确认下是不是产假期间的妇女仍然算作有工作?看到

问卷有关于临时假期和在确定时间返回工作岗位的问题设置。但这种划定似乎不包含从事农业生产的

妇女(因为她们没有名义上的产假)?

A:在我们的综合变量employ中你所提及的情况是算作“有工作”的,不属于另外两类(“没有工作”

或“不在劳动力市场“)人员。

 

Q:在qn201_b_1到qn202题,有跳转条件为u201!=1,这个条件该如何理解?

A:!=的意思是不等于,也就是当U201不等于时。

 

Q:调查问卷中对于是否住家进行了提问“住家与否”但是在数据中对于这一部分的反映只有一个家庭成

样本编码的整合字符串,对于每一部分如何表示的不是太清楚,特别是住家状态这一项的反映,是字

符串的第一个字母的反映吗?

A在家庭成员数据库中,我们对于每个人是否在家居住有一个二分变量(是、否)。以CFPS2016为例,

个变量名是tb6_a16_p,可以直接通过它了解个体是否居住在当前家庭。

 

Q:我在对CFPS数据库进行研究的时候,发现在CFPS2014年中有很详细的关于金融素养的题目,在

CFPS2018年中也有关于个人金融知识的题目,但是在CFPS2016年却鲜有涉及到金融素养或者金融

识的题目,因此我想问一下是否是我在下载该数据库的时候存在数据缺失的问题,还是CFPS2016

年本身没有设计金融素养或金融知识的题目呢?

A:金融素养模块和相关问题为合作机构的搭载问题,只在2014和2018年进行了数据采集,2016年没

有提问相关问题。

 

Q:请问CFPS2016中的劳动者工作时间计算完整的逻辑是什么?

A:CFPS针对受访者的主要工作(QG6)、一般工作(EGC204_B_1,EGC204_a_i系列)以及实习工作

(QGA302)均询问了一定时间内每周工作的时长,工作总时长需要综合考虑这三个部分。

 

Q:我想问问10-16年的所有savings变量是否跨年可比呢?18年没有生成savings变量,用ft1代替

可以吗?

A:Ft1问题在不同年份的问卷题干上有些许差别,严格来说并不直接可比。请您结合您自身的研究判断

是否能将其判断为可比变量。问卷比对时可以借助我们的跨年问卷比对表。

http://www.isss.pku.edu.cn/cfps/wdzx/tcwj/index.htm

(CFPS2010-2018历年家庭经济问卷汇总表)2018年你可以用ft1代替。

 

Q:在2016年数据中,QM601_s_1,QM601_s_2都是调查宗教的,请问两个变量的区别是?

A:_s_1代表受访者的第一个选择,_s_2代表第二个选择。如果二者都存在有效的数值,说明该受访者

至少填报了两个宗教。

 

Q:因为有些变量不同年份变量名并不一样,想确认下不同年份之间不会存在变量名相同,但表示的变量

不相同的情况?另外,您是否有相关资料可以对照同一变量不同年份的变量名呢?

A:您好,数据中的确存在部分这样的情况。不建议您通过某一年份的变量名来推导其他年份变量含义的

做法,需要对照当年调查问卷进行确认。我们网站上有跨年问卷比对表(CFPS2010-2018历年XX问卷

内容汇总表),也许可以给你提供参考。http://www.isss.pku.edu.cn/cfps/wdzx/tcwj/index.htm

 

Q:请问2018年成人库中,一些样本主要工作的持续时间计算不一致,有些样本按照

egc1053m-egc1052m计算,只持续一个月;但是按照qg12/qg11计算,持续了11个月。

A:qg11与qg12没有直接的计算关系;qg11是受访者自报的每月税后工资,qg12是受访者自报的过

去12个月工作总收入(工资、奖金、现金福利、实物补贴都算在内)。问卷中的检查,只要

qg12≥qg11,年收入应高于月收入即可。因为是自报的,有可能二者都是对的,也有可能其中之一

存在误报。请您根据自己的理解进行相应的处理。项目组也会对此问题进行进一步探索,如有系统性

发现,会体现在后续的更新数据集中。

 

Q:2018年问卷中gc1053问的是“请问您的这份工作持续至什么时候”,但在成人数据库中,

egc1053y 和 egc1053m 标签为什么是最早一次间断时间?

A:因为考虑到工作可能会间断多次,在此种情况下,受访者提供最早一次的间断时间。

 

Q:2012年“主要工作”是否是“受雇工作1”的一部分?

A:二者有交叉部分,您可以参考2012年主要工作相关的如下技术报告和调查问卷:

http://www.isss.pku.edu.cn/cfps/docs/20210427144546134380.pdf?CSRFT=WSVD-A9O4-T8KX-N556-Q79X-52XQ-OYAG-NDTP  

 

Q:您好,请问cfps2014年如何判断个人是否体制内(政府部门,国企,事业单位)工作?

A:个人问卷工作相关模块有询问受雇工作的“雇主性质”,您可以在调查问卷中查找。

http://www.isss.pku.edu.cn/cfps/docs/20211029155608209728.pdf

 

Q:你好,2020年个人层面,工作性质是自家农业生产经营的,后面工资性的问题都是不适用,

家农业生产经营的没有统计收入吗?

A:农业经济的相关收入在经济库中,数据还在清理和评估中,具体发布时间请关注公众号。

上一篇: 下面没有链接了

下一篇: CFPS小课堂 | 如何用CFPS做性别研究?