中国的空气质量数据:一份简单介绍

暑期在学校做RA,参与一个跟中国空气污染相关的项目。之前听过一些用空气质量数据写的文章,但并没有过多留意,没想到这两年经常能看到相关的paper或working paper,而且我想将来使用这方面数据的人也会越来越多。因此整理了下中国空气质量数据的相关资料,并在此跟大家分享下。当然,主要是以经济学的视角来写这篇文章。

空气质量数据,按数据来源分为两类,一类是政府网站提供的数据(下文1-4),另一类则是网友提供的,在政府网站上抓取下来的数据(下文5)。前者是社科学者直接能用的数据,即使可能存在数据造假也可以用,这点下面会谈到;后者则是爬虫数据,主要是网友在做的一些相关项目提供的数据(which is awesome)。后者的数据获取会比较简单(一些网站提供API接口或SQL格式的数据),但数据在使用之前需要跟官方数据做一下核对。

 

1. 全国城市空气质量日报(http://datacenter.mep.gov.cn:8099/ths-report/report!list.action?xmlname=1462259560614)

全国城市空气质量日报是环境部数据中心的一部分,目前提供中国367个城市每天的AQI数据。最早可查询到2014年1月1号的数据,但是时间越早的数据所涉及的城市越少。

说到空气质量数据,值得一提的是2012年之前,中国政府使用的是API(Air Pollution Index)数据。事情的拐点发生在2011年年底,美国驻华大使馆开始在推特公布北京的PM2.5数据,民众渐渐关注到中国的空气议题,之后中国政府在批评声中修改了空气质量标准,而以往的标准是不包含PM2.5这一指标的。AQI和API的区别,如维基百科AQI条目所述:

“AQI分级计算参考的标准是GB 3095-2012《环境空气质量标准》(现行),参与评价的污染物为SO2、NO2、PM10、PM2.5、O3、CO等六项,每小时发布一次;而API分级计算参考的标准是GB 3095-1996《环境空气质量标准》(已作废),评价的污染物仅为SO2、NO2和PM10等三项,每天发布一次。因此,AQI采用的标准更严、污染物指标更多、发布频次更高,其评价结果也将更加接近公众的真实感受。”

早期的经济学的相关研究使用的主要是环境部的API数据,其中包含了PM10、SO2和NO2三个指标。如Ghanem&Zhang (2014) 发表在JEEM的文章,通过研究中国113个城市2010年期间的API数据,他们怀疑中国有一半的城市存在数据造假行为。他们发现天数的密度曲线在API为100左右存在一个断点,即API稍稍小于100的天数会明显多于API稍稍大于100的天数。这以断点对北京特别明显,而API在100以下则是北京市“蓝天计划”中的蓝天标准。除此之外,Chen et al. (2013)同样发表在JEEM的文章,利用2000到2009年的API数据研究发现,北京为举办奥运会所做的改善空气准备,确实改善了北京的空气质量。其后为了排除数据造假对其估计的影响,他们使用美国NASA卫星的AOD数据做了稳健性检验。因此,我们可以看到,即使数据被怀疑存在造假,也是可以用以研究的;一是研究数据造假本身,二则是利用第三方可靠的数据源进行论证。

 

2. 全国城市空气质量发布平台(http://106.37.208.233:20035/)

该平台由中国环境监测总站提供,是除了上述空气质量日报之外,另一个中国官方提供的空气质量数据。该数据源最大的特点在于其提供实时的各城市各个监测点的数据,也就是说,这一网站提供的是每小时的、散落在不同城市的各个检测点的,包含了SO2、NO2、PM10、PM2.5、O3、CO六个指标的数据。这应该能为经济学研究者进行识别(identification)提供不少帮助。但该网站有一个槽点,是只能用IE浏览器打开。

 

3. 美使馆数据(http://www.stateair.net/)

该项数据由美国驻华大使馆(北京)和四个领事馆(上海、沈阳、成都和广州)所提供,网站上提供实时的AQI数据,也有历史的每小时PM2.5数据提供下载。这是上述五个机构自己测量的空气质量数据,监测点应该在各使馆内部。虽然涉及到的城市只有五个,即北京、上海、沈阳、成都和广州,但是数据质量可信度较高,很适合拿来做稳健性检验。如上文所述,美使馆于2011年底开始在推特公布PM2.5数据,推动了中国政府在空气质量检测方面的改变。

 

4. 美国NASA的AOD数据(https://ladsweb.modaps.eosdis.nasa.gov/)

AOD的全称是Aerosol Optical Depth,中文叫气溶剂光学厚度,该数据由美国国家航空航天局(NASA)的MODIS卫星提供。作为Chen et al.(2013)里提及的数据,这里也仅仅是提及下。因为涉及气象学方面的知识,我也不是很了解。数据具体的下载网站是https://ladsweb.modaps.eosdis.nasa.gov/,但这应该跟灯光数据类似,需要了解相关领域才能懂得如何处理数据。值得一提的是,网上有些研究表示,AOD数据与PM10存在相关性,但是这一相关性会受季节或其他气象因素影响,因此使用时需要注意控制变量的设置。感兴趣的同学还请自行google相关资料。

 

5. 一些网友整理的数据

最后介绍下一些网友爬虫整理的数据,他们的数据源基本来自上述介绍的两个中国政府网站。但有些网站并没有明说其数据源是什么,对于这些网站,并不能确定他们的数据源是什么。

第一个的网站是 http://aqicn.org/ ,特点是提供英文(和其他语言)界面,且提供的是全世界范围的空气质量数据(虽然我们并不关心这点),感觉外国人多半会选择这个网站来了解一些中国的空气质量信息。第二个网站则是http://www.pm25.in/ ,特点是提供API接口,因此方便人们抓取数据。这两个网站都没有明说其数据源,但提供的是中国各城市的监测点数据。我猜他们的数据源应该是前面提到的“全国城市空气质量发布平台”。

第三和第四个网站分别是中国大陆重点城市空气质量(AQI)历史数据库(https://www.gracecode.com/aqi.html )和中国大陆重点城市空气质量(AQI)数据抓取(http://ydoku.com/aqi-fetch.html)。他们抓取的都是环境部数据中心提供的中国各城市每日的AQI数据。两者都是网友自己抓取的数据,前者网站上写着“目前数据库包含 3231 个地区的总计 444391 条数据,时间跨度为 2000-06-05 至 2015-02-25”;后者则是在前者的基础上,抓取了2014-01-01 至 2017-04-27的数据。数据的储存格式是SQL,因此需要处理一下转化成csv格式。

 

参考文献

  1. Ghanem, D., & Zhang, J. (2014). ‘Effortless Perfection:’Do Chinese cities manipulate air pollution data?. Journal of Environmental Economics and Management68(2), 203-225.
  2. Chen, Y., Jin, G. Z., Kumar, N., & Shi, G. (2013). The promise of Beijing: Evaluating the impact of the 2008 Olympic Games on air quality. Journal of Environmental Economics and Management66(3), 424-443.

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

博弈论的发展:一段回顾

前言

《The Journal of Economic Perspectives》16年秋季刊中讨论了两个专题,分别是“移民与劳动力市场(Immigration and Labor Markets)”和“博弈论领域正在发生什么?(What is Happening in Game Theory?)”。在第二个专题中,耶鲁大学经济系教授Larry Samuelson发表了名为“Game Theory in Economics and Beyond”的专题文章,回顾了博弈论是如何以纯数学的内容融入经济学领域并得到极大发展的一段历程,然后提及了博弈论领域目前面临的几个挑战,并在最后就博弈论的未来做了展望。

我这学期刚好修了一门博弈论,所以在这学期的Final之前,编译下这篇文章,加深自己对博弈论的理解,也希望能对国内修博弈论课程的同学有所帮助。本文将主要介绍这篇论文的第一部分,即集中梳理下博弈论这门学科的发展历程,而不会对第二部分(挑战)和第三部分(展望)做详细介绍。感兴趣的同学可以参阅原文。需要说明的是:第一,本文并没有对其涉及到的一些经典博弈模型和术语(如Cournot and Bertrand model、infinitely repeared game、Folk theorem和Signaling等)做出解释,对这些内容的理解要求一些基本的博弈论知识;第二,正文部分小标题内容为本文所取(为了方便阅读和理解),小标题后的英文对应的才是原论文中的标题内容。

正文

在上世纪60和70年代,博弈论基本是经济学学科中分离的一支。学习博弈论的人往往是那些被称作game theorists的人群,而经济学家对博弈论基本没有什么概念。但随着上世纪80、90年代经济学家在博弈论上的发展,博弈论目前已经成为经济学中标准的工具之一。这种转变明显地体现在经济学的课堂上,经济学研究生或博士生会在其第一年的核心课程(具体而言是在微观经济学的课程)中学习博弈论的基本使用。

1.博弈论的微观基础(“Aggregating Individual Behavior”)

首先需要谈及的是博弈论的建立和发展是有其微观基础的,即博弈论的基础跟经济学的基础是一致的。经济学家之所以跟其他社科学者存在差异,就在于其秉持的方法论上的个人主义(methodological individualism)这一信念,即对社会现象的解释是建立在对人体行为的研究上的。经济学家依据这一信念建立的模型有着两大原则:第一个原则跟人体行为有关,即经济学家假设人类存在持续且稳定的偏好(consistent and stable preferences);而第二个原则则是利用个人行为的加总来研究复杂的社会现象。

而博弈论也是建立在个体行为的基础之上,即它同样假设个体存在持续且稳定的偏好,但它使用另外一种视角来理解“使用个体行为的加总来检验社会现象”这一模型。简而言之,博弈论跟微观经济学有一样的假设前提,但会在此假设基础上通过另外一种途径来研究社会现象。

2.古典的博弈论理论(“Classical Game Theory”)

在古典的视角看来,博弈论就是对感兴趣的研究情景的一种描述,而不是我们今天所用说的是一种近似(approximation)。古典的博弈论理论使得这一学科能够自给自足的(self-contained)。这也意味着在古典的视角下,博弈论不需要担心决策者(players)是不是会在游戏中交流,合作或相互发送信号(signal)。而即使发生了上述情况,在古典视角的认知中,这些情况也将会被包含在决策者的行动之中,因而其对博弈的分析并不会受到影响。

其中的一个例子便是Cournot和Bertrand模型。在不完全竞争情况下,Cournot模型假定企业可以选择他们的产出数量,而产品的市场价格由市场上所有产出数量(而非一家企业的产出数量)来决定;而后来Bertrand在其构建的模型中表示,市场上的企业是可以选择其产品价格的,而非由市场的总体产出来决定价格。那我们应该如何在这两个模型中做出选择?在古典视角的下,这一问题是很好解决的。他们认为,如果企业可以选择产品数量,那么就用Cournot模型;如果企业可以现在产品价格,那么就用Bertrand模型;而如果数量和价格都可以选择,我们则需要一个不一样的新模型。

而当我们构建了适当的模型后,在理性人决策者的基础上,均衡便会被反映出来。比如在Cournot模型中,我们很容易就会发现存在纳什均衡且只存在一个纳什均衡。然而,实际上这一模型会存在许多纳什均衡,而我们也需要考虑更多的情况。比如在repeated game中,一种可能的均衡是上文所提及的在one-shot game中的纳什均衡;但在企业足够耐心的情况下,最后可能会导致企业会相互合作的结局,企业会合作以设置垄断价格,并在每一期中划分市场利润。事实上,正如fork theorem所指出的,对于足够耐心的决策者而言,实际上任何结果都会是均衡。而在另外一些情况中,如企业面临的是非线性的需求函数,或者面临不确定性(uncertainty)——如信号模型(signaling models)时,多均衡的结局都会产生。

3.均衡的精炼(“Equilibrium Refinements”)

面对多均衡这一问题,博弈论中开始出现一支关于均衡的精炼(refinement)的文献。在这一支文献中,经济学家试图通过设置各种精炼的标准,对纳什均衡的产生做出进一步限制,由此来“提炼”纳什均衡。然而这一试图解决问题的工具也存在许多问题,如作者指出,在不管增长的精炼理论之中,新的理论的产生给后来者提供了批评他们弱点的机会,而后来者也是如此,仅仅是给下一轮的新理论提供了原材料,并如此反复循环。

但在许多经济学家都在纳什均衡精炼的设置条件上绞尽脑汁的时候,经济学家如Bernheim(1984)和Pearce(1984)仅仅就“理性及其共同知识”(common knowledge of nationlity)这一假设基础上(而不是通过添加其他精炼限制)做出了一连串的突破。还是以Cournot模型为例子,如果我们假定企业是理性决策者,企业的竞争对手也是理性决策者,而且企业知道他的对手是理性的,且企业的对手知道“企业知道他的对手是理性”这一事实(并如此反复…),我们可以一步步消除掉(eliminate)企业们不可能做出的产量决策,并在此反复消除之下达到最终的均衡产量。虽然如此,这一进展在其他许多的博弈(及其精炼)中并不适用。matching pennies game就是一个明显的例子,我们知道,这个游戏最终的均衡是一个(1/2, 1/2)的混合策略均衡,而利用common knowledge of nationlity并不能消除这个博弈中决策者的任一决策。

4.工具主义观点下的博弈论(“An Instrumental View of Game Theory”)

作为回应,古典的博弈论便让位于工具视角下的博弈论理论。在这种视角下,博弈论不再是关于决策者相互博弈的描述,而是变成对人们研究这些博弈过程的有用的模型工具。还是以Cournot和Bertrand模型为例,在这种视角下,我们可以看出企业的行动不再取决于我们所想企业会怎么做,而是取决于哪个模型对我们分析问题较有帮助。如果我们的模型设定是“即使是在只有两个企业的市场上,竞争也足够使得他们的产品价格等于边际成本”,那么选择Bertrand模型更为合适;而在另外一种市场设定中,即当我们认为“新进入的企业会降低现存企业的利润”时,选择Cournot模型会更为合适。

一个工具主义下博弈理论的运用即是,一个更符合现实情况的模型并不一定意味着这是一个更好的模型(能帮助人们更好地理解社会现实的模型才是更好的模型)。也就是说,在工具主义的观点看来,即使不会使得模型更为复杂,更为现实也不是一个模型必要的构建条件。举例而言,无限期的重复博弈(infinitely repeated games)很明显就是一个不现实的模型,一个更为现实的模型是有限期的重复博弈(finitely repeated games)。但是在这里,经济学家关心的是在无限期情况下人们可能采取的行动,而不是关心的人类的死亡率表(human mortality table)。一个很明显的论点即是,在无限期和有限期的情况下,企业可能采取的行为完全是不一样的,在无限期下会导致的垄断的均衡结局在有限期重复博弈下将不复存在。

这种工具主义的观点同时也复杂化了博弈论。以简单的囚徒困境为例,我们知道,在古典视角下,囚徒困境中最后的均衡是双方都会在面临“合作”和“背叛”的决策下选择背叛;但在工具主义的视角下,这一问题就复杂许多。首先,博弈双方的“合作”可能意味着是垄断市场上的合作,也可能是核武器协议中的信号;而“背叛”则可能是涌进市场的新企业对市场总产出的影响,也可能意味着安装反弹道导弹这一抉择。其次,效用的测量将变得困难,我们面临的效用测量可能并不是指的测量诸如企业利润或者数量。于是,问“决策者会不会背叛”这个问题,就等同于在问“对于囚徒困境,我们是否选择了合适的方式去近似他们的博弈了?”,而这可以变为一个很难回答的问题。

5.演化博弈(“Evolutionary Game Theory”)

演化博弈又将博弈论从工具主义带回了经济学长久的传统之中。在经济学中,我们假设理性人会最大化自己的效用,但是我们总会问道,“人们或企业真的会最大化自己的效用吗”?对此,一个标准的回应是,人们或许并不总是最大化自己的效用,事实上,人们会根据自己已有的经验不断做出选择和调整,并由此使得自己达到更优的结果,虽然在这过程中有时人们也会进行试验和犯错。而正是由此产生的人们不断适应的过程,解决了人们最大化自己效用的问题。

演化博弈则借用了类似的理由。演化博弈并不是在说决策者将从博弈的结构中推出均衡,而是在说我们认为决策者将会跟随着博弈过程而不断累积经验。这一观点下的博弈论中使用的方法更接近于传统经济学中所使用的方法。事实上,古典的博弈模型特点之一便是在动态过程中找出均衡,而演化博弈这一视角无疑又将博弈论拉回到了这一局面。有意思的是,1838年Cournot构建Cournot模型时,就是将其结果建立在以最佳策略(best repsonse)为基础的相互调整的过程中。

最后作者提到了演化博弈所要处理的两个最基本的问题是:一是我们能从动态的过程中得到博弈的纳什均衡吗?二是这一动态过程能产出纳什均衡的精炼吗?对于前者,回答是肯定的。经济学家对此的共识是,在适当的条件下,演化博弈是可以产出纳什均衡的;而对于后者,回答则是否定的,即演化博弈并不一定能导致标准的纳什均衡精炼。

 

论文的第一部分对博弈论发展的梳理到此就结束了。在文章剩下的两部分中,作者先提及了博弈论面临的挑战,如多均衡下的选择,博弈论的应用和合作博弈方面的挑战;再谈了下自己对博弈论未来的展望,分别提及了博弈论在经济学学科之外的发展以及博弈论将来可能的发展之地(如在行为经济学和动态效用最大化问题上的应用)。感兴趣的同学可能参阅原文。

 

文献来源:

Samuelson, L. (2016). Game Theory in Economics and Beyond. Journal of Economic Perspectives, 30(4), 107-30.

 

 

欢迎各位批评指正。

联系我

Share

计划生育及其意外后果——来自经济学研究的证据

前言

2016年,中国结束了三十多年的计划生育政策,更确切地说,是结束了计划生育里面的一胎政策。“一对夫妇可生育两个小孩”,对大多数家庭来说,这意味着他们可以最多生育两个小孩的同时,也意味着中国还处于计划生育时代。

全面二胎及其可能的影响并不是这篇文章的关注点,本文希望通过介绍几篇经济学学科的研究,来试图聊一下“计划生育政策及其意外后果”这一话题——即执行了三十多年的计划生育政策,除了控制人口增长之外,还对中国社会的其他方面造成影响了吗?如果答案是肯定的,那么又造成了怎样的影响呢?在回答之前,让我们先看下计划生育政策的背景介绍。

 

计划生育政策

1949年新中国成立时总人口只有5亿4千万,仅仅二十年后,人口数量就超过了8亿人。人口的快速增长引起了政府的担忧,于是从上世纪70年代开始,中国政府开始筹备计划生育工作——从最开始的提倡一对夫妇生育两个孩子(1973年),到最终确定执行强制的“一胎政策”,要求各地政府制定地方的计划生育条例,并在全国大部分地区施行(1979年)。

因此,对经济学家而言,一般视1979年为计划生育政策的正式执行时期,因为1979年之后各地方政府为惩罚多生育行为,根据地方的收入水平制定了相应的的罚金数额。具体而言,计划生育政策带来的两个层次的差异(variation),而这为经济研究中的因果推断提供了可能性。

第一个差异,在于计划生育政策对于不同家庭的可生育胎儿数量的规定是不一样的,即并非中国所有家庭都只能生育一个小孩。一胎政策(One-Child Policy)主要实施在中国的城市地区,而对于一些省份的农村居民来说,如果他们第一胎是女儿则可合法地生育第二胎,这就是所谓的一胎半政策(“1.5-child” policy)。在一些边远地区,有的家庭可以生育二胎或三胎;而对一些少数民族或一些在高危职位就业的家庭来说,他们被准予不算做是计划生育政策的实施对象(Ebenstein 2010)。

据Ebenstein 2010年发表在Journal of Human Resources(下称JHR)的文章估计,在2010年左右,大概有35%的家庭受到一胎政策的影响,54%的家庭受到一胎半政策的影响,10%的家庭可以合法生育二胎,1%的家庭可合法生育三胎。

第二个层面的差异,在于计划生育政策在各地对于超生家庭的罚金数额是不一样的。关于各地的罚金差异,Ebenstein 2010年的文章也提供了其整理的数据。图1为Wei Huang和Yi Zhou工作论文中根据Ebenstein的数据整理出来的图片,横坐标显示的是年份,纵坐标表示的是“各省罚金除以当地居民年收入得到的倍数”。另外,Ebenstein的罚金数据可在其个人网站上下载。

fine_Wei Huang 2016

图1 中国各省的计划生育罚金率

 

计划生育的意外后果

  1. 男女性别比的失衡加剧

中国男女性别比失衡(sex ratio imbalance)方面的经济学文献很多,这也是中国研究的一个经典议题。性别比的测度一般是看“每一百个女性对应着多少男性人口”,按自然的生育规律,男女性别比应该为1:1,但在许多国家和地区(主要集中在亚洲、中东和北非),每一百个女性对应着一百多个男性,即男性新生儿的数量要远超女性。由此造成了“Missing women“或“Missing Girls”的现象,即很多女性并没有成长成人,她们可能在出生前就“消失”了,或者童年早期夭折了。

最早关注到这一现象的是经济学家阿玛蒂亚森,他也是“Missing Women”这一概念的提出者。在森最初的研究(Sen 1990)中,他估计世界范围内有超过一亿个消失女性。由于亚洲许多国家(比如印度和中国)也存在这一现象,因此很早之前许多中外经济学家就开始研究中国的“Missing Women”现象,即男女性别比失衡的现象。

长久以来中国人持有的“重男轻女”观念或许影响了中国的性别比失衡现象,但更多经济学家感兴趣的是,自上世纪八十年代以来,中国政府强制执行的计划生育政策是否加剧了这一现象。在一个人口众多的国家,对其大多数家庭采取强制性的一胎化政策,这在全世界范围来看,也是一件很不常见的事情。

Ebenstein(2010)的论文并不是最早的相关研究,但是其整理的罚金数据,为之后的多篇论文提供了识别基础,因此在这里首先讲下这篇文章。Ebenstein的研究发现,在执行计划生育之后,相较于其他地区,受一胎政策影响地区的家庭中生育男性的比例更高。更具体的研究显示,这一比例在第一胎中的区别不大,但对于第一胎是女性的家庭来说,第二胎生育男性的几率更大。也就是说,对于任何家庭来说,第一胎生男生女的概率都是差不多的,但是对于第一胎生了女性的家庭来说,受到一胎政策影响的家庭相较于其他家庭,在第二胎生育男性的可能性更大,由此可看出一胎家庭对其新生儿在性别选择上的主动操作。

上述结论仅仅来自于数据上的描述分析,但之后的回归中也显示了一致的结论。具体而言(原论文表5),在计划生育执行之后,罚金较高的地区中家庭生育男性的可能性更高,而在计划生育执行之前,地区的罚金数量并不会影响家庭的生育结果。进一步研究(原论文表6)显示,罚金数额确实减少了家庭的生育行为,但对于那些拥有一个女孩或者两个女孩的家庭来说,如果他们选择继续生育的话,罚金数额会显著增加这些家庭在下一胎生育男性的比例,即他们如果选择继续生育的话,会想办法“生”一个男孩。

另一篇与这个议题相关的文章来自清华大学的Hongbin Li等人2011年发表在《Demography》上的文章。在这篇文章中,作者利用计划生育在一胎家庭和其他家庭之间的执行差异和执行时间上的前后差异这两层差异,基于双重差分的方法,研究发现计划生育政策造成了1980年至1990年新生儿中94%的性别比失衡现象。

既然计划生育政策的执行真的促进了中国的性别比失衡,而且可能还造成了严重的影响了。那下一步的问题便是其中的机制是什么?即对于那些家庭来说,他们可能是通过怎样的途径来进行“性别选择”的?本文不打算详述此内容,感兴趣的同学可以参看Hongbin Li的另一篇论文(Yuyu Chen 等人 2013)。这篇文章发表在JHR的论文显示,1980年至1990年期间40%-50%的性别比失衡现象与B超技术的引进有关,即B超技术成为了许多家庭进行“性别选择”的一个途径。

 

  1. 小孩数量减少,质量却提高了?

劳动经济学上有一个经典的议题叫“Quality-Quantity Tradeoff”,即质量和数量之间的权衡。这个议题最初源起自经济学家Becker和Lewis的开创性文章(Becker和Lewis 1973),并由此发展出各种各样的trade-off模型。具体而言,质量和数量之间的权衡是指,家庭小孩数量与小孩质量之间会呈负相关关系,即小孩数量的增加会减低其质量,反之亦然。早期的实证研究基本倾向于支持QQ理论的,但是后来的研究则提供了许多不支持QQ理论的证据。

那这一理论在中国是如何的呢?特别是在中国,计划生育的执行刚好为这一理论的检测提供了一个外生的冲击条件,借此经济学家可以来研究在小孩数量必须被减少的背景下,小孩的质量是否得到了提升?在细说之前,还得先谈下“质量”这一指标的测度。关于质量的测度指标很多,主要有受教育程度(Education attainment)、营养和健康状态和认知能力三个指标。通过选用不同的指标测量“质量”进而来讨论QQ理论可能会产生不一样的结果,这与国别等具体情况相关。

而即使采用同一个测量指标,也有可能得出不一样的结论。比如在受教育程度方面,借助计划生育这一外生政策,Rosenzweig和Zhang(2009)的研究发现家庭小孩数量与小孩受教育水平之间存在负向关系,而Qian(2009)的研究则发现,在中国农村,受一胎政策影响的家庭生育第二个小孩会促进其第一个小孩的受教育程度。

对此,新加坡国立大学的Haoming Liu 2014年发表在《Journal of Population Economics》的论文提供了一些新证据和与质量测度相关的讨论。Liu借计划生育政策在1984年的放宽(即准许部分符合条件的家庭可生育二胎,主要是部分省份第一胎为女孩的农村家庭),在文中构建三个工具变量:是否有可生育二胎的资格,当地罚金数额及这两个变量的交互项,由此进行估计推断。

Liu在文章中用小孩的身高来表示小孩的“质量”(具体的测度值是height-for-age z-scores,详情可参阅原文),其研究发现家庭小孩数量的增加会降低其小孩的身高,分位数回归的结果显示这一影响对身高较低的男孩影响会更显著,对不同身高分布的女孩的影响则没有系统差异。而当作者把质量的测度指标换为小孩的受教育程度之后,家庭中小孩数量对其受教育程度的影响就变弱很多。

关于“质量”的测量指标方面,在这篇文章中,作者之所以采用身高作为小孩“质量”的测量指标,是因为:一方面,由于中国存在义务教育制度,所以家庭小孩数量对小孩受教育程度的影响应该会受到义务教育法规的影响,由此可能得到很弱的影响结果;另一方面,营养的摄入量对小孩的身高有着极其重要的影响,而营养的摄入又完全由中国家庭(而非政府)的食物支出决定。以往有研究(Wu和Li 2012)发现家庭小孩数量的增加会减少父母的人力资本投资,那么家庭中小孩数量的增加也极有可能影响小孩的身高。另外,即使在中国公共卫生条件良好的地区,营养的摄入也对小孩的身高也有着很重要的影响。同理可知,如果使用身高作为测度指标,这一指标放在发达国家的贫困地区或发展中国家(如中国)来讨论QQ理论会得出更好的结果。因此,在讨论QQ理论时,质量指标的选取就显得十分重要。

这篇文章用中国的数据对经典议题进行了详细的讨论,提供了来自发展中国家的证据。而此文也拿了《Journal of Population Economics》2015年的库茨涅兹奖(Kuznets Prize),详见IZA相关报道

 

  1. 儿童肥胖的增加

既然家庭中小孩数量的减少有可能提高父母对小孩的人力资本投资,那么除此之外,计划生育政策还可能对其造就的一孩家庭中的小孩带来什么类似后果吗?

最近被《Chinese Economics Review》接收的一篇论文(Jie Zhang 等人 2016)提供了一个有趣的视角,他们在论文中探讨了计划生育政策的执行与我国儿童肥胖之间可能存在的关系。在中国(特别是在大城市的)儿童肥胖这一公共健康议题正日益受到关注的当下,作者等人好奇,对中国特有的由计划生育所塑造的一孩家庭中的小孩而言,相较于那些拥有兄弟姐妹的小孩,他们是不是会面临着不一样的父母照顾,并由此最终反应在他们的肥胖程度上。图2(原论文图1)中数据反馈的这一基本趋势对比,也激励着作者将这个故事更细致地讨论下去。

J. Zhang et al. 2016

    图2 一孩家庭和多孩家庭中超重小孩占比趋势图

该研究发现(原文表3),比起拥有至少一个兄弟姐妹的小孩,出生在一孩家庭中的小孩超重或肥胖的概率会增加5.6%(OLS估计值)或7.8%(2SLS估计值),且将被解释变量换为身体质量指数值和体重值(具体是BMI-for-age z-scores和Weight-for-age z-scores)之后,也得到了一致的正向显著估计。上述是只讨论第一胎样本的结果,原文也提供了全样本的讨论,这些样本的年龄都限定在5到18岁。

那么如何解释这一发现呢?在文中作者提供并用数据论证了两个机制。首先,一孩家庭的父母会用更多的金钱而不是时间来照顾小孩。在原文表5的回归结果中我们可以看到,一孩家庭中的母亲会花更多的时间在工作上,更少的时间在煮饭和照顾小孩上。与此同时,这些家庭中的小孩(见原文表6)花在外面吃饭的时间更多,特别是体现在早餐上,而且他们花在吃快餐的时间也会较多。其次,一孩家庭中的小孩会摄入更多的高糖、高脂肪、高蛋白的食物。这一饮食结构极有可能与父母的照顾时间的缺乏有关,且与他们拥有更多的零花钱相关。

这是第一篇试图探讨计划生育政策与中国儿童肥胖之间因果关系的文章。在儿童肥胖现象伴随着经济增加日益增加的当下,作者在本文提供的视角和研究结果都值得公众和政策制定者关注。

 

  1. “人造双胞胎”现象

“一个小孩太少了…人们想要再生一个”,在Wei Huang等人2016年发表在《The Review of Economics and Statistics》的论文开头,作者们引用了美国广播公司(ABC News)在中国对一位正在医院等待的妇女的采访。

是的,虽然“只生一个好”,但很多家庭可能会觉得“一个小孩太少了”。那么对于这些家庭来说,多生育同时又不用受计划生育政策管制(或说惩罚)的方法存在吗?答案是肯定的,而这个方法即是生育双胞胎(或多胞胎)。

中国政府不会因为一个母亲生育了双胞胎而认为其违反了计划生育这一基本国策,因为生育双胞胎会被认为是不可控的,或者说是不能被操作的。但既然是不可控的,那么人们又如何可以人为地生育双胞胎呢?其实对于这些家庭来说,他们还是有解决问题的方法的,比方在户口登记时把前后两胎出生的小孩谎报为是双胞胎,或者通过药物来诱导母亲怀上双胞胎。这种在人为操作下产生的双胞胎,就是所谓的“人造双胞胎”(Man-made Twins)。

twins_Wei Huang 2016

图3 每一千个新生儿中双胞胎的数量,1965-2005

图3(原论文图1)是1965年到2005年每年中国的双胞胎生育率,数据来源自四次的普查数据。从图3可以看出,1979年计划生育(图中垂直虚线)执行之后,中国新生儿中双胞胎的出生率翻了一倍。但这并不能说明计划生育对“双胞胎”出生率的影响,为此他们在文中对此做了更深入的研究。

Wei Huang等人(2016)的研究发现(见原文表1),当地罚金数额增加一单位(等同于当地家户一年的收入)时,每1000个新生儿中双胞胎的出生率增长了0.066个百分点,且这一发现对汉族家庭成立(增长0.072个百分点)而对少数民族家庭不成立。作者由此推断出,自1970年以来双胞胎出生率增长中三分之一的部分,是因为计划生育政策的执行引起的。另外,计划生育对城市居民的影响比农村居民的要大,且影响主要集中在第二胎,即家长通常是在第二胎进行“人造双胞胎”的行为(见原文表2)。

机制部分检验了“人造双胞胎”的两个可能途径:即将前后两胎谎报为双胞胎,或通过服用药物诱孕双胞胎。对于前者,作者猜想,父母往往是将第二胎跟第三胎谎报为双胞胎,因此比起没有双胞胎出生的家庭,这些家庭中第二胎(“人造双胞胎”)的出生时间要更长,因为这一出生时间其实是第三胎的出生时间。回归结果与作者预期一致(原文表3),双胞胎家庭第一胎跟“第二胎”的出生间隔要比没有双胞胎家庭中两胎出生间隔要长0.08年,而这里的0.08年其实是双胞胎家庭第三胎跟非双胞胎家庭第二胎之间的出生间隔差距,而不是第二胎跟第二胎的对比。而对于后者,文章的识别是通过比较同性和异性双胞胎的身高差异来得出结论,具体可以参看原文。在这一部分中,作者没有发现具体证据(见原文表4),即作者没有发现母亲“通过服用药物诱孕双胞胎”的相关证据。但如作者在结论部分所说,虽然没有找到相关证据,但本文的研究并没有排除父母采取服药怀上双胞胎的这一途径。这部分的样本被限定为双胞胎,所以总样本量只有几十个,因此很难得出有效的推断,但作者在这部分推断做的识别设计很是新颖。

综上我们可知,计划生育政策确实增加了中国“双胞胎”的出生率,但这些增加的双胞胎中有近三分之一是“人造双胞胎”,即并非是真实发双胞胎,而是多生育的父母为了逃避政策惩罚而将其第二胎和第三胎谎报为双胞胎,由此产生的“人造双胞胎”。

 

总结与讨论

综上所述,我们发现,计划生育政策除了控制人口之外,还影响着中国社会其他的许多方面——它加剧了中国男女性别比的失衡,它影响着一胎家庭中小孩的身高甚至受教育程度,它增长了中国的小孩肥胖程度,它还让中国父母把家里的兄弟姐妹谎报为双胞胎以逃避政策惩罚。

看完这些“意外后果”之后,我们或许会问一个问题,即计划生育政策到底是什么?如果我们仔细思考这一政策的本质,或许我们能得到这样一个结论:计划生育政策带着最初的控制人口增长的目的,但本质上,这一政策提供了一个扭曲的激励机制。而正是这一激励机制,不仅影响着今天中国的人口结构,还必然地影响着中国千千万万个家庭,由此带来了包括上文所述的诸多方面的影响。

最后需要说明的是,本文仅仅是介绍了几篇跟计划生育相关的经济学论文。因此,首先,这篇文章并没有覆盖全部相关的经济学文献,还有一些文献没有介绍,比如Wu 和Li (2012)的研究——计划生育政策减少了家庭成员数量之后是否使得这些父母更加健康了呢;又比如Wei Huang跟Yi Zhou合作的工作论文——计划生育是否增进了汉族跟少数民族之间的通婚现象?以此获取更多的生育配额。感兴趣的同学可以自行去关注。其次,这篇文章更没有涉及到其他社科领域的相关文献。因此,特别欢迎社科领域的同学能就计划生育政策带来的影响提供更多的讨论。

 

参考文献

  1. Becker, G., & Lewis, H. (1973). On the Interaction between the Quantity and Quality of Children. Journal of Political Economy, 81(2), S279-S288.
  2. Chen, Y., Li, H., & Meng, L. (2013). Prenatal sex selection and missing girls in China: Evidence from the diffusion of diagnostic ultrasound. Journal of Human Resources, 48(1), 36-70.
  3. Ebenstein, A. (2010). The “missing girls” of China and the unintended consequences of the one child policy. Journal of Human Resources, 45(1), 87-115.
  4. Huang, Wei, Xiaoyan Lei, and Yaohui Zhao. (2016). One-Child Policy and the Rise of Man-Made Twins. The Review of Economics and Statistics, 98 (3) : 467-476.
  5. Huang, Wei, and Yi Zhou. Submitted. One-Child Policy, Marriage Distortion and Welfare Loss.
  6. Li, H., Yi, J., & Zhang, J. (2011). Estimating the effect of the one-child policy on the sex ratio imbalance in China: identification based on the difference-in-differences. Demography, 48(4), 1535-1557.
  7. Liu, H. (2014). The quality–quantity trade-off: evidence from the relaxation of China’s one-child policy. Journal of Population Economics, 27(2), 565-602.
  8. R., & Zhang, J. (2009). Do population control policies induce more human capital investment? Twins, birth weight and China’s “one-child” policy. The Review of Economic Studies, 76(3), 1149-1174.
  9. Qian, N. (2009). Quantity-quality and the one child policy: The only-child disadvantage in school enrollment in rural China. Working Paper 14973. National Bureau of Economic Research. Rosenzweig,
  10. Sen A. (1990). More Than 100 Million Women Are Missing. The New York Review of Books.
  11. Wu, X., & Li, L. (2012). Family size and maternal health: evidence from the One-Child policy in China. Journal of population economics25(4), 1341-1364.
  12. Zhang, J., et al., One-child policy and childhood obesity, China Economic Review (2016), http://dx.doi.org/ 10.1016/j.chieco.2016.05.003

 

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

媒体与政治说服:来自俄罗斯的证据

1991年苏联解体之后,俄罗斯首任联邦总统叶利钦开始推行激进改革政策,于1993年成立新的国家立法机关—俄罗斯联邦会议,以取代旧有的俄罗斯联邦人民代表大会,并宣布联邦会议将于93年年底开启大选。联邦会议由下议院“国家杜马”和上议院“联邦委员会”构成,其中下议院“国家杜马”一半席位采取比例代表制,另一半采取单一选区选举,并于每四年改选一次。2007年“国家杜马”改为全部席位采用政党比例制,并在次年年底改为五年一届,不过这都是后话。

2011年,三位来自俄罗斯的经济学家在经济学界顶级期刊之一的《美国经济评论》上发表了一篇名叫“Media and Political Persuasion: Evidence from Russia”的论文。在这篇文章中,作者就是讨论了90年代俄罗斯的这段历史。这三位来自媒体经济学(Media Economics)领域的专家,希望利用这段历史来讨论媒体在政治说服上的作用这一议题。

Ruben Enikolopov

论文作者之一的Ruben Enikolopov,图片来自YouTube。

一方面,他们好奇1999年被任命为总理时普遍支持率低于2%的普京,何以在八个月之后的总统选举首轮获得52.9%的选票;而在1999年“国家杜马“选举前两个月成立的亲政府政党Unity(该政党宣称自己是中间派,并支持政府及时任政府总理的普京),何以在当年的下议院选举中获得23.3%的选票。许多学者和媒体人都猜测当时的国营电视台起到了关键作用,而作者关心是否真的如此;另一方面,作者指出许多文献都证明了媒体在政治结果上的作用,但这些文献研究的框架多集中在完善的民主体制国家。作者认为相较于(具备多元媒体,稳定的政党制度和具备鲜明政治立场的政党等特征的)民主国家,威权国家中媒体对政治结果的影响应该更大。如90年代的俄罗斯,政党体系是如此不稳定,许多短期存在的政党轮流更替。对投票者来说,他们大多只能透过大众媒体来获取相关信息。因而作者猜测,相较于政党的政策议题,90年代的俄罗斯选民在做出投票抉择时会更多地被政治领袖的个人魅力所影响。

为了讨论媒体在政治说服(具体而言是人们的投票行为)方面的影响,作者巧妙地找到了90年代俄罗斯的独立电视台NTV作为切入点。1999年,俄罗斯播放政治新闻的主要电视台有三家,除了两大国营电视台ORT和RTR外,就剩下一家独立电视台NTV。NTV的持有者—媒体大亨Gusinsky是普京的反对者,而NTV也公开批评克里姆林宫。其新闻报道与当时的国营电视台也存在很大差异,具体体现在:首先,NTV倾向于将更多的时间报道Unity的政治竞争对手;其次,更为重要的是在播报内容上NTV倾向于播报Unity的负面新闻;最后是在1999年体现普京强硬政治态度的车臣战争中,电视台NTV是当时唯一一家公开持反对态度的电视台。

既然如此,那么如果一个地区能收到NTV电视信号的话(即在当地存在信号中转站),相较于不能收到NTV信号的地区,该地区的人们在1999年的议会选举中是否会存在不一样的投票抉择,比如更少地支持Unity而更多地投票给NTV支持的政党?但这里进行因果推断时需要考虑一个内生性问题,比方说在人们对政府批评程度较高的地区,更可能存在NTV的信号中转站,由此存在NTV的信号覆盖。而这一地区特征也是影响当地居民投票行为的关键因素,由此我们没有办法从中识别出到底是因为NTV的电视节目还是因为当地固有的特征,最终影响了居民的投票行为。但是,NTV独特的存在经历,使得其为本文的因果推断提供了足够的外生性。

成立于1993年的NTV在当时成立仅仅是个小范围信号覆盖的电视台,而在1996年,NTV被允许使用国家教育频道的所有基础设备(如信号中转站),由此一举成为信号覆盖全国大部分地区的电视台。因此,NTV的信号覆盖依靠的是前苏联的基础设备,而这些信号中转站并非是NTV特意分布的产物,也是沿袭了固有的设备基础。为了论证这一点,作者在文中做了一个简单的OLS回归,来看城市的哪些特征与当地存在中转站相关。他们最终推测,存在国家教育频道中转站的地区,更有可能是前苏联的工业重镇。而当地人民的政治倾向(1995年议会选举中的投票结果)和1998年城市的社会经济特征也与当地是否存在中转站无关。由此为NTV的外生性做了论证。

 

实证部分

讨论完NTV的外生性之后,文章开始讨论NTV电视信号可能对当地政治结果的影响。具体分为两大部分,第一部分讨论了总体上的政治结果,即1999年不同地区是否能收到NTV对该地区议会投票结果的影响;而第二部分讨论了个人层面的政治结果,即1999年的个人是否观看NTV的行为对其投票抉择的影响。

 

第一部分——总体层面的结果

在第一部分中,作者先用基本的OLS做了一个主要回归。从文中的回归结果(见原论文Table2)可以看到,如果一个地方1999年可以收到NTV的电视信号,在同年的下议院投票结果中,该地区会更少地投票给NTV反对的Unity政党,而显著地增加对NTV支持政党(Unity最大的反对党OVR,自由派政党SPS和Yabloko)的投票比例。值得注意的是,这一回归结果中还讨论了NTV对其持中立态度的两个政党——KPFR(共产主义政党)和LDPR(国家主义政党)的影响。因为这两个政党在NTV和国营电视台的关注度并没有什么差异,因此以往的讨论往往无法指出媒体如何影响了他们,而从本文的回归结果中可以看到,NTV信号存在地区的居民,会更多地投票给KPFR,而更少地投票给LDPR。最后,回归结果还显示,NTV在地区的存在会使该地区选民的投票比例(turnout)显著降低,而这与以往的文献相符,因为NTV对当局的批评使得民众不信任政府,由此使得减少了人们的投票行为。需要说明的是,选取这几个政党作为研究对象,是因为他们获得了1999年下议院选举5%的最低选票比例(阈值),由此才能在下议院中按比例代表制占据一定议员席位。

主要回归之后,作者先使用了一个双重差分(Differences-in-differences)模型为主要回归提供稳健检验。他们收集了1995年和1999年两个年份的数据,原论文的Table3显示了该回归结果。因为上述六个政党中只有NTV支持的自由派政党SPS,Yabloko和NTV持中立态度的KPFR,LDPR参加了这两届下议院选举,所以这里只讨论这个四个政党。他们的研究发现,双重差分模型下得到的回归结果与主要回归结果是一致的,即存在NTV信号地区的选民倾向于投票给NTV支持的政党,而对NTV持中立态度的政党,NTV的信号存在与否并不会有任何显著影响。另外,该回归的结果显示,NTV的存在对当地人们的投票比例(turnout)存在负向但不显著的结果,文中作者并没有对此进行解释。

双重差分之后是一个安慰剂检验(Placebo test)。安慰剂检验的思想来自临床医学,即为了确认对病人起作用的是测试药物,而非是病人本人的反应。临床上的操作是将病人分为两组,且都会进行“药物“注射,但仅对其中一组进行真正的药物注射,另一组则注射生理盐水。在两组病人都认为自己注射了真正的药物的情况下,看两组病人不同的反馈结果。如果两组病人最终反馈了一致的结果,则说明起作用的并不是测试药物本身,而更可能来自其他因素。注射生理盐水的组别检验则被称为安慰剂检验。在本文中,作者用1999NTV在不同地区的覆盖情况,来检验其是否会对1995年的投票结果造成影响。因为1995年的时候NTV还不是全国性的电视台,而1999年NTV的信号分布也不可能会对4年前的议会选举结果产生影响,所以应该会得出一个不显著的结果。因此,如果结果显著,则说明存在NTV之外的地区因素影响了该地的政治结果。本文安慰剂检验结果显示在原论文的Table4中,根据这一结果我们可以看到,1999年的NTV信号覆盖情况并不会对1995年的投票结果存在任何显著影响,由此再一次为该部分的主要回归做了有力的支撑。

第一部分到这里并没有结束,接下来作者还讨论NTV的持续影响,即1999年NTV的电视信号会对2003年的下议院选举结果产生什么影响,而这也算是一处稳健检验。你到这里可能会疑问说作者为什么不用2003年NTV的覆盖情况研究其对2003年下议院选举结果的影响,这里的原因是因为在2003年,NTV已经变为国有控股的电视频道。这里需要补充说明的是,在2000年普京当选为总统之后不久,NTV的持有者Gusinsky即被宣告入狱,而保释的条件则是将手中全部NTV股份卖给国营企业。Gusinsky在被迫卖掉股份之后,旋即逃离了俄罗斯。因此,2000之后NTV便不再是独立电视台,而NTV的员工也遭遇洗牌,许多因NTV聚在一起的优秀记者都离开了公司。这也解释了为什么本文将主要回归聚集在了1999年的政治选举上。我们从回归结果(见原论文Table5)可以看到,NTV1999年的信号覆盖情况依旧会影响到2003年的选举结果,即1999年存在NTV信号的地区的选民,在2003年的时候依旧会更多地支持自由派政党SPS和Yabloko,而对KPFR和LDPR的选举结果无影响。从这一回归结果还可以看到,系数在显著的同时,其影响程度也在变小,这说明NTV在存在持续影响的同时,这一影响也在减小。另外,因为Unity和OVR在2001年合并组成了新的United Russia(目前普京所在的政党),所以这里讨论的是NTV对2003年United Russia投票结果的影响。回归结果发现,NTV在1999年的信号覆盖情况并不会影响到2003年United Russia在下议院的选票结果。最后在投票总数方面,1999年的NTV信号覆盖依旧会显著减少2003年人们的投票行为。

 

第二部分——个体层面的结果

在第一部分用总体层面的数据讨论了NTV对政治结果的影响之后,第二部分在个人层面对此议题进行了更为细致的分析。作者想知道,个体1999年观看NTV的行为对其1999年投票抉择有怎样的影响。而如果观看NTV的人真的倾向于投票给NTV支持的政党,那么具体又是哪些人受到了NTV的影响(即政治说服)。

如果我们想讨论“是否观看NTV”与该个体1999年“是否投票给某政党”之间的关系,我们可以使用Probit模型直接做回归。但是这里的回归结果并不能构成因果推断,因为会面临内生性问题,比如看NTV的人跟不看NTV的人本身可能就是不一样的群体,因此这些人存在的不同投票抉择偏好可能是源自自身所带特征,而非是因为“是否观看NTV”这一行为的影响。为了做出NTV的观看行为对投票抉择的作用的因果推断,作者在这里用了工具变量法。具体而言,在第一阶段的回归中,用NTV1999的信号强度来估计出其对“人们是否会观看NTV”的影响,由此分离出干扰因素;然后在第二阶段的回归中,再估计“是否观看NTV”对于人们“是否投票给某一政党”的影响。

原论文中的Table6和Table7给出了这两个阶段的回归结果。结果发现,1999年观看NTV的行为显著减少了人们对于Unity的投票,且显著增加了人们对NTV支持的两个政党(即OVR和SPS)的投票,而另一个NTV支持的自由派政党Yabloko,该系数虽然为正但是不显著。另外,1999年是否观看NTV并没有对个体是否前去投票的抉择产生影响。

既然观看NTV影响了个体的投票抉择,那么又是哪些个体受到了NTV的影响?为此作者进一步用分样本讨论的方式对此进行研究,具体操作是将总样本分为“清楚知道自己会决定投票给哪个政党”的样本和“还没决定要投票给哪个政党”的样本。需要说明的是,在这一部分使用的微观调查数据来自1999年的一项追踪调查,调查者在1999年议会选举前后一个月分别收集了一次数据。因此,这里的“还没决定要投票给哪个政党”,是指在1999年的议会选举前一个月时被调查者的反馈。在这一调查中,已经确定投票意向的受访者还提供了自己的意向政党。而在议会投票结束后一个月,这一调查再次收集了他们真实的投票抉择。

回归结果(见原论文中Table8)发现,即使控制了选举前一个月个体的投票意愿,观看NTV的行为依旧对人们的投票抉择产生了影响,也就是说,人们可能仅仅因为在投票前一个月观看了NTV,而改变了自己的投票意愿。具体而言,对于投票前一个月清楚知道自己投票意向的群体,前一个月观看NTV的行为会增加(或说说服)选民支持OVR和SPS,但是不会影响人们对Unity的投票。另外,在选举一月前的投票意向方面,回归发现以往观看NTV的行为会显著增加这部分人在选举前一个月对OVR和Yabloko的支持意向。进一步,对于选举前一个月还不清楚自己会投票给哪个政党的这部分人,作者发现,选举前一个月观看NTV的行为会显著减少这部分人对Unity的支持。也就是说,在Unity1999年的议会投票结果中,NTV显著地说服了投票前一个月还未决定投票意向的这部分人,并显著减少了他们对Unity的支持。

 

结论

本文用俄罗斯1999年的议会选举这段历史讨论了媒体对政治结果的作用这一议题,作者的识别策略基于当时的独立电视台NTV,因为NTV电视信号在地理上存在差异且具备外生性,由此为本文的因果推断提供了可能。具体分析分为总体层面和个体层面两个层面。在总体层面上,本文发现存在NTV电视信号地区的选民会更多地支持NTV支持的三个政党(OVR,SPS和Yablok),而显著减少对NTV反对政党Unity的支持;在个体层面,作者也发现了一致的结果,具体而言,文章发现观看NTV的个体会更有可能将自己的选票投给NTV支持的政党,且会有很大可能不将自己的选票投给NTV反对的Unity政党。作者还发现,即使控制了个体选民投票前一个月的投票意向之后,NTV依旧会显著减少选民对Unity的支持,这意味着有一大批选民在投票前一个月因为观看了NTV的节目而选择不投票给Unity。通过进一步分析,作者发现,被NTV说服不投票给Unity的这部分人主要是在投票前一个月还未确定自己投票意向的选民。

 

评语:

  1. 这篇文章的第一部分,作者能直接用简单的OLS做出因果推断,全得因于作者在识别策略上所做的努力,之后再用DID等方法进行稳健检验,都是值得学习的地方。
  2. 论文作者中的Ruben Enikolopov和Maria Petrova两夫妇合写了包括这篇论文在内的多篇论文,另外有名的一篇文章为2015年发表在QJE的《Radio and the Rise of The Nazis in Prewar Germany》。 他们还有几篇working papers,分别讨论了俄罗斯的媒体跟集会反抗和腐败监督之间的关系。另外,他们为Handbook of Media Economics编纂了其中一章,其中提到了几篇关于中国的媒体研究,感兴趣的读者可以关注下。
  3. 本文的开头引用了普京的一句话,“Contrary to a common perception, mass media is an instrument, rather than an institution”,翻译为中文是,“跟普遍看法不同的是,媒体其实是一个工具,而不是一种产业制度 ”。把大众传媒当做舆论工具,普京这样认为的好处是什么?这篇论文或许给出了一部分答案。
  4. 最后,至于NTV的命运如何,这里给感兴趣的读者推荐一部NHK2008年拍摄的纪录片——《言论管制·普京帝国与媒体》。

 

文献来源:

Enikolopov, R., Petrova, M., & Zhuravskaya, E. (2011). Media and Political Persuasion: Evidence from Russia. The American Economic Review101(7), 3253-3285.

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

实证研究议题:选题、文献和机制

越来越觉得做一份好的实证研究不是一件不容易的事情,并不是一股数据进去,一个模型回归,社会机制的黑箱子就清楚了这么简单。从一些top journal的文章中可以看到,一份好的实证研究在于,作者真的提出了一个很有力的证据在论证自己的猜想。他们能够从ABCD四个角度来试图“摧毁”自己的研究,但很“遗憾”都没能“成功”。秉着“那些打不死你的最后只能让你更强”的精神,ABCD四个内容最终成功地跟文章的基本回归和机制构成了经济学家经常说的,“好的故事”。

写一个“好的故事”重要的地方在哪,我会在文章第二部分继续谈下个人看法。让我先从第一部分说下找选题和文献阅读方面的事情,最后在第三部分提一些如何“试图摧毁”自己论文的建议——即如何给自己的论文找建议和批评意见。

 

1.选题和文献阅读
选题似乎是一种稀缺资源,可能大多数人都有这样的感受。反正以前我的老师们经常跟我们说这样的话,“你以为你们能想出的题目别人就想不出吗,其实肯定有人想过这个题目”,结尾自带naive特效。然后视情况会接着说,一般会先说“所以你们应该去多看文献,肯定会发现有人写过这个题目了”;如果真的没人写过这个题目,老师就会说,“肯定别人想到了这个题目但是写不出来”,暗含你们更写不出来的意思。最后总结说,除非是大牛,一般人能做的不过是一个“打补丁”的工作。

这种鼓励学生先多读文献或者扎实学习的态度是好的,但是我个人不是这样看找选题的事情的。读文献也是一样的道路,很多老师会跟你说,先不要着急写论文的事情,要先多读文献。学生大概会想,是是是,这个道理我都懂。但是个人认为,写论文跟读文献其实并不矛盾。

我对选题方面的看法大概是:找选题最好的状态自然是可以研究自己感兴趣的事情。比如我对政经领域的研究比较感兴趣,虽然我在学校从来没有接触过这方面的老师,但因为我感兴趣,所以还是有许多想研究的内容的。再加上,相比之下,这方面真的没什么人在做,所以说中国的政经研究真的很需要我们去做努力。其次,假如不能做自己感兴趣的内容,如果有个好导师指导着,慢慢也能磨出属于自己的作品。而另一方面,找选题需要的就是培养所谓的“直觉”了。很难说清楚“直觉”是什么,就像是一种发现生活中各种可进行实证的议题的能力。比如对于一件公共事件,大家会有各自的看法,这时候你可以去想,如果让你来为你的看法提供证据,你能做些什么?或者有一天在聊天时,在看书时,你得到了一个“判断”,突然你就意识到自己可以用数据来检验这个“判断”.这些想法大概就是一种“直觉”吧。培养这种能力之后,你会听到“直觉”告诉你说,选题其实并不是一个稀缺资源。它会告诉你,我们并不需要活在一个零和世界,我们并不是做了一个选题就会使得这个世界可做的选题少了一角。相反,“直觉”会告诉你说,去把这个选题领域的蛋糕做大。我们可以发现新的内容,并做出很多研究。一个好的学者拥有这样的能力,他们能够想方设法对自己感兴趣的点进行研究,并让晚辈觉得这个世界黑暗的部分又光明了一块。

所以说初学者就一定只能“打补丁”吗,不一定。我反倒认为一昧“打补丁”是培养不出优秀学者的。每个人都能在自己喜欢的领域有所贡献,其实这类似于亚当斯密所构想的那个理性的市场经济。现实中,很多学者也是基于自己的兴趣点在进行研究的,你可以观察到,往往是优秀的学者越不怕跟人分享自己的选题,他们反而是很乐意组织各种seminar或workshop来讲自己的working paper。而这种正常的学界交流,一方面有利于寻找自己潜在的合作者,另一方面也能给周边的学生或青年老师带来知识上的外溢。如果你的program里面都是些相互不交流的老师,那么这样的program多半不正常。

其实我现在接触下来就发现,有些老师或前辈提出的一些题目,我并不一定感兴趣。也就是说,并不是所有人都在你脑门口蹲着点等着窃取你的选题。即使是在正常的学界交流圈内,你跟别人分享选题之后,别人不一定会关心你做的事情,因为他们有自己感兴趣的内容。他们如果要强加进来跟你一起做这个题目,我觉得他们多半不会有积极性来跟你一起做出一篇很优秀的文章。

所以我还是特别建议国内的经济系,应该多构建系内自己,或者跟别的系合作的各种seminar和workshop,甚至lunch talk之类的东西。这些研讨会可以内部的,学生自己的,也可以是外部的,或有老师参与的。总之,促进学生在上面分享自己的选题是很好的一件事情。就这么问吧,你觉得如果经济系举办了seminar,学生上的讲自己的选题之后,这些seminar是会促进学生的研究多一些,还是会使得学生的(各种不成熟的)选题被盗取的可能性多一些?我觉得认为后者多一些的program多半是不正常的。

而当你开始做自己感兴趣的内容之后,文献的阅读自然会展开。首先,虽说“修行看个人”,但是之前也要导师带进门才行。导师如果对该领域了解,只要稍微指导下学生,我觉得一切都会事半功倍起来。其次,修行一方面看历史进程,另一方面也还是要看个人啊。自己有感兴趣的内容最好,先把该领域的handbook拿出来翻翻,然后去该领域的top journal找找相关选题。如果不是有特别想读的文献,真的建议不要翻中文期刊。因为中文期刊有很多错误的地方,或者故事不完整的地方,作者结论能不能成立真的不知道。英文世界的领域顶级期刊或top5,有很多很有意思且内容、文风各方面都值得学习的文章,是很值得阅读的刊物。最后一点,文献这方面,最早开始读越好,因为这样意味着你的积累会越多,对该领域会越了解,将来写起论文来会更方便。

 

2. 好的故事
好的实证研究往往能提供一个好的故事,我以前以为找一个很好的IV就是一个好故事,其实并不是这么回事。这里的“好的故事”其实体现在两个方面,一方面可能是你研究的内容很有趣,而其实更为重要的一方面在于,你把你所要研究内容的机制看清楚了,因此你做了一个好的研究,用科学的工具写了一个系统的故事。后者很重要,我会在后面详细说下。

首先,对于一个有趣的IV,其实它内容本身的有趣并不足以构成一个好的故事。有趣的IV之所以能够变成好的故事,是因为这个IV在因果推断上的有用,而不是故事的趣味性(这只是副产品)。DID和RDD这种准实验工具也是同理。这一点很重要,因为如果你的IV不能帮助你进行因果推断,那么你的文章甚至都不能构成一个故事。我不同意好故事是指找有趣的IV或准自然实验,其实找IV和准自然实验的目的,都是为了进行有力的因果识别,他们最后都会趋近于OLS方法。所以如果说你在top journal看到有文章在用的是OLS方法,也不用惊讶。其实这很正常,只要能进行有效的因果推断,OLS就足够了。你可以去看作者的识别策略,一般来说,这种文章会存在一个有力的外生变量,而且你能在文中看到作者相关的argument。【本文不讨论RCT和田野实验,因为本人没有接触过这种壕迈的研究方式】我个人认为,刚开始看文献的人会倾向于关注IV的有趣性;但是开始做研究之后,人们就会更多地关注IV的有用性。

其次,最最最重要的事情是,好的故事在于,作者真的看清楚了机制是什么,或者说他们提出了一个可能的机制。至少目前我是这么认为的。好的机制是什么意思,比如你看准了一件事情的内部结构,你只要拿到相关的数据做一下分析,总能找到强有力的证据支持你的猜测。就好像在大部分的情况下,个人的受教育程度总是跟将来的收入成正比的,你去做回归的时候总会发现他们之间的显著性特别强,比如说有三颗星(这里的三颗星是指这种相关程度上的推断错误的可能性在1%以下)。这种情况下你就不用run上两百万次回归,你只要做几次的检验就能接受自己的猜测是准确的。与之类似,如果有一天你的数据跟你说,对于这批研究样本,他们受教育越高却收入越低,那你就要去想想这是为什么,你看准的那个内部机制到底出了什么问题?一份好的研究可能就此展开在你手下。而当你弄懂了这件事情的来龙去脉之后,你的研究也就能称为那个好的故事。

这种对机制的理解很困难,需要我们去弄懂所研究内容的各种制度背景之后,去寻找隐藏在其中的秘密。就像是一次侦探推理,我们在了解事件大概之后,要从各种细节处入手来捕捉出更多的内容并构造出事件的全景。而在此之后,我们还要用其他的方式来对我们的猜想进行检验。而那个没被证伪的猜想,才是你最终的研究成果。这就好像是我们的物理学家做出了一个猜想,然后他们在欧洲搭了一座大型强子对撞机,用质子碰撞质子,去看诸如暗物质之类的物质是否存在并拥有怎样的性质,由此来验证自己的猜想。好的实证研究也是如此,你的主回归是否成立,并不是一件很轻巧的事情。你的主回归其实只是一个等待被证伪的产物,只是一个有了初步证明的猜想,而这个猜想到底能不给够成立,还要用数据的其他方面对主回归进行“抨击”检验。机制研究也是一样的道理。

你可以认为实证研究的星星是数万次回归之后的结果,但是这种所谓的data mining其实并不是社科学者应该有的态度。如果我们能早点发现出所研究内容真正隐藏的信息,那么在基本发现(Benchmark Results)之后我们其实并不需要太多的回归。当然,为了确保我们初步结果的可靠性,稳健性(和安慰剂检验)这块,看似烦冗的回归或许是必不可少的内容。

但其实我们都不太知道事情的真想到底是什么,毕竟我们不是上帝。这时我们可以从其他学科的学者那边得到那么的讯息。有时候我们会听到历史学者对社科学者有这样的批评,“这些东西我们早就知道了,还用这样正儿八经用数据研究必要吗?”从中我们可以看到,很多社科学者之所以能看清楚他们的研究内容,是因为之前已经有很多学者对于相关题目进行了研究,因此这些经济学家能站在巨人肩上看得更远。【与此同时,我要对此进行回应,这些学者来自其他领域,他们在自己的领域内有自己的研究范式。而经济系的学者借数据去检测这些学者的猜想,是我们学科所能做的贡献之一,因此有必要。】

很多新手经常为自己的文章写得很粗糙而着急。我个人的看法是,当逼近真实世界的机制出来之后,你的研究自然也会跟着细致起来,因此不必着急。

 

3.自己是自己论文最好的质疑者
在seminar或workshop上经常能听到小白报告人(包括我),说自己来会议是为了收集意见。我指的不是大牛的谦虚说法,而是真的是为了收集意见,特别是自己一个人开始做研究时。有时候,对于刚开始进行研究的人来说:1.文章主回归出来后,接下来不知道该做什么,更不知道稳健性、安慰剂检验什么的要怎么做;2.缺乏导师或合作者,自然也缺乏多一份有力的对文章的质疑加打磨。这时你一点思路都没有,觉得你文章真的是做得很可以了,然后你跑到会议上去,说“想收集意见”,最终确是以被经验丰富的同行批得很惨收尾。会议确实是收集意见的好地方,但是当你要用上会议时,就得好好利用,而不是因为自己过于小白去收集一些没必要的同行批评。当然,初稿能写多好主要看个人,刚开始的时候总是免不了磕磕碰碰。我这里要强调的是:自己首先得是自己论文最好的质疑者,不要老是护着自己的文章。其实自己能给自己提的意见有很多,不要对自己太不自信。

可是,当你也不知道自己是不是对自己的文章过度自信时,怎么办?这时候就把自己的文章给自己的老师或前辈看下,看他们是不是能给出一些意见。如果,program师资很强的话,论文在program内部就能很好地发展成完整的文章。但对于大部分人来说,论文写完之后并不拥有那么大牛的老师,那么在合适的时候,就把自己的文章交给各种seminar或会议吧。也许你会在这里受到很“善意的批评”,但估计大多数直戳要害的建议都会让你羞愧到想死。但是,苦口良药吧。另一方面,你也把这当做是一种写文章的激励,如果你的文章写得真的很好,你则会在会议上有不少意外的收获。

我导师有一个外国学生,曾经去AEA年会讲自己的论文。有一次找我聊天,我跟他说在中国竞争很激烈,经济学家太多了,你会发现你能做的很多事情都有人做过了。结果他的回应让我有些吃惊,他说很羡慕你们有这么多的同行,因为如果你们有什么研究,他们能提供很多意见,这样你们能做出更优秀的研究。说实话,他说的都是很质朴的道理,我不明白为什么我之前就是不明白这个道理。回想这句话时总能让我当年在学校做RA的日子,当我很焦虑自己的回归的时候,老师总是跟我说慢慢来,踏实地做下去。我觉得我老师跟他身上都带着一种同样的质朴的气质。在他们身上学到的东西,我也希望能在此跟各位共勉。

 

【关于后话的】后话
后来我发现,其实这篇文章的大部分真理其实都凝缩在MHE的Last Word里。因此,在文章的最后,让我们再次倾听下安神老人家的“肺腑之言”。

在MHE中,安神这样说,“If applied econometrics was easy, theorists would do it. But it is not as hard as the dense pages of Econometrica might lead you to believe. Carefully applied to coherent causal questions, regression and 2SLS almost always make sense. Your standard errors probably won’t be quite right, but they rarely are. Avoid embarrassment by being your own best skeptic – and, especially, Don’t Panic!”

我经常在实证研究领域摸着摸着,就会不经意地想到这段话。用老套的说辞评价是:每次翻这段话,我都有新的体验。用新潮的语言评价是:于是我常常会脑补到这样一个画面——安神在讲述学界哲理的同时,并向你投出了一抹深深的微笑。

 

 

注:网站在今年1月份之后就没有更新,因为个人实在太忙(lan)了,在此表示歉意。在此写一篇(不成熟的)最近几个月的收获,希望大家在研究的道路上都能有所收获,谢谢。

 

欢迎各位批评指正。

联系我

Share

三年大饥荒的长期影响:来自幸存者的证据

在半个多世纪之前,中国发生过一次严重的饥荒。这段主要发生在1959年到1961年的饥荒现在被历史课本叫做“三年自然灾害”或“三年困难时期”。这次饥荒的严重体现在涉及人群广,而且不可思议地持续了三年以上。学界有不少关于饥荒造成的死亡人数的讨论,估计的死亡人数在1500万到3000万之间,甚至更高;而在饥荒成因方面,经济学界也贡献了不少文章。

The Simpsons S16E12_en

注:上图来自The Simpsons S16E12

陈玉宇和周黎安在2007年发表在Journal of Health Economics的文章——“The long-term health and economic consequences of the 1959–1961 famine in China”也讨论了这段历史,但是他们的关注点并不在于饥荒造成的死亡人数或产生原因。在这篇文章中,他们关心的是这场发生在大半个世纪前的饥荒,是否对当下的饥荒幸存者依然存在影响。如果产生了影响,那具体又是什么影响。使用能更全面地反映个体层面的微观数据,他们在这篇文章中讨论了饥荒可能对其幸存者在健康和经济层面存在的长期影响。虽然这是一篇较早的文献,但也是第一篇研究中国饥荒长期影响方面的文章,因此是一篇重要的文献,所以本次选择给大家推送这篇论文。

这篇文章研究的内容看起来属于中国的政经研究,但实际上,儿童早期成长环境可能产生的长期影响,是劳动经济学领域的一个研究议题。因此这篇文章也是发表在劳动经济学领域的顶级期刊JHE上。具体而言,在劳动经济学领域,有一支文献专门研究儿童早期的成长环境对其可能造成的长期影响,比如许多文献探究了儿童成长早期,父母的身体健康、家庭经济状况或父母的雇佣情况等因素,是否会对小孩造成长期影响。父母的健康我们很容易理解,一个身体不健康的母亲(如长期抽烟或喝酒)更可能生出健康较差的孩子;而父母收入的增加,可能意味着孩子能够拥有更好的成长环境;但有时收入的增加也意味着雇佣情况的改变即意味着父母可能会有更少的时间和精力去为小孩提供一个温馨的成长环境(于是经济学家就会去关心到底哪方面的效应会更强)。再举个跟当下国人较为相关的例子,许多经济学家关心,小孩在妊娠期或出生后如果长期生活(或说暴露)在空气污染严重的环境中,那么相较于生活在空气质量良好环境中的小孩,这些人长大之后的健康状况是否会更差,而这种健康状况的差异又是否会对其将来的受教育程度以及劳动市场上的产出(如收入情况)造成影响?类似的文献还有很多,感兴趣的读者可以看下Handbook of Labor Economics (2010)第4册B部分中的第15章“Human Capital Development before Age Five”。

 

实证方法

按这个思路,我们回过头来看下这篇文章。这篇文章使用了一种叫做双重差分(Differences-in-Differences)的“准实验”方法。之所以叫做“准实验”是因为饥荒的发生并不是自然科学家在实验室控制出来的结果,但饥荒这一历史事件却导致了一种类似于实验产生的结果,因此可以把这场饥荒看做是为了研究儿童早期的负面环境可能造成的长期影响提供了一次“准实验”(虽然这种说法显得无情)。

而双重差分,其思想类似于临床医学上进行因果推断所使用控制实验法,即随机将一部分使用药物的样本本视为实验组(treatment group),随机将另一部分不使用药物的样本组视为控制组(control group)。由此从样本产生的组别差异中推断出药物会对人体造成的影响。在这篇文章中,一方面,作者把在饥荒之前及期间(1954-1958年、1959-1962年)出生的一批人分成一个组,视为实验组;把饥荒之后出生(1963-1967年)的一批人分为另一个组,视为控制组。由此我们可以看出,对于那些在1954至1962年出生的人来说,他们在妊娠期或童年早期,将会受到饥荒的影响(比如一个1954年出生的人在5岁的时候会遭遇饥荒;一个1962年出生的人1961年处在母亲的妊娠期因此也会遭遇饥荒影响);而对于那些在1963年及之后出生的人来说,不管他们在哪一年出生,他们早期的生活环境都不再受到饥荒的影响,因为饥荒已经结束了。由此,我们可以通过比较实验组和控制组两组样本成年之后健康和经济层面的差异,来推断饥荒的长期影响。具体而言,这篇文章用样本成年之后的身高来衡量其健康状况,用成年之后的劳动时间供给状况和家庭收入来衡量其经济状况。

但这仅构成了第一层的差异,要进行因果推断,我们还需要另一层差异。即对于那些妊娠期或童年早期暴露在饥荒的样本,我们还应观察他们受到的不同程度的饥荒是否也会对应产出不同程度的影响,由此产生的结论才能构成因果推断。因此,各省饥荒的严重程度便构成了这文的第二层差异。这篇文章利用各省人数的超额死亡率来衡量饥荒的严重程度(具体使用的是各省在饥荒最为严重的1960年的超额死亡率)。

 

数据与实证结果

文章个体层面的样本数据来自中国健康与营养调查项目(China Health and Nutrition Surveys, CHNS),而1959年到1961年各省超额死亡率的数据来自Lin和Yang (2000)的从食物获取权方面讨论饥荒成因的文章——“Food Availability, Entitlements and the Chinese Famine of 1959-61”。文章样本来自CHNS数据所覆盖的中国的8个省份,并且将研究范围限制在中国农村地区。一般认为,城市和农村地区的饥荒情况并不一致,而且农村的饥荒程度更为严重。【将样本限制在农村地区还有出于减少样本选择偏误(selection bias)方面的考虑,这里不做细谈,对此有兴趣的读者可以具体查看原文和结语处提供的文章。】

由此,作者构建了两个双重差分模型(如下图)。

Model1

Model2

模型1的Hijk表示出生在k时期j地区的i样本被调查当年(1991年)的身高,βk是出生队列(cohort)的固定效应,edrj是j地区在1960年(饥荒最严重的年份)的超额死亡率。第一个方程在回归的过程中仅包括实验组——即1954年到1962年出生的样本。在方程中包括了1962年出生的样本,因为这些样本是1961年就处在母亲的妊娠期,因此也会受到饥荒的影响;第二个模型与第一个方程类似,不一样的是被解释变量为出生在k时期j地区的i样本在1991年总共工作时间的对数值,且第二个方程中加入了一系列的用X表示的控制变量。之后还用其他的一些被解释变量来衡量样本的劳动供给和收入状况。

鉴于上文的识别框架,我们能够预期到,那些童年遭遇饥荒,特别是童年早期遭遇饥荒的群体(以往的文献认为越是早期遭受负面环境对将来的影响越大),成年后会有更差的健康和经济状况。他们的回归结果发现了一致的结果,对于那些童年早期暴露在饥荒时期的而儿童来说,他们成年之后拥有更低的身高,更短的劳动供给时间和更少的收入。

但是这一回归结果是否真的论证了饥荒的长期影响?为了得到解答我们需要从其他方面来检验以上的回归结果,即需要做一些稳健性检验。首先,作者检验了那些饥荒之后出生的样本,看他们是否会受到饥荒的影响。如果这些饥荒之后出生的样本的回归结果也存在显著性,则说明样本所受到的影响并不来自饥荒,而来自于一些被作者所忽略的因素。稳健性检验表明,饥荒之后出生的样本的回归结果并没有显著性,即没有受到饥荒的影响。其次,作者用分位数回归(Quantile Regression)进一步对回归结果进行检验。按照预期,作者认为实验组中那些身高较低的群体,相较于身高较正常的群体,将会受到更为严重的饥荒的负向影响。实证结果支持了作者的这一预期。

 

结论

作者研究发现,发生在1959到1961年的饥荒对其幸存者存在着长期影响。具体来说,饥荒使得那些童年早期暴露在饥荒之中的小孩,在成年之后拥有较低的身高,较少的劳动时间供给和家庭收入。因此,作者认为,发生在半个多世纪之前的大饥荒对当下的幸存者产生了巨大且持续的影响,而这一影响无疑深远而长久地影响了这些幸存者各项财富(welfare)。

在文章最后,作者指出该研究还存在的两个局限之处。第一是这篇文章所使用的将近2000个个体的样本还是有点太小了,因此作者本文的结论在更大范围的样本中是否依旧成立还有待测试;第二,这篇文章虽然讨论了饥荒在经济层面的长期影响,但并没有清楚地指出其中的影响机制是什么。虽然以往的文献指出健康状况是一个极为可能对经济状况产生影响的渠道,但鉴于他们能够获得的关于健康的数据只有身高一项,因此很难借由本数据揭示出具体的影响机制是什么。

 

结语

  1. 关于饥荒研究中的样本选择偏误问题,感兴趣的读者可以看下何晓波老师写过的一篇文章《为什么经济学家要研究饥荒》,里面对此有很好的论述。
  1. 童年早期遭遇的环境,并不一定是负面的(虽然这方面的研究很多)。今年4月份AER新刊出的文章——“Long-Run Impacts of Childhood Access to the Safety Net”,讲述的是美国上世纪60-70年代的食品券项目(Food Stamp Program)对受到经济资助家庭小孩的长期影响,这既是一个童年时期受到正向影响的研究。
  1. 1962年,时任主席的刘少奇在年初召开的“七千人大会”上曾经以“要上书”来评价这段历史。刘的这句判断如今已应验,但或许他没有想到这段历史不单上了书,还上了劳动经济学领域的顶级期刊。#误

 

文献来源

Chen, Y., & Zhou, L. A. (2007). The long-term health and economic consequences of the 1959–1961 famine in China. Journal of health economics, 26(4), 659-681.

 

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

MacTeX无法编译,“找不到必要的工具”?

因为一篇论文被会议接纳,1月中会去上海参加一个经济学的workshop。这篇论文讨论的是在中国农村,宗族势力如何影响了计划生育政策的执行,我的研究发现是在宗族势力越强的地区,计划生育总是执行的没那么好。如果这篇文章晚点有机会(正式或以working paper的形式)发表,我再在这里跟大家细聊这篇论文。

既然论文被会议接纳了,自然是需要认真准备一番。按照业界的惯例,我打算用LaTeX写一个beamer主题的幻灯片,来讲这篇论文。但是当我打开TeXShop编译时,发现无法顺利生产PDF文件了,问题提示为“找不到必要的工具。/usr/texbin/pdflatex不存在……(以下省略)”,我换用其他编译器,如TeXstudio编译,也是有类似的提示。

我想了一下,这个问题提示大意是说,MacTeX可以编译,但是无法生产PDF文件了,预览也无法生产。问题的关键在于某一路径错误,导致了PDF文件无法生产。而该路径跟“/usr/texbin/pdflatex”有关。我找了一下TeXShop的“偏好设置”,在“引擎”——“路径设置”处找到了错误源,即“/usr/texbin/”这一默认的路径。

我Google了很久都没有找到相应的解决方案,后来看到了TeXstudio的提示,大意是由于Mac系统升级,“/usr/texbin/”的路径不被允许使用,是否将路径更改为 “/Library/TeX/texbin”?我选了YES之后,发现tex文件又能成功编译了。于是我回过头去,在TeXShop的“偏好设置——引擎——路径设置”处,将默认的“/usr/texbin/”改为了“/Library/TeX/texbin”,然后TeXShop也能工作了。真是太开心了,又能敲代码了。(误

感于我没有Google到解决方法,而一定也有很大Mac用户在更新系统后遇到了同样的问题,于是在这里写下这篇短文,给大家帮个忙。

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

实证研究的数据议题:获取与使用

做过研究,或在毕业季准备做研究的童鞋应该都有过这样的体会,即:如果做实证研究的话,论文中应该选用什么数据?而所选的数据不但跟自己的选题有关,还会反映文章的质量。

本科时期教我的一些年长的老师大多使用的是宏观数据,如国家统计局提供的各类年鉴,或者是自己的调研数据,这或许反映了他们那一代人做研究的方法;而后来接触的几位刚从美国读完博士回来的老师,发现他们普遍倾向于使用微观数据,比如之前写过一篇文章提到的国内较常用的几个微观数据库。但是后来我在上海对外经贸大学的“微观应用计量”暑期班上接触到大量实证研究之后,我发现了一个特点:即每一篇展示的文章,基本上都是使用的不同的数据。甚至可以这样说,许多学者花费长时间构建自己(通常是小型)的数据库,就是为了写一篇文章(当然用同一套数据写几篇文章也挺常见的,如西财的何石军等人所做的清代妻妾价格研究)。这种构建数据库的想法,跟构建大型微观数据库的想法完全不同。这反映了实证研究数据来源的多样,也反映了在当下,一份好的研究值得我们付出漫长而耐心的努力。

因此,本文主要谈下实证研究中数据的获取和使用问题,给大家(特别是需要展开论文研究的各位童鞋)提供一些思路。当然,范围限制在经济学学科,偏微观应用计量领域。

1. 微观数据库的使用及其意义

做中国的实证研究,一个重要的数据来源便是国内正在建设的几个微观数据库,包括但不限于:北大的CFPS、CHARLS,西财的CHFS、北卡的CHNS、北师大的CHIP、人大的CGSS等。目前国内的许多高校都在兴建类似于“社会科学调查中心”这样的机构,并希望依靠该平台建立自己的微观数据库,由此可见当下国内学界对微观数据的重视。大型微观数据库的意义在于:可研究的内容更广(变量多),更全面(涉及家庭方方面面),可做长期跟踪调查(更可靠的面板数据研究),且更能惠及学界(公开数据),等等。

而对于需要开展研究的初学者来说,微观数据库最为重要的地方或许在于:一、数据质量高,这为他们的研究提供了可靠的基础;二、签署协议后可免费使用,这种学界的正外部性让初学者感到轻松许多。

之前看过一个2011年左右的公开课,如果没听错的话,我记得视频里Raj Chetty说现在已经不兴使用Survey Data(调查数据),而是兴使用Administration Data(行政机构提供的数据?)。这里的Survey Data,指的就是上文提到的微观数据;而Administration Data,大概指的如税收数据这种由行政部门提供的数据。这里换个说法大家或许就不会感到太陌生了,Thomas Piketty 及其合作者Emmanuel Saez 利用美国政府提供的税收数据反推出美国的居民收入,由此研究收入不平等(Income  Inequality)的议题。而根据所做的研究,Piketty 后来出版了大家都很熟悉的 Capital in the Twenty-First Century一书。这就是一个使用Administration Data进行研究的故事。

Chetty 这么说或许跟在美国学界的现状有关:在美国,申请官方的数据更为简单,且有法律支持;而美国的微观数据库,如NPL (The National Longitudinal Surveys),已经起步快40年了,因此建立在此之上的研究应该有很多。而国内的微观数据才刚刚起步,虽然也产生了许多研究,但还有许多社会状况有待于学界、民众和政府部门去了解。

另外值得一提的是,中国的国家统计局(NBS)提供的每10年一次的人口普查数据,以及两次人口普查之间的1%抽样数据。最近一次的人口普查数据为六普数据(2010年);而1%抽样数据目前执行过三次,分别在1978、1995和2005年。基于这些普查数据进行的研究也不少,如Qian Nancy(2008)著名那篇著名的Missing Women,当然,这篇文章还结合了地理数据。

2. 自己构建数据库

除了使用现成的数据之外,就是自己构建数据库了。相较于上文提到的微观数据库,这种数据库显得较为小型,往往是因为一篇研究的需要而构建的数据库。数据来源往往为以下几个途径:调查问卷、历史文本、网络爬虫等。最后还会谈下一类较为特殊的数据,如地理、气象、环境数据,这类数据来自自然科学领域,往往作为配角和其他数据结合起来,帮助学者进行研究。

2.1 调查问卷

考虑财力人力等现实问题的话,学者通过小范围的调查问卷进行研究还是挺常见的。这方面的论文提多,这里提一篇个人觉得比较有意思的文章。陈钊、陆铭等人(2014)最近在CER上发表的关于“方言的回报”的研究,所使用的即是他们自己在上海地区收集的调查数据。

自己用调查问卷收集数据,最为重要的是保证数据的质量。问卷设计是一方面,而更为需要注意的另一处是数据的偏误问题。举个例子,最近临近期末,可以看到许多同学(也包括在国外读研究生的同学额)为了做项目在微信朋友圈上发调查问卷。这种收集数据的方式,如果不是研究相关议题(如特定于微信用户的研究),那么就可能存在很多很严重的问题。这种调查方式收集的数据存在偏误,即自我选择偏误(self-selection bias)的问题。首先,大部分使用微信的都是年轻人,所以这种你不可能在朋友圈做类似于“城市老年人消费观念”的调查;其次,最为可能帮你你填写问卷的人是近期跟你玩得比较好的朋友,所以这种方式收集的数据内容甚至不能用来代表你朋友的普遍状况。比如,有一位女同学在收集了几份问卷信息之后,在朋友圈抱怨说,“基本都是女性在填写问卷,来几位男同胞啊。”如果说这种一开始就赤果果的偏差都没有引起她的注意,那么只能说她没有一点儿“随机抽样”的意识。而且,要知道,即使是最后填写问卷的男女比例达到了1:1,这样收集上来的数据也是“然并卵”的质量。

不符合随机原则收集的调查数据可能完全不具备代表性,但并不是说就不能用,这跟你的研究内容有关。比如说,有一个域名为 zuobiao.me 的网站,为国人提供“中国政治坐标系测试”,这一测试在网民之间流传很广。后来这个网站被墙,于是站长觉得被墙之后收集的数据偏误会很大(BTW,站长是数学系的博士),因为能翻墙过来填写问卷的人跟无法翻墙的人之间的政治观念差异可能会很不一样,因此他决定公开该网站这几年收集的数据。根据这一数据,MIT的徐轶青等人(2015)和复旦的兰小欢(2015)各写了一篇文章。其实该网站被墙之前,收集的问卷数据也是有偏的,因为会做该测试的人,往往可能是对政治较为感兴趣的年轻网民,而不是全体国人。但是上面提到的两篇研究,研究的内容正是局限于对政治议题较为感兴趣且偏向于年轻的网友,因此即使数据有偏,但还是可以用在研究上。

另外,“自我选择偏误”不单存在于数据收集上,还可能存在于进行实证研究时数据选取上。比如你感兴趣的是某一地区的全部人员,但是数据库提供的仅仅是劳动力市场上人员的调查数据;又比如你感兴趣的研究内容是劳动力的受教育程度对其收入的影响,但是你会发现受教育程度较高的这部分人,往往也是家庭背景较好的一类人,而这一类人的高收入可能是由于家庭背景导致的,而如何识别教育回报,也就是一个解决“自我选择偏误”的过程。对此感兴趣的同学可以看下Heckman(1979)的经典大作。

2.2 历史文本

从历史文本中整理数据是另一种收集数据的方式,我想随着国内经济史研究的方兴未艾,通过历史文本整理数据的研究可能会越来越多。即将在Econometrica刊发的Elite Recruitment and Political Stability一文,探讨了清朝废除科举制对政治稳定的影响,使用的即是整理自文本的历史数据:1900-1906年间清朝262个府的面板数据。关于这篇文章的研究内容,可参见政见的这篇《废除科举加速清朝灭亡?》。而这篇文章的两位作者,也是政经和经济史领域的两颗学术新星,分别是目前在港中文的白营和UCSD的贾瑞雪。

再举一些经济史方面的研究,如白营和贾瑞雪之前分别写的一些文章。白营和港科大的Prof. Kung 合作的两篇文章(2011,2014),分别研究了气候变化对游牧民族入侵中原的影响,和新教在中国的知识传播对经济增长的影响。之前8月份第一次去青岛,我想到中国殖民地这方面的经济史研究选题,后来发现贾瑞雪做过一篇相关研究,即是这篇发在RES的 The Legacies of Forced Freedom

《量化历史研究》中颜色老师的那篇《从经济学的角度研究经济史的一点体会》,提到了经济史的一类很适合的研究内容为“遗产”研究(Legacy Research)。我原先不太明白什么叫做“遗产研究”,后来看到贾瑞雪这篇 The Legacies of Forced Freedom的研究内容,我才大概明白为什么说“遗产”研究是一类较为适合的经济史研究。其实很简单,从现实层面考虑,综合”历史数据的难以获取“和“当下经济数据的可获取性”两个现实,由此可推断经济史中一个可行的研究内容就是,研究历史上发生的事情对当下社会经济状况的影响,这即是所谓的“遗产”研究。

这类的研究有许多,这里推荐Harvard的Melissa Dell的两篇文章,一篇是颜色老师在书中推荐的,发在Econometrica上的 The persistent effects of Peru’s mining mita ; 另一篇则是她的工作论文:State Capacity, Local Governance, and Economic Development in Vietnam。这两篇研究都是使用RDD,研究的都是历史上的某一事件对当下的影响,因此使用的数据为2000年之后的家户调查数据:前者使用的数据包括2001年的秘鲁家户调查数据(Peruvian National Household Survey ),后者使用的数据包括2002-2012年的越南家户调查数据(Vietnam Household Living Standards Survey)。

2.3 网络爬虫

现在基于网络数据进行的实证研究也不少。一方面,网络数据虽然本身就是以电脑可直接处理的形式存在,但是该形式并不一定可以直接用做研究,也需要对其进行处理。另一方面,网络数据的优点之一是其涉及的样本量往往会比较大,因为它可能是用户自己提供的数据,如微博信息、婚恋网站的匹配数据等;也可能是定期更新的数据,如财经数据、电影票房信息等。网络数据经常需要用爬虫来获取,但这并不意味着研究人员本身需要具备爬虫技术,目前雇佣专业人员用爬虫获取数据的情况也是挺常见的。

网络数据这方面的研究,上面提到的“微博”、“婚恋网站”、“财经数据”、“票房信息”四个方面都有相关的研究,其中有些研究会结合其他的一些数据,如等下会谈到的环境数据;当然,除此之外利用网络数据进行的研究有很多,也包括研究学界本身,如利用学科的期刊数据来进行研究。我对这方面的关注较少,因此除了上文提到的徐轶青等人(2015)和兰小欢(2015)的两篇文章,这里没有其他推荐。关于网络数据的偏误问题,也见上文内容。

2.4 自然科学数据

因为我不知道该如何给地理数据、气象数据、环境数据、甚至外太空获取的灯光数据等数据归类,所以这里我就统一把他们归为自然科学领域的数据。

通常,经济学家会将这类数据当做是辅助工具,结合自己的主要数据来进行研究。前面提到的:Qian(2008)的Missing Women 和Dell(2010)的 The persistent effects of Peru’s mining mita都是结合了地理方面的数据后者是利用地理环境构建了一个RDD,也有学者用这种方法研究中国问题,即陈玉宇和李宏彬(2013)等人利用中国政府在淮河两侧采取供暖政策不同,构造了一个地理上的RDD,由此得出长期暴露在空气污染中的居民的平均预期寿命会缩短3年。

用气象数据进行的研究,如之前提到的Bai和Kung(2011)合作的文章:气候变化对游牧民族入侵中原的影响。而随着中国环境问题的加剧,特别是雾霾问题,用环境数据所进行的研究在未来几年应该都会陆续出现。如空气污染是否会影响人们的消费行为,是否会影响人们的身体健康和心理感受(如满意度)等。

用外太空获取的灯光数据进行政治经济学研究,大家应该都有所耳闻。对于一些经济数据较为难以获取,且官方提供的数据不太可靠的地区(比如非洲),用外太空获取的地区的灯光数据当做是地区经济发展状况的代理变量,由此来进行相应的研究。这方面的研究我也没有细看过文章,所以这边也没有推荐。

3.  深入讨论

上面提到了几个获取数据的途径,但并不是说实证研究只能通过这几个途径获取数据。从某种程度上来说,实证研究的数据获取可以是一个开脑洞的过程,比如外太空的灯光数据;而实证研究过程中将不同的数据结合起来,也可以是一个开脑洞的过程,就类似于寻找准自然实验的过程。这就所谓的,“大处着眼”。

而在获取了数据之后,更为重要的是如何处理这些数据。数据本身的状况就形态各异,因此需要研究者对其进行细致的识别,这样才能更好(或说更科学)地使用这些数据。实证研究中很关键的一点是识别策略,因为识别涉及到该研究的因果推断,因此只有制定了好的识别策略学者才能做出好的实证研究。这就是所谓的,“小处着手”。

最后,我们抛开数据处理的操作层面,来探讨下数据的本质。记得Angrist等人合著的《基本无害的计量经济学》中曾这样描述过RDD,

“断点回归式识别策略基于如下思想:在高度依赖规则而运行的世界中,有些规则的出现是十分随意,这种随意性为我们提供了性质良好的实验。”

而数据的产生也是如此,如果说社会存在某些规律(自然的或者是人为的),那么在日常生活中它就可能反应在人类产生的各种资料之中,这些资料可以是历史文本、微博信息、大气质量等信息,实证研究需要做的就是,使用科学的研究设计(识别策略、计量框架等)来对这些被称作为“数据”的资料进行研究,由此重新挖掘出数据中蕴含着的社会奥秘。

 

参考文献

1. Qian, Nancy. “Missing Women and the Price of Tea in China: The Effect of Sex-Specific Earnings on Sex Imbalance.” The Quarterly Journal of Economics 123.3 (2008): 1251-1285.

2. Chen, Zhao, Ming Lu, and Le Xu. “Returns to dialect: Identity exposure through language in the Chinese labor market.” China Economic Review 30 (2014): 27-43.

3.Pan, Jennifer, and Yiqing Xu. “China’s Ideological Spectrum.” (2015).

4. Lan, Xiaohuan, and Ben G. Li. “The Economics of Nationalism.” American Economic Journal: Economic Policy 7.2 (2015): 294-325.

5. Heckman, James J. “Sample selection bias as a specification error.” Econometrica: Journal of the econometric society (1979): 153-161.

6. Bai, Y., & Jia. R. “Elite Recruitment and Political Stability: The Impact of the Abolition of China’s Civil Service Exam” Econometrica, forthcoming.

7. Bai, Ying, and James Kai-sing Kung. “Climate shocks and Sino-nomadic conflict.” Review of Economics and Statistics 93.3 (2011): 970-981.

8. Bai, Ying, and James Kai-sing Kung. “Diffusing knowledge while spreading God’s message: Protestantism and economic prosperity in China, 1840–1920.” Journal of the European Economic Association (2014).

9. Jia, Ruixue. “The Legacies of Forced Freedom: China’s Treaty Ports.”Review of Economics and Statistics 96.4 (2014): 596-608.

10. 陈志武等编,《量化历史研究(第一辑)》, 浙江大学出版社 (2014), P259-269.

11. Dell, Melissa. “The persistent effects of Peru’s mining mita.” Econometrica 78.6 (2010): 1863-1903.

12. Dell, Melissa, Nathan Lane, and Pablo Querubin. “State Capacity, Local Governance, and Economic Development in Vietnam.” (2015).

13.  Chen, Yuyu, et al. “Evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River policy.” Proceedings of the National Academy of Sciences 110.32 (2013): 12936-12941.

14. 安神等, 《基本无害的计量经济学》, 格致出版社 (2012), P177.

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

注:目前本文仅授权给“中国经济学教育科研网”进行转载(转载网页),其余转载皆没有授权。

Share

Links for Econ Journals &Papers

8月份,我在上海对外经贸大学参加了YES的暑期班,培训内容是“微观应用计量”。

以下是我整理自暑期学校不同授课老师所提及的各领域期刊以及文献的笔记内容,分享给大家。

 

1. Literature (via 何晓波)
Journal of Economic Literature
journal of economic perspectives

2. Top 5
AER for American Economic Review
Econometrica
JPE for Journal of Political Economy
QJE for Quarterly Journal of Economics
RES for Review of Economic Studies

3. Working Paper
NBER
IZA

4. Labor Economics(via 何晓波)
Journal of Labor Economics
Journal of Human Resources

5. Development Economics(via 刘宇)
Besley, T., & Persson, T. (2014). Why Do Developing Countries Tax So Little?. The Journal of Economic Perspectives, 28(4), 99-120.
Gordon, R., & Li, W. (2009). Tax structures in developing countries: Many puzzles and a possible explanation. Journal of public Economics, 93(7), 855-866.
Gadenne, L., & Singhal, M. (2014). Decentralization in Developing Economies. Annual Review of Economics, 6, 581-604.
Pomeranz, D. (2013). No taxation without information: Deterrence and self-enforcement in the value added tax (No. w19199). National Bureau of Economic Research.
Liu, Y. (2015). Discretionary Charges as Firm Output Distortions: Evidence from China.

6. Cliometrics(Econometric History)(via 李楠)
Journal of Economic History
The Economic History Review

Nunn, N. (2009). The Importance of History for Economic Development. Annual Review of Economics, 1(1), 65-92.

7. Political Economics(via 兰小欢)
Selected Papers of Xiaohuan Lan
Lan, X., & Li, B. G. (2015). The Economics of Nationalism. American Economic Journal: Economic Policy, 7(2), 294-325.
Lan, X., GSB, C. K., & Li, W. (2013). Swiss watch cycles: Evidence of corruption during leadership transition in China. Working Paper, Cheung Kong Graduate School of Business, Shanghai.
Jia, R., & Lan, X. (2014). Capitalism for the Children: Entrepreneurs with Cadre Parents Under Big Government.

8. Academic Writing(via 马红梅)
陆铭. (2004). 把实证研究进行到底. 经济学家茶座, 8(4), 77-81.
陆铭. (2006). 如何做研究和写论文:现实.理论.证据. 上海: 复旦大学.
陆铭. (2006). 全球视野与中国问题. 上海: 复旦大学.
陆铭. (2007). 再谈”把实证研究进行到底”. 上海: 复旦大学.
陆铭. (2007). 本土经济学博士可以贡献什么. 南京: 南京农业大学.
陆铭. (2009). 中国研究与人类智慧:兼谈如何做研究和写论文. 上海: 复旦大学.
陆铭. (2011). 说审稿. 经济学家茶座, 43(3), 13-16.
彭玉生. (2010). “洋八股”与社会科学规范. 社会学研究(2), 180-210.
施一公.(2014).优秀博士如何养成. 北京: 清华大学.
王汎森. (2014). 怎样写一篇优秀论文. 台北: 台湾大学.

To be continue

如想转载,请联系我。:)

联系我

 

Share

中国劳动经济学领域的微观数据库

注:今年6月份几个数据库都公布了新一轮的数据,本文没有及时更新,相关介绍可参阅何晓波老师的文章《2016年6月最新中国微观经济数据介绍》。(写于09/17/2016)

——————————————————————————————————————————————————————————————————

本文介绍了目前国内劳经领域一些主要的微观数据库,并且附上数据申请下载地址(公开免费)。当然,国内还存在许多其他不公开的数据,一般都是由学校的教师带队进行收集和整理工作,由于公布的成本过高,所以并没有公开。如果你想做实证研究,多了解下国内的微观数据库或许对你的研究会很有帮助。另外,我了解的也不全面,如果各位觉得我漏掉了某些微观数据库,或觉得我的评论有什么不恰当之处,欢迎各位留言交流。

 

1. CHIP

CHIP全称是 Chinese Household Income Project,中文名为中国家庭收入调查

CHIP项目主要由北京师范大学的中国收入分配研究院(CIID)主持,申请过程很简单,只需要你提供基本的信息,经过审核之后即可下载数据。

CHIP项目从最早的CHIP1988到最新公开的CHIP2008,该项目已经有20年的历史。以往有许多文章用CHIP数据来研究城市和农村的劳动力,以及城乡之间的收入分配等议题。最近Juan Yang等人(2014)发表在CER的研究中,他们使用CHIP2002和2007的数据研究了中国农村地区子女中学入学的影响因素的变动情况。

值得一提的是,以往的CHIP数据只有农村和城市的住户样本,而在最新公布的CHIP2007和2008数据中,除了城市和乡村住户之外,第一次加入了城乡劳动力(rural-to-urban migrats)这一群体。而且,官方说CHIP2007和2008可以构成一个两年的面板数据(但是我对此很怀疑,因为我发现CHIP2008很多内容都跟CHIP2007是一样的,都是2007年收集的数据内容。因此个人认为,如果要使用面板数据进行研究,我暂时不会考虑用CHIP,而是考虑用CFPS)。

CHIP2007和2008也是我本科毕业论文所使用的数据,但是我最先接触到的并不是北师大的CHIP数据。由于我的老师刚从美国回来,我给她担任研究助理期间,她跟我推荐了IZA的RUMiC2008和2009数据,所以RUMiC也是我申请的第一份微观数据。后来我发现这跟CHIP2007和2008实际上是同一个的项目。

附上CHIP申请地址

 

2. CFPS

CFPS全称是 China Family Panel Studies,中文名为中国家庭追踪调查

CFPS项目由北京大学中国社会科学调查中心(ISSS)主持,申请除了需要你的信息之外,申请使用的邮箱需要一个edu后缀,即是教育系统的邮箱。申请审核通过之后,你的edu后缀邮箱会收到CFPS提供的密码,即可下载数据。另外,CFPS的问卷可以直接在官网上获取,只有数据是需要申请的。

CFPS虽然只有2010,2011和2012三年数据,和一份测试调查数据,但是从问卷中即可看出,CFPS包含的内容远比CHIP丰富。CFPS2012的面访问卷就足足有251页,而CHIP2008中较长的城乡劳动力的问卷,也仅仅只有30页。另外,CFPS2010,2012可以构成面板数据。

我看过的使用CFPS进行研究的文献虽然不多,但是我发现一个有趣的地方,就是许多人利用CFPS研究农村的金融状况。后来从问卷中我发现,CFPS包含了农村家庭的资产,投资等状况。虽然金融不是我的研究方向,但我也大概能意识到研究当下中国农村住户的金融状况有着其重要的意义,这一研究大概就属于发展中国家小额金融(micro-finance)的研究内容的一部分。另外,西南财经大学的中国家庭金融调查(CHFS)也是研究金融的不错的数据库,但是我的研究方向并不是金融领域,因此没有过多关注。

附上CFPS申请地址

 

3. CHARLS

CHARLS全称是 China Health and Retirement Longitudinal Study,中文名为中国健康与养老追踪调查

CHARLS项目跟CFPS一样,也是由北京大学中国社会科学调查中心(ISSS)主持。申请需要基本的个人信息,并不需要edu后缀的邮箱,通过审核并没有什么困难。

CHARLS,如名字所言,主要是关注中国老年人的医疗保险,养老金等方面的议题。CHARLS目前包括了2008年的两省数据,2012年的两省追踪数据,2010年的全国基线调查数据和2013年的全国基线追踪数据(今年1月底刚刚公开的数据)。前两者和后两者分别可以形成面板数据。

由于看的文献比较少,我并不熟悉老年人的医疗保险和身体健康等领域。但是我之前看过一篇特别让我感兴趣的文章,有学者利用CHARLS数据研究“大饥荒”对健康的长期影响(马光荣 2011)。因为CHARLS收集的是老年人的信息,这些人年轻的时候可能经历了中国58-61年的三年大饥荒,所以刚好可以使用当下的微观数据来研究历史事件造成的长期影响,我觉得这真是一个很有趣的研究。

另外,CHARLS在今年会展开新一轮的基线数据调查,这也是北京大学公选课“社会经济调查理论方法与实践”的暑期实践项目(这门课的老师还是赵耀辉!北大的学生就是幸福 ,>。<)。不过我作为非北京地区的学生,申请并入选了今年的CHARLS访员(参见北大的CHARLS第一批访员的录取名单)。所以今年七月初我会在北大上培训课,然后跟着大家伙到实地去帮CHARLS项目收集一个月的数据。

附上CHARLS申请地址

 

4. CHNS

CHNS全称是 China Health and Nutrition Survey, 中文名为中国健康与营养调查

CHNS项目由北卡罗来纳大学的Carolina Population Center主持,申请没有一点困难。但是CHNS提供的数据类型与刚刚介绍的几个项目提到的数据类型不一样,是需要用SAS软件打开的带sas7bdat后缀的数据。因此,如果你和我一样使用的是Mac,那么你就不得不使用SAS软件来打开或转换CHNS数据。幸好SAS有免费的University Version,但是在Mac上使用SAS需要先安装一个虚拟机。

 关于CHNS数据,官网上的介绍讲得很明确,“The China Health and Nutrition Survey (CHNS) was designed to examine the effects of the health, nutrition, and family planning policies and programs implemented by national and local governments and to see how the social and economic transformation of Chinese society is affecting the health and nutritional status of its population.”

我目前还没有仔细研究和使用过CHNS数据,所以还不能谈些什么。

附上CHNS申请地址

 

5. CGSS

CGSS全称是Chinese General Social Survey,中文名为中国综合社会调查

CGSS项目由中国人民大学的中国调查和社会中心主持。我之前申请的时候,需要提交个人信息和一份申请表格(需签字)。因为之前有人大经济论坛的帖子说CGSS的申请不遇到审核不通过的情况,我的审核是很顺利的(而且人大的效率特别高),不知道为什么会有朋友这么说。因此,为了以防万一,我建议各位跟我一样,在申请邮件中除了附上申请所需的表格之外,在正文处详细地提及下自己的研究方向,以及想要用CGSS数据研究什么内容。

但是目前好像CGSS的数据已经转移到新的网站上了,注册申请的过程也和我之前遇到的不一样。我已经发邮件给CGSS的项目组了,询问他我之前申请审核通过的账号为什么不能在新的网站上使用,目前还没收到邮件回复。(新网址见下方“CGSS申请地址”)

CGSS数据或许在社会学领域用的比较多,这应该也是国内社会学领域最好的数据库。CGSS项目也存在许久了,CGSS2003,2005,2006和2008共同构建了该项目第一阶段(长达10年)的数据调查。目前CGSS已经开始了第二个10年的数据调查,CGSS2010和最近公开的CGSS2013都属于此阶段的调查项目。

因为是社会学领域的数据库,所以除了样本住户的基本情况外,CGSS还包含了许多关于价值观念的内容。另外,CGSS数据往往会包含一些特别的内容调查,感兴趣的朋友可以自己去看下问卷。

就我之前研究所接触的文献而言,Hu等人(2011)发表在CER上的一篇文章特别不错,他用CGSS的数据研究了中国城乡劳动力短期流动和长期流动的影响因素。他们将获得了“蓝印户口”或“非农业户口”以及在城镇购买了房产的这部分人界定为城乡流动劳动力中会做出长期流动(即定居)的人群,让人很有启发。

附上CGSS申请地址

 

6. CHFS

CHFS全称是China Household Finance Survey,中文名为中国家庭金融调查

CHFS项目由西南财经大学中国家庭金融调查与研究中心主持。申请并不难,只需要提交一份叫”CHFS数据下载注册信息”的申请表,使用工作邮箱(edu后缀,不接受126,gmail等邮箱)。申请表除了需要提交你的基本信息外,你还需要说明“所需数据的研究项目的标题和摘要”及其“持续时间”。其实也就是需要你大致说下你将使用这套数据分析什么对象,用什么计量方法来进行相应的实证研究。审核时间很快,上午的申请下午就通过了。

至于CHFS数据,官网是这样介绍的,CHFS“旨在通过科学的抽样,采取现代的调查技术和调查管理手段,在全国范围内收集关于家庭资产、负债、收入支出、社会保障和保险等方面的信息为国内外的研究者提供研究中国问题的高质量的微观数据。”

我原本以为CHFS仅仅是家庭金融方面的数据库,因此没怎么关注。直到前几天听了中国家庭金融调查与研究中心主任甘犁在我们学校对CHFS的介绍,我才知道CHFS是一套很出色的数据库。甘犁说建立这套数据库,他想要做的是了解当下中国家庭的基本状况。因此CHFS不只是调查了中国家庭的资产状况,如上述几个数据库一样,它也包含了所调查家庭的基本特征。

CHFS一半以上的资金是由甘犁个人筹得,可以看出甘犁教授的能力。因此甘犁教授在前几天的讲座中说,他一直还在考虑什么时候公布2013年的CHFS数据,因为这个项目的成本实在太大了。CHFS目前只提供2011年的数据,也是全国范围的抽样数据,每两年实行一次跟踪调查。

可以说,甘犁教授的团队利用CHFS数据做了许多优秀的研究,在社会上影响反应较大的包括西财公布的基尼系数,城镇住房空置率报告。其中正是因为城镇住房空置率报告的争议,使得他们团队发现了大家对“城镇化”的误解,以往的研究都忽视了那些被新划分为“城镇”但是生活状态还是农村状态地区的考察,因此在今年的CHFS将会增加对这部分地区的数据收集。研究城镇化的童鞋们,可以关注下(多年之后会发布的…)CHFS2015数据。

附上CHFS申请地址

 

 

当然,目前经济学领域的微观数据库并不止这些,以上提到的六个数据库仅仅是研究中国劳经议题所使用的主要数据库。我想随着我研究的深入,我会更加熟悉这些数据库以及了解到其他的数据,到时我还会再来修正和补充这篇文章。

 

附上两个PDF文档:

1. 《经济学研究常用中国微观数据》,提供自厦门大学王亚南经济研究院,点击下载

2. 《中国微观数据库简介》,提供自南昌大学,点击下载

 

参考文献

1. Yang, Juan, Terry Sicular, and L. A. I. Desheng. “The changing determinants of high school attainment in rural China.” China Economic Review 30 (2014): 551-566.

2. 马光荣. “中国大饥荒对健康的长期影响: 来自 CHARLS 和县级死亡率历史数据的证据.” 世界经济 4 (2011): 104-123.

3. Hu, Feng, Zhaoyuan Xu, and Yuyu Chen. “Circular migration, or permanent stay? Evidence from China’s rural–urban migration.” China Economic Review22.1 (2011): 64-74.

 

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share