媒体与政治说服:来自俄罗斯的证据

1991年苏联解体之后,俄罗斯首任联邦总统叶利钦开始推行激进改革政策,于1993年成立新的国家立法机关—俄罗斯联邦会议,以取代旧有的俄罗斯联邦人民代表大会,并宣布联邦会议将于93年年底开启大选。联邦会议由下议院“国家杜马”和上议院“联邦委员会”构成,其中下议院“国家杜马”一半席位采取比例代表制,另一半采取单一选区选举,并于每四年改选一次。2007年“国家杜马”改为全部席位采用政党比例制,并在次年年底改为五年一届,不过这都是后话。

2011年,三位来自俄罗斯的经济学家在经济学界顶级期刊之一的《美国经济评论》上发表了一篇名叫“Media and Political Persuasion: Evidence from Russia”的论文。在这篇文章中,作者就是讨论了90年代俄罗斯的这段历史。这三位来自媒体经济学(Media Economics)领域的专家,希望利用这段历史来讨论媒体在政治说服上的作用这一议题。

Ruben Enikolopov

论文作者之一的Ruben Enikolopov,图片来自YouTube。

一方面,他们好奇1999年被任命为总理时普遍支持率低于2%的普京,何以在八个月之后的总统选举首轮获得52.9%的选票;而在1999年“国家杜马“选举前两个月成立的亲政府政党Unity(该政党宣称自己是中间派,并支持政府及时任政府总理的普京),何以在当年的下议院选举中获得23.3%的选票。许多学者和媒体人都猜测当时的国营电视台起到了关键作用,而作者关心是否真的如此;另一方面,作者指出许多文献都证明了媒体在政治结果上的作用,但这些文献研究的框架多集中在完善的民主体制国家。作者认为相较于(具备多元媒体,稳定的政党制度和具备鲜明政治立场的政党等特征的)民主国家,威权国家中媒体对政治结果的影响应该更大。如90年代的俄罗斯,政党体系是如此不稳定,许多短期存在的政党轮流更替。对投票者来说,他们大多只能透过大众媒体来获取相关信息。因而作者猜测,相较于政党的政策议题,90年代的俄罗斯选民在做出投票抉择时会更多地被政治领袖的个人魅力所影响。

为了讨论媒体在政治说服(具体而言是人们的投票行为)方面的影响,作者巧妙地找到了90年代俄罗斯的独立电视台NTV作为切入点。1999年,俄罗斯播放政治新闻的主要电视台有三家,除了两大国营电视台ORT和RTR外,就剩下一家独立电视台NTV。NTV的持有者—媒体大亨Gusinsky是普京的反对者,而NTV也公开批评克里姆林宫。其新闻报道与当时的国营电视台也存在很大差异,具体体现在:首先,NTV倾向于将更多的时间报道Unity的政治竞争对手;其次,更为重要的是在播报内容上NTV倾向于播报Unity的负面新闻;最后是在1999年体现普京强硬政治态度的车臣战争中,电视台NTV是当时唯一一家公开持反对态度的电视台。

既然如此,那么如果一个地区能收到NTV电视信号的话(即在当地存在信号中转站),相较于不能收到NTV信号的地区,该地区的人们在1999年的议会选举中是否会存在不一样的投票抉择,比如更少地支持Unity而更多地投票给NTV支持的政党?但这里进行因果推断时需要考虑一个内生性问题,比方说在人们对政府批评程度较高的地区,更可能存在NTV的信号中转站,由此存在NTV的信号覆盖。而这一地区特征也是影响当地居民投票行为的关键因素,由此我们没有办法从中识别出到底是因为NTV的电视节目还是因为当地固有的特征,最终影响了居民的投票行为。但是,NTV独特的存在经历,使得其为本文的因果推断提供了足够的外生性。

成立于1993年的NTV在当时成立仅仅是个小范围信号覆盖的电视台,而在1996年,NTV被允许使用国家教育频道的所有基础设备(如信号中转站),由此一举成为信号覆盖全国大部分地区的电视台。因此,NTV的信号覆盖依靠的是前苏联的基础设备,而这些信号中转站并非是NTV特意分布的产物,也是沿袭了固有的设备基础。为了论证这一点,作者在文中做了一个简单的OLS回归,来看城市的哪些特征与当地存在中转站相关。他们最终推测,存在国家教育频道中转站的地区,更有可能是前苏联的工业重镇。而当地人民的政治倾向(1995年议会选举中的投票结果)和1998年城市的社会经济特征也与当地是否存在中转站无关。由此为NTV的外生性做了论证。

 

实证部分

讨论完NTV的外生性之后,文章开始讨论NTV电视信号可能对当地政治结果的影响。具体分为两大部分,第一部分讨论了总体上的政治结果,即1999年不同地区是否能收到NTV对该地区议会投票结果的影响;而第二部分讨论了个人层面的政治结果,即1999年的个人是否观看NTV的行为对其投票抉择的影响。

 

第一部分——总体层面的结果

在第一部分中,作者先用基本的OLS做了一个主要回归。从文中的回归结果(见原论文Table2)可以看到,如果一个地方1999年可以收到NTV的电视信号,在同年的下议院投票结果中,该地区会更少地投票给NTV反对的Unity政党,而显著地增加对NTV支持政党(Unity最大的反对党OVR,自由派政党SPS和Yabloko)的投票比例。值得注意的是,这一回归结果中还讨论了NTV对其持中立态度的两个政党——KPFR(共产主义政党)和LDPR(国家主义政党)的影响。因为这两个政党在NTV和国营电视台的关注度并没有什么差异,因此以往的讨论往往无法指出媒体如何影响了他们,而从本文的回归结果中可以看到,NTV信号存在地区的居民,会更多地投票给KPFR,而更少地投票给LDPR。最后,回归结果还显示,NTV在地区的存在会使该地区选民的投票比例(turnout)显著降低,而这与以往的文献相符,因为NTV对当局的批评使得民众不信任政府,由此使得减少了人们的投票行为。需要说明的是,选取这几个政党作为研究对象,是因为他们获得了1999年下议院选举5%的最低选票比例(阈值),由此才能在下议院中按比例代表制占据一定议员席位。

主要回归之后,作者先使用了一个双重差分(Differences-in-differences)模型为主要回归提供稳健检验。他们收集了1995年和1999年两个年份的数据,原论文的Table3显示了该回归结果。因为上述六个政党中只有NTV支持的自由派政党SPS,Yabloko和NTV持中立态度的KPFR,LDPR参加了这两届下议院选举,所以这里只讨论这个四个政党。他们的研究发现,双重差分模型下得到的回归结果与主要回归结果是一致的,即存在NTV信号地区的选民倾向于投票给NTV支持的政党,而对NTV持中立态度的政党,NTV的信号存在与否并不会有任何显著影响。另外,该回归的结果显示,NTV的存在对当地人们的投票比例(turnout)存在负向但不显著的结果,文中作者并没有对此进行解释。

双重差分之后是一个安慰剂检验(Placebo test)。安慰剂检验的思想来自临床医学,即为了确认对病人起作用的是测试药物,而非是病人本人的反应。临床上的操作是将病人分为两组,且都会进行“药物“注射,但仅对其中一组进行真正的药物注射,另一组则注射生理盐水。在两组病人都认为自己注射了真正的药物的情况下,看两组病人不同的反馈结果。如果两组病人最终反馈了一致的结果,则说明起作用的并不是测试药物本身,而更可能来自其他因素。注射生理盐水的组别检验则被称为安慰剂检验。在本文中,作者用1999NTV在不同地区的覆盖情况,来检验其是否会对1995年的投票结果造成影响。因为1995年的时候NTV还不是全国性的电视台,而1999年NTV的信号分布也不可能会对4年前的议会选举结果产生影响,所以应该会得出一个不显著的结果。因此,如果结果显著,则说明存在NTV之外的地区因素影响了该地的政治结果。本文安慰剂检验结果显示在原论文的Table4中,根据这一结果我们可以看到,1999年的NTV信号覆盖情况并不会对1995年的投票结果存在任何显著影响,由此再一次为该部分的主要回归做了有力的支撑。

第一部分到这里并没有结束,接下来作者还讨论NTV的持续影响,即1999年NTV的电视信号会对2003年的下议院选举结果产生什么影响,而这也算是一处稳健检验。你到这里可能会疑问说作者为什么不用2003年NTV的覆盖情况研究其对2003年下议院选举结果的影响,这里的原因是因为在2003年,NTV已经变为国有控股的电视频道。这里需要补充说明的是,在2000年普京当选为总统之后不久,NTV的持有者Gusinsky即被宣告入狱,而保释的条件则是将手中全部NTV股份卖给国营企业。Gusinsky在被迫卖掉股份之后,旋即逃离了俄罗斯。因此,2000之后NTV便不再是独立电视台,而NTV的员工也遭遇洗牌,许多因NTV聚在一起的优秀记者都离开了公司。这也解释了为什么本文将主要回归聚集在了1999年的政治选举上。我们从回归结果(见原论文Table5)可以看到,NTV1999年的信号覆盖情况依旧会影响到2003年的选举结果,即1999年存在NTV信号的地区的选民,在2003年的时候依旧会更多地支持自由派政党SPS和Yabloko,而对KPFR和LDPR的选举结果无影响。从这一回归结果还可以看到,系数在显著的同时,其影响程度也在变小,这说明NTV在存在持续影响的同时,这一影响也在减小。另外,因为Unity和OVR在2001年合并组成了新的United Russia(目前普京所在的政党),所以这里讨论的是NTV对2003年United Russia投票结果的影响。回归结果发现,NTV在1999年的信号覆盖情况并不会影响到2003年United Russia在下议院的选票结果。最后在投票总数方面,1999年的NTV信号覆盖依旧会显著减少2003年人们的投票行为。

 

第二部分——个体层面的结果

在第一部分用总体层面的数据讨论了NTV对政治结果的影响之后,第二部分在个人层面对此议题进行了更为细致的分析。作者想知道,个体1999年观看NTV的行为对其1999年投票抉择有怎样的影响。而如果观看NTV的人真的倾向于投票给NTV支持的政党,那么具体又是哪些人受到了NTV的影响(即政治说服)。

如果我们想讨论“是否观看NTV”与该个体1999年“是否投票给某政党”之间的关系,我们可以使用Probit模型直接做回归。但是这里的回归结果并不能构成因果推断,因为会面临内生性问题,比如看NTV的人跟不看NTV的人本身可能就是不一样的群体,因此这些人存在的不同投票抉择偏好可能是源自自身所带特征,而非是因为“是否观看NTV”这一行为的影响。为了做出NTV的观看行为对投票抉择的作用的因果推断,作者在这里用了工具变量法。具体而言,在第一阶段的回归中,用NTV1999的信号强度来估计出其对“人们是否会观看NTV”的影响,由此分离出干扰因素;然后在第二阶段的回归中,再估计“是否观看NTV”对于人们“是否投票给某一政党”的影响。

原论文中的Table6和Table7给出了这两个阶段的回归结果。结果发现,1999年观看NTV的行为显著减少了人们对于Unity的投票,且显著增加了人们对NTV支持的两个政党(即OVR和SPS)的投票,而另一个NTV支持的自由派政党Yabloko,该系数虽然为正但是不显著。另外,1999年是否观看NTV并没有对个体是否前去投票的抉择产生影响。

既然观看NTV影响了个体的投票抉择,那么又是哪些个体受到了NTV的影响?为此作者进一步用分样本讨论的方式对此进行研究,具体操作是将总样本分为“清楚知道自己会决定投票给哪个政党”的样本和“还没决定要投票给哪个政党”的样本。需要说明的是,在这一部分使用的微观调查数据来自1999年的一项追踪调查,调查者在1999年议会选举前后一个月分别收集了一次数据。因此,这里的“还没决定要投票给哪个政党”,是指在1999年的议会选举前一个月时被调查者的反馈。在这一调查中,已经确定投票意向的受访者还提供了自己的意向政党。而在议会投票结束后一个月,这一调查再次收集了他们真实的投票抉择。

回归结果(见原论文中Table8)发现,即使控制了选举前一个月个体的投票意愿,观看NTV的行为依旧对人们的投票抉择产生了影响,也就是说,人们可能仅仅因为在投票前一个月观看了NTV,而改变了自己的投票意愿。具体而言,对于投票前一个月清楚知道自己投票意向的群体,前一个月观看NTV的行为会增加(或说说服)选民支持OVR和SPS,但是不会影响人们对Unity的投票。另外,在选举一月前的投票意向方面,回归发现以往观看NTV的行为会显著增加这部分人在选举前一个月对OVR和Yabloko的支持意向。进一步,对于选举前一个月还不清楚自己会投票给哪个政党的这部分人,作者发现,选举前一个月观看NTV的行为会显著减少这部分人对Unity的支持。也就是说,在Unity1999年的议会投票结果中,NTV显著地说服了投票前一个月还未决定投票意向的这部分人,并显著减少了他们对Unity的支持。

 

结论

本文用俄罗斯1999年的议会选举这段历史讨论了媒体对政治结果的作用这一议题,作者的识别策略基于当时的独立电视台NTV,因为NTV电视信号在地理上存在差异且具备外生性,由此为本文的因果推断提供了可能。具体分析分为总体层面和个体层面两个层面。在总体层面上,本文发现存在NTV电视信号地区的选民会更多地支持NTV支持的三个政党(OVR,SPS和Yablok),而显著减少对NTV反对政党Unity的支持;在个体层面,作者也发现了一致的结果,具体而言,文章发现观看NTV的个体会更有可能将自己的选票投给NTV支持的政党,且会有很大可能不将自己的选票投给NTV反对的Unity政党。作者还发现,即使控制了个体选民投票前一个月的投票意向之后,NTV依旧会显著减少选民对Unity的支持,这意味着有一大批选民在投票前一个月因为观看了NTV的节目而选择不投票给Unity。通过进一步分析,作者发现,被NTV说服不投票给Unity的这部分人主要是在投票前一个月还未确定自己投票意向的选民。

 

评语:

  1. 这篇文章的第一部分,作者能直接用简单的OLS做出因果推断,全得因于作者在识别策略上所做的努力,之后再用DID等方法进行稳健检验,都是值得学习的地方。
  2. 论文作者中的Ruben Enikolopov和Maria Petrova两夫妇合写了包括这篇论文在内的多篇论文,另外有名的一篇文章为2015年发表在QJE的《Radio and the Rise of The Nazis in Prewar Germany》。 他们还有几篇working papers,分别讨论了俄罗斯的媒体跟集会反抗和腐败监督之间的关系。另外,他们为Handbook of Media Economics编纂了其中一章,其中提到了几篇关于中国的媒体研究,感兴趣的读者可以关注下。
  3. 本文的开头引用了普京的一句话,“Contrary to a common perception, mass media is an instrument, rather than an institution”,翻译为中文是,“跟普遍看法不同的是,媒体其实是一个工具,而不是一种产业制度 ”。把大众传媒当做舆论工具,普京这样认为的好处是什么?这篇论文或许给出了一部分答案。
  4. 最后,至于NTV的命运如何,这里给感兴趣的读者推荐一部NHK2008年拍摄的纪录片——《言论管制·普京帝国与媒体》。

 

文献来源:

Enikolopov, R., Petrova, M., & Zhuravskaya, E. (2011). Media and Political Persuasion: Evidence from Russia. The American Economic Review101(7), 3253-3285.

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share

实证研究议题:选题、文献和机制

越来越觉得做一份好的实证研究不是一件不容易的事情,并不是一股数据进去,一个模型回归,社会机制的黑箱子就清楚了这么简单。从一些top journal的文章中可以看到,一份好的实证研究在于,作者真的提出了一个很有力的证据在论证自己的猜想。他们能够从ABCD四个角度来试图“摧毁”自己的研究,但很“遗憾”都没能“成功”。秉着“那些打不死你的最后只能让你更强”的精神,ABCD四个内容最终成功地跟文章的基本回归和机制构成了经济学家经常说的,“好的故事”。

写一个“好的故事”重要的地方在哪,我会在文章第二部分继续谈下个人看法。让我先从第一部分说下找选题和文献阅读方面的事情,最后在第三部分提一些如何“试图摧毁”自己论文的建议——即如何给自己的论文找建议和批评意见。

 

1.选题和文献阅读
选题似乎是一种稀缺资源,可能大多数人都有这样的感受。反正以前我的老师们经常跟我们说这样的话,“你以为你们能想出的题目别人就想不出吗,其实肯定有人想过这个题目”,结尾自带naive特效。然后视情况会接着说,一般会先说“所以你们应该去多看文献,肯定会发现有人写过这个题目了”;如果真的没人写过这个题目,老师就会说,“肯定别人想到了这个题目但是写不出来”,暗含你们更写不出来的意思。最后总结说,除非是大牛,一般人能做的不过是一个“打补丁”的工作。

这种鼓励学生先多读文献或者扎实学习的态度是好的,但是我个人不是这样看找选题的事情的。读文献也是一样的道路,很多老师会跟你说,先不要着急写论文的事情,要先多读文献。学生大概会想,是是是,这个道理我都懂。但是个人认为,写论文跟读文献其实并不矛盾。

我对选题方面的看法大概是:找选题最好的状态自然是可以研究自己感兴趣的事情。比如我对政经领域的研究比较感兴趣,虽然我在学校从来没有接触过这方面的老师,但因为我感兴趣,所以还是有许多想研究的内容的。再加上,相比之下,这方面真的没什么人在做,所以说中国的政经研究真的很需要我们去做努力。其次,假如不能做自己感兴趣的内容,如果有个好导师指导着,慢慢也能磨出属于自己的作品。而另一方面,找选题需要的就是培养所谓的“直觉”了。很难说清楚“直觉”是什么,就像是一种发现生活中各种可进行实证的议题的能力。比如对于一件公共事件,大家会有各自的看法,这时候你可以去想,如果让你来为你的看法提供证据,你能做些什么?或者有一天在聊天时,在看书时,你得到了一个“判断”,突然你就意识到自己可以用数据来检验这个“判断”.这些想法大概就是一种“直觉”吧。培养这种能力之后,你会听到“直觉”告诉你说,选题其实并不是一个稀缺资源。它会告诉你,我们并不需要活在一个零和世界,我们并不是做了一个选题就会使得这个世界可做的选题少了一角。相反,“直觉”会告诉你说,去把这个选题领域的蛋糕做大。我们可以发现新的内容,并做出很多研究。一个好的学者拥有这样的能力,他们能够想方设法对自己感兴趣的点进行研究,并让晚辈觉得这个世界黑暗的部分又光明了一块。

所以说初学者就一定只能“打补丁”吗,不一定。我反倒认为一昧“打补丁”是培养不出优秀学者的。每个人都能在自己喜欢的领域有所贡献,其实这类似于亚当斯密所构想的那个理性的市场经济。现实中,很多学者也是基于自己的兴趣点在进行研究的,你可以观察到,往往是优秀的学者越不怕跟人分享自己的选题,他们反而是很乐意组织各种seminar或workshop来讲自己的working paper。而这种正常的学界交流,一方面有利于寻找自己潜在的合作者,另一方面也能给周边的学生或青年老师带来知识上的外溢。如果你的program里面都是些相互不交流的老师,那么这样的program多半不正常。

其实我现在接触下来就发现,有些老师或前辈提出的一些题目,我并不一定感兴趣。也就是说,并不是所有人都在你脑门口蹲着点等着窃取你的选题。即使是在正常的学界交流圈内,你跟别人分享选题之后,别人不一定会关心你做的事情,因为他们有自己感兴趣的内容。他们如果要强加进来跟你一起做这个题目,我觉得他们多半不会有积极性来跟你一起做出一篇很优秀的文章。

所以我还是特别建议国内的经济系,应该多构建系内自己,或者跟别的系合作的各种seminar和workshop,甚至lunch talk之类的东西。这些研讨会可以内部的,学生自己的,也可以是外部的,或有老师参与的。总之,促进学生在上面分享自己的选题是很好的一件事情。就这么问吧,你觉得如果经济系举办了seminar,学生上的讲自己的选题之后,这些seminar是会促进学生的研究多一些,还是会使得学生的(各种不成熟的)选题被盗取的可能性多一些?我觉得认为后者多一些的program多半是不正常的。

而当你开始做自己感兴趣的内容之后,文献的阅读自然会展开。首先,虽说“修行看个人”,但是之前也要导师带进门才行。导师如果对该领域了解,只要稍微指导下学生,我觉得一切都会事半功倍起来。其次,修行一方面看历史进程,另一方面也还是要看个人啊。自己有感兴趣的内容最好,先把该领域的handbook拿出来翻翻,然后去该领域的top journal找找相关选题。如果不是有特别想读的文献,真的建议不要翻中文期刊。因为中文期刊有很多错误的地方,或者故事不完整的地方,作者结论能不能成立真的不知道。英文世界的领域顶级期刊或top5,有很多很有意思且内容、文风各方面都值得学习的文章,是很值得阅读的刊物。最后一点,文献这方面,最早开始读越好,因为这样意味着你的积累会越多,对该领域会越了解,将来写起论文来会更方便。

 

2. 好的故事
好的实证研究往往能提供一个好的故事,我以前以为找一个很好的IV就是一个好故事,其实并不是这么回事。这里的“好的故事”其实体现在两个方面,一方面可能是你研究的内容很有趣,而其实更为重要的一方面在于,你把你所要研究内容的机制看清楚了,因此你做了一个好的研究,用科学的工具写了一个系统的故事。后者很重要,我会在后面详细说下。

首先,对于一个有趣的IV,其实它内容本身的有趣并不足以构成一个好的故事。有趣的IV之所以能够变成好的故事,是因为这个IV在因果推断上的有用,而不是故事的趣味性(这只是副产品)。DID和RDD这种准实验工具也是同理。这一点很重要,因为如果你的IV不能帮助你进行因果推断,那么你的文章甚至都不能构成一个故事。我不同意好故事是指找有趣的IV或准自然实验,其实找IV和准自然实验的目的,都是为了进行有力的因果识别,他们最后都会趋近于OLS方法。所以如果说你在top journal看到有文章在用的是OLS方法,也不用惊讶。其实这很正常,只要能进行有效的因果推断,OLS就足够了。你可以去看作者的识别策略,一般来说,这种文章会存在一个有力的外生变量,而且你能在文中看到作者相关的argument。【本文不讨论RCT和田野实验,因为本人没有接触过这种壕迈的研究方式】我个人认为,刚开始看文献的人会倾向于关注IV的有趣性;但是开始做研究之后,人们就会更多地关注IV的有用性。

其次,最最最重要的事情是,好的故事在于,作者真的看清楚了机制是什么,或者说他们提出了一个可能的机制。至少目前我是这么认为的。好的机制是什么意思,比如你看准了一件事情的内部结构,你只要拿到相关的数据做一下分析,总能找到强有力的证据支持你的猜测。就好像在大部分的情况下,个人的受教育程度总是跟将来的收入成正比的,你去做回归的时候总会发现他们之间的显著性特别强,比如说有三颗星(这里的三颗星是指这种相关程度上的推断错误的可能性在1%以下)。这种情况下你就不用run上两百万次回归,你只要做几次的检验就能接受自己的猜测是准确的。与之类似,如果有一天你的数据跟你说,对于这批研究样本,他们受教育越高却收入越低,那你就要去想想这是为什么,你看准的那个内部机制到底出了什么问题?一份好的研究可能就此展开在你手下。而当你弄懂了这件事情的来龙去脉之后,你的研究也就能称为那个好的故事。

这种对机制的理解很困难,需要我们去弄懂所研究内容的各种制度背景之后,去寻找隐藏在其中的秘密。就像是一次侦探推理,我们在了解事件大概之后,要从各种细节处入手来捕捉出更多的内容并构造出事件的全景。而在此之后,我们还要用其他的方式来对我们的猜想进行检验。而那个没被证伪的猜想,才是你最终的研究成果。这就好像是我们的物理学家做出了一个猜想,然后他们在欧洲搭了一座大型强子对撞机,用质子碰撞质子,去看诸如暗物质之类的物质是否存在并拥有怎样的性质,由此来验证自己的猜想。好的实证研究也是如此,你的主回归是否成立,并不是一件很轻巧的事情。你的主回归其实只是一个等待被证伪的产物,只是一个有了初步证明的猜想,而这个猜想到底能不给够成立,还要用数据的其他方面对主回归进行“抨击”检验。机制研究也是一样的道理。

你可以认为实证研究的星星是数万次回归之后的结果,但是这种所谓的data mining其实并不是社科学者应该有的态度。如果我们能早点发现出所研究内容真正隐藏的信息,那么在基本发现(Benchmark Results)之后我们其实并不需要太多的回归。当然,为了确保我们初步结果的可靠性,稳健性(和安慰剂检验)这块,看似烦冗的回归或许是必不可少的内容。

但其实我们都不太知道事情的真想到底是什么,毕竟我们不是上帝。这时我们可以从其他学科的学者那边得到那么的讯息。有时候我们会听到历史学者对社科学者有这样的批评,“这些东西我们早就知道了,还用这样正儿八经用数据研究必要吗?”从中我们可以看到,很多社科学者之所以能看清楚他们的研究内容,是因为之前已经有很多学者对于相关题目进行了研究,因此这些经济学家能站在巨人肩上看得更远。【与此同时,我要对此进行回应,这些学者来自其他领域,他们在自己的领域内有自己的研究范式。而经济系的学者借数据去检测这些学者的猜想,是我们学科所能做的贡献之一,因此有必要。】

很多新手经常为自己的文章写得很粗糙而着急。我个人的看法是,当逼近真实世界的机制出来之后,你的研究自然也会跟着细致起来,因此不必着急。

 

3.自己是自己论文最好的质疑者
在seminar或workshop上经常能听到小白报告人(包括我),说自己来会议是为了收集意见。我指的不是大牛的谦虚说法,而是真的是为了收集意见,特别是自己一个人开始做研究时。有时候,对于刚开始进行研究的人来说:1.文章主回归出来后,接下来不知道该做什么,更不知道稳健性、安慰剂检验什么的要怎么做;2.缺乏导师或合作者,自然也缺乏多一份有力的对文章的质疑加打磨。这时你一点思路都没有,觉得你文章真的是做得很可以了,然后你跑到会议上去,说“想收集意见”,最终确是以被经验丰富的同行批得很惨收尾。会议确实是收集意见的好地方,但是当你要用上会议时,就得好好利用,而不是因为自己过于小白去收集一些没必要的同行批评。当然,初稿能写多好主要看个人,刚开始的时候总是免不了磕磕碰碰。我这里要强调的是:自己首先得是自己论文最好的质疑者,不要老是护着自己的文章。其实自己能给自己提的意见有很多,不要对自己太不自信。

可是,当你也不知道自己是不是对自己的文章过度自信时,怎么办?这时候就把自己的文章给自己的老师或前辈看下,看他们是不是能给出一些意见。如果,program师资很强的话,论文在program内部就能很好地发展成完整的文章。但对于大部分人来说,论文写完之后并不拥有那么大牛的老师,那么在合适的时候,就把自己的文章交给各种seminar或会议吧。也许你会在这里受到很“善意的批评”,但估计大多数直戳要害的建议都会让你羞愧到想死。但是,苦口良药吧。另一方面,你也把这当做是一种写文章的激励,如果你的文章写得真的很好,你则会在会议上有不少意外的收获。

我导师有一个外国学生,曾经去AEA年会讲自己的论文。有一次找我聊天,我跟他说在中国竞争很激烈,经济学家太多了,你会发现你能做的很多事情都有人做过了。结果他的回应让我有些吃惊,他说很羡慕你们有这么多的同行,因为如果你们有什么研究,他们能提供很多意见,这样你们能做出更优秀的研究。说实话,他说的都是很质朴的道理,我不明白为什么我之前就是不明白这个道理。回想这句话时总能让我当年在学校做RA的日子,当我很焦虑自己的回归的时候,老师总是跟我说慢慢来,踏实地做下去。我觉得我老师跟他身上都带着一种同样的质朴的气质。在他们身上学到的东西,我也希望能在此跟各位共勉。

 

【关于后话的】后话
后来我发现,其实这篇文章的大部分真理其实都凝缩在MHE的Last Word里。因此,在文章的最后,让我们再次倾听下安神老人家的“肺腑之言”。

在MHE中,安神这样说,“If applied econometrics was easy, theorists would do it. But it is not as hard as the dense pages of Econometrica might lead you to believe. Carefully applied to coherent causal questions, regression and 2SLS almost always make sense. Your standard errors probably won’t be quite right, but they rarely are. Avoid embarrassment by being your own best skeptic – and, especially, Don’t Panic!”

我经常在实证研究领域摸着摸着,就会不经意地想到这段话。用老套的说辞评价是:每次翻这段话,我都有新的体验。用新潮的语言评价是:于是我常常会脑补到这样一个画面——安神在讲述学界哲理的同时,并向你投出了一抹深深的微笑。

 

 

注:网站在今年1月份之后就没有更新,因为个人实在太忙(lan)了,在此表示歉意。在此写一篇(不成熟的)最近几个月的收获,希望大家在研究的道路上都能有所收获,谢谢。

 

欢迎各位批评指正。

联系我

Share

三年大饥荒的长期影响:来自幸存者的证据

在半个多世纪之前,中国发生过一次严重的饥荒。这段主要发生在1959年到1961年的饥荒现在被历史课本叫做“三年自然灾害”或“三年困难时期”。这次饥荒的严重体现在涉及人群广,而且不可思议地持续了三年以上。学界有不少关于饥荒造成的死亡人数的讨论,估计的死亡人数在1500万到3000万之间,甚至更高;而在饥荒成因方面,经济学界也贡献了不少文章。

The Simpsons S16E12_en

注:上图来自The Simpsons S16E12

陈玉宇和周黎安在2007年发表在Journal of Health Economics的文章——“The long-term health and economic consequences of the 1959–1961 famine in China”也讨论了这段历史,但是他们的关注点并不在于饥荒造成的死亡人数或产生原因。在这篇文章中,他们关心的是这场发生在大半个世纪前的饥荒,是否对当下的饥荒幸存者依然存在影响。如果产生了影响,那具体又是什么影响。使用能更全面地反映个体层面的微观数据,他们在这篇文章中讨论了饥荒可能对其幸存者在健康和经济层面存在的长期影响。虽然这是一篇较早的文献,但也是第一篇研究中国饥荒长期影响方面的文章,因此是一篇重要的文献,所以本次选择给大家推送这篇论文。

这篇文章研究的内容看起来属于中国的政经研究,但实际上,儿童早期成长环境可能产生的长期影响,是劳动经济学领域的一个研究议题。因此这篇文章也是发表在劳动经济学领域的顶级期刊JHE上。具体而言,在劳动经济学领域,有一支文献专门研究儿童早期的成长环境对其可能造成的长期影响,比如许多文献探究了儿童成长早期,父母的身体健康、家庭经济状况或父母的雇佣情况等因素,是否会对小孩造成长期影响。父母的健康我们很容易理解,一个身体不健康的母亲(如长期抽烟或喝酒)更可能生出健康较差的孩子;而父母收入的增加,可能意味着孩子能够拥有更好的成长环境;但有时收入的增加也意味着雇佣情况的改变即意味着父母可能会有更少的时间和精力去为小孩提供一个温馨的成长环境(于是经济学家就会去关心到底哪方面的效应会更强)。再举个跟当下国人较为相关的例子,许多经济学家关心,小孩在妊娠期或出生后如果长期生活(或说暴露)在空气污染严重的环境中,那么相较于生活在空气质量良好环境中的小孩,这些人长大之后的健康状况是否会更差,而这种健康状况的差异又是否会对其将来的受教育程度以及劳动市场上的产出(如收入情况)造成影响?类似的文献还有很多,感兴趣的读者可以看下Handbook of Labor Economics (2010)第4册B部分中的第15章“Human Capital Development before Age Five”。

 

实证方法

按这个思路,我们回过头来看下这篇文章。这篇文章使用了一种叫做双重差分(Differences-in-Differences)的“准实验”方法。之所以叫做“准实验”是因为饥荒的发生并不是自然科学家在实验室控制出来的结果,但饥荒这一历史事件却导致了一种类似于实验产生的结果,因此可以把这场饥荒看做是为了研究儿童早期的负面环境可能造成的长期影响提供了一次“准实验”(虽然这种说法显得无情)。

而双重差分,其思想类似于临床医学上进行因果推断所使用控制实验法,即随机将一部分使用药物的样本本视为实验组(treatment group),随机将另一部分不使用药物的样本组视为控制组(control group)。由此从样本产生的组别差异中推断出药物会对人体造成的影响。在这篇文章中,一方面,作者把在饥荒之前及期间(1954-1958年、1959-1962年)出生的一批人分成一个组,视为实验组;把饥荒之后出生(1963-1967年)的一批人分为另一个组,视为控制组。由此我们可以看出,对于那些在1954至1962年出生的人来说,他们在妊娠期或童年早期,将会受到饥荒的影响(比如一个1954年出生的人在5岁的时候会遭遇饥荒;一个1962年出生的人1961年处在母亲的妊娠期因此也会遭遇饥荒影响);而对于那些在1963年及之后出生的人来说,不管他们在哪一年出生,他们早期的生活环境都不再受到饥荒的影响,因为饥荒已经结束了。由此,我们可以通过比较实验组和控制组两组样本成年之后健康和经济层面的差异,来推断饥荒的长期影响。具体而言,这篇文章用样本成年之后的身高来衡量其健康状况,用成年之后的劳动时间供给状况和家庭收入来衡量其经济状况。

但这仅构成了第一层的差异,要进行因果推断,我们还需要另一层差异。即对于那些妊娠期或童年早期暴露在饥荒的样本,我们还应观察他们受到的不同程度的饥荒是否也会对应产出不同程度的影响,由此产生的结论才能构成因果推断。因此,各省饥荒的严重程度便构成了这文的第二层差异。这篇文章利用各省人数的超额死亡率来衡量饥荒的严重程度(具体使用的是各省在饥荒最为严重的1960年的超额死亡率)。

 

数据与实证结果

文章个体层面的样本数据来自中国健康与营养调查项目(China Health and Nutrition Surveys, CHNS),而1959年到1961年各省超额死亡率的数据来自Lin和Yang (2000)的从食物获取权方面讨论饥荒成因的文章——“Food Availability, Entitlements and the Chinese Famine of 1959-61”。文章样本来自CHNS数据所覆盖的中国的8个省份,并且将研究范围限制在中国农村地区。一般认为,城市和农村地区的饥荒情况并不一致,而且农村的饥荒程度更为严重。【将样本限制在农村地区还有出于减少样本选择偏误(selection bias)方面的考虑,这里不做细谈,对此有兴趣的读者可以具体查看原文和结语处提供的文章。】

由此,作者构建了两个双重差分模型(如下图)。

Model1

Model2

模型1的Hijk表示出生在k时期j地区的i样本被调查当年(1991年)的身高,βk是出生队列(cohort)的固定效应,edrj是j地区在1960年(饥荒最严重的年份)的超额死亡率。第一个方程在回归的过程中仅包括实验组——即1954年到1962年出生的样本。在方程中包括了1962年出生的样本,因为这些样本是1961年就处在母亲的妊娠期,因此也会受到饥荒的影响;第二个模型与第一个方程类似,不一样的是被解释变量为出生在k时期j地区的i样本在1991年总共工作时间的对数值,且第二个方程中加入了一系列的用X表示的控制变量。之后还用其他的一些被解释变量来衡量样本的劳动供给和收入状况。

鉴于上文的识别框架,我们能够预期到,那些童年遭遇饥荒,特别是童年早期遭遇饥荒的群体(以往的文献认为越是早期遭受负面环境对将来的影响越大),成年后会有更差的健康和经济状况。他们的回归结果发现了一致的结果,对于那些童年早期暴露在饥荒时期的而儿童来说,他们成年之后拥有更低的身高,更短的劳动供给时间和更少的收入。

但是这一回归结果是否真的论证了饥荒的长期影响?为了得到解答我们需要从其他方面来检验以上的回归结果,即需要做一些稳健性检验。首先,作者检验了那些饥荒之后出生的样本,看他们是否会受到饥荒的影响。如果这些饥荒之后出生的样本的回归结果也存在显著性,则说明样本所受到的影响并不来自饥荒,而来自于一些被作者所忽略的因素。稳健性检验表明,饥荒之后出生的样本的回归结果并没有显著性,即没有受到饥荒的影响。其次,作者用分位数回归(Quantile Regression)进一步对回归结果进行检验。按照预期,作者认为实验组中那些身高较低的群体,相较于身高较正常的群体,将会受到更为严重的饥荒的负向影响。实证结果支持了作者的这一预期。

 

结论

作者研究发现,发生在1959到1961年的饥荒对其幸存者存在着长期影响。具体来说,饥荒使得那些童年早期暴露在饥荒之中的小孩,在成年之后拥有较低的身高,较少的劳动时间供给和家庭收入。因此,作者认为,发生在半个多世纪之前的大饥荒对当下的幸存者产生了巨大且持续的影响,而这一影响无疑深远而长久地影响了这些幸存者各项财富(welfare)。

在文章最后,作者指出该研究还存在的两个局限之处。第一是这篇文章所使用的将近2000个个体的样本还是有点太小了,因此作者本文的结论在更大范围的样本中是否依旧成立还有待测试;第二,这篇文章虽然讨论了饥荒在经济层面的长期影响,但并没有清楚地指出其中的影响机制是什么。虽然以往的文献指出健康状况是一个极为可能对经济状况产生影响的渠道,但鉴于他们能够获得的关于健康的数据只有身高一项,因此很难借由本数据揭示出具体的影响机制是什么。

 

结语

  1. 关于饥荒研究中的样本选择偏误问题,感兴趣的读者可以看下何晓波老师写过的一篇文章《为什么经济学家要研究饥荒》,里面对此有很好的论述。
  1. 童年早期遭遇的环境,并不一定是负面的(虽然这方面的研究很多)。今年4月份AER新刊出的文章——“Long-Run Impacts of Childhood Access to the Safety Net”,讲述的是美国上世纪60-70年代的食品券项目(Food Stamp Program)对受到经济资助家庭小孩的长期影响,这既是一个童年时期受到正向影响的研究。
  1. 1962年,时任主席的刘少奇在年初召开的“七千人大会”上曾经以“要上书”来评价这段历史。刘的这句判断如今已应验,但或许他没有想到这段历史不单上了书,还上了劳动经济学领域的顶级期刊。#误

 

文献来源

Chen, Y., & Zhou, L. A. (2007). The long-term health and economic consequences of the 1959–1961 famine in China. Journal of health economics, 26(4), 659-681.

 

 

欢迎各位批评指正。

如想转载,请联系我。:)

联系我

Share