实证研究议题:选题、文献和机制

越来越觉得做一份好的实证研究不是一件不容易的事情,并不是一股数据进去,一个模型回归,社会机制的黑箱子就清楚了这么简单。从一些top journal的文章中可以看到,一份好的实证研究在于,作者真的提出了一个很有力的证据在论证自己的猜想。他们能够从ABCD四个角度来试图“摧毁”自己的研究,但很“遗憾”都没能“成功”。秉着“那些打不死你的最后只能让你更强”的精神,ABCD四个内容最终成功地跟文章的基本回归和机制构成了经济学家经常说的,“好的故事”。

写一个“好的故事”重要的地方在哪,我会在文章第二部分继续谈下个人看法。让我先从第一部分说下找选题和文献阅读方面的事情,最后在第三部分提一些如何“试图摧毁”自己论文的建议——即如何给自己的论文找建议和批评意见。

 

1.选题和文献阅读
选题似乎是一种稀缺资源,可能大多数人都有这样的感受。反正以前我的老师们经常跟我们说这样的话,“你以为你们能想出的题目别人就想不出吗,其实肯定有人想过这个题目”,结尾自带naive特效。然后视情况会接着说,一般会先说“所以你们应该去多看文献,肯定会发现有人写过这个题目了”;如果真的没人写过这个题目,老师就会说,“肯定别人想到了这个题目但是写不出来”,暗含你们更写不出来的意思。最后总结说,除非是大牛,一般人能做的不过是一个“打补丁”的工作。

这种鼓励学生先多读文献或者扎实学习的态度是好的,但是我个人不是这样看找选题的事情的。读文献也是一样的道路,很多老师会跟你说,先不要着急写论文的事情,要先多读文献。学生大概会想,是是是,这个道理我都懂。但是个人认为,写论文跟读文献其实并不矛盾。

我对选题方面的看法大概是:找选题最好的状态自然是可以研究自己感兴趣的事情。比如我对政经领域的研究比较感兴趣,虽然我在学校从来没有接触过这方面的老师,但因为我感兴趣,所以还是有许多想研究的内容的。再加上,相比之下,这方面真的没什么人在做,所以说中国的政经研究真的很需要我们去做努力。其次,假如不能做自己感兴趣的内容,如果有个好导师指导着,慢慢也能磨出属于自己的作品。而另一方面,找选题需要的就是培养所谓的“直觉”了。很难说清楚“直觉”是什么,就像是一种发现生活中各种可进行实证的议题的能力。比如对于一件公共事件,大家会有各自的看法,这时候你可以去想,如果让你来为你的看法提供证据,你能做些什么?或者有一天在聊天时,在看书时,你得到了一个“判断”,突然你就意识到自己可以用数据来检验这个“判断”.这些想法大概就是一种“直觉”吧。培养这种能力之后,你会听到“直觉”告诉你说,选题其实并不是一个稀缺资源。它会告诉你,我们并不需要活在一个零和世界,我们并不是做了一个选题就会使得这个世界可做的选题少了一角。相反,“直觉”会告诉你说,去把这个选题领域的蛋糕做大。我们可以发现新的内容,并做出很多研究。一个好的学者拥有这样的能力,他们能够想方设法对自己感兴趣的点进行研究,并让晚辈觉得这个世界黑暗的部分又光明了一块。

所以说初学者就一定只能“打补丁”吗,不一定。我反倒认为一昧“打补丁”是培养不出优秀学者的。每个人都能在自己喜欢的领域有所贡献,其实这类似于亚当斯密所构想的那个理性的市场经济。现实中,很多学者也是基于自己的兴趣点在进行研究的,你可以观察到,往往是优秀的学者越不怕跟人分享自己的选题,他们反而是很乐意组织各种seminar或workshop来讲自己的working paper。而这种正常的学界交流,一方面有利于寻找自己潜在的合作者,另一方面也能给周边的学生或青年老师带来知识上的外溢。如果你的program里面都是些相互不交流的老师,那么这样的program多半不正常。

其实我现在接触下来就发现,有些老师或前辈提出的一些题目,我并不一定感兴趣。也就是说,并不是所有人都在你脑门口蹲着点等着窃取你的选题。即使是在正常的学界交流圈内,你跟别人分享选题之后,别人不一定会关心你做的事情,因为他们有自己感兴趣的内容。他们如果要强加进来跟你一起做这个题目,我觉得他们多半不会有积极性来跟你一起做出一篇很优秀的文章。

所以我还是特别建议国内的经济系,应该多构建系内自己,或者跟别的系合作的各种seminar和workshop,甚至lunch talk之类的东西。这些研讨会可以内部的,学生自己的,也可以是外部的,或有老师参与的。总之,促进学生在上面分享自己的选题是很好的一件事情。就这么问吧,你觉得如果经济系举办了seminar,学生上的讲自己的选题之后,这些seminar是会促进学生的研究多一些,还是会使得学生的(各种不成熟的)选题被盗取的可能性多一些?我觉得认为后者多一些的program多半是不正常的。

而当你开始做自己感兴趣的内容之后,文献的阅读自然会展开。首先,虽说“修行看个人”,但是之前也要导师带进门才行。导师如果对该领域了解,只要稍微指导下学生,我觉得一切都会事半功倍起来。其次,修行一方面看历史进程,另一方面也还是要看个人啊。自己有感兴趣的内容最好,先把该领域的handbook拿出来翻翻,然后去该领域的top journal找找相关选题。如果不是有特别想读的文献,真的建议不要翻中文期刊。因为中文期刊有很多错误的地方,或者故事不完整的地方,作者结论能不能成立真的不知道。英文世界的领域顶级期刊或top5,有很多很有意思且内容、文风各方面都值得学习的文章,是很值得阅读的刊物。最后一点,文献这方面,最早开始读越好,因为这样意味着你的积累会越多,对该领域会越了解,将来写起论文来会更方便。

 

2. 好的故事
好的实证研究往往能提供一个好的故事,我以前以为找一个很好的IV就是一个好故事,其实并不是这么回事。这里的“好的故事”其实体现在两个方面,一方面可能是你研究的内容很有趣,而其实更为重要的一方面在于,你把你所要研究内容的机制看清楚了,因此你做了一个好的研究,用科学的工具写了一个系统的故事。后者很重要,我会在后面详细说下。

首先,对于一个有趣的IV,其实它内容本身的有趣并不足以构成一个好的故事。有趣的IV之所以能够变成好的故事,是因为这个IV在因果推断上的有用,而不是故事的趣味性(这只是副产品)。DID和RDD这种准实验工具也是同理。这一点很重要,因为如果你的IV不能帮助你进行因果推断,那么你的文章甚至都不能构成一个故事。我不同意好故事是指找有趣的IV或准自然实验,其实找IV和准自然实验的目的,都是为了进行有力的因果识别,他们最后都会趋近于OLS方法。所以如果说你在top journal看到有文章在用的是OLS方法,也不用惊讶。其实这很正常,只要能进行有效的因果推断,OLS就足够了。你可以去看作者的识别策略,一般来说,这种文章会存在一个有力的外生变量,而且你能在文中看到作者相关的argument。【本文不讨论RCT和田野实验,因为本人没有接触过这种壕迈的研究方式】我个人认为,刚开始看文献的人会倾向于关注IV的有趣性;但是开始做研究之后,人们就会更多地关注IV的有用性。

其次,最最最重要的事情是,好的故事在于,作者真的看清楚了机制是什么,或者说他们提出了一个可能的机制。至少目前我是这么认为的。好的机制是什么意思,比如你看准了一件事情的内部结构,你只要拿到相关的数据做一下分析,总能找到强有力的证据支持你的猜测。就好像在大部分的情况下,个人的受教育程度总是跟将来的收入成正比的,你去做回归的时候总会发现他们之间的显著性特别强,比如说有三颗星(这里的三颗星是指这种相关程度上的推断错误的可能性在1%以下)。这种情况下你就不用run上两百万次回归,你只要做几次的检验就能接受自己的猜测是准确的。与之类似,如果有一天你的数据跟你说,对于这批研究样本,他们受教育越高却收入越低,那你就要去想想这是为什么,你看准的那个内部机制到底出了什么问题?一份好的研究可能就此展开在你手下。而当你弄懂了这件事情的来龙去脉之后,你的研究也就能称为那个好的故事。

这种对机制的理解很困难,需要我们去弄懂所研究内容的各种制度背景之后,去寻找隐藏在其中的秘密。就像是一次侦探推理,我们在了解事件大概之后,要从各种细节处入手来捕捉出更多的内容并构造出事件的全景。而在此之后,我们还要用其他的方式来对我们的猜想进行检验。而那个没被证伪的猜想,才是你最终的研究成果。这就好像是我们的物理学家做出了一个猜想,然后他们在欧洲搭了一座大型强子对撞机,用质子碰撞质子,去看诸如暗物质之类的物质是否存在并拥有怎样的性质,由此来验证自己的猜想。好的实证研究也是如此,你的主回归是否成立,并不是一件很轻巧的事情。你的主回归其实只是一个等待被证伪的产物,只是一个有了初步证明的猜想,而这个猜想到底能不给够成立,还要用数据的其他方面对主回归进行“抨击”检验。机制研究也是一样的道理。

你可以认为实证研究的星星是数万次回归之后的结果,但是这种所谓的data mining其实并不是社科学者应该有的态度。如果我们能早点发现出所研究内容真正隐藏的信息,那么在基本发现(Benchmark Results)之后我们其实并不需要太多的回归。当然,为了确保我们初步结果的可靠性,稳健性(和安慰剂检验)这块,看似烦冗的回归或许是必不可少的内容。

但其实我们都不太知道事情的真想到底是什么,毕竟我们不是上帝。这时我们可以从其他学科的学者那边得到那么的讯息。有时候我们会听到历史学者对社科学者有这样的批评,“这些东西我们早就知道了,还用这样正儿八经用数据研究必要吗?”从中我们可以看到,很多社科学者之所以能看清楚他们的研究内容,是因为之前已经有很多学者对于相关题目进行了研究,因此这些经济学家能站在巨人肩上看得更远。【与此同时,我要对此进行回应,这些学者来自其他领域,他们在自己的领域内有自己的研究范式。而经济系的学者借数据去检测这些学者的猜想,是我们学科所能做的贡献之一,因此有必要。】

很多新手经常为自己的文章写得很粗糙而着急。我个人的看法是,当逼近真实世界的机制出来之后,你的研究自然也会跟着细致起来,因此不必着急。

 

3.自己是自己论文最好的质疑者
在seminar或workshop上经常能听到小白报告人(包括我),说自己来会议是为了收集意见。我指的不是大牛的谦虚说法,而是真的是为了收集意见,特别是自己一个人开始做研究时。有时候,对于刚开始进行研究的人来说:1.文章主回归出来后,接下来不知道该做什么,更不知道稳健性、安慰剂检验什么的要怎么做;2.缺乏导师或合作者,自然也缺乏多一份有力的对文章的质疑加打磨。这时你一点思路都没有,觉得你文章真的是做得很可以了,然后你跑到会议上去,说“想收集意见”,最终确是以被经验丰富的同行批得很惨收尾。会议确实是收集意见的好地方,但是当你要用上会议时,就得好好利用,而不是因为自己过于小白去收集一些没必要的同行批评。当然,初稿能写多好主要看个人,刚开始的时候总是免不了磕磕碰碰。我这里要强调的是:自己首先得是自己论文最好的质疑者,不要老是护着自己的文章。其实自己能给自己提的意见有很多,不要对自己太不自信。

可是,当你也不知道自己是不是对自己的文章过度自信时,怎么办?这时候就把自己的文章给自己的老师或前辈看下,看他们是不是能给出一些意见。如果,program师资很强的话,论文在program内部就能很好地发展成完整的文章。但对于大部分人来说,论文写完之后并不拥有那么大牛的老师,那么在合适的时候,就把自己的文章交给各种seminar或会议吧。也许你会在这里受到很“善意的批评”,但估计大多数直戳要害的建议都会让你羞愧到想死。但是,苦口良药吧。另一方面,你也把这当做是一种写文章的激励,如果你的文章写得真的很好,你则会在会议上有不少意外的收获。

我导师有一个外国学生,曾经去AEA年会讲自己的论文。有一次找我聊天,我跟他说在中国竞争很激烈,经济学家太多了,你会发现你能做的很多事情都有人做过了。结果他的回应让我有些吃惊,他说很羡慕你们有这么多的同行,因为如果你们有什么研究,他们能提供很多意见,这样你们能做出更优秀的研究。说实话,他说的都是很质朴的道理,我不明白为什么我之前就是不明白这个道理。回想这句话时总能让我当年在学校做RA的日子,当我很焦虑自己的回归的时候,老师总是跟我说慢慢来,踏实地做下去。我觉得我老师跟他身上都带着一种同样的质朴的气质。在他们身上学到的东西,我也希望能在此跟各位共勉。

 

【关于后话的】后话
后来我发现,其实这篇文章的大部分真理其实都凝缩在MHE的Last Word里。因此,在文章的最后,让我们再次倾听下安神老人家的“肺腑之言”。

在MHE中,安神这样说,“If applied econometrics was easy, theorists would do it. But it is not as hard as the dense pages of Econometrica might lead you to believe. Carefully applied to coherent causal questions, regression and 2SLS almost always make sense. Your standard errors probably won’t be quite right, but they rarely are. Avoid embarrassment by being your own best skeptic – and, especially, Don’t Panic!”

我经常在实证研究领域摸着摸着,就会不经意地想到这段话。用老套的说辞评价是:每次翻这段话,我都有新的体验。用新潮的语言评价是:于是我常常会脑补到这样一个画面——安神在讲述学界哲理的同时,并向你投出了一抹深深的微笑。

 

 

注:网站在今年1月份之后就没有更新,因为个人实在太忙(lan)了,在此表示歉意。在此写一篇(不成熟的)最近几个月的收获,希望大家在研究的道路上都能有所收获,谢谢。

 

欢迎各位批评指正。

联系我

Share

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注