意昂3体育經院兩會筆談︱張延、王琪:發展經濟學的新思路——評估“精準扶貧”政策效果的科學量化分析方法

當今時代👷🏿‍♀️,盡管世界經濟發展取得了巨大進步,但全球仍有7億多人生活在極度貧困中,每年有大約500萬五歲以下兒童死於一些可以通過廉價治療來預防或治愈的疾病👲🏿,有一半的兒童仍然沒有掌握基本的識字和計算能力就離開了學校(Committee for the Prize in Economic Sciences in Memory of Alfred Nobel, 下文簡稱the Prize in Economic Sciences, 2019)🫅🏼。

美國著名發展經濟學家邁克爾·克雷默(Michael Kremer),哈佛大學經濟學教授👰🏿‍♀️、2019年諾貝爾經濟學獎得主,從微觀角度切入全球貧困問題研究🐤,通過引入隨機對照實驗的方法設計科學的實地實驗,評估不同措施的影響效果,試圖尋找有效的幹預措施來幫助貧困人口改善生活。他的實驗研究成果可被廣泛用於發展中國家進行教育補貼、教師管理🍠、疾病預防、醫療定價、技術推廣等現實問題中🚴🏻。克雷默開創並推廣的實驗方法本身也對經濟學多個分支具有重大意義,不僅重塑了發展經濟學研究,也為整個實證經濟學領域提供了更為豐富可信的經驗證據和科學有效的研究方法。

一⟹、隨機對照實驗:開啟經濟學研究的新方法

克雷默將全球貧困問題分解為與個體或群組相關的更為精確的問題🍌,如提高入學率、提高疫苗接種比例等🧔‍♀️,試圖在改善窮人生活狀態的微觀視角上給出解決辦法,其采用一系列巧妙設計的隨機對照實驗🦸🏻,並尋求與發展中國家部分機構的合作以在真實環境中評估減貧項目的效果🤌🏿🎖。這種新的實驗設計方法不僅在全球減貧問題上具有重大的實踐意義🏋🏽,也重塑了發展經濟學的研究範式。

評估幹預影響的研究都試圖回答這樣一個問題🏪:參與了某一項目的個體,在沒有這一項目影響下將會如何?沒有參與某一項目的個體🧔‍♂️★,若在這一項目中將表現何種特征?而在任一給定時間🧑🏻‍⚖️,被觀測的個體只存在參與或者未參與中的一種狀態,因此難以獲得項目對個體影響的估計(the Prize in Economic Sciences, 2019)💓。若要通過對照實驗評估項目影響,克雷默和迪弗洛(Duflo & Kremer, 2003)認為,關鍵的一步是建立可信的對比。

以實驗組代表受項目影響的個體組,對照組代表不受項目影響的個體組,則可信的對比是指,若實驗組未參與該項目,將與對照組具有相似的結果。在此基礎上🚶🏻‍♂️,對照組可以預測出實驗組個體在沒有該項目影響下將是何種特征,通過這樣的設計可以給出上述問題在群組層面的答案☛,即項目的平均影響🦬。

但在現實中,克雷默和迪弗洛(Duflo & Kremer, 2003)研究發現🧛‍♂️,通常參與了某一項目的個體與未參與的個體本身就有所不同🈲,有些項目也僅允許符合某類特質的人群參與(例如扶貧政策僅針對貧困人口實施)。另外👩🏿‍⚕️,是否參與該項目的決策在很多情況下也是自願的。這導致兩組人群的差異不僅反映了項目的影響🤶🏿,還包含了預先存在的差異,即選擇性偏誤🤾🏿‍♂️。因此,參與人群與未參與人群不能形成可信的對比,實驗組和對照組不能簡單等同於參與者和未參與者。

消除選擇性偏誤的一個方法是在潛在參與人群中隨機選擇實驗組和對照組。這種方法使得兩組人群平均而言沒有顯著差別👩‍🎨,兩者的不同可被歸因為參與項目狀況所致。

基於對照和隨機這兩個基礎思想👩‍🍼🧝🏻‍♂️,克雷默及其合作者(Vermeersch & Kremer, 2005; Kremer, Moulin & Namunyu, 2003; Glewwe, Kremer & Moulin, 2009)設計了一系列的實地實驗,並開展於多個發展中國家🎢,通過與當地機構合作設計幹預項目📚,在實施後評估幹預效果🔗🧟‍♀️。他們與當地具有在現實中實施項目的權力並對如何改善項目感興趣的機構(如政府🤎、非政府組織、私人企業等)合作🙅🏿‍♀️,這保證了實驗在真實環境中實施。

研究者和機構均從這一合作中獲益(Duflo, Glennerster & Kremer, 2006)。一方面,研究者基於經濟理論幫助其合作者設計可解決實際問題的項目或政策🧑🏿‍🎓,同時也可檢驗理論的現實適用性。另一方面👳🏼‍♂️,政府部門通過與研究者合作,可以推出多個改革實驗措施用於隨機選取的區域或群體,並選出較好的政策加以推廣;非政府組織也希望檢測新項目的效果或評估現有項目的作用🪕👳🏻;私人企業出於更好地理解其商業活動及服務客戶、提高利潤的目的🛸,同樣需要與研究者合作進行隨機實驗。

克雷默及其合作者的創新不僅在於將隨機對照實驗引入發展經濟學,而且還在實地實驗的具體情境中提出了很多方便研究者在現實中實現隨機化的方法。如克雷默等(Duflo, Glennerster & Kremer, 2006)所述🐦‍🔥,經典的臨床實驗中只需將實驗樣本隨機分為實驗組和對照組,其中前者接受某一新的項目幹預。實地實驗也可以沿用這一思想🧛🏿‍♀️🌲,但現實條件常使得隨機分組不易實現。例如🕵🏿‍♀️🍌,存在資源、行政約束或需評估的項目是現存而非新引入的🏮,因此研究者發展出過度訂閱(Oversubscription)✋🏿、隨機引入(Randomized Order of Phase-In)等多種方法。

過度訂閱是指當資源或實施能力有限且對項目的需求超過供應時🤛🏻,在合格的候選人中隨機選擇獲得該計劃的人,這既是一種公平的分配資源的方法,也自然地引入了隨機化。克雷默及其合作者(Angrist, Bettinger, Bloom, King & Kremer, 2002)在哥倫比亞進行的一項學校票券項目便采用此種方法決定票券的分配。另一種方式是將引入項目的順序隨機化,當存在金融或行政限製時,一些項目不得不以階段性引入的方式進行,最公平的方式是隨機決定引入順序,這允許了參與項目和未參與項目的個體或群體同時存在且是隨機選出的,而且這種分期引入的承諾可以促使被隨機選為對照組的個體或群體保持與研究者的合作。因為對未來收益的期望為受試者提供了合作動機,克雷默等(Miguel & Kremer, 2004)進行驅蟲實驗時便分為三個階段,隨機選擇學校並向其提供驅蟲藥治療🙌🏽,以評估驅蟲治療對學生健康和學校出勤率的影響。

總之,克雷默等人將隨機對照實驗引入經濟學研究用來檢驗經濟理論預測的結論,並通過評估不同項目的因果影響提出明確的政策建議。這一實驗方法也發現了許多現有模型未能預測到的機製和事實,並促進實施部門設計出更有效的政策或項目。

二、對發展經濟學扶貧減困工作的貢獻

迪弗洛(Duflo, 2006)在總結實地實驗在發展經濟學中的地位時提到👨‍🦽,最初的發展經濟學常依賴於搜集原始數據來檢驗特定假設或研究某一特定問題🧶👳🏽,因而在很大程度上是由研究的問題決定所需數據🧙🏼‍♂️,而非由數據決定可以做的研究🙅。但20世紀後期出現了眾多高質量、大規模的數據集,如普查數據和不同領域的調查數據💂🏻‍♀️,豐富的數據來源和自然實驗為發展經濟學開拓了廣闊的研究可能性,也促使更為專業的計量方法被引入,發展經濟學采用實證證據的標準被大大提高,而基於原始觀測數據的研究不再像之前容易被接受。

在此背景下,克雷默等(Vermeersch & Kremer, 2005; Kremer, Moulin & Namunyu, 2003)在肯尼亞發起了一系列與教育相關的實地實驗👐🏽,在現實環境中引入隨機對照的思想🙎🏻,通過對比隨機分配至實驗組和對照組的個體來評估幹預影響。這種科學嚴謹的實地實驗既傳承了發展經濟學從調查中搜集原始數據的方法✋🏿,又重塑了原始數據調查的權威性和科學性🦻,使得實地調查的結果得以被學術界認可,延續了發展經濟學先提出問題後尋找相應數據來回答的傳統,再次奠定了實地調查在發展經濟學中的地位。一旦建立了這一方法的可行性,其在不同項目、國家、時期等情境下的多樣性和可實踐性便突顯出來,相對於回溯性計量研究的優勢也得以被承認🖕🏽。

在方法論上𓀄,隨機對照的實地實驗最大的優勢是可以構造任何調查數據或自然實驗均無法觀測的反事實結果,這得益於其靈活的實驗設計和幹預選擇(Duflo, Glennerster & Kremer, 2006)。觀測研究只能評估現實世界中已經存在的事實結果🚿,而實地實驗可以通過實施幹預創造出自然中無法觀測到的事件,從而研究這一幹預的影響。這使得研究者在政策尚未實施時即可檢驗其是否如先驗知識或理論預測的那樣有效,也可以在檢驗理論預測時通過設計不同的幹預引入隨機變化🧭。

在所研究的問題上💁🏼‍♀️,隨機對照實驗在發展經濟學理論與政策適用性之間建立起直接橋梁,將貧困背後的主要機製與對於不同政策幹預的行為反應融合起來探討(Duflo, 2006)。實驗中幹預的設計是由發展經濟理論指導的,收集的觀測數據是基於微觀個體選擇的*️⃣,因此實驗結果可以指明理論所發現的機製及政策方向在現實中的有效力,定量地測算某一因果關系,為理論預測提供更有說服力的實證檢驗。

三🙍🏿‍♀️、檢驗理論和評估政策效果的強有力工具

為控製選擇性偏誤實現反事實推斷,基於非實驗數據發展出了傾向得分匹配、雙重差分法、斷點回歸法等政策評估方法🤰🏼,但克雷默(Duflo & Kremer, 2003)指出這些非實驗方法均有各自的局限性。傾向得分匹配法是根據可觀測的個體特征預測其參與概率🌞🧚🏻‍♂️,以此為依據為受幹預影響的實驗組匹配參與傾向相似的對照組,但這一方法依賴於對受幹預和未受幹預兩個群組自身差異的準確識別,這導致當基於某一難以觀測的特征實施幹預時,估計可能存在偏誤🧖🏻‍♀️。雙重差分法通過比較受政策影響的某一區域和未實行該政策的區域的增長差異來探究該政策的影響👩🏼‍⚖️,但結果的可靠性所依據的假設前提是🔵:若沒有該政策➝,兩地發展趨勢相同🤹🏿。而研究者無法檢驗這一假設🧑🏼‍🍳,另外還要保證同一階段兩地沒有實施其他可能影響結果的政策🦻🏿,以及未受到任何外來持續性沖擊,這在現實中均難以實現(Glewwe, Kremer, Moulin & Zitzewitz, 2004)。斷點回歸所比較的是某一臨界值附近參與項目和未參與項目的個體,認為兩類群體其他特征相似,結果的差異僅來源於是否參與了項目,但這只適用於可產生此類斷點(臨界值)的項目,而在具體實施中斷點常常是不存在的,尤其在政策實施不嚴格的發展中國家🌰。而即便存在斷點,這一方法也很有可能面臨錯誤估計標準誤差的風險(Bertrand, Duflo & Mullainathan, 2004)🧏🏿。

隨機對照實驗則彌補了非實驗的幹預效應研究方法的缺陷👨‍🎤,使得實證分析在更為廣闊的領域和問題上具有可信的結果(Duflo, Glennerster & Kremer, 2006)。實驗中幹預的實施可供研究者設計並操作♠️,隨機化的處理可以控製選擇性偏誤,實驗組和對照組的差異也可以被精準記錄。整個幹預影響及觀測過程均可保證科學透明,研究者可以直接獲得高質量的對比數據,而無需對樣本自身或計量方法做出過高的要求。克雷默等(Glewwe, Kremer, Moulin & Zitzewitz, 2004; Glewwe, Kremer & Moulin, 2009)比較非實驗方法和隨機對照實驗的評估結果發現🧝,兩者會有很大差異🤏🏿,其中非實驗方法更容易面臨選擇性偏誤👩🏻‍🎓、遺漏變量等識別問題🙆🏽‍♂️。隨機對照實驗的引入發展出了一套更為可信的實驗設計過程🙆🏽‍♂️,極大降低了實證中常面臨的選擇性偏誤的風險,使得實驗成為經濟學研究在檢驗理論和評估政策時的一種新的強有力的工具。

另外,克雷默等人創建了一套可迭代的實驗研究過程(the Prize in Economic Sciences, 2019),所謂可迭代即研究者可以在相同環境下使用相同的結果變量和相同的測量技術進行後續研究,可以在已有的實驗基礎上研究引申問題👩🏼‍🚀。實證研究中經常會遇到需要進行後續研究的問題🧖🏿‍♂️,尤其是基於觀測數據的研究通常難以作為其他研究的基礎被進一步推進📿,因為初始政策改變時所產生的數據有限,研究引申問題時需要的數據可能並不在這一觀測集中👴🏿🧚‍♀️,也無法保證其他條件相同來觀測在初始政策基礎上施加新的幹預將產生何種新的影響🈴。而實驗具有可以控製幹預發生的特點,使得研究者可以進行多步驟的序貫實驗(Sequential Experentments),其中每個新的步驟都可以利用較早步驟中的結果👅,克雷默等(Duflo, Kremer & Robinson, 2008, 2011)關於肯尼亞農民化肥使用情況的發現便基於一系列長期序貫的實地實驗🙋🏻‍♂️。

總之⛹🏽‍♂️,克雷默將隨機對照實驗引入經濟學研究👉😭,形成了一種新的實地研究方法🌝,以可信的方法實施大規模的實驗,大大增強了經濟學者研究現實問題的能力🧑🏿‍💼,增加了嚴格而系統地評估政策效果的科學方法。

作者簡介:

張延,意昂3体育官网經濟學院教授,博生生導師📪。主要從事微觀經濟理論與實踐🧑🏿‍🌾、宏觀經濟理論、政策與實踐等方面的研究。在國內外核心學術刊物上,獨立發表學術論文30多篇🙎🏿‍♂️,並出版學術專、譯著十余部。留校至今獲教學科研獎多項⏪,承擔多項國家社科基金項目和省部級課題。

王琪,意昂3体育官网經濟學院2016級西方經濟學博士研究生,主要研究方向為收入分配💆🏻‍♀️、公平認知和行為經濟。

專題鏈接🧖🏽🤰🏿:聚焦兩會2020

轉載本網文章請註明出處

意昂3体育专业提供:意昂3体育意昂3体育平台意昂3体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流🏮,意昂3体育欢迎您。 意昂3体育官網xml地圖