模型方法介紹
10.1.1 面板回歸模型
面板數(shù)據(jù)(Panel Data)也稱時(shí)間序列截面數(shù)據(jù)或混合數(shù)據(jù)(Pooled Data),是指在時(shí)間序列上取多個(gè)截面,在這些截面上同時(shí)選取樣本觀測(cè)值所構(gòu)成的樣本數(shù)據(jù)?;诿姘鍞?shù)據(jù)的回歸模型稱為面板數(shù)據(jù)模型。面板數(shù)據(jù)模型可以分為單方程面板數(shù)據(jù)模型和聯(lián)立方程面板數(shù)據(jù)模型;也可以分為線性面板數(shù)據(jù)模型和非線性面板數(shù)據(jù)模型。
分析面板數(shù)據(jù)的基本框架是形如式(10-1)的回歸模型:
其中,xit中有k個(gè)解釋變量,不包括常數(shù)項(xiàng);異質(zhì)性或個(gè)體影響由表示,包含一個(gè)常數(shù)項(xiàng)和一組體現(xiàn)橫截面?zhèn)€體影響但不隨時(shí)間變化的變量;μit為隨機(jī)項(xiàng)。
利用面板數(shù)據(jù)模型可以解決樣本容量不足的問(wèn)題,有助于正確地分析經(jīng)濟(jì)變量之間的關(guān)系,可以估計(jì)某些難以度量的因素對(duì)被解釋變量的影響。
1)混合模型
混合模型假設(shè)常數(shù)項(xiàng)和斜率不隨時(shí)間和個(gè)體而變化,模型設(shè)定形式如下:
混合模型假設(shè)所有橫截面?zhèn)€體在各個(gè)不同時(shí)期的斜率和截距不變,這樣就可以直接把面板數(shù)據(jù)混合在一起,用OLS估計(jì)參數(shù),得到一致和有效的估計(jì)結(jié)果。由于混合回歸模型假設(shè)解釋變量對(duì)被解釋變量的影響與橫截面?zhèn)€體及時(shí)間無(wú)關(guān),這在實(shí)際數(shù)據(jù)樣本中很難成立,故該模型使用較少。
2)固定效應(yīng)模型
如果zi不可觀測(cè),但與xit相關(guān),由于遺漏了相關(guān)變量,β的OLS估計(jì)量是有偏和不一致的。在這種情況下,式(10-3)包含了所有可觀測(cè)的影響,并且設(shè)定了一個(gè)可估計(jì)的條件均值,這就是固定效應(yīng)模型。
其中固定效應(yīng)模型將αi視為回歸模型中每一個(gè)體各自不同的常數(shù)項(xiàng)。從模型的設(shè)定可知,固定效應(yīng)模型假設(shè)允許不同的橫截面?zhèn)€體截距不同,但每一個(gè)體的截距在各個(gè)不同時(shí)期則保持不變。
如果對(duì)不同橫截面?zhèn)€體的差異感興趣,可以用F檢驗(yàn)來(lái)檢驗(yàn)每個(gè)橫截面?zhèn)€體的常數(shù)項(xiàng)是否都相等,即假設(shè)α1=α2=…=αn,檢驗(yàn)的F統(tǒng)計(jì)量為:
R2R為受約束模型(即混合模型)的決定系數(shù);RSSR受約束模型的殘差平方和,RSS為最小二乘虛擬變量模型的殘差平方和。在給定的顯著性水平下,如果拒絕了原假設(shè),則將模型設(shè)定為固定效應(yīng)模型;如果接受原假設(shè),則模型設(shè)定為混合模型。
固定效應(yīng)模型可分為三類:①不變系數(shù)模型在橫截面上無(wú)個(gè)體影響、無(wú)結(jié)構(gòu)變化,可將模型簡(jiǎn)單地視為橫截面數(shù)據(jù)堆積的模型,只要隨機(jī)擾動(dòng)項(xiàng)服從經(jīng)典基本假設(shè)條件,就可以采用OLS法進(jìn)行估計(jì),該模型也稱為混合模型。②變截距模型在橫截面上存在個(gè)體影響,不存在結(jié)構(gòu)性變化,即解釋變量的結(jié)構(gòu)參數(shù)在不同橫截面上是相同的,不同的只是截距項(xiàng),個(gè)體影響可以用截距項(xiàng)的差別來(lái)說(shuō)明,故通常把它稱為變截距模型。③變系數(shù)模型在橫截面上存在個(gè)體影響,又存在結(jié)構(gòu)變化,即在允許個(gè)體影響由變化的截距項(xiàng)來(lái)說(shuō)明的同時(shí),還允許系數(shù)隨個(gè)體成員的不同而變化,用以說(shuō)明個(gè)體成員之間的結(jié)構(gòu)變化,故通常稱為變系數(shù)模型。
3)隨機(jī)效應(yīng)模型
如果未觀測(cè)到的個(gè)體異質(zhì)性可以被假定與包括在模型中的變量無(wú)關(guān),則模型可設(shè)定為:
式(10-5)稱為隨機(jī)效應(yīng)模型,εi是一個(gè)反映橫截面?zhèn)€體影響的隨機(jī)元素。這是一個(gè)帶復(fù)合擾動(dòng)項(xiàng)的線性回歸模型,可用OLS法估計(jì),得到一致但非有效的估計(jì)量,需采用廣義最小二乘法(GLS)進(jìn)行估計(jì)。
固定效應(yīng)模型和隨機(jī)效應(yīng)模型的關(guān)鍵區(qū)別是未觀測(cè)到的個(gè)體影響是否包含與模型中解釋變量相關(guān)的元素,而不在于這些影響是否隨機(jī)。固定效應(yīng)模型允許未觀測(cè)到的個(gè)體影響與解釋變量相關(guān)。如果個(gè)體影響與解釋變量嚴(yán)格不相關(guān),那么在模型中將個(gè)體的常數(shù)項(xiàng)設(shè)定為跨橫截面單元隨機(jī)分布,是比較恰當(dāng)?shù)?。如果橫截面?zhèn)€體是隨機(jī)地被選擇出來(lái)以代表一個(gè)較大的總體,則采用隨機(jī)效應(yīng)模型比較合適。隨機(jī)效應(yīng)模型與固定效應(yīng)模型一樣,通過(guò)允許截距變動(dòng)來(lái)處理橫截面?zhèn)€體之間的差異,但截距變動(dòng)的量是隨機(jī)的。采用隨機(jī)效應(yīng)模型的好處是它大大減少了要估計(jì)的參數(shù),但是,如果關(guān)于隨機(jī)常數(shù)項(xiàng)的假設(shè)不恰當(dāng)?shù)脑?,得到的估?jì)值可能不一致。
4)豪斯曼檢驗(yàn)
豪斯曼檢驗(yàn)(Hausman Test)的思路是,在隨機(jī)效應(yīng)模型中,如果E{xitεi}≠0,即隨機(jī)效應(yīng)與解釋變量之間沒(méi)有正交性,則GLS估計(jì)量是有偏和非一致的。但正交性并不影響固定效應(yīng)模型的組內(nèi)估計(jì)量的性質(zhì)。于是,通過(guò)檢驗(yàn)?zāi)P驼`差項(xiàng)與解釋變量的正交性就可解決面板數(shù)據(jù)模型的設(shè)定問(wèn)題,如果模型誤差項(xiàng)與解釋變量之間是正交的,即GLS估計(jì)量是無(wú)偏的,則應(yīng)將模型設(shè)為隨機(jī)效應(yīng)模型,否則設(shè)為固定效應(yīng)模型。其原假設(shè)與備擇假設(shè)分別為:
H0:εi與Xit不相關(guān)
H1:εi與Xit相關(guān)
檢驗(yàn)統(tǒng)計(jì)量為:
其中,
k為解釋變量的個(gè)數(shù),如果拒絕原假設(shè)H0時(shí),模型設(shè)定為固定效應(yīng)模型,否則,模型應(yīng)設(shè)定為隨機(jī)效應(yīng)模型。
10.1.2 雙重差分模型
1)雙重差分法
雙重差分法的理論框架建立在“自然實(shí)驗(yàn)(Natural Experiment)”基礎(chǔ)上,沒(méi)有自然實(shí)驗(yàn),所謂的“雙重差分法”研究只能稱作針對(duì)兩個(gè)虛擬變量交叉相乘項(xiàng)的實(shí)證研究。要進(jìn)行自然實(shí)驗(yàn),首先要進(jìn)行隨機(jī)或近似于隨機(jī)的樣本分組。第一組是進(jìn)行了“實(shí)驗(yàn)處理”的處理組(Treated Group),第二組是不實(shí)施實(shí)驗(yàn)變項(xiàng)的控制組(Control Group)。在政策效果評(píng)估的研究中,實(shí)驗(yàn)處理或?qū)嶒?yàn)變項(xiàng)即指政策實(shí)施,受到新政策影響的樣本即為處理組,否則為控制組。假設(shè)樣本的分組虛擬變量為treated,處理組treated=1,表明該組樣本受到了政策沖擊;控制組treated=0,表明該組樣本沒(méi)有受到政策沖擊。假設(shè)時(shí)間虛擬變量為post,實(shí)驗(yàn)處理前post=0;實(shí)驗(yàn)處理后post=1,表明政策沖擊已發(fā)生。時(shí)間虛擬變量post與分組虛擬變量treated乘積即為雙重差分估計(jì)量post*treated (Difference-in-Difference Estimator),是實(shí)驗(yàn)處理(政策實(shí)施)對(duì)實(shí)驗(yàn)因變項(xiàng)(被解釋變量)的影響是否顯著的判別依據(jù)。雙重差分計(jì)量模型一般可表達(dá)為
yi,t=β0+β1posti+β2treatedi+β3postt*treatedi+λXi,t+εi,t (107)
其中,yi,t為第i個(gè)個(gè)體的被解釋變量,Xi,t為考察個(gè)體差異的控制變量,εi,t為隨機(jī)擾動(dòng)項(xiàng),β0、β1、β2、β3和λ是回歸系數(shù)。β3是研究者關(guān)注的政策效應(yīng)。
2)傾向得分匹配法
傾向得分匹配(Propensity Score Matching,簡(jiǎn)稱PSM)使用非實(shí)驗(yàn)數(shù)據(jù)或觀測(cè)數(shù)據(jù)進(jìn)行干預(yù)效應(yīng)分析,是非隨機(jī)化研究中控制偏倚的一種新的統(tǒng)計(jì)方法。具有研究步驟標(biāo)準(zhǔn)化程度高、易于理解等優(yōu)點(diǎn),近年來(lái)備受研究者的關(guān)注,被廣泛應(yīng)用于各領(lǐng)域的非隨機(jī)化研究中。隨機(jī)實(shí)驗(yàn)?zāi)鼙WC處理組和控制組之間的數(shù)據(jù)平衡。而對(duì)于非隨機(jī)實(shí)驗(yàn),往往由于缺乏隨機(jī)性,而導(dǎo)致處理組和控制組不僅僅在干預(yù)統(tǒng)計(jì)量上存在不同,還在第三方變量X上存在區(qū)別。這時(shí),我們必須要考慮到這些區(qū)別以防止出現(xiàn)潛在偏倚。這時(shí)就要采用匹配的方式進(jìn)行干預(yù)效應(yīng)分析。匹配的目的在于確保干預(yù)效應(yīng)估計(jì)是建立在可比個(gè)體之間的不同結(jié)果的基礎(chǔ)上。最簡(jiǎn)單的匹配方式是將處理組和控制組中第三方變量X的值相同的兩個(gè)個(gè)體進(jìn)行配對(duì)分析。但是,如果X并不是某一個(gè)變量,而是一組變量時(shí),最終簡(jiǎn)單的匹配方式也就不再適用,而是采用傾向得分匹配方式進(jìn)行匹配。
傾向得分的概念最早由Rosenbaum和Rubin(1983)提出,定義為個(gè)體在其特定的屬性下接受某種干預(yù)的可能性。傾向得分匹配法制造了一個(gè)“準(zhǔn)隨機(jī)”試驗(yàn),在試驗(yàn)中,只需有兩個(gè)傾向得分相同的試驗(yàn)對(duì)象,其中一個(gè)在處理組,而另一個(gè)在控制組,可以認(rèn)為處理可能性相同的兩個(gè)試驗(yàn)對(duì)象被隨機(jī)地分到了處理組與控制組。傾向得分是所有協(xié)變量的一個(gè)函數(shù)。傾向得分匹配法可以將多個(gè)協(xié)變量共同作用的結(jié)果表示出來(lái),即將多個(gè)協(xié)變量變成一個(gè)變量,實(shí)質(zhì)就是“降維”,通過(guò)調(diào)整處理組和控制組之間的協(xié)變量均衡性來(lái)控制選擇性偏倚。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。