面板資料分析方法步驟全解

Question

面板資料分析方法步驟全解

其他

面板資料分析方法步驟全解

步驟一：分析資料的平穩性(單位根檢驗)

按照正規程式，面板資料模型在迴歸前需檢驗資料的平穩性。李子奈曾指出，一些非平穩的經濟時間序列往往表現出共同的變化趨勢，而這些序列間本身不一定有直接的關聯，此時，對這些資料進行迴歸，儘管有較高的R平方，但其結果是沒有任何實際意義的。這種情況稱為稱為虛假迴歸或偽迴歸(spurious regression)。他認為平穩的真正含義是：一個時間序列剔除了不變的均值(可視為截距)和時間趨勢以後，剩餘的序列為零均值，同方差，即白噪聲。因此單位根檢驗時有三種檢驗模式：既有趨勢又有截距、只有截距、以上都無。

因此為了避免偽迴歸，確保估計結果的有效性，我們必須對各面板序列的平穩性進行檢驗。而檢驗資料平穩性最常用的辦法就是單位根檢驗。首先，我們可以先對面板序列繪製時序圖，以粗略觀測時序圖中由各個觀測值描出代表變數的折線是否含有趨勢項和(或)截距項，從而為進一步的單位根檢驗的檢驗模式做準備。

單位根檢驗方法的文獻綜述：在非平穩的面板資料漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分佈是高斯分佈,這些結果也被應用在有異方差的面板資料中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。Levin et al. (2002) 指出,該方法允許不同截距和時間趨勢,異方差和高階序列相關,適合於中等維度(時間序列介於25～250 之間,截面數介於10～250 之間) 的面板單位根檢驗。Im et al. (1997) 還提出了檢驗面板單位根的IPS 法,但Breitung(2000) 發現IPS 法對限定性趨勢的設定極為敏感,並提出了面板單位根檢驗的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板單位根檢驗方法。

由上述綜述可知，可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5種方法進行面板單位根檢驗。

其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分別指Levin, Lin & Chu t* 統計量、Breitung t 統計量、lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量、Hadri Z統計量，並且Levin, Lin & Chu t* 統計量、Breitung t統計量的原假設為存在普通的單位根過程，lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量的原假設為存在有效的`單位根過程， Hadri Z統計量的檢驗原假設為不存在普通的單位根過程。

有時，為了方便，只採用兩種面板資料單位根檢驗方法，即相同根單位根檢驗LLC(Levin-Lin-Chu)檢驗和不同根單位根檢驗Fisher-ADF檢驗(注：對普通序列(非面板序列)的單位根檢驗方法則常用ADF檢驗)，如果在兩種檢驗中均拒絕存在單位根的原假設則我們說此序列是平穩的，反之則不平穩。

如果我們以T(trend)代表序列含趨勢項，以I(intercept)代表序列含截距項，T&I代表兩項都含，N(none)代表兩項都不含，那麼我們可以基於前面時序圖得出的結論，在單位根檢驗中選擇相應檢驗模式。

但基於時序圖得出的結論畢竟是粗略的，嚴格來說，那些檢驗結構均需一一檢驗。具體操作可以參照李子奈的說法：ADF檢驗是透過三個模型來完成，首先從含有截距和趨勢項的模型開始，再檢驗只含截距項的模型，最後檢驗二者都不含的模型。並且認為，只有三個模型的檢驗結果都不能拒絕原假設時，我們才認為時間序列是非平穩的，而只要其中有一個模型的檢驗結果拒絕了零假設，就可認為時間序列是平穩的。

此外，單位根檢驗一般是先從水平(level)序列開始檢驗起，如果存在單位根，則對該序列進行一階差分後繼續檢驗，若仍存在單位根，則進行二階甚至高階差分後檢驗，直至序列平穩為止。我們記I(0)為零階單整，I(1)為一階單整，依次類推，I(N)為N階單整。

步驟二：協整檢驗或模型修正

情況一：如果基於單位根檢驗的結果發現變數之間是同階單整的，那麼我們可以進行協整檢驗。協整檢驗是考察變數間長期均衡關係的方法。所謂的協整是指若兩個或多個非平穩的變數序列，其某個線性組合後的序列呈平穩性。此時我們稱這些變數序列間有協整關係存在。因此協整的要求或前提是同階單整。

但也有如下的寬限說法：如果變數個數多於兩個，即解釋變數個數多於一個，被解釋變數的單整階數不能高於任何一個解釋變數的單整階數。另當解釋變數的單整階數高於被解釋變數的單整階數時，則必須至少有兩個解釋變數的單整階數高於被解釋變數的單整階數。如果只含有兩個解釋變數，則兩個變數的單整階數應該相同。

也就是說，單整階數不同的兩個或以上的非平穩序列如果一起進行協整檢驗，必然有某些低階單整的，即波動相對高階序列的波動甚微弱(有可能波動幅度也不同)的序列，對協整結果的影響不大，因此包不包含的重要性不大。而相對處於最高階序列，由於其波動較大，對迴歸殘差的平穩性帶來極大的影響，所以如果協整是包含有某些高階單整序列的話(但如果所有變數都是階數相同的高階，此時也被稱作同階單整，這樣的話另當別論)，一定不能將其納入協整檢驗。

協整檢驗方法的文獻綜述：(1)Kao(1999)、Kao and Chiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協整的方法,這種方法零假設是沒有協整關係,並且利用靜態面板迴歸的殘差來構建統計量。(2)Pedron(1999)在零假設是在動態多元面板迴歸中沒有協整關係的條件下給出了七種基於殘差的面板協整檢驗方法。和Kao的方法不同的是,Pedroni的檢驗方法允許異質面板的存在。(3)Larsson et al(2001)發展了基於Johansen(1995)向量自迴歸的似然檢驗的面板協整檢驗方法，這種檢驗的方法是檢驗變數存在共同的協整的秩。

我們主要採用的是Pedroni、Kao、Johansen的方法。

通過了協整檢驗，說明變數之間存在著長期穩定的均衡關係，其方程迴歸殘差是平穩的。因此可以在此基礎上直接對原方程進行迴歸，此時的迴歸結果是較精確的。

這時，我們或許還想進一步對面板資料做格蘭傑因果檢驗(因果檢驗的前提是變數協整)。但如果變數之間不是協整(即非同階單整)的話，是不能進行格蘭傑因果檢驗的，不過此時可以先對資料進行處理。引用張曉峒的原話，“如果y和x不同階，不能做格蘭傑因果檢驗，但可透過差分序列或其他處理得到同階單整序列，並且要看它們此時有無經濟意義。”

下面簡要介紹一下因果檢驗的含義：這裡的因果關係是從統計角度而言的，即是透過機率或者分佈函式的角度體現出來的：在所有其它事件的發生情況固定不變的條件下，如果一個事件X的發生與不發生對於另一個事件Y的發生的機率(如果透過事件定義了隨機變數那麼也可以說分佈函式)有影響，並且這兩個事件在時間上又有先後順序(A前B後)，那麼我們便可以說X是Y的原因。考慮最簡單的形式，Granger檢驗是運用F-統計量來檢驗X的滯後值是否顯著影響Y(在統計的意義下，且已經綜合考慮了Y的滯後值;如果影響不顯著，那麼稱X不是Y的“Granger原因”(Granger cause);如果影響顯著，那麼稱X是Y的“Granger原因”。同樣，這也可以用於檢驗Y是X的“原因”，檢驗Y的滯後值是否影響X(已經考慮了X的滯後對X自身的影響)。

Eviews好像沒有在POOL視窗中提供Granger causality test，而只有unit root test和cointegration test。說明Eviews是無法對面板資料序列做格蘭傑檢驗的，格蘭傑檢驗只能針對序列組做。也就是說格蘭傑因果檢驗在Eviews中是針對普通的序列對(pairwise)而言的。你如果想對面板資料中的某些合成序列做因果檢驗的話，不妨先匯出相關序列到一個組中(POOL視窗中的Proc/Make Group)，再來試試。

情況二：如果如果基於單位根檢驗的結果發現變數之間是非同階單整的，即面板資料中有些序列平穩而有些序列不平穩，此時不能進行協整檢驗與直接對原序列進行迴歸。但此時也不要著急，我們可以在保持變數經濟意義的前提下，對我們前面提出的模型進行修正，以消除資料不平穩對迴歸造成的不利影響。如差分某些序列，將基於時間頻度的絕對資料變成時間頻度下的變動資料或增長率資料。此時的研究轉向新的模型，但要保證模型具有經濟意義。因此一般不要對原序列進行二階差分，因為對變動資料或增長率資料再進行差分，我們不好對其冠以經濟解釋。難道你稱其為變動率的變動率?

步驟三：面板模型的選擇與迴歸

面板資料模型的選擇通常有三種形式：

Model)。如果從時間上看，不同個體之間不存在顯著性差異;從截面上看，不同截面之間也不存在顯著性差異，那麼就可以直接把面板資料混合在一起用普通最小二乘法(OLS)估計引數。一種是固定效應模型(Fixed Effects Regression Model)。如果對於不同的截面或不同的時間序列，模型的截距不同，則可以採用在模型中新增虛擬變數的方法估計迴歸引數。一種是隨機效應模型(Random Effects Regression Model)。如果固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應，並且這兩個隨機誤差項都服從正態分佈，則固定效應模型就變成了隨機效應模型。

在面板資料模型形式的選擇方法上，我們經常採用F檢驗決定選用混合模型還是固定效應模型，然後用Hausman檢驗確定應該建立隨機效應模型還是固定效應模型。

檢驗完畢後，我們也就知道該選用哪種模型了，然後我們就開始迴歸：

在迴歸的時候，權數可以選擇按截面加權(cross-section weights)的方式，對於橫截面個數大於時序個數的情況更應如此，表示允許不同的截面存在異方差現象。估計方法採用PCSE(Panel Corrected Standard Errors，面板校正標準誤)方法。Beck和Katz(1995)引入的PCSE估計方法是面板資料模型估計方法的一個創新，可以有效的處理複雜的面板誤差結構，如同步相關，異方差，序列相關等，在樣本量不夠大時尤為有用。

Answer 1

相關內容