CFA二級量化方法重點分析:線性回歸假設(shè)的違反,識別與處理——高頓財經(jīng)CFA講師  Quine老師給大家講解:
  線性回歸分析的有效性依賴于若干假設(shè),這些假設(shè)包括:
  1)因變量與自變量間存在著線性關(guān)系;
  2)自變量不是隨機變量,且不存在精確的(完全的)線性關(guān)系;
  3)給定自變量,誤差項的條件期望為零;
  4)誤差項的方差應(yīng)為常數(shù);
  5)誤差項之間應(yīng)相互獨立;
  6)誤差項是正態(tài)分布的。
  以上六個假設(shè)如果有一個或多個被違反,則線性回歸分析的結(jié)果會有問題,最常見的三個問題是異方差性、序列相關(guān)與多重共線性。針對以上三個問題,我們需要明確:1)問題的含義是什么?2)它對回歸分析的影響;3)如何識別這些問題?4)如何處理這些問題?下面我們做一個系統(tǒng)的總結(jié)。
高頓CFA
  一、異方差性(heteroskedasticity)
  含義:誤差項的方差不為常數(shù),而是隨著觀察值的變化而變化,可以分為無條件異方差(unconditional heteroskedasticity)與條件異方差(conditional heteroskedasticity)。無條件異方差指誤差項的方差雖然隨觀察值的變化而變化,但是沒有固定的規(guī)律,這雖然違反了線性回歸的假設(shè),但對回歸分析結(jié)果不會有太大的影響。條件異方差則不同,誤差項的方差會隨著觀察值的增大而增大或減小,從而對回歸分析的結(jié)果會產(chǎn)生較大的影響。
  影響:1)回歸系數(shù)的標(biāo)準(zhǔn)誤不能有效的估計;2)回歸系數(shù)的估計不受影響;3)回歸系數(shù)的T檢驗的結(jié)果會受影響,如果標(biāo)準(zhǔn)誤被過大估計,則T統(tǒng)計量會過小,則容易導(dǎo)致錯誤地?zé)o法拒絕原假設(shè);如果標(biāo)準(zhǔn)誤被過小估計,則T統(tǒng)計量會過大,則容易導(dǎo)致錯誤地拒絕原假設(shè);4)F檢驗的結(jié)果也是不可靠的。
  識別:1)在一元回歸中,可以觀察值為橫軸,殘差為縱軸做散點圖進行觀察,如果發(fā)現(xiàn)殘差隨著觀察值的增大或減少有顯著變化,則可能存在異方差;2)更常用的識別方法為Breusch-Pagan檢驗。
  處理:1)使用穩(wěn)健標(biāo)準(zhǔn)誤(robust standard error)重新計算T統(tǒng)計量,根據(jù)新的統(tǒng)計值判斷是否拒絕還是無法拒絕原假設(shè);2)使用廣義最小二乘回歸。
  下面cfa三級學(xué)長整理了一份很完整cfa備考精華資料,在CFA考試前,一份CFA好資料+更早的準(zhǔn)備cfa考試,能夠大大提升通過率》》點擊這里免費領(lǐng)取
 
高頓CFA學(xué)習(xí)資料
  二、序列相關(guān)(serial correlation)
  含義:序列相關(guān)也稱自相關(guān),是指誤差項之間不是完全相互獨立的,而是存在相關(guān)性。序列相關(guān)分為兩種,一種得正序列相關(guān),一種是負(fù)序列相關(guān)。正序列相關(guān)中,正的誤差項之后有較大概率仍是一個正的誤差項,在負(fù)序列相關(guān)中,正的誤差項之后有較大概率是一個負(fù)的誤差項。
  影響:正的序列相關(guān)使得殘差項傾向于集聚,從而使得系數(shù)的標(biāo)準(zhǔn)誤縮小,從而夸大了 T統(tǒng)計量,使得第一類錯誤的可能性上升,即在原假設(shè)成立時錯誤的拒絕它,這會使得我們錯誤的把不顯著的結(jié)果當(dāng)成顯著的。但系數(shù)本身的估計仍是可靠的。
  識別:1)在一元回歸中與識別異方差的方法類似,可以觀察值為橫軸,殘差為縱軸做散點圖進行觀察;2)DW 檢驗:如果 DW 統(tǒng)計量小于下臨界值,則拒絕原假設(shè),殘差正序列相關(guān)。如果,則無法得出結(jié)論。如果DW統(tǒng)計量大于上臨界值,則無法拒絕原假設(shè)。
  處理:1)使用 Hansen-white標(biāo)準(zhǔn)誤,對原來的標(biāo)準(zhǔn)誤進行調(diào)整;2)進一步修正模型,將數(shù)據(jù)的時間序列性質(zhì)納入到模型中。
 
高頓CFA
  三、多重共線性(multicollinearity)
  含義:兩個或更多的自變量,或者自變量的線性組合高度相關(guān)。
  影響:1)對系數(shù)的估計不可靠;2)過高的估計系數(shù)的標(biāo)準(zhǔn)誤,從而導(dǎo)致低估T統(tǒng)計量,從而錯誤地?zé)o法拒絕原假設(shè),從而錯誤的得出結(jié)論認(rèn)為系數(shù)統(tǒng)計上不顯著。
  識別:1) 如果模型的F檢驗與都表明模型顯著,但T檢驗表明各個變量不顯著,則很可能存在多重共線性;2) 如果只有兩個自變量,它們的相關(guān)系數(shù)大于0.7,則很可能存在多重共線性,注意這條經(jīng)驗規(guī)律只在只有兩個自變量的情況下成立。
  處理:1)試著去掉一兩個變量;2)使用逐步回歸法(stepwise regression),逐漸減小多重共線性。
  以下表格對比分析了三種違反線性回歸假設(shè)情況的含義、影響、識別與處理方法:
 
CFACFA
  文章來源:高頓,更多CFA資訊【請關(guān)注微信號:gaoduncfa】禁止轉(zhuǎn)載,盜版者將追究法律責(zé)任!
  相關(guān)CFA內(nèi)容推薦閱讀