
stata筆記常用
Stata: 輸出regression table到word和excel
1. 安裝estout。最簡單的方式是在stata的指令輸入:
ssc install estout, replace
EST安裝的指導網址是:
2.跑你的regression
3.寫下這行指令esttab using ,然后就會出現個漂亮的表
格給你(WORD文檔)。只要再小幅修改,就可以直接用了。這個檔
案會存在my documentstata下。如果你用打開的是一個stata do
file,結果會保存到do文件所在文件夾中。如果要得到excel文件,
就把后綴改為.xls或者.csv就可以了
4.跑多個其實也不難,只要每跑完一個regression,你把它取個
名字存起來:est store m1。m1是你要改的,第一個model所以我
叫m1,第二個的話指令就變成est store m2,依次類推。
5.運行指令:esttab m1 m2 ... using 就行了。
異方差的檢驗:
Breusch-Pagan test in STATA:
其基本命令是:estat hettest var1 var2 var3
其中,var1 var2 var3 分別為你認為導致異方差性的幾個自變量。
是你自己設定的一個
滯后項數量。
同樣,如果輸出的P-Value 顯著小于0.05,則拒絕原假設,即不
存在異方差性。
White檢驗:
其基本命令是在完成基本的OLS 回歸之后,輸入
imtest, white
如果輸出的P-Value 顯著小于0.05,則拒絕原假設,即不存在異
方差性
處理異方差性問題的方法:
方法一:WLS
WLS是GLS(一般最小二乘法)的一種,也可以說在異方差情形
下的GLS就是WLS。在WLS下,我們設定擾動項的條件方差是某個
解釋變量子集的函數。之所以被稱為加權最小二乘法,是因為這個估
計最小化的是殘差的加權平方和,而上述函數的倒數恰為其權重。
在stata中實現WLS的方法如下:
reg (被解釋變量) (解釋變量1) (解釋變量2)……
[aweight=變量名]
其中,aweight后面的變量就是權重,是我們設定的函數。
一種經常的設定是假設擾動項的條件方差是所有解釋變量的某個
線性組合的指數函數。在stata中也可以方便地實現:
首先做標準的OLS回歸,并得到殘差項;
reg (被解釋變量) (解釋變量1) (解釋變量2)……
predict r, resid
生成新變量logusq,并用它對所有解釋變量做回歸,得到這個回
歸的擬合值,再對這個擬合值求指數函數;
gen logusq=ln(r^2)
reg logusq (解釋變量1) (解釋變量2)……
predict g, xb
gen h=exp(g)
最后以h作為權重做WLS回歸;
reg (被解釋變量) (解釋變量1) (解釋變量2)……
[aweight=h]
如果我們確切地知道擾動項的協方差矩陣的形式,那么GLS估計
是最小方差線性無偏估計,是所有線性估計中最好的。顯然它比OLS
更有效率。雖然GLS有很多好處,但有一個致命弱點:就是一般而言
我們不知道擾動項的協方差矩陣,因而無法保證結果的有效性。
方法二:HC SE
There are 3 kinds of HC SE
(1)Huber-White Robust Standard Errors HC1, 其基本命令
是:
reg var1 var2 var3, robust
White(1980)證明了這種方法得到的標準誤是漸進可用
(asymptotically valid)的。這種方法的優點是簡單,而且需要的信
息少,在各種情況下都通用。缺點是損失了一些效率。這種方法在我
們日常的實證研究中是最經常使用。
(2)MacKinnon-White SE HC2,其基本命令是:
reg var1 var2 var3, hc2
(3)Long-Ervin SE HC3,其基本命令是:
reg var1 var2 var3, hc3
約束條件檢驗:
如果需要檢驗兩個變量,比如x 與y,之間系
數之間的關系,以檢驗兩者系數相等為例,我們可以直接輸入命
令:
test x=y
再如檢驗兩者系數之和等于1,我們可以直接輸入命令:
test x+y=1
如果輸出結果對應的P-Value 小于0.05,則說明原假設顯著不成
立,即拒絕原假設。
序列相關性問題的檢驗與處理
序列相關性問題的檢驗:
首先,要保證所用的數據必須為時間序列數據。如果原數據不是
時間序列數據,
則需要進行必要的處理,最常用的方法就是:
gen n=_n
tst n
這兩個命令的意思是,首先要生成一個時間序列的標志變量n(或
者t 也可以);
然后通過tst 命令將這個數據集定義為依據時間序列標志變量n
定義的時間序
列數據。
最直觀的檢驗方式是通過觀察殘差分布,其基本步驟是在跑完回
歸之后,直接輸
入
Predict error, stdp
這樣就得到了殘差值;然后輸入命令:
plot error n
會得到一個error 隨n 變化的一個散點圖。
D-W檢驗——對一階自相關問題的檢驗:
D-W檢驗是對一階自相關問題的常用檢驗方法,但是如果實際問
題中存在高階
序列相關性問題,則不能用這個檢驗方法。
D-W 檢驗的命令如下:
首先,輸入回歸命令,
reg Variable1 Variable2 Variable3…VariableM
輸出一個簡單的OLS估計結果。然后,再輸入命令:
dwstat
這時會輸出一個DW 統計量。通過與臨界值之間的比較,可以得
出結論。也可
以執行如下命令
estat durbinalt
直接進行Durbin檢驗。
Breusch-GodfreyTest in STATA——檢驗高階序列相關性:
在得到一個基本回歸結果和error 之后,我們假設這樣一個關
系:
et = α0 + α1 et-1 + α2 et-2 …+ αk et-p + β1 x1t + β2 x2t …
+βk xkt +εt
BG 檢驗的原假設是:H0 : α1 = α2 = … αp =0。
其基本命令是:
bgodfrey , lags(p)
其中p 是你自己設定的一個滯后項數量。如果輸出的p-value 顯
著小于0.05,則
可以拒絕原假設,這就意味著模型存在p 階序列相關性;如果輸
出的p-value 顯
著大于0.05 甚至很大,則可以接受原假設,即不存在p 階序列
相關性。
處理序列相關性問題的方法——GLS:
常用的幾種GLS 方法:
(1) Cochrane-Orcutt estimator 和Prais-Winsten estimator
其基本命令是
prais var1 var2 var3, corc
(2) Newey-West standard errors
其基本命令是
newey var1 var2 var3, lag(3)
其中,lag(3)意思是對三階序列相關性問題進行處理;如果需
要對p 階序列相
關性問題進行處理,則為lag(p)
t因變量,g,f,c是自變量,_26存放了弟26個觀測值,為需要預
測的值
reg t g f c if _n!=26
點預測
predict taxpredict if _n==26
均值的區間預測
predictnl py=predict(xb),ci(lb ub) l(95)
因變量的區間預測
adjust g=117251.9 f=24649.95 c=99.9,stdf ci level(95)
Hausman檢驗是檢驗內生性的最常用的方法。它是通過比較一
致估計量與有效估計量的Wald統計量。
命令格式為:
.hausman name-constistent [name-efficent] [,options]
其中,name-cosistent指一致估計的結果, name-efficent 指有
效估計的結果。注意,一致、有效估計量的先后順序不能改變。
Option選項:
constant 計算檢驗統計量將常數也包括在內,默認值為排除常數
allegs 利用所有方程進行檢驗,默認只對第一個方程進行檢驗
skipeqs(eqlist) eqlist只能以方程名稱而不能以方程序號表示
equation(matchlist) 比較設定的方程。
force 即使假設條件不滿足仍進行檢驗
df(#) 默認值為一致估計與有效估計的協方差矩陣的差的估計
sigmamore 協方差矩陣采用有效估計量的協方差矩陣
sigmaless 協方差矩陣采用一致估計量的協方差矩陣
tconsistent(string) 一致估計量的標題
tefficient(string) 有效估計量的標題
工具變量估計
命令格式:
.ivregress esitimator depvar [varlist1] [varlist2=varlist_iv]
[if] [in] [weight][,options]
其中,estimator包括2sls,gmm,liml三種。varlist1為模型中
的外生變量,varlist2為模型中的內生變量,varlist_iv為模型中的工
具變量。
Nonconstant 不包括常數項
Hascons 用戶自己設定常數項
CMM 選項:
wmatrix(wmtype) robust,cluster clustvar,hac kernel,
unadjusted
center 權數矩陣采用中心矩
igmm 采用迭代GMM估計
eps(#) 參數收斂標準。默認值為eps(le-6)
weps(#) 權數矩陣的收斂標準。默認值為w eps(le-6)
Vce(vcetype) unajusted,robust,cluster
clustvar,bootstrap,jackknife,hac kernel
level(#)置信區間
First 輸出第一階段的估計結果
Small 小樣本下的自由度調整
.estat firststage [,all forcenonrobust]
該命令給出第一階段的估計結果以及各種統計量,包括排除外生
變量的相關性檢驗。All選項給出所有的擬合優度統計量。如果模型存
在多個內生變量,則stata給出R2、偏R2、調整的R2 、F統計量;
如果模型存在多個內生變量,則stata給出Shea偏R2和調整的偏R2。
forcenonrobust給出最小特征值統計量及其臨界值,即使采用穩
健估計(這一檢驗的假設條件是誤差項為獨立正態分布)。
estat overid[,lag(#) forceweights forcenonrobust]
該命令給出了過度識別約束檢驗。如果使用2sls估計估計,則
Stata給Sargan’s(1958)和Basman’s(1960)卡方統計量,這也是
Wooldridge’(1995)穩健得分檢驗。如果采用liml估計方法,則
stata給出Anderson and Rubin’s(1950) 卡方統計量以及Basmann
F統計量;如果采用GMM估計,則stata給出hann’s(1982)J統
計量。Lags(#)用于計算得分檢驗的HAC(異方差自相關一致)統計量
的過程中進行去噪時設定滯后階數。如果設定lag(0),則表示不進行去
噪處理。默認選擇為lag(1)。這一選擇僅使用于2sls估計方法和設定
vce(hac)選項情況。
Forceweight 表示即使采用aweights,pweights或iweights也
進行檢驗。Stata僅對于fweights的情況進行檢驗,其他權數所得到
臨界值可能不準確。
Forcenonrobust 指在2sls或LIML估計中即使采用穩健標準差
也進行Sargan and Basmann檢驗(這一檢驗的假設的假設條件是誤
差項為獨立正態分布)。
例子:
log(wage)=a+b*educ+c*exper+d*expersq+u
懷疑模型教育(educ)具有內生性問題,利用父母接受教育的年
數(fatheduc,motheduc)作educ的工具變量估計上述模型。
(1)利用2SLS估計模型
.ivregress 2sls lwage exper expersq (educ=fatheduc
motheduc),first
第一階段回歸結果為:
educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper
(21.34) (5.62) (4.39) (1.12)
- 0.001expersq
(-0.84)
第二階段的估計結果為:
lwagehat=0.05+0.06educ+0.04exper-0.001expersq
(0.12) (1.95) (5.29) (-2.24)
(2)檢驗educ的內生性
.quietly ivreg iwage exper expersq {educ=fatheduc
motheduc}
.est store IV_reg
.quietly regress lwage exper expersq educ
.est store LS_reg
.hausman IV_reg LS_reg
可以得到hausman估計量=2.7,P值=0.44。接受原假設,即
educ是外生的。
(3)進行過度識別的約束檢驗
.estat overid
可得Sargan統計量=0.38,P值=0.54接受原假設。
面板數據估計
首先對面板數據進行聲明:
前面是截面單元,后面是時間標識:
tst company year
tst industry year
產生新的變量:gen newvar=human*lnrd
產生滯后變量Gen fiscal(2)=
產生差分變量Gen fiscal(D)=
描述性統計:
xtdes :對Panel Data截面個數、時間跨度的整體描述
Xtsum:分組內、組間和樣本整體計算各個變量的基本統計量
xttab 采用列表的方式顯示某個變量的分布
Stata中用于估計面板模型的主要命令:xtreg
xtreg depvar [varlist] [if exp] , model_type [level(#) ]
Model type 模型
be Between-effects estimator
fe Fixed-effects estimator
re GLS Random-effects estimator
pa GEE population-averaged estimator
mle Maximum-likelihood Random-effects estimator
主要估計方法:
xtreg: Fixed-, between- and random-effects, and
population-averaged linear models
xtregar:Fixed- and random-effects linear models with an
AR(1) disturbance
xtpc :OLS or Prais-Winsten models with panel-corrected
standard errors
xtrchh :Hildreth-Houck random coefficients models
xtivreg :Instrumental variables and two-stage least squares
for panel-data models
xtabond:Arellano-Bond linear, dynamic panel data
estimator
xttobit :Random-effects tobit models
xtlogit : Fixed-effects, random-effects, population-
averaged logit models
xtprobit :Random-effects and population-averaged probit
models
xtfrontier :Stochastic frontier models for panel-data
xtrc gdp invest culture edu sci health social admin,beta
xtreg命令的應用:
聲明面板數據類型:tst sheng t
描述性統計:xtsum gdp invest sci admin
1.固定效應模型估計:
xtreg gdp invest culture sci health admin techno,fe
固定效應模型中個體效應和隨機干擾項的方差估計值(分別為
sigma u 和sigma e),二者之間的相關關系(rho)
最后一行給出了檢驗固定效應是否顯著的F 統計量和相應的P 值
2.隨機效應模型估計:
xtreg gdp invest culture sci health admin techno,re
檢驗隨機效應模型是否優于混合OLS 模型:
在進行隨機效應回歸之后,使用xttest0
檢驗得到的P 值為0.0000,表明隨機效應模型優于混合OLS 模型
3. 最大似然估計Ml:
xtreg gdp invest culture sci health admin techno,mle
Hausman檢驗
Hausman檢驗究竟選擇固定效應模型還是隨機效應模型:
第一步:估計固定效應模型,存儲結果
xtreg gdp invest culture sci health admin techno,fe
est store fe
第二步:估計隨機效應模型,存儲結果
xtreg gdp invest culture sci health admin techno,re
est store re
第三步:進行hausman檢驗
hausman fe
Hausman檢驗量為:
H=(b-B)′[Var(b)-Var(B)]-1(b-B)~x2(k)
Hausman統計量服從自由度為k的χ2分布。當H大于一定顯
著水平的臨界值時,我們就認為模型中存在固定效應,從而選用固定
效應模型,否則選用隨機效應模型
如果hausman檢驗值為負,說明的模型設定有問題,導致
Hausman 檢驗的基本假設得不到滿足,遺漏變量的問題,或者某些
變量是非平穩等等
可以改用hausman檢驗的其他形式:
hausman fe, sigmaless
對于固定效應模型的異方差檢驗和序列相關檢驗:
Xtrial gdp invest culture sci health admin techno
異方差檢驗:
xtreg gdp invest culture sci health admin techno,fe
xttest3 (Modified Wald statistic for groupwi
heteroskedasticity in fixed effect model)
隨機效應模型的序列相關檢驗:
xtreg gdp invest culture sci health admin techno,re
Xttest1
Xttest1用于檢驗隨機效應(單尾和雙尾) 、一階序列相關以及兩者
的聯合顯著
檢驗結果表明存在隨機效應和序列相關,而且對隨機效應和序列
相關的聯合檢驗也非常顯著
可以使用廣義線性模型xtgls對異方差和序列相關進行修正:
xtgls gdp invest culture sci health admin techno,
panels(hetero),修正異方差
xtgls gdp invest culture sci health admin techno,
panels(correlated),修正依橫截面而變化的異方差
xtgls gdp invest culture sci health admin techno,
panels(hetero) corr(ar1),修正異方差和一階序列相關ar(1)

本文發布于:2023-11-10 00:08:43,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/1699546124211092.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:stata筆記常用.doc
本文 PDF 下載地址:stata筆記常用.pdf
| 留言與評論(共有 0 條評論) |