Stata 是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。它擁有很多功能,包含線性混合模型、均衡重復(fù)反復(fù)及多項(xiàng)式普羅比模式。用Stata繪制的統(tǒng)計(jì)圖形相當(dāng)精美。
新版本的STATA采用最具親和力的窗口接口,使用者自行建立程序時(shí),軟件能提供具有直接命令式的語(yǔ)法。Stata提供完整的使用手冊(cè),包含統(tǒng)計(jì)樣本建立、解釋、模型與語(yǔ)法、文獻(xiàn)等超過一萬(wàn)余頁(yè)的出版品。
除此之外,Stata軟件可以透過網(wǎng)絡(luò)實(shí)時(shí)更新每天的最新功能,更可以得知世界各地的使用者對(duì)于STATA公司提出的問題與解決之道。使用者也可以透過Stata Journal獲得許許多多的相關(guān)訊息以及書籍介紹等。另外一個(gè)獲取龐大資源的管道就是Statalist,它是一個(gè)獨(dú)立的listserver,每月交替提供使用者超過1000個(gè)訊息以及50個(gè)程序。
Stata官方網(wǎng)站。Stata公司提供的Web resources,涵蓋了大量相關(guān)網(wǎng)絡(luò)資源;其FAQ則提供了各種常見問題的解答;Statalist則是一個(gè)類似于人大經(jīng)濟(jì)論壇的免費(fèi)的討論區(qū)。加入Statalist的方法很簡(jiǎn)單,你只需要發(fā)送郵件至Stata-maillist,郵件內(nèi)容無需任何稱謂,只需寫上“subscribe Statalist”的字樣即可。接到確認(rèn)信息后,你便成為一名Statalist的成員了。當(dāng)然,即使不加入,你仍然可以瀏覽,但不能提問。
UCLA(加州大學(xué)洛杉磯分校提供的網(wǎng)絡(luò)教程。該網(wǎng)站提供的Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊都非常出色;其Web Books、Textbook Examples模塊則非常細(xì)致地呈現(xiàn)了幾十本非常流行的統(tǒng)計(jì)和計(jì)量教材的Stata實(shí)例;對(duì)于LaTeX感興趣的朋友,則可以通過Stata Tools for LaTeX模塊獲得諸多有用的信息;在Graph examples模塊中,則列舉了四十余種圖形的繪制方法;最后,在Classes and Seminars模塊中,你可以在線觀看數(shù)十個(gè)Stata教學(xué)視頻。
Stata中文討論專區(qū)。目前,國(guó)內(nèi)已有多個(gè)專門討論Stata應(yīng)用的論壇,包括人大經(jīng)濟(jì)論壇Stata專區(qū),公衛(wèi)人EpiMan等。這些論壇集中了國(guó)內(nèi)外數(shù)十萬(wàn)的Stata用戶,為交流和解決Stata應(yīng)用過程中遇到的各種問題和經(jīng)驗(yàn)提供了很好的平臺(tái)。
自從Hamilton(1990)出版Statistics with Stata后,一系列將計(jì)量理論與軟件操作結(jié)合起來的書籍開始相繼面世,而在此之前,人們似乎都認(rèn)為軟件操作是件非常簡(jiǎn)單的事情。也正因?yàn)槿绱?,很多學(xué)生在修改完了一個(gè)學(xué)年的計(jì)量經(jīng)濟(jì)學(xué)課程后,仍然不知道該如何完成OLS估計(jì)。為此,我列舉的書籍多附有Stata實(shí)例(* 表示我的推薦程度),多數(shù)書中的范例數(shù)據(jù)都可通過Stata官方網(wǎng)站下載。
一份詳細(xì)的書單:UCLA提供了的書單 。
入門教材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波士頓大學(xué)的網(wǎng)站上提供了該書所有章節(jié)的Stata范例,是一套非常好的學(xué)習(xí)資料。
綜合性教材:Cameron and Trivedi(2005)撰寫的Microeconometrics: Methods and applications一書全面介紹了微觀計(jì)量中的基本分析工具,其中不乏最近十年中得到廣泛應(yīng)用的Bootstrap、Monte Carlo模擬,以及非參數(shù)估計(jì)法。二人于2009年出版的另一力作(Cameron and Trivedi(2009)*)是這本書的姊妹篇,重點(diǎn)介紹了常用計(jì)量模型的Stata實(shí)現(xiàn)方法。
Stata手冊(cè):我一直非常佩服撰寫Stata手冊(cè)的那些人,他們總能以最簡(jiǎn)潔的語(yǔ)言說清楚糾結(jié)我很久的問題。Stata11附有16本電子手冊(cè),僅需統(tǒng)一放置于D:stata11utilities目錄下,即可從Stata內(nèi)部的幫助文件中的Also see部分直接鏈接到相應(yīng)的PDF說明書中。作為初學(xué)者,我強(qiáng)烈建議你將[U]和[D]打印出來,反復(fù)研讀。stata手冊(cè)內(nèi)容齊全,但不便于閱讀,把命令與例題割裂開來,閱讀起來很不方便。
stata軟件在社會(huì)科學(xué)研究中的高級(jí)應(yīng)用:周文光,李堯遠(yuǎn),梁煒 著,西北工業(yè)大學(xué)出版社出版。該書詳細(xì)介紹了如何應(yīng)用stata對(duì)連續(xù)變量與分類變量進(jìn)行分析,包括回歸分析,時(shí)間序列分析,面板數(shù)據(jù)分析等,并介紹了如何使用stata進(jìn)行生存分析與聚類分析、編程等內(nèi)容。
Stata視頻。相比于網(wǎng)絡(luò)教程和紙本教材,通過視頻學(xué)習(xí)Stata可能是最快捷的方式了。UCLA免費(fèi)發(fā)布的視頻教程,內(nèi)容涉及Stata入門、數(shù)據(jù)處理和繪圖等。采用英文講解,思路清晰。局限在于所涉及內(nèi)容不夠系統(tǒng),但對(duì)于想快速入門的學(xué)生則是一份不錯(cuò)的參考資料。同時(shí),藉由這份資料也可以練習(xí)一下英語(yǔ)聽力。對(duì)于中文用戶而言,人大論壇發(fā)布的Stata初級(jí)和高級(jí)視頻則提供了更為快捷的學(xué)習(xí)方式。其中,初級(jí)視頻主要介紹stata的操作方法,包括stata入門、stata數(shù)據(jù)處理、stata繪圖、stata矩陣以及stata編程初步五個(gè)部分。高級(jí)視頻主要介紹各種計(jì)量模型的基本原理,重點(diǎn)介紹其在stata中的實(shí)現(xiàn)方法,包括OLS、GLS、MLE、IV-GMM、時(shí)間序列分析、面板模型、stata高級(jí)編程、Bootstrap和Monte Carlo模擬等內(nèi)容,比較全面的涵蓋了計(jì)量經(jīng)濟(jì)學(xué)和核心內(nèi)容。
統(tǒng)計(jì)方法:Rabe-Hesketh and Everitt(2006)。
Stata繪圖:Mitchell(2008),非常細(xì)致地介紹了各種圖形的繪制方法。
Stata數(shù)據(jù)處理:Kohler and Kreuter(2005)*、Long(2009)*、楊菊華(2008)。
Stata編程:Baum(2009),當(dāng)然,該書中有關(guān)數(shù)據(jù)處理的介紹也非常精彩。
Logit/Probit模型:Hosmer and Lemeshow(2000)*對(duì)相關(guān)的理論進(jìn)行非常細(xì)致的介紹,是我學(xué)習(xí)Logit模型的入門教材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則涉及了大量的Stata實(shí)例,對(duì)解讀Logit/Probit模型的結(jié)果很有幫助;Rabe-Hesketh et al.(2004)提供了在GLLAMM架構(gòu)下估計(jì)xtlogit, xtprobit, xtmelogit以及xtmepoisson模型的方法。
Panel Data和多層次模型:Stata11 手冊(cè)[XT]*,簡(jiǎn)潔明了,附有大量實(shí)例;Cameron and Trivedi(2009)*、王志剛(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡(jiǎn)潔明了介紹了Mata的基本用法;詳情則可參與Stata11手冊(cè)[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分析:Cleves et al.(2008)。
Stata是一個(gè)統(tǒng)計(jì)分析軟件,但它也具有很強(qiáng)的程序語(yǔ)言功能,這給用戶提供了一個(gè)廣闊的開發(fā)應(yīng)用的天地,用戶可以充分發(fā)揮自己的聰明才智,熟練應(yīng)用各種技巧,真正做到隨心所欲。事實(shí)上,Stata的ado文件(高級(jí)統(tǒng)計(jì)部分)都是用Stata自己的語(yǔ)言編寫的。
Stata其統(tǒng)計(jì)分析能力遠(yuǎn)遠(yuǎn)超過了SPSS,在許多方面也超過了SAS!由于Stata在分析時(shí)是將數(shù)據(jù)全部讀入內(nèi)存,在計(jì)算全部完成后才和磁盤交換數(shù)據(jù),因此計(jì)算速度極快(一般來說, SAS的運(yùn)算速度要比SPSS至少快一個(gè)數(shù)量級(jí),而Stata的某些模塊和執(zhí)行同樣功能的SAS模塊比,其速度又比SAS快將近一個(gè)數(shù)量級(jí)?。㏒tata也是采用命令行方式來操作,但使用上遠(yuǎn)比SAS簡(jiǎn)單。其生存數(shù)據(jù)分析、縱向數(shù)據(jù)(重復(fù)測(cè)量數(shù)據(jù))分析等模塊的功能甚至超過了SAS。用Stata繪制的統(tǒng)計(jì)圖形相當(dāng)精美,很有特色。
Stata的統(tǒng)計(jì)功能很強(qiáng),除了傳統(tǒng)的統(tǒng)計(jì)分析方法外,還收集了近20年發(fā)展起來的新方法,如Cox比例風(fēng)險(xiǎn)回歸,指數(shù)與Weibull回歸,多類結(jié)果與有序結(jié)果的logistic回歸,Poisson回歸,負(fù)二項(xiàng)回歸及廣義負(fù)二項(xiàng)回歸,隨機(jī)效應(yīng)模型等。具體說, Stata具有如下統(tǒng)計(jì)分析能力:
數(shù)值變量資料的一般分析:參數(shù)估計(jì),t檢驗(yàn),單因素和多因素的方差分析,協(xié)方差分析,交互效應(yīng)模型,平衡和非平衡設(shè)計(jì),嵌套設(shè)計(jì),隨機(jī)效應(yīng),多個(gè)均數(shù)的兩兩比較,缺項(xiàng)數(shù)據(jù)的處理,方差齊性檢驗(yàn),正態(tài)性檢驗(yàn),變量變換等。
分類資料的一般分析:參數(shù)估計(jì),列聯(lián)表分析 ( 列聯(lián)系數(shù),確切概率 ) ,流行病學(xué)表格分析等。
等級(jí)資料的一般分析:秩變換,秩和檢驗(yàn),秩相關(guān)等
相關(guān)與回歸分析:簡(jiǎn)單相關(guān),偏相關(guān),典型相關(guān),以及多達(dá)數(shù)十種的回歸分析方法,如多元線性回歸,逐步回歸,加權(quán)回歸,穩(wěn)鍵回歸,二階段回歸,百分位數(shù) ( 中位數(shù) ) 回歸,殘差分析、強(qiáng)影響點(diǎn)分析,曲線擬合,隨機(jī)效應(yīng)的線性回歸模型等。
其他方法:質(zhì)量控制,整群抽樣的設(shè)計(jì)效率,診斷試驗(yàn)評(píng)價(jià), kappa等。
Stata的作圖模塊,主要提供如下八種基本圖形的制作 : 直方圖(histogram),條形圖(bar),百分條圖 (oneway),百分圓圖(pie),散點(diǎn)圖(two way),散點(diǎn)圖矩陣(matrix),星形圖(star),分位數(shù)圖。這些圖形的巧妙應(yīng)用,可以滿足絕大多數(shù)用戶的統(tǒng)計(jì)作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
矩陣代數(shù)是多元統(tǒng)計(jì)分析的重要工具, Stata提供了多元統(tǒng)計(jì)分析中所需的矩陣基本運(yùn)算,如矩陣的加、積、逆、 Cholesky分解、 Kronecker內(nèi)積等;還提供了一些高級(jí)運(yùn)算,如特征根、特征向量、奇異值分解等;在執(zhí)行完某些統(tǒng)計(jì)分析命令后,還提供了一些系統(tǒng)矩陣,如估計(jì)系數(shù)向量、估計(jì)系數(shù)的協(xié)方差矩陣等。
數(shù)據(jù)管理(Data management)
資料轉(zhuǎn)換、分組處理、附加檔案、 ODBC 、行 - 列轉(zhuǎn)換、數(shù)據(jù)標(biāo)記、字符串函數(shù)…等
基本統(tǒng)計(jì)(Basic statistics)
直交表、相關(guān)性、 t- 檢定、變異數(shù)相等性檢定、比例檢定、信賴區(qū)間…等
線性模式(Linear models)
穩(wěn)健Huber/White/sandwich變異估計(jì) , 三階最小平方法、類非相關(guān)回歸、齊次多項(xiàng)式回歸、GLS
廣義型線性模式(Generalized linear models)
十連結(jié)函數(shù)、使用者-定義連結(jié)、 ML及IRLS估計(jì)、九變異數(shù)估計(jì)、七殘差…等
二元、計(jì)數(shù)及有限應(yīng)變量(Binary, count and limited dependent variables)
羅吉斯特、probit、卜松回歸、tobit、truncated回歸、條件羅吉斯特、多項(xiàng)式邏輯、巢狀邏輯、負(fù)二項(xiàng)、 zero-inflated模型、Heckman 選擇模式、邊際影響
Panel數(shù)據(jù)/交叉 - 組合時(shí)間序列(Panel data/cross-sectional time-series)
隨機(jī)及固定影響之回歸、GEE、隨機(jī)及固定-影響之卜松及負(fù)二項(xiàng)分配、隨機(jī) - 影響、工具變量回歸、AR(1) 干擾回歸
無母數(shù)方法(Nonparametric methods)
多變量方法(Multivariate methods)
因素分析、多變量回歸、 anonical 相關(guān)系數(shù)
模型檢定及事后估計(jì)量支持分析(Model testing and post-estimation support)
Wald檢定、LR檢定、線性及非線性組合、非線性限制檢定、邊際影響、修正平均數(shù)Hausman檢定
群集分析(Cluster analysis)
加權(quán)平均、質(zhì)量中心及中位數(shù)聯(lián)結(jié)、kmeans、kmedians、dendrograms、停止規(guī)則、使用者擴(kuò)充
圖形(Graphics)
直線圖、散布圖、條狀圖、圓餅圖、 hi-lo 圖、回歸診斷圖…
調(diào)查方法(Survey methods)
抽樣權(quán)重、叢集抽樣、分層、線性變異數(shù)估計(jì)量、擬 - 概似最大估計(jì)量、回歸、工具變量…
生存分析(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱性)、參數(shù)模式(弱性)、危險(xiǎn)比例測(cè)試、時(shí)間共變項(xiàng)、左-右檢查、韋柏分配、指數(shù)分配…
流行病學(xué)工具(Tools for epidemiologists)
比例標(biāo)準(zhǔn)化、病例控制、已配適病例控制、Mantel – Haenszel,藥理學(xué)、ROC分析、ICD-9-CM
時(shí)間序列(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色 - 噪音測(cè)試、最小整數(shù)根檢定、時(shí)間序列運(yùn)算、平滑化
最大概似法(Maximum likelihood)
轉(zhuǎn)換及常態(tài)檢定(Transforms and normality tests)
Box–Cox、次方轉(zhuǎn)換Shapiro–Wilk、Shapiro–Francia檢定
其它統(tǒng)計(jì)方法(Other statistical methods)
樣本數(shù)量及次方、非線性回歸、逐步式回歸 、統(tǒng)計(jì)及數(shù)學(xué)函數(shù)
包含樣本范例(Sample session)
再抽樣及模擬方法(Resampling and simulation methods)
bootstrapping、jackknife、蒙地卡羅模擬、排列檢定
網(wǎng)絡(luò)功能
安裝新指令、網(wǎng)絡(luò)升級(jí)、網(wǎng)站檔案分享、Stata 最新消息
epiman論壇學(xué)習(xí)資源豐富,學(xué)術(shù)氛圍良好,在國(guó)內(nèi)新生代公共衛(wèi)生學(xué)術(shù)界有一定影響力。是探討Stata、spss、sas、epidata等統(tǒng)計(jì)軟件的主流論壇之一。