Stata15是一款專業(yè)的數(shù)據(jù)統(tǒng)計(jì)分析軟件,這款軟件擁有數(shù)據(jù)管理、數(shù)據(jù)分析以及繪制專業(yè)圖表三大實(shí)用型功能,可以幫助您在統(tǒng)計(jì)數(shù)據(jù),分析實(shí)驗(yàn),分析經(jīng)濟(jì)市場,分析方程等方面提供重要的輔助功能,F(xiàn)在很多復(fù)雜的計(jì)算項(xiàng)目都是通過電腦完成的,利用電腦強(qiáng)大的計(jì)算功能以及圖表功能,可以將復(fù)雜的數(shù)據(jù)數(shù)據(jù)輕松計(jì)算結(jié)果,并且可以將結(jié)果顯示在圖表上,讓每個(gè)人都可以清晰的知道數(shù)據(jù)變換。
主要功能:
1、Stata15.1中文破解版擁有強(qiáng)大的繪圖功能,可以幫助您分析更多經(jīng)濟(jì)數(shù)據(jù)
2、可以將實(shí)驗(yàn)數(shù)據(jù)加載到軟件建立新的統(tǒng)計(jì)項(xiàng)目
3、提供了生物數(shù)據(jù)統(tǒng)計(jì),可以通過圖表展示分析的數(shù)據(jù)
4、擁有強(qiáng)大的計(jì)算功能,實(shí)驗(yàn)結(jié)果可以自動(dòng)計(jì)算
5、界面提供了數(shù)據(jù)編輯器,可以對您添加的數(shù)據(jù)編輯
6、提供變量顯示窗口,調(diào)整函數(shù)變量更方便
7、Stata15.1中文破解版也提供了專業(yè)的圖形分析
8、讓實(shí)驗(yàn)數(shù)據(jù)更加可視化,讓化學(xué)研究數(shù)據(jù)更清晰
9、在分析市場數(shù)據(jù)方面也是支持的
10、對于統(tǒng)計(jì)數(shù)學(xué)方面的數(shù)據(jù)擁有更好的函數(shù)方程設(shè)置
使用方法:
(1) 使用Stata時(shí),盡量不用命令框,而最好使用do file編寫命令。這樣可以保證操作的可重復(fù)性。
(2) 本文中,所有命令以黃色背景、粗體、藍(lán)色字體顯示。
(3) do file中命令末尾的雙斜線//表示添加注釋(例如,圖0.1.1第6行set linesize 255后為注釋),三斜線///表示換行(例如,圖0.1.1從第8行到16行為一個(gè)完整的命令,其中使用///換行)。
圖0.1.1
1. 導(dǎo)入數(shù)據(jù)并觀察
為了方便大家學(xué)習(xí),我們在本教程中使用Stata自帶的數(shù)據(jù)uslifeexp.dta,大家可以輸入sysuse dir這行命令查看系統(tǒng)自帶的數(shù)據(jù)庫(圖1.1.1)。若沒有uslifeexp這個(gè)數(shù)據(jù)庫,大家可以在http://www.stata-press.com/data/r9/uslifeexp.dta下載。
圖1.1.1 Stata 14.2自帶的數(shù)據(jù)庫
. sysuse uslifeexp這一步的目的是導(dǎo)入該系統(tǒng)自帶數(shù)據(jù)。屏幕顯示的結(jié)果如下。
. list in 1/10通過這個(gè)命令,我們可以查看該數(shù)據(jù)庫第1到第10個(gè)數(shù)據(jù),對數(shù)據(jù)有一個(gè)初步的了解。屏幕顯示的結(jié)果如下。
. describe通過這個(gè)命令,我們可以查看這個(gè)數(shù)據(jù)集的簡要介紹,包括了樣本數(shù)量(obs:100)、變量數(shù)量(vars:10)、大小(size:3800)、以及每個(gè)標(biāo)量的簡要介紹。屏幕顯示的結(jié)果如下。
2. 單變量探索以及作圖
在這一小節(jié)中,我們一起來對某一個(gè)變量進(jìn)行探索。我們會(huì)用到四個(gè)命令,分別是codebook、summarize、stem以及histogram。我們以數(shù)據(jù)集中的變量le (life expectancy)為例。這個(gè)變量是人均預(yù)期壽命。
2.1 Codebook Codebook這個(gè)命令適合于我們初次接觸一個(gè)數(shù)據(jù)集的變量。
. codebook le下圖是codebook le這行命令給出的結(jié)果。我們可以看到,output給出了該變量的標(biāo)簽(life expectancy)、類型(numeric: float)、范圍、單位、特異值、缺失值(0/100)、以及一些統(tǒng)計(jì)量。這樣,我們對于該變量有一個(gè)初步的了解。
2.2 SummarizeSummarize這個(gè)命令可以讓我們更加深入地探索變量的統(tǒng)計(jì)量。
. summarize le下圖是summarize le這行命令的結(jié)果,給出最常用的幾個(gè)統(tǒng)計(jì)量。
而summarize le, detail這行命令則會(huì)給出更多的統(tǒng)計(jì)量。
summarize le, detail
.
其中,smallest和largest代表了該變量最大和最小值,即預(yù)期壽命(le)的4個(gè)最高值和4個(gè)最低值。
2.3 其他圖像為了探索變量的分布,我們還可以使用莖葉圖(stem plot)、箱式圖(box plot)、直方圖(histogram)等圖像進(jìn)行探索。
. stem le
. graph box le (左圖). hist le (右圖)** hist是histogram的縮寫。在Stata中,一些命令有縮寫形式,如summarize可以縮寫為sum。
由于篇幅有限,對于這些圖像,我們在此不做贅述。但是我們應(yīng)該記住,莖葉圖的莖寬、保留位數(shù);直方圖的組距、顏色、y軸是頻率還是頻數(shù)等都可以進(jìn)行自定義,直到畫出滿意的圖像。感興趣的讀者可以在命令行中輸入help stem、help graph box、help histogram獲取help文件。如還有不清楚的地方,可以聯(lián)系小咖獲取幫助。
3. 雙變量作圖
在這一小節(jié)中,我們對于雙變量進(jìn)行繪圖。我們繼續(xù)研究預(yù)期壽命(le)隨年份(year)變化的規(guī)律。不同的是,我們使用le_male與le_female繪制2個(gè)y變量和x的圖,使用le_wmale、le_wfemale、le_bmale、le_bfemale繪制4個(gè)y變量和x的關(guān)系。
. twoway plot [if] [in] [, twoway_options]twoway的命令是twoway plot 變量 [if] [in] [, twoway_options],我們可以自己定義的主要是:
plot:選擇圖像的種類,這里的plot可以改成scatter, plot, connected, area, bar等,我們可以繪制出相應(yīng)的圖。
變量:這里可以寫一個(gè)或多個(gè)y變量,一個(gè)x變量。最后一個(gè)是x變量,之前的為y變量。
[if] [in] [, twoway_options]等中括號(hào)內(nèi)的命令是可選命令,如果不寫,則表示默認(rèn)值。
if:定義所取某一個(gè)自變量的范圍,例如if le > 40,即只畫le>40的圖
in:定義所取觀測值的范圍,例如in 10/20,即只畫第10到20個(gè)觀測值的圖
twoway_options:可以定義圖像的“美觀”部分,例如坐標(biāo)軸范圍、標(biāo)題、注釋、標(biāo)簽等等。
3.1 一個(gè)y變量(預(yù)期壽命(le)隨年份(year)變化的關(guān)系)twoway plot y x,其中plot可以換為某種特定的圖像,如scatter。
- 散點(diǎn)圖
下圖Stata代碼:. twoway scatter le year
圖2.1.1 散點(diǎn)圖
- 折線圖
. twoway line le year
圖2.1.2 折線圖
同理,我們還可以做出更多種的圖。
. twoway connected le year (左上,帶數(shù)據(jù)標(biāo)記的折線圖). twoway dropline le year (右上,垂直線圖). twoway spike le year (左下,脈沖圖). twoway lowess le year (右下,lowess圖)
圖2.1.3
大家可以輸入help graph_twoway,查看Stata都可以做出什么樣的圖。
3.2 多個(gè)y 變量命令形式:graph twoway plot yvar1 yvar2 yvar3 … xvarplot表示我們要畫的是某種圖,之后是變量的名字。
Stata會(huì)默認(rèn)最后一個(gè)變量是x變量,plot和x變量之間則均為y變量。
下圖Stata代碼:graph twoway scatter le_male le_female year
圖3.2.1
下圖Stata代碼:twoway line le_male le_female year
圖3.2.2
下圖Stata代碼:twoway area le_female le_male year
圖3.2.3
下圖Stata代碼:twoway line le_wmale le_wfemale le_bmale le_bfemale year
圖3.2.4
注意:在Stata中,上述命令graph twoway plot yvar1 yvar2 yvar3 xvar和下列命令等價(jià):
- graph twoway (plot yvar1 xvar) (plot yvar2 xvar) (plot yvar3 xvar)
- graph twoway plot yvar1 xvar || plot yvar2 xvar || plot yvar3 xvar
. twoway scatter le_m le_f year. twoway (scatter le_m year) (scatter le_f year). twoway scatter le_m year || scatter le_f year(以上3個(gè)命令等價(jià),畫出下圖)
圖3.2.5(同3.2.1)
因此,我們完全可以在同一張圖上畫出不同y變量。
(以上1-4行為第一個(gè)命令,6-9行為第二個(gè)命令,兩個(gè)命令等價(jià),畫出下圖)
圖3.2.6
也可以將yvar1的兩種不同的曲線畫在同一幅圖上。
. twoway (scatter le year) (lfit le year). twoway scatter le year || lfit le year(以上2個(gè)命令等價(jià),畫出下圖)
圖3.2.7
4. 改變點(diǎn)的大小形狀,改變線的粗細(xì)、樣式
在這一節(jié),我們主要講對于點(diǎn)和線的處理。我們重新回到男、女預(yù)期壽命比較這幅圖(圖3.2.1)。
下圖的Stata代碼:graph twoway scatter le_male le_female year
圖4.1.1(同3.2.1)
對于這幅圖,我們沒有定義點(diǎn)的顏色、形狀、大小等等參數(shù),而是接受了Stata給出的默認(rèn)值。我們也可以對此進(jìn)行更改。
例如:
下圖的Stata代碼(藍(lán)色背景部分為新增內(nèi)容):
graph twoway scatter le_male le_female year, mcolor(red blue) msymbol(circle diamond) msize(vsmall
vsmall)
圖4.1.2(圖3.2.1改進(jìn))
在這行code中,我們調(diào)整了點(diǎn)的顏色(mcolor),形狀(msymbol),大小(msize)。括號(hào)里的順序(red blue)應(yīng)按照y變量的順序 (le_male le_female) 依次對應(yīng),這樣紅色代表le_male,blue代表le_female。
除了點(diǎn)的顏色、形狀、大小外,Stata還給了我們多種改進(jìn)的方案,如點(diǎn)內(nèi)部顏色、點(diǎn)外周顏色、點(diǎn)外周寬度等等。讀者可以通過在命令行里輸入help scatter##marker_options得到更加詳盡的介紹。
我們也可以更改連線的屬性。讓我們回到3.2.2這幅圖。
下圖Stata代碼:twoway line le_male le_female year
圖4.1.3(同圖3.2.2)
對于這幅圖,我們同樣可以改進(jìn)。
下圖Stata代碼(藍(lán)色背景部分為新增內(nèi)容):
twoway line le_male le_female year, lcolor(red blue) lpattern(solid dash) lwidth(thin thin)
圖4.1.4(圖3.2.2改進(jìn))
在這行code中,我們調(diào)整了線的顏色(lcolor),連接方式(lpattern),寬度(lwidth)。括號(hào)里的順序(red blue)應(yīng)按照y變量的順序 (le_male le_female) 依次對應(yīng),這樣紅色代表le_male,blue代表le_female。
除了線的顏色、連接方式、寬度外,Stata還給了我們多種改進(jìn)的方案,如線如何連接(階梯/直線/曲線)、線條風(fēng)格等。
5. 改進(jìn)圖像整體
在下圖分性別和人種的預(yù)期壽命比較中,1920年的預(yù)期壽命看起來近似于0,但其實(shí)是30左右。
圖5.1.1(同圖3.2.4)
上圖Stata代碼:twoway line le_wmale le_wfemale le_bmale le_bfemale year我們怎樣調(diào)整坐標(biāo)軸的范圍、單位,以更適應(yīng)我們的預(yù)期呢?(1) 改變坐標(biāo)軸的最大值、最小值
下圖代碼(藍(lán)色背景部分為新增內(nèi)容):
. twoway line le_wmale le_wfemale le_bmale le_bfemale year, yscale(range(0))yscale(range(0)) 要求y軸的范圍包括0
圖5.1.2