SPSS數(shù)據(jù)分析教程概率論初步_第1頁(yè)
SPSS數(shù)據(jù)分析教程概率論初步_第2頁(yè)
SPSS數(shù)據(jù)分析教程概率論初步_第3頁(yè)
SPSS數(shù)據(jù)分析教程概率論初步_第4頁(yè)
SPSS數(shù)據(jù)分析教程概率論初步_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS數(shù)據(jù)分析教程SPSS數(shù)據(jù)分析教程1第4章 概率論初步2目錄4.1離散型隨機(jī)變量的仿真 4.1.1均勻分布的隨機(jī)數(shù)4.1.2正態(tài)分布的隨機(jī)數(shù)4.2理論分布4.2.1二項(xiàng)分布的分布函數(shù)和概率4.2.2連續(xù)分布的隨機(jī)變量正態(tài)分布4.3經(jīng)驗(yàn)分布4.4抽樣分布4.5置信區(qū)間3本章學(xué)習(xí)目標(biāo)用仿真方法從總體中抽取隨機(jī)樣本:生成服從某種分布的隨機(jī)數(shù);得到觀測(cè)值的理論分布、經(jīng)驗(yàn)分布;理解抽樣分布的形狀;掌握如何求置信區(qū)間;學(xué)習(xí)如何從數(shù)據(jù)集中選擇符合條件的個(gè)案。44.1 離散型隨機(jī)變量的仿真 54.1.1 均勻分布的隨機(jī)數(shù) 假設(shè)我們有一個(gè)正方形,它被均勻的分為4個(gè)相同大小的小正方形?,F(xiàn)在從正方形的中心上方

2、隨機(jī)地投擲一顆玉米粒1000次,假設(shè)每次投擲的玉米粒都等可能的落在4個(gè)小正方形中的一個(gè)之中。問(wèn)題是:落在1號(hào)、2號(hào)、3號(hào)和4號(hào)正方形中的情況如何呢? 1 2 4 36模擬投擲的過(guò)程 (1)第1步:設(shè)置隨機(jī)數(shù)種子 選擇【轉(zhuǎn)換】【隨機(jī)數(shù)字生成器】,勾選“設(shè)置起點(diǎn)”,并在“固定值”下的“值”中輸入一個(gè)用戶給定的數(shù)值。 第2步:生成均勻分布的隨機(jī)數(shù),等可能的產(chǎn)生1,2,3和4這四個(gè)數(shù)共計(jì)1000個(gè). 選擇【轉(zhuǎn)換】【計(jì)算變量】,在“目標(biāo)變量”框中輸入變量名“Spinn”,在“數(shù)字表達(dá)式”框中輸入TRUNC(RV.UNIFORM(1,5),然后單擊【確定】按鈕.7模擬投擲的過(guò)程 (2)第3步:然后分析這四

3、個(gè)數(shù)出現(xiàn)的次數(shù)和相對(duì)頻率。 選擇【分析】【描述統(tǒng)計(jì)】【頻率】 8隨機(jī)數(shù)分析(1)9隨機(jī)數(shù)分析(2)104.1.2 正態(tài)分布的隨機(jī)數(shù) 正態(tài)分布的隨機(jī)變量是連續(xù)型隨機(jī)變量,它的可能取值是所有實(shí)數(shù)。數(shù)據(jù)分析的許多模型和理論都要求數(shù)據(jù)服從正態(tài)分布,因此正態(tài)分布的隨機(jī)數(shù)在模擬中有廣泛的應(yīng)用。 11一、生成正態(tài)分布的隨機(jī)數(shù)第1步:設(shè)置隨機(jī)數(shù)種子為123456 第2步:選擇【轉(zhuǎn)換】【計(jì)算變量】, 應(yīng)用函數(shù)RV.Normal(0,1)。SET SEED=123456. COMPUTE Rnorm01= RV.NORM(0,1). SAVE OUTFILE=D:SPSSIntrodataSim_norm.sav

4、 /COMPRESSED. EXECUTE12生成隨機(jī)數(shù)示意圖13二、分析這些正態(tài)隨機(jī)數(shù)的性質(zhì)繪制隨機(jī)數(shù)的序列圖,有幾種方法方法1:選擇【圖形】【圖表構(gòu)建程序】,選擇“條” 方法2:選擇【分析】【預(yù)測(cè)】【序列圖】方法3:選擇【圖形】【舊對(duì)話框】【線圖】1415該樣本數(shù)據(jù)的確是從正態(tài)分布的總體中隨機(jī)抽取的呢? 繪制隨機(jī)數(shù)的帶有正態(tài)曲線的直方圖 164.2 理 論 分 布除4.1中的均勻分布和正態(tài)分布外,常見(jiàn)的分布還有二項(xiàng)分布、負(fù)二項(xiàng)分布、泊松分布、指數(shù)分布、t分布等。SPSS軟件中提供了這些常見(jiàn)分布的分布函數(shù)、概率分布函數(shù)和概率密度函數(shù)。SPSS的PDF與非中心PDF函數(shù)族提供了相關(guān)分布的概率分

5、布函數(shù)或者概率密度函數(shù),CDF與非中心CDF函數(shù)族提供了相關(guān)分布的累積概率分布函數(shù)(或簡(jiǎn)稱分布函數(shù))。而逆DF函數(shù)族則給出了相應(yīng)分布的分位數(shù)。 174.2.1 二項(xiàng)分布的分布函數(shù)和概率 如果隨機(jī)試驗(yàn)只有兩個(gè)可能的結(jié)果,設(shè)該試驗(yàn)中成功的概率為p。如果將該試驗(yàn)獨(dú)立地重復(fù)進(jìn)行次n次,這一串重復(fù)的獨(dú)立試驗(yàn)稱為重n貝努力試驗(yàn)。如果用X表示在這次試驗(yàn)中成功的次數(shù),則隨機(jī)變量X服從二項(xiàng)分布,其分布函數(shù)為 18CDF.BINOM(x,10,0.25),該函數(shù)用于計(jì)算出x所對(duì)應(yīng)的累計(jì)概率,即: (1)這里x表示不大于的最大整數(shù)。PDF.BINOM(x,10,0.25)計(jì)算而X取某個(gè)特定值i的概率為: (2)19

6、由上面(1)式計(jì)算出的為分布函數(shù)的值;如果是離散隨機(jī)變量,(2)式給出的為概率值,它是隨機(jī)變量X取各個(gè)離散值0,1,2,10的概率 。函數(shù)CDF.BINOM(x,10,0.25)用于計(jì)算n=10,p=0.25的二項(xiàng)分布下x的分布函數(shù)值或者稱為累計(jì)概率。20二項(xiàng)分布的概率分布圖214.2.2 連續(xù)分布的隨機(jī)變量正態(tài)分布 連續(xù)型隨機(jī)變量的任何兩個(gè)可能取值之間都有無(wú)限多個(gè)可能的取值,因此所有可能取值是不能列舉的,也不能給隨機(jī)變量的某可能取值賦給一個(gè)唯一的概率值。一般考慮連續(xù)型隨機(jī)變量的分布函數(shù)(即累積概率函數(shù)(Probability Cumulative Function,CDF)和密度函數(shù)(Pro

7、babilitty Density Function,PDF)。22SPSS的CDF函數(shù)族給出的就是分布函數(shù)的值。 CDF.NORMAL(x,0,1)是給出均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布變量x的累計(jì)概率分布函數(shù)值。PDF.NORMAL(x,0,1)是給出均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布變量x的密度函數(shù)值。23可以畫(huà)出累計(jì)概率分布函數(shù)的線圖24可以畫(huà)出正態(tài)分布變量x的密度函數(shù)的線圖25比較不同參數(shù)的正態(tài)分布函數(shù)264.3 經(jīng) 驗(yàn) 分 布把觀測(cè)到的樣本數(shù)據(jù)的相對(duì)頻率分布稱為經(jīng)驗(yàn)分布,根據(jù)概率的頻率定義,當(dāng)樣本量足夠大時(shí),頻率穩(wěn)定到概率。實(shí)際問(wèn)題中樣本數(shù)據(jù)所服從的分布常常是未知的,我們只能通過(guò)樣本數(shù)據(jù)

8、的經(jīng)驗(yàn)分布來(lái)了解數(shù)據(jù)的分布情況。SPSS描述性統(tǒng)計(jì)菜單的的頻率過(guò)程中把頻率稱為百分比,而把結(jié)果出現(xiàn)的次數(shù)稱為頻率。 27頻率數(shù)據(jù)GSS2004.sav,它記錄了美國(guó)2004年社會(huì)調(diào)查的數(shù)據(jù),有調(diào)查對(duì)象的年齡、性別、受教育年限、最高學(xué)歷、子女個(gè)數(shù)等。這里我們考察調(diào)查對(duì)象子女個(gè)數(shù)的分布情況。 28頻率表選擇【分析】【頻率】,把變量“CHILDS”選到右側(cè)的“變量(V)”框中。29相對(duì)頻率直方圖304.4 抽 樣 分 布由于樣本選擇的隨機(jī)性,樣本統(tǒng)計(jì)量也是隨機(jī)變量,不同的樣本,樣本統(tǒng)計(jì)量的取值也可能不同。 每個(gè)隨機(jī)變量都有其分布性質(zhì),例如描述性統(tǒng)計(jì)量均值、方差、分位數(shù)等。樣本統(tǒng)計(jì)量的分布稱為抽樣分布。31模擬從同一個(gè)分布已知的總體中隨機(jī)抽取若干不同的樣本,然后觀察樣本統(tǒng)計(jì)量的分布情況。從一個(gè)均值為50、標(biāo)準(zhǔn)差為10的正態(tài)總體中隨機(jī)抽取80個(gè)容量為50的樣本。32Sample80.sps INPUT PROGRAM. VECTOR X(80). LOOP #I = 1 TO 50. LOOP #J=1 TO 80. COMPUTE X(#J)=RV.NORMAL(50, 10). END LOOP. END CASE. END LOOP. END FILE. END

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論