




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、.:.;對一個(gè)變數(shù)求出其平均數(shù)及標(biāo)準(zhǔn)差之後,我們知道它的平均數(shù)落在一定的區(qū)間以內(nèi),但是我們還想知道它能否有一些特別的假設(shè)可以驗(yàn)證,例如這個(gè)變數(shù)的平均數(shù)能否有能夠等於某個(gè)值,例如0。透過統(tǒng)計(jì)方法,我們可以對等距尺度的變數(shù)做以上的檢定。但是對於類別資料,我們比較關(guān)心它能否呈現(xiàn)隨機(jī)分布。1. 先看看等距或等比資料的分布。我們選擇a9dn有幾個(gè)小孩做為變數(shù),然後看其能否為常態(tài)分布。記得先將99轉(zhuǎn)為遺漏值。統(tǒng)計(jì)圖直方圖,選顯示常態(tài)曲線很明顯的小孩子的數(shù)目集中在2個(gè)及4個(gè),6個(gè)以上非常少。假設(shè)這個(gè)樣本來自於常態(tài)分配,而平均數(shù)為2.9,標(biāo)準(zhǔn)差為1.48的情況下,我們可以說95%的觀察值落在2.9-1.96*
2、0.039, 2.9+1.96*0.039之間,也是2.81, 2.976之間。而我們還可以進(jìn)一步檢驗(yàn),能否2.9這個(gè)平均值,假設(shè)多做幾次抽樣之後,依然確實(shí)是等於0。此處用的是單一樣本T檢定。顧名思義,t檢定指的是用t分布來看我們所要檢定的值能否會(huì)落在一定的區(qū)域內(nèi)。假設(shè)是會(huì)的話,那麼我們不拒絕虛無假設(shè),即平均值等於0這個(gè)假設(shè)。假設(shè)不會(huì)的話,那麼我們可以拒絕這個(gè)虛無假設(shè),也就是平均值能夠不會(huì)等於0。常態(tài)分布跟t分布的不一樣地方是t分布適用於小樣本,假設(shè)觀察值小於60的時(shí)候。當(dāng)觀察值大於60時(shí),我們還是可以用t分布,但是得到的檢定事實(shí)上與常態(tài)分布無異。參考網(wǎng)頁上附的常態(tài)分布與t分布的對應(yīng)機(jī)率與值。
3、在單一樣本檢定時(shí),求t值的公式為,k是我們要檢定的值。在95%自信心水準(zhǔn)下,求平均值的上下區(qū)間公式為:(X-k)-tb , (X-k)+ tb 。tb是t值在/2而且自在度為n-1時(shí)候的值,也就是所謂的臨界點(diǎn)。是標(biāo)準(zhǔn)誤,也就是standard error of mean,簡寫為SE,也就是平均值的分布情形。而標(biāo)準(zhǔn)誤代表的就是平均值所在的範(fàn)圍。以這個(gè)例子來說,k為0,平均值為2.89,而標(biāo)準(zhǔn)誤為1.477,個(gè)數(shù)為1419,因此自在度等於1418,代入公式及查表自在度大於120且信賴區(qū)間為95%時(shí),t的臨界值為1.96後得2.81, 2.976。2.89落在這個(gè)區(qū)間之間,而且這個(gè)區(qū)間包含了95%的
4、信賴區(qū)間,也就是說抽無數(shù)次後,95%所得的平均值將落在這個(gè)區(qū)間內(nèi),因此等於0的機(jī)會(huì)是非常小,所以我們拒絕我們的虛無假設(shè)。或者是說,求出t值為73.603,而這個(gè)值遠(yuǎn)大於我們的t檢定值1.96,因此可以拒絕等於0這個(gè)虛無假設(shè)。分析比較平均數(shù)法單一樣本T檢定試著檢定平均值等於3或10的假設(shè),也可以發(fā)現(xiàn)會(huì)遭到拒絕。但是假設(shè)設(shè)定平均值等於2.85,則將無法拒絕,表示樣本平均值跟這個(gè)值相差不多,有能夠在這個(gè)區(qū)間內(nèi)。0對我們特別重要,因?yàn)榧僭O(shè)平均值能夠等於0,那麼我們要考慮能否測到的其實(shí)是不存在的。這裡用t分布是因?yàn)閠分布近似常態(tài)分布,而且適用於小樣本。t 分布的臨界值比z分布來得大,因?yàn)閠分布比較扁平,
5、也因此檢定時(shí)比較不容易拒斥其假設(shè)。2. 接下來我們可以檢證能否兩組觀察值在某一個(gè)變數(shù)上能否有一樣的平均值,也就是檢驗(yàn)?zāi)芊駜扇喝擞性谀骋蛔償?shù)上有一樣的特徵。這樣做的好處是觀察能否不同的人有不同的平均值;假設(shè)不同的話,那麼意味著各有各的特征,即兩群人並不一樣,違反了樣本彼此相互是獨(dú)立的假設(shè)。假設(shè)一樣的話,意味兩群人是來自一樣的母體。虛無假設(shè)是兩者是有著一樣的平均數(shù),也就是平均數(shù)的差異等於0,而拒斥的假設(shè)即是差異不等於0。我們用c4e配偶的工時(shí)來看受訪的a1性別能否獨(dú)立。虛無假設(shè)是兩者獨(dú)立,即平均數(shù)一樣。先把配偶工時(shí)高於90的轉(zhuǎn)換為遺漏值。分析比較平均數(shù)法獨(dú)立樣本T檢定。選性別填入分組變數(shù),並且按定
6、義組別,填入性別的類別1與2。從下表可以看到,顯著性均大於0.05,所以不拒絕虛無假設(shè),也就是說這兩個(gè)分組中的樣本應(yīng)該是一致的,或者是這兩組樣本的樣本沒有差異。以男女這兩個(gè)組來說,樣本數(shù)為915,而自在度為913。另外平均數(shù)的差距為46.14 - 47.21 = 1.07。由於我們假設(shè)男女來自不同的母體,而且假設(shè)兩組人的變異數(shù)相等,所以可以用集合變異數(shù)估計(jì)找出兩個(gè)母體的共同標(biāo)準(zhǔn)差。算法為 = = 200.197。而計(jì)算t值的公式為 = = -1.05。根據(jù)自在度及95%信賴水準(zhǔn),t分布給的檢定值至少在 -1.96,也就是說 -1.05並未通過檢定,因此我們必須接受假設(shè),即兩者兩平均數(shù)來自同一母
7、體。同時(shí)我們可以找出在信賴水準(zhǔn)為95%的條件下,這兩個(gè)平均差差異的區(qū)間為-1.07 -1.96*1.014, -1.07 + 1.96*1.014,也就是-3.05, 0.91。假設(shè)我們假設(shè)兩個(gè)組的變異數(shù)不相等,我們計(jì)算平均值差異的標(biāo)準(zhǔn)差如下:。而t值則是: = -1.086。這裡的F檢定指的是應(yīng)用F分布所做的檢定,是用one-way ANOVA所得到的檢定值,比較不依賴樣本成常態(tài)分配的假設(shè)。表中的F檢定值為0.590,顯著性也就不到0.05。假設(shè)是要檢查能否變異數(shù)相等,可用簡單分布圖來看每組對應(yīng)的樣本。GRAPH /SCATTERPLOT(BIVAR)=a1 WITH c4e /MISSIN
8、G=LISTWISE .3. 有時(shí)候我們想比較同一群人前後兩個(gè)時(shí)間點(diǎn)的某個(gè)變數(shù)平均值,或是有時(shí)候我們給兩群人同一個(gè)刺激,想要知道這兩個(gè)刺激的結(jié)果能否一樣。這種類似實(shí)驗(yàn)的研討,可以運(yùn)用成對樣本T檢定來檢驗(yàn)?zāi)芊駜蓚€(gè)平均值一樣。事實(shí)上這種檢驗(yàn)類似上面的獨(dú)立樣本檢定,只是沒有分組變數(shù),而是兩個(gè)連續(xù)性資料的態(tài)度變數(shù)。分析比較平均數(shù)法成對樣本T檢定選g38a一星期花多少時(shí)間做家事及g38b配偶花多少時(shí)間做家事這裡是將兩個(gè)比對的變數(shù)值相減之後,求出標(biāo)準(zhǔn)差及標(biāo)準(zhǔn)誤,然後就可以得到t值了。可以看到t值為 -0.906,顯著性達(dá)0.365,因此不拒絕虛無假設(shè),也就是平均數(shù)相等。以上的檢定也可應(yīng)用在百分比資料。比如
9、說在一組患者120名之中,男生佔(zhàn)了39.2%,女生佔(zhàn)了 60.8%。而在另一組患者中640名,男生佔(zhàn)了43.3%,女生則是56.7%。這兩組之間的差異會(huì)不會(huì)是偶爾發(fā)生的?或是說,這兩組的差異能否達(dá)到顯著水準(zhǔn)?可以計(jì)算標(biāo)準(zhǔn)誤如下:SE = = = 4.87計(jì)算兩者差異的標(biāo)準(zhǔn)誤要先計(jì)算全部人之中某一群人的發(fā)生機(jī)率。以女性而言,在120人那一組的數(shù)目是73人,而640人那一組則是363人,合計(jì)是436人,佔(zhàn)了全部兩組人之57.4%。SE(diff%) = = = 4.92因?yàn)閮山M的差距為4.1%,而SE為4.92,兩者相除得0.83。應(yīng)用Z分布,可得到p值約0.4,也就是不拒斥兩者相等的假設(shè),也就是
10、這個(gè)差距能夠是偶爾發(fā)生的,在95%的信賴水準(zhǔn)下。取材自httpbmj.bmjjournals/collections/statsbk4. 接下來我們處理類別資料。類別資料主要是檢驗(yàn)?zāi)芊駷殡S機(jī)分布。應(yīng)用上次上課所運(yùn)用的求卡方值公式,或是無母數(shù)檢定,都可以得到檢定。分析無母數(shù)檢定卡方檢定,選全部類別相等。我們用A1性別來檢驗(yàn)我們的受訪者的性別能否為隨機(jī)分布??ǚ綑z定幫我們檢驗(yàn)虛無假設(shè):各個(gè)類別為隨機(jī)分布。在求出一個(gè)卡方值後,對比卡方表的檢定值,便可以決定能否接受或是拒斥這個(gè)虛無假設(shè)。計(jì)算出來的卡方值為0.424。在自在度為1的情況下,95%信賴水準(zhǔn)的檢定值為3.841,所以我們必須接受這個(gè)虛無假設(shè)
11、,也就是受訪者性別是隨機(jī)的。殘差就是期望值減觀察值,而殘差除以期望值的平方和就是卡方值??ǚ椒峙渲?,自在度是k-1,k是格子數(shù)。在自在度為1,且顯著水準(zhǔn)為0.05情況下,至少要有3.841才干否認(rèn)假設(shè),因此在這裡我們接受性別成隨機(jī)分布的假設(shè)。5. 要檢驗(yàn)類別資料能否為獨(dú)立或者是跟其他變數(shù)相關(guān),可以用交叉列表來表示。交叉列表分析將幫我們計(jì)算卡方值,然後比較卡方表的檢定值。假設(shè)卡方值小於檢定值,我們不可以拒絕虛無假設(shè),也就是兩個(gè)變數(shù)的分布是一樣的,也就是沒有相關(guān)。假設(shè)卡方值大於檢定值,我們可以拒絕虛無假設(shè),也就是兩者分布有相關(guān)。分析描畫統(tǒng)計(jì)交叉表。按統(tǒng)計(jì)量,選取卡方統(tǒng)計(jì)量按格式,並選取橫列及觀察值回到前面的畫面,選取性別為列,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 省級醫(yī)學(xué)課題申報(bào)書范例
- 出售游艇別墅合同范本
- 原房主合同范例
- 北京租賃居間合同范本
- 課題立項(xiàng)申報(bào)書小學(xué)
- 人像攝影肖像合同范本
- 個(gè)人出租土地合同范本
- 【復(fù)習(xí)大串講】【中職專用】高二語文上學(xué)期期末綜合測試題(五)(職業(yè)模塊)(原卷版)
- 二手辦公用房買賣合同范本
- 養(yǎng)殖基地出售馬匹合同范本
- 七下綜合世界真奇妙-共享“地球村”
- 工地早班會(huì)活動(dòng)記錄表(普工、塔司、信號工)
- 印刷服務(wù)投標(biāo)方案(技術(shù)方案)
- 馬工程《刑法學(xué)(下冊)》教學(xué)課件 第16章 刑法各論概述
- 《建筑工程資料管理規(guī)程》DB34T918-2019
- 小班數(shù)學(xué)掛燈籠教案反思
- 屈原《國殤》教學(xué)課件
- 美術(shù)課件:水印版畫
- LED驅(qū)動(dòng)電源基礎(chǔ)知識(課堂PPT)
- 空白個(gè)人簡歷表格1
評論
0/150
提交評論