




已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一節(jié)均數(shù)抽樣誤差與t分布 欲了解總體的特征 最直接的方法是對總體中的每個觀察單位進行測量 通過整理分析得到總體參數(shù) 但這在醫(yī)學研究實際中往往是不可能實現(xiàn)的 通常應(yīng)用抽樣研究 通過樣本指標來了解總體特征 抽樣研究所得樣本均數(shù)會不會恰好等于未知的總體均數(shù)呢 如果固定樣本含量n從同一總體中進行多次抽樣 所得樣本均數(shù)又會如何呢 假設(shè)已知某地30歲 40歲正常男性血清總膽固醇的均值為5 0mmol L 標準差為0 6mmol L 現(xiàn)從該總體中進行隨機抽樣 每次抽取30名正常男子 并測得他們的血清總膽固醇水平 最終共抽取100份樣本 并計算出每份樣本的均數(shù) 由個體變異產(chǎn)生的 隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差 samplingerror 抽樣造成的樣本均數(shù)與總體均數(shù)間的差異就稱為均數(shù)的抽樣誤差 在抽樣研究中 抽樣誤差是不可避免的 但抽樣誤差分布具有一定的規(guī)律性 圖3 1從正態(tài)分布總體N 5 0 0 62 中隨機抽樣所得樣本均數(shù)的分布 樣本均數(shù)大部分分布在總體均數(shù)5 0的左右 中間多 兩邊少 左右基本對稱 服從正態(tài)分布 并且樣本均數(shù)的變異范圍比原變量的變異范圍要小很多 樣本均數(shù)的標準差稱為均數(shù)的標準誤 簡稱標準誤 用符號表示 均數(shù)的標準誤說明各樣本均數(shù)圍繞總體均數(shù)的離散程度 可用來反映樣本均數(shù)的抽樣誤差大小 中心極限定理 從正態(tài)總體N 2 中 隨機抽取例數(shù)為n的樣本 樣本均數(shù)也服從正態(tài)分布 即使從偏態(tài)總體隨機抽樣 當n足夠大時 n 50 樣本均數(shù)近似正態(tài)分布 從均數(shù)為 標準差為 的正態(tài)或偏態(tài)總體中 抽取例數(shù)為n的樣本 樣本均數(shù)的總體均數(shù)也為 標準差與原標準差成正比 與樣本例數(shù)的平方根成反比 越大 樣本均數(shù)的分布越分散 樣本均數(shù)與總體均數(shù)的差別越大 抽樣誤差越大 由樣本均數(shù)估計總體均數(shù)的可靠性越小 反之 越小 樣本均數(shù)的分布越集中 樣本均數(shù)與總體均數(shù)的差別越小 抽樣誤差越小 由樣本均數(shù)估計總體均數(shù)的可靠性越大 的大小與 成正比 與成反比 當 固定不變時 樣本含量n增大 減小 因此 在實際工作中 可通過適當增加樣本含量來減小抽樣誤差 常未知 用S估計 因此均數(shù)標準誤的估計值為 t分布的演化 常未知 若用 這時對樣本均數(shù)進行的不是Z變換而是t變換 統(tǒng)計量t不再服從N 0 1 標準正態(tài)分布 英國統(tǒng)計學家W S Gosset于1908年以 Student 筆名發(fā)表論文 證明統(tǒng)計量t服從v n 1的t分布 又稱為Studentt分布 Student st distribution t分布的圖形及特征 t分布的特征為 以0為中心 左右對稱的單峰分布 越小 t值越分散 峰越矮 尾越高增大 t分布逐漸逼近Z分布 時 t分布即為Z分布 t界值表 橫標目 自由度 縱標目 概率P 曲線下面積 表中數(shù)字 自由度為 概率P為 時 所對應(yīng)的t界值 記為t 單側(cè) 或雙側(cè) 即 在相同自由度時 t的絕對值越大 P越小在相同P值時 自由度越大所對應(yīng)的t界值越小在相同t值時 雙側(cè)概率P為單側(cè)概率P的兩倍時 t界值即為Z界值 第二節(jié)總體均數(shù)的點估計與區(qū)間估計 點估計 pointestimation 將樣本統(tǒng)計量直接作為總體參數(shù)的估計值區(qū)間估計 intervalestimation 按事先給定的概率 估計包含未知總體參數(shù)的一個可能范圍 區(qū)間估計的實質(zhì)假設(shè)某個總體的均數(shù)為 需要找到兩個量A和B 使得在一個比較高的可信度下 如95 區(qū)間 A B 能包含 即P A B 0 95 可信區(qū)間的定義按一定的概率或可信度 1 估計包含未知總體參數(shù)的可能范圍 該范圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間 confidenceinterval CI 預(yù)先給定的概率 1 稱為可信度或者置信度 confidencelevel 常取95 或99 可信區(qū)間 CL CU 為開區(qū)間 CL CU稱可信限 總體均數(shù)可信區(qū)間的計算 當 已知 2 5 2 5 95 未知但n足夠大 n 50 例6 3中 因n 120 試求該地正常成年男性血清膽固醇平均水平的95 可信區(qū)間 即 3 55 4 17 mmol L 例6 1從某地隨機抽取120名30歲 40歲正常男性 得其血清總膽固醇水平的均數(shù)為4 95mmol L 標準差為0 64mmol L 試估計該地30歲 40歲正常男性血清總膽固醇平均水平的95 可信區(qū)間 因n 120 屬于 未知但n足夠大 又均數(shù)為4 95mmol L 標準差為0 64mmol L 故該地30歲 40歲正常男性血清總膽固醇平均水平的95 可信區(qū)間為即 4 84 5 06 mmol L 當 未知n較小 可信區(qū)間的涵義 從總體中作隨機抽樣 每個樣本可以算得一個可信區(qū)間 如95 可信區(qū)間意味著做100次抽樣 算得100個可信區(qū)間 平均有95個估計正確 在實際研究中 一般只進行一次抽樣 算得一個可信區(qū)間 對于這個可信區(qū)間來說 我們就認為該區(qū)間包含了總體均數(shù) 把握度為95 圖6 5從N 0 1 中隨機抽樣算得的100個95 可信區(qū)間 n 10 可信區(qū)間的兩個要素 可信度 可靠性 即1 一般取90 95 可人為控制區(qū)間的寬度 區(qū)間的大小 區(qū)間的長度 越小越好必須二者兼顧 均數(shù)的可信區(qū)間與參考值范圍的區(qū)別 第三節(jié)總體率的點估計與區(qū)間估計 一 二項分布 如某實驗中小白鼠染毒后死亡概率P為0 8 則生存概率為 1 P 0 2 1 對一只小白鼠進行實驗的結(jié)果為 死 概率為P 或生 概率為1 P 2 對二只小白鼠 甲乙 進行實驗的結(jié)果為 甲乙均死 概率為P2 甲死乙生 概率為P 1 P 乙死甲生 概率為 1 P P 或甲乙均生 概率為 1 P 2 概率相加得P2 P 1 P 1 P P 1 P 2 P 1 P 23 依此類推 對n只小白鼠進行實驗 所有可能結(jié)果的概率相加得Pn cn1P 1 P n 1 cnxPx 1 P n x 1 P x P 1 P n其中n為樣本含量 即事件發(fā)生總數(shù) x為某事件出現(xiàn)次數(shù) cnxPx 1 P n x為二項式通式 cnx n x n x P為總體率 因此 二項分布是說明結(jié)果只有兩種情況的n次實驗中發(fā)生某種結(jié)果為x次的概率分布 其概率密度為 P x cnxPx 1 P n x x 0 1 n 二項分布的圖形 當 0 5時 分布對稱 當 0 5 分布呈偏態(tài) 當 0 5時分布呈負偏態(tài) 特別是當n值不是很大時 偏離0 5愈遠 分布愈偏 隨著n的增大 二項分布逐漸逼近正態(tài)分布 如 0 30 n 5和n 10時 圖形呈偏態(tài) 當n 30時 圖形已接近正態(tài)分布 一般地說 如果n 或n 1 大于5時 ??捎谜龖B(tài)近似原理處理二項分布問題 二項分布的性質(zhì) 累積概率 1 二項分布的概率之和等于1 2 單側(cè)累積概率 至多有m例陽性的概率 下側(cè)累積概率 至少有m例陽性的概率 上側(cè)累積概率 二項分布的性質(zhì) 均數(shù)和方差 陽性結(jié)果發(fā)生數(shù)X的總體均數(shù)總體方差總體標準差 二項分布的抽樣分布及其性質(zhì) 二項分布的隨機抽樣性質(zhì)仍然被中心極限定理所反映在n足夠大時 樣本率近似服從正態(tài)分布樣本率p的均數(shù)等于 樣本率p的標準差 率的標準誤 二 Poisson分布 當二項分布中n很大 p很小時 二項分布就變?yōu)镻oisson分布 Poisson分布實際上是二項分布的極限分布法國數(shù)學家SimeonDenisPoisson 1781 1840 1837年在 關(guān)于判斷的概率之研究 一文中提出的描述隨機現(xiàn)象的一種常用分布 Poisson分布也是一種重要的離散型概率分布 用于研究單位時間 單位人群 單位空間內(nèi) 某稀有事件發(fā)生次數(shù)的分布單位體積水中細菌數(shù)單位體積空氣中粉塵數(shù)單位時間內(nèi)放射性物質(zhì)放射出的質(zhì)點數(shù)單位空間中某些昆蟲數(shù)一定人群中惡性腫瘤或罕見非傳染性疾病患病數(shù)或死亡數(shù) 可以認為滿足以下三個條件的隨機變量服從Poisson分布 平穩(wěn)性 X的取值與觀察單位的位置無關(guān) 只與觀察單位的大小有關(guān)獨立性 在某個觀察單位上X的取值與前面各觀察單位上X的取值獨立 無關(guān) 普通性 在充分小的觀察單位上X的取值最多為1 Poisson分布的概率函數(shù) 若隨機變量的概率函數(shù)為 則稱此變量服從Poisson分布 記為 Poisson分布的累計概率 Poisson分布的圖形 Poisson分布的性質(zhì)均數(shù)和方差 Poisson分布的均數(shù)和方差相等 均為 即 Poisson分布中均數(shù)的抽樣分布及其性質(zhì) 在 足夠大時 Poisson分布的平均計數(shù)近似正態(tài)分布平均計數(shù)的標準誤n 1時 1個單位 三 總體率的估計 根據(jù)樣本率 也可以對總體率做出點估計和區(qū)間估計 我們用樣本率p作為總體率 的點估計值 總體率的點估計亦未考慮其抽樣誤差大小 而總體率的區(qū)間估計克服了點估計的缺陷 利用樣本資料可估計二項分布總體率的1 可信區(qū)間 取0 05或0 01 對于 且接近于0或1時 可直接查表得到總體率的 1 可信區(qū)間 例6 6某醫(yī)院
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新疆維吾爾自治區(qū)塔城地區(qū)塔城市2022-2023學年高二上學期期中語文含解析
- 廣東省汕頭市2023-2024學年高三上學期12月期中考歷史含解析
- 小學生養(yǎng)成教育冠軍演講
- 茅臺學院《汽車電控原理》2023-2024學年第二學期期末試卷
- 襄陽職業(yè)技術(shù)學院《綜合保稅區(qū)運營實務(wù)》2023-2024學年第二學期期末試卷
- 廣州康大職業(yè)技術(shù)學院《安全化工基礎(chǔ)》2023-2024學年第二學期期末試卷
- 萊蕪職業(yè)技術(shù)學院《花卉學》2023-2024學年第二學期期末試卷
- 永州職業(yè)技術(shù)學院《分析力學》2023-2024學年第二學期期末試卷
- 青島理工大學《現(xiàn)當代文學》2023-2024學年第二學期期末試卷
- 青海交通職業(yè)技術(shù)學院《日語專業(yè)認知教育》2023-2024學年第二學期期末試卷
- 2024年呼和浩特市玉泉區(qū)消防救援大隊招聘政府專職消防員真題
- 2025年中考語文文言文復(fù)習:神話寓言 練習題(含答案解析)
- 《醫(yī)療機構(gòu)節(jié)能減排教育》課件
- 預(yù)錄用協(xié)議勞動合同
- GA/T 751-2024公安視頻圖像屏幕顯示信息疊加規(guī)范
- 新疆烏魯木齊市名校2025屆初三5月中考模擬考試數(shù)學試題試卷含解析
- 2025至2030中國長鏈氯化石蠟行業(yè)供需現(xiàn)狀與前景策略研究報告
- 租地蓋大棚合同協(xié)議
- 江蘇蘇州高新區(qū)獅山商務(wù)創(chuàng)新區(qū)招聘筆試真題2024
- 自體輸血知識培訓課件
- 人教A版高一下冊必修第二冊高中數(shù)學8.6.2直線與平面垂直【課件】
評論
0/150
提交評論