版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
勤學好問必有所獲第五章
數(shù)理統(tǒng)計的概念
數(shù)理統(tǒng)計
數(shù)理統(tǒng)計一、數(shù)理統(tǒng)計及其任務
數(shù)理統(tǒng)計是一門以概率論為基礎的應用學科。它是研究如何有效地收集、整理、分析帶有隨機性的數(shù)據(jù),以便對所考察的問題作出推斷和預測,從而為決策提供依據(jù)。
數(shù)理統(tǒng)計的任務就是研究有效地收集數(shù)據(jù),科學地整理與分析所獲得的有限的資料,對所研究的問題,盡可能地作出精確而可靠的結論。
數(shù)理統(tǒng)計研究問題的方式,不是對所研究對象的全體(稱為總體)進行觀察,而是抽取其中的部分(稱為樣本)進行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對總體進行推斷。數(shù)理統(tǒng)計方法具有“部分推斷整體”的特征。二、數(shù)理統(tǒng)計研究問題的一般流程分析問題確定總體收集數(shù)據(jù)試驗設計抽樣數(shù)據(jù)整理統(tǒng)計推斷參數(shù)估計假設檢驗我們這門課所學的數(shù)理統(tǒng)計實際上是統(tǒng)計推斷及其應用(方差分析與回歸分析)的一部分內(nèi)容。
為什么要用數(shù)理統(tǒng)計方法研究問題?隨機現(xiàn)象有它的規(guī)律性,隨機現(xiàn)象的特點注定了進行足夠多次觀察,其規(guī)律性才能清楚地呈現(xiàn)出來。但是,客觀上只允許對隨機現(xiàn)象進行有限次觀察試驗,只能獲得局部觀察資料.總體與總體特征數(shù)一、總體與總體標志總體(Population)
Def在數(shù)理統(tǒng)計中,把研究對象的全體稱為總體或母體,而把組成總體的每個單元稱為個體。描述總體單元在某方面特性的名稱或記號稱為總體指標;每個總體單元對總體指標的響應稱為指標值??傮w中所包含的個體的個數(shù)稱為總體的容量?!芯磕撑鸁襞莸馁|(zhì)量
…總體個體在數(shù)理統(tǒng)計中,人們往往研究有關總體總是關注總體某一項或幾項指標,為此,對這些指標進行隨機的試驗或觀測,試驗或觀測結果獲得這些指標的一部分或全部指標值,從而考察該數(shù)量指標的分布情況。這時,指標值的全體就象是總體。每個指標值就象是總體單元??傮w指標值全集指標隨機變量總體可以用隨機變量及其分布來表示,研究總體等價于研究表達總體的隨機變量概率分布;在理論上可以把總體與概率分布等同起來,總體分布就是表達總體的隨機變量的分布。例如:研究某批燈泡的壽命時,關心的指標是壽命,那么,該總體就可以用隨機變量X和其概率分布表示??傮w特征數(shù)樣本與統(tǒng)計量一、樣本樣本(Sample)Def按一定規(guī)則從總體中抽取一部分總體單元進行觀測或試驗,這一抽取過程稱為“抽樣”,所抽取的部分總體單元的整體稱為總體的一個樣本(子樣)。樣本中所包含的總體單元稱為樣本單元,樣本中樣本單元的數(shù)目稱為樣本容量。樣本樣本實現(xiàn)抽定樣本應滿足的性質(zhì)(1)代表性;(2)隨機性。簡單隨機樣本(Independenceidenticaldistribution)Def例如:要通過隨機抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測后放回原來的總量中再抽第二件產(chǎn)品,則這樣獲得一個簡單隨機抽樣。
實際抽樣中,往往是不再放回產(chǎn)品,則這不是一個簡單隨機抽樣。但當總量N很大時,可近似看成是簡單隨機抽樣。樣本分布Def注意:樣本分布反映樣本取不同實現(xiàn)的概率規(guī)律,其與總體分布相聯(lián)系,一般求算比較麻煩,但對于iid樣本有下列結果??傮w、樣本、樣本實現(xiàn)的關系總體樣本實現(xiàn)樣本推斷例5.1例5.2二、統(tǒng)計量樣本(Statistic)例5.3
設是從正態(tài)總體中抽取的一個樣本,其中為已知參數(shù),為未知參數(shù),確定下列那些量是統(tǒng)計量它反映了總體k階矩的信息幾個常用的統(tǒng)計量樣本平均值它反映了總體均值的信息樣本方差它反映了總體方差的信息樣本標準差
樣本k階原點矩樣本k階中心矩統(tǒng)計三大分布
分布這個分布是由Helmet于1875年提出,K.Pearson于1900年重新提出。理論推導可得概率密度函數(shù)為
其概率密度函數(shù)的圖像如圖所示(用中心極限定理證明)t分布(學生氏t分布)這個分布是由W.S.Gosset于1908年提出,該分布的提出為小樣本方法的建立奠定了概率基礎。理論推導可得概率密度函數(shù)為F分布這個分布是由R.A.Fisher于1918年提出,該分布的提出為方差分析的建立奠定了概率基礎。Snedcor于1934年給出概率密度函數(shù)。例5.4抽樣分布抽樣分布(SamplingDistribution)確定抽樣分布是數(shù)理統(tǒng)計的有一個基本問題,確定相應統(tǒng)計量的分布是建立統(tǒng)計方法的基礎。以統(tǒng)計量的精確為基礎的統(tǒng)計方法稱為小樣本方法;而以統(tǒng)計量的極限分布為基礎的統(tǒng)計方法稱為大樣本方法。例5.7解:
為了研究隨機現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調(diào)查或試驗得到的數(shù)據(jù)往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。數(shù)據(jù)的簡單處理是以一種直觀明了方式加工數(shù)據(jù),它包括兩個方面:數(shù)據(jù)整理;計算樣本特征值。數(shù)據(jù)的整理與加工數(shù)據(jù)整理:將數(shù)據(jù)分組計算各組頻數(shù)作頻率分布表作頻率直方圖計算樣本特征值:樣本均值、樣本方差等。例5.8為對某小麥雜交組合F2代的株高X進行研究,抽取容量為100的樣本,測試的原始數(shù)據(jù)記錄如下(單位:厘米),試根據(jù)以上數(shù)據(jù),畫出它的頻率直方圖,并以此說明隨機變量X的分布狀況。
87 88 111 91 73 70 92 98 1059499 91 98 110 98 97 90 83 928886 94 102 99 89 104 94 94 929687 94 92 86 102 88 75 90 908084 91 82 94 99 102 91 96 949485 88 80 83 81 69 95 80 979296 109 91 80 80 94 102 80 869190 83 84 91 87 95 76 90 9177103 89 88 85 95 92 104 92 958386 81 86 91 89 83 96 86 7592
整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫直方圖,提取樣本分布特征的信息。步驟如下:1.找數(shù)據(jù)最小值m=69,最大值M=111,極差為M-m=42;2.數(shù)據(jù)分組,根據(jù)樣本容量n的大小,決定分組數(shù)k;3.確定組限和組中點值;4.將數(shù)據(jù)分組,計算出各組頻數(shù),作頻數(shù)、頻率分布表;5.作出頻率直方圖。注意:分組的一般原則為
30≤n≤405≤k≤640≤n≤606≤k≤860≤n≤1008≤k≤10100≤n≤50010≤k≤20
本例取k=9,一般采取等距分組(也可以不等距分組),組距等于比極差除以組數(shù)略大的測量單位的整數(shù)倍。本例測量單位為1厘米,組距為一般根據(jù)算式:各組中點值加減1/2組距=組的上限或下限,組的上限與下限應比數(shù)據(jù)多一位小數(shù)。本例取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:[67.5,72.5)[72.5,77.5)[77.5,82.5)[82.5,87.5)[87.5,92.5)[92.5,97.5)[97.5,102.5)[102.5,107.5)[107.5,112.5)組中值分別為:70,75,80,85,90,95,100,105,110組序區(qū)間范圍頻數(shù)fj頻率Wj=fj/n累計頻率Fj1[67.5,72.5)20.020.022[72.5,77.5)50.050.073[77.5,82.5)100.100.174[82.5,87.5)180.180.355[87.5,92.5)300.30.656[92.5,97.5)180.180.837[97.5,12.5)100.10.938[102.5,107.5)40.040.979[107.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度苗圃技術員苗木質(zhì)量檢測與標準制定合同4篇
- 停車場智能化系統(tǒng)定制合同2025版
- 2025年度新型建筑材料代理投標合同范本4篇
- 二零二五版煤礦場地地質(zhì)災害防治租賃合同3篇
- 2025年度船舶建造與綠色能源應用合同4篇
- 2025年度智能落水管系統(tǒng)安裝與維護服務合同4篇
- 2025年度農(nóng)業(yè)示范區(qū)土地種植承包管理協(xié)議4篇
- 二零二五年度環(huán)保技術開發(fā)與應用承包合同范本4篇
- 二零二五版民間借貸合同糾紛調(diào)解中心運營管理合同4篇
- 二零二五年度大棚建設與農(nóng)業(yè)科技培訓服務合同4篇
- 第22單元(二次函數(shù))-單元測試卷(2)-2024-2025學年數(shù)學人教版九年級上冊(含答案解析)
- 藍色3D風工作總結匯報模板
- 安全常識課件
- 河北省石家莊市2023-2024學年高一上學期期末聯(lián)考化學試題(含答案)
- 2024年江蘇省導游服務技能大賽理論考試題庫(含答案)
- 2024年中考英語閱讀理解表格型解題技巧講解(含練習題及答案)
- 新版中國食物成分表
- 浙江省溫州市溫州中學2025屆數(shù)學高二上期末綜合測試試題含解析
- 2024年山東省青島市中考生物試題(含答案)
- 保安公司市場拓展方案-保安拓展工作方案
- GB/T 15843.2-2024網(wǎng)絡安全技術實體鑒別第2部分:采用鑒別式加密的機制
評論
0/150
提交評論