06統(tǒng)計量及其抽樣分布_第1頁
06統(tǒng)計量及其抽樣分布_第2頁
06統(tǒng)計量及其抽樣分布_第3頁
06統(tǒng)計量及其抽樣分布_第4頁
06統(tǒng)計量及其抽樣分布_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)理統(tǒng)計基礎從歷史的的典籍中中,人們們不難發(fā)發(fā)現(xiàn)許多多關于錢錢糧、戶戶口、地地震、水水災等等等的記載載,說明明人們很很早就開開始了統(tǒng)統(tǒng)計的工工作.但是當時時的統(tǒng)計計,只是是對有關關事實的的簡單記記錄和整整理,而而沒有在在一定理理論的指指導下,作出超超越這些些數(shù)據(jù)范范圍之外外的推斷斷.到了十九九世紀末末二十世世紀初,隨著近近代數(shù)學學和概率率論的發(fā)發(fā)展,才才真正誕誕生了數(shù)數(shù)理統(tǒng)計計學這門門學科.數(shù)理統(tǒng)計計學數(shù)理統(tǒng)計計學是一一門應用用性很強強的學科科.它是研究究怎樣以以有效的方方式收集、整整理和和分析帶有隨機機性的數(shù)數(shù)據(jù),以便對對所考察察的問題題作出推推斷和預預測,直直至為采采取一定定的決策策和行動

2、動提供依依據(jù)和建建議.數(shù)理統(tǒng)計計的特點點是應用用面廣,分支較較多.社會的發(fā)發(fā)展不斷斷向統(tǒng)計計提出新新的問題題.計算機的的誕生與與發(fā)展,為數(shù)據(jù)據(jù)處理提提供了強強有力的的技術支支持,數(shù)數(shù)理統(tǒng)計計與計算算機的結結合是必必然的發(fā)發(fā)展趨勢勢.數(shù)理統(tǒng)計計不同于于一般的的資料統(tǒng)統(tǒng)計,它它更側重重于應用用隨機現(xiàn)現(xiàn)象本身身的規(guī)律律性進行行資料的的收集、整理和和分析.由于大量量隨機現(xiàn)現(xiàn)象必然然呈現(xiàn)出出它的規(guī)規(guī)律性,因而從從理論上上講,只只要對隨隨機現(xiàn)象象進行足足夠多次次觀察,被研究究的隨機機現(xiàn)象的的規(guī)律性性一定能能清楚地地呈現(xiàn)出出來.只允許我們對隨機現(xiàn)象進行次數(shù)不多的觀察試驗,也就是說, 我們獲得的只是局部觀察資

3、料.但客觀上數(shù)理統(tǒng)計計的任務務就是研研究怎樣樣有效地地收集、整理、分析所所獲得的的有限的資料,對所研研究的問問題,盡可能地地作出精精確而可可靠的結結論.由于推斷斷是基于于抽樣數(shù)數(shù)據(jù),抽抽樣數(shù)據(jù)據(jù)又不能能包括研研究對象象的全部部信息.因而由此此獲得的的結論必必然包含含不肯定定性.在數(shù)理統(tǒng)統(tǒng)計中,不是對對所研究究的對象象全體(稱為總體)進行觀察察,而是是抽取其其中的部部分(稱為樣本)進行觀察察獲得數(shù)數(shù)據(jù)(抽樣),并通通過這些些數(shù)據(jù)對對總體進進行推斷斷.下面我們們以一例例進行說說明:某種子公公司A,栽種了幾幾種類別別的鮮鮮花,收收獲了大大量的花花籽,并把每25?;ㄗ言梢恍⌒“鍪凼?一個零售售商

4、批發(fā)發(fā)了若干干包,并并向顧客客保證:在每包包25?;ㄗ阎兄兄辽儆杏?2粒將能發(fā)發(fā)芽,否否則的話話可免費費調換另另一包.每包要是是有3粒不發(fā)芽,馬馬上免費費退換!每包25粒每包25粒中至少有22粒將發(fā)芽所有的包包都如此嗎?這種類型型的不肯肯定性,即不知知道種子子公司出出售的小小包中可可接受的的比例,它是由由于對總總體的真真實狀態(tài)態(tài)(天然然狀態(tài))無知所所引起的的不肯定定性.零售商面面臨如下下兩種類類型的不不肯定性性:(1) 他對種子公司出售的小包中可接受(即至少有22?;ㄗ褜l(fā)芽)的包數(shù)所占比例 是不清楚的. 這是第一類不肯定性.(2)由于種子子公司出出售的花花籽的貨貨單上,這類花花籽共有有一百萬

5、萬包,而而零售商商只購買買了200包,那些包是可接受的呢?這就是盡管他知道了一百萬包可接受的比例 ,但對他所購買的200包,其中可接受的比例仍舊沒有“把握”.從中購買200包共100萬包因此他又又面臨著著另一類類不肯定定性;零售商購購買的200包仍有可可能“碰碰巧”是是從不可可接受的的一萬包包中選取取的.那些包是可接受的呢?即使 是0.99,即種子公司出售的一百萬包中有99萬包是可接受的,這樣他就就要損失失一筆資資金.從中購買200包共100萬包這一類不不肯定性性是由于于“隨機機性”所所引起的的. 在已知 的條件下,這種不肯定性的程度已在概率論部分作過討論.下面我們們回到第第一類不不肯定性性:

6、 零售商對種子公司出售的小包中可接受(即至少有22?;ㄗ褜l(fā)芽)的包數(shù)所占比例 是多少沒有把握.零售商能能夠根據(jù)據(jù)試驗的的方法(請公司司進行發(fā)發(fā)芽試驗驗)來改改善他的的處境.根據(jù)試驗他能作出天然狀況 是多少的決策.這就是抽取部分種籽進行發(fā)芽試驗,通過這部分中發(fā)芽數(shù)所占比例(頻率)來對 的真值進行推斷.(1)怎樣設計計試驗,決定觀觀察的數(shù)數(shù)目;(2)怎樣利用用試驗觀觀察的結結果作出出一個“好”的的推斷等等.這都是數(shù)數(shù)理統(tǒng)計計所要研研究的問問題. 雖然他不能精確地和肯定地確定 , 但可以期望獲得一個(在某種意義下)比較好的推斷. 這就涉及及到第一個問問題是怎怎樣進行行抽樣,使抽得得的樣本本更合理理

7、,并有更好好的代表表性?這這是抽樣樣方法和和試驗設設計問題題:最簡簡單易行行的是進進行隨機機抽樣.第二個問問題是怎怎樣從取取得的樣樣本去推推斷總體體?這種種推斷具具有多大大的可靠靠性?這是統(tǒng)計推斷斷問題.本課程著著重討論論第二個個問題,即最常用用統(tǒng)計推推斷方法法.概率論是是數(shù)理統(tǒng)統(tǒng)計的基基礎,而而數(shù)理統(tǒng)統(tǒng)計是概概率論的的重要應應用.但它們是是并列的的兩個學學科,并并無從屬屬關系.可見,在在數(shù)理統(tǒng)統(tǒng)計中必必然要用用到概率率論的理理論和方方法.因為隨機機抽樣的的結果帶帶有隨機機性,不不能不把把它當作作隨機現(xiàn)現(xiàn)象來處處理.由此也可可以說,統(tǒng)計方法法具有“部分推斷斷整體”的特征.在結束本本節(jié)之前前,我

8、們們需要強強調說明明一點:因為我們們是從一一小部分分樣本觀觀察值去去推斷該該全體對對象(總總體)情情況,即即由部分分推斷全全體.這里使用用的推理理方法是是“歸納推理理”.這種歸納推理理不同于數(shù)數(shù)學中的的“演繹繹推理”,它在作出出結論時時,是根根據(jù)所觀觀察到的的大量個個別情況況,“歸納”起來所所得,而而不是從從一些假假設、命命題、已已知的事事實等出出發(fā),按按一定的的邏輯推推理去得得出來的的.例如,在在幾何學學中要證證明“等腰三角角形底角角相等”只須從“等腰”這個前提提出發(fā),運用幾幾何公理理,一步步一步推推出這個個結論.而一個習習慣于統(tǒng)統(tǒng)計思想想的人,就可能能想出這這樣的方方法:做做很多大大小形狀

9、狀不一的的等腰三三角形,實地測測量其底底角,看看差距如如何,根根據(jù)所得得資料看看看可否否作出“底角相等等”的結論.這樣做就就是歸納納式的方方法.現(xiàn)在要問問:從局局部觀察察要對總總體下結結論有沒沒有片面面性呢?結論是是否可靠靠?顯然這里里不僅依依賴于進進行局部部觀察的的“樣本本”是否否具有總總體的代代表性,也依賴賴于對從從這些樣樣本得到到數(shù)據(jù)的的合理加加工、分分析并得得出論斷斷.我們對每每個經(jīng)過過合理手手續(xù)選取取的一個個樣品也也應看到到它所具具有的兩兩重性:一方面它它具有特特殊性,因為它它畢竟是是個別觀觀察值,不能反反映總體體的全面面性質,有片面面性.因而統(tǒng)計計上往往往不采用用由一次次抽取的的樣

10、品來來下結論論.在這個基基礎上再再加上科科學的推推斷方法法,對總總體下的的結論同同樣也是是可靠的的.另一方面面也要看看到“普普遍性即即存在于于特殊性性之中”,即每每個樣品品的情況況又必然然反映總總體的一一些普遍遍性.當樣品有有一定數(shù)數(shù)量時總總體的普普遍性是是可以得得到比較較真實的的反映的的.但此時還還應記住住畢竟是是由“局部”推斷“整體”,因而而仍可能能犯錯誤誤,結論論往往又又是在某某個“可靠性水水平”之下得得出的.這種矛盾盾的特殊殊性與普普遍性的的辯證統(tǒng)統(tǒng)一在統(tǒng)統(tǒng)計學中中貫穿始始終,是是我們應應該記住住的基本本思想.第二節(jié)樣樣本本及抽樣樣分布統(tǒng)計量與與經(jīng)驗分分布函數(shù)數(shù)統(tǒng)計三大大抽樣分分布幾個

11、重要要的抽樣樣分布定定理課堂練習習小結布布置作作業(yè)由樣本值值去推斷斷總體情情況,需需要對樣樣本值進進行“加工”,這就就要構造造一些樣樣本的函函數(shù),它它把樣本本中所含含的(某某一方面面)的信信息集中中起來.1.統(tǒng)計量這種不含任何何未知參參數(shù)的樣樣本的函函數(shù)稱為為統(tǒng)計量量.它是完全全由樣本本決定的的量.一、統(tǒng)計計量與經(jīng)經(jīng)驗分布布函數(shù)定義請注意:幾個常見見統(tǒng)計量量樣本平均均值它反映了了總體均值值的信息樣本方差差它反映了了總體方差的信信息樣本標準準差它反映了了總體k階矩的信信息樣本k階原點矩矩樣本k階中心矩矩k=1,2,它反映了了總體k階中心矩的的信息統(tǒng)計量的的觀察值值2.經(jīng)驗分布布函數(shù)二、統(tǒng)計計三大

12、抽抽樣分布布記為分布1、定義:設相相互互獨立,都服從正正態(tài)分布布N(0,1),則稱隨機機變量:所服從的的分布為為自由度為為n的分分布.分布是由正態(tài)分布派生出來的一種分布.分布的密密度函數(shù)數(shù)為來定義.其中伽瑪函數(shù) 通過積分注1.設相相互獨獨立,都服從正正態(tài)分布布則這個性質叫 分布的可加性.3若近似正態(tài)態(tài)分布N(0,1).(應用中心心極限定定理可得得)2設且且X1,X2相互獨立立,E(X)=n,D(X)=2n.概率密度度函數(shù)為為: 定義: 設XN(0,1) , Y , 且X與Y相互 獨立,則稱變量所服從的分布為自由度為 n的 t 分布.2、t分布由定義可見見,3、F分布F(n2,n1)定義: 設

13、U 與V 相互獨立,則稱隨機變量服從自由度為n1及 n2 的F分布,n1稱為第自由度,n2稱為第二自由度,記作FF(n1,n2) .即它的數(shù)數(shù)學期望望并不依依賴于第第一自由由度n1.1.F分布的數(shù)數(shù)學期望望為:若n22若FF(n1,n2),F(xiàn)的概率密密度為2.F分布的分分位數(shù)三、幾個個重要的的抽樣分分布定理理當總體為為正態(tài)分布布時,給出出幾個重重要的抽抽樣分布布定理.定理1(樣本均值值的分布布) 設 X1, X2, , Xn 是來自正態(tài)總體的樣本, 是樣本均值,則有n取不同值時樣本均值 的分布請注意:定理2(樣本方差差的分布布)設X1,X2,Xn是來自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有n取不同值時 的分布定理3(樣本均值值的分布布) 設X1,X2,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有定理4(兩總體樣樣本均值值差、樣樣本方差差比的分分布)分別是這兩個樣本的且X與Y獨立,X1,X2,是來自X的樣本,是取自Y的樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論