第四章 數(shù)理統(tǒng)計的基礎知識_第1頁
第四章 數(shù)理統(tǒng)計的基礎知識_第2頁
第四章 數(shù)理統(tǒng)計的基礎知識_第3頁
第四章 數(shù)理統(tǒng)計的基礎知識_第4頁
第四章 數(shù)理統(tǒng)計的基礎知識_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第四章數(shù)理統(tǒng)計的基礎知識§4.1總體與樣本§4.2統(tǒng)計量§4.3常用的統(tǒng)計分布§4.4抽樣分布§4.1總體與樣本一、統(tǒng)計學(數(shù)理統(tǒng)計)的定義二、總體與總體分布三、樣本與樣本分布四、統(tǒng)計學的研究內(nèi)容五、統(tǒng)計推斷與概率論的區(qū)別六、統(tǒng)計學與數(shù)學的區(qū)別七、統(tǒng)計軟件一、統(tǒng)計學(數(shù)理統(tǒng)計)的定義統(tǒng)計學研究如何用有效的方法收集數(shù)據(jù)、分析數(shù)據(jù)和從數(shù)據(jù)中獲取有用信息來幫助人們進行預測和決策(數(shù)據(jù)是關于數(shù)量指標的觀測值)。例如,要了解全班同學的身高情況,先要測量并記錄班上每個同學的身高,然后用記錄下來的身高數(shù)據(jù)計算全班同學的平均身高。這里的第一步就是搜集數(shù)據(jù),第二步就是從搜集到的數(shù)據(jù)集中獲取信息。平均身高正是反映全班同學身高狀況的重要信息。統(tǒng)計學(數(shù)理統(tǒng)計)的定義(續(xù))

當然統(tǒng)計學中研究的問題要比這個例子復雜得多?,F(xiàn)代統(tǒng)計學所提供的各種統(tǒng)計方法,作為在不確定情況下進行預測和決策的重要輔助工具,被廣泛地應用于所有出現(xiàn)定量數(shù)據(jù)且需要對它們進行分析和解釋的問題中(稱這類問題為統(tǒng)計問題)。在對什么是統(tǒng)計學做詳細解釋之前,我們先考查一些需要應用統(tǒng)計方法的問題,從這些問題中我們希望大家能領悟出統(tǒng)計問題的基本要素。例1

記錄這次期中考試全部同學(經(jīng)濟3班、4班,金融3班、4班)的成績。我們很難直接從這些數(shù)據(jù)中直觀地看出全體同學成績狀況的信息。只有對這些數(shù)據(jù)進行分類整理,并用一些綜合性的數(shù)值描述它們的重要特征,這些信息才能更容易地被理解和使用。這里應用統(tǒng)計方法的目的是描述全部同學(稱這個集合為總體)的成績狀況,由于我們擁有獲取總體成績狀況信息所需的全部數(shù)據(jù),統(tǒng)計學中稱這里提到的從總體數(shù)據(jù)中獲取總體狀況信息的方法為描述性統(tǒng)計方法。例2

統(tǒng)計方法在現(xiàn)代會計中也起著重要的作用。如清點一家大型超市貨架上的商品可能是一件十分費錢和費時的工作。代替清點和估價貨架上的全部幾千種商品(總體),會計人員從貨架商品清單中選取一個樣本,將樣本在貨架上的實際價值與其在帳目中的價值比較,依此估計出貨架上商品總價值與帳目中總價值的比率。例3某市場分析人員搜集一個消費者的樣本,要求樣本中每個人回答對某商品的觀點。從得到的這些樣本數(shù)據(jù)中,市場分析人員必須做出這種商品有無足夠需求量的決定。若存在足夠需求,分析人員還要選擇包括設計、價格及市場范圍。所有這些問題都可以從調(diào)查的樣本數(shù)據(jù)所提供的信息中得到回答。例4

某百貨公司對購買的一批電燈泡進行抽樣檢驗。在檢驗的基礎上決定是否接受這批燈泡。這種檢驗可能從這批燈泡中抽取15只作為樣本,檢驗樣本的廢品數(shù)和平均使用壽命。是否接受的決定建立在觀察到的廢品數(shù)和平均使用壽命上。統(tǒng)計學(數(shù)理統(tǒng)計)的定義(續(xù))

在以上幾個例子中,除第一個例子外,其它幾個例子都需要在不確定情況下對總體狀態(tài)進行預測或決策,之所以產(chǎn)生不確定性,是因為我們無法擁有進行預測或決策所需的全部信息(總體數(shù)據(jù))。在使用不完全信息(樣本數(shù)據(jù))進行預測和決策時,必須借助于一種叫做統(tǒng)計推斷的統(tǒng)計方法。通過上面的例子大家對統(tǒng)計問題應該有了初步的了解。下面我們將介紹上面例子中涉及到的幾個統(tǒng)計學的基本概念,這些概念是對統(tǒng)計學的本質(zhì)和特征的概括和反映,是統(tǒng)計思維網(wǎng)絡上的結(jié)點。掌握了這些基本概念后,大家對統(tǒng)計問題會有更深刻的認識和理解。二、總體與總體分布從前面的幾個例子中,我們可以看出統(tǒng)計問題就是研究總體的整體性質(zhì)。統(tǒng)計學中的總體(母體)是指與研究問題有關的所有研究對象全體組成的集合,稱組成總體的各個研究對象為個體。研究某批燈泡的質(zhì)量考察廈大漳州校區(qū)全體同學的身高總體的定義(續(xù))統(tǒng)計學中組成總體的個體不僅可以是人、物、組織單位等實體,也可以是現(xiàn)象、事件、活動過程等非實體。但在個體是非實體時,總體通常不是有形的,而是概念性的。例如,要判斷一枚硬幣是否均勻,先對這枚硬幣進行100次投擲試驗,然后根據(jù)這100次投擲試驗的結(jié)果做出這枚硬幣是否均勻的結(jié)論。這個統(tǒng)計問題的個體是對這枚硬幣的每次投擲試驗,這種個體顯然是個活動過程。這個統(tǒng)計問題的總體是所有可能的對這枚硬幣的投擲試驗,這個總體顯然是概念性的。總體的定義(續(xù))在統(tǒng)計研究中,人們關心的總體的整體性質(zhì)就是組成總體的每個個體的一項(或幾項)數(shù)量指標所對應指標值全體的集體性質(zhì)(稱之為總體數(shù)量特征)。因此,我們也稱每個個體所對應的一項(或幾項)指標值全體為總體;稱單個個體所對應的指標值為個體。該批燈泡壽命的全體就是總體燈泡的壽命漳州校區(qū)全體同學身高的全體就是總體當個體是非實體時,把指標值全體稱為總體將更加方便。有限總體和無限總體總體中所包含的個體的個數(shù)稱為總體的容量。容量為有限的總體稱為有限總體,容量為無限的總體稱為無限總體。有限總體的例子某工廠生產(chǎn)的燈泡的壽命是一個總體,每一個燈泡的壽命是一個個體;某學校男生的身高的全體是一個總體,每個男生的身高是一個個體;某一湖泊中某種魚的含汞量。無限總體的例子某一地點每天(包括以往、現(xiàn)在和將來)的最高氣溫;某一湖泊任一地點的深度??傮w數(shù)量特征的特點總體數(shù)量特征通常具有如下兩個特點:第一,總體數(shù)量特征同組成總體的每個個體都有關系,由于組成總體的個體數(shù)目一般都非常之多,因而就單個個體而言它對總體數(shù)量特征的影響又很??;第二,組成總體的各個個體之間不是完全相同的,即個體特征具有變異性。如果組成總體的每個個體都完全一模一樣,那么這個總體的數(shù)量特征除了總體總數(shù)外均等同于單個個體的數(shù)量特征,因而只要對其中的任一個個體進行研究就可以了,不需要什么統(tǒng)計方法。因此要完全了解總體數(shù)量特征,必須了解總體中每個個體的相關特征。通常一個總體有很多不同的數(shù)量特征,選擇什么樣的數(shù)量特征來研究完全取決于研究的目的??傮w是由大量取值不全相同的觀察值組成。這些大量觀察值在數(shù)量指標的值域上所形成的分布就叫總體分布??傮w分布包含了總體的整體數(shù)量特征的全部信息。只要知道了總體分布,總體數(shù)量特征就完全清楚了。但要完全知道總體分布,就必須知道組成總體的全部指標值。統(tǒng)計推斷就是在無法獲得組成總體的全部指標值的情況下,如何用獲得的部分指標值(有限個)來推斷未知的總體分布。如果所研究的數(shù)量指標是隨機變量(如當個體是非實體時),那么總體分布就是這個隨機變量的分布。總體分布如果所研究的數(shù)量指標不是隨機變量(如當個體是實體時),那么可通過設計一個隨機試驗使所研究的數(shù)量指標成為一個隨機變量。因此我們可以把所研究的數(shù)量指標看作一個隨機變量(或隨機向量),相應的總體分布就是這個隨機變量(或隨機向量)的分布。我們感興趣的總體數(shù)量特征就是這個隨機變量(或隨機向量)的分布及其數(shù)字特征。因此,我們也可以稱隨機變量(或隨機向量)為總體,而總體分布就是這個隨機變量(或隨機向量)的分布。統(tǒng)計推斷就是利用這個隨機變量(或隨機向量)的有限個觀察值來推斷其未知的分布。本課程只研究總體是隨機變量的情況??傮w分布(續(xù))在實際問題中,我們可以依據(jù)問題的背景,設定總體分布的類型(如正態(tài)分布、伯努利分布、泊松分布等),我們稱所設定的總體分布的類型為理論模型。如果所設定的總體分布的類型是由有限個未知參數(shù)決定的,我們就稱之為參數(shù)模型。如果所設定的總體分布的類型不能由有限個未知參數(shù)決定的,我們就稱之為非參數(shù)模型。理論模型某人群由N個男生組成,記N個男生的身高數(shù)據(jù)為x1,x2,…,xN。用隨機方法從人群中抽取一個人,記X為其身高的測量值,則X是個隨機變量,其分布為即為:例5一萬個身高數(shù)據(jù)的直方圖近似于一條光滑的概率密度曲線總體x1,x2,…,xN的分組頻率分布就是對總體分布的近似。從分組頻率分布的直方圖可直觀地看出,在N→∞時,可以取每組的組距d→0,因而直方圖就收斂于一條光滑的密度曲線。由于這個概率密度曲線與正態(tài)分布的概率密度曲線非常接近,因此可用正態(tài)分布作為身高這個數(shù)量指標的理論模型。某人群由N個人組成,其中有N1個男性,記p=N1/N為人群中男性所占比例。從這個人群中隨機抽出一個人,記X為被抽到的人的性別,并用X=1表示男性,X=0表示女性。則數(shù)量化后的性別指標X就變成一個隨機變量,這個隨機變量就是總體,其分布(理論模型)為:例6顯然這個分布即為性別的頻率分布,p則為描述總體性別特征的一個參數(shù)。對這個總體,顯然有μ=E(X)=p。即總體性別特征可用總體均值來描述。X~0<p<1例7要判斷一枚硬幣是否均勻,先對這枚硬幣進行100次投擲試驗,然后根據(jù)這100次投擲試驗的結(jié)果做出這枚硬幣是否均勻的結(jié)論。記X為投擲試驗的結(jié)果,并用X=1表示國微向上,X=0表示文字向上。則數(shù)量化后的指標X就變成一個隨機變量,用這個隨機變量表示總體,顯然比用全體投擲試驗或全體投擲試驗結(jié)果表示總體都來得方便。顯然總體分布(理論模型)為:其中p為投擲這枚硬幣時,出現(xiàn)國微向上這種結(jié)果的概率。X~0<p<1統(tǒng)計推斷就是通過從總體中抽取一部分個體,根據(jù)獲取的數(shù)據(jù)來對總體分布得出推斷的。被抽出的部分個體叫做總體的一個樣本。顯然,樣本就是總體的一個有限子集。若將總體定義為隨機變量X,總體分布就是隨機變量X的概率分布,總體數(shù)量特征就是隨機變量X的數(shù)字特征。這時,從總體中抽取一個個體,就是對總體X進行一次觀察并記錄其結(jié)果。三、樣本與抽樣分布在相同條件下對總體X進行n次重復的、獨立的觀察,將n次觀察結(jié)果按試驗的次序記為x1,x2,…,xn

。由于x1,x2,…,xn是對隨機變量X觀察的結(jié)果,且各次觀察是在相同的條件下獨立進行的,所以有理由認為(x1,x2,…,xn)是n個獨立同分布(共同分布就是總體X的分布)的隨機變量組成的n維隨機向量(X1,X2,…,Xn)的一次實現(xiàn)。稱這種n維隨機向量(X1,X2,…,Xn)為簡單隨機樣本,簡稱為樣本。n稱為這個樣本的容量。簡單隨機樣本容量為n的樣本在觀察之前為一個n維隨機向量(X1,X2,…,Xn),當n次觀察一經(jīng)完成,我們就得到由一組實數(shù)組成的n維向量(x1,x2,…,xn),它是n維隨機向量(X1,X2,…,Xn)的一次實現(xiàn),稱之為樣本值。簡單隨機樣本(續(xù))全體樣本值組成的集合稱為樣本空間。容量為n的樣本的樣本空間是n維實空間的子集。若(x1,x2,…,xn)與(y1,y2,…,yn)都是相應于樣本(X1,X2,…,Xn)的樣本值,一般來說它們是不同的。對于有限總體,采用有放回抽樣就能得到簡單隨機樣本,但有放回抽樣使用起來不方便,當總體中的個體總數(shù)N比要得到的樣本容量大得多時,在實際中可將不放回抽樣近似地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論