學(xué)習(xí)數(shù)理統(tǒng)計(jì)5_第1頁(yè)
學(xué)習(xí)數(shù)理統(tǒng)計(jì)5_第2頁(yè)
學(xué)習(xí)數(shù)理統(tǒng)計(jì)5_第3頁(yè)
學(xué)習(xí)數(shù)理統(tǒng)計(jì)5_第4頁(yè)
學(xué)習(xí)數(shù)理統(tǒng)計(jì)5_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022/8/14 9:28/ 491 電話:2580718黃榮坦數(shù) 理 統(tǒng) 計(jì)2022/8/14 9:28/ 492第五章 統(tǒng)計(jì)量及其分布5.1 總體與樣本5.2 樣本數(shù)據(jù)的整理與顯示5.3 統(tǒng)計(jì)量及其分布5.4 三大抽樣分布5.5 充分統(tǒng)計(jì)量2022/8/14 9:28/ 4935.1 總體與樣本5.1.1 統(tǒng)計(jì)學(xué)(數(shù)理統(tǒng)計(jì))的定義5.1.2 總體和總體分布5.1.3 樣本和樣本分布5.1.4 統(tǒng)計(jì)模型及其意義5.1.5 統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容5.1.6 統(tǒng)計(jì)推斷與概率論和數(shù)學(xué)的區(qū)別5.1.7 統(tǒng)計(jì)軟件2022/8/14 9:28/ 4945.1.1 統(tǒng)計(jì)學(xué)(數(shù)理統(tǒng)計(jì))的定義統(tǒng)計(jì)學(xué)研究如何用有效

2、的方法收集、概括和分析數(shù)據(jù),以便從數(shù)據(jù)中獲取有用信息來(lái)幫助人們進(jìn)行預(yù)測(cè)和決策。數(shù)據(jù):描述研究對(duì)象特征的變量的觀測(cè)值。例如,要了解全班同學(xué)的身高情況,先要測(cè)量并記錄班上每個(gè)同學(xué)的身高,然后用記錄下來(lái)的身高數(shù)據(jù)計(jì)算全班同學(xué)的平均身高。這里的第一步就是搜集數(shù)據(jù),第二步就是對(duì)所搜集到的數(shù)據(jù)進(jìn)行概括,以獲取班級(jí)身高狀況的信息。平均身高是描述班級(jí)身高狀況的重要信息。2022/8/14 9:28/ 495統(tǒng)計(jì)學(xué)(數(shù)理統(tǒng)計(jì))的定義(續(xù)) 當(dāng)然統(tǒng)計(jì)學(xué)研究的問(wèn)題要比這個(gè)例子復(fù)雜得多?,F(xiàn)代統(tǒng)計(jì)學(xué)所提供的各種統(tǒng)計(jì)方法,作為在不確定情況下進(jìn)行預(yù)測(cè)和決策的重要輔助工具,被廣泛地應(yīng)用于所有出現(xiàn)定量數(shù)據(jù)且需要對(duì)它們進(jìn)行分析和

3、解釋的問(wèn)題中(稱這類問(wèn)題為統(tǒng)計(jì)問(wèn)題)。在對(duì)什么是統(tǒng)計(jì)問(wèn)題做詳細(xì)解釋之前,我們先考查一些需要應(yīng)用統(tǒng)計(jì)方法的問(wèn)題,從這些問(wèn)題中我們能領(lǐng)悟出統(tǒng)計(jì)問(wèn)題的基本要素。2022/8/14 9:28/ 496例5.1.1 產(chǎn)品的抽樣檢查1為檢驗(yàn)?zāi)碂襞輳S生產(chǎn)的產(chǎn)品的質(zhì)量,從該廠庫(kù)存的一批燈泡中隨機(jī)地抽取10個(gè),檢驗(yàn)其壽命(單位h)。假定測(cè)得壽命為1980,2800,3060,4500,2760,3270,1560,0,3200,1940。用這10個(gè)樣品的壽命數(shù)據(jù),推測(cè)該廠庫(kù)存的一批燈泡的質(zhì)量,進(jìn)而推測(cè)該廠生產(chǎn)的燈泡的質(zhì)量。2022/8/14 9:28/ 497例 5.1.2 產(chǎn)品的抽樣檢查2假設(shè)按照某種規(guī)定的標(biāo)

4、準(zhǔn),燈泡的壽命在3000h以上為正品,而在3000h以下為次品,同樣是例5.1.1中的10個(gè)樣品,其正品和次品的記錄為次品,次品,正品,正品,次品,正品,次品,次品,正品,次品。用這10個(gè)樣品的次品率,推測(cè)該廠庫(kù)存的一批燈泡的次品率,進(jìn)而推測(cè)該廠生產(chǎn)的燈泡的次品率。2022/8/14 9:28/ 498例 5.1.3 抽樣調(diào)查 從某個(gè)城市的居民中隨機(jī)地選取500人,調(diào)查他們的年齡、職業(yè)、受教育程度及年收入。由于數(shù)據(jù)量很大,不可能將這些數(shù)據(jù)全列出來(lái),只列出前5個(gè)人的調(diào)查結(jié)果于表5.1.1中。表5.1.1 城市居民調(diào)查表用500人的年齡、職業(yè)、教育程度及年收入的數(shù)據(jù)推測(cè)該城市居民的年齡、職業(yè)、教育

5、程度及年收入的狀況。2022/8/14 9:28/ 499例 5.1.4 為研究甲醛與尿素的反應(yīng)時(shí)間對(duì)所生成樹(shù)脂強(qiáng)度的影響,在三個(gè)反應(yīng)時(shí)間:80min,100min,120min分別做三次試驗(yàn),記錄下試驗(yàn)結(jié)果,列于表5.1.2中。表5.1.2 樹(shù)脂強(qiáng)度試驗(yàn)結(jié)果如果假定樹(shù)脂強(qiáng)度是反應(yīng)時(shí)間的未知函數(shù),由于在工業(yè)試驗(yàn)中,各種條件(例如試驗(yàn)溫度、原料純度、原料混合的均勻程度等)很難控制得十分穩(wěn)定。因此在相同設(shè)計(jì)條件(反應(yīng)時(shí)間)下所得到的結(jié)果具有隨機(jī)誤差。用這些帶隨機(jī)誤差的試驗(yàn)結(jié)果推測(cè)樹(shù)脂強(qiáng)度和反應(yīng)時(shí)間之間的未知函數(shù)關(guān)系。2022/8/14 9:28/ 4910統(tǒng)計(jì)學(xué)(數(shù)理統(tǒng)計(jì))的定義(續(xù)) 以上幾個(gè)例

6、子中,都需要在不確定情況下對(duì)總體狀態(tài)進(jìn)行預(yù)測(cè)或決策。之所以產(chǎn)生不確定性,是因?yàn)槲覀儫o(wú)法擁有進(jìn)行預(yù)測(cè)或決策所需的全部信息(總體數(shù)據(jù))。在使用不完全信息(樣本數(shù)據(jù),或隨機(jī)數(shù)據(jù))進(jìn)行預(yù)測(cè)和決策時(shí),必須借助于一種叫做統(tǒng)計(jì)推斷的統(tǒng)計(jì)方法。通過(guò)上面的例子大家對(duì)統(tǒng)計(jì)問(wèn)題應(yīng)該有了初步的了解。下面我們將介紹上面例子中涉及到的幾個(gè)統(tǒng)計(jì)學(xué)的基本概念,這些概念是對(duì)統(tǒng)計(jì)學(xué)的本質(zhì)和特征的概括和反映,是統(tǒng)計(jì)思維網(wǎng)絡(luò)上的結(jié)點(diǎn)。掌握了這些基本概念后,大家對(duì)統(tǒng)計(jì)問(wèn)題會(huì)有更深刻的認(rèn)識(shí)和理解。2022/8/14 9:28/ 49115.1.2 總體與總體分布總體和個(gè)體檢驗(yàn)一批燈泡的質(zhì)量城市居民調(diào)查從前面的幾個(gè)例子中,我們可以看出統(tǒng)計(jì)

7、問(wèn)題是探討研究對(duì)象全體的集體性質(zhì)。統(tǒng)計(jì)學(xué)中稱與研究問(wèn)題有關(guān)的所有研究對(duì)象全體組成的集合為總體(或母體) ,稱構(gòu)成總體的每個(gè)成員為個(gè)體。事實(shí)上,統(tǒng)計(jì)問(wèn)題就是研究總體的數(shù)量特征。2022/8/14 9:28/ 4912有限總體和無(wú)限總體統(tǒng)計(jì)學(xué)中構(gòu)成總體的個(gè)體不僅可以是人、物、組織單位等實(shí)體,也可以是現(xiàn)象、事件、活動(dòng)過(guò)程等非實(shí)體。但在個(gè)體是非實(shí)體時(shí),總體通常不是有形的,而是概念性的。如例5.1.4中,個(gè)體是每一次的試驗(yàn),這種個(gè)體顯然是個(gè)活動(dòng)過(guò)程,總體是所有可能的試驗(yàn)全體,這個(gè)總體顯然是概念性的總體。 總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量。容量為有限的總體稱為有限總體,容量為無(wú)限的總體稱為無(wú)限總體。

8、一般來(lái)說(shuō),由非實(shí)體組成的總體都是無(wú)限總體。2022/8/14 9:28/ 4913總體數(shù)量特征的特點(diǎn)統(tǒng)計(jì)中總體的數(shù)量特征具有如下兩個(gè)特點(diǎn):第一,總體數(shù)量特征同構(gòu)成總體的每個(gè)個(gè)體的一個(gè)或多個(gè)特征的取值都有關(guān)系,由于構(gòu)成總體的個(gè)體數(shù)目一般都非常之多,因而就單個(gè)個(gè)體而言它對(duì)總體數(shù)量特征的影響又很?。坏诙?,構(gòu)成總體的各個(gè)個(gè)體的特征的取值不是完全相同的,即個(gè)體特征具有變異性。如果構(gòu)成總體的每個(gè)個(gè)體的特征的取值都完全一模一樣,那么這個(gè)總體的數(shù)量特征除了總體總數(shù)外均等同于單個(gè)個(gè)體的特征,因而只要對(duì)其中的任一個(gè)個(gè)體進(jìn)行研究就可以了,不需要什么統(tǒng)計(jì)方法。因此要完全了解總體數(shù)量特征,必須了解總體中每個(gè)個(gè)體的相關(guān)特

9、征。通常一個(gè)總體有很多不同的數(shù)量特征,選擇什么樣的數(shù)量特征來(lái)研究完全取決于研究的目的。2022/8/14 9:28/ 4914總體的抽象定義該批燈泡壽命的全體就是總體燈泡的壽命所有城市居民的年齡、職業(yè)、教育程度和年收入的全體就是總體從以上總體數(shù)量特征的特點(diǎn)可知,我們感興趣的總體的數(shù)量特征實(shí)際上就是構(gòu)成總體的每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))相關(guān)特征的取值全體的集體性質(zhì)。因此,我們也稱這些特征的取值全體為總體;稱單個(gè)個(gè)體所對(duì)應(yīng)的特征的取值為個(gè)體。2022/8/14 9:28/ 4915總體變量與我們感興趣的總體數(shù)量特征相關(guān)的個(gè)體特征的取值全體實(shí)際上就是定義在總體上的函數(shù)。一方面由于函數(shù)值隨著個(gè)體的不同而變

10、化,另一方面由于我們感興趣的不是函數(shù)的對(duì)應(yīng)關(guān)系,而是所有個(gè)體所對(duì)應(yīng)的函數(shù)值全體,因此我們將這種函數(shù)稱為變量。又因變量是定義在總體上的,我們稱之為總體變量。2022/8/14 9:28/ 4916總體變量(續(xù))例5.1.1中的總體變量是燈泡壽命,它是一個(gè)定量變量,定量變量用于描述個(gè)體的數(shù)量特征。相應(yīng)的數(shù)據(jù)稱為定量數(shù)據(jù)。例5.1.2中的總體變量是由燈泡的壽命所定義的定性變量。定性變量用于描述個(gè)體所屬類別或等級(jí)。相應(yīng)的數(shù)據(jù)稱為定性數(shù)據(jù)。定性數(shù)據(jù)可以通過(guò)用數(shù)字表示不同類別或等級(jí)來(lái)進(jìn)行數(shù)量化。比如本例中可用0表示正品,用1表示次品實(shí)現(xiàn)數(shù)量化。2022/8/14 9:28/ 4917例5.1.3中的總體變

11、量是年齡、職業(yè)、教育程度和年收入。例5.1.4中的總體變量是樹(shù)脂強(qiáng)度。總體變量(續(xù))當(dāng)個(gè)體是非實(shí)體時(shí),把總體抽象為總體變量將更加方便。總體變量是統(tǒng)計(jì)學(xué)真正研究的對(duì)象,今后用X來(lái)表示。例5.1.4中的總體是某次試驗(yàn)的樹(shù)脂強(qiáng)度。2022/8/14 9:28/ 4918總體中的個(gè)體在總體變量的值域上所形成的分布就叫總體分布。總體分布包含了總體數(shù)量特征的全部信息。只要知道了總體分布,總體數(shù)量特征就完全清楚了。但要完全知道總體分布,就必須知道構(gòu)成總體的每個(gè)個(gè)體所對(duì)應(yīng)的變量值。統(tǒng)計(jì)推斷就是在無(wú)法獲得構(gòu)成總體的全部變量值的情況下,如何用獲得的部分變量值(有限個(gè))來(lái)推斷未知的總體分布。有了總體分布的概念,我們

12、可將總體變量當(dāng)作隨機(jī)變量,那么總體分布就是這個(gè)隨機(jī)變量的分布。總體分布2022/8/14 9:28/ 4919在很多情況下,特別是在個(gè)體是非實(shí)體的情況下,所研究的總體變量本身就是隨機(jī)變量,總體分布就是這個(gè)隨機(jī)變量的分布。如果所研究的總體變量不是隨機(jī)變量,那么可通過(guò)設(shè)計(jì)一個(gè)隨機(jī)試驗(yàn)(如隨機(jī)抽樣),使所研究的總體變量成為一個(gè)隨機(jī)變量。因此我們可以把所研究的總體變量看作一個(gè)隨機(jī)變量(或隨機(jī)向量),相應(yīng)的總體分布就是這個(gè)隨機(jī)變量(或隨機(jī)向量)的分布。我們感興趣的總體數(shù)量特征就是這個(gè)隨機(jī)變量(或隨機(jī)向量)的分布及其數(shù)字特征。因此,我們也可以稱隨機(jī)變量(或隨機(jī)向量)為總體,而總體分布就是這個(gè)隨機(jī)變量(或隨

13、機(jī)向量)的分布。統(tǒng)計(jì)推斷就是利用這個(gè)隨機(jī)變量(或隨機(jī)向量)的有限個(gè)觀察值來(lái)推斷其未知的分布或其數(shù)字特征??傮w分布(續(xù))2022/8/14 9:28/ 4920在實(shí)際問(wèn)題中,我們可以依據(jù)經(jīng)驗(yàn)和問(wèn)題的背景理論,設(shè)定總體分布的類型(如正態(tài)分布、伯努利分布、泊松分布等),我們稱所設(shè)定的總體分布的類型為理論模型。如果所設(shè)定的總體分布的類型是由有限個(gè)未知參數(shù)決定的,我們就稱之為參數(shù)模型。如果所設(shè)定的總體分布的類型不能由有限個(gè)未知參數(shù)決定的,我們就稱之為非參數(shù)模型。理論模型2022/8/14 9:28/ 4921在例5.1.1中,雖然燈泡壽命是有限的,但我們可假定總體變量取值于0,+),這一方面是因?yàn)槲覀儫o(wú)

14、法確定燈泡壽命的上限,另一方面是因?yàn)閷?duì)一個(gè)隨機(jī)變量擴(kuò)大其取值范圍,從數(shù)學(xué)角度看不僅沒(méi)有問(wèn)題而且還會(huì)帶來(lái)一些方便。我們可設(shè)定總體分布為均值的指數(shù)分布。在例5.1.2中,通過(guò)數(shù)量化后,可設(shè)定總體分布為參數(shù)p的伯努利分布,其中p為次品率。在例5.1.3中,總體變量X= (X1,X2,X3,X4)分別代表年齡、收入、職業(yè)和教育程度。在例5.1.4中,總體變量X的分布與反應(yīng)時(shí)間有關(guān)。2022/8/14 9:28/ 4922某人群由 N 個(gè)男生組成,記 N 個(gè)男生的身高數(shù)據(jù)為x1,x2,xN 。用隨機(jī)方法從人群中抽取一個(gè)人,記X為其身高的測(cè)量值,則X是個(gè)隨機(jī)變量,其分布為即為:例5.1. 5一萬(wàn)個(gè)身高數(shù)據(jù)

15、的直方圖近似于一條光滑的概率密度曲線總體x1,x2,xN的分組頻率分布就是對(duì)總體分布的近似。從分組頻率分布的直方圖可直觀地看出,在N時(shí),可以取每組的組距d0,因而直方圖就收斂于一條光滑的密度曲線。由于這個(gè)概率密度曲線與正態(tài)分布的概率密度曲線非常接近,因此可用正態(tài)分布作為身高這個(gè)數(shù)量指標(biāo)的理論模型。2022/8/14 9:28/ 4923某人群由 N 個(gè)人組成,其中有 N1個(gè)男性,記 p=N1/N為人群中男性所占比例。從這個(gè)人群中隨機(jī)抽出一個(gè)人,記 X 為被抽到的人的性別,并用 X=1 表示男性,X=0 表示女性。則數(shù)量化后的性別指標(biāo) X 就變成一個(gè)隨機(jī)變量,這個(gè)隨機(jī)變量就是總體,其分布(理論模

16、型)為:例5.1.6顯然這個(gè)分布即為性別的頻率分布,p 則為描述總體性別特征的一個(gè)參數(shù)。對(duì)這個(gè)總體,顯然有=E(X)=p。即總體性別特征可用總體均值來(lái)描述。 X 0p12022/8/14 9:28/ 4924例5.1.7要判斷一枚硬幣是否均勻,先對(duì)這枚硬幣進(jìn)行100次投擲試驗(yàn),然后根據(jù)這100次投擲試驗(yàn)的結(jié)果做出這枚硬幣是否均勻的結(jié)論。記 X 為投擲試驗(yàn)的結(jié)果,并用 X=1 表示國(guó)微向上,X=0 表示文字向上。則數(shù)量化后的指標(biāo) X 就變成一個(gè)隨機(jī)變量,用這個(gè)隨機(jī)變量表示總體,顯然比用全體投擲試驗(yàn)或全體投擲試驗(yàn)結(jié)果表示總體都來(lái)得方便。顯然總體分布(理論模型)為:其中 p 為投擲這枚硬幣時(shí),出現(xiàn)國(guó)

17、微向上這種結(jié)果的概率。 X 0p552441223113100只電子元件的壽命2022/8/14 9:28/ 4932在相同條件下對(duì)總體X進(jìn)行n次重復(fù)的、獨(dú)立的觀察,將n次觀察結(jié)果按試驗(yàn)的次序記為x1,x2,xn 。由于x1,x2,xn是對(duì)隨機(jī)變量X觀察的結(jié)果,且各次觀察是在相同的條件下獨(dú)立進(jìn)行的,所以有理由認(rèn)為(x1,x2,xn)是 n 個(gè)獨(dú)立同分布(IID),共同分布就是總體分布的隨機(jī)變量組成的 n 維隨機(jī)向量(X1,X2,Xn)的一次實(shí)現(xiàn)。稱這種n 維隨機(jī)向量( X1,X2,Xn ) 為簡(jiǎn)單樣本(或IID樣本)。隨機(jī)性和獨(dú)立性是簡(jiǎn)單隨機(jī)樣本的兩個(gè)基本要求。簡(jiǎn)單樣本2022/8/14 9:

18、28/ 4933對(duì)于有限總體,采用有放回抽樣就能得到簡(jiǎn)單樣本,但有放回抽樣使用起來(lái)不方便,當(dāng)總體中的個(gè)體總數(shù)N比要抽取的樣本容量大得多時(shí),在實(shí)際中可將不放回抽樣近似地當(dāng)作放回抽樣來(lái)處理。至于無(wú)限總體,由于抽取一個(gè)個(gè)體不影響它的分布,所以總是用不放回抽樣。在生產(chǎn)過(guò)程中,每隔一定時(shí)間抽取一個(gè)個(gè)體,抽取n個(gè)就得到一個(gè)簡(jiǎn)單樣本。實(shí)驗(yàn)室中的記錄,試制新產(chǎn)品得到的樣品質(zhì)量指標(biāo),也常被認(rèn)為是簡(jiǎn)單樣本。簡(jiǎn)單樣本(續(xù))由于本課程的大部分內(nèi)容是討論簡(jiǎn)單樣本,今后在不引起混淆時(shí)將簡(jiǎn)單樣本簡(jiǎn)稱為樣本。2022/8/14 9:28/ 4934設(shè)有一批產(chǎn)品共有N件,需要進(jìn)行抽樣檢驗(yàn)以了解其不合格品率p,現(xiàn)抽取n件逐一檢查

19、它們是否是不合格品。如果記合格品為0,不合格品為1,則樣本x1, x2 , xn不具有獨(dú)立性,因而不是簡(jiǎn)單隨機(jī)樣本。例5.1.112022/8/14 9:28/ 4935簡(jiǎn)單樣本的樣本分布2022/8/14 9:28/ 4936正態(tài)總體的樣本分布2022/8/14 9:28/ 4937伯努利總體的樣本分布2022/8/14 9:28/ 4938泊松總體 的樣本分布2022/8/14 9:28/ 4939事實(shí)上我們抽樣后得到的數(shù)據(jù)都是具體的、確定的樣本值(隨機(jī)數(shù)據(jù))。如我們從全班同學(xué)中抽取2人測(cè)量身高,得到2個(gè)數(shù),它們是樣本值而不是樣本。我們只能觀察到隨機(jī)變量的取值而見(jiàn)不到隨機(jī)變量??傮w、樣本、

20、樣本值的關(guān)系2022/8/14 9:28/ 4940總體(理論分布) ? 樣本 樣本值統(tǒng)計(jì)是從手中已有的數(shù)據(jù)-樣本值,去推斷總體的情況-總體分布F(x)的特征。總體分布決定了樣本取值的概率規(guī)律,也就是從樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體。樣本是聯(lián)系樣本值和總體分布的橋梁總體、樣本、樣本值的關(guān)系(續(xù))2022/8/14 9:28/ 49415.1.4 統(tǒng)計(jì)學(xué)的研究?jī)?nèi)容研究如何用有效的方法收集的抽樣調(diào)查、試驗(yàn)設(shè)計(jì)和概括數(shù)據(jù)的描述性統(tǒng)計(jì);研究如何用有效的方法對(duì)所得的數(shù)據(jù)進(jìn)行分析、研究,從而對(duì)所研究的對(duì)象的性質(zhì) 、特點(diǎn)作出推斷的統(tǒng)計(jì)推斷(“樣本”推斷“總體”)。依據(jù)推斷形式不同,統(tǒng)計(jì)推斷

21、可分為估計(jì)和假設(shè)檢驗(yàn)兩種,它們構(gòu)成了統(tǒng)計(jì)學(xué)的基礎(chǔ) 。依據(jù)不同的理論模型,統(tǒng)計(jì)推斷可分為許多不同的分支學(xué)科。比如,參數(shù)和非參數(shù)、線性和非線性、方差分析、回歸分析、時(shí)間序列分析、多元統(tǒng)計(jì)分析等等。依據(jù)對(duì)概率的不同解釋,統(tǒng)計(jì)推斷可分為頻率統(tǒng)計(jì)和貝葉斯統(tǒng)計(jì)。頻率的穩(wěn)定值對(duì)某件事情發(fā)生機(jī)會(huì)的信念2022/8/14 9:28/ 49425.1.5 統(tǒng)計(jì)推斷與概率論的區(qū)別在概率論中,我們研究的隨機(jī)變量的分布都是假設(shè)已知的,在這一前題下去研究它的性質(zhì)、特點(diǎn)和規(guī)律性。例如求出它的數(shù)字特征,討論隨機(jī)變量函數(shù)的分布,介紹常用的各種分布等。統(tǒng)計(jì)推斷以概率論為理論基礎(chǔ),根據(jù)試驗(yàn)或觀察得到的數(shù)據(jù),來(lái)研究隨機(jī)現(xiàn)象,對(duì)研究對(duì)

22、象的客觀規(guī)律性作出種種合理的估計(jì)和判斷。在統(tǒng)計(jì)推斷中,我們研究的隨機(jī)變量的分布是未知的,或者是不完全知道的,人們是通過(guò)對(duì)研究的隨機(jī)變量進(jìn)行重復(fù)獨(dú)立的觀察,得到許多觀察值,對(duì)這些數(shù)據(jù)進(jìn)行分析,從而對(duì)所研究的隨機(jī)變量的分布作出種種推斷。2022/8/14 9:28/ 49435.1.6 統(tǒng)計(jì)學(xué)與數(shù)學(xué)的區(qū)別由于統(tǒng)計(jì)需要大量的數(shù)學(xué),而且現(xiàn)代統(tǒng)計(jì)的基礎(chǔ)也是數(shù)學(xué)家所奠定的,因此統(tǒng)計(jì)也被人認(rèn)為是數(shù)學(xué)的一個(gè)分支。但是統(tǒng)計(jì)和數(shù)學(xué)有很大的區(qū)別。數(shù)學(xué)的思維是以演繹為主(從一些假設(shè)、命題、已知的事實(shí)等出發(fā),按一定的邏輯推理去得出結(jié)論);而統(tǒng)計(jì)的思維是以歸納為主(從所觀察到的大量個(gè)別情況中“歸納”起來(lái)得出結(jié)論),兼有演

23、繹。例如,在幾何學(xué)中要證明“等腰三角形底角相等”只須從“等腰”這個(gè)前提出發(fā),運(yùn)用幾何公理,一步一步推出這個(gè)結(jié)論。而一個(gè)習(xí)慣于統(tǒng)計(jì)思維的人,就可能想出這樣的方法:做很多大小形狀不一的等腰三角形,實(shí)地測(cè)量其底角,看差距如何,根據(jù)所得資料看看可否作出“底角相等”的結(jié)論,這樣做就是歸納推理的方法。2022/8/14 9:28/ 4944在數(shù)學(xué)中,是非是明確的;但統(tǒng)計(jì)從來(lái)不絕對(duì)地說(shuō)“是”或者“不是”,只說(shuō)可能,而且提供可能發(fā)生的概率。統(tǒng)計(jì)只說(shuō)可能性是現(xiàn)實(shí)世界的真實(shí)體現(xiàn),真實(shí)世界充滿了不確定性。從某種意義來(lái)說(shuō),生活中唯一確定的事情就是其不確定性。和音樂(lè)類似,數(shù)學(xué)圈內(nèi)的人士可以欣賞數(shù)學(xué)本身的美妙的境界。數(shù)學(xué)

24、的很多內(nèi)容可以和真實(shí)世界沒(méi)有任何關(guān)系。而旨在為各個(gè)領(lǐng)域服務(wù)的統(tǒng)計(jì)如果滿足于欣賞自己的“魅力”,那統(tǒng)計(jì)就沒(méi)有存在的必要了。學(xué)習(xí)數(shù)學(xué)的關(guān)鍵在公式和定理的推導(dǎo)和證明;但對(duì)初學(xué)者來(lái)講,學(xué)習(xí)統(tǒng)計(jì)的關(guān)鍵在理解隱藏在公式和定理背后的統(tǒng)計(jì)思想。而對(duì)公式和定理的推導(dǎo)和證明則是其次。統(tǒng)計(jì)學(xué)與數(shù)學(xué)的區(qū)別(續(xù))2022/8/14 9:28/ 49455.1.7 統(tǒng)計(jì)軟件由于統(tǒng)計(jì)和數(shù)據(jù)打交道,沒(méi)有計(jì)算機(jī)的發(fā)展統(tǒng)計(jì)就沒(méi)有前途,計(jì)算機(jī)和統(tǒng)計(jì)的發(fā)展相輔相成。統(tǒng)計(jì)軟件的發(fā)展,使得統(tǒng)計(jì)從統(tǒng)計(jì)學(xué)家的圈內(nèi)游戲變成了大眾的游戲。只要你輸入你的數(shù)據(jù),點(diǎn)幾下鼠標(biāo),做一些選項(xiàng),馬上就得到令人驚嘆的漂亮結(jié)果了。你可能會(huì)問(wèn),是否傻瓜式的統(tǒng)計(jì)軟件使用可以代替統(tǒng)計(jì)課程了?當(dāng)然不是。數(shù)據(jù)的整理和識(shí)別,方法的選用,計(jì)算機(jī)輸出結(jié)果的理解都不象使用傻瓜相機(jī)那樣簡(jiǎn)單可靠。2022/8/14 9:28/ 4946有些諸如法律和醫(yī)學(xué)方面的軟件都有不少警告,不時(shí)提醒你去咨詢專家。但統(tǒng)計(jì)軟件則不那么負(fù)責(zé)。只要數(shù)據(jù)格式無(wú)誤、方法不矛盾而且不用零作為除數(shù)就一定給你結(jié)果,而且沒(méi)有任何警告。另外,統(tǒng)計(jì)軟件輸出的結(jié)果太多;即使是同樣的方法,不同軟件輸出的內(nèi)容還不一樣;有時(shí)同樣的內(nèi)容名稱也不一樣。這就使得使用者大傷腦筋。即使是統(tǒng)計(jì)學(xué)家也不一定能解釋所有的輸出。因此,就應(yīng)該特別留神,明白自己是在干什么。不要在得到一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論