質(zhì)量工程師:數(shù)理統(tǒng)計(jì)基本知識(shí)(共9頁)_第1頁
質(zhì)量工程師:數(shù)理統(tǒng)計(jì)基本知識(shí)(共9頁)_第2頁
質(zhì)量工程師:數(shù)理統(tǒng)計(jì)基本知識(shí)(共9頁)_第3頁
質(zhì)量工程師:數(shù)理統(tǒng)計(jì)基本知識(shí)(共9頁)_第4頁
質(zhì)量工程師:數(shù)理統(tǒng)計(jì)基本知識(shí)(共9頁)_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上質(zhì)量工程師(初級)相關(guān)知識(shí)輔導(dǎo):數(shù)理統(tǒng)計(jì)基本常識(shí)(1)學(xué)習(xí)數(shù)理統(tǒng)計(jì)最重要的是樹立統(tǒng)計(jì)思想,同時(shí)要善于聯(lián)系實(shí)際,從而達(dá)到掌握數(shù)理統(tǒng)計(jì)基本理論和方法的目的。 學(xué)習(xí)目標(biāo)1掌握總體、個(gè)體、樣本及統(tǒng)計(jì)量的概念2熟悉數(shù)據(jù)的整理方法3掌握樣本均值、中位數(shù)的概念與計(jì)算4掌握樣本極差、方差、標(biāo)準(zhǔn)差的概念與計(jì)算一 總體與個(gè)體1 總體與個(gè)體定義:在一個(gè)統(tǒng)計(jì)問題中,稱研究對象的全體為總體。構(gòu)成總體的每個(gè)成員或每個(gè)研究對象稱為個(gè)體。例如,一批燈泡是總體,其中的每個(gè)燈泡是個(gè)體;一個(gè)城市的人口是總體,這個(gè)城市的每個(gè)人是個(gè)體。我們通常關(guān)心某個(gè)總體的某個(gè)(某些)數(shù)量指標(biāo)(或數(shù)量化的屬性特征)

2、,一般用X表示所要考察的數(shù)量指標(biāo)(如燈泡的壽命,零件的尺寸,兒童的身高等)。隨機(jī)試驗(yàn)是從總體中隨機(jī)地取出一個(gè)個(gè)體,測定這個(gè)數(shù)量指標(biāo)的值X,那么X作為隨機(jī)試驗(yàn)中被測量的量是一個(gè)隨機(jī)變量,稱它為表征總體的隨機(jī)變量。例如,對于燈泡這個(gè)總體,燈泡的使用壽命就是表征它的隨機(jī)變量;對于零件這個(gè)總體,零件的尺寸就是表征它的隨機(jī)變量。當(dāng)然,有時(shí)候一個(gè)總體會(huì)有多個(gè)數(shù)量指標(biāo),比如對于某個(gè)學(xué)校的學(xué)生這個(gè)總體,我們不僅僅只關(guān)心學(xué)生的學(xué)習(xí)成績,還關(guān)心他的思想狀況、身體狀況等等。 (1)統(tǒng)計(jì)學(xué)主要的任務(wù)若關(guān)心的是研究對象的某個(gè)數(shù)量指標(biāo),那么將每個(gè)個(gè)體具有的數(shù)量指標(biāo)x稱為個(gè)體,這樣一來,總體就是某數(shù)量指標(biāo)值x的全

3、體,是一堆數(shù)。若從總體中隨機(jī)抽取一個(gè)個(gè)體,它的數(shù)量指標(biāo)x隨所抽取個(gè)體而變,從而總體也相應(yīng)于一個(gè)隨機(jī)變量X,它有一個(gè)分布,從而總體可用一個(gè)分布描述。簡單地說,總體就是一個(gè)分布,不同總體有不同分布。統(tǒng)計(jì)學(xué)主要的任務(wù)就是:l 研究總體是什么分布?l 這個(gè)總體(分布)的均值、方差(或標(biāo)準(zhǔn)差)各是多少?例1 對某產(chǎn)品僅考察其合格與否,并記合格品為0,不合格品為1。分析:總體=該產(chǎn)品的全體=由0或1組成的一堆數(shù)若記l在總體中所占比例為P,則該總體可用如下二項(xiàng)分布b(1,P)(n=l的二項(xiàng)分布)表示:例2有兩個(gè)工廠生產(chǎn)同一產(chǎn)品,甲廠的不合格品率P=0.01,乙廠的不合格品率P=0.08,甲乙兩廠所生產(chǎn)的產(chǎn)品

4、(即兩個(gè)總體)分別用如下兩個(gè)分布描述:例3考察某橡膠件( 質(zhì)量工程師考試網(wǎng) )的抗張強(qiáng)度。它可用0到上的一個(gè)實(shí)數(shù)表示,這時(shí)總體可用區(qū)間0,上的一個(gè)概率分布表示。國內(nèi)外橡膠業(yè)對其抗張強(qiáng)度有較多研究,認(rèn)為橡膠件的抗張強(qiáng)度服從正態(tài)分布 ,該總體常稱為正態(tài)總體。這時(shí)統(tǒng)計(jì)要研究的主要問題是:正態(tài)均值 是多少?正態(tài)方差 是多少?例4 用非對稱分布(偏態(tài)分布)描述的總體也和常見。例如某型號電視機(jī)的壽命全體所構(gòu)成的總體就是一個(gè)偏態(tài)分布。又如兩個(gè)不同的正態(tài)總體混合也可以產(chǎn)生一個(gè)偏態(tài)總體。如將兩位不同的操作工(或在不同機(jī)器上,或用不同原料,或不同轉(zhuǎn)速等)生產(chǎn)的同一種零件混在一起,其質(zhì)量特性常呈偏態(tài)分布,應(yīng)該重視考

5、察偏態(tài)分布產(chǎn)生的原因。質(zhì)量工程師(初級)相關(guān)知識(shí)輔導(dǎo):數(shù)理統(tǒng)計(jì)基本常識(shí)(2)二 樣本與樣本容量為了對總體的分布進(jìn)行各種分析推斷,就必須對總體進(jìn)行抽樣(取樣)。直觀地講,就是抽取一些個(gè)體進(jìn)行觀察或試驗(yàn);抽象地講,就是對總體X進(jìn)行觀測。1樣本的概念樣本:從總體中抽取部分個(gè)體所組成的集合稱為樣本。2樣本容量樣本中所包含個(gè)體的個(gè)數(shù),或樣本所含的元素個(gè)數(shù),稱為樣本容量。常用n表示。樣本中的個(gè)體有時(shí)也稱為樣品,如對總體X進(jìn)行了n次觀測,記Xi為第i次觀測所得的結(jié)果,稱(X1,X2,Xn)為容量是n的樣本。3抽樣的意義人們從總體中( 質(zhì)量工程師考試網(wǎng) )抽取樣本是為了認(rèn)識(shí)總體。即從樣本推斷總體,如推斷總體是

6、什么分布?總體均值為多少?總體的標(biāo)準(zhǔn)差是多少?為了使此種統(tǒng)計(jì)推斷有所依據(jù),推斷結(jié)果有效,由樣本獲得對總體的正確認(rèn)識(shí),需要對抽樣方法有一定的要求。如為了了解女性所占的比例,不能專門到坦克部隊(duì)去取樣,也不能專門到紡織廠去取樣,而應(yīng)當(dāng)進(jìn)行隨機(jī)抽樣。直觀地講就是抽樣時(shí),每個(gè)個(gè)體被抽到的可能性相同。下面介紹一種常見的抽樣方法。4簡單隨機(jī)樣本簡單隨機(jī)樣本:滿足下面兩個(gè)條件的樣本稱為簡單隨機(jī)樣本,簡稱隨機(jī)樣本,或樣本。簡單隨機(jī)樣本的基本特點(diǎn):(1)隨機(jī)性??傮w中每個(gè)個(gè)體都有相同的機(jī)會(huì)加入樣本。例如,按隨機(jī)性要求抽出5個(gè)樣品,記為 ,則其中每一個(gè)都應(yīng)與總體分布相同。只要隨機(jī)抽樣就可保證此點(diǎn)實(shí)施。(2)獨(dú)立性。

7、從總體中抽取的每個(gè)個(gè)體對其他個(gè)體的抽取無任何影響。假如總體是無限的,獨(dú)立性容易實(shí)現(xiàn),若總體很大,特別與樣本量n相比是很大時(shí),即使總體是有限的,此種抽樣獨(dú)立性也可基本得到保證。即把在不變的條件下對總體X的n次獨(dú)立觀測(如n次放回抽樣)叫做n次簡單隨機(jī)取樣,這樣得到的樣本稱為簡單隨機(jī)樣本。定義:設(shè)(X1,X2,Xn)為取自總體X的樣本,如果X1,X2,Xn相互獨(dú)立且與總體X同分布(簡稱X1,X2,Xn獨(dú)立同分布),則稱此樣本為簡單隨機(jī)樣本。注釋:今后討論的樣本都是指滿足這些要求的簡單隨機(jī)樣本。在實(shí)際抽樣時(shí),也應(yīng)按此要求從總體中進(jìn)行抽樣。這樣獲得的樣本能夠很好地反映實(shí)際總體的狀態(tài)。兩個(gè)不同的總體,若

8、是按隨機(jī)性和獨(dú)立性要求進(jìn)行抽樣,則機(jī)會(huì)大的地方(概率密度值大被抽到樣本的個(gè)體就多;而機(jī)會(huì)少的地方(概率密度值小),被抽到樣本的個(gè)體就少。分布愈分散,樣本也就分散;分布愈集中,樣本也相對集中。抽樣切忌受到干擾,特別是人為干擾。某些人為的傾向性會(huì)使所得樣本不是簡單隨機(jī)樣本,從而使最后的統(tǒng)計(jì)推斷失效。5樣本的觀測值若 是從總體X中獲得的樣本,那么 是獨(dú)立同分布的隨機(jī)變量。所以樣本(X1,X2,Xn)是一個(gè)隨機(jī)向量,它的每個(gè)可能值稱為樣本觀測值,用(x1,x2,xn)表示樣本觀測值。簡稱為樣本值。樣本的觀測值用 表示,這也是我們常說的數(shù)據(jù)。有時(shí)為方便起見,不分大寫與小寫,樣本及其觀測值都用 表示,今后

9、將采用這一方法表示。質(zhì)量工程師(初級)相關(guān)知識(shí)輔導(dǎo):數(shù)理統(tǒng)計(jì)基本常識(shí)(3)統(tǒng)計(jì)量與抽樣分布樣本來自總體,因此樣本中包含了有關(guān)總體的豐富信息,但是這些信息是零散的,為了把這些零散的信息集中起來反映總體的特征,我們?nèi)〉脴颖局?,并不是直接利用樣本進(jìn)行推斷,而需要對樣本進(jìn)行一番“加工”和“提煉”,把樣本中所包含的有關(guān)信息盡可能地集中起來,種有效的辦法就是針對不同的問題,構(gòu)造出樣本的某種函數(shù),這就是統(tǒng)計(jì)量。不同的函數(shù)可以反映總體的不同的特征。1統(tǒng)計(jì)量把不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計(jì)量。一個(gè)統(tǒng)計(jì)量也是一個(gè)隨機(jī)變量。定義:設(shè)(X1,X2,Xn)為取自總體X的一個(gè)樣本,g(X1,X2,Xn)為一個(gè)連續(xù)函數(shù),

10、如果這個(gè)函數(shù)中不包含任何未知參數(shù),則稱g(X1,X2,Xn)為一個(gè)統(tǒng)計(jì)量。例如,設(shè)XN(m ,s 2),其中m 已知,s 2未知,(X1,X2,Xn)為取自X的樣本,則 是統(tǒng)計(jì)量, 不是統(tǒng)計(jì)量。統(tǒng)計(jì)量是樣本的函數(shù),因而統(tǒng)計(jì)量是隨機(jī)變量。由統(tǒng)計(jì)量進(jìn)行推斷,便可獲得對總體的認(rèn)識(shí),統(tǒng)計(jì)推斷是數(shù)理統(tǒng)計(jì)的核心內(nèi)容。2抽樣分布統(tǒng)計(jì)量的分布稱為抽樣分布。例5:從均值為 ,方差為 的總體中抽得一個(gè)樣本量為n的樣本 ,其中 與 均未知。在此情形, 是統(tǒng)計(jì)量;而 , 都不是統(tǒng)計(jì)量,因?yàn)楹笳甙?, 等未知參數(shù)。3常用統(tǒng)計(jì)量常用統(tǒng)計(jì)量可分為兩類,一類用來描述樣本的中心位置,另一類用來描述樣本的分散程度。為此先介紹有

11、序樣本的概念,再引入幾個(gè)常用統(tǒng)計(jì)量。有序樣本設(shè) 是從總體X中隨機(jī)抽取的樣本,樣本量為n,將它們的觀測值從小到大排列為: ,這便是有序樣本。其中 是樣本中的最小觀測值, 是樣本中的最大觀測值。例6 從某種合金強(qiáng)度總體中隨機(jī)抽取樣本量為5的樣本,記為 ,樣本觀測值為:140,150,155,130,145解析:將它們從小到大排序后為:130,140,145,150,155,這便是有序樣本,其中最小的觀測值為 =30,最大的觀測值為 =155。(1)描述樣本的中心位置的統(tǒng)計(jì)量總體中每一個(gè)個(gè)體的取值盡管是有差異的,但是總有一個(gè)中心位置,如樣本均值、樣本中位數(shù)等。描述樣本中心位置的統(tǒng)計(jì)量反映了總體的中心

12、位置,常用的有以下幾種:樣本均值樣本觀測值有大有小,樣本均值大致處于樣本的中間位置,它可以反映總體分布的均值。例7 上例數(shù)據(jù): ,樣本觀測值為:140,150,155,130,145。樣本均值為 =(140+150+155+130+145)/5=144。對分組數(shù)據(jù),樣本均值的近似值為其中 是分組數(shù), 是第 組的組中值, 是第 組的頻數(shù), 。例8 下表是經(jīng)過整理的分組數(shù)據(jù)表,給出了110個(gè)電子元件的失效時(shí)間:分組區(qū)間0,400400,800)800,1200)1200,1600)1600, 2000)2000,2400)組中值xi頻數(shù)ni解析:平均失效時(shí)間近似為:= 1170.9樣本中位數(shù)中位數(shù)

13、有時(shí)也記為Me。當(dāng)n為奇數(shù), 當(dāng)n為偶數(shù)例9 現(xiàn)有兩組數(shù)據(jù)(已經(jīng)排序):2,3,4,4,5,5,5,5,6,6,7,7,82,4,4,4,5,6,6,7,7,8,8,8,9,9解析:第一組共有13個(gè)數(shù)據(jù),處于中間位置的是第7個(gè)數(shù)據(jù),樣本中位數(shù)即為 。第二組共有14個(gè)數(shù)據(jù),處于中間位置的是第7,8個(gè)數(shù)據(jù),樣本中位數(shù)即為 。(3)描述樣本數(shù)據(jù)分散程度的統(tǒng)計(jì)量總體中各個(gè)個(gè)體的取值總是有差別的,因此樣本的觀測值也是有差異的,這種差異有大有小,反映樣本數(shù)據(jù)的分散程度的統(tǒng)計(jì)量實(shí)際上反映了總體取值的分散程度,常用的有如下幾種:樣本極差:例10 數(shù)據(jù)為 ,樣本觀測值為:140,150,155,130,145,

14、那么將它們從小到大排序后為:130,140,145,150,155解析:最小值為130,最大值為155,因此樣本極差R=155-130=25樣本方差:同樣,對分組數(shù)據(jù)來講,樣本方差的近似值為:其中 表示第i組的組中值。例11 數(shù)據(jù)為 ,樣本觀測值為:140,150,155,130,145解析:上式有兩個(gè)簡化的計(jì)算公式:樣本極差的計(jì)算十分簡便,但對樣本中的信息利用得也較少,而樣本方差就能充分利用樣本中的信息,因此在實(shí)際中樣本方差比樣本極差用得更廣。樣本標(biāo)準(zhǔn)差:在上例中 。在例8中,樣本標(biāo)準(zhǔn)差的意義:樣本方差盡管對數(shù)據(jù)的利用是充分的,但是方差的量綱(即數(shù)據(jù)的單位)是原始量綱的平方,例如樣本觀測值是

15、長度,單位是“毫米”,而方差的單位是“平方毫米”,單位不同就不便于比較,而采用樣本標(biāo)準(zhǔn)差就消除了單位的差異。質(zhì)量工程師(初級)相關(guān)知識(shí)輔導(dǎo):數(shù)理統(tǒng)計(jì)基本常識(shí)(4)樣本數(shù)據(jù)的整理從總體x中獲得的樣本是總體的一個(gè)縮影,具有豐富信息的數(shù)據(jù),我們需要對數(shù)據(jù)進(jìn)行加工,將有用的信息提取出來,以便對總體有所了解。對數(shù)據(jù)加工有兩種方法:一是計(jì)算統(tǒng)計(jì)量,二是利用圖形與表格。上面提到的便是常用的統(tǒng)計(jì)量,它具有概括性,但不夠形象,下面給出對數(shù)據(jù)進(jìn)行整理的表格與圖形描述。我們結(jié)合一個(gè)例子來敘述對計(jì)置數(shù)據(jù)給出頻數(shù)頻率分布表的步驟。例12 食品廠用自動(dòng)裝罐機(jī)生產(chǎn)罐頭食品,由于工藝的限制,每個(gè)罐頭的實(shí)際重量有所波動(dòng),現(xiàn)從一

16、批罐頭中隨機(jī)抽取100個(gè)稱其凈重,數(shù)據(jù)如下:342 352 346 344 343 339 336 342 347 340 340 350 347 336 341349 346 348 342 346 347 346 346 345 344 350 348 352 340 356339 348 338 342 347 347 344 343 349 341 348 341 340 347 342337 344 340 344 346 342 344 345 338 351 348 345 339 343 345346 344 344 344 343 345 345 350 353 345 352 350 345 343 347354 350 343 350 344 351 348 352 344 345 349 332 343 3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論