版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基礎(chǔ)統(tǒng)計(jì)1基礎(chǔ)統(tǒng)計(jì)1教育目標(biāo)
訂立進(jìn)行6-SIGMA必要的基礎(chǔ)統(tǒng)計(jì)的概念理解離散概率分布及連續(xù)概率分布的概念基礎(chǔ)統(tǒng)計(jì)的內(nèi)容與6-SIGMAMetrics聯(lián)貫理解熟知Minitap的基礎(chǔ)使用方法基礎(chǔ)統(tǒng)計(jì)與Minitap聯(lián)貫理解收集的數(shù)據(jù)利用Minitap分析2教育目標(biāo)訂立進(jìn)行6-SIGMA必要的基礎(chǔ)統(tǒng)計(jì)的概念2統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)的概念在日常生活中經(jīng)常接觸,且每天都在使用-為預(yù)測(cè)棒球比賽的勝負(fù),調(diào)查各個(gè)Team的過去勝率-用收集的氣象資料預(yù)測(cè)天氣統(tǒng)計(jì)學(xué)為了對(duì)不確實(shí)的未來的預(yù)測(cè)提供必要的情報(bào)收集,分類,分析資料及以此為基礎(chǔ)提示結(jié)論的學(xué)問3統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)的概念在日常生活中經(jīng)常接觸,且每天都在使用3母集團(tuán)的標(biāo)本作為關(guān)心對(duì)象的所有個(gè)體的集合稱母集團(tuán),在母集團(tuán)中作為調(diào)查對(duì)象采納的一部分稱為標(biāo)本母集團(tuán)標(biāo)本
母集團(tuán)的特性:母數(shù)平均μ
分散2
標(biāo)準(zhǔn)偏差
標(biāo)本的特性:統(tǒng)計(jì)量平均分散S2
標(biāo)本偏差S如果能夠正確計(jì)算母集團(tuán)的母數(shù)時(shí)沒有問題,但如果很難知道的情況下,用標(biāo)本計(jì)算出的統(tǒng)計(jì)量推定母數(shù)。4母集團(tuán)的標(biāo)本作為關(guān)心對(duì)象的所有個(gè)體的集合稱母集團(tuán),在母集團(tuán)中母集團(tuán),標(biāo)本及資料母集團(tuán)(Population)和種類1)有限母集團(tuán):形成母集團(tuán)的元素的個(gè)數(shù)為有限例)出荷LOT內(nèi)制品的數(shù)2)無限母集團(tuán):形成母集團(tuán)的元素的個(gè)數(shù)為無限例)工程中生產(chǎn)的制品數(shù)
標(biāo)本(Sample)取出的重要性-標(biāo)本取出時(shí)應(yīng)盡可能沒有偏差例)嘗一鍋湯的味道時(shí),如不用勺子攪勻,而只嘗上面部分會(huì)怎樣?-標(biāo)本取出方法:?jiǎn)渭冸S機(jī)取出,層別取出,群集取出,體系的取出
資料(Data)的種類1)量的變量:大小和量可以用數(shù)字表現(xiàn)的變量-離散型變量:可數(shù)的,如不良品數(shù),缺點(diǎn)數(shù)等計(jì)數(shù)值數(shù)據(jù)-連續(xù)型變量:是連續(xù)的值,拉力,長(zhǎng)度等計(jì)量值數(shù)據(jù)2)質(zhì)的變量:無法表示大小或量的變量:性別,宗教,職業(yè)等5母集團(tuán),標(biāo)本及資料母集團(tuán)(Population)和種類分布的特性統(tǒng)計(jì)分析是找出資料分布具有的特性用數(shù)字表示的作業(yè)。
分布的特性
集中化傾向(算術(shù)平均,中央值,最頻數(shù))-顯示資料集中在什么位置分散度(范圍,分散,標(biāo)準(zhǔn)偏差)-資料以算術(shù)平均為中心擴(kuò)散的程度非對(duì)稱度-資料傾向于哪一側(cè)?6分布的特性統(tǒng)計(jì)分析是找出資料分布具有的特性用數(shù)字表示的作業(yè)。集中化傾向
最頻數(shù)(Mode)
最頻數(shù)是資料分布中出現(xiàn)頻率最多的數(shù)
中央值(Median)
數(shù)值按大小排序觀察其位置1)資料為單數(shù)時(shí):中間的資料2)資料為偶數(shù)時(shí):(中間兩個(gè)資料的和)/2
算術(shù)平均
母集團(tuán)的平均標(biāo)本的平均μ==X1+X2+X3+…+Xn
N∑Xi
NX==X1+X2+X3+…+Xnn∑Xi
n7集中化傾向最頻數(shù)(Mode)
最頻數(shù)是資料分布分散度
范圍資料的集團(tuán)中最大的數(shù)值和最小數(shù)值的差異
分散和標(biāo)本偏差母集團(tuán)的分散母集團(tuán)的標(biāo)準(zhǔn)偏差
標(biāo)本的分散標(biāo)本的標(biāo)準(zhǔn)偏差算術(shù)平均為一次元的值,分散是二次元,因此求分散的開方標(biāo)準(zhǔn)偏差。標(biāo)本統(tǒng)計(jì)量失去一個(gè)自由度,因此標(biāo)本時(shí)具有n-1的自由度2=∑(Xi–X)2
N
=∑(Xi–X)2
NS2=∑(Xi–X)2
n-1S
=∑(Xi–X)2
n-18分散度范圍2=∑(Xi–X)2特性值 母數(shù) 統(tǒng)計(jì)量集團(tuán)數(shù) N n平均 X分散 2 s2標(biāo)準(zhǔn)偏差 s相關(guān)系數(shù) r回歸系數(shù) , a,b誤差 e母數(shù)和統(tǒng)計(jì)量的符號(hào)比較9特性值 母數(shù) 統(tǒng)計(jì)量母數(shù)和統(tǒng)計(jì)量的符號(hào)比較9概率理論
概率的定義:對(duì)所有具有發(fā)生可能性,特定事件發(fā)生的可能性
標(biāo)本空間:發(fā)生的可能性相同的全部情況的數(shù)思想:屬于事件A的情況的數(shù)概率變量:從測(cè)定值可得到的所有集合稱為標(biāo)本空間,對(duì)標(biāo)本空間的各各值付予實(shí)數(shù)的函數(shù)稱為概率變量。如(H,1/2)集合的概論概率分布:對(duì)概率變量可取的所有值,將其取值的概率用圖或表顯示的稱為概率分布離散概率分布:對(duì)應(yīng)于可數(shù)的概率變量如不良數(shù)或缺點(diǎn)數(shù)的概率分布連續(xù)概率分布:具有不可數(shù)的連續(xù)值如制品的重量或尺寸的概率分布P(A)
=思想標(biāo)本空間10概率理論概率的定義:對(duì)所有具有發(fā)生可能性,特定事件發(fā)生的概率理論
概率密度函數(shù)(ProbabilityDensityFunction)對(duì)應(yīng)于概率變量的概率的關(guān)系表示為函數(shù)的稱為概率密度函數(shù)概率密度函數(shù)總是+值,全體的和為1。6-Sigma使用的概率密度函數(shù)1)離散概率密度函數(shù)?超幾何分布?二項(xiàng)分布?帕松分布2)連續(xù)型概率密度函數(shù)?正態(tài)分布?t-分布?F-分布?2-分布
11概率理論概率密度函數(shù)(ProbabilityDens超幾何分布(Hyper-geometricdistribution)超幾何分布是以非復(fù)元取出,每次成功概率不一定時(shí)適用的分布,每次實(shí)行獨(dú)立時(shí)為二項(xiàng)分布,從屬時(shí)超幾何分布。超幾何分布的概率模型:大小為N的母集團(tuán)中,N1中X1個(gè),N2中X2個(gè) 取出的概率超幾何分布的密度函數(shù)
P(N1中x1,N2中x2)=N1Cx1*N2Cx2
(N1+N2)C(x1+x2)
NN1N2Xx2x112超幾何分布(Hyper-geometricdistribu超幾何分布例題由20個(gè)制品構(gòu)成的LOT中有5個(gè)不良品。此時(shí)抽取4個(gè)制品時(shí),有2個(gè)不良品的概率是多少?正確答案是0.217(請(qǐng)實(shí)際計(jì)算后比較)不良品是4個(gè),良品是6個(gè)的制品集團(tuán)中隨機(jī)抽取3個(gè)制品,選擇的3個(gè)制品全部為良品的概率是多少?正確答案是0.618(請(qǐng)實(shí)際計(jì)算后比較)13超幾何分布例題由20個(gè)制品構(gòu)成的LOT中有5個(gè)不良品。此時(shí)抽二項(xiàng)分布(Binomialdistribution)貝魯諾實(shí)驗(yàn)的條件-例)擲銅錢
1)實(shí)驗(yàn)的結(jié)果一個(gè)事件成功(S),別一事件為失敗(F)區(qū)分為相互排斥的兩個(gè)事件2)各個(gè)實(shí)驗(yàn)中成功出現(xiàn)的概率為p=P(S),失敗出現(xiàn)的概率為q=P(F)=1-p因此成功與失敗出現(xiàn)的概率和為p+q=1.3)各個(gè)實(shí)驗(yàn)是相互獨(dú)立的,一個(gè)實(shí)驗(yàn)結(jié)果對(duì)另外實(shí)驗(yàn)結(jié)果無任何影響.二項(xiàng)分布是反復(fù)進(jìn)行貝魯諾實(shí)驗(yàn)后顯示的分布二項(xiàng)分布的概率密度函數(shù)P(X=x)=nCxpx(1-p)n-x
nCx=()=
nxn!x!(n-x)!排列與組合!還記得嗎?14二項(xiàng)分布(Binomialdistribution)貝魯諾01234P(X)x1/162/163/164/165/166/1601234P(X)x0.10.20.3n=4,p=1/2的二項(xiàng)分布n=9,p=1/3的二項(xiàng)分布56789二項(xiàng)分布的形狀1)n即使小p=0.5時(shí)概率分布總是對(duì)稱2)即使不是p=0.5,n越大越接近于對(duì)稱二項(xiàng)分布的期望值,標(biāo)準(zhǔn)偏差,分散期望值:=E(X)=np分散:2=Var(X)=np(1-p)=npq標(biāo)準(zhǔn)偏差:
=√np(1-p)=√npq二項(xiàng)分布的形態(tài)1501234P(X)x1/162/163/164/165/16超幾何分布與二項(xiàng)分布的比較說明如下圖有三個(gè)白球,七個(gè)藍(lán)球的箱子中取出2個(gè)球時(shí),取出白球的概率分為非復(fù)元取出和復(fù)元取出的情況分析.非復(fù)元取出的情況:1次取出時(shí)取出白球的概率=3/10 2次取出時(shí)取出白球的概率=2/9即,2次實(shí)行的概率受1次實(shí)行結(jié)果的影響.超幾何分布復(fù)元取出的情況:1次取出時(shí)取出白球的概率=3/102次取出時(shí)取出白球的概率=3/10即,1次實(shí)行的結(jié)果并不影響2次實(shí)行的概率.二項(xiàng)分布16超幾何分布與二項(xiàng)分布的比較說明如下圖有三個(gè)白球,七個(gè)藍(lán)球的箱帕松分布(Poissondistribution)用于定義單位時(shí)間或單位空間里特定事件的發(fā)生次數(shù)-鋼板,織物等的連續(xù)體有平均m個(gè)瑕疵,隨機(jī)抽取一定單位調(diào)查瑕疵時(shí),瑕疵出現(xiàn)x個(gè)的概率遵守帕松分布.-單位時(shí)間內(nèi)到銀行的顧客的數(shù),某一地域內(nèi)一天交通事故數(shù).帕松分布的密度函數(shù)
P(X=x)=e-mmx
x!m:平均發(fā)生次數(shù)x:事件發(fā)生次數(shù)
帕松分布的特性-二項(xiàng)分布中p<0.1時(shí),變成帕松分布-帕松分布中m>5時(shí),變成正態(tài)分布17帕松分布(Poissondistribution)用于定義帕松分布和RTY的關(guān)系
帕松分布觀察帕松分布的概念,與Unit內(nèi)Defect分布是同一概念,即可以如下開展事件的平均發(fā)生次數(shù)m成為dpu.RTY是最終工程無缺點(diǎn)的概率,帕松分布中x=0的情況.因此在帕松分布的分布式中代入上面的結(jié)果,成立下面等式.
RTY=e-dpudpu=-ln(RTY)P(X=x)=e-mmx
x!m:平均發(fā)生次數(shù)x:事件發(fā)生次數(shù)18帕松分布和RTY的關(guān)系帕松分布P(X=x)=e-m正態(tài)分布(Normaldistribution)正態(tài)分布是最自然的分布可以取任何一定范圍內(nèi)的所有實(shí)數(shù)值的概率分布,是連續(xù)概率分布中最具代表性的分布.
正態(tài)分布的特點(diǎn)1)正態(tài)分布的形狀與位置由分布的平均和標(biāo)準(zhǔn)偏差決定
2)正態(tài)分布的概率密度函數(shù)以平均()為中心相對(duì)稱的鐘形.3)正態(tài)曲線不接觸X軸,因此X取值的范圍是-<X<+.
(但觀察值的99.7%在3內(nèi))
4)分布的平均()和標(biāo)準(zhǔn)偏差()無論取什么值,正態(tài)曲線與X軸的全部面積為1.
正態(tài)分布的密度函數(shù)
f(X)=1
√22e-(x-)2/22-<X<+:3.142(元周率)
e:2.7183
:分布的平均:分布的標(biāo)準(zhǔn)偏差19正態(tài)分布(Normaldistribution)正態(tài)分布是正態(tài)曲線(Normalcurve)95.5%43210-1-2-3-468.3%99.73%121=112121221[與決定的正態(tài)分布形狀]12,1=2
1=2,1
2
12,1
2
應(yīng)熟知教材后部分收錄的標(biāo)準(zhǔn)正態(tài)分布的讀法20正態(tài)曲線(Normalcurve)95.5%43210-1標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布是把正態(tài)分布標(biāo)準(zhǔn)化為平均=0,標(biāo)準(zhǔn)偏差=1.某一觀察值X的值,從其分布的平均的距離是標(biāo)準(zhǔn)偏差的多少倍,如下用標(biāo)準(zhǔn)化的概率變數(shù)Z表示,表示為N(0,12)X-
Z=————
0Z=0到Z=1.5之間概率變數(shù)存在的概率P(0≤Z≤1.5)=0.43320Z=0到±45%相應(yīng)的Z值Z=±1.64490比Z=-2小或比Z=2大的范圍內(nèi)存在概率變量的概率-22P(-2≥Z,Z≥2)=0.0456P=0.0228P=0.022821標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布是把正態(tài)分布標(biāo)準(zhǔn)化為平均=0,標(biāo)對(duì)正態(tài)分布的說明影響制造工程的平均值或分散的要因分為1)偶然原因和2)異常原因。偶然原因是如作業(yè)環(huán)境的溫度變化等不可避免的要因,異常原因是指設(shè)備異常,作業(yè)者的失誤等要因不介入異常要因,只有偶然要因作業(yè)時(shí)取出的數(shù)據(jù)必然遵守正態(tài)分布。教育時(shí)可感覺到,在利用連續(xù)型概率變量進(jìn)行統(tǒng)計(jì)分析時(shí)首先應(yīng)考慮分布是否是正態(tài)分布。今后要學(xué)的t-分布,F(xiàn)-分布,2-分布是人們?nèi)藶樽鞒鰜淼母怕拭芏群瘮?shù),但正態(tài)分布是說明自然現(xiàn)象的自然分布。最自然的不就是最美的嗎?每個(gè)銅錢擲10次擲100個(gè)時(shí)每個(gè)銅錢正面出現(xiàn)的次數(shù)與反面出現(xiàn)的次數(shù)畫在直線上時(shí)是否取正態(tài)分布?22對(duì)正態(tài)分布的說明影響制造工程的平均值或分散的要因分為1)偶然練習(xí)題1.X~N(10,4)的正態(tài)分布中X在8≤X≤12范圍的概率是?Z=X-
=12-10
4=0.5,此時(shí)概率是0.691510128Z=X-
=8-10
4=-0.5此時(shí)概率是(1-0.6915)因此0.6915-0.3085=0.382923練習(xí)題1.X~N(10,4)的正態(tài)分布中X在8≤X≤1√n平均標(biāo)本分布
標(biāo)本分布?在母集團(tuán)中按一定大小把能夠取出的標(biāo)本全部取出后,各標(biāo)本的特性值(統(tǒng)計(jì)量)的概率分布
平均的標(biāo)本分布? 在特定的母集團(tuán)按一定大小把能夠取出的標(biāo)本全部取出后計(jì)算各個(gè)標(biāo)本的平均時(shí)其平均的概率分布。x2=_2
nx=_
平均標(biāo)本分布的分散
平均標(biāo)本分布的標(biāo)準(zhǔn)偏差
平均標(biāo)本分布的平均=24平均標(biāo)本分布標(biāo)本分布?平均的標(biāo)本分布中心極限定理(CentralLimitTheorem)平均為,分散為2的無限母集團(tuán)中隨機(jī)抽取大小為n的樣品時(shí)n充分大時(shí)與母集團(tuán)的分布狀態(tài)無關(guān),標(biāo)本平均近似地遵守N(,2/n)。即,的分布近似為N(0,1)。Z=/nX-母集團(tuán)遵守正態(tài)分布時(shí)標(biāo)本的平均必然遵守正態(tài)分布,但此時(shí)標(biāo)本平均的分散分為標(biāo)本的大小(n),因此變小。如果母集團(tuán)不是正態(tài)分布的任意分布時(shí),標(biāo)本大小充分大時(shí)標(biāo)本的平均分布也遵守正態(tài)分布但此時(shí)標(biāo)本平均的分散分為標(biāo)本的大小(n),也變小。25中心極限定理(CentralLimitTheorem)t-分布:互不相同的兩個(gè)集團(tuán)的平均的統(tǒng)計(jì)驗(yàn)證從正態(tài)分布概率標(biāo)本不大,且標(biāo)準(zhǔn)偏差()未知時(shí)
遵守自由度n-1的t-分布。.0S2=(xi-x)
n-1X=xi1
nt=X-
S/√n正態(tài)分布=7=3=1T-分布的特點(diǎn)t分布比正態(tài)分布的形狀擴(kuò)散,自由度()越大越接近于正態(tài)分布。
這是因?yàn)闃?biāo)本的大小小,標(biāo)準(zhǔn)偏差(s)比母集團(tuán)的標(biāo)準(zhǔn)偏差()具有不確信性,所以標(biāo)本的大小n越大,標(biāo)本的標(biāo)準(zhǔn)偏差越接近于母集團(tuán)的標(biāo)準(zhǔn)偏差。t分布根據(jù)自由度變化,自由度是標(biāo)本的大小減1,表示為n-1。26t-分布:互不相同的兩個(gè)集團(tuán)的平均的統(tǒng)計(jì)驗(yàn)證從正態(tài)分t-分布的應(yīng)用
積層薄膜事業(yè)部的CERAMICPOWDER從業(yè)體受入后使用。1月受入的POWDER的平均徑為0.35m,2月是0.38m,2個(gè)月間的POWDER徑是否可以下結(jié)論有差異。t-分布利用于以原來的數(shù)據(jù)為本,統(tǒng)計(jì)地判斷有無平均值的差異比較2個(gè)集團(tuán)間的平均時(shí)需要下列2項(xiàng)前提條件。請(qǐng)思考一下理由.2個(gè)集團(tuán)應(yīng)具有相當(dāng)正規(guī)的分布2集團(tuán)的分散均勻利用t-分布進(jìn)行比較時(shí)一個(gè)集團(tuán)內(nèi)有30個(gè)以上的數(shù)據(jù)時(shí)可以減少誤差。27t-分布的應(yīng)用積層薄膜事業(yè)部的CERAMICPOWD標(biāo)本分布中計(jì)算平均的位置1.正態(tài)分布:已知母集團(tuán)的標(biāo)準(zhǔn)偏差()時(shí)可以適用(可能性很少)Z=X-
/√nMINITAP的1-SPLZTest實(shí)際上在我們想知道母集團(tuán)的平均時(shí),我們提前知道母集團(tuán)的標(biāo)準(zhǔn)偏差而去接近的情況極少。2.t-分布:t=X-
S/√n參照MINITAP的1-SPLtTest,2-SPLtTest想知道母集團(tuán)的平均時(shí),雖然不知道母集團(tuán)的標(biāo)準(zhǔn)偏差,但并不難求出樣品的標(biāo)準(zhǔn)偏差(S)。28標(biāo)本分布中計(jì)算平均的位置1.正態(tài)分布:已知母集團(tuán)的標(biāo)準(zhǔn)偏2-分布:不相同的兩個(gè)以上集團(tuán)的概率的統(tǒng)計(jì)驗(yàn)證根據(jù)情況不僅平均的標(biāo)本分布,連分散的標(biāo)本分布也很重要。例如罐頭廠罐頭的平均重量與罐頭的重量都很重要母集團(tuán)的分散的標(biāo)本分布可利用2分布表示,兩個(gè)母集團(tuán)的分散的標(biāo)本分布可利用F分布表示。對(duì)正態(tài)母集團(tuán)N(,2)的概率分布X1,X2,….Xn 的分布稱為自由度為n-1的2分布.2
=(Xi-X)2
2(n-1)S2
2=f(x)0n=1n=5n=10292-分布:不相同的兩個(gè)以上集團(tuán)的概率的統(tǒng)計(jì)驗(yàn)證根據(jù)2-分布:實(shí)際的使用例題
現(xiàn)有1元的硬幣1個(gè),張課長(zhǎng)擲硬幣100次時(shí)正面出現(xiàn)63次,反面出現(xiàn)37次。理想的結(jié)果是正面50次,反面50次。此時(shí)是否可以下結(jié)論上述結(jié)果是偶然出現(xiàn)的,或者認(rèn)為是因?yàn)橛矌诺男螤畈徽3霈F(xiàn)的必然結(jié)果得出這種比率的結(jié)論時(shí),可以有效使用2分布近似的情況有在生產(chǎn)現(xiàn)場(chǎng)白班作業(yè)的不良率為2.0%,夜班作業(yè)的不良率為2.5%那么是否可以確信夜班不良率高于白班不良率?請(qǐng)用MINITAB得出結(jié)果.302-分布:實(shí)際的使用例題現(xiàn)有1元的硬幣1個(gè),張課長(zhǎng)F-分布:不同的兩個(gè)以上集團(tuán)的分散的均一性驗(yàn)證.母集團(tuán)是正態(tài)分布,從具有分散12,22
的兩個(gè)母集團(tuán)中抽取大小為n1,n2兩個(gè)標(biāo)本計(jì)算標(biāo)本分散.兩個(gè)標(biāo)本分散為S12,S22時(shí)由標(biāo)本分散與母分散的比率形成的兩個(gè)2的比率形成F分布,F分布具有兩個(gè)自由度.12
=(n1-1)S12
12
~
12(n1-1)22
=(n2-1)S22
22
~
22(n2-1)12/(n1-1)22/(n2-1)=S12/12S22/22~F(n1-1,n2-1)上式內(nèi)容中可知F分布是比較兩個(gè)母集團(tuán)的分散31F-分布:不同的兩個(gè)以上集團(tuán)的分散的均一性驗(yàn)證.母集F-分布:實(shí)際的使用例1=2,2=41=12,2=121=4,2=6金代理在進(jìn)行工程變化后,將變化前后的平均值用t-Test比較的結(jié)果,認(rèn)為沒有差異認(rèn)為工程變化對(duì)制品特性無影響.這個(gè)判斷正確嗎答)錯(cuò)誤.分布的特性不僅是平均值,還要考慮分散.在上述情況平均相同,但工程變化后的分散比變化前增加了2倍,得出結(jié)論是工程變化影響制品特性.F-分布是用在比較分散的均一性.了解一下利用MINITAB的實(shí)際的使用方法和解釋方法.32F-分布:實(shí)際的使用例1=2,2=41=12,推定與驗(yàn)證
推定?母集團(tuán)的特點(diǎn)由分布函數(shù)來體現(xiàn),母集團(tuán)具體的特點(diǎn)由分布函數(shù)的母數(shù)來決定因此為了解母集團(tuán)的具體的性格對(duì)母數(shù)進(jìn)行的推測(cè)叫推定(Inference).
驗(yàn)證?假設(shè)母集團(tuán)的母數(shù),以樣品的情報(bào)來判斷其假設(shè)的真?zhèn)蔚倪^程叫假設(shè)驗(yàn)證.(HypothesisTesting).33推定與驗(yàn)證推定?33推定為了解母集團(tuán)的特點(diǎn)推測(cè)母集團(tuán)的分布函數(shù)推定的種類
1)點(diǎn)推定
未知的母數(shù)用一個(gè)推定值表示,但因未包括誤差的范圍,無法保障與母數(shù)一致。
2)區(qū)間推定
預(yù)想包括母數(shù)的真值的預(yù)想?yún)^(qū)間,按照信賴區(qū)間范圍不同對(duì)母數(shù)進(jìn)行區(qū)間推定時(shí)指求P(L<<U)=1-的L與U此時(shí)[L,U]稱為信賴區(qū)間,1-為信賴水平.34推定為了解母集團(tuán)的特點(diǎn)推測(cè)母集團(tuán)的分布函數(shù)推定的種類34推定母集團(tuán)平均的信賴區(qū)間0/2=0.025-Z0.025=-1.96/2=0.025Z0.025=1.96=0.05時(shí)Z/2和-Z/2的值即,信賴區(qū)間:95%1)已知標(biāo)準(zhǔn)偏差:利用正態(tài)分布P(-Z/2<<Z/2)=1-
X-
/√nP(L<<U)=1-
對(duì)此解X-Z/2/√n<<X+Z/2/√n的100(1-)信賴區(qū)間因可得出上述所有變數(shù),可以推定平均的區(qū)間推定35推定母集團(tuán)平均的信賴區(qū)間0/2=0.025-Z0.02推定母集團(tuán)平均的信賴區(qū)間=0.05時(shí)t/2與-t/2的值即,信賴區(qū)間:95%2)未知標(biāo)準(zhǔn)偏差時(shí):利用t-分布P(-t/2<<t/2)=1-
X-
S/√nP(L<<U)=1-對(duì)此解X-t/2S/√n<<X+t/2S/√n的100(1-)信賴區(qū)間因可得出上述所有變數(shù),可以推定平均的區(qū)間推定t-分布的形狀按照自由度不同而相異,是否會(huì)讀附錄的t-分布表參考)上述的所有t-分布意味著自由度為n-1的t/2,n-1.36推定母集團(tuán)平均的信賴區(qū)間=0.05時(shí)t/2與-t推定母集團(tuán)平均的置信區(qū)間的例題1.為了解女社員一個(gè)月零用錢使用水平,任意選擇100名調(diào)查的結(jié)果,平均零用錢為82,000元母集團(tuán)的標(biāo)準(zhǔn)偏差為10萬元,母集團(tuán)為正態(tài)分布時(shí),求女社員零用錢平均(用90%的信賴區(qū)間)2.任意選擇12個(gè)BEARING測(cè)定直徑的結(jié)果平均為5.6mm,標(biāo)準(zhǔn)偏差為0.032mm.直徑的分布為正態(tài)分布時(shí),用95%信賴區(qū)間求直徑的真值.對(duì)上述問題大家應(yīng)當(dāng)會(huì)用手算及MINITAB計(jì)算出結(jié)果另外,到現(xiàn)在為止都假設(shè)遵守正態(tài)分布狀態(tài)下進(jìn)行37推定母集團(tuán)平均的置信區(qū)間的例題1.為了解女社員一個(gè)月零用錢使對(duì)假設(shè)驗(yàn)證
假設(shè)驗(yàn)證?假設(shè)母集團(tuán)的母數(shù),以標(biāo)本的情報(bào)來判斷其假設(shè)的真?zhèn)?歸零假設(shè)?.作為驗(yàn)證對(duì)象的假設(shè),無變化或無差異的敘述文用H0來表示對(duì)立假設(shè)?與歸零假設(shè)相對(duì)立的相反的假設(shè),變化或有差異的敘述文用H1
或Ha來表示.即,已存在的事實(shí)稱歸零假設(shè),新的主張稱對(duì)立假設(shè).留意水準(zhǔn)?歸零假設(shè)正確,但放棄歸零假設(shè)的概率的限度.信賴區(qū)間(ConfidenceLevel)與留意水平(SignificanceLevel)的關(guān)系
1-信賴區(qū)間=留意水平38對(duì)假設(shè)驗(yàn)證假設(shè)驗(yàn)證?38驗(yàn)證統(tǒng)計(jì)量?判定是否放棄歸無假設(shè)的統(tǒng)計(jì)量.即Z,t,F,2
等.此時(shí)驗(yàn)證統(tǒng)計(jì)量可取的區(qū)間按照適當(dāng)?shù)幕鶞?zhǔn)分為采納域與放棄域,統(tǒng)計(jì)量的值屬于放棄域時(shí)放棄歸零假設(shè),屬于采納域時(shí)不放棄歸零假設(shè)臨界值:區(qū)分放棄域與采納域的界限值單側(cè)驗(yàn)證與兩側(cè)驗(yàn)證對(duì)歸零假設(shè)H0:=0的對(duì)立假設(shè)可設(shè)定為H1:>0,H1:<0
及H1:0的3種形態(tài),根據(jù)對(duì)立假設(shè)的形態(tài)前兩個(gè)對(duì)立假設(shè)的情況叫單側(cè)驗(yàn)證,最后對(duì)立假設(shè)的情況叫兩側(cè)驗(yàn)證.留意差:統(tǒng)計(jì)的假設(shè)結(jié)果視為偶然造成的是具有太多的差異,為了敘述此結(jié)果用的統(tǒng)計(jì)用語對(duì)假設(shè)驗(yàn)證39對(duì)假設(shè)驗(yàn)證39假設(shè)驗(yàn)證的錯(cuò)誤錯(cuò)誤實(shí)際上是歸零假設(shè)正確,但驗(yàn)證結(jié)果放棄歸零假設(shè)的的錯(cuò)誤稱為第一種錯(cuò)誤.錯(cuò)誤實(shí)際上是歸零假設(shè)錯(cuò)誤,但驗(yàn)證結(jié)果接受歸零結(jié)果的錯(cuò)誤稱為第二種錯(cuò)誤事實(shí)判斷H0H1H0正確決定H1錯(cuò)誤正確的決定錯(cuò)誤
錯(cuò)誤:與留意水平相同,一般以5%為基準(zhǔn)值錯(cuò)誤:一般為10%,驗(yàn)證力=1-40假設(shè)驗(yàn)證的錯(cuò)誤錯(cuò)誤實(shí)際上是歸零假設(shè)正確,但驗(yàn)證結(jié)果放棄歸假設(shè)驗(yàn)證的順序1.設(shè)定歸零假設(shè)與對(duì)立假設(shè)2.設(shè)定驗(yàn)證統(tǒng)計(jì)量3.決定滿足留意水平的臨界值4.假設(shè)歸零假設(shè)正確的前提下計(jì)算統(tǒng)計(jì)量與臨界值比較.41假設(shè)驗(yàn)證的順序1.設(shè)定歸零假設(shè)與對(duì)立假設(shè)41例題)罐頭的重量為16克,標(biāo)準(zhǔn)偏差為1.5克的正態(tài)分布.但是有顧客提出罐頭不是16克.為此作為標(biāo)本確認(rèn)了25個(gè)罐頭,調(diào)查結(jié)果平均為15.5克.=5%時(shí),是否可以說罐頭重量為16克.1.歸零假設(shè)與對(duì)立假設(shè)的設(shè)定=H0:=16,H1:<16
2.驗(yàn)證統(tǒng)計(jì)量的決定:已知母集團(tuán)
Z=/nX-3.臨界值的決定:在標(biāo)準(zhǔn)正態(tài)分布表=0.05相應(yīng)的Z=1.64因此采納領(lǐng)域:Z>-1.64,放棄領(lǐng)域:Z<-1.64
4.在假設(shè)歸零無假設(shè)正確的前提下計(jì)算統(tǒng)計(jì)量后,與臨界值比較。Z=-1.67放棄H0(罐頭的重量不足16克.)
42例題)1.歸零假設(shè)與對(duì)立假設(shè)的設(shè)定=H0:說明在前頁對(duì)罐頭重量驗(yàn)證的過程中因已知母集團(tuán)的標(biāo)準(zhǔn)偏差利用正態(tài)分布進(jìn)行了說明。除正態(tài)分布外適用t-分布,F-分布以及2-分布時(shí)可以按照同樣的過程。但為驗(yàn)證首先應(yīng)理解的是各驗(yàn)證統(tǒng)計(jì)量的理解,附錄表搜索的方法,以及最終驗(yàn)證統(tǒng)計(jì)量的值與附錄表數(shù)據(jù)的比較后得出結(jié)論等。在上面已經(jīng)說明過各驗(yàn)證統(tǒng)計(jì)量適用于什么時(shí)簡(jiǎn)單進(jìn)行總結(jié)。t-分布:已知母集團(tuán)的標(biāo)準(zhǔn)偏差時(shí)母集團(tuán)的平均驗(yàn)證F-分布:未知母集團(tuán)的標(biāo)準(zhǔn)偏差時(shí)母集團(tuán)和平均驗(yàn)證2-分布:兩個(gè)集團(tuán)間的比率的統(tǒng)計(jì)驗(yàn)證43說明在前頁對(duì)罐頭重量驗(yàn)證的過程中因已知母集團(tuán)的標(biāo)準(zhǔn)偏差利用正MINITAB與驗(yàn)證與推定那么在MINITAB如何進(jìn)行驗(yàn)證與推定,是否要向前面所說要全部計(jì)算后錄入不是,如果已經(jīng)知道大家要進(jìn)行的驗(yàn)證與推定的特點(diǎn)適用于哪個(gè)驗(yàn)證統(tǒng)計(jì)量時(shí)在MINITAB只要簡(jiǎn)單一擊就可以代替前面的所有說明。那么所有驗(yàn)證統(tǒng)計(jì)量的臨界值互相不同,實(shí)行MINITAB后,是否應(yīng)在統(tǒng)計(jì)量附錄表中找到臨界值后與MINITAB結(jié)果統(tǒng)計(jì)量進(jìn)行比較嗎?不是MINITAB自己比較,最終用p-值來判斷,大家只要記住看MINITAB顯示的p-值判斷就可以了。一般p>0.05:統(tǒng)計(jì)量無差異(無留意)p<0.05:統(tǒng)計(jì)量有差異(留意)44MINITAB與驗(yàn)證與推定那么在MINITAB如何進(jìn)行驗(yàn)證與基礎(chǔ)統(tǒng)計(jì)45基礎(chǔ)統(tǒng)計(jì)1教育目標(biāo)
訂立進(jìn)行6-SIGMA必要的基礎(chǔ)統(tǒng)計(jì)的概念理解離散概率分布及連續(xù)概率分布的概念基礎(chǔ)統(tǒng)計(jì)的內(nèi)容與6-SIGMAMetrics聯(lián)貫理解熟知Minitap的基礎(chǔ)使用方法基礎(chǔ)統(tǒng)計(jì)與Minitap聯(lián)貫理解收集的數(shù)據(jù)利用Minitap分析46教育目標(biāo)訂立進(jìn)行6-SIGMA必要的基礎(chǔ)統(tǒng)計(jì)的概念2統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)的概念在日常生活中經(jīng)常接觸,且每天都在使用-為預(yù)測(cè)棒球比賽的勝負(fù),調(diào)查各個(gè)Team的過去勝率-用收集的氣象資料預(yù)測(cè)天氣統(tǒng)計(jì)學(xué)為了對(duì)不確實(shí)的未來的預(yù)測(cè)提供必要的情報(bào)收集,分類,分析資料及以此為基礎(chǔ)提示結(jié)論的學(xué)問47統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)的概念在日常生活中經(jīng)常接觸,且每天都在使用3母集團(tuán)的標(biāo)本作為關(guān)心對(duì)象的所有個(gè)體的集合稱母集團(tuán),在母集團(tuán)中作為調(diào)查對(duì)象采納的一部分稱為標(biāo)本母集團(tuán)標(biāo)本
母集團(tuán)的特性:母數(shù)平均μ
分散2
標(biāo)準(zhǔn)偏差
標(biāo)本的特性:統(tǒng)計(jì)量平均分散S2
標(biāo)本偏差S如果能夠正確計(jì)算母集團(tuán)的母數(shù)時(shí)沒有問題,但如果很難知道的情況下,用標(biāo)本計(jì)算出的統(tǒng)計(jì)量推定母數(shù)。48母集團(tuán)的標(biāo)本作為關(guān)心對(duì)象的所有個(gè)體的集合稱母集團(tuán),在母集團(tuán)中母集團(tuán),標(biāo)本及資料母集團(tuán)(Population)和種類1)有限母集團(tuán):形成母集團(tuán)的元素的個(gè)數(shù)為有限例)出荷LOT內(nèi)制品的數(shù)2)無限母集團(tuán):形成母集團(tuán)的元素的個(gè)數(shù)為無限例)工程中生產(chǎn)的制品數(shù)
標(biāo)本(Sample)取出的重要性-標(biāo)本取出時(shí)應(yīng)盡可能沒有偏差例)嘗一鍋湯的味道時(shí),如不用勺子攪勻,而只嘗上面部分會(huì)怎樣?-標(biāo)本取出方法:?jiǎn)渭冸S機(jī)取出,層別取出,群集取出,體系的取出
資料(Data)的種類1)量的變量:大小和量可以用數(shù)字表現(xiàn)的變量-離散型變量:可數(shù)的,如不良品數(shù),缺點(diǎn)數(shù)等計(jì)數(shù)值數(shù)據(jù)-連續(xù)型變量:是連續(xù)的值,拉力,長(zhǎng)度等計(jì)量值數(shù)據(jù)2)質(zhì)的變量:無法表示大小或量的變量:性別,宗教,職業(yè)等49母集團(tuán),標(biāo)本及資料母集團(tuán)(Population)和種類分布的特性統(tǒng)計(jì)分析是找出資料分布具有的特性用數(shù)字表示的作業(yè)。
分布的特性
集中化傾向(算術(shù)平均,中央值,最頻數(shù))-顯示資料集中在什么位置分散度(范圍,分散,標(biāo)準(zhǔn)偏差)-資料以算術(shù)平均為中心擴(kuò)散的程度非對(duì)稱度-資料傾向于哪一側(cè)?50分布的特性統(tǒng)計(jì)分析是找出資料分布具有的特性用數(shù)字表示的作業(yè)。集中化傾向
最頻數(shù)(Mode)
最頻數(shù)是資料分布中出現(xiàn)頻率最多的數(shù)
中央值(Median)
數(shù)值按大小排序觀察其位置1)資料為單數(shù)時(shí):中間的資料2)資料為偶數(shù)時(shí):(中間兩個(gè)資料的和)/2
算術(shù)平均
母集團(tuán)的平均標(biāo)本的平均μ==X1+X2+X3+…+Xn
N∑Xi
NX==X1+X2+X3+…+Xnn∑Xi
n51集中化傾向最頻數(shù)(Mode)
最頻數(shù)是資料分布分散度
范圍資料的集團(tuán)中最大的數(shù)值和最小數(shù)值的差異
分散和標(biāo)本偏差母集團(tuán)的分散母集團(tuán)的標(biāo)準(zhǔn)偏差
標(biāo)本的分散標(biāo)本的標(biāo)準(zhǔn)偏差算術(shù)平均為一次元的值,分散是二次元,因此求分散的開方標(biāo)準(zhǔn)偏差。標(biāo)本統(tǒng)計(jì)量失去一個(gè)自由度,因此標(biāo)本時(shí)具有n-1的自由度2=∑(Xi–X)2
N
=∑(Xi–X)2
NS2=∑(Xi–X)2
n-1S
=∑(Xi–X)2
n-152分散度范圍2=∑(Xi–X)2特性值 母數(shù) 統(tǒng)計(jì)量集團(tuán)數(shù) N n平均 X分散 2 s2標(biāo)準(zhǔn)偏差 s相關(guān)系數(shù) r回歸系數(shù) , a,b誤差 e母數(shù)和統(tǒng)計(jì)量的符號(hào)比較53特性值 母數(shù) 統(tǒng)計(jì)量母數(shù)和統(tǒng)計(jì)量的符號(hào)比較9概率理論
概率的定義:對(duì)所有具有發(fā)生可能性,特定事件發(fā)生的可能性
標(biāo)本空間:發(fā)生的可能性相同的全部情況的數(shù)思想:屬于事件A的情況的數(shù)概率變量:從測(cè)定值可得到的所有集合稱為標(biāo)本空間,對(duì)標(biāo)本空間的各各值付予實(shí)數(shù)的函數(shù)稱為概率變量。如(H,1/2)集合的概論概率分布:對(duì)概率變量可取的所有值,將其取值的概率用圖或表顯示的稱為概率分布離散概率分布:對(duì)應(yīng)于可數(shù)的概率變量如不良數(shù)或缺點(diǎn)數(shù)的概率分布連續(xù)概率分布:具有不可數(shù)的連續(xù)值如制品的重量或尺寸的概率分布P(A)
=思想標(biāo)本空間54概率理論概率的定義:對(duì)所有具有發(fā)生可能性,特定事件發(fā)生的概率理論
概率密度函數(shù)(ProbabilityDensityFunction)對(duì)應(yīng)于概率變量的概率的關(guān)系表示為函數(shù)的稱為概率密度函數(shù)概率密度函數(shù)總是+值,全體的和為1。6-Sigma使用的概率密度函數(shù)1)離散概率密度函數(shù)?超幾何分布?二項(xiàng)分布?帕松分布2)連續(xù)型概率密度函數(shù)?正態(tài)分布?t-分布?F-分布?2-分布
55概率理論概率密度函數(shù)(ProbabilityDens超幾何分布(Hyper-geometricdistribution)超幾何分布是以非復(fù)元取出,每次成功概率不一定時(shí)適用的分布,每次實(shí)行獨(dú)立時(shí)為二項(xiàng)分布,從屬時(shí)超幾何分布。超幾何分布的概率模型:大小為N的母集團(tuán)中,N1中X1個(gè),N2中X2個(gè) 取出的概率超幾何分布的密度函數(shù)
P(N1中x1,N2中x2)=N1Cx1*N2Cx2
(N1+N2)C(x1+x2)
NN1N2Xx2x156超幾何分布(Hyper-geometricdistribu超幾何分布例題由20個(gè)制品構(gòu)成的LOT中有5個(gè)不良品。此時(shí)抽取4個(gè)制品時(shí),有2個(gè)不良品的概率是多少?正確答案是0.217(請(qǐng)實(shí)際計(jì)算后比較)不良品是4個(gè),良品是6個(gè)的制品集團(tuán)中隨機(jī)抽取3個(gè)制品,選擇的3個(gè)制品全部為良品的概率是多少?正確答案是0.618(請(qǐng)實(shí)際計(jì)算后比較)57超幾何分布例題由20個(gè)制品構(gòu)成的LOT中有5個(gè)不良品。此時(shí)抽二項(xiàng)分布(Binomialdistribution)貝魯諾實(shí)驗(yàn)的條件-例)擲銅錢
1)實(shí)驗(yàn)的結(jié)果一個(gè)事件成功(S),別一事件為失敗(F)區(qū)分為相互排斥的兩個(gè)事件2)各個(gè)實(shí)驗(yàn)中成功出現(xiàn)的概率為p=P(S),失敗出現(xiàn)的概率為q=P(F)=1-p因此成功與失敗出現(xiàn)的概率和為p+q=1.3)各個(gè)實(shí)驗(yàn)是相互獨(dú)立的,一個(gè)實(shí)驗(yàn)結(jié)果對(duì)另外實(shí)驗(yàn)結(jié)果無任何影響.二項(xiàng)分布是反復(fù)進(jìn)行貝魯諾實(shí)驗(yàn)后顯示的分布二項(xiàng)分布的概率密度函數(shù)P(X=x)=nCxpx(1-p)n-x
nCx=()=
nxn!x!(n-x)!排列與組合!還記得嗎?58二項(xiàng)分布(Binomialdistribution)貝魯諾01234P(X)x1/162/163/164/165/166/1601234P(X)x0.10.20.3n=4,p=1/2的二項(xiàng)分布n=9,p=1/3的二項(xiàng)分布56789二項(xiàng)分布的形狀1)n即使小p=0.5時(shí)概率分布總是對(duì)稱2)即使不是p=0.5,n越大越接近于對(duì)稱二項(xiàng)分布的期望值,標(biāo)準(zhǔn)偏差,分散期望值:=E(X)=np分散:2=Var(X)=np(1-p)=npq標(biāo)準(zhǔn)偏差:
=√np(1-p)=√npq二項(xiàng)分布的形態(tài)5901234P(X)x1/162/163/164/165/16超幾何分布與二項(xiàng)分布的比較說明如下圖有三個(gè)白球,七個(gè)藍(lán)球的箱子中取出2個(gè)球時(shí),取出白球的概率分為非復(fù)元取出和復(fù)元取出的情況分析.非復(fù)元取出的情況:1次取出時(shí)取出白球的概率=3/10 2次取出時(shí)取出白球的概率=2/9即,2次實(shí)行的概率受1次實(shí)行結(jié)果的影響.超幾何分布復(fù)元取出的情況:1次取出時(shí)取出白球的概率=3/102次取出時(shí)取出白球的概率=3/10即,1次實(shí)行的結(jié)果并不影響2次實(shí)行的概率.二項(xiàng)分布60超幾何分布與二項(xiàng)分布的比較說明如下圖有三個(gè)白球,七個(gè)藍(lán)球的箱帕松分布(Poissondistribution)用于定義單位時(shí)間或單位空間里特定事件的發(fā)生次數(shù)-鋼板,織物等的連續(xù)體有平均m個(gè)瑕疵,隨機(jī)抽取一定單位調(diào)查瑕疵時(shí),瑕疵出現(xiàn)x個(gè)的概率遵守帕松分布.-單位時(shí)間內(nèi)到銀行的顧客的數(shù),某一地域內(nèi)一天交通事故數(shù).帕松分布的密度函數(shù)
P(X=x)=e-mmx
x!m:平均發(fā)生次數(shù)x:事件發(fā)生次數(shù)
帕松分布的特性-二項(xiàng)分布中p<0.1時(shí),變成帕松分布-帕松分布中m>5時(shí),變成正態(tài)分布61帕松分布(Poissondistribution)用于定義帕松分布和RTY的關(guān)系
帕松分布觀察帕松分布的概念,與Unit內(nèi)Defect分布是同一概念,即可以如下開展事件的平均發(fā)生次數(shù)m成為dpu.RTY是最終工程無缺點(diǎn)的概率,帕松分布中x=0的情況.因此在帕松分布的分布式中代入上面的結(jié)果,成立下面等式.
RTY=e-dpudpu=-ln(RTY)P(X=x)=e-mmx
x!m:平均發(fā)生次數(shù)x:事件發(fā)生次數(shù)62帕松分布和RTY的關(guān)系帕松分布P(X=x)=e-m正態(tài)分布(Normaldistribution)正態(tài)分布是最自然的分布可以取任何一定范圍內(nèi)的所有實(shí)數(shù)值的概率分布,是連續(xù)概率分布中最具代表性的分布.
正態(tài)分布的特點(diǎn)1)正態(tài)分布的形狀與位置由分布的平均和標(biāo)準(zhǔn)偏差決定
2)正態(tài)分布的概率密度函數(shù)以平均()為中心相對(duì)稱的鐘形.3)正態(tài)曲線不接觸X軸,因此X取值的范圍是-<X<+.
(但觀察值的99.7%在3內(nèi))
4)分布的平均()和標(biāo)準(zhǔn)偏差()無論取什么值,正態(tài)曲線與X軸的全部面積為1.
正態(tài)分布的密度函數(shù)
f(X)=1
√22e-(x-)2/22-<X<+:3.142(元周率)
e:2.7183
:分布的平均:分布的標(biāo)準(zhǔn)偏差63正態(tài)分布(Normaldistribution)正態(tài)分布是正態(tài)曲線(Normalcurve)95.5%43210-1-2-3-468.3%99.73%121=112121221[與決定的正態(tài)分布形狀]12,1=2
1=2,1
2
12,1
2
應(yīng)熟知教材后部分收錄的標(biāo)準(zhǔn)正態(tài)分布的讀法64正態(tài)曲線(Normalcurve)95.5%43210-1標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布是把正態(tài)分布標(biāo)準(zhǔn)化為平均=0,標(biāo)準(zhǔn)偏差=1.某一觀察值X的值,從其分布的平均的距離是標(biāo)準(zhǔn)偏差的多少倍,如下用標(biāo)準(zhǔn)化的概率變數(shù)Z表示,表示為N(0,12)X-
Z=————
0Z=0到Z=1.5之間概率變數(shù)存在的概率P(0≤Z≤1.5)=0.43320Z=0到±45%相應(yīng)的Z值Z=±1.64490比Z=-2小或比Z=2大的范圍內(nèi)存在概率變量的概率-22P(-2≥Z,Z≥2)=0.0456P=0.0228P=0.022865標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布是把正態(tài)分布標(biāo)準(zhǔn)化為平均=0,標(biāo)對(duì)正態(tài)分布的說明影響制造工程的平均值或分散的要因分為1)偶然原因和2)異常原因。偶然原因是如作業(yè)環(huán)境的溫度變化等不可避免的要因,異常原因是指設(shè)備異常,作業(yè)者的失誤等要因不介入異常要因,只有偶然要因作業(yè)時(shí)取出的數(shù)據(jù)必然遵守正態(tài)分布。教育時(shí)可感覺到,在利用連續(xù)型概率變量進(jìn)行統(tǒng)計(jì)分析時(shí)首先應(yīng)考慮分布是否是正態(tài)分布。今后要學(xué)的t-分布,F(xiàn)-分布,2-分布是人們?nèi)藶樽鞒鰜淼母怕拭芏群瘮?shù),但正態(tài)分布是說明自然現(xiàn)象的自然分布。最自然的不就是最美的嗎?每個(gè)銅錢擲10次擲100個(gè)時(shí)每個(gè)銅錢正面出現(xiàn)的次數(shù)與反面出現(xiàn)的次數(shù)畫在直線上時(shí)是否取正態(tài)分布?66對(duì)正態(tài)分布的說明影響制造工程的平均值或分散的要因分為1)偶然練習(xí)題1.X~N(10,4)的正態(tài)分布中X在8≤X≤12范圍的概率是?Z=X-
=12-10
4=0.5,此時(shí)概率是0.691510128Z=X-
=8-10
4=-0.5此時(shí)概率是(1-0.6915)因此0.6915-0.3085=0.382967練習(xí)題1.X~N(10,4)的正態(tài)分布中X在8≤X≤1√n平均標(biāo)本分布
標(biāo)本分布?在母集團(tuán)中按一定大小把能夠取出的標(biāo)本全部取出后,各標(biāo)本的特性值(統(tǒng)計(jì)量)的概率分布
平均的標(biāo)本分布? 在特定的母集團(tuán)按一定大小把能夠取出的標(biāo)本全部取出后計(jì)算各個(gè)標(biāo)本的平均時(shí)其平均的概率分布。x2=_2
nx=_
平均標(biāo)本分布的分散
平均標(biāo)本分布的標(biāo)準(zhǔn)偏差
平均標(biāo)本分布的平均=68平均標(biāo)本分布標(biāo)本分布?平均的標(biāo)本分布中心極限定理(CentralLimitTheorem)平均為,分散為2的無限母集團(tuán)中隨機(jī)抽取大小為n的樣品時(shí)n充分大時(shí)與母集團(tuán)的分布狀態(tài)無關(guān),標(biāo)本平均近似地遵守N(,2/n)。即,的分布近似為N(0,1)。Z=/nX-母集團(tuán)遵守正態(tài)分布時(shí)標(biāo)本的平均必然遵守正態(tài)分布,但此時(shí)標(biāo)本平均的分散分為標(biāo)本的大小(n),因此變小。如果母集團(tuán)不是正態(tài)分布的任意分布時(shí),標(biāo)本大小充分大時(shí)標(biāo)本的平均分布也遵守正態(tài)分布但此時(shí)標(biāo)本平均的分散分為標(biāo)本的大小(n),也變小。69中心極限定理(CentralLimitTheorem)t-分布:互不相同的兩個(gè)集團(tuán)的平均的統(tǒng)計(jì)驗(yàn)證從正態(tài)分布概率標(biāo)本不大,且標(biāo)準(zhǔn)偏差()未知時(shí)
遵守自由度n-1的t-分布。.0S2=(xi-x)
n-1X=xi1
nt=X-
S/√n正態(tài)分布=7=3=1T-分布的特點(diǎn)t分布比正態(tài)分布的形狀擴(kuò)散,自由度()越大越接近于正態(tài)分布。
這是因?yàn)闃?biāo)本的大小小,標(biāo)準(zhǔn)偏差(s)比母集團(tuán)的標(biāo)準(zhǔn)偏差()具有不確信性,所以標(biāo)本的大小n越大,標(biāo)本的標(biāo)準(zhǔn)偏差越接近于母集團(tuán)的標(biāo)準(zhǔn)偏差。t分布根據(jù)自由度變化,自由度是標(biāo)本的大小減1,表示為n-1。70t-分布:互不相同的兩個(gè)集團(tuán)的平均的統(tǒng)計(jì)驗(yàn)證從正態(tài)分t-分布的應(yīng)用
積層薄膜事業(yè)部的CERAMICPOWDER從業(yè)體受入后使用。1月受入的POWDER的平均徑為0.35m,2月是0.38m,2個(gè)月間的POWDER徑是否可以下結(jié)論有差異。t-分布利用于以原來的數(shù)據(jù)為本,統(tǒng)計(jì)地判斷有無平均值的差異比較2個(gè)集團(tuán)間的平均時(shí)需要下列2項(xiàng)前提條件。請(qǐng)思考一下理由.2個(gè)集團(tuán)應(yīng)具有相當(dāng)正規(guī)的分布2集團(tuán)的分散均勻利用t-分布進(jìn)行比較時(shí)一個(gè)集團(tuán)內(nèi)有30個(gè)以上的數(shù)據(jù)時(shí)可以減少誤差。71t-分布的應(yīng)用積層薄膜事業(yè)部的CERAMICPOWD標(biāo)本分布中計(jì)算平均的位置1.正態(tài)分布:已知母集團(tuán)的標(biāo)準(zhǔn)偏差()時(shí)可以適用(可能性很少)Z=X-
/√nMINITAP的1-SPLZTest實(shí)際上在我們想知道母集團(tuán)的平均時(shí),我們提前知道母集團(tuán)的標(biāo)準(zhǔn)偏差而去接近的情況極少。2.t-分布:t=X-
S/√n參照MINITAP的1-SPLtTest,2-SPLtTest想知道母集團(tuán)的平均時(shí),雖然不知道母集團(tuán)的標(biāo)準(zhǔn)偏差,但并不難求出樣品的標(biāo)準(zhǔn)偏差(S)。72標(biāo)本分布中計(jì)算平均的位置1.正態(tài)分布:已知母集團(tuán)的標(biāo)準(zhǔn)偏2-分布:不相同的兩個(gè)以上集團(tuán)的概率的統(tǒng)計(jì)驗(yàn)證根據(jù)情況不僅平均的標(biāo)本分布,連分散的標(biāo)本分布也很重要。例如罐頭廠罐頭的平均重量與罐頭的重量都很重要母集團(tuán)的分散的標(biāo)本分布可利用2分布表示,兩個(gè)母集團(tuán)的分散的標(biāo)本分布可利用F分布表示。對(duì)正態(tài)母集團(tuán)N(,2)的概率分布X1,X2,….Xn 的分布稱為自由度為n-1的2分布.2
=(Xi-X)2
2(n-1)S2
2=f(x)0n=1n=5n=10732-分布:不相同的兩個(gè)以上集團(tuán)的概率的統(tǒng)計(jì)驗(yàn)證根據(jù)2-分布:實(shí)際的使用例題
現(xiàn)有1元的硬幣1個(gè),張課長(zhǎng)擲硬幣100次時(shí)正面出現(xiàn)63次,反面出現(xiàn)37次。理想的結(jié)果是正面50次,反面50次。此時(shí)是否可以下結(jié)論上述結(jié)果是偶然出現(xiàn)的,或者認(rèn)為是因?yàn)橛矌诺男螤畈徽3霈F(xiàn)的必然結(jié)果得出這種比率的結(jié)論時(shí),可以有效使用2分布近似的情況有在生產(chǎn)現(xiàn)場(chǎng)白班作業(yè)的不良率為2.0%,夜班作業(yè)的不良率為2.5%那么是否可以確信夜班不良率高于白班不良率?請(qǐng)用MINITAB得出結(jié)果.742-分布:實(shí)際的使用例題現(xiàn)有1元的硬幣1個(gè),張課長(zhǎng)F-分布:不同的兩個(gè)以上集團(tuán)的分散的均一性驗(yàn)證.母集團(tuán)是正態(tài)分布,從具有分散12,22
的兩個(gè)母集團(tuán)中抽取大小為n1,n2兩個(gè)標(biāo)本計(jì)算標(biāo)本分散.兩個(gè)標(biāo)本分散為S12,S22時(shí)由標(biāo)本分散與母分散的比率形成的兩個(gè)2的比率形成F分布,F分布具有兩個(gè)自由度.12
=(n1-1)S12
12
~
12(n1-1)22
=(n2-1)S22
22
~
22(n2-1)12/(n1-1)22/(n2-1)=S12/12S22/22~F(n1-1,n2-1)上式內(nèi)容中可知F分布是比較兩個(gè)母集團(tuán)的分散75F-分布:不同的兩個(gè)以上集團(tuán)的分散的均一性驗(yàn)證.母集F-分布:實(shí)際的使用例1=2,2=41=12,2=121=4,2=6金代理在進(jìn)行工程變化后,將變化前后的平均值用t-Test比較的結(jié)果,認(rèn)為沒有差異認(rèn)為工程變化對(duì)制品特性無影響.這個(gè)判斷正確嗎答)錯(cuò)誤.分布的特性不僅是平均值,還要考慮分散.在上述情況平均相同,但工程變化后的分散比變化前增加了2倍,得出結(jié)論是工程變化影響制品特性.F-分布是用在比較分散的均一性.了解一下利用MINITAB的實(shí)際的使用方法和解釋方法.76F-分布:實(shí)際的使用例1=2,2=41=12,推定與驗(yàn)證
推定?母集團(tuán)的特點(diǎn)由分布函數(shù)來體現(xiàn),母集團(tuán)具體的特點(diǎn)由分布函數(shù)的母數(shù)來決定因此為了解母集團(tuán)的具體的性格對(duì)母數(shù)進(jìn)行的推測(cè)叫推定(Inference).
驗(yàn)證?假設(shè)母集團(tuán)的母數(shù),以樣品的情報(bào)來判斷其假設(shè)的真?zhèn)蔚倪^程叫假設(shè)驗(yàn)證.(HypothesisTesting).77推定與驗(yàn)證推定?33推定為了解母集團(tuán)的特點(diǎn)推測(cè)母集團(tuán)的分布函數(shù)推定的種類
1)點(diǎn)推定
未知的母數(shù)用一個(gè)推定值表示,但因未包括誤差的范圍,無法保障與母數(shù)一致。
2)區(qū)間推定
預(yù)想包括母數(shù)的真值的預(yù)想?yún)^(qū)間,按照信賴區(qū)間范圍不同對(duì)母數(shù)進(jìn)行區(qū)間推定時(shí)指求P(L<<U)=1-的L與U此時(shí)[L,U]稱為信賴區(qū)間,1-為信賴水平.78推定為了解母集團(tuán)的特點(diǎn)推測(cè)母集團(tuán)的分布函數(shù)推定的種類34推定母集團(tuán)平均的信賴區(qū)間0/2=0.025-Z0.025=-1.96/2=0.025Z0.025=1.96=0.05時(shí)Z/2和-Z/2的值即,信賴區(qū)間:95%1)已知標(biāo)準(zhǔn)偏差:利用正態(tài)分布P(-Z/2<<Z/2)=1-
X-
/√nP(L<<U)=1-
對(duì)此解X-Z/2/√n<<X+Z/2/√n的100(1-)信賴區(qū)間因可得出上述所有變數(shù),可以推定平均的區(qū)間推定79推定母集團(tuán)平均的信賴區(qū)間0/2=0.025-Z0.02推定母集團(tuán)平均的信賴區(qū)間=0.05時(shí)t/2與-t/2的值即,信賴區(qū)間:95%2)未知標(biāo)準(zhǔn)偏差時(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 個(gè)人資金周轉(zhuǎn)借款合同:信用貸款合同
- 二手房交易標(biāo)準(zhǔn)協(xié)議簡(jiǎn)明2024一
- 2025年物業(yè)服務(wù)企業(yè)數(shù)字化轉(zhuǎn)型服務(wù)合同3篇
- 2025年度物流信息化解決方案承包合同4篇
- 中科軟件園辦公區(qū)2024年度使用權(quán)協(xié)議版
- 二零二五年度生態(tài)公園綠化養(yǎng)護(hù)合作協(xié)議4篇
- 2025年度新能源汽車品牌區(qū)域銷售代理合同協(xié)議4篇
- 2025年度旅游紀(jì)念品銷售與旅游服務(wù)合同4篇
- 2025年度鋁型材產(chǎn)品出口退稅服務(wù)合同4篇
- 二零二五版跨境持股合作合同協(xié)議書3篇
- 影視劇制作投資分紅協(xié)議
- 2024-2025學(xué)年成都青羊區(qū)九上數(shù)學(xué)期末考試試卷【含答案】
- 2025年競(jìng)聘醫(yī)院內(nèi)科醫(yī)生崗位演講稿模版(3篇)
- 虛擬貨幣地址分析技術(shù)的研究-洞察分析
- 綠色供應(yīng)鏈管理制度內(nèi)容
- 心理學(xué)基礎(chǔ)知識(shí)考試參考題庫500題(含答案)
- 電力智慧檢修安全運(yùn)行三維可視化管理平臺(tái)建設(shè)方案
- 一年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)集錦
- 消防安全應(yīng)急預(yù)案下載
- 《北航空氣動(dòng)力學(xué)》課件
- 附件:財(cái)政業(yè)務(wù)基礎(chǔ)數(shù)據(jù)規(guī)范(3.0版)
評(píng)論
0/150
提交評(píng)論