統(tǒng)計方法基礎知識_第1頁
統(tǒng)計方法基礎知識_第2頁
統(tǒng)計方法基礎知識_第3頁
統(tǒng)計方法基礎知識_第4頁
統(tǒng)計方法基礎知識_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四部分QC小組統(tǒng)計技術應用第一頁,共52頁。

QC小組活動為什么要應用統(tǒng)計技術1、證實活動的科學性,達到質量改進的目的2、運用統(tǒng)計方法——增強分析解決問題的能力3、用事實數據說話——提供活動的證據4、準確的統(tǒng)計分析——決策下一步行動5、提高活動效率——少走或不走彎路第二頁,共52頁。(1)統(tǒng)計方法基礎知識第三頁,共52頁。

統(tǒng)計方法基礎知識(P116)統(tǒng)計:收集和整理國情、資料的一種活動。◆統(tǒng)計方法:收集、整理、分析和解釋統(tǒng)計數據,并對其所反映的問題做出一定結論的方法。目的:進行數據的整理、分析。方法:全數檢驗或隨機抽取。工具:“老七種工具”、“新七種工具”等。一、什么是統(tǒng)計方法第四頁,共52頁。一、什么是統(tǒng)計方法(P116)統(tǒng)計方法分類:一般分為描述性和推斷性兩類。

如老師由這個班級的數學平均成績,去估計整個年級5個班的平均水平,這種統(tǒng)計估計就屬于推斷性統(tǒng)計方法。推斷性統(tǒng)計方法要通過詳細樣本來達到了解、推斷總體的目的。具有由局部推斷整體的性質,如控制圖、散布圖、假設檢驗、抽樣檢查等。(2)推斷性:在對統(tǒng)計數據進行描述的基礎上,進一步分析、解釋和作出推斷性結論。展示出統(tǒng)計數據的規(guī)律,這就是統(tǒng)計方法的描述性,例:計算一個班級的數學平均成績,最高最低分的差距,描述性統(tǒng)計方法常用曲線、表格、圖形反映統(tǒng)計數據和描述觀測結果,使數據更容易理解,如排列圖、直方圖、柱狀圖、折線圖等。(1)描述性:對統(tǒng)計數據進行整理和描述第五頁,共52頁。二、統(tǒng)計方法的性質:

描述性、推斷性、風險性。(1)描述性:用統(tǒng)計方法對數據進行整理和描述,展示統(tǒng)計數據的規(guī)律,就是統(tǒng)計方法的描述性(2)推斷性:統(tǒng)計方法通過詳細研究樣本,達到了解、推斷總體的目的,具有由局部推斷整體的性質。(3)風險性:部分推斷全體,結論不可能全正確,可能有錯誤,有錯誤就要承擔風險。正確運用統(tǒng)計方法,把風險降至最低。第六頁,共52頁。1、提供特征數據;(平均值、中位數、標準偏差、方差、極差等)2、比較差異;(假設檢驗、顯著性檢驗、水平對比)3、分析影響因素;(因果圖、系統(tǒng)圖、分層法等)4、分析相關關系;確定關系的性質和程度(散布圖)5、確定試驗方案;(抽樣檢驗、單因素檢驗、正交試驗、可靠性試驗等)6、發(fā)現問題,分析動態(tài)變化情況(排列圖、直方圖、控制圖、散布圖等)7、描述質量形成過程(流程圖、控制圖等)三、統(tǒng)計方法的用途第七頁,共52頁。1、QC小組活動要求用事實和數據說話,沒有對事實的統(tǒng)計分析就不能提供活動的證據。2、沒有準確的統(tǒng)計分析有可能發(fā)生錯誤的判斷,導致下一步行動的決策錯誤。3、沒有數據分析就不能充分體現科學性。4、不使用統(tǒng)計方法QC小組往往會走彎路,影響小組的活動效率及小組成員的積極性。5、學會和使用統(tǒng)計方法將提高QC小組成員分析問題和解決問題的能力。6、統(tǒng)計方法是科學管理的基礎,正確、適宜地使用統(tǒng)計技術也是對QC小組的基本要求。四、QC小組為什么要用統(tǒng)計方法第八頁,共52頁。統(tǒng)計數據及分類數據分類:計量數據、計數數據1、計量數據

服從于正態(tài)分布凡是可以連續(xù)取值的,或可以用測量工具測量出小數點以下數值的數據。如:用于計量的長度、重量、溫度、時間、強度等數據。

長度1—2mm之間,可連續(xù)測出1.1、1.2….1.1—1.2之間還可測出1.11、1.12等數第九頁,共52頁。統(tǒng)計數據及分類(P118)2、計數數據凡是不能連續(xù)取值的或用測量工具也得不到小數點以下的數據,而只能自然數的數據稱為計數數據。計數數據分為:計件數據服從于二項分布

計點數據服從于泊松分布12345只能測得0或1、2、3、…等自然數,不合格品數、缺陷數,只能測得1件、2件第十頁,共52頁。

計件數據:

按件計數的數據,如不合格品數、不合格品率、彩色電視機數等。統(tǒng)計數據及分類計點數據:

指按缺陷點(項)計數的數據,不合格數、如疵點數、砂眼數、氣泡數、產品缺陷數等。注意:

當數據以百分率表示時,判斷它是計量數據還是計數數據,取決于給出數據的計算公式的分子,當分子是計量數據時、則求得的百分率數為計量數據,當分子是計數數據時,即使得到百分率不是整數、也屬計數數據。12臺1000臺×100%=1.2%生產的1000臺電動機中有12臺不合格。從1.2%看雖有小數點以下數值,計算公式分子12臺是計數數據,1.2%應為計數數據。第十一頁,共52頁。產品質量的波動(P119)

過程中有許多導致波動的因素存在;每種因素的發(fā)生是隨機的且無法預測,但都影響著過程的輸出,即質量特性;波動具有隨機性也有規(guī)律性;質量特性有波動是正常,無波動則屬異常;徹底消滅波動是不可能的,但減少波動是可能的;

質量管理工作的一項重要工作,就是把正常波動控制在合理范圍之內,消除異常波動。

一、波動理論第十二頁,共52頁。1、正常波動:

隨機原因引起的產品質量波動。特點:大量存在、影響很小、消除難度大、經濟代價高。要求:一般情況下在生產過程中允許存在??刂茽顟B(tài):僅有正常波動的生產過程,簡稱為控制狀態(tài)或穩(wěn)定狀態(tài)。

產品質量波動分為正常波動和異常波動兩類。二、波動的分類第十三頁,共52頁。特點:不經常發(fā)生,一旦發(fā)生影響較大,容易查明原因,容易預防和消除。要求:由于對生產影響大,生產過程中不允許存在。產品質量的波動

2、異常波動:由系統(tǒng)原因引起的產品質量波動。質量管理工作的一項重要工作,就是把正常波動控制在合理范圍之內,消除異常波動。第十四頁,共52頁。三、引起波動的因素引起產品質量波動六個方面,“5M1E”因素:人員(Man)操作者的意識、技術、素養(yǎng)及熟練程度等;機器(Machine)設備、工夾具精度、維護與保養(yǎng)等;材料(Material)化學成份、物理性能及外觀質量等;方法(Method)加工工藝、操作規(guī)程的作業(yè)程度;測量(Measure)測量設備、試驗手段和測試方法等;環(huán)境(Enviroment)工作場地的溫、濕度,照明噪聲等;正常波動—隨機原因—隨機特點—普遍存在異常波動—系統(tǒng)原因—系統(tǒng)特點—單一現象飛機晚點:空中管制、調配、天氣變化、機械故障第十五頁,共52頁。

當過程處于穩(wěn)定狀態(tài)時,產品質量特性數據,其波動服從于一定的分布規(guī)律。例如:長度尺寸必然形成右圖的分布規(guī)律。

四、波動的規(guī)律性正態(tài)分布圖分布有兩種類型:一種是連續(xù)型分布常見的有:正態(tài)分布(計量數據)一種是離散型分布,常見的有:1、二項分布(計件數據)2、泊松分布(計點數據)第十六頁,共52頁。關于正態(tài)分布正態(tài)分布受兩個參數影響μ(總體平均值)——集中位置σ(總體標準偏差)——分散程度通常用樣本平均值:X樣本的標準偏差:S正態(tài)分布曲線,又稱高斯曲線、鐘型曲線。μσXS備注:高斯德國數學家第十七頁,共52頁。正態(tài)分布特性區(qū)間內的概率0.68260.95450.9973XS±σ±2σ±3σ第十八頁,共52頁。

如果你是某學校高一的班主任,當每次考試成績公布前,你第一想知道的結果是什么?一、正態(tài)分布參數平均值

μ人口普查華東,人均收入、男女平均身高等第十九頁,共52頁。1、一組數據向其中心值靠攏的傾向和程度2、測量集中位置就是尋找數據一般的代表值和中心值。3、平均值是正態(tài)分布曲線的位置參數,它只決定曲線出現頻率最大數值,而不改變正態(tài)曲線的形狀。4、平均值易受極端值的影響。

一、正態(tài)分布參數平均值

總體平均值μ(樣本平均值X)第二十頁,共52頁。一、正態(tài)分布參數平均值

μμ1μ2σ相同

μ不同的正態(tài)分布曲線μ不同,最大值的位置不同μ是正態(tài)分布的中心607080三次考試的平均成績第二十一頁,共52頁。

如果你想過河,有人只告訴你河的平均深度是1.5米,你是否還想知道它的變化范圍。二、正態(tài)分布參數標準偏差σ標準偏差說明數據的分散程度第二十二頁,共52頁。二、正態(tài)分布參數標準偏差

1、數據分布的另一個重要特征2、離散程度的各測度值就是對數據分散程度所作的描述。3、反映一組數據各變量值遠離其中心值的程度,因此也稱為離中趨勢總體標準偏差σ(樣本標準偏差S)第二十三頁,共52頁。二、正態(tài)分布參數標準偏差

標準偏差是正態(tài)分布曲線的形狀參數,它決定了曲線的高、矮、胖、瘦。當σ較小時,數據較多集中于平均值附近,曲線形狀就較高和瘦;當σ較大時,數據集中程度就差,曲線就矮和胖。第二十四頁,共52頁。μ

相同

σ不同的正態(tài)分布曲線σ1=0.4σ2=1.0σ3=2.5問題:σ是多少考試分數較接近?σ不同曲線的高度不同σ決定曲線的形狀二正態(tài)分布參數標準偏差第二十五頁,共52頁。三、正態(tài)分布主要特點:1、集中性:正態(tài)曲線的高峰位于正中央,即均數所在的位置;2、對稱性:正態(tài)曲線以均數為中心,左右對稱,曲線兩端永遠不與橫軸相交;(是否有零缺陷?)3、均勻變動性:正態(tài)曲線由均數所在處開始,分別向左右兩側逐漸均勻下降,靠近μ的偏差出現概率較大,遠離μ的偏差出現概率小,在遠離一定的范圍以外的偏差,其出現的概率是很小的如:(在±3σ以外的偏差,出現概率不到0.3%)。4、曲線與橫坐標軸所圍成的面積等于1;5、對μ的正偏差和負偏差概率相等。第二十六頁,共52頁。正態(tài)分布特性μminmax—XXS±σ±2σ±3σ極差相當于6倍的標準偏差99.73%區(qū)間內的概率0.68260.95450.99730.999940.999994±σ±2σ±3σ±4σ±5σσ第二十七頁,共52頁??傮w:指某次統(tǒng)計分析中研究對象的全體又稱母體。

總體是提供數據的大本營、數據庫。如某專業(yè)同一年的考生、一條生產線的某個零件、所有中國工人、農民、18歲的人都可分別構成一個總體。我們?yōu)檠芯恳坏拦ば蚧蛞慌a品質量的好壞、這道工序、這批產品就是總體??傮w可以是有限的、也可是無限的。一批電子元件10萬件,5萬個電阻,數量大,但可以數清,為有限總體??傮w也可以是一個過程。如生產線上的一道工序,自來水管中的水,煤氣管道中的煤氣等為無限總體。組成總體的每個單元(產品)叫做個體??傮w中所含的個體數叫做總體含量(總體大小)。用符號N表示??傮w與樣本(P124)第二十八頁,共52頁。

樣本:從總體中隨機抽取出來要對其進行分析的一部分個體,也稱為子體。

樣本中所含的樣品數目、一般叫樣本大小或樣本容量、常用符號“n”表示。例:從1000件產品中隨機抽取20件、對它進行檢測,這20件產品組成一個樣本即n=20、樣本是由一個或若干個樣品組成的??傮w與樣本抽樣:從總體中隨機抽取樣品組成樣本的活動過程。隨機抽樣:使總體中每一個個體都有同等的機會被抽取出來組成樣本的活動過程。第二十九頁,共52頁??傮w可以是一批產品,進行質量判斷,確定是否合格(有限總體)??梢允且粋€過程對工序進行分析控制(無限總體)。

判斷隨機抽取測量總體樣本數據總體與樣本的關系(P124)

第三十頁,共52頁。用樣本推斷總體樣本總體樣本統(tǒng)計量如:樣本均值方差、標準差總體均值、方差、標準偏差第三十一頁,共52頁。SX計算時代表判斷μσ數量:N集中位置(平均值):μ分散程度(標準偏差):σ總體數量:N數量:n樣本X數量:n平均值:標準偏差:s如果產品特性值是計量數據,則總體與樣本的關系:第三十二頁,共52頁。

1、簡單隨機抽樣從:抽樣誤差小。抽樣手續(xù)比較繁雜。100件中抽10件組成樣本,把100件從1至100編號,用抽簽(抓鬮)查數值表抽10張。例

2、系統(tǒng)抽樣法(等距抽樣)

例:100件從1至100編號,抽簽或查隨機數值表,確定那件產品入選,如5號、15、25、操作簡便、不易出差錯。易出現大的偏差,織布機恰好50米出現一段疵布

3、分層抽樣法(類型抽樣法)

甲、乙、丙三個工人同一臺設備加工零件,放在三個地方,抽15個零件組成樣本,隨機在三個地方抽5個組成樣本,代表性好、誤差小。抽樣手續(xù)繁雜。

4、整群抽樣法(集團抽樣)

將總體分成許多群,如每隔10小時抽30分鐘的產量組成樣本。實施方便抽樣誤差大。用于工序控制。

隨機抽樣方法第三十三頁,共52頁。

某零件20箱,每箱50個,共1000個、要抽取100個進行測試研究,怎樣用上述4種方法

1、20箱倒在一起混合,從1至1000編號,查隨機數表或抽簽,抽出毫無規(guī)律的100個樣本,簡單隨機抽樣。2、20箱混合,1至1000編號,查隨機數表或抽簽決定起始號,如6號,依次為16、26、916、100個樣本,系統(tǒng)抽樣。3、20箱中每箱隨機抽取5個,100個樣本,分層抽樣。4、20箱隨機抽出2箱,進行檢驗,整群抽樣。隨機抽樣方法第三十四頁,共52頁。

統(tǒng)計特征數是對樣本來說的。常用的統(tǒng)計特征數可分為兩類:一:表示數據的集中位置1、樣本平均值2、樣本中位數二:表示數據的離散程度1、樣本方差

s2

2、樣本標準偏差s

;3、樣本極差R

統(tǒng)計特征數(P125)~

x第三十五頁,共52頁。一、表示數據的集中位置1、樣本的平均值2、樣本的中位數中心位置—X~

xX~

x第三十六頁,共52頁。

樣本平均值(P126)—X式中樣本的算術平均值;

n:樣本大小。最常用的測度值,是集中趨勢的測度值之一,易受極端值影響。計算公式:

=—X:第三十七頁,共52頁。

樣本平均值—X

原始數據: 10 5 9 13 6 85.868613951066543211=+++++=+++++==?=XXXXXXNXXNii計算算例:第三十八頁,共52頁。

樣本中位數(P126)將所收集的數按大小排序,在正中位置的數為中位數。集中趨勢的測度值之一。不受極端值影響。50%50%~

x當N為畸數時,中位數為正中間位置的數。當N為偶數時,中位數為正中間兩個數的算術平均值。~

x較樣本平均值表示的集中位置粗略第三十九頁,共52頁。五個數據取中位數原始數據:105 91268排序: 5688.5

91012位置: 123 456原始數據: 2422212620排序: 2021222426位置: 12345六個數據取中位數中位數8+928.5中位數22第四十頁,共52頁。數據分布的另一個重要特征離散程度的各測度值就是對數據離散程度所作的描述它所反映的是各變量值遠離其中心值的程度,因此也稱為離中趨勢從另一個側面說明了集中趨勢測度值的代表程度離散程度minmax—X離中趨勢第四十一頁,共52頁。二、表示數據的離散程度minmax—X離散程度1、樣本的方差S22、樣本的標準偏差S3、樣本的極差R第四十二頁,共52頁。方差和標準差(P126)離散程度的測度值之一最常用的測度值反映了數據的分布反映了各變量值與均值的平均差異根據總體數據計算的,稱為總體方差或標準差;根據樣本數據計算的,稱為樣本方差或標準差4681012X=8.3第四十三頁,共52頁。1、樣本方差的計算樣本方差S2

:(xi-x):表示某一數據與樣本平均值之間的偏差n:采集的樣本數

n-1:樣本方差的自由度第四十四頁,共52頁。一組數據中可以自由取值的數據的個數當樣本數據的個數為

n

時,若樣本均值確定后,只有n-1個數據可以自由取值,其中必有一個數據則不能自由取值;例如,樣本有3個數值,即x1=2,x2=4,x3=9,則x=5。當x=5確定后,x1,x2和x3有兩個數據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2;樣本方差用自由度去除,其原因可以從多方面來解釋,從

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論