統(tǒng)計學(xué)根本概念_第1頁
統(tǒng)計學(xué)根本概念_第2頁
統(tǒng)計學(xué)根本概念_第3頁
統(tǒng)計學(xué)根本概念_第4頁
統(tǒng)計學(xué)根本概念_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)根本概念6導(dǎo)論(GB103)6管理模式統(tǒng)計學(xué)根本概念主 要 內(nèi) 容1. 波動(偏差)。2. 連續(xù)變量和邏輯變量。3. 均值,中位數(shù),眾數(shù),極差,方差, 標準偏差。4. 正態(tài)曲線。5. 帶正值的標準化數(shù)據(jù)。6. 中心極限定律。7. 過程能力一用Z值作為恒量尺度。波動的型式與原因 任何過程都包含隨機波動(由于一般或普遍原因造成的)和非隨機波動(由于特殊原因造成的)。 時 間不合格產(chǎn)品率特殊波動歷史水平(0)最正確水平(1)在 0 (30) 范圍內(nèi)的隨機波動在 1 (31) 范圍內(nèi)的隨機波動普遍原因:過程波動隨時間推移是穩(wěn)定的,可預(yù)測的處于控制狀態(tài)原因: 固有的或是自然的 例如: 垂直向上空先

2、把硬幣夾垂直) 拋擲一枚硬幣, 統(tǒng)計硬幣落地后每一面向上的次數(shù)。當拋擲次數(shù)很多時,每面向上的次數(shù)大約各占一半,只有微小差異。 普遍原因:差異的原因:有風,每次拋擲動作有微小差異,地面不平整,等等。波動的型式與原因 特殊原因:過程波動無法預(yù)測 (按小時,按天或按周)處于失控狀態(tài)原因: 機器調(diào)整不當,原材料不合格,操作者本身目標: 檢測和消除特殊原因特殊原因:例如: 同樣是拋硬幣,拋1000次,AB兩面 各自向上的次數(shù)卻相差400屢次。原因: 操作者每次拋擲時,總時將硬幣平放,且總是將正面朝上,然后拋出。波動的型式與原因 數(shù)據(jù)的兩種類型連續(xù)(可變)數(shù)據(jù):使用一種度量單位,比方英寸或小時。 連續(xù)(可

3、變)數(shù)據(jù)的例子:電壓、電流、 功率、時間、距離、重量、速度。離散(邏輯)數(shù)據(jù):是類別信息,比方“合格 或“不合格。連續(xù)數(shù)據(jù)離散數(shù)據(jù)統(tǒng)計領(lǐng)域用以下方法處理波動(偏差):描述型統(tǒng)計用圖表或總結(jié)性的數(shù)字 ( 均值,方差, 標準偏差)來描述一系列數(shù)據(jù)。統(tǒng) 計 推 斷當結(jié)果差異可能因為隨機偏差或不能歸 屬為隨機偏差時所作的決定(假設(shè)檢驗)。試 驗 設(shè) 計收集并分析數(shù)據(jù)估計過程改變效果。數(shù)理統(tǒng)計的作用總體和樣本總體(母體): 它是提供數(shù)據(jù)的原始集團,是所要研究分析的對象的全部??傮w可以是一批產(chǎn)品由于一批產(chǎn)品的數(shù)量是有限的,故稱為有限總體),也可以是一道工序所生產(chǎn)的所有產(chǎn)品由于其源源不斷的運行,甚至也包含今

4、后的產(chǎn)品,故稱為無限總體)樣本(子樣,抽樣,試樣): 從總體中抽出一局部個體,總體中的這一局部個體稱之為樣本。它是直接被檢測并提供數(shù)據(jù)的諸個體。連續(xù)數(shù)據(jù)的測量如何描述數(shù)據(jù)的統(tǒng)計特性:measures of location (central tendency居中程度)measures of dispersion (variation離散程度)描述數(shù)據(jù)的居中程度Mean均值Median中位數(shù)Mode眾數(shù)Quartiles四分位數(shù) 輸出值 聚集在某個中心值附近居中趨勢平均值,中位數(shù),眾數(shù),四分位數(shù)是所有居中趨勢的測量均 值 (中心值) 均值 總體或樣本的平均值。 總體的中心值用 表示。 樣本的中心

5、值用x 表示。 樣本均值的計算公式如下:The mean is the most common measure of location or center of the data.中 位 數(shù) 中位數(shù) 反響樣本數(shù)據(jù)中間50%的數(shù)值,一系列數(shù)據(jù) 由低到高排列后所得到的中間數(shù)。偶數(shù)奇數(shù) 眾數(shù)-在一個數(shù)據(jù)集中最頻繁出現(xiàn)的值。眾 數(shù)The mode is the observation that occurs most frequently in the sample.The mode may be unique, or there may be more than 1 mode. Sometimes,

6、 the mode may not exist.Range極差Variance方差Standard Deviation標準偏差I(lǐng)nter Quartile Range內(nèi)四分位極差描述數(shù)據(jù)的離散程度離散程度的測量用來判定一個數(shù)據(jù) 集合離散程度或?qū)挾鹊暮懔砍叨葮O 差 - 在一個樣本中最大值與最小值的差值。 極差 = 最大值 - 最小值 即:R= x(max) x(min)方 差 與中心值間距的平方和的平均值。 總體的方差用 表示 樣本的方差用 s2 表示標準偏差 是方差的平方根。 總體標準偏差由 表示 樣本標準偏差由 s 表示Units of Measure直方圖塊的中點中心光滑連接形成曲線大多數(shù)

7、但不是所有數(shù)據(jù)是正態(tài)分布或鐘形曲線正 態(tài) 分 布 在許多實際問題中, 我們遇到的隨機變量都受到為數(shù)眾多的相互獨立的隨機因素的影響, 而每一個別因素的影響都是微小的, 且這些影響是可以疊加的. 例如, 電燈在指定條件下的耐用時間受到原料,工藝,保管等條件的影響,而且每一種因素在正常情形下都是均勻地微小且可以疊加的. 具有上述特點的隨機變量一般都可以認為是具有正態(tài)分布的隨機變量. 在現(xiàn)實生產(chǎn)生活中, 我們所遇到實際問題大多數(shù)都屬于具有正態(tài)分布的隨機變量, 因此在此我們重點討論研究此類分布.正 態(tài) 分 布 簡 介正態(tài)分布的特點: 1. 形態(tài)如鐘; 2. 左右對稱; 3. 于平均值處分布的頻數(shù)最多。此

8、外,越遠離平均值,分布的頻 數(shù)也越少。正態(tài)分布的要素: 1.平 均 值:決定正態(tài)分布曲線的中心位置; 2.標準偏差:決定正態(tài)分布曲線的 “寬窄.為何要研究正態(tài)分布?1.它是自然界的一種最根本的最普遍的法那么,反響了事物內(nèi)在的變化規(guī)律; 2.它使我們得以將許多復(fù)雜的事物簡化處理; 3.它使我們得以通過少量抽樣來把握全體,從而節(jié)省大量人力,物力,財 力和時間。正 態(tài) 分 布 簡 介正態(tài)檢驗為什么有用?許多統(tǒng)計檢驗均值和方差的檢驗都假定數(shù)據(jù)是正態(tài)分布的,正態(tài)檢驗用來判定該假定是否有效。何時用正態(tài)檢驗? 當你分析數(shù)據(jù)并要計算根本統(tǒng)計值如Z值或假定正態(tài)性的統(tǒng)計檢驗如T-檢驗或方差分析(ANOVA)時。分

9、布的正態(tài)性檢驗如何做正態(tài)性檢驗?采用Minitab公司的專業(yè)統(tǒng)計軟件MINITAB: 如何做正態(tài)性檢驗?方法1:從Minitab的菜單項選擇項里, 選擇: Stat Basic Statistics Normality Test翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV如何做正態(tài)性檢驗?從Minitab的菜單項選擇項里, 選擇 Stat Basic Statistics Normality Test. 我們可以看到以下圖的對話框。變量:選擇一列數(shù)據(jù)用于X軸。 正態(tài)檢驗: 有3種類型,通常用Anderson-Darling test. 標題: 用你自擬的題目取代默認的。 單擊

10、 OK. 圖形輸出如以下圖。 正態(tài)概率圖:如何做正態(tài)性檢驗?如何做正態(tài)性檢驗?方法2:從Minitab的菜單項選擇項里, 選擇: Stat Basic Statistics Display Descriptive Statistics 翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV如何做正態(tài)性檢驗?從Minitab的菜單項選擇項里, 選擇: Stat Basic Statistics Display Descriptive Statistics我們可以看到以下圖的對話框。 如何做正態(tài)性檢驗?結(jié)果顯示:P-Value大于0.05,判定數(shù)據(jù)的分布為正態(tài)分布。 (冒險概率=0.05)

11、 如何做正態(tài)性檢驗? 顯示在圖上的總結(jié)包括添加了分布曲線的直方圖和Anderson Darling正態(tài)檢驗的P值 顯示在右上角。 正態(tài)檢驗的通常規(guī)那么當P值小于或等于0.05那么認為樣本數(shù)據(jù)的分布不同于標準的正態(tài)分布。相反,當P值 大于0.05,那么認為樣本數(shù)據(jù)的分布與正態(tài)沒有顯著差異。 進一步解釋:正態(tài)性檢驗屬于根據(jù)樣本來檢驗關(guān)于總體分布的檢驗方法,屬于數(shù)學(xué)中的非參數(shù)檢驗方法。對于正態(tài)檢驗,原 假 設(shè) 為: H0:總體的分布與正態(tài)分布無顯著差異;對立假設(shè)為: H1:總體的分布與正態(tài)分布有顯著差異。 其中P值代表判斷總體數(shù)據(jù)分布和正態(tài)分布沒有顯著差異的可能性。上圖表現(xiàn)了數(shù)據(jù)分布的直方圖及分布曲

12、線,從圖中我們可以看出此圖不是正態(tài)分布。結(jié)果說明:Visual interpretation the data set.Common graphical tools to illustrate a data set:Dot Plot 散點圖Box Plot 盒子圖Histogram 直方圖圖形工具描述散點圖 ( Dot Plot )The dot plot is useful for displaying a small body of data.散點圖更易分析樣本容量較少的參數(shù)特性。The location or central tendency in the data set and it

13、s spread or dispersion are easily identified.散點圖對單個樣本數(shù)據(jù)的居中程度和離散程度都很容易看出來。It can also be used in comparing two or more data sets.散點圖還可用于定性地比較兩組樣本或多組樣本的數(shù)據(jù)之間有無顯著差異。案例:某器件AM5003特性參數(shù)電流增量( mA ):批次A:4.5,7.3,4.8,6.2,8.7,5.1,3.5,5.4,4.6,3.8批次B:4.5,7.3,4.8,6.2,8.7,5.1,11,13,9.7,10.5Minitab: Graph Dotplot 散點圖

14、( Dot Plot )翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV結(jié)論:散點圖 結(jié)果顯示:批次A的電流增量比較集中,均值小,因此批次A的 質(zhì)量比較穩(wěn)定;而批次B的電流增量比較分散,均值較大,性能較差。圖形結(jié)果顯示:散點圖 ( Dot Plot )批次A批次B盒子圖 ( Box Plot )Not to be used when sample size is less than 10 units.注意:當樣本容量小于 10 時請勿采用! 盒子圖是比較樣本數(shù)據(jù)間的分布差異,中心位置和分散大小。 和散點圖相近,都是用來分析樣本數(shù)據(jù)的居中程度和離散程度,但比散點圖更直觀,更有效。*

15、異常點 75%數(shù)(3/4分位)Q3Q1MaxMinimum, Q1 - 1.5 IQRQ3 + MinMaximum, Q3 + 1.5 IQR 25%的數(shù)(1/4分位)Q1中位數(shù)(1/2分位)Q2注:盒子的高度內(nèi)四分位極差(IQR) Inter Quartile Range Q3-Q1 盒子圖 ( Box Plot )數(shù)據(jù)的中心50%(盒子的高度)Minitab: Graph Boxplot : 盒子圖 ( Box Plot )翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV單個樣本數(shù)據(jù)分析:圖形結(jié)果顯示單個樣本數(shù)據(jù)分析:盒子圖 ( Box Plot )盒子圖 ( Box Pl

16、ot )翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV多個樣本數(shù)據(jù)比較分析:盒子圖 ( Box Plot )圖形結(jié)果顯示多個樣本數(shù)據(jù)比較分析:直方圖 ( Histogram )The histogram, a graphical presentation of the frequency distribution, provides a visual impression of the shape ofthe distribution of measurements.直方圖表征數(shù)據(jù)的概率分布,主要應(yīng)用在了解數(shù)據(jù)分布的形狀 及形態(tài)。便于掌握數(shù)據(jù)的居中趨勢,數(shù)據(jù)的分布等。X-axi

17、s:measurement scale 測量數(shù)據(jù)的區(qū)間劃分,隨著區(qū)間的調(diào) 整,數(shù)據(jù)的形狀分布略有不同。Y-axis:frequency (or relative frequency) scale 事件發(fā)生的頻數(shù)。Not to be used when sample size is less than 50 units.注意:當樣本容量小于 50 時謹慎使用直方圖!Minitab: Graph Histogram直方圖 ( Histogram )翻開數(shù)據(jù)文件: DOT-BOX-HISTOGRAM . MTV圖形結(jié)果顯示:直方圖 ( Histogram )中心極限定律概率論根本概念:1.隨機變量根

18、據(jù)試驗結(jié)果對隨機試驗取什么值的變量。2. 隨機事件的頻率 設(shè)隨機事件A在n次試驗中出現(xiàn)了r次,那么稱比值r/n為這n次試驗中事件A出現(xiàn)的頻率,記作W(A)即: W(A)= r/n 3. 概率的統(tǒng)計定義隨著試驗次數(shù)n的增大,事件出現(xiàn)的頻率r/n在區(qū)間0,1上的某個數(shù)字p附近擺動,那么定義事件的概率為: P(A)= p 根據(jù)貝努里大數(shù)定理,在實際應(yīng)用中,當試驗次數(shù)很大時,便可以用事件出現(xiàn)的頻率來代替事件發(fā)生的概率。中心極限定律在實際問題中,有許多隨機變量,它們是由大量的相互獨立的隨機因素的綜合影響所形成的,即可以表示成獨立隨機變量之和,這種隨機變量往往近似地服從正態(tài)分布,這就是中心極限定律地客觀背

19、景。1. 獨立同分布地中心極限定理指出:設(shè)獨立隨機變量序列X1, X2, , Xn,服從同一分布,并具有有限的數(shù)學(xué)期望和方差,那么只要n充分大,不管Xi 服從什么分布, 近似地服從正態(tài)分布德莫佛拉普拉斯定理指出:當n很大時,在n次獨立重復(fù)試驗中事件A發(fā)生地次數(shù)近似服從正態(tài)分布。從而服從二項分布的隨機變量近似服從正態(tài)分布N(np, np(1-p)。在次品率為 p 的一大批產(chǎn)品中任取 n 件產(chǎn)品,那么取得次品的件數(shù) 服 從二項分布)。例1“總銷售量是許多許多經(jīng)銷商銷售的總和,一個銷售商可能不是正態(tài)分布,但總的銷售量大致是正態(tài)分布的。例2許多產(chǎn)品的堆積高度大致是正態(tài)分布,即使單一產(chǎn)品高度不是正態(tài)分布。注意:不是所有數(shù)據(jù)服從正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論