變異數(shù)與標(biāo)準(zhǔn)差ppt課件_第1頁
變異數(shù)與標(biāo)準(zhǔn)差ppt課件_第2頁
變異數(shù)與標(biāo)準(zhǔn)差ppt課件_第3頁
變異數(shù)與標(biāo)準(zhǔn)差ppt課件_第4頁
變異數(shù)與標(biāo)準(zhǔn)差ppt課件_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、變異數(shù)與標(biāo)準(zhǔn)差變異數(shù):離差(資料值與期望值的差異)平方和的平均 標(biāo)準(zhǔn)差:變異數(shù)的平方根 變異數(shù)的單位是原資料單位的平方 標(biāo)準(zhǔn)差的單位同原資料的單位母體變異數(shù): 樣本變異數(shù):計(jì)算樣本變異數(shù)時(shí),分母取(n-1)而非(n)的緣由: 實(shí)務(wù)上,母體變異數(shù)通常未知,須以樣本變異數(shù)估計(jì)之,而樣本變異數(shù)會(huì)隨所 抽選樣本的不同而有變動(dòng)(非固定),假設(shè)考慮很多次抽樣,每次都以 的 公式計(jì)算樣本變異數(shù),則有些樣本變異數(shù)會(huì)高於母體變異數(shù),有些則低於母體 變異數(shù),但平均而言會(huì)與母體變異數(shù)很接近;反之,假設(shè)計(jì)算樣本變異數(shù)時(shí)均除 以n,則平均而言會(huì)偏向低於母體變異數(shù).變異數(shù)(或標(biāo)準(zhǔn)差)與期望值一樣,容易受極值的影響例:(起

2、薪的資料)假設(shè)將最大值改為10,000,則.起薪的資料.變異係數(shù)(Coefficient of Variation)變異係數(shù)定義為CV是量測相對(於期望值)分散程度的量數(shù),表示標(biāo)準(zhǔn)差佔(zhàn)期望值的百分比,通常小於1例:(起薪的資料)表示薪資的分散程度約為期望值的5.6%變異係數(shù)在財(cái)務(wù)分析上可用來計(jì)算相對的風(fēng)險(xiǎn).變數(shù)變換對期望值與標(biāo)準(zhǔn)差的影響設(shè)變數(shù)Y為變數(shù)X的函數(shù):y=g(x)變數(shù)Y之觀察值的期望值通常無法直接以X變數(shù)之期望值的一樣函數(shù)計(jì)算,但線性函數(shù)則例外假設(shè) 則 但對標(biāo)準(zhǔn)差的影響則為 xy=ax+by=axy=x+b.例: 假設(shè)本錢(C) 是產(chǎn)量(x)的線性函數(shù), 變動(dòng)本錢+固定本錢假設(shè)每月平均

3、產(chǎn)量為 標(biāo)準(zhǔn)差則而產(chǎn)量與本錢的變異係數(shù)則分別為.Z分?jǐn)?shù)(z-score)是一個(gè)特殊的線性變數(shù)變換: 未知時(shí)以 代之,而常另稱之為t分?jǐn)?shù)(t-score)正的Z分?jǐn)?shù)表示變數(shù)值比期望值大z個(gè)標(biāo)準(zhǔn)差負(fù)的Z分?jǐn)?shù)表示變數(shù)值比期望值小|z|個(gè)標(biāo)準(zhǔn)差變數(shù)變換後的Z分?jǐn)?shù)是無單位的,所以適用於比較不同資料集之資料值在各自資料集裡的相對位置,例如:林同學(xué)身高的z分?jǐn)?shù)為0.6,而體重的z分?jǐn)?shù)為0.2;表示比班上平均身高高0.6個(gè)標(biāo)準(zhǔn)差,而比平均體重重0.2個(gè)標(biāo)準(zhǔn)差;所以在班上是屬於中等個(gè)子,但略微高一些.經(jīng)驗(yàn)法則(Empirical Rule)假設(shè)原資料呈對稱如吊鐘型的分佈,則經(jīng)變數(shù)變換後的Z分?jǐn)?shù)會(huì)變?yōu)閷ΨQ於零的吊

4、鐘型分配,且分配的型態(tài)固定(不因標(biāo)準(zhǔn)差的大小而有不同),此通稱為標(biāo)準(zhǔn)常態(tài)分配(Standard Normal Distribution) 大約有68%的z分?jǐn)?shù)會(huì)對稱分佈在+1之間,大約有95%的z分?jǐn)?shù)會(huì)對稱分佈在+ 2之間,而幾乎一切的z分?jǐn)?shù)會(huì)對稱分佈在+ 3之間.保齡球成績的資料.0123-1-2-368%99.7%95%.謝比契夫(Chebyshev) 不等式假設(shè)原資料的分佈非對稱,則至少有的資料會(huì)落在期望值+z倍標(biāo)準(zhǔn)差之間, 但z須大於1 Z275%389%494%.例:(起薪的資料)假設(shè)起薪分配的期望值=2,940,標(biāo)準(zhǔn)差=165.65,則至少有75%畢業(yè)學(xué)生的起薪會(huì)在 2,940+2

5、(165.65)=(2,608.7, 3,105.65) 之間89%畢業(yè)學(xué)生的起薪會(huì)在 2,940+3(165.65)=(2,443.05, 3,436.95) 之間94%畢業(yè)學(xué)生的起薪會(huì)在 2,940+4(165.65)=(2,277.40, 3,602.60) 之間.離群值(Outliers)Z分?jǐn)?shù)可用來檢查資料集裡能否有離群值:普通而言,假設(shè)Z分?jǐn)?shù)的絕對值大於3,則稱對應(yīng)的資料值為離群值離群值能夠是錯(cuò)誤的資料,也能夠是較特殊的資料假設(shè)是錯(cuò)誤的資料,須訂正或移除後,才進(jìn)行統(tǒng)計(jì)分析假設(shè)是特殊的資料,則可比較移除與不移除下的兩種分析結(jié)果,折衷或採其中之一較合理的結(jié)果.箱型圖(Box Plot)

6、五個(gè)統(tǒng)計(jì)量:Min, Q1, Q2, Q3, Max繪製圖型的步驟:由Q1, Q3劃一個(gè)箱型以Q2將箱型分成兩部分由箱型兩邊各劃一條平行直線,向外延伸到Min與Max在箱型兩邊向外 1.5倍IQR 處,各劃一條垂直直線在箱型兩邊向外 3倍IQR 處,各劃一條垂直直線Q1, Q2, Q3大約將一切資料平分成四份.起薪資料的箱型圖Min=2,710 Q1=2,865 Q2=2,905 Q3=3,000 Max=3,325IQR= Q1-1.5 IQR=2,663 Q3+1.5 IQR=3,203.共變異數(shù)(Covariance)與相關(guān)係數(shù)(Correlation Coefficient)量測兩量化

7、變數(shù)之間線性關(guān)聯(lián)程度的量數(shù)例如: 廣告次數(shù) vs. 銷售金額 溫度 vs. 餅乾的脆度假設(shè)觀察資料的序?qū)?呈現(xiàn)狹長的帶狀分佈,則表示兩變數(shù)具有線性關(guān)聯(lián),分布越集中,越有關(guān)聯(lián)計(jì)算公式:母體共變異數(shù): 樣本共變異數(shù): 母體相關(guān)係數(shù):樣本相關(guān)係數(shù):.例: 廣告次數(shù)(x) vs. 銷售金額(y).相關(guān)係數(shù)是無單位的,且係數(shù)值一定會(huì)介於+1與-1之間;正的係數(shù)表示正向的相關(guān),負(fù)的係數(shù)表示負(fù)向的相關(guān),係數(shù)值越接近+1,相關(guān)程度越高係數(shù)值接近零 ,表示無明顯的線性相關(guān),但並不表示無其他非線性函數(shù)的關(guān)係,例如:x-2.0-1.5-1.0-0.50.00.51.01.52.0y6.004.253.002.252.002.253.004.256.00.相關(guān)係數(shù)等於0,但兩變數(shù)有拋物線的關(guān)係.相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論