變異數(shù)與標(biāo)準(zhǔn)差_第1頁
變異數(shù)與標(biāo)準(zhǔn)差_第2頁
變異數(shù)與標(biāo)準(zhǔn)差_第3頁
變異數(shù)與標(biāo)準(zhǔn)差_第4頁
變異數(shù)與標(biāo)準(zhǔn)差_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、變異數(shù)與標(biāo)準(zhǔn)差變異數(shù):離差(資料值與期望值的差異)平方和的平均 標(biāo)準(zhǔn)差:變異數(shù)的平方根 變異數(shù)的單位是原資料單位的平方 標(biāo)準(zhǔn)差的單位同原資料的單位母體變異數(shù): 樣本變異數(shù):計算樣本變異數(shù)時,分母取(n-1)而非(n)的原因: 實務(wù)上,母體變異數(shù)通常未知,須以樣本變異數(shù)估計之,而樣本變異數(shù)會隨所 抽選樣本的不同而有變動(非固定),若考慮很多次抽樣,每次都以” ”的 公式計算樣本變異數(shù),則有些樣本變異數(shù)會高於母體變異數(shù),有些則低於母體 變異數(shù),但平均而言會與母體變異數(shù)很接近;反之,若計算樣本變異數(shù)時均除 以n,則平均而言會偏向低於母體變異數(shù)變異數(shù)(或標(biāo)準(zhǔn)準(zhǔn)差)與與期望值值一樣,容易受受極值的的影響

2、例:(起起薪的資資料)若將最大大值改為為10,000,則起薪的資資料變異係數(shù)數(shù)(Coefficient of Variation)變異係數(shù)數(shù)定義為為CV是量量測相對對(於期期望值)分散程程度的量量數(shù),表表示標(biāo)準(zhǔn)準(zhǔn)差佔期期望值的的百分比比,通常常小於1例:(起起薪的資資料)表示薪資資的分散程度度約為期期望值的的5.6%變異係數(shù)數(shù)在財務(wù)務(wù)分析上上可用來來計算相相對的風(fēng)風(fēng)險變數(shù)變換換對期望望值與標(biāo)標(biāo)準(zhǔn)差的的影響設(shè)變數(shù)Y為變數(shù)數(shù)X的函函數(shù):y=g(x)變數(shù)Y之之觀察值值的期望望值通常常無法直直接以X變數(shù)之之期望值值的相同同函數(shù)計計算,但但線性函函數(shù)則例例外若則則但對標(biāo)準(zhǔn)準(zhǔn)差的影影響則為為 xy=ax+

3、by=axy=x+b例:假假設(shè)成成本(C)是是產(chǎn)量(x)的的線性函函數(shù),變動成本本+固定定成本若每月平平均產(chǎn)量量為標(biāo)標(biāo)準(zhǔn)準(zhǔn)差則而產(chǎn)量與與成本的的變異係係數(shù)則分分別為Z分數(shù)(z-score)是一個特特殊的線線性變數(shù)變換換:未知時以以代代之之,而常常另稱之之為t分分數(shù)(t-score)正的Z分分數(shù)表示示變數(shù)值值比期望望值大z個標(biāo)準(zhǔn)準(zhǔn)差負的Z分分數(shù)表示示變數(shù)值值比期望望值小|z|個個標(biāo)準(zhǔn)差差變數(shù)變換換後的Z分數(shù)是是無單位位的,所所以適用用於比較較不同資資料集之之資料值值在各自自資料集集裡的相相對位置置,例如如:林同同學(xué)身高高的z分分數(shù)為0.6,而體重重的z分分數(shù)為0.2;表示比比班上平平均身高高高0

4、.6個標(biāo)標(biāo)準(zhǔn)差,而比平平均體重重重0.2個標(biāo)標(biāo)準(zhǔn)差;所以在在班上是是屬於中中等個子子,但稍稍微高一一些經(jīng)驗法則則(EmpiricalRule)若原資料料呈對稱稱如吊鐘鐘型的分分佈,則則經(jīng)變數(shù)數(shù)變換後後的Z分分數(shù)會變變?yōu)閷ΨQ稱於零的的吊鐘型型分配,且分配配的型態(tài)態(tài)固定(不因標(biāo)標(biāo)準(zhǔn)差的的大小而而有不同同),此此通稱為為標(biāo)準(zhǔn)常常態(tài)分配配(Standard NormalDistribution)大約有68%的的z分數(shù)數(shù)會對稱稱分佈在在+1之間,大約有95%的的z分數(shù)數(shù)會對稱稱分佈在在+2之間,而幾乎所所有的z分數(shù)會會對稱分分佈在+3之間保齡球成成績的資資料0123-1-2-368%99.7%95%謝比

5、契夫夫(Chebyshev)不不等式式若原資料料的分佈佈非對稱稱,則至至少有的資料會會落在期望值+z倍標(biāo)準(zhǔn)準(zhǔn)差之間,但但z須須大於1 Z275%389%494%例:(起起薪的資資料)若起薪分分配的期期望值=2,940,標(biāo)準(zhǔn)差差=165.65,則則至少有有75%畢畢業(yè)學(xué)生生的起薪薪會在2,940+2(165.65)=(2,608.7, 3,105.65)之之間89%畢畢業(yè)學(xué)生生的起薪薪會在2,940+3(165.65)=(2,443.05,3,436.95)之之間94%畢畢業(yè)學(xué)生生的起薪薪會在2,940+4(165.65)=(2,277.40,3,602.60)之之間離群值(Outliers)Z

6、分數(shù)可可用來檢檢查資料集裡是是否有離離群值:一般而言言,若Z分數(shù)的的絕對值值大於3,則稱稱對應(yīng)的的資料值值為離群值離群值可可能是錯錯誤的資資料,也也可能是是較特殊殊的資料料如果是錯錯誤的資資料,須須訂正或或移除後後,才進進行統(tǒng)計計分析如果是特特殊的資資料,則則可比較較移除與與不移除除下的兩兩種分析析結(jié)果,折衷或或採其中中之一較較合理的的結(jié)果箱型圖(Box Plot)五個統(tǒng)計計量:Min, Q1,Q2,Q3, Max繪製圖型型的步驟驟:由Q1, Q3劃一個個箱型以Q2將將箱型分分成兩部部分由箱型兩兩邊各劃劃一條平平行直線線,向外外延伸到到Min與Max在箱型兩兩邊向外外 1.5倍IQR處處,各各

7、劃一條條垂直直直線在箱型兩兩邊向外外3倍倍IQR 處,各劃一一條垂直直直線Q1,Q2, Q3大約將將所有資資料平分分成四份份起薪資料料的箱型型圖Min=2,710Q1=2,865Q2=2,905Q3=3,000Max=3,325IQR=135Q1-1.5IQR=2,663Q3+1.5 IQR=3,203共變異數(shù)數(shù)(Covariance)與相關(guān)關(guān)係數(shù)(CorrelationCoefficient)量測兩量量化變數(shù)數(shù)之間線線性關(guān)聯(lián)聯(lián)程度的的量數(shù)例如:廣廣告次次數(shù)vs.銷銷售金額額溫度vs.餅餅乾乾的脆度度若觀察資資料的序序?qū)Τ食尸F(xiàn)現(xiàn)狹長的的帶狀分分佈,則則表示兩兩變數(shù)具具有線性性關(guān)聯(lián),分布越越集中,越有關(guān)關(guān)聯(lián)計算公式式:母體共變變異數(shù):樣本共變變異數(shù):母體相關(guān)關(guān)係數(shù):樣本相關(guān)關(guān)係數(shù):例:廣告次數(shù)數(shù)(x) vs.銷銷售金金額(y)相關(guān)係數(shù)數(shù)是無單單位的,且係數(shù)數(shù)值一定定會介於於+1與與-1之之間;正正的係數(shù)數(shù)表示正正向的相相關(guān),負負的係數(shù)數(shù)表示負負向的相相關(guān),係係數(shù)值越越接近+1,相關(guān)關(guān)程度越越高係數(shù)值接接近零,表示示無明顯顯的線性性相關(guān),但並不不表示無無其他非非線性函函數(shù)的關(guān)關(guān)係,例如:x-2.0-1.5-1.0-0.50.00.51.01.52.0y6.004.253.002.252.002.253.004.256.00相關(guān)係數(shù)數(shù)等於0,但兩兩變數(shù)有有拋物線線的關(guān)係係相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論