心理統(tǒng)計學(xué)各定義_第1頁
心理統(tǒng)計學(xué)各定義_第2頁
心理統(tǒng)計學(xué)各定義_第3頁
心理統(tǒng)計學(xué)各定義_第4頁
心理統(tǒng)計學(xué)各定義_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、方差:在概率論和統(tǒng)計學(xué)中,一個隨機變量的方差描述的是它的離散程度,也就是該變量離其期望 值的距離。一個實隨機變量的方差也稱為它的二階矩或二階中心動差,恰巧也是它的二階累 積量。方差的算術(shù)平方根稱為該隨機變量的標(biāo)準(zhǔn)差。定義設(shè)為服從分布的隨機變量,則稱為隨機變量或者分布的方差。如果是隨機變量X的期望值(平均數(shù)),則其方差為:特性在樣本空間Q上存在有限期望和方差的隨機變量構(gòu)成一個希爾伯特空間:L2(Q , dP),不 過這里的內(nèi)積和長度跟方差,標(biāo)準(zhǔn)差還是不大一樣。所以,我們得把這個空間“除”常變 量構(gòu)成的子空間,也就是說把相差一個常數(shù)的所有原來那個空間的隨機變量做成一個等價 類。這還是一個新的無窮維

2、線性空間,并且有一個從老空間內(nèi)積誘導(dǎo)出來的新內(nèi)積,而這 個內(nèi)積就是方差一般化如果X是一個向量其取值范圍在實數(shù)空間Rn并且其每個元素都是一個一維隨機變量,我們 就把X稱為隨機向量。隨機向量的方差是一維隨機變量方差的自然推廣,其定義為E(X - M )(X - p )t,其中p = E(X),Xt是X的轉(zhuǎn)秩.這個方差是一個非負定的方陣,通常稱為 協(xié)方差矩陣。如果X是一個復(fù)數(shù)隨機變量的向量(向量中每個元素均為復(fù)數(shù)的隨機變量),那么其方差定 義則為E(X - p )(X - p )*,其中X*是X的共軛轉(zhuǎn)置向量或稱為埃爾米特向量。根據(jù)這個 定義,方差為實數(shù)。標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(Standard Deviat

3、ion),在概率統(tǒng)計中最常使用作為統(tǒng)計分布程度(statistical dispersion)上的測量。標(biāo)準(zhǔn)差定義為方差的算術(shù)平方根,反映組內(nèi)個體間的離散程度。測 量到分布程度的結(jié)果,原則上具有兩種性質(zhì):為非負數(shù)值,與測量資料具有相同單位。一個總量的標(biāo)準(zhǔn)差或一個隨機變量的標(biāo)準(zhǔn)差,及一個子集合樣品數(shù)的標(biāo)準(zhǔn)差之間,有所差別。 其公式如下所列。標(biāo)準(zhǔn)差的觀念是由卡爾皮爾遜(Karl Pearson)引入到統(tǒng)計中。闡述及應(yīng)用簡單來說,標(biāo)準(zhǔn)差是一組數(shù)值自平均值分散開來的程度的一種測量觀念。一個較大的標(biāo)準(zhǔn)差, 代表大部分的數(shù)值和其平均值之間差異較大;一個較小的標(biāo)準(zhǔn)差,代表這些數(shù)值較接近平均 值。例如,兩組數(shù)

4、的集合0, 5, 9, 14和5, 6, 8, 9其平均值都是7,但第二個集合具 有較小的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差可以當(dāng)作不確定性的一種測量。例如在物理科學(xué)中,做重復(fù)性測量時,測量數(shù)值集合 的標(biāo)準(zhǔn)差代表這些測量的精確度。當(dāng)要決定測量值是否符合預(yù)測值,測量值的標(biāo)準(zhǔn)差占有決 定性重要角色:如果測量平均值與預(yù)測值相差太遠(同時與標(biāo)準(zhǔn)差數(shù)值做比較),則認為測 量值與預(yù)測值互相矛盾。這很容易理解,因為如果測量值都落在一定數(shù)值范圍之外,可以合 理推論預(yù)測值是否正確。標(biāo)準(zhǔn)差應(yīng)用于投資上,可作為量度回報穩(wěn)定性的指標(biāo)。標(biāo)準(zhǔn)差數(shù)值越大,代表回報遠離過去 平均數(shù)值,回報較不穩(wěn)定故風(fēng)險越高。相反,標(biāo)準(zhǔn)差數(shù)值越小,代表回報較為穩(wěn)

5、定,風(fēng)險亦 較小。標(biāo)準(zhǔn)差的定義及簡易計算公式標(biāo)準(zhǔn)計算公式假設(shè)有一組數(shù)值、x (皆為實數(shù)),其平均值為:此組數(shù)值的標(biāo)準(zhǔn)差為:(7 =-2N + Np簡化計算公式上述公式可以變換為一個較簡單的公式:隨機變量的標(biāo)準(zhǔn)差計算公式一隨機變量X的標(biāo)準(zhǔn)差定義為:上述代數(shù)變換的過程如下:2”(AW) + A/iv/E(X E(X)2)= JE(X2) (E(X)2須注意并非所有隨機變量都具有標(biāo)準(zhǔn)差,因為有些隨機變量不存在期望值。如果隨機變量X 為I ,匚,具有相同機率,則可用上述公式計算標(biāo)準(zhǔn)差。樣本標(biāo)準(zhǔn)差在真實世界中,除非在某些特殊情況下,找到一個總體的真實的標(biāo)準(zhǔn)差是不現(xiàn)實的。大多數(shù) 情況下,總體標(biāo)準(zhǔn)差是通過隨

6、機抽取一定量的樣本并計算樣本標(biāo)準(zhǔn)差估計的。從一大組數(shù)值 J、:當(dāng)中取出一樣本數(shù)值組合iLW : ,常定義其樣本標(biāo)準(zhǔn)差:樣本方差S2是對總體方差。2的無偏估計。s中分母為n - 1是因為匚;的自由】(皿了)=0度為n 1,這是由于存在約束條件二連續(xù)隨機變量的標(biāo)準(zhǔn)差計算公式概率密度為P(x)的連續(xù)隨機變量x的標(biāo)準(zhǔn)差是:(7 = 一研歹血其中R = j dx標(biāo)準(zhǔn)差的性質(zhì)對于常數(shù)C和隨機變量X和Y:a (X + c) = a (X)時頃=C(7(X)其中:cov(X,r)表示隨機變量X和Y的協(xié)方差。范例這里示范如何計算一組數(shù)的標(biāo)準(zhǔn)差。例如一群孩童年齡的數(shù)值為5, 6, 8, 9 : 第一步,計算平均值

7、?。簄 = 4 (因為集合里有4個數(shù)),分別設(shè)為:叼=5叼=6工3 = 8勇=9 I此為平均值。第二步,計算標(biāo)準(zhǔn)差戶:深藍區(qū)域是距平均值小于一個標(biāo)準(zhǔn)差之內(nèi)的數(shù)值范圍。在正態(tài)分布中,此范圍所占比率為全 部數(shù)值之68%。根據(jù)正態(tài)分布,兩個標(biāo)準(zhǔn)差之內(nèi)(深藍,藍)的比率合起來為95%。根 據(jù)正態(tài)分布,三個標(biāo)準(zhǔn)差之內(nèi)(深藍,藍,淺藍)的比率合起來為99%。在實際應(yīng)用上,??紤]一組數(shù)據(jù)具有近似于正態(tài)分布的機率分布。若其假設(shè)正確,則約68% 數(shù)值分布在距離平均值有1個標(biāo)準(zhǔn)差之內(nèi)的范圍,約95%數(shù)值分布在距離平均值有2個 標(biāo)準(zhǔn)差之內(nèi)的范圍,以及約99.7%數(shù)值分布在距離平均值有3個標(biāo)準(zhǔn)差之內(nèi)的范圍。稱為 68

8、-95-99.7 法則。標(biāo)準(zhǔn)差與平均值之間的關(guān)系一組數(shù)據(jù)的平均值及標(biāo)準(zhǔn)差常常同時作為參考的依據(jù)。從某種意義上說,如果用平均值來考 量數(shù)值的中心的話,則標(biāo)準(zhǔn)差也就是對統(tǒng)計的分散度的一個自然”的測度。因為由平均值所得的標(biāo)準(zhǔn)差要小于到其他任何一個點的標(biāo)準(zhǔn)差。較確切的敘述為:設(shè)I ,為實數(shù),定義函數(shù)使用微積分或者通過配方法,不難算出a (r)在下面情況下具有唯一最小值:r X幾何學(xué)解釋從幾何學(xué)的角度出發(fā),標(biāo)準(zhǔn)差可以理解為一個從n維空間的一個點到一條直線的距離的函 數(shù)。舉一個簡單的例子,一組數(shù)據(jù)中有3個值,X15 X2, X3。它們可以在3維空間中確定一個 點P= (X15 X2, X3) 0想像一條通

9、過原點的直線LG R。如果這組數(shù)據(jù)中的3個值都相等,則點P就是直線L上的一個點,P到L的距離為0,所以標(biāo)準(zhǔn)差也為0。 若這3個值不都相等,過點P作垂線PR垂直于L,PR交L于點R,則R的坐標(biāo)為這3 個值的平均數(shù):運用一些代數(shù)知識,不難發(fā)現(xiàn)點P與點R之間的距離(也就是點P到直線L的距離)是。在n維空間中,這個規(guī)律同樣適用,把3換成n就可以了。田巨(Range),又稱極差,是用來表示統(tǒng)計資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距:即最大佰減最小佰后所得之?dāng)?shù)據(jù)。全距可以用3 (讀做omega)來表示。公式3 =X -X其中的3為全距,XH為最大值,XL

10、為最小值。特征HL全距為離散程度的最簡單測度值,易受極端值影響。其適用于等距變量、比率變量,不適用 于名義變量或次序變量。四分差(interquartile range, IQR),又稱四分位距。是描述統(tǒng)計學(xué)中的一種方法,以確定第三四分位數(shù)和第一四分位數(shù)的區(qū)別(即A J:;的差距)E。與方差、標(biāo)準(zhǔn)差一樣,表示統(tǒng)計資料中各變量分散情形,但四分差更多為一種穩(wěn)健統(tǒng)計(robust statistic)。定義四分差通常是用來構(gòu)建箱形圖,以及對概率分布的簡要圖表概述。對一個對稱性分布數(shù)據(jù)(其 中位數(shù)必然等于第三四分位數(shù)與第一四分位數(shù)的算術(shù)平均數(shù)),二分之一的四分差等于絕對 中位差(MAD)。中位數(shù)是聚中

11、趨勢的反映以。IQR = Q Q四分位數(shù)(Quartile),即統(tǒng)計學(xué)中,把所有數(shù)值由小到大排列并分成四等 份,處于三個分割點位置的得分就是四分位數(shù)。概念第一四分位數(shù)(Q1),又稱“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25% 的數(shù)字。第二四分位數(shù)(Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。第三四分位數(shù)(Q3),又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75% 的數(shù)字。第三四分位數(shù)與第一四分位數(shù)的差距又稱四分位距(InterQuartile Range, IQR)。運算過程關(guān)于四分位數(shù)值的選擇尚存爭議E。主要選擇四分位的百分比值(y

12、),及樣本總量(n)有以下數(shù)學(xué)公式可以表示:可100情況1:如果L是一個整數(shù),則取第L和第L+1的平均值 情況2:如果L不是一個整數(shù),則取下一個最近的整數(shù)。(比如L = 1.2,則取2)例如圖示中箱形圖(有四分位數(shù)及四分位距)和概率密度函數(shù) 為描述一個常規(guī)總量N(0,1 a 2) 的分布情況一個算法如下(可以兼用TI-83計算器):利用中位數(shù)使數(shù)據(jù)分成兩列(不要把中位數(shù)放入已分好的數(shù)列),第一四分位數(shù)為第一組數(shù)列的中位數(shù);第三四分位數(shù)為第二組數(shù)列的中位數(shù)。以下例子可以用來參考。例如1數(shù)據(jù)總量:6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36由小到大排列的結(jié)果:6

13、, 7, 15, 36, 39, 40, 41, 42, 43, 47, 490 = 15Q, = 40例如2數(shù)據(jù)總量:7, 15, 36, 39, 40, 410 = 15I Qw = 37.5加3 =如例如3數(shù)據(jù)總量:1, 2, 3, 4Qi = 1-5= 2.5加= 3.5應(yīng)用不論的變異量數(shù)數(shù)值為何,均視為一個分界點,以此將總數(shù)分成四個相等 部份,可以通過比較i,分析其數(shù)據(jù)變量的趨勢。在統(tǒng)計學(xué)中,中值(又稱中位數(shù))代表一個樣本、種群或概率分布中的一個數(shù) 值,其可將數(shù)值集合劃分為相等的上下兩部分。對于有限的數(shù)集,可以通過把所 有觀察值高低排序后找出正中間的一個作為中值。如果觀察值有偶數(shù)個,則中值 不唯一,通常取最中間的兩個數(shù)值的平均數(shù)作為中值。一個數(shù)集中最多有一半的數(shù)值小于中值,也最多有一半的數(shù)值大于中值。如果大 于和小于中值的數(shù)值個數(shù)均少于一半,那麼數(shù)集中必有若干值等同于中值。設(shè)連續(xù)隨機變量X的分布函數(shù)為F(X),那么滿足條件P(Xm)=F(m)=1/2的數(shù)稱 為X或分布F的中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論