定量投資分析第三章_第1頁
定量投資分析第三章_第2頁
定量投資分析第三章_第3頁
定量投資分析第三章_第4頁
定量投資分析第三章_第5頁
已閱讀5頁,還剩73頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第3章統(tǒng)計(jì)學(xué)概念和市場收益率3.1引言統(tǒng)計(jì)方法為我們提供了強(qiáng)大的分析數(shù)據(jù),以及從中獲得推斷結(jié)論的一組工具。無論我們分析的是資產(chǎn)收益率、盈利增長率、商品價(jià)格還是其他金融數(shù)據(jù),統(tǒng)計(jì)工具都能幫助我們量化并表現(xiàn)出這些數(shù)據(jù)的重要特征。在本章中,我們將介紹一些描述與分析數(shù)據(jù)的基本方法。這些方法在統(tǒng)計(jì)學(xué)的分支中被稱為描述性統(tǒng)計(jì)。本章將提供一組在不同投資環(huán)境中應(yīng)用的實(shí)用統(tǒng)計(jì)學(xué)概念和工具。正如本章的章名所反映的,我們要介紹的一個(gè)主題就是描述收益率分布的統(tǒng)計(jì)方法。(伊博森協(xié)會(huì)(Ibbotson Associates)()慷慨地提供了本章中所使用的大部分?jǐn)?shù)據(jù)。我們同樣也采用了Dimson,Marsh和Staunto

2、n(2002)的歷史數(shù)據(jù)和他們對(duì)于世界金融市場的研究以及其他的一些數(shù)據(jù)來源。)我們將探討收益率分布的4個(gè)性質(zhì):收益率集中于何處集中趨勢(shì)(central tendency)收益率距其中心位置的偏離有多遠(yuǎn)離散度(dispersion)收益率的分布是否是對(duì)稱的還是偏向一邊的偏度(skewness)收益率是否容易出現(xiàn)極端結(jié)果的情況峰度(kurtosis)這些概念一般也會(huì)同樣地被應(yīng)用到其他類型數(shù)據(jù)的分布之中。本章的內(nèi)容組織如下。在第2節(jié)給出了一些基本概念的定義之后,在第3節(jié)和第4節(jié)中我們會(huì)對(duì)數(shù)據(jù)的表述進(jìn)行討論。第3節(jié)討論的是如何用表格形式來表現(xiàn)數(shù)據(jù),第4節(jié)討論的是如何用圖像來表現(xiàn)數(shù)據(jù)。接著,我們轉(zhuǎn)而討論

3、如何對(duì)數(shù)據(jù)分布的情況進(jìn)行定量描述:第5節(jié)重點(diǎn)討論度量數(shù)據(jù)集中到哪里的量化指標(biāo),或數(shù)據(jù)中心趨勢(shì)的度量。第6節(jié)介紹其他描述數(shù)據(jù)位置的度量指標(biāo)。第7節(jié)介紹度量數(shù)據(jù)離散度的量化指標(biāo)。第8節(jié)和第9節(jié)討論其他一些能夠提供數(shù)據(jù)更加精確(詳細(xì))描述的度量指標(biāo)。第10節(jié)討論如何將第5節(jié)中介紹的概念應(yīng)用于實(shí)際投資中。3.2一些基本概念在開始本章有關(guān)統(tǒng)計(jì)學(xué)的學(xué)習(xí)之前,先縱覽一下該領(lǐng)域的全貌可能會(huì)對(duì)我們的學(xué)習(xí)有所幫助。下面,我們將簡單地介紹一下統(tǒng)計(jì)學(xué)的研究范圍及其分支學(xué)科。我們會(huì)解釋總體和樣本的概念。另外,我們將會(huì)看到數(shù)據(jù)的不同類型對(duì)其度量方式及其在分析時(shí)所采用的適當(dāng)?shù)慕y(tǒng)計(jì)方法產(chǎn)生影響。最后,我們將討論基本的數(shù)據(jù)度量

4、類型。3.2.1統(tǒng)計(jì)學(xué)的本質(zhì)統(tǒng)計(jì)(statistics)這一術(shù)語可以有兩種寬泛的含義,一種是指數(shù)據(jù),另一種是指方法。一家公司最近20個(gè)季度的平均每股盈利(earnings per share,EPS)或者最近10年的平均收益率就是統(tǒng)計(jì)。我們也可以通過分析歷史的EPS來預(yù)測(cè)未來的EPS,或者利用公司過去的收益率來推斷其所面臨的風(fēng)險(xiǎn)。我們采用的所有這些收集與分析數(shù)據(jù)的方法也被稱為統(tǒng)計(jì)。統(tǒng)計(jì)方法包括描述性統(tǒng)計(jì)和統(tǒng)計(jì)推斷(推斷性統(tǒng)計(jì))。描述性統(tǒng)計(jì)(descriptive statistics)研究的是如何有效地概括數(shù)據(jù)以反映包含大量數(shù)據(jù)的集合的重要特征。描述性統(tǒng)計(jì)通過對(duì)大量的數(shù)據(jù)細(xì)節(jié)進(jìn)行整合,將數(shù)據(jù)轉(zhuǎn)

5、化為有用的信息。統(tǒng)計(jì)推斷(statistical inference)所涉及的是如何通過實(shí)際觀測(cè)到的小的數(shù)據(jù)集合來對(duì)大的數(shù)據(jù)集合的情況進(jìn)行預(yù)測(cè)、估計(jì)和判斷。統(tǒng)計(jì)推斷的基礎(chǔ)是概率論。統(tǒng)計(jì)推斷和概率論將在后面的幾章中進(jìn)行討論。本章的重點(diǎn)只放在描述性統(tǒng)計(jì)的討論上。3.2.2總體和樣本在整個(gè)統(tǒng)計(jì)學(xué)的學(xué)習(xí)中,我們要明確區(qū)分總體和樣本這兩個(gè)概念之間的區(qū)別。在這一節(jié)中,我們將在解釋這兩個(gè)術(shù)語的同時(shí),介紹與其相關(guān)的參數(shù)和樣本統(tǒng)計(jì)量這兩個(gè)術(shù)語。(本章會(huì)介紹許多統(tǒng)計(jì)學(xué)的概念和公式。為了使得它們能更易于識(shí)別,我們將一些重要的內(nèi)容用項(xiàng)目符號(hào)列舉出來。)總體的定義。一個(gè)總體(population)是指一組特定數(shù)據(jù)中的所

6、有元素。任何對(duì)于總體特征的描述性度量指標(biāo)均被稱為參數(shù)(parameter)。雖然對(duì)總體進(jìn)行刻畫的參數(shù)可能會(huì)有很多,但是投資分析師們一般只關(guān)注其中的一部分,如投資收益率的均值、極差以及方差。即使我們能夠觀測(cè)總體中的所有元素,這樣做需要花費(fèi)的高昂的時(shí)間和資金成本也會(huì)令我們望而卻步。例如,如果總體是全球無線通信的全體用戶,而分析師想要了解他們的購買計(jì)劃,那么分析師將會(huì)發(fā)現(xiàn),如果要觀測(cè)整個(gè)總體的情況,花費(fèi)將是巨大的。這時(shí),分析師可以通過從總體中取出一個(gè)樣本來對(duì)該問題進(jìn)行分析。樣本的定義。一個(gè)樣本(sample)就是總體的一個(gè)子集。在抽取一個(gè)樣本時(shí),分析師往往希望該樣本能夠反映總體的特征。在統(tǒng)計(jì)學(xué)領(lǐng)域中

7、,關(guān)于采用適當(dāng)?shù)姆椒▉硎沟贸槌龅臉颖灸軌蜻_(dá)到較好地反映總體目的的研究被稱為抽樣(調(diào)查)。在本章的后面部分,我們會(huì)介紹一些具體的抽樣方法。之前,我們?cè)谔岬綌?shù)據(jù)的時(shí)候已經(jīng)涉及了統(tǒng)計(jì)學(xué)的相關(guān)內(nèi)容。正如參數(shù)是描述總體特征的度量指標(biāo),樣本統(tǒng)計(jì)量(簡稱為統(tǒng)計(jì)量)是描述樣本特征的度量指標(biāo)。樣本統(tǒng)計(jì)量的定義。一個(gè)樣本統(tǒng)計(jì)量(或統(tǒng)計(jì)量,sample statistic or statistic)是由樣本計(jì)算得來的,用來描述樣本特征的一個(gè)量。我們?cè)诒菊碌拇蟛糠謨?nèi)容都會(huì)在這個(gè)定義下解釋和介紹統(tǒng)計(jì)量的用途。這個(gè)概念同樣在統(tǒng)計(jì)推斷中也是非常重要的,因?yàn)樗婕叭绾螒?yīng)用樣本統(tǒng)計(jì)量來對(duì)于未知總體參數(shù)進(jìn)行估計(jì)的問題。3.2.3

8、度量尺度為了選擇一個(gè)恰當(dāng)?shù)慕y(tǒng)計(jì)方法來描述和分析數(shù)據(jù),我們需要區(qū)分不同的度量尺度(measurement scales)或者說是測(cè)量標(biāo)準(zhǔn)。所有數(shù)據(jù)都會(huì)用下面四種度量尺度之一進(jìn)行度量:名義型、順序型、區(qū)間型或者比率型。名義尺度(nominal scales)代表最簡單的度量標(biāo)準(zhǔn):它對(duì)數(shù)據(jù)進(jìn)行分類但不進(jìn)行排序。如果我們根據(jù)共同基金不同的投資策略用整數(shù)對(duì)其進(jìn)行編號(hào),那么數(shù)字1可能代表小市值價(jià)值型基金,數(shù)字2代表大市值價(jià)值型基金,諸如此類,對(duì)于每種類型的基金我們都會(huì)用一個(gè)數(shù)字來進(jìn)行表示。這種名義尺度將基金根據(jù)各自的類型進(jìn)行分類,但并沒有進(jìn)行排序。順序尺度(ordinal scales)代表稍強(qiáng)一點(diǎn)的度量

9、標(biāo)準(zhǔn)。順序尺度將數(shù)據(jù)分成根據(jù)某種特征排序的不同類別。舉個(gè)例子來說,晨星和標(biāo)準(zhǔn)普爾為共同基金進(jìn)行的評(píng)級(jí)服務(wù)用的就是順序尺度,根據(jù)共同基金的相對(duì)業(yè)績表現(xiàn),將最差的一類基金評(píng)為一星,然后隨著業(yè)績向好的方向發(fā)展,依次評(píng)為二星、三星、四星和五星。順序尺度也可以用數(shù)字來區(qū)分不同的類別。例如,在對(duì)平衡型共同基金5年的累積收益率進(jìn)行排序時(shí),我們可以將數(shù)字1分配給業(yè)績最好的前10%的基金,以此類推,從而數(shù)字10代表表現(xiàn)最差的后10%的基金。因?yàn)轫樞虺叨饶軌蚪沂境雠琶?的基金比排名2的基金業(yè)績更好,所以順序尺度比名義尺度要求更高。但是,該尺度并沒有告訴我們排名1的基金和排名2的基金之間業(yè)績的差別與排名3和排名4,

10、或者排名9和排名10的基金業(yè)績之間的差別有什么不同。間隔尺度(interval scales)不僅提供數(shù)據(jù)的排序,還保證相鄰賦值之間的差別是相同的。因此,這些賦值之間是可以進(jìn)行有意義的加減運(yùn)算的。例如,攝氏和華氏的尺度就是這類區(qū)間型度量尺度。溫度在10和11之間的差別與40和41之間的差別是相同的,而且我們可以準(zhǔn)確地得到12=9+3。但是,間隔尺度的零點(diǎn)并不表示我們所度量的東西不存在;它不是一個(gè)真正的零點(diǎn)或者自然的零。零攝氏度對(duì)應(yīng)的是水的冰點(diǎn),而不是指沒有溫度。由于缺乏真正的零點(diǎn),所以我們不能通過間隔尺度來計(jì)算有意義的比率。舉例來說,50雖然比10大5倍,但是這并不意味著溫度高5倍。同樣,問卷

11、中的量常會(huì)用間隔尺度來進(jìn)行度量。如果一個(gè)投資者被要求用從1(極端風(fēng)險(xiǎn)厭惡)到7(極端風(fēng)險(xiǎn)喜好)中的一個(gè)數(shù)來度量其風(fēng)險(xiǎn)厭惡程度,那么回答為1和回答為2的投資者之間的風(fēng)險(xiǎn)厭惡差別,與回答為6和回答為7的投資者之間的風(fēng)險(xiǎn)厭惡差別有時(shí)就被假設(shè)為相同的。當(dāng)我們做出上述假設(shè)時(shí),該數(shù)據(jù)就是由間隔尺度進(jìn)行度量的。比率尺度(ratio scales)代表要求最高的度量標(biāo)準(zhǔn)。該尺度不僅具有區(qū)間度量尺度的所有特征,而且擁有一個(gè)真正的零點(diǎn)作為數(shù)據(jù)的原點(diǎn)。對(duì)于用比率尺度進(jìn)行度量的數(shù)據(jù),我們計(jì)算出的比率是有意義的,而這些比率間的加減運(yùn)算同樣也是有意義的。因此,我們可以應(yīng)用所有的統(tǒng)計(jì)工具來對(duì)以比率尺度度量的數(shù)據(jù)進(jìn)行處理。收

12、益率和貨幣一樣,都是以比率尺度來度量的量。如果我們有兩倍的貨幣量,那么我們就有兩倍的購買力。注意該度量是有一個(gè)自然的零值的(零意味著沒有貨幣)。例3-1 識(shí)別度量尺度說明下列各項(xiàng)指標(biāo)所使用的度量尺度:(1)債券發(fā)行的信用評(píng)級(jí)。(債券發(fā)行的信用評(píng)級(jí)度量了債券發(fā)行者履行債券所承諾支付的本金和利息的能力。例如,評(píng)級(jí)機(jī)構(gòu)標(biāo)準(zhǔn)普爾,給予每一個(gè)發(fā)行的債券分配如下的某一個(gè)級(jí)別,以信用質(zhì)量的降序排列的具體級(jí)別分別為(或者以違約概率的升序排列):AAA,AA+,AA,AA-,A+,A,A-,BBB,BBB-,BB+,BB,BB-,B,CCC+,CCC-,CC,C,CI,D。想要了解更多關(guān)于信用風(fēng)險(xiǎn)的信息,參見F

13、abozzi(2004a)。)(2)每股現(xiàn)金紅利。(3)對(duì)沖基金分類類別。(對(duì)沖基金指的是一種具有合法組織結(jié)構(gòu)的投資機(jī)構(gòu),它所受的監(jiān)管要小于其他的集資投資機(jī)構(gòu),如共同基金。根據(jù)它們所采用的投資策略的類型可將對(duì)沖基金劃分成不同的類別。)(4)債券到期年限。解:(1)信用評(píng)級(jí)是以順序尺度來度量的。一個(gè)評(píng)級(jí)將發(fā)行的債券歸到一個(gè)類別之中,并且該類別是根據(jù)其期望違約概率來進(jìn)行排序的。但是AA-和A+之間期望違約概率的差別并不必然與BB-和B+之間期望違約概率的差別相同。也就是說,用字母來表示的信用評(píng)級(jí)并不是以間隔尺度來度量的。(2)每股現(xiàn)金紅利是以比率尺度來度量的。對(duì)于該變量,0表示完全沒有紅利;這是一

14、個(gè)真正的零點(diǎn)。(3)對(duì)沖基金分類類別是以名義尺度來度量的。每個(gè)類別中包含的是以相同投資策略進(jìn)行投資的對(duì)沖基金。然而,與債券的信用評(píng)級(jí)不同,對(duì)沖基金分類規(guī)則中并沒有涉及對(duì)其進(jìn)行排序。因此,該分類規(guī)則并不是以順序尺度來度量的。(4)債券到期年限是以比率尺度來度量的。3.3用頻數(shù)分布匯總數(shù)據(jù)在這一節(jié)中,我們討論一種最簡單的匯總數(shù)據(jù)的方法頻數(shù)分布。頻數(shù)分布的定義。一個(gè)頻數(shù)分布(frequency distribution)是指一種表格列示數(shù)據(jù)的方法,它用較少的區(qū)間對(duì)數(shù)據(jù)總體進(jìn)行概括。頻數(shù)分布為我們對(duì)大量統(tǒng)計(jì)數(shù)據(jù)的分析提供了幫助,并且其能夠應(yīng)用于任何尺度度量的數(shù)據(jù)之上。收益率是分析師和投資組合經(jīng)理用來進(jìn)

15、行投資決策的最基本要素,我們可以使用頻數(shù)分布來對(duì)其進(jìn)行匯總與描述。當(dāng)我們分析收益率時(shí),我們的出發(fā)點(diǎn)是持有期收益(也被稱為總收益)。持有期收益公式(holding period return formula)。在時(shí)刻t(從t-1到t)的持有期收益Rt為:式中,Pt表示時(shí)刻t的每股價(jià)格;Pt-1表示時(shí)刻t-1的每股價(jià)格,該時(shí)刻緊接在時(shí)刻t之前;Dt表示在時(shí)刻t-1到時(shí)刻t之間收到的現(xiàn)金分配。因此,時(shí)刻t的持有期收益為資本利得(或者損失)加上現(xiàn)金分配再除以期初的價(jià)格。(對(duì)于普通股來說,現(xiàn)金分配為紅利;對(duì)于債券來說,現(xiàn)金分配為息票支付。)我們可以簡單地通過對(duì)于時(shí)間指標(biāo)t的間隔單位的不同解釋,來利用式(

16、3-1)對(duì)任何資產(chǎn)的日、周、月或者年的持有期收益分別進(jìn)行定義。如式(3-1)所定義的持有期收益具有兩個(gè)重要的特征。首先,它是一個(gè)與時(shí)間有關(guān)的量。例如,如果我們觀測(cè)到的價(jià)格之間的時(shí)間間隔是以月為單位的話,那么收益率就是一個(gè)月度的數(shù)字。其次,收益率是沒有貨幣單位的。例如,如果貨幣是用歐元來計(jì)量的話,那么式(3-1)的分子與分母都將以歐元來表示,結(jié)果該比率將不含有任何單位,因?yàn)榉肿雍头帜傅膯挝豢梢韵嗷ゼs去。無論價(jià)格是以何種貨幣來計(jì)量的,這一結(jié)果都將成立。(然而我們要注意,如果在持有期收益中的價(jià)格和現(xiàn)金分配不是以同一本國貨幣來表述的話,我們一般需要在計(jì)算持有期收益之前先將這些變量都轉(zhuǎn)化為本國貨幣。由于

17、匯率會(huì)在持有期間內(nèi)波動(dòng),所以一個(gè)資產(chǎn)的持有期收益以不同貨幣作為單位進(jìn)行計(jì)算時(shí),往往會(huì)得出不同的結(jié)果。)在注意到上述事項(xiàng)之后,我們現(xiàn)在來討論標(biāo)準(zhǔn)普爾500指數(shù)持有期收益的頻數(shù)分布。(我們使用伊博森協(xié)會(huì)提供的標(biāo)準(zhǔn)普爾500在1926年1月至2002年12月的總收益序列。)首先,我們考察年度收益率;然后我們?cè)倏丛露仁找媛?。通過式(3-1),我們可以計(jì)算出標(biāo)準(zhǔn)普爾500在1926年1月至2002年12月的年度收益率,共77個(gè)年度觀測(cè)值。月度數(shù)據(jù)包括1926年1月至2002年12月,共924個(gè)月度觀測(cè)值。我們可以將建立頻數(shù)分布的基本步驟敘述如下:建立一個(gè)頻數(shù)分布。1.將數(shù)據(jù)以升序排列。2.計(jì)算出數(shù)據(jù)的極

18、差。定義極差=最大值-最小值。3.確定頻數(shù)分布包含的區(qū)間數(shù)k。4.確定區(qū)間的寬度(極差/k)。5.通過不斷地在數(shù)據(jù)最小值上加上區(qū)間寬度來確定各個(gè)區(qū)間的端點(diǎn),該過程在到達(dá)包含最大值的區(qū)間時(shí)停止。6.計(jì)算落入每個(gè)區(qū)間中觀測(cè)值的個(gè)數(shù)。7.建立一個(gè)列示落入從小到大排列的每個(gè)區(qū)間中觀測(cè)值數(shù)量的表格。在第4步中,當(dāng)對(duì)區(qū)間寬度進(jìn)行四舍五入時(shí),我們采用上舍入(round up)而不是下舍出(round down)(如1.11的上舍入為2,而下舍出為1),以保證最后的那個(gè)區(qū)間中包含數(shù)據(jù)的最大值。正如上述步驟所明確表述的,一個(gè)頻數(shù)分布將數(shù)據(jù)歸入到一系列區(qū)間之中。(區(qū)間有時(shí)也被稱為組別(classes)、范圍(ra

19、nges)或者箱體(bins)。)一個(gè)區(qū)間(interval)是指一對(duì)數(shù)值,在這對(duì)數(shù)值的范圍之內(nèi)會(huì)包含落入其中的觀測(cè)值。每個(gè)觀測(cè)值只會(huì)落入一個(gè)區(qū)間之中,并且整個(gè)區(qū)間應(yīng)該包含數(shù)據(jù)中所有觀測(cè)值。實(shí)際落入一個(gè)給定區(qū)間的觀測(cè)值數(shù)量被稱為絕對(duì)頻數(shù)(absolute frequency),或者簡稱為頻數(shù)。頻數(shù)分布是反映一組區(qū)間以及各個(gè)區(qū)間相對(duì)應(yīng)的頻數(shù)度量指標(biāo)的一個(gè)列表。為了說明操作的基本步驟,假設(shè)我們有12個(gè)觀測(cè)值,以升序排列為:-4.57,-4.04,-1.64,0.28,1.34,2.35,2.38,4.28,4.42,4.68,7.16和11.43。最小的觀測(cè)值為-4.57,而最大的觀測(cè)值為+11.

20、43,因此,極差為+11.43-(-4.57)=16。如果我們?cè)O(shè)定k=4,那么區(qū)間寬度為16/4=4。表3-1顯示了不斷增加區(qū)間寬度4而得到的區(qū)間的端點(diǎn)(步驟5)。因此,所得到的區(qū)間分別為-4.57,-0.57),-0.57,3.43),3.43,7.43)和7.43,11.43)。(-4.57,-0.57)的記法是指-4.57觀測(cè)值)表3-2匯總了步驟5到步驟7的結(jié)果。注:這里的區(qū)間之間不會(huì)相互重疊,所以每個(gè)觀測(cè)值只能唯一地落入其中的某一區(qū)間之中。我們首先討論如何對(duì)19262002年區(qū)間段的標(biāo)準(zhǔn)普爾500年收益率建立頻數(shù)分布。在這個(gè)區(qū)間中,標(biāo)準(zhǔn)普爾500收益率的最小值為-43.34%(在19

21、31年),最大值為+51.99%(在1933年)。因此,該數(shù)據(jù)的極差近似為+54%-(-43%)=97%。現(xiàn)在的問題是我們用來歸類觀測(cè)值的區(qū)間數(shù)k應(yīng)該選擇多少。雖然在統(tǒng)計(jì)學(xué)的文獻(xiàn)中有一些對(duì)于k選擇的建議,但是設(shè)置一個(gè)有用的k值經(jīng)常涉及對(duì)于數(shù)據(jù)仔細(xì)的觀察與審慎的判斷。那么我們應(yīng)該要包含多少具體細(xì)節(jié)呢?如果我們使用過少的區(qū)間,那么我們將匯總得過于粗略,從而失去數(shù)據(jù)相關(guān)的特征。而如果我們使用過多的區(qū)間,那么我們可能根本就沒有起到匯總的效果。我們可以通過比較劃分不同區(qū)間寬度所產(chǎn)生的效果,來選擇一個(gè)適當(dāng)?shù)膋值。大量的空白區(qū)間可能意味著我們過分想要將數(shù)據(jù)進(jìn)行分類,以至于反映了過多的細(xì)節(jié)。我們可以從一個(gè)相對(duì)

22、較小的區(qū)間寬度開始著手,來觀察它是否使得大部分區(qū)間是空白的,以及判斷與區(qū)間寬度相關(guān)的k值是否取得過大。如果區(qū)間大部分都是空白的或者k值非常大,那么我們可以考慮逐步增大區(qū)間寬度(減小k值),直至產(chǎn)生一個(gè)能有效匯總數(shù)據(jù)分布的頻數(shù)分布。對(duì)于標(biāo)準(zhǔn)普爾500年度序列來說,1%的收益率區(qū)間寬度將形成97個(gè)區(qū)間,并且其中很多區(qū)間是空白的,因?yàn)槲覀冎挥?7個(gè)年度觀測(cè)值。我們需要記住建立頻數(shù)分布的目的在于匯總數(shù)據(jù)。假如為了解釋簡單,我們想要使用以整數(shù)而不是分?jǐn)?shù)百分比表述的區(qū)間寬度。一個(gè)2%的區(qū)間寬度可能會(huì)比1%的區(qū)間寬度擁有更少的空白區(qū)間,并且能更有效地匯總數(shù)據(jù)。一個(gè)2%的區(qū)間寬度將會(huì)有97/2=48.5個(gè)區(qū)間

23、,我們可以將其四舍五入成49個(gè)區(qū)間??倕^(qū)間的寬度將為2%49=98%。我們可以肯定,如果我們從最小的整數(shù)-44%開始,不斷增加2%的區(qū)間,最終區(qū)間的端點(diǎn)將位于-44.0%+98%=54%,該區(qū)間就包含了樣本中最大的收益率53.99%。在通過這種方式建立該頻數(shù)分布過程中,我們也得到以數(shù)值0%結(jié)束和以0%開始的兩個(gè)區(qū)間,這樣就使得我們可以計(jì)算數(shù)據(jù)中負(fù)的和正的收益率的數(shù)量。不需要太多的工作量,我們就找到了匯總數(shù)據(jù)的有效方法。我們將使用2%的區(qū)間,從-44%Rt-42%開始(在表中給出的是-44.0%到-42.0%)一直到52%Rt54%結(jié)束。表3-3給出了標(biāo)準(zhǔn)普爾500年度總收益率的頻數(shù)分布。表3-

24、3中包含了其他3種表示數(shù)據(jù)的有用方法。一旦建立了頻數(shù)分布,我們就可以計(jì)算相對(duì)頻數(shù)、累積頻數(shù)(也被稱為累積絕對(duì)頻數(shù))和累積相對(duì)頻數(shù)。表3-3 19262002年標(biāo)準(zhǔn)普爾500年度總收益率的頻數(shù)分布表在原書P95注:每個(gè)區(qū)間的下限取的是不嚴(yán)格不等號(hào)(),而每個(gè)區(qū)間的上限取的是嚴(yán)格不等號(hào)()。相對(duì)頻數(shù)的定義。相對(duì)頻數(shù)(relative frequency)是指每個(gè)區(qū)間的絕對(duì)頻數(shù)除以整個(gè)樣本觀測(cè)值的數(shù)量。累積相對(duì)頻數(shù)(cumulative relative frequency)將隨著區(qū)間從第一個(gè)到最后一個(gè)的移動(dòng),對(duì)于相應(yīng)的相對(duì)頻數(shù)進(jìn)行累積(加總)。該指標(biāo)告訴我們低于每個(gè)區(qū)間上限的觀測(cè)值占總觀測(cè)值的比例

25、。仔細(xì)觀測(cè)表3-3中給出的頻數(shù)分布,我們可以看到,第1個(gè)收益率區(qū)間-44%到-42%,只有一個(gè)觀測(cè)值;其相對(duì)頻數(shù)為1/77或1.30%。因?yàn)榈陀?42%的觀測(cè)值只有一個(gè),所以該區(qū)間的累積頻數(shù)為1。因此,累積相對(duì)頻數(shù)為1/77或1.30%。第2個(gè)收益率區(qū)間有0個(gè)觀測(cè)值;因此,其累積頻數(shù)為0加上1,而其累積相對(duì)頻數(shù)為1.30%(從前一個(gè)區(qū)間得來的累積相對(duì)頻數(shù))。我們可以通過在前一個(gè)累積頻數(shù)的基礎(chǔ)上加總(絕對(duì))頻數(shù)來求得其他區(qū)間的累積頻數(shù)。累積頻數(shù)告訴我們小于每個(gè)收益率區(qū)間上限的觀測(cè)值的數(shù)量。正如表3-3所顯示的,該樣本在各個(gè)收益率區(qū)間中頻數(shù)的取值為07中的一個(gè)數(shù)。收益率為-10%-8%的區(qū)間中最多

26、有7個(gè)觀測(cè)值。頻數(shù)第二多的區(qū)間為收益率18%20%的6個(gè)觀測(cè)值。從累積頻數(shù)一列中,我們可以看到,負(fù)收益率的觀測(cè)值為23個(gè)。所以正收益率的觀測(cè)值一定等于77-23,即54個(gè)。我們可以將正的和負(fù)的收益率的數(shù)目分別表示成總數(shù)的一個(gè)百分比,并通過該指標(biāo)來感受投資于股票市場所存在的內(nèi)在風(fēng)險(xiǎn)。在77年的區(qū)間中,標(biāo)準(zhǔn)普爾500具有負(fù)的年收益率的時(shí)間占總體的29.9%(即23/77)。這一結(jié)果顯示在表3-3的第5列,它給出了累積相對(duì)頻數(shù)的結(jié)果。頻數(shù)分布不僅告訴我們大部分觀測(cè)值集中在何處,還告訴我們數(shù)據(jù)分布是否是對(duì)稱的、有偏的或者尖峰的。在標(biāo)準(zhǔn)普爾500的例子中,我們可以看到,超過一半的數(shù)據(jù)都是正的,而且大部分

27、的年收益率都超過10%(54個(gè)正的年收益率中只有11個(gè)(大約20%)集中在0到10%之間)。表3-3允許我們對(duì)于區(qū)間數(shù)的選擇,特別是與股票收益率有關(guān)的區(qū)間數(shù)的選擇問題,給出了進(jìn)一步的重要結(jié)論。從表3-3的頻數(shù)分布中,我們可以看到,落在-44%至-16%和38%至54%之間的結(jié)果只有5個(gè)。股票收益率數(shù)據(jù)經(jīng)常會(huì)出現(xiàn)非常大或非常小的結(jié)果。我們可以通過選擇一個(gè)較小的k值,使得頻數(shù)分布尾部的收益率區(qū)間減少。但是這么做會(huì)使得我們失去關(guān)于股票市場極端差或者極端好這兩種情況的信息。一位風(fēng)險(xiǎn)管理者可能需要知道最差的可能結(jié)果,因此,他可能想要關(guān)于分布尾端(極端值)部分的詳細(xì)信息。此時(shí),一個(gè)具有較大k值的頻數(shù)分布就

28、會(huì)對(duì)他有用。而一個(gè)投資組合經(jīng)理或者投資分析師同樣也可能對(duì)于尾部的詳細(xì)信息感興趣;然而,如果一個(gè)經(jīng)理或者分析師想要獲得關(guān)于大部分觀測(cè)值主要集中在何處的信息,那么他可能會(huì)希望區(qū)間的寬度更大一些,例如4%(從-44%開始,共25個(gè)區(qū)間)。標(biāo)準(zhǔn)普爾500月度收益率的頻數(shù)分布看上去與年度收益率有較大不同。從1926年1月至2002年12月的月度收益率序列共924個(gè)觀測(cè)值。收益率從最小的-30%左右到最大的43%左右。對(duì)于這么大規(guī)模的月度數(shù)據(jù),我們必須對(duì)其進(jìn)行匯總以獲得對(duì)于數(shù)據(jù)總體分布的一個(gè)感受,所以我們將數(shù)據(jù)分為37個(gè)2%寬度的等間距收益率區(qū)間。通過這樣的匯總方式所獲得的好處是巨大的。表3-4列出了最終

29、獲得的頻數(shù)分布。絕對(duì)頻數(shù)出現(xiàn)在第二列中,而在其后面的是相對(duì)頻數(shù)一列。相對(duì)頻數(shù)一列中的數(shù)據(jù)都被近似到小數(shù)點(diǎn)后兩位。而累積絕對(duì)頻數(shù)和累積相對(duì)頻數(shù)分別出現(xiàn)在第4列和第5列中。表3-4 1926年1月至2002年12月標(biāo)準(zhǔn)普爾500月度總收益率的頻數(shù)分表在原書P97注:每個(gè)區(qū)間的下限取的是不嚴(yán)格不等號(hào)(),而每個(gè)區(qū)間的上限取的是嚴(yán)格不等號(hào)(0對(duì)于i=1,2,n。調(diào)和平均數(shù)是對(duì)于觀測(cè)值的倒數(shù)(形式為1/Xi的項(xiàng))進(jìn)行求和后再求平均(即將總和除以其觀測(cè)值的數(shù)目n),最后將平均數(shù)求倒數(shù)后得到的。調(diào)和平均數(shù)可以看做一種特殊形式的加權(quán)平均數(shù),其觀測(cè)值的權(quán)重與其大小成反比例。調(diào)和平均數(shù)是關(guān)于均值相對(duì)專門的一個(gè)概念

30、。當(dāng)我們對(duì)比率進(jìn)行平均(每單位的數(shù)量)且該比率被重復(fù)地應(yīng)用于一個(gè)固定值來得到一個(gè)變化的單位數(shù)量時(shí),該調(diào)和平均數(shù)的計(jì)算是恰當(dāng)?shù)?。這個(gè)概念最好通過一個(gè)例子來進(jìn)行說明。一個(gè)廣為人知的應(yīng)用來源于一種投資策略,即成本平均,其涉及在每個(gè)區(qū)間中投資固定數(shù)目的一筆金額。在這個(gè)應(yīng)用中,我們進(jìn)行平均的比率是在購買當(dāng)天的每股價(jià)格,而且我們將這些價(jià)格去除一個(gè)常數(shù)金額,并得出一系列不同的股數(shù)值。假設(shè)一個(gè)投資者在n=2個(gè)月內(nèi)每個(gè)月購買1000歐元的股票,該股票的價(jià)格在這兩個(gè)購買時(shí)點(diǎn)分別為10歐元和15歐元。那么購買該股票的平均價(jià)格是多少?如果我們?cè)诿總€(gè)時(shí)點(diǎn)投資不同的金額,那么我們就不能應(yīng)用調(diào)和平均數(shù)的計(jì)算公式。但是,我們

31、仍可以使用加權(quán)平均數(shù)的計(jì)算公式來進(jìn)行類似于上面的計(jì)算。一個(gè)關(guān)于調(diào)和平均數(shù)、幾何平均數(shù)和算術(shù)平均數(shù)之間的數(shù)學(xué)關(guān)系是除非數(shù)據(jù)集的所有觀測(cè)值都相同,否則調(diào)和平均數(shù)就將嚴(yán)格小于幾何平均數(shù),而幾何平均數(shù)嚴(yán)格小于算術(shù)平均數(shù)。在我們給出的例子中,調(diào)和平均價(jià)格確實(shí)嚴(yán)格小于算術(shù)平均價(jià)格。3.6位置的度量:分位數(shù)至今為止,我們已經(jīng)討論了集中趨勢(shì)測(cè)度。現(xiàn)在我們來考察描述數(shù)據(jù)位置的一種方法,該方法被用來識(shí)別出這樣的一個(gè)臨界值,小于等于該臨界值的觀測(cè)值數(shù)量占到整個(gè)數(shù)據(jù)中某個(gè)具體比率。例如,一個(gè)投資組合25%、50%和75%的年收益率的值分別小于或者等于值-0.05、0.16和0.25。這些數(shù)值提供了關(guān)于投資組合收益率分

32、布的簡要信息。統(tǒng)計(jì)學(xué)家使用詞匯分位數(shù)(或分位點(diǎn))(quantile or fractile)來作為對(duì)于該值(小于等于該值的數(shù)據(jù)為一給定的比率)最一般的術(shù)語。下面,我們會(huì)討論最常用的一些分位數(shù)四分位數(shù)、五分位數(shù)、十分位數(shù)和百分位數(shù),以及它們?cè)谕顿Y中的一些應(yīng)用。3.6.1四分位數(shù)、五分位數(shù)、十分位數(shù)、百分位數(shù)我們知道中位數(shù)將一個(gè)分布分成相等的兩個(gè)部分。我們可以定義其他將一個(gè)分布分成更小尺寸的分割線。四分位數(shù)(quartiles)將一個(gè)分布分成4等分,而五分位數(shù)(quintiles)將其分成5等分,十分位數(shù)(deciles)分成10等分,百分位數(shù)(percentiles)分成一百等分。給定一組觀測(cè)值

33、,第y個(gè)百分位數(shù)是指這樣的一個(gè)值,小于等于該值的觀測(cè)值占總觀測(cè)值的比例為y%。百分位數(shù)經(jīng)常被使用,其他的一些度量指標(biāo)可以類似地由百分位點(diǎn)進(jìn)行定義。例如,第1個(gè)四分位數(shù)(Q1)將一個(gè)分布分成兩塊,該分割點(diǎn)使得25%的觀測(cè)值小于等于它。因此,第1個(gè)四分位點(diǎn)也就是第25個(gè)百分位點(diǎn)。同樣的,第2個(gè)四分位點(diǎn)表示第50個(gè)百分位點(diǎn),第3個(gè)四分位點(diǎn)表示第75個(gè)百分位點(diǎn)(因?yàn)?5%的觀測(cè)值小于等于它)。當(dāng)處理實(shí)際數(shù)據(jù)時(shí),我們經(jīng)常發(fā)現(xiàn)我們需要去近似估計(jì)百分位數(shù)的值。例如,如果我們對(duì)于第75個(gè)百分位數(shù)的值感興趣,而且我們發(fā)現(xiàn)數(shù)據(jù)中沒有使得樣本中正好有75%的觀測(cè)值小于等于它的觀測(cè)值存在。我們就可以運(yùn)用下面的方法來幫

34、助我們確定或者估計(jì)該百分位數(shù)。這種方法首先要求在該組觀測(cè)值中確定百分位數(shù)的位置,然后確定(或者估計(jì))出與那個(gè)位置相關(guān)的具體數(shù)值。假使Py是這樣的一個(gè)數(shù)值,它使得分布的y%小于等于該值,或者說它就是第y個(gè)百分位點(diǎn)。(例如,P18就是使得分布中18%的觀測(cè)值小于等于它的這樣一個(gè)數(shù)值;或者說有100-18=82%的觀測(cè)值比P18大。)一個(gè)由n個(gè)按升序排列數(shù)據(jù)組成的數(shù)組的百分位點(diǎn)位置的計(jì)算公式為:式中,y是百分點(diǎn)(在該點(diǎn)我們將分布進(jìn)行分割);Ly是按升序排序數(shù)組中位于百分?jǐn)?shù)Py處的值(L)。Ly該值可能是一個(gè)整數(shù),也可能不是一個(gè)整數(shù)。通常,隨著樣本容量的增大,百分位數(shù)位置的計(jì)算將會(huì)變得越來越精確;而在

35、小樣本的情況下,它可能只是一個(gè)近似。作為一個(gè)Ly不是整數(shù)的例子,假設(shè)我們要確定2002年由表3-8給出的16個(gè)歐洲股票市場收益率的第3個(gè)四分位數(shù)(Q3或者P75)。按照式(3-8),第3個(gè)四分位數(shù)的位置為L75=(16+1)75/100=12.75,或者位于表3-9按收益率升序排列的第12項(xiàng)和第13項(xiàng)之間的值。表3-9中第12項(xiàng)為2002年葡萄牙的股票收益率-28.29%。第13項(xiàng)為2002年瑞士的股票收益率-25.84%。為了反映12.75中的0.75,我們得出這樣的結(jié)論:P75位于-28.29%和-25.84%之間75%的距離上??偨Y(jié)如下:當(dāng)位置Ly是一個(gè)整數(shù)時(shí),該位置與一個(gè)實(shí)際的觀測(cè)值相

36、對(duì)應(yīng)。例如,如果意大利沒有被包含在樣本中,那么n+1將等于16,于是L75=12,故第3個(gè)四分位數(shù)將為P75=X12,其中,Xi是有在按升序排列的數(shù)據(jù)中的第i個(gè)(i=L75)位置上的觀測(cè)值的數(shù)值(即P75=-28.29)。當(dāng)Ly不是一個(gè)整數(shù)時(shí),Ly位于兩個(gè)與其最接近的整數(shù)之間(一個(gè)大于它,一個(gè)小于它),那么我們可以通過在這兩個(gè)位置之間進(jìn)行線性插值(linear interpolation)來確定Py。插值指的是通過兩個(gè)已知的且在所求未知量附近的數(shù)值(一個(gè)大于它,一個(gè)小于它)來對(duì)于未知量進(jìn)行估計(jì)的一種方法;而術(shù)語線性指的是一種利用直線來進(jìn)行的估計(jì)。回到計(jì)算股票收益率的P75值的例子中,我們之前求

37、得Ly=12.75;其相鄰的比它小的整數(shù)為12,而相鄰的比它大的整數(shù)為13。利用線性插值方法,P75X12+(12.75-12)(X13-X12)。如上所述,在第12個(gè)位置上的數(shù)值是葡萄牙的股票收益率,所以X12=-28.29%;而X13=-25.84%,代表著第13個(gè)位置上的瑞士的股票收益率。因此,我們的估計(jì)為P75X12+(12.75-12)(X13-X12)=-28.29+0.75-25.84-(-28.29)=-28.29+0.75(2.45)=-28.29+1.84=-26.45%。用語言來表達(dá)就是,P75被包含在一個(gè)下界為-28.29、上界為-25.84的區(qū)間中。因?yàn)?2.75-1

38、2=0.75,所以利用線性插值,我們將從-28.29%至-25.84%之間距離的75%處的點(diǎn)作為我們P75的估計(jì)值。當(dāng)Ly不是一個(gè)整數(shù)時(shí),我們采用這種方式:取包含Py的最接近的位于Ly之上和之下的兩個(gè)整數(shù)來確定所使用觀測(cè)值的位置,然后對(duì)于該位置上的兩個(gè)觀測(cè)值利用線性插值來對(duì)于Py進(jìn)行估計(jì)。例3-9舉例說明了歐洲主要股票指數(shù)中成分股紅利收益率的不同分位數(shù)的計(jì)算方法。例3-9 計(jì)算百分位數(shù)、四分位數(shù)和五分位數(shù)DJ EuroSTOXX 50是一個(gè)由歐洲最大的50家上市公司按市值加權(quán)所計(jì)算得到的指數(shù)。表3-17列出了該指數(shù)中50個(gè)成分股在2003年中期的紅利收益率情況,數(shù)據(jù)按升序排列。表3-17在原文

39、P122利用表3-17中的數(shù)據(jù)回答下列問題:(1)計(jì)算第10個(gè)和第90個(gè)百分位數(shù)。(2)計(jì)算第1個(gè)、第2個(gè)和第3個(gè)四分位數(shù)。(3)給出中位數(shù)的值。(4)有多少個(gè)五分位數(shù),這些五分位數(shù)分別與哪些百分位數(shù)相對(duì)應(yīng)?(5)計(jì)算第1個(gè)五分位數(shù)。解:(1)在這個(gè)例子中,n=50。利用式(3-8),Ly=(n+1)y/100是第y個(gè)百分位數(shù)所處的位置,因此,對(duì)于第10個(gè)百分位數(shù)來說,我們有L10=(50+1)(10/100)=5.1L10在第5個(gè)和第6個(gè)觀測(cè)值X5=0.26和X6=1.09之間。紅利收益率的第10個(gè)百分位數(shù)(第1個(gè)十分位數(shù))的估計(jì)值為對(duì)于第90個(gè)百分位數(shù),L90=(50+1)(90/100)

40、=45.9L90位于第45個(gè)觀測(cè)值X45=5.15和第46個(gè)觀測(cè)值X46=5.66之間。故第90個(gè)百分位數(shù)(第9個(gè)十分位數(shù))的估計(jì)值為(2)第1個(gè)、第2個(gè)和第3個(gè)四分位數(shù)分別對(duì)應(yīng)于P25、P50和P75。L25=(51)(25/100)=12.75L25位于第12和第13個(gè)數(shù)據(jù)X12=1.51和X13=1.75之間。P25=Q1X12+(12.75-12)(X3-X12)=1.51+0.75(1.75-1.51)=1.51+0.75(0.24)=1.69%L50=(51)(50/100)=25.5L50位于第25和第26個(gè)數(shù)據(jù)之間,但是由于X25=X26=2.65,故我們不需要插值。P50=Q

41、2=2.65%L75=(51)(75/100)=38.25L75位于第38和第39個(gè)數(shù)據(jù)X38=3.88和X39=4.06之間。P75=Q3X38+(38.25-28)(X39-X38)=3.88+0.25(4.06-3.88)=3.88+0.25(0.18)=3.93%(3)中位數(shù)是第50個(gè)百分位數(shù),2.65%。這與我們通過求第n/2=50/2=25項(xiàng)和第(n+2)/2=52/2=26項(xiàng)的平均數(shù)的結(jié)果是相同的。這一方法與之前樣本容量為偶數(shù)的樣本中位數(shù)的求解過程所得的結(jié)果是一致的。(4)有4個(gè)五分位點(diǎn),它們分別對(duì)應(yīng)P20、P40、P60和P80。(5)第1個(gè)五分位點(diǎn)是P20。L20=(50+1

42、)(20/100)=10.2L20位于第10個(gè)和第11個(gè)觀測(cè)值X10=1.39和X11=1.41之間故第1個(gè)五分位數(shù)的估計(jì)值為P20X10+(10.2-10)(X11-X10)=1.39+0.2(1.41-1.39)=1.39+0.2(0.02)=1.394%或1.39%3.6.2分位數(shù)在投資中的應(yīng)用在這一節(jié)中,我們將對(duì)分位數(shù)在投資中的應(yīng)用進(jìn)行討論。分位數(shù)在投資組合業(yè)績?cè)u(píng)價(jià)和投資策略研發(fā)中都有應(yīng)用。投資分析師每天使用分位數(shù)來對(duì)于業(yè)績進(jìn)行排序例如,對(duì)于投資組合的業(yè)績。投資經(jīng)理的業(yè)績也經(jīng)常以與同等類型投資經(jīng)理的業(yè)績相比所處的分位數(shù)的形式來表示。另外,晨星共同基金星級(jí)評(píng)級(jí)也將同類風(fēng)格共同基金百分位數(shù)

43、的業(yè)績與某個(gè)星級(jí)的數(shù)字相聯(lián)系。另外一個(gè)使用分位數(shù)的領(lǐng)域是在投資研究方面。分析師根據(jù)某一分位數(shù)來定義一個(gè)以該分位數(shù)命名的組類。例如,分析師們經(jīng)常將一組收益率低于作為截?cái)帱c(diǎn)的第10個(gè)百分位數(shù)的公司作為收益率最低的10%的公司。基于某些特征將數(shù)據(jù)分成幾類,使得分析師們能評(píng)估特定特征對(duì)于某些感興趣數(shù)據(jù)的影響情況。例如,金融實(shí)證研究常根據(jù)股票市值對(duì)上市公司進(jìn)行排序并將其分成10類。第1類包含的是那些擁有最小市值公司投資組合,而第10類包含的是那些擁有最大市值公司的投資組合。將上市公司分成10類使得分析師們能夠比較小市值公司和大市值公司業(yè)績表現(xiàn)之間的差別。我們可以用鮑曼(Bauman)、柯諾瓦(Conov

44、er)和米勒(Miller)(1998)作為一個(gè)在投資研究中使用分位數(shù),特別是四分位數(shù)的例子來加以說明。他們的研究比較了國際成長股和價(jià)值股之間的業(yè)績表現(xiàn)情況。通常,價(jià)值股被定義為那些市場價(jià)格相對(duì)其每股盈利、每股賬面價(jià)值或者每股紅利較低的股票。而另一方面,成長股的市場價(jià)格卻相對(duì)于那些指標(biāo)較高。鮑曼他們的分類標(biāo)準(zhǔn)是按照一些估值度量指標(biāo):價(jià)格-盈利比(市盈率P/E),價(jià)格-現(xiàn)金流比(P/CF),價(jià)格-賬面價(jià)值比(市凈率,P/B)和紅利收益率(D/P)。他們將總樣本中在19861996年間每年6月20日擁有最低市盈率的四分之一股票(價(jià)值股類)定義為四分位數(shù)組1,而將每年擁有最高市盈率的四分之一股票(成

45、長股類)定義為四分位數(shù)組2。擁有第二大的市盈率的股票形成四分位數(shù)組3,而擁有第二小的市盈率的股票形成四分位數(shù)組2。作者們對(duì)于每個(gè)基本面因子重復(fù)這個(gè)分類過程。對(duì)于每個(gè)四分位數(shù)組類,他們將其以等權(quán)重的方式形成一個(gè)投資組合。由此,他們能夠比較不同價(jià)值/成長四分位數(shù)組類間的業(yè)績表現(xiàn)情況。下面的表3-18是由他們研究中的表1復(fù)制而來的。表3-18給出了每個(gè)四分位數(shù)組類以及每個(gè)估值因子的中位數(shù)、均值收益率和標(biāo)準(zhǔn)差。從四分位數(shù)組1到四分位數(shù)組4,按P/E、P/CF和P/B分類時(shí),都呈現(xiàn)逐漸增加的趨勢(shì);而按D/P分類時(shí),呈現(xiàn)出逐漸下降的趨勢(shì)。而無論選擇標(biāo)準(zhǔn)是什么,國際價(jià)值股在樣本區(qū)間內(nèi)總是表現(xiàn)優(yōu)于成長股。鮑曼

46、、柯諾瓦和米勒也根據(jù)股票市值的大小將公司分入4個(gè)四分位數(shù)組類之一。在此基礎(chǔ)上,他們考察了在不同四分位數(shù)組類中股票的收益率情況。表3-19是從他們論文中的表7復(fù)制而來。如表中所示,小公司的投資組合具有市值中位數(shù)為46600000美元,而大公司的投資組合具有的市值中位數(shù)為2472300000美元。大公司的市值是小公司的50多倍,但是它們的股票平均收益率卻小于小公司平均收益率的一半(小公司22.0%,大公司10.8%)。總的來看,鮑曼等人發(fā)現(xiàn)兩種效應(yīng):第一,國際價(jià)值股(如作者們所定義的)的表現(xiàn)要優(yōu)于國際成長股;第二,國際小市值股票的表現(xiàn)要優(yōu)于國際大市值的股票。作者下一步是考察在控制公司規(guī)模的情況下,

47、價(jià)值股和成長股表現(xiàn)情況如何。這一步涉及構(gòu)建16個(gè)不同的價(jià)值型/成長型和公司規(guī)模的投資組合(44=16),并觀察這兩個(gè)基本面因素相互間的交互作用。他們發(fā)現(xiàn)除了市值非常小的情況之外,國際價(jià)值股票的表現(xiàn)始終優(yōu)于國際成長股。對(duì)于投資組合經(jīng)理來說,這些發(fā)現(xiàn)告訴我們?cè)谀膫€(gè)具體研究的時(shí)間區(qū)間內(nèi)將國際市場上的價(jià)值股推薦給投資者比推薦成長股更能獲得有利的收益率。3.7離散度的度量正如著名的研究者費(fèi)雪 布萊克(Fisher Black)所寫的,投資中的重要問題在于估計(jì)期望收益率。(布萊克(Black)(1993)。)很少有人會(huì)忽視投資中期望收益率或者平均收益率的重要性:平均收益率告訴我們收益率和投資的結(jié)果會(huì)集中出

48、現(xiàn)在哪里。然而為了完全地理解投資,我們也需要去了解收益率在均值附近的分散情況。離散度(dispersion)是反映集中趨勢(shì)附近變化程度的一個(gè)度量。如果平均收益率表示的是回報(bào),那么離散度表達(dá)的就是風(fēng)險(xiǎn)。在這一節(jié)中,我們將考察最常用的離散度度量指標(biāo):極差、平均絕對(duì)偏差、方差和標(biāo)準(zhǔn)差。所有這些都是度量絕對(duì)離散度(absolute dispersion)的指標(biāo)。絕對(duì)離散度是指不需要與任何參考點(diǎn)或基準(zhǔn)進(jìn)行比較而得到的反映數(shù)據(jù)變動(dòng)程度的量。這些度量指標(biāo)將在整個(gè)投資實(shí)踐中得到使用。收益率的方差和標(biāo)準(zhǔn)差經(jīng)常被用來作為風(fēng)險(xiǎn)的度量指標(biāo)。這一方法最早起源于諾貝爾獎(jiǎng)得主哈里?馬克維茨(Harry Markowitz)

49、的開創(chuàng)性工作。而另一位諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主威廉?夏普(William Sharpe)則提出了夏普比率,這是一個(gè)經(jīng)過風(fēng)險(xiǎn)調(diào)整后的業(yè)績度量指標(biāo)。該指標(biāo)利用了收益率的標(biāo)準(zhǔn)差作為風(fēng)險(xiǎn)的度量。其他度量數(shù)據(jù)離散度的指標(biāo)平均絕對(duì)偏差和極差同樣也在數(shù)據(jù)分析中非常有用。3.7.1極差我們先前在討論構(gòu)建頻數(shù)分布過程中就已經(jīng)遇到過極差。作為所有度量離散度指標(biāo)中最簡單的指標(biāo),極差可以對(duì)區(qū)間型或者比率型數(shù)據(jù)進(jìn)行計(jì)算。差的定義。極差(range)是指一個(gè)數(shù)據(jù)集中最大值與最小值之差。作為極差的一個(gè)例子,從1926年1月至2002年12月標(biāo)準(zhǔn)普爾500最大的月收益率為42.56%(出現(xiàn)在1933年4月),最小的收益率為-29.

50、73%(出現(xiàn)在1931年9月),因此收益率的極差為72.29%42.56%-(-29.73%)。另外一種代替極差定義的方法是報(bào)告最大值和最小值。這種替代的方法能比式(3-9)的定義提供更多的信息。極差的一個(gè)優(yōu)點(diǎn)在于計(jì)算簡單。而其缺點(diǎn)在于極差僅僅使用了分布中的兩個(gè)信息,它無法告訴我們數(shù)據(jù)是如何分布的(即分布的形狀是怎樣的)。因?yàn)闃O差是最大值和最小值之差,它只能反映出極端大和極端小的情況,而不能表現(xiàn)出分布總體的情況。(我們可能遇到的另一個(gè)度量離散度的距離指標(biāo)為四分位距,它關(guān)注于數(shù)據(jù)的中間部分,而不是極端值。四分位距(interquartile range,IQR)是數(shù)據(jù)集中第3個(gè)和第1個(gè)四分位數(shù)之

51、差:IQR=Q3-Q1。IQR代表包括中間50%數(shù)據(jù)的區(qū)間長度。其他情況不變,四分位距越大則表示數(shù)據(jù)離散度越大。)3.7.2平均絕對(duì)偏差離散度的度量指標(biāo)可以利用分布中所有的觀測(cè)值來進(jìn)行計(jì)算,而不是僅僅使用最大和最小值。但問題是我們應(yīng)該如何來度量離散度呢?我們最初關(guān)于算術(shù)平均數(shù)的討論中介紹了離開均值的距離或偏差的概念,并將其作為統(tǒng)計(jì)學(xué)中使用的一個(gè)基本信息。我們可以通過考察偏離均值偏差的算術(shù)平均來計(jì)算出度量數(shù)據(jù)離散度的指標(biāo),但是在這過程中我們遇到一個(gè)問題:偏離均值的偏差之和總是等于0。如果我們計(jì)算偏差的平均數(shù)的話,這個(gè)結(jié)果將同樣為0。因此,我們需要尋找一個(gè)將負(fù)的偏差值從正的偏差值中除去的方法。一種

52、方法為考察偏離均值的絕對(duì)偏差,以計(jì)算出平均絕對(duì)偏差值。平均絕對(duì)偏差計(jì)算公式(mean absolute deviation formula)。對(duì)于一個(gè)樣本的平均絕對(duì)偏差(mean absolute deviation,MAD)為:式中,X-表示樣本均值;n表示樣本中觀測(cè)值的數(shù)目。在計(jì)算MAD中,我們忽略了偏離均值偏差的符號(hào)。例如,如果Xi=-11.0且=4.5,差別的絕對(duì)值為。平均絕對(duì)偏差由于利用樣本中所有的觀測(cè)值,所以其比極差更適合作為度量離散度的指標(biāo)。MAD的一個(gè)技術(shù)性缺陷在于它相對(duì)于我們下面介紹的度量指標(biāo)方差,在數(shù)學(xué)上難以處理。(在一些分析性的工作中(如最優(yōu)化),對(duì)于微分的可積運(yùn)算是重要

53、的。方差可以作為一個(gè)可微函數(shù),而絕對(duì)值卻不行。)例3-10舉例介紹了如何利用極差和平均絕對(duì)偏差來對(duì)于風(fēng)險(xiǎn)進(jìn)行度量。例3-10 極差和平均絕對(duì)偏差例3-7中我們已經(jīng)計(jì)算出了兩家共同基金的平均收益率。現(xiàn)在分析師們將對(duì)于它們的風(fēng)險(xiǎn)進(jìn)行評(píng)估。基于表3-15中所給出的數(shù)據(jù),回答下列問題:(1)計(jì)算(A)SLASX和(B)PRFDX年收益率的極差,并基于所得極差說明哪一個(gè)共同基金的風(fēng)險(xiǎn)更大。(2)計(jì)算(A)SLASX和(B)PRFDX年收益率的平均絕對(duì)偏差,并基于所得的MAD說明哪一個(gè)共同基金的風(fēng)險(xiǎn)更大。解:(1)A.對(duì)于SLASX,最大收益率為20.3%,最小收益率為-17.0%。因此,極差為20.3-

54、(-17.0)=37.3%。B.對(duì)于PFRDX,極差為13.1-(-13.0)=26.1%。由于與PRFDX相比,SLASX有更大的收益率極差,因此,SLASX在19982002年間是風(fēng)險(xiǎn)更大的基金。(2)A.在例3-7中所計(jì)算出的SLASX算術(shù)平均收益率為3.54%。故SLASX收益率的平均絕對(duì)偏差值為B.在例3-7中所計(jì)算出的PRFDX算術(shù)平均收益率為2.94%。故PRFDX收益率的平均絕對(duì)偏差值為SLASX的MAD為14.1%,故其要比具有6.9%MAD的PRFDX的風(fēng)險(xiǎn)更大。3.7.3總體方差和總體標(biāo)準(zhǔn)差平均絕對(duì)偏差通過對(duì)于偏差值取絕對(duì)值再求和的方法,解決了偏離均值的偏差值之和為0的問

55、題。而第2種解決該問題的方法是將偏差值進(jìn)行平方。基于偏差值平方的方差和標(biāo)準(zhǔn)差就是兩個(gè)應(yīng)用最為廣泛的度量離散度的指標(biāo)。方差定義為一個(gè)隨機(jī)變量與其均值偏差平方的平均值。標(biāo)準(zhǔn)差為方差正的平方根。下面我們對(duì)于方差和標(biāo)準(zhǔn)差的計(jì)算和應(yīng)用進(jìn)行討論。總體方差如果我們知道總體中的每一個(gè)元素,那么我們就可以計(jì)算出總體方差的值??傮w方差是偏離均值偏差平方的算術(shù)平均數(shù),我們用符號(hào)2來表示。總體方差計(jì)算公式(population variance formula)。總體方差(population variance)為式中,表示總體均值,而N表示總體的規(guī)模。如果給定總體均值,我們可以利用式(3-11)來計(jì)算偏離均值偏差的

56、平方和(這里,考慮了總體中所有N項(xiàng)),然后通過將平方和除以N來求得平均平方偏差。無論偏離均值的數(shù)值為正還是為負(fù),偏差的平方總是一個(gè)正數(shù)。因此,方差通過對(duì)于偏差進(jìn)行平方的操作,解決了偏離均值偏差中存在的負(fù)數(shù)的問題。之前給出的BJ、COST和WMT的市盈率分別為16.73、22.02和29.30。我們所算出的市盈率均值為22.68。因此,市盈率的總體方差為(1/3)(16.73-22.68)2+(22.02-22.68)2+(29.30-22.68)2=(1/3)((-5.95)2+(-0.66)2+(6.62)2)=(1/3)(35.4025+0.4356+43.8244)=(1/3)(79.6

57、625)=26.5542。總體標(biāo)準(zhǔn)差因?yàn)榉讲钍且詥挝坏钠椒竭M(jìn)行計(jì)量的,我們需要尋找一個(gè)將其回復(fù)到原來單位的方法。我們可以利用標(biāo)準(zhǔn)差,即方差的平方根來解決這個(gè)問題。標(biāo)準(zhǔn)差比起方差更加容易解釋,因?yàn)闃?biāo)準(zhǔn)差所用的度量單位與觀測(cè)值是相同的。總體標(biāo)準(zhǔn)差計(jì)算公式(population standard deviation formula)。總體標(biāo)準(zhǔn)差(population standard deviation)定義為總體方差的正的平方根,具體為:式中,表示總體均值,N表示總體的規(guī)模。利用BJ、COST和WMT市盈率的例子,由式(3-12),我們可以得到方差為26.5542。接著我們對(duì)其求平方根:或者約為5

58、.2。總體方差和總體標(biāo)準(zhǔn)差都是分布參數(shù)的例子。在后面的章節(jié)中,我們將會(huì)介紹作為風(fēng)險(xiǎn)度量指標(biāo)的方差和標(biāo)準(zhǔn)差的概念。在投資活動(dòng)中,我們經(jīng)常不知道所研究總體的均值,因?yàn)槲覀円话銦o法從總體中識(shí)別出每個(gè)元素或者對(duì)每一個(gè)元素進(jìn)行計(jì)算。于是,我們需要通過從總體中抽取出的樣本均值來對(duì)于總體均值進(jìn)行估計(jì)。我們可以利用與式(3-11)和式(3-12)不同的公式來計(jì)算出樣本方差和樣本標(biāo)準(zhǔn)差。我們將在之后的幾節(jié)中對(duì)這些計(jì)算方法進(jìn)行討論。然而,在投資活動(dòng)中,有時(shí)我們有一個(gè)定義良好的可以被視為總體的組類。對(duì)于良好定義的總體,我們就可以使用式(3-11)和式(3-12)來進(jìn)行相應(yīng)計(jì)算,具體如例3-11所示。例3-11 計(jì)算

59、總體標(biāo)準(zhǔn)差表3-20給出了組成2002年福布斯雜志榮譽(yù)榜的10家美國股票型基金的年度投資組合換手率。(福布斯雜志每年會(huì)選擇出滿足其榮譽(yù)榜特定標(biāo)準(zhǔn)的美國股票型共同基金。該標(biāo)準(zhǔn)與資本保值(在熊市中的表現(xiàn))、管理持續(xù)性(基金必須聘用一個(gè)基金經(jīng)理不少于6年),投資分散化程度,可投資性(不滿足該要求的基金是指已經(jīng)對(duì)于新投資者關(guān)閉的基金)和稅后長期業(yè)績表現(xiàn)有關(guān)。)投資組合換手率是一個(gè)度量交易活動(dòng)的指標(biāo),其值為一年中銷售值和購買值中的最小者除以該年的平均凈資產(chǎn)。福布斯榮譽(yù)榜上的數(shù)據(jù)和基金名稱每年都會(huì)發(fā)生變化。基于表3-20中的數(shù)據(jù),回答下述問題:(1)利用2002年福布斯榮譽(yù)榜中的10大基金數(shù)據(jù),計(jì)算區(qū)間投

60、資組合換手率的總體均值。(2)計(jì)算投資組合換手率的總體方差和總體標(biāo)準(zhǔn)差。(3)解釋本例中總體公式的使用原因。解:(1)(2)在=20.7的基礎(chǔ)上,我們可以計(jì)算。我們先計(jì)算表達(dá)式中的分子,再將其除以N=10。分子(偏離均值偏差的平方和)為(23-20.7)2+(8-20.7)2+(11-20.7)2+(18-20.7)2+(56-20.7)2+(29-20.7)2+(23-20.7)2+(13-20.7)2+(16-20.7)2+(10-20.7)2=1784.1因此,為了計(jì)算標(biāo)準(zhǔn)差(方差的單位是百分比的平方,因此標(biāo)準(zhǔn)差的單位是百分比。)(3)如果總體明確地定義為在特定一年(2002)福布斯榮譽(yù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論