CH9統(tǒng)計(jì)決策-貝葉斯推理研究綜述_第1頁(yè)
CH9統(tǒng)計(jì)決策-貝葉斯推理研究綜述_第2頁(yè)
CH9統(tǒng)計(jì)決策-貝葉斯推理研究綜述_第3頁(yè)
CH9統(tǒng)計(jì)決策-貝葉斯推理研究綜述_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、貝葉斯推理研究綜述張向陽(yáng)、劉鳴 摘自心理科學(xué)進(jìn)展2002 ( 4 )人們根據(jù)不確定性信息作出推理和決策需要對(duì)各種結(jié)論的概率作出估計(jì),這類(lèi)推理稱(chēng)為 概率推理。概率推理既是概率學(xué)和邏紺學(xué)的研究對(duì)彖,也是心理學(xué)的研究對(duì)彖,但研究的角 度是不同的。概率學(xué)和邏輯學(xué)研究的是客觀概率推算的公式或規(guī)則;而心理學(xué)研究人們主觀 概率估計(jì)的認(rèn)知加工過(guò)程規(guī)律。貝葉斯推理的問(wèn)題是條件概率推理問(wèn)題,這一領(lǐng)域的探討対 揭示人們對(duì)概率信息的認(rèn)知加工過(guò)程與規(guī)律、指導(dǎo)人們進(jìn)行有效的學(xué)習(xí)和判斷決策都具有十 分垂要的理論意義和實(shí)踐童義。一、什么是貝葉斯推理現(xiàn)舉一個(gè)心理學(xué)研究中常被引用的例子來(lái)說(shuō)明:參加常規(guī)檢杳的40歲的婦女患乳腺癌的

2、概率是1%。如果一個(gè)婦女有乳腺癌,則她有 80%的概率將接受早期胸部腫瘤x射線檢查。如果一個(gè)婦女沒(méi)佇患乳腺癌,也有9.6%的概 率將接受早期胸部腫瘤x射線測(cè)定法檢查。在這一年齡群的常規(guī)檢查中某婦女接受了早期 胸部腫瘤x射線測(cè)定法檢査。問(wèn)她實(shí)際患乳腺癌的概率是多大?設(shè)hf, 11 =乳腺癌,h, 2=非乳腺癌,a=早期胸部腫瘤x射線檢查(以下簡(jiǎn)稱(chēng)“x 射線檢查”),已 知 p(h, 1 )=!%, p(h, 2)=99%, p(a/h, l)=8o%, p(a/h, 2)=9.6%, 求 p(h, 1/a)o 根據(jù)貝葉斯定理,p(h, 1 /a)=( 1 %)(8o%)/( 1 %)(80%)+

3、(99%)(9.6%)=0.078心理學(xué)家所關(guān)心的是,一個(gè)不懂貝葉斯原理的人對(duì)上述問(wèn)題進(jìn)行直覺(jué)推理時(shí)的情形是怎 樣的,并將他們的判斷結(jié)果與貝葉斯公式計(jì)算的結(jié)果做比較來(lái)研究推理過(guò)程的規(guī)律。因此佇 關(guān)這類(lèi)問(wèn)題的推理被稱(chēng)為貝葉斯推理。二、貝葉斯推理研究概況(-)基礎(chǔ)概率忽略現(xiàn)象的發(fā)現(xiàn)與爭(zhēng)論kahneman和tversky開(kāi)辟了概率推理這一重要的研究領(lǐng)域。他們?cè)?()世紀(jì)7()年代初 期的研究首先發(fā)現(xiàn),人們的直覺(jué)概率推理并不遵循貝葉斯原理,表現(xiàn)在判斷中往往忽略問(wèn)題 中的基礎(chǔ)概率信息,而主要根據(jù)擊中率信息作出判斷。他們一個(gè)經(jīng)典性的研究是:告知被試 100人中有70人是律師,30人是工程師,從中隨機(jī)選出一

4、人,當(dāng)把該人的個(gè)性特征描述得 象工程師時(shí),被試判斷該人為工程師的概率接近0.90o顯然被試忽略了工程師的基礎(chǔ)概率只 有30%后來(lái)他們還采用多種問(wèn)題驗(yàn)證基礎(chǔ)概率忽略現(xiàn)象,如讓被試解決如下出租車(chē)問(wèn)題: 一個(gè)城市85%的出租車(chē)屬丁綠車(chē)公司,15%屬于藍(lán)車(chē)公司,現(xiàn)有一出租車(chē)卷入肇事逃逸事件, 根據(jù)一忖擊者確認(rèn),肇事千屬于藍(lán)車(chē)公司,廿擊者的可靠性為80%。問(wèn)肇事車(chē)是藍(lán)千的概 率是多少。結(jié)果大多數(shù)被試判斷為80%,但如果考慮基礎(chǔ)概率則應(yīng)是41%o這一研究結(jié)果引發(fā)了 20世紀(jì)70年代以來(lái)的大量研究。有研究支持其結(jié)論,如eddy用 前述乳腺癌問(wèn)題讓內(nèi)科醫(yī)生判斷,結(jié)果95%的人判斷介于70%80%,圈 于7.8

5、%ocasscells 等人的研究結(jié)果表明,即使哈佛i矢學(xué)院的工作人員對(duì)解決如乳腺癌和與之相類(lèi)似的問(wèn)題都出 現(xiàn)同樣的偏差。但也有研究發(fā)現(xiàn),在許多條件下,被試對(duì)基礎(chǔ)概率的反應(yīng)是敏感的。例如,如果問(wèn)題的 措辭強(qiáng)調(diào)要理解基礎(chǔ)概率與判斷的相關(guān)性或強(qiáng)調(diào)事件是隨機(jī)抽樣的,則基礎(chǔ)概率忽略現(xiàn)象就 會(huì)減少或消除。另一個(gè)引人注意的是gigerenzer和hoffrage 1995年的研究,他們強(qiáng)調(diào)概率信 息形式對(duì)概率判斷的影響。采用15個(gè)類(lèi)似前述乳腺癌的文本問(wèn)題進(jìn)行了實(shí)驗(yàn),問(wèn)題的概率 信息用兩種形式呈現(xiàn),一種沿用標(biāo)準(zhǔn)概率形式(百分?jǐn)?shù));一種用口然數(shù)表示的頻率形式, 如“1000名婦女中有10名患有乳腺癌,在患有乳

6、腺癌的婦女中8名婦女接受早期胸部x射 線測(cè)定法檢查,衣沒(méi)有患乳腺癌的990名婦女中有95名接受早期胸部x射線測(cè)定法檢查”。 結(jié)果在頻率形式條件下,接近50%的判斷符合貝葉斯算法,而在標(biāo)準(zhǔn)概率條件下只有20% 的判斷符合貝葉斯算法。而另一些研究者對(duì)此也提出異議,右人認(rèn)為他們?cè)诟淖冃畔⑿问降牟僮麇?,同時(shí)也改變 了其他的變量。如lewis和keren提出這種概率信息的改變使原來(lái)的一般性問(wèn)題變成了當(dāng)前 單個(gè)情境的具體問(wèn)題,因而問(wèn)題變得容易,被試判斷的改善不能說(shuō)明他們的訃算與貝葉斯計(jì) 算一致。另外fiedler認(rèn)為,他們進(jìn)行頻率形式的操作為所有數(shù)據(jù)提供了一個(gè)共同的參照尺 度即所有數(shù)據(jù)都是相對(duì)于總體(10

7、0()名婦女)而言的,依靠它所有的數(shù)據(jù)變得容易比 較。很明顯,接受x射線檢查并患乳腺癌的婦女的數(shù)量(8)與接受x射線檢查并無(wú)乳腺癌的 婦女的數(shù)量(95)相比或與接受x射線檢查的婦女總數(shù)(103)相比都是非常小的。相反,在標(biāo) 準(zhǔn)概率條件下,沒(méi)有共同的參照尺度,表面上擊中率(80%)遠(yuǎn)高于誤報(bào)率(9.6%),但它們是 相對(duì)于大小不同的亞樣本,而不是相對(duì)于總體,不能在同一尺度上進(jìn)行數(shù)量比較。于是他們 用4個(gè)問(wèn)題進(jìn)行了 2(數(shù)據(jù)比較尺度:共同尺度/非共同尺度)x2(數(shù)據(jù)形式:標(biāo)準(zhǔn)概率/ 頻率)的被試間設(shè)計(jì),實(shí)驗(yàn)結(jié)果表明:不管采用哪一種數(shù)據(jù)形式,被試在非共同參照尺度條 件下,判斷準(zhǔn)確性都低,在共同參照尺

8、度下,判斷準(zhǔn)確性高。所以判斷準(zhǔn)確性與數(shù)據(jù)形式無(wú) 關(guān)。對(duì)見(jiàn),人們?cè)诟怕逝袛嘀泻雎曰A(chǔ)概率是不是一種普遍現(xiàn)彖,不同的研究z間存在較大 分歧。這將促使研究者們采川各種方法對(duì)人們的概率判斷推理過(guò)程進(jìn)行更深入的探討。(-)貝葉斯推理問(wèn)題的研究范式為了探討上述問(wèn)題,人們采用了不同的研究范式。從已有的研究看,貝葉斯推理的研究 范式主要有兩種,一種是文木范式,一種是經(jīng)驗(yàn)范式。文本范式是實(shí)驗(yàn)中的問(wèn)題以文木的形式直接提供各事件的基礎(chǔ)概率和擊中率、誤報(bào)率等 信息,讓被試對(duì)某一出現(xiàn)的事件作出概率大小的判斷。如詢(xún)述的乳腺癌問(wèn)題,工程師問(wèn)題, 出租車(chē)問(wèn)題等的研究就是采用這一范式。然而,在實(shí)際?;钪?,人們進(jìn)行概率判斷需要從

9、口己經(jīng)歷過(guò)的事件中搜集信息,而不是 像文本范式那樣被動(dòng)得到這些信息。經(jīng)驗(yàn)范式使克服了文本范式的這-缺陷。經(jīng)驗(yàn)范式就是 在實(shí)驗(yàn)中止被試通過(guò)經(jīng)丿力事件過(guò)程,主動(dòng)搜集信息來(lái)獲得基礎(chǔ)概率、擊中率和謀報(bào)率等各種 情況的信息,然后作出概率判斷。例如,lovett和schunn為了探討基礎(chǔ)概率信息和特殊信息對(duì)被試解決問(wèn)題策略的影響, 利用建筑棒任務(wù)(building stick task, bst)進(jìn)行了實(shí)驗(yàn)設(shè)計(jì)。對(duì)于一個(gè)給定的bst問(wèn)題來(lái) 說(shuō),計(jì)算機(jī)屏幕下方提供3條不同長(zhǎng)度(長(zhǎng)、中、短)的建筑棒并在上方顯示一條一定長(zhǎng)度 的口標(biāo)棒,要求被試用建筑棒通過(guò)加法(中棒+短棒)策略或減法(長(zhǎng)一中或短棒)策略制 造h

10、標(biāo)棒。被試只能憑視覺(jué)估計(jì)每條棒的長(zhǎng)度,迫使他們不能用代數(shù)方法而只能川策略嘗試 來(lái)解決問(wèn)題?;A(chǔ)概率是兩種策略解決問(wèn)題的基本成功率;特殊信息是建筑棒為日標(biāo)棒的接 近類(lèi)型對(duì)選擇策略的暗示性和所選策略成功的預(yù)見(jiàn)性:長(zhǎng)棒接近日標(biāo)棒則暗示使用減法策 略,中棒接近目標(biāo)棒則暗示使用加法策略,如果暗示性策略成功表明該策略具有預(yù)見(jiàn)性,否 則為非預(yù)見(jiàn)性。問(wèn)題設(shè)計(jì)時(shí),在200個(gè)任務(wù)中控制兩種策略基本成功率(偏向:一策略髙(如 70%),另一策略低(如30%);無(wú)偏向:兩策略各50%)和暗示性策略對(duì)成功預(yù)見(jiàn)性的比例 (有預(yù)見(jiàn)性:暗示性和非喑示性策略成功率分別為80%和20%;無(wú)預(yù)見(jiàn)性:暗示性和非暗 示性策略成功率各5

11、0%)o研究者對(duì)被試在嘗試上述任務(wù)前后分別用10個(gè)建筑棒任務(wù)進(jìn)行 了測(cè)試,發(fā)現(xiàn)被試在嘗試前主要根據(jù)特殊信息選擇策略,在嘗試后主要依據(jù)兩種策略的基本 成功率信息選擇策略。說(shuō)明人們?cè)趪L試200個(gè)任務(wù)后對(duì)嘗試中的基礎(chǔ)概率信息的反映是敏感 的。經(jīng)驗(yàn)范式的優(yōu)點(diǎn)在于,實(shí)驗(yàn)操作過(guò)程非常接近人們?cè)谌粘I钪蝎@得概率信息以作出判 斷的情況,較為真實(shí)地反映了人們實(shí)際的表征信息和作出概率判斷的過(guò)程。所以許多研究者 采用了這一范式。但研究范式的變化并沒(méi)右能消除前述的爭(zhēng)論,在不同的研究范式下都存在人們對(duì)基礎(chǔ)概 率信息的忽略或敏感現(xiàn)象,并出現(xiàn)了各種對(duì)基礎(chǔ)概率信息忽略或敏感現(xiàn)象進(jìn)行解釋的理論。三、幾種主要理論如前所述,人們

12、進(jìn)行概率判斷時(shí),在一些條件下忽略基礎(chǔ)概率,在另一些條件下并沒(méi)有 忽略基礎(chǔ)概率。那么,人們是如何作出判斷的呢?哪些因素在影響人們的概率推理呢?對(duì)此, 不同的研究者提出了不同的觀點(diǎn)。(一)啟發(fā)法策略論kahneman和tversky認(rèn)為人們直覺(jué)的概率推理受認(rèn)知策略的影響,這是一種依賴(lài)丁經(jīng) 驗(yàn)的判斷或猜測(cè)。所以,經(jīng)常會(huì)作出錯(cuò)誤的判斷。主要的認(rèn)知策略包括“代衣性啟發(fā)法''和“可 得性啟發(fā)法s代表性啟發(fā)法是指人們傾向于根據(jù)樣本是否代表或類(lèi)似總體來(lái)判斷其出現(xiàn)的概率,愈有 代表性的,被判斷為出現(xiàn)的概率愈大,愈少代表性的被判斷為出現(xiàn)的概率愈小。例如,在他 們的研究中,要求被試估計(jì)某城市有6個(gè)孩

13、子的家庭中,男(b)女(g)兒童出生順序?yàn)?gbgbbg和bgbbbb (b代表男孩,g代表女孩)的比例,結(jié)果大多數(shù)被試估計(jì)前者遠(yuǎn)高 于后者3。因?yàn)榍罢吒艽碚麄€(gè)人口中的比例,其次它看起來(lái)更隨機(jī)。但從機(jī)會(huì)來(lái)說(shuō), 兩者的概率應(yīng)是相等的??傻眯詥l(fā)法是指人們傾向于根據(jù)某現(xiàn)彖在知覺(jué)或記憶中容易得到的事例來(lái)估計(jì)其出 現(xiàn)是概率,如他們?cè)趯?shí)驗(yàn)中要求被試估計(jì)英語(yǔ)中以字母r、l、n、k、v開(kāi)頭的單詞數(shù)和以 它們?yōu)榈谌齻€(gè)字母的單詞數(shù),結(jié)果絕大部分被試估計(jì)前者遠(yuǎn)多于后者。但實(shí)際上前者是的基 礎(chǔ)比例遠(yuǎn)低于后者的基礎(chǔ)比例。判斷錯(cuò)誤的原因在于人們更容易冋憶出以這些字母開(kāi)頭的單 詞,而不容易冋憶起它們?cè)谥虚g位置的單詞。

14、這與人們的記憶組織有關(guān)。(-)自然抽樣空間假說(shuō)gavanski等認(rèn)為判斷一個(gè)事件出現(xiàn)的概率時(shí),人們從什么范圍抽取一樣本有一種自然的 抽樣傾向,他們稱(chēng)之為“自然抽樣空間”,如果直接從白然的抽樣空間中抽取的樣本対判斷事 件的概率是無(wú)偏差的,則被試容易作出準(zhǔn)確的判斷;但若要求被試從非白然抽樣空間中抽樣 才能正確判斷事件的概率,則被試容易作出錯(cuò)謀的判斷。如前述乳腺癌問(wèn)題,被試從患乳腺 癌的人群中抽樣來(lái)判斷接受x射線檢查的概率較為白然,因?yàn)楸辉嚫菀渍J(rèn)為患乳腺癌的 人耍接受x射線檢杳。但實(shí)驗(yàn)任務(wù)是要求從接受x射線的人群中抽樣來(lái)判斷患乳腺癌的概 率,這與被試的口然抽樣方向相反,導(dǎo)致被試對(duì)問(wèn)題進(jìn)行了錯(cuò)誤的表

15、征,對(duì)照貝葉斯公式, 被試的錯(cuò)誤是把p(h, 1/a)表征為p(a/h, 1),剛好與問(wèn)題的要求相反,從而作出了錯(cuò) 誤的判斷。(三)頻率效應(yīng)論gigerenzer和hoff rage同意自然抽樣的觀點(diǎn),但他們所指的“自然”是人們加工概率信息 的自然方式,認(rèn)為人們是通過(guò)事件的頻率而不是標(biāo)準(zhǔn)概率(百分?jǐn)?shù))來(lái)獲得環(huán)境信息的,雖 然兩種信息形式的意義相同,但人們對(duì)具有同等意義的不同外部信息形式會(huì)產(chǎn)生不同的心理 表征。他從進(jìn)化論的角度出發(fā)認(rèn)為,人類(lèi)進(jìn)行概率推理已經(jīng)進(jìn)化了一種認(rèn)知算法規(guī)則系統(tǒng), 它不適合加工以百分?jǐn)?shù)表示的標(biāo)準(zhǔn)概率信息,而適合加工以口然數(shù)表示的頻率信息,因?yàn)闃?biāo) 準(zhǔn)概率是在概率論發(fā)展以后才被人

16、們認(rèn)識(shí)的,而頻率在人類(lèi)進(jìn)化的早期就被認(rèn)識(shí)了,所以人 們對(duì)事件的頻率容易編碼而且兒乎是口動(dòng)的,而對(duì)標(biāo)準(zhǔn)概率難于編碼。因此,它們預(yù)言當(dāng)問(wèn) 題的陳述從標(biāo)準(zhǔn)概率形式轉(zhuǎn)變?yōu)轭l率形式時(shí),對(duì)條件概率的直覺(jué)推理會(huì)得到顯著改善,并在 前述的他們的實(shí)驗(yàn)中得到了支持。如果被試在判斷中是忽略基礎(chǔ)概率的,那么在標(biāo)準(zhǔn)概率改 為頻率形式時(shí)也應(yīng)表現(xiàn)出來(lái),但他們的實(shí)驗(yàn)表明加工頻率信息的被試判斷的準(zhǔn)確性明顯高于 加工標(biāo)準(zhǔn)概率信息的被試。然血,止如前血所述,他們的結(jié)論也受到其他研究的挑戰(zhàn)。(四)抽樣加工理論fiedler認(rèn)為對(duì)概率判斷最根本的影響既不是抽樣方向也不是概率信息形式,而是抽取 不同樣本所得的數(shù)據(jù)需要進(jìn)行不同的認(rèn)知加工。

17、概率判斷中的認(rèn)知加工分為兩個(gè)過(guò)程,一是 歸納加工過(guò)程,即利用記憶中或知覺(jué)到的樣木進(jìn)行的概率估計(jì),如旅行前根據(jù)自c的經(jīng)驗(yàn)估 計(jì)某個(gè)地區(qū)為晴天或雨天的概率。然而,由于受許多主觀(如個(gè)人偏好、期望等)和客觀條 件(如過(guò)去的經(jīng)驗(yàn)是在一定時(shí)空下獲得的)的限制,根據(jù)可利川的樣木來(lái)估計(jì)概率會(huì)存在許 多潛在的偏差,所以,要作出正確的判斷就必須調(diào)整抽樣過(guò)程中潛在的偏差,這是一個(gè)元認(rèn) 知控制過(guò)程,通過(guò)它,不同來(lái)源的樣本得到整合并運(yùn)川丁最后的概率判斷,這需要運(yùn)用大量 基于規(guī)則的元認(rèn)知操作,包括使用邏輯規(guī)則、概率演算、統(tǒng)計(jì)學(xué)知識(shí)或元認(rèn)知知識(shí)。如變換 在不同尺度上估計(jì)的數(shù)量、顛倒條件概率、對(duì)來(lái)源于有偏差的樣本進(jìn)行矯正等

18、。判斷者z所以忽略基礎(chǔ)概率而不遵循貝葉斯原理,是因?yàn)樗麄內(nèi)狈υJ(rèn)知手段,不能調(diào) 整在抽樣過(guò)程中潛在的偏差。為驗(yàn)證此結(jié)論,他們用4個(gè)問(wèn)題(在此僅以乳腺癌為例)在計(jì) 算機(jī)上設(shè)計(jì)了 a、b兩種卡片盒,分別讓兩組被試口己搜索信息,告知被試a卡片盒的每 張r片止血標(biāo)明是否患有乳腺癌的案例,背曲告知是否參加x射線檢杳,b卡片盒中每張 卡片的止血和背曲與前一個(gè)r片盒的卡片內(nèi)容相反,設(shè)計(jì)時(shí)設(shè)定基礎(chǔ)概率、擊中率和誤報(bào)率。 屏幕的左邊行顯示正面內(nèi)容,右邊小窗口顯示反面內(nèi)容,被試點(diǎn)擊左邊行后才出現(xiàn)右邊窗口 的反饋信息,確認(rèn)后左邊行變成灰色,右邊窗口消失。信息搜索完畢時(shí),屏幕底部顯示一刻 度尺,用于被試標(biāo)示判斷接受x射線檢查的婦女患乳腺癌的概率。這樣,看a卡片盒的被 試明顯覺(jué)得乳腺癌的擊中率高,非乳腺癌

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論