版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)學(xué)文化與思維主講人:吳東靈博弈論劇情回顧
影片中有這樣一個(gè)情節(jié):在美國(guó)普林斯頓大學(xué)的酒吧里,4個(gè)男生正商量著如何去追求一位漂亮女生,當(dāng)時(shí)還正在大學(xué)讀書(shū)的納什卻在朦朧的“博弈論”思維邏輯引導(dǎo)下喃喃自語(yǔ):“如果他們4個(gè)人全部去追求那漂亮女生,那她一定會(huì)擺足架子,誰(shuí)也不睬。然后再去追其他女孩子,別人也不會(huì)接受,因?yàn)闆](méi)人愿意當(dāng)‘次品’。但如果他們先追其他女生,那么漂亮女生就會(huì)感到被孤立,這時(shí)再追她就會(huì)容易得多?!痹诩{什眼里,追求女生就是一場(chǎng)“博弈”,而“博弈”是要遵循一定規(guī)則的,是需要“博弈”策略的。博弈論是什么?博弈論又被稱為對(duì)策論(GameTheory)既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論是研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。它考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。目前已被廣泛運(yùn)用到各個(gè)領(lǐng)域,在經(jīng)濟(jì)學(xué)中取得了尤為突出的發(fā)展。戰(zhàn)爭(zhēng)是怎樣發(fā)生的?
8歲的男孩問(wèn)父親:“爸爸,戰(zhàn)爭(zhēng)是怎樣發(fā)生的?”男孩的父親回答:“很簡(jiǎn)單。比如說(shuō)第一次世界大戰(zhàn)的爆發(fā),是因?yàn)榈聡?guó)入侵比利時(shí)……”在一旁的妻子立即打斷他的話:“你講的不對(duì)。第一次世界大戰(zhàn)的起因是有人在薩拉熱窩被刺殺了?!闭煞蚵?tīng)了一臉不悅,沖妻子不耐煩地說(shuō)道:“是你回答這個(gè)問(wèn)題,還是我回答?”妻子聽(tīng)了也是滿臉的不高興,她轉(zhuǎn)身跑出起居室,砰的一聲將門關(guān)上。緊接著,從廚房里傳出了碗碟猛摔在地上的聲音,過(guò)了一會(huì)兒,整個(gè)屋子陷入死一般沉寂。男孩眼眶里含著淚水,輕聲說(shuō):“爸爸,你不用說(shuō)了,我知道戰(zhàn)爭(zhēng)是怎樣發(fā)生的了."遠(yuǎn)觀博弈論夫妻二人以一種兩敗俱傷的方式,使自己的孩子明白了戰(zhàn)爭(zhēng)的發(fā)生和夫妻兩個(gè)人吵架之間的內(nèi)在關(guān)聯(lián):讓國(guó)家之間一步一步走向世界大戰(zhàn)的機(jī)制,同樣也正是同一屋檐下夫妻失和的原因。也就是說(shuō),無(wú)論是國(guó)與國(guó)之間,還是人與人之間的合作和沖突,其中所蘊(yùn)含的博弈原理是大同小異的。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主奧曼在權(quán)威的《帕爾格雷丈夫辭典》中,對(duì)“博弈論”此條的解釋十分精辟和凝練。他認(rèn)為,博弈論描述性的名稱應(yīng)該是“互動(dòng)的決策論”。因?yàn)槿藗冎g的決策與行為會(huì)形成互為影響的關(guān)系,一個(gè)主體在決策時(shí)必須考慮到對(duì)方的反應(yīng)。博弈的形成博弈的目的是利益,利益形成博弈的基礎(chǔ)。最基本的假設(shè)就是經(jīng)濟(jì)人或理性人的目的就在于使收益最大化。參與博弈者正是為了自身收益的最大化而互相競(jìng)爭(zhēng)。參與博弈的各方形成相互競(jìng)爭(zhēng)、相互對(duì)抗的關(guān)系,以爭(zhēng)得利益的多少來(lái)決定勝負(fù),一定的外部條件又決定了競(jìng)爭(zhēng)和對(duì)抗的具體形式。這樣就形成了博弈。簡(jiǎn)單的案例夫妻倆下班回到家,吃完晚飯想看電視。電視預(yù)報(bào)顯示,一個(gè)頻道會(huì)播放丈夫喜愛(ài)的足球賽,而另一個(gè)頻道會(huì)播放妻子喜愛(ài)的選秀節(jié)目。但是家里只有一臺(tái)電視機(jī)。這樣,圍繞著到底看什么節(jié)目。一場(chǎng)博弈就展開(kāi)了。要素分析在這場(chǎng)博弈中,完整地包含了形成一個(gè)博弈的4個(gè)要素:(1)2個(gè)或2個(gè)以上的參與者(player)。
博弈中必需的條件:不是一個(gè)人在一個(gè)毫無(wú)干擾的環(huán)境中做決策。(2)博弈要有參與各方爭(zhēng)奪的資源或收益(resources/payoff)
資源指的不僅僅是自然資源,還包括了各種社會(huì)資源,如人脈、信譽(yù)、學(xué)歷、職位等。人們之所以參與博弈是受到利益的吸引,將來(lái)所獲得利益的大小直接影響到博弈的吸引力和參與者的關(guān)注程度。
簡(jiǎn)單說(shuō)就是:凡是自己主觀需要的就是資源;相反,主觀不需要的對(duì)自己就不能構(gòu)成資源。這就是“情人眼里出西施”的道理。要素分析(3)參與者有自己能夠選擇的策略(strategy)
通俗地說(shuō),策略就是計(jì)策,是博弈參與者所選擇的手段和方法。制定博弈論中的策略,要先對(duì)局勢(shì)和整體狀況進(jìn)行分析,確定局勢(shì)特征,再找出其中關(guān)鍵因素,最后才進(jìn)行手段選擇。
由此可見(jiàn),博弈論中的策略是牽一發(fā)而動(dòng)全身的,直接對(duì)整個(gè)局勢(shì)造成重大影響。(4)參與者擁有一定量的信息(information)
博弈就是個(gè)人或組織在一定的環(huán)境條件與已定的規(guī)則下,同時(shí)或先后,一次或是多次選擇策略并實(shí)施從而得到某種結(jié)果的過(guò)程。案列分析上述“夫妻博弈”模型大致會(huì)出現(xiàn)三種情況:一是兩人爭(zhēng)執(zhí)不下,于是干脆關(guān)掉電視,誰(shuí)都別看;二是你看足球,我到其他地方看選秀,或你看選秀,我到其他地方看足球;三是其中一方說(shuō)服另一方,兩人同看足球或同看選秀節(jié)目。案例分析夫妻二人通常不會(huì)因?yàn)殡娨暪?jié)目的分歧而分開(kāi)活動(dòng)的。這是研究該問(wèn)題的潛在前提。但是,對(duì)于看什么節(jié)目,雙方又各有偏好。因此我們可以假定:如果丈夫和妻子分開(kāi)活動(dòng),男女雙方的效用為0,如果雙方一起去看球賽,則丈夫的效用為5,而妻子的效用為1;如果雙方一起看選秀,則丈夫的效用為1,妻子的效用為5。案例分析
根據(jù)上述假定夫妻雙方不同選擇的所有結(jié)果及其效用組合如下表。
就是這樣一個(gè)矩陣,可以一目了然地把我們介紹的幾種因素包含在里面。
矩陣是博弈論中用來(lái)描述兩個(gè)或多個(gè)參與人的策略和效用的最常用工具,又被稱為“收益矩陣”或“得益矩陣”。均衡思想
均衡可以說(shuō)是博弈論中最重要的思想之一,但是卻并不復(fù)雜。我們可以用描述法來(lái)加以定義:在博弈達(dá)到均衡時(shí),局中的每一個(gè)博弈者都不可能因?yàn)閱畏矫娓淖冏约旱牟呗远黾邮找妫谑歉鞣綖榱俗约豪娴淖畲蠡x擇了某種最優(yōu)策略,并與其他對(duì)手達(dá)成了某種暫時(shí)的平衡。在外界環(huán)境沒(méi)有變化的情況下,倘若各方堅(jiān)持原有的利益最大化原則并理性面對(duì)現(xiàn)實(shí),那么這種平衡狀況就能夠長(zhǎng)期保持穩(wěn)定。納什均衡
在所有的均衡中,“納什均衡”又是一個(gè)基礎(chǔ)性的概念。簡(jiǎn)單地說(shuō),所謂“納什均衡”就是所有人的選擇綜合在一塊,不一定所有選擇都能實(shí)現(xiàn)最大化原則,但能使所有人都達(dá)到最大化的均衡狀態(tài)。
納什均衡是一種最常見(jiàn)的均衡。在納什均衡點(diǎn)上,每個(gè)參與者的策略是最好的,此時(shí)沒(méi)有人愿意先改變或主動(dòng)改變自己的策略。也就是說(shuō)此時(shí)如果他改變策略,他的收益將會(huì)降低,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。納什均衡不僅要求所有的博弈參與人都是理性的,而且要求每個(gè)參與人都了解所有其他參與人也都是理性的。需要注意的是,博弈的結(jié)果并不都能成為均衡。博弈的均衡是穩(wěn)定的,因此可以預(yù)測(cè)。輕松一刻在斯大林時(shí)代的蘇聯(lián),一位樂(lè)隊(duì)指揮坐火車前往下一個(gè)演出地點(diǎn)。正當(dāng)他在車上翻看當(dāng)晚就要指揮演奏的作品樂(lè)譜時(shí),兩名克格勃(KGB,蘇聯(lián)國(guó)家安全警察,實(shí)際是政治特務(wù))將他作為間諜逮捕了。他們以為那樂(lè)譜是某種密碼。這位樂(lè)隊(duì)指揮爭(zhēng)辯說(shuō)那只是柴可夫斯基的小提琴協(xié)奏曲,根本無(wú)濟(jì)于事。在樂(lè)隊(duì)指揮被投入牢房的第二天,審問(wèn)者自鳴得意地走進(jìn)來(lái)說(shuō):“我看你最好還是老實(shí)招了吧,我們已經(jīng)抓住你的朋友柴可夫斯基了。他這會(huì)兒正向我們交代呢。你如果再不招就槍斃了你。如果交代了,只判你10年。”經(jīng)典模型之一:囚徒困境模型
1950年,擔(dān)任斯坦福大學(xué)客座教授的數(shù)學(xué)家圖克(Tucker),給一些心理學(xué)家解釋他正在研究的完全信息靜態(tài)博弈問(wèn)題。為了更形象地說(shuō)明博弈過(guò)程,他用兩個(gè)犯罪嫌疑人的故事構(gòu)造了一個(gè)博弈模型,即“囚徒困境模型”。
這一模型的過(guò)程具體是這樣的:囚徒困境模型兩個(gè)共同偷竊的犯罪嫌疑人甲和乙被帶進(jìn)警察局。警方對(duì)兩名犯罪嫌疑人實(shí)行隔離關(guān)押,隔離審訊,每個(gè)犯罪嫌疑人都無(wú)法觀察到同伴的選擇。警方懷疑他們作案,但手中并沒(méi)有掌握確鑿證據(jù),于是明確地分別告知兩名犯罪嫌疑人,對(duì)他們犯罪事實(shí)的認(rèn)定及相應(yīng)的罪刑完全取決于他們自己的供認(rèn)。警方提出條件如下:囚徒困境模型分析
兩名囚徒面臨的選擇及其帶來(lái)的后果組合用收益矩陣表示如下:哪一種選擇對(duì)犯罪嫌疑人更有利呢?囚徒困境模型分析
從上表中可以知道:每個(gè)犯罪嫌疑人都有兩種可供選擇的策略:供認(rèn)或抵賴。而且,每個(gè)犯罪嫌疑人選擇的最優(yōu)策略不依賴于其同伙的策略選擇。如果甲選擇抵賴,那么就可能會(huì)出現(xiàn)兩種情況:如果乙選擇供認(rèn),那么甲將被加重懲罰,判刑10年,而乙則無(wú)罪釋放;如果乙也同樣選擇抵賴,那么他們兩個(gè)都將因證據(jù)不足而被釋放。很顯然,這第二種結(jié)果對(duì)于兩個(gè)人都是最有利的。但是,因?yàn)榫經(jīng)]有把兩名嫌疑人放在一間囚室里,因而這種合作難以順利進(jìn)行,使得結(jié)果預(yù)測(cè)的不確定性加大,或者說(shuō)增加了抵賴合作的風(fēng)險(xiǎn)性。
因此,基于人是理性的這一前提。由于犯罪嫌疑人不知道對(duì)方的想法,最理性的博弈策略,就是選擇供認(rèn)。這時(shí)的策略,我們可以稱為占優(yōu)策略。占優(yōu)策略與劣勢(shì)策略
而如果所有參與人都有占優(yōu)策略存在,那么博弈將在所有參與人的占優(yōu)策略的基礎(chǔ)上達(dá)到均衡,這種均衡稱為占優(yōu)策略均衡。在囚徒困境中,“甲供認(rèn),乙供認(rèn)”就是占優(yōu)策略均衡,因?yàn)椴还芗滓覂扇苏l(shuí)供認(rèn),都將得到減輕懲罰的結(jié)果:如果甲供認(rèn)了,乙抵賴。甲將免于懲罰,如果乙也供認(rèn)了,那么罪名各擔(dān)一半,從甲個(gè)人看來(lái),也減輕了懲罰;甲乙互換位置,結(jié)果依然是一樣。顯然,這一策略是一個(gè)占優(yōu)策略。
與占優(yōu)策略相對(duì)應(yīng),劣勢(shì)策略則是指在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對(duì)自己嚴(yán)格不利的策略。
有一個(gè)要注意的問(wèn)題是,采用優(yōu)勢(shì)策略得到的最壞結(jié)果,并不一定比采用其他策略得到的最佳結(jié)果要好。應(yīng)該說(shuō),參與人采用優(yōu)勢(shì)策略時(shí),無(wú)論對(duì)方采取任何策略總能夠顯示出優(yōu)勢(shì)。聰明還是不聰明??jī)蓚€(gè)旅行者從一個(gè)出產(chǎn)細(xì)瓷花瓶的地方回來(lái),都買了花瓶??墒翘崛⌒欣畹臅r(shí)候,發(fā)現(xiàn)花瓶被摔壞了。于是。他們向航空公司索賠。航空公司知道花瓶的價(jià)格總在八九十元上下浮動(dòng),但是不知道兩位旅客買的確切價(jià)格是多少。于是,航空公司請(qǐng)兩位旅客在100元以內(nèi)自己寫(xiě)下花瓶的價(jià)格。如果兩人寫(xiě)的一樣,航空公司將認(rèn)為他們講的是真話,并按照他們寫(xiě)的數(shù)額賠償;如果兩人寫(xiě)的不一樣,航空公司就論定寫(xiě)得低的旅客講的是真話,并且照這個(gè)低的價(jià)格賠償。但是對(duì)講真話的旅客獎(jiǎng)勵(lì)10元錢,對(duì)講假話的旅客罰款10元。為了獲取最大賠償,甲乙兩位旅客最好的策略就是都寫(xiě)100元,這樣兩人都能夠獲賠100元。可是甲很聰明,他想:如果我少寫(xiě)1元變成99元,而乙會(huì)寫(xiě)100元,這樣我將得到109元。何樂(lè)而不為?所以他準(zhǔn)備寫(xiě)99元。可是乙更加聰明,他算計(jì)到甲要算計(jì)自己而寫(xiě)99元?!叭瞬环肝遥也环溉?,人若犯我,我必犯人”,于是他準(zhǔn)備寫(xiě)98元。想不到甲又聰明一層,算計(jì)出乙要這樣寫(xiě)98元來(lái)坑他,“來(lái)而不往非禮也”,他準(zhǔn)備寫(xiě)97元…
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度專業(yè)版私人二手房購(gòu)買協(xié)議3篇
- 2024-2030年中國(guó)大豆水解蛋白市場(chǎng)現(xiàn)狀分析及前景趨勢(shì)預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)城市地下管線探測(cè)行業(yè)需求趨勢(shì)預(yù)測(cè)發(fā)展規(guī)劃研究報(bào)告
- 2024-2030年中國(guó)垃圾發(fā)電項(xiàng)目可行性研究報(bào)告
- 2024-2030年中國(guó)地?zé)岵膳瘜S玫匕瀹a(chǎn)業(yè)未來(lái)發(fā)展趨勢(shì)及投資策略分析報(bào)告
- 2024-2030年中國(guó)土地儲(chǔ)備產(chǎn)業(yè)發(fā)展?fàn)顩r規(guī)劃研究報(bào)告
- 2024年度人工智能領(lǐng)域股權(quán)補(bǔ)償協(xié)議3篇
- 2024年度校園物業(yè)管理及優(yōu)化合同版B版
- 2024年物聯(lián)網(wǎng)技術(shù)應(yīng)用開(kāi)發(fā)合作協(xié)議
- 馬鞍山職業(yè)技術(shù)學(xué)院《數(shù)據(jù)庫(kù)應(yīng)用技術(shù)案例》2023-2024學(xué)年第一學(xué)期期末試卷
- 2023年自考傳播學(xué)概論試題及答案
- GB/T 18277-2000公路收費(fèi)制式
- 2023年住院醫(yī)師規(guī)范化培訓(xùn)胸外科出科考試
- 11468工作崗位研究原理與應(yīng)用第7章
- 2023實(shí)施《中華人民共和國(guó)野生動(dòng)物保護(hù)法》全文學(xué)習(xí)PPT課件(帶內(nèi)容)
- 2022年初級(jí)育嬰師考試題庫(kù)附答案
- 系統(tǒng)家庭療法課件
- 新版GSP《醫(yī)療器械經(jīng)營(yíng)質(zhì)量管理規(guī)范》培訓(xùn)試題
- 初中道德與法治答題技巧課件
- 河北省保定市藥品零售藥店企業(yè)藥房名單目錄
- 廣西基本醫(yī)療保險(xiǎn)門診特殊慢性病申報(bào)表
評(píng)論
0/150
提交評(píng)論