版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
博弈論與決策管理主講老師:王若文博弈論與決策管理主講老師:王若文王若文,湖南長沙人;1987年畢業(yè)于北京大學中興通訊企管部經理、總裁秘書三一重工人力資源總監(jiān)、行政副總裁彩虹集團人力資源總監(jiān)、副總裁神州通集團人力資源總監(jiān)、培訓總監(jiān)中華網(wǎng)CHINA.COM
中國區(qū)人力資源總監(jiān)
2003年深圳首屆“十大金領”人物之一;
2004年深圳百名“特區(qū)之子”人物之一;
2010年最受歡迎的“中式人本管理專家”;
2011年金蝶公司全國巡場“領袖峰會”金牌主持2013年培訓TOP100-最佳人力資源及領導力管理專家。清華大學總裁班、北京大學匯豐商學院、浙江大學、新疆財經大學、上海財經大學EMBA班特聘領導力和人力資源講師。上市企業(yè)現(xiàn)職:廣州通盈投資公司董事長王若文,湖南長沙人;1987年畢業(yè)于北京大學上現(xiàn)職:廣州通盈七“到”輪回獲取思想,更在乎獲得方法;獲得知識,更在乎解決問題。錯少多學心到眼到耳到口到手到悟到做到練為什么要學?習七“到”輪回獲取思想,更在乎獲得方法;錯少多學心到眼到耳到口P-4頁知道悟到做到得到優(yōu)秀管理者的絕密八字P-4頁知道悟到做到得到優(yōu)秀管理者的絕密八字克服貪嗔癡表達"好"心情微笑、主動、回避、韜光幽默、語氣、適可、得讓謙卑、順從、真誠、舍得一打方法:先處理好心情,再學習好課程克服貪嗔癡表達"好"心情微笑、主動、回避、韜光一打方法:先斯大林時代的蘇聯(lián),一個樂隊指揮坐火車時看樂譜,兩個克格勃軍官以為是密碼,就將他抓了起來,他說那是柴可夫斯基的樂譜,但無無濟于事。第二天,克格勃告訴他,已把他的同伙柴可夫斯基也抓起來了,正在招供。他們倆面臨一種艱難的選擇:如一方招供另一方不招,坦白者從寬判1年,抗拒者從嚴判25年;如果雙方都招供,則各以間諜罪判10年;如雙方均不招供,克格勃無法定罪,各自坐牢3年。他們被分別關押,請問應該招、還是不招?招還是不招?這是個問題斯大林時代的蘇聯(lián),一個樂隊指揮坐火車時看樂譜,兩個克格勃軍官可能的思想斗爭是什么?坦白的原因
1、可能會被判的很輕
2、最壞的結果-10,-1,比-25,-3要好抵賴的原因
1、我沒犯罪,不愿意招
2、雙方抵賴各-3,比雙方坦白各-10好
3、人云:坦白從寬牢底坐穿,抗拒從嚴回家過年可能的思想斗爭是什么?一、博弈論簡介
博弈論(GameTheory)又名對策論,游戲論失火了,屋里人很多,你往哪個門跑—這就是博弈你的行動結果不僅取決于你的策略選擇,同時也取決于他人的策略選擇。它研究個體或組織之間存在利益沖突情況下如何進行最優(yōu)決策。一、博弈論簡介博弈論是40年代數(shù)學家馮·諾依曼和經濟學家奧斯卡·摩根斯坦首先提出的。在經濟學、政治學、社會學獲得了巨大的應用。1994年諾貝爾經濟學獎頒發(fā)給了3位博弈論專家:
納什Nash
、澤爾騰Selten
、哈桑尼Harsanyi
。中國人研究博弈論是有優(yōu)勢的:《三國演義》《孫子兵法》《三十六計》《厚黑學》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是40年代數(shù)學家馮·諾依曼和經濟
1994年諾貝爾經濟學獎獲得者:美國數(shù)學家JohnF.Nash;德國經濟學家ReinhardSelten;美籍匈牙利經濟學家JohnC.Harsanyi。
1928年Nash出生于美國,1950年獲Princeton大學數(shù)學博士學位,曾先后任教于MIT和Princeton大學。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。1930年
Selten出生于現(xiàn)屬于波蘭的德國城市,1961年獲法蘭克福大學數(shù)學博士學位,曾先后任教于柏林自由大學、比勒菲爾特大學和波恩大學。Selten的主要貢獻是首次對分析動態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達佩斯大學博士學位,后逃亡澳大利亞,再到美國,1954年獲斯坦福大學博士學位,曾先后任教于澳大利亞國立大學、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經濟學提供了一個理論基礎。1994年諾貝爾經濟學獎獲得者:1928年Nash出生于美1996年,兩位將博弈論應用于不對稱信息下機制設計的經濟學家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經濟學獎。2001年三位經濟學家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運用博弈論研究信息經濟學所取得的成就而成為該年度的諾貝爾經濟學獎得主。2005年諾貝爾經濟學獎授予羅伯特·奧曼和托馬斯·謝林,以表彰他們“運用博弈論的分析方法對現(xiàn)實的政治、經濟問題進行分析,改變了我們對沖突與合作的理解”。1996年,兩位將博弈論應用于不對稱信息下機制設計的經濟學家博弈的分類1、靜態(tài)博弈與動態(tài)博弈參與者行動的先后順序,靜態(tài)博弈是同時作出決策(不了解對手的決策方案),動態(tài)博弈是參與者先后作出決策(后行動的人知道先行動者的行動方案)。2、完全信息博弈與不完全信息博弈對其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。3、合作博弈與非合作博弈能否達成一個有約束力的協(xié)議,合作博弈強調集體理性。(經濟學主要討論非合作博弈)4、一次性博弈與重復博弈博弈重復多次進行。(注意區(qū)分動態(tài)博弈)博弈的分類1、靜態(tài)博弈與動態(tài)博弈嚴格地講,博弈論并不是經濟學的一個分支,它是一種方法,應用范圍除經濟學外,還包括政治學、軍事學、外交學、國際關系學、犯罪學等。但為何博弈論受到經濟學的重視呢?主要原因有:1、博弈論在經濟學中得到最廣泛、最成功的應用,尤其在寡頭市場理論中得到直接的應用。2、博弈論的許多成果也是借助于經濟學的例子來發(fā)展的,經濟學家對博弈論的貢獻最大。3、博弈論與經濟學的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。
由于上述原因博弈論逐漸成為主流經濟學最重要的組成部分。嚴格地講,二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開審問)
BA
坦白不坦白
A=10年A=25年
B=10年B=1年
A=1年A=3年
B=25年B=3年坦白不坦白每一個人的結局不僅取決于自身的選擇,同時也取決于對手的選擇不管B坦白不坦白,我坦白總是會少坐一些牢1、囚徒博弈二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個存在占優(yōu)均衡的博弈:因為對囚犯A,B來說,無論對方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競爭性動機阻礙了它們達到更好的互利選擇,我們將看到,寡頭壟斷廠商經常面臨類似的困境。啟示:個體理性決策常常導致集體非理性結果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone“囚徒的困境”還對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。這位經濟學圣人在《國富論》中的名言:“每個人都力圖利用好他的資本,使其能實現(xiàn)最大的價值。一般說來,他并不企圖增進公共福利,他所追求的僅僅是他個人的利益。但在他這樣做的時候,有一只看不見的手引導著他去實現(xiàn)另一種目標,這種目標并非是他本意所要追求的東西。通過追逐個人利益,他經常增進社會利益?!卑凑账姑艿睦碚摚谑袌鼋洕?,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。從某種意義上說,納什提出的非合作博弈的囚徒悖論實際上動搖了西方經濟學的基石?!扒敉降睦Ь场边€對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。例:投標總工程量50,賄賂成本5,甲乙雙方實力相當甲賄賂不賄賂
賄賂不賄賂20200454502525問題:賄賂還是不賄賂?均衡:(賄賂,賄賂)乙2、投標博弈例:投標不賄賂200453、智豬博弈背景:在豬圈里住著一大一小兩頭豬。它們從同一個食槽獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個單位食物,但需付出2個單位勞動。規(guī)則:若大豬按按鈕:大豬吃6個單位,小豬吃4個單位;若小豬按按鈕:大豬吃9個單位,小豬吃1個單位;若一起去按:大豬吃7個單位,小豬吃3個單位;問題:哪頭豬將會去按按鈕?
小豬按等待按5,14,4
等待9,-10,0大豬3、智豬博弈背景:大豬經濟學中,這頭小豬也被稱為“免費搭便車者”
現(xiàn)實社會之中的大豬和小豬何其之多:山寨版的橫行股份公司治理中的大股東與小股東大企業(yè)的人才培訓與小企業(yè)的挖腳股市中的散戶跟隨大戶體制改革中的出頭者職場團隊中的小組長與組員公共設施或基礎設施投資:富人與窮人…………經濟學中,這頭小豬也被稱為“免費搭便車者”4、斗雞博弈假設兩只公雞遇到一起,每只都有兩個行動選擇:進攻或后退。后退是很丟面子的事情,若雞甲進攻,乙后退,則甲贏。雙方前進,兩敗俱傷。
雞乙進退
雞甲進-4,-41,-1退-1,1-1,-1雙方都沒有占優(yōu)策略存在兩個穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)4、斗雞博弈假設兩只公雞遇到一起,每只都有兩個行動選擇:進攻
雙方都避免兩敗俱傷,斗雞博弈有兩個納什均衡,一方前進,另一方后退。由于有兩個均衡點,結果無法預知。具體博弈結果還取決于其他因素。20世紀60年代蘇美間的古巴導彈危機就是一個斗雞博弈的很好例子。古巴導彈危機是冷戰(zhàn)時期蘇美之間最嚴重的一次危機,赫魯曉夫1962年偷偷將導彈運到古巴對付美國,被美國U2飛機偵察到,美國派出攜帶核武器的戰(zhàn)機、航母,威脅蘇聯(lián)限期從古巴撤出導彈。蘇美這兩只大公雞均在考慮進還是退?戰(zhàn)爭的結果當然是兩敗俱傷,但任何一方退下來則是很不光彩的事。博弈結果是蘇聯(lián)從古巴撤回了導彈,做了丟面子的“撤退的雞”,而美國堅持了自己的策略,做了“不退的雞”。當然為了給蘇聯(lián)面子,同時也擔心戰(zhàn)爭,美國也從土耳其撤了一些導彈。雙方都避免兩敗俱傷,斗雞博弈有兩個納什均衡,一方前進例:兩個寡頭進行價格戰(zhàn)博弈的收益矩陣。10,1050,50-50,100100,-50低價低價高價高價廠商B廠商A三、博弈論中的均衡博弈論中的均衡是一組穩(wěn)定的博弈結果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預測的。例:兩個寡頭進行價格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無論B選擇何行動,該策略對A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價。占優(yōu)均衡,支配均衡每個參與者都有并都選擇占優(yōu)策略,由此實現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。1、占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy2、納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益。此時,雙方在對方給定的策略下均不愿意調整自己的策略。下例中,A有占優(yōu)策略即正常價格策略,而廠商B沒有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價格正常價格廠商B廠商A高價格正常價格2、納什均衡納什均衡(非合作性均衡):100,20010,13、占優(yōu)均衡與納什均衡的區(qū)別
占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個特例3、占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管四、最大最小策略迄今為止,對廠商行為的分析都建立在利潤最大化基礎上。但在一些競爭激烈的寡頭壟斷市場,馮·諾依曼和摩根斯坦認為決策者也可能采取一種風險厭惡策略,即確保在最壞的結果中得到最好的結果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤方案中選擇利潤最大的方案。四、最大最小策略迄今為止,對廠商行為的分析都建立在利潤最大化風險與均衡由于納什均衡要求理性共識和一致預期,當人們可能犯小小的錯誤時,納什均衡不一定被選擇。如下面這個博弈中,假定你是A,則多數(shù)人將選擇“下”而不是“上”。上下
左
右8,10-1000,97,66,5只要B有千分之一的概率錯誤地選擇右,A的后果將是災難性的,A將極力避免這種風險,因此會選擇下。所以,出現(xiàn)的不是納什均衡BA風險與均衡由于納什均衡要求理性共識和一致預期,當人們可能犯小
如果企業(yè)謀求利潤最大化,將有兩個納什均衡,一家企業(yè)投資推出新產品,另一家企業(yè)不投資產品。最大最小策略,不是利潤最大化策略,準確說,它是用來避免十分不利結果的。對企業(yè)1來說,如果它不投資新產品,利潤最小是300萬,如果它投資,利潤最小是200萬。對企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤中選最大值。結果是兩家企業(yè)都不投資新產品。因為這樣的策略能保證至少獲得300萬利潤。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2(單位百萬)不投資
雙寡頭企業(yè)都在考慮是否投資推出新產品。如果企業(yè)謀求利潤最大化,將有兩個納什均衡,一家企業(yè)投資最大最小策略的結果并不是兩種納什均衡中的一種。原因是這種決策所用的準則,不是利潤最大化,而是避免虧損過多,最大最小策略是一種保守的策略。不同的決策目標可能導致人們選擇不同的策略,最終導致不同的博弈結果。最大最小策略的結果并不是兩種納什均衡中的一種。五、重復剔除嚴格劣戰(zhàn)略“重復剔除嚴格劣戰(zhàn)略”的思路如下:1、首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個劣戰(zhàn)略剔除后,剩下的是一個不包含已剔除劣戰(zhàn)略的新的博弈;然后再剔除這個新的博弈中的劣戰(zhàn)略;繼續(xù)這個過程,直到沒有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個唯一的戰(zhàn)略組合就是“重復剔除占優(yōu)均衡”。2、如果這樣的解存在,該博弈是“重復剔除占優(yōu)可解的”。1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中五、重復剔除嚴格劣戰(zhàn)略“重復剔除嚴格劣戰(zhàn)略”的思路如下:1連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?玩家2玩家1100,10090,11050,120110,4080,8045,50120,3050,3540,40策略ABCabcABCabc90,11050,12050,3540,40
80,8045,50
50,3540,40玩家2玩家1策略連續(xù)排除劣勢策略兩者都沒有占優(yōu)策略,怎么辦?玩家2玩家1普林斯頓大學的一道習題題目:如果給你兩個師的兵力,由你來當“司令”,任務是攻克“敵人”占據(jù)的一座城市,而敵軍的守備力量是三個師,規(guī)定雙方的兵力只能整師調動。通往城市的道路只有甲乙兩條。當你發(fā)起攻擊的時候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。那么,你將如何制定攻城方案?敵人你方(3,0);(2,1);(1,2);(0,3)(2,0);(1,1);(0,2)其實,這次模擬“作戰(zhàn)”,每一方取勝的概率都是50%,即誰勝誰負的可能性是一半對一半。你這個司令能否神機妙算,指揮隊伍克敵制勝,還得看你的本事。普林斯頓大學的一道習題敵人你方(3,0);(2,1);(1六、重復博弈“囚徒的困境”暗含有一次性博弈假定,結果陷入了個體理性決策導致(因為猜忌)集體非理性結果的困境。現(xiàn)在我們改變假定條件,討論博弈可以多次進行的重復博弈(RepeatedGame)。如,囚徒困境博弈中,假定博弈或重復多次,A對B宣布如下方針:我將選擇沉默,并要求你也如此來增進各自利益;然而,如果你半途背叛選擇坦白,我從下一階段游戲開始便一直采取坦白。這一方針與A利益一致,因而是可信的。六、重復博弈“囚徒的困境”暗含有一次性博弈假定,結果陷入了個重復博弈中,聲譽(名聲)十分重要從B角度來看,和A合作可在每階段得到較好結果;中途變卦,固然當期可得更好結果,但此后便每次面臨更壞的后果,顯然是不利的。因而,重復性博弈中,“沉默+沉默”點可能成為對雙方最佳選擇,因而成為納什均衡點?!捎诓┺臈l件由一次性變?yōu)橹貜托裕鉅顟B(tài)隨之發(fā)生變化。欺騙一次對方就會警覺,導致合作失敗。在重復博弈中,名聲對得出什么樣的結果十分重要。重復博弈中,聲譽(名聲)十分重要從B角度來看,和A合作可在每重復博弈導致合作的例子重復博弈導致合作的例子我還以為上了戰(zhàn)場就可以亂放槍呢,誰知竟有這麼多狗屁規(guī)矩。
“不過我們也不能全走出去,不然他給你來個一窩揣也說不定。每次出去一個,其他人守著?!彼麄兙嫖摇叭绻挟敼俚膩砹司鸵貏e小心,當官的不了解內情,一聲令下,他們不想打也得打,你站在外面就活該倒霉?!?/p>
很有道理,我想我又上了一課,希望下課前我還沒死。戰(zhàn)場上不用考試的,不合格的學生全得死,沒有補考的機會。這是個恐怖的課堂!我想學校里如果成績不佳就馬上拉出去槍斃的話,學生們會怎樣玩命學習呢。
類似的例子:一戰(zhàn)的戰(zhàn)場上“我們不開槍,你們不開槍”標語我還以為上了戰(zhàn)場就可以亂放槍呢,誰知竟有這麼多狗屁規(guī)矩。
多個博弈論專家為此編制策略模型,兩兩配對進行比較,博弈反復多次進行,結果下述簡單策略效果最好
“針鋒相對”策略:以合作開局,隨后博弈參與者就模仿競爭對手上一期的行動,對手欺騙(削價),則下一期我也欺騙(削價)。如果對方采取合作態(tài)度(提價),則下期我也合作(提價)。在非合作的、重復性博弈中,個體或企業(yè)有不取決于博弈內容的最優(yōu)策略嗎?換言之:有沒有一種簡單的策略讓我們可以在重復博弈中利益最大化?多個博弈論專家為此編制策略模型,兩兩配對進行比較,博弈反復多針鋒相對策略在重復博弈中的優(yōu)勢:1、簡單,不易誤解;2、針鋒相對決不是先搞欺騙,先搞欺騙會導致合作瓦解;3、決不慫恿欺騙行為,不允許對這類行為不加懲罰;4、針鋒相對是寬大的,它允許迅速恢復合作??梢哉f,這種策略既是毫不留情的,又是毫不記恨的。真正是“善有善報,惡有惡報”,而且“無論善惡,立即得報”。毛主席的:人不犯我、我不犯人,人若犯我,我必犯人。不幸的是,如果確定知道博弈次數(shù),針鋒相對的策略可能失效。每一方都企圖在最后一次博弈搞欺騙(對手已沒機會報復),前一次也沒必要合作…,又回到了囚徒困境模式。針鋒相對策略在重復博弈中的優(yōu)勢:毛主席的:人不犯我、我不犯人七、行動有先后:順序性博弈通常的博弈不是參與者同時選擇,即不是靜態(tài)博弈。在動態(tài)博弈中,各博弈方先后依次行動。-5,-5-5,-520,1010,20咸餅干咸餅干甜餅干甜餅干廠商B廠商A下面支付矩陣描述了一個博弈,如果同時行動,它有兩個納什均衡點(“甜,咸”與“咸,甜”)。假定廠商A可以先推出甜餅干(如利潤較高),我們就有了序列博弈:A先作決策,B隨后選擇。A決策時必須考慮競爭者的理性反應:它知道不論自己推出那種餅干,B出于自身利益會推出另一種。因而A推出甜餅干,B在給定A決策時選擇咸餅干。結果兩個納什均衡點收斂為一個,其中A由于具有先行者優(yōu)勢(FirstMover’sAdvantage)而得到較大利益,七、行動有先后:順序性博弈通常的博弈不是參與者同時選擇,即不先行優(yōu)勢
沃爾瑪進入不進入進入-1000,-10002500,0
不進入0,30000,0最終的結果取決于誰先采取行動,如果一方搶先進入,另一方只能放棄。(很多企業(yè)寧愿虧損也要多處布點)家樂福鋼鐵大王安德魯·卡內基曾經說過:“第一個來的人得到了牡蠣,而第二個人只得到了貝殼。”如果沃爾瑪和家樂福兩家公司都想在某一中小城市開設商業(yè)網(wǎng)點,由于市場容量有限,當兩家公司都進入時,大家都可能虧損先行優(yōu)勢家樂福鋼鐵大王安德魯·卡內基曾經說過:“第一個來的人規(guī)模上千億美元的世界芯片市場提供了另一個例證:近十幾年來,芯片的需求急劇膨脹,一方面源于個人電腦和手機爆炸性需求的拉動,另一方面諸如汽車、立體聲設備等產品的日益電子化、精密化。進行新投資的時間問題是這一行業(yè)經營制勝的重要一環(huán)。建立一個芯片工廠往往要耗資十億多美元,但設備在3-5年內就會過時。80年代初,美國半導體企業(yè)壟斷了整個芯片行業(yè)。1984年,價格的下降使得Intel和德州儀器推遲了建立新的芯片工廠的計劃。預計到這個形勢,東芝、NEC和Oki電子公司等日本企業(yè)馬上作出反應,投資增加新的生產能力。80年代末,日本企業(yè)占領了世界芯片市場的80%,而美國企業(yè)只有可憐的15%,一些美國企業(yè)如英特爾干脆退出了低端芯片行業(yè)。規(guī)模上千億美元的世界芯片市場提供了另一個例證:1990年代,這種機制又得到重演,這次扮演擴大生產能力進攻者角色的是韓國。1990年前后,正處于行業(yè)衰退中,主要日本廠商都減少了芯片生產規(guī)模,同時,日本經濟進入蕭條狀態(tài),導致籌措資金步履維艱,因此,日本企業(yè)推遲了興建新的芯片工廠的計劃。相反,韓國現(xiàn)代,三星和金星電子等則紛紛斥巨資興建芯片工廠。到1994年,韓國已經占有世界芯片市場36%的份額,三星也成為世界最大的芯片生產廠商。1990年代中后期,臺灣也加入了該產業(yè)的博弈行動中,獲得了較大的市場份額。這些公司贏得優(yōu)勢的主要做法之一就是在商業(yè)周期低谷時大量投資,形成過剩生產能力。等到經濟開始復蘇,其他競爭對手發(fā)現(xiàn)再投資已無利可圖。1990年代,這種機制又得到重演,這次扮演擴大生產能力進攻者八、言語博弈:威脅和承諾為了在博弈中獲得對已有利的結果,往往會產生“威脅”和“承諾”的行為。語言哲學認為,語言就是行動。言語博弈涉及:聲稱的策略和實際的策略?,F(xiàn)實中,各國的外交聲明,企業(yè)發(fā)出的威脅等。伊拉克對美國:如果你打我們,我就使用大規(guī)模殺傷性武器。臺灣問題:美國聲稱,如果中國武力攻打臺灣,美國將介入。中國聲稱,是否收回臺灣是中國內政,中國原來的不率先使用核武器的聲明在國內戰(zhàn)爭中不適用,溫家寶的“不惜一切代價”。中國用“不首先使用核武器”的承諾。八、言語博弈:威脅和承諾為了在博弈中獲得對已有利的結果,往往1、威脅:可信的與不可信的B公司降價不降價降價100,200200,-100不降價600,10001000,700A公司A公司降價的威脅可信嗎?不可信!如果A公司要讓B公司相信其威脅是可信的,只有一個途徑:建立一種不按牌理出牌的形象。公司之間經常相互發(fā)出信號以表明他們的意圖、動機和目標。有些信號是威脅性的。例如,A公司宣布,如果誰挑起價格戰(zhàn),它將堅決奉陪到底,并宣稱其規(guī)模在本行業(yè)中名列前茅,最有降價的實力。是否所有的威脅都是可信的?1、威脅:可信的與不可信的2、威脅的可信度
以前述餅干生產廠為例:先行者有優(yōu)勢,但在雙方都沒投產之前,廠商B宣布不管其他廠家如何,他都將投產甜餅干,當然A可能沒有理由非得相信他。此時B訂購大宗蔗糖合同,同時投放昂貴廣告,傳達相關信息。A可能就會放棄。只有威脅變得可信時才會生效。此策略可能很有效,但很危險,取決于對信息的充分了解。不按常理出牌,而形成一種非理性或“瘋子”的名聲,在重復博弈中可能會大大增加獲益的機會。-5,-5-5,-520,1010,20咸餅干咸餅干甜餅干甜餅干廠商B廠商A2、威脅的可信度以前述餅干生產廠為例:-5,-5-5,-53、阻止市場進入的威脅在一般的情況中,一個市場中不一定只能容納一家企業(yè)。假定在一個市場中,某企業(yè)是市場壟斷者。現(xiàn)在有另一企業(yè)作為潛在的競爭者,試圖進入這個市場。對壟斷者來說,會設法阻止?jié)撛诟偁幷叩倪M入。在這個博弈中,潛在競爭者有兩種策略可以選擇,即進入或不進入;壟斷者也有兩種策略,或者與進入者打一場價格戰(zhàn),或者默許它的進入。該博弈的策略選擇順序是:首先由潛在進入者作出進入市場或不進入市場的選擇,然后再由壟斷者來決定是默許它的進入還是與進入者進行一場價格戰(zhàn)。這個博弈的得益矩陣如表所示:-200,6000,30000,3000900,1100價格戰(zhàn)進入不價格戰(zhàn)不進入壟斷者潛入者可信嗎:壟斷者對潛在進入者進行威脅:“如果你進入市場,我將采取價格戰(zhàn)的策略”空頭威脅!3、阻止市場進入的威脅在一般的情況中,一個市場中不一定只能4、承諾與可信性承諾,是指對局者所采取的某種行動,這種行動使其威脅成為一種令人可信的威脅。與承諾行動相比,空頭威脅無法有效阻止市場進入的主要原因是,它不需要任何成本。阻止市場進入的有效承諾就是通過投資來形成一部分剩余的生產能力。這部分生產能力在沒有其他企業(yè)進入市場的時候是多余的,但在進入發(fā)生時則成為其低價競爭的有力武器。生產能力的擴大需要額外的投入,我們假定壟斷者需要投資800萬元來實行這個承諾。這一投資將改變博弈的得益矩陣,新的得益矩陣如下表:-400,4000,22000,2200900,300價格戰(zhàn)進入不價格戰(zhàn)不進入壟斷者潛入者4、承諾與可信性承諾,是指對局者所采取的某種行動,這種行動例:運用公布價格策略搶占市場
德克薩斯儀器公司宣布了DRAM兩年內的價格。一周后,鮑默公司宣布以低于德克薩斯公司的價格生產這種產品。幾周后,摩托羅拉也宣稱將以比鮑默公司更低的價格生產這種產品。終于在幾周后,德克薩斯公司宣布其價格比摩托羅拉公司的價格還要低50%,而其他兩家公司則宣稱經過慎重考慮,他們不打算生產這種產品。某公司的董事長聽到這則消息后,認為應該學習德克薩斯公司的策略。他的公司計劃開發(fā)一種新產品,兩年后投放市場,雖然其生產成本并不比同時進入市場的其他競爭性產品的成本低,但仍具有一定的競爭力。該董事長認為,應該將新產品的價格公布很低,目的是誘使其他企業(yè)放棄該新產品的開發(fā)計劃。
如果你是這家公司的顧問,你認為董事長公布一個較低的新產品價格有哪些好處和壞處?例:運用公布價格策略搶占市場德克薩斯儀器公司宣布了DRAM某警察負責A、B兩地治安,兩地相隔較遠,他每晚只能去一個地方巡邏,該地區(qū)有一小偷,他每晚也只能選擇偷一個地方,A地財產價格2萬元,B地財產價格1萬元,若警察選A地巡邏,而小偷也選擇去了A地,則會放棄偷竊,警察保全了3萬元財產;若警察選擇A巡邏,小偷去了B地,則B地財產被盜。
問:警察如何巡邏效果最好?策略1:警察只對A巡邏,這樣可保住2萬元的財產不被竊。
這個做法是最優(yōu)的嗎?有沒有改進的措施?策略2:既去A地,又去B地。那么去A地多少次,B地多少次最優(yōu)?九、混合策略博弈——警察與小偷某警察負責A、B兩地治安,兩地相隔較遠,他每晚只能去一個
小偷警察盜竊A地盜竊B地巡邏A地(3,0)(2,1)巡邏B地(1,2)(3,0)顯然,警察的最好做法是:通過擲骰子決定去A地還是B地,1/3的機會去B地,2/3的機會去A地。(對6個面的骰子,1-4點去A地,5、6點去B地。)對小偷也是如此,擲骰子來決定是偷什么地方,只是1-4點去B地,5、6點去A地。小偷盜竊A地盜竊B地巡邏A地(3警察和小偷的損益分析:警察到A地時,小偷有1/3機會到A,2/3機會去B,此時警察得益:同理警察到B地時,得益也為7/3。由于警察到A的可能為2/3,到B的可能為1/3,其總得益為:可以看出警察的總得益大于2,該策略優(yōu)于只巡邏A的策略1。小偷的得益有什么改變呢?(2/3)警察和小偷的損益分析:該博弈為零和博弈(一方之所得,即為另一方之所失),只有混和策略均衡點,不會有純策略的納什均衡點。警察與小偷博弈如同剪刀-石頭-布游戲,或猜拳游戲,是混合策略博弈,參與者在多種備選策略中隨機選擇。在這樣的游戲中,不存在純策略均衡(不能選擇單一策略),對每個人來說,出剪刀、布、還是石頭的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是策略的“傾向性”,如果對方知道你出哪一個策略的可能性較大,你在游戲中輸?shù)目赡苄跃驮龃?。該博弈為零和博弈(一方之所得,即為另一方之所失),只有混和策二、策略式博弈?shù)學基礎設在一個n人博弈中,諸局中人的策略集為S1,…Sn,每個局中人的支付/收益為u1,…,un,都是定義在S1×S2×…×Sn上的函數(shù),我們將這個博弈記作G={S1,…Sn;u1,…,un}。這種表述方法稱為博弈的策略型表述或者正規(guī)型表述。博弈者采取Si策略的概率記為σi,則收益ui=f(σi,Si)二、策略式博弈數(shù)學基礎設在一個n人博弈中,諸局中人的策略4,35,16,22,18,43,63,09,62,8策略LMRUMD玩家2玩家1σ1(U)+σ1(M)+σ1(D)=1σ1=(1/3,1/3,1/3)σ1i=(0,1/2,1/2)則:U1=1/3(0*4+1/2*5+1/2*6)+1/3(0*2+1/2*8+1/2*3)+1/3(0*3+1/2*9+1/2*2)=11/2;U2=27/64,35,16,22,18,43,63,09,62,8策略L
某國有6個省,A、B、C、D、E、F,總統(tǒng)選舉由這些省的代表投票選出,票數(shù)由不同省人口比例分配。A10票,B9票,C7票,D3票,E1票,F(xiàn)1票,總數(shù)31票。候選人有兩位,如某候選人獲過半,即16票以上通過,就得以當選。立法也是如些,票數(shù)過半則通過。該政治體制運行了多年,但D、E、F的人民總覺得他們不同的聲音往往得不到重視。試問該國的民主機制有什么問題嗎?十、公共選擇理論(聯(lián)盟博弈)十、公共選擇理論(聯(lián)盟博弈)雖然D、E、F分別有3票,1票,1票,但事實上在表決時,這3個省在任何情況下都不起作用。因為他們不是任何獲勝聯(lián)盟的關鍵加入者?,F(xiàn)任總統(tǒng)知道了漏洞,提出要增加DEF的權力,但要求:1、人多的省權力要大些;2、人數(shù)少的地區(qū)也要有一定的權力;3、不要對現(xiàn)行制度作太大的修改,以免實施困難。你認為如何對現(xiàn)行體制進行修改好呢?雖然D、E、F分別有3票,1票,1票,但事實上在表決時,這3最簡單的方法是:多給A地區(qū)兩張選票,總票數(shù)33張,獲17張選票才能勝出,這樣就能增加三個弱小省的權力。提示:在合作博弈中,票數(shù)是一個虛假的指標,權力指數(shù)才真正起作用。(夏普里值,ShapleyValue)權力指數(shù):某一方作為關鍵加入者的獲勝聯(lián)盟的個數(shù)。簡例:A、B、C三人,A有兩票,B、C各有一票,三人群體對某議題的表決,服從大多數(shù)原則,即若獲3票,則通過,這三人各自的權力指數(shù)多大?解:獲勝聯(lián)盟有:AB、AC、ABC,其中A在3個組合中均是關鍵加入者,而B,只對AB是關鍵加入者。所以A的權力指數(shù)是3,B的權力指數(shù)是1,而C的權力指數(shù)也是1。最簡單的方法是:多給A地區(qū)兩張選票,總票數(shù)33張,獲17張選省票數(shù)權力指數(shù)權力指數(shù)(%)A10433.3B9433.3C7433.3D300E100F100省票數(shù)權力指數(shù)權力指數(shù)(%)A121834.6B91426.9C71426.9D323.8E123.8F123.8總票31時各省權力指數(shù)總票33時各省權力指數(shù)省票數(shù)權力指數(shù)權力指數(shù)(%)A10433.3B9433.3C
從權力指數(shù)角度看股份公司案例五個股東A、B、C、D、E合資成立一股份公司,各出資20%,公司運行的兩原則:1、一股一票原則;2、大多數(shù)原則(51%通過才能執(zhí)行某決議)。第一年年底,A表示想增持一部分股份,而BCDE愿意減持一些股份,但又不想讓A控股,于是BCDE各減持了3%,A的股份為32%,BCDE各為17%。第二年年初,A提出要BCDE各自再轉讓1%股份,BCDE一想,A持有的股份36%,不超過50%,就同意了,此時BCDE各有16%股份。
請問:如果你是B,你會同意第一次減持3%嗎?你會同意第二次減持1%嗎?為什么?從權力指數(shù)角度看股份公司案例股東最初股份%第一年未股份%權力指數(shù)權力指數(shù)%A2032620B2017620C2017620D2017620E2017620股東第二年初股份%權力指數(shù)權力指數(shù)%A361463.6B1629.1C1629.1D1629.1E1629.1股東最初股份%第一年未股份%權力指數(shù)權力指數(shù)%A203262三人分配財產案假定有100萬元,在三人間分配,A有50%的投票權,B有40%有投票權,C有10%,規(guī)則規(guī)定,當超過50%的票認可某方案,才能分配財產,否則三人一無所有。你認為分配的比例會是什么樣的呢?
A50萬,B40萬,C10萬合理嗎?三人分配財產案A50萬,B40萬,C10萬,不合理,因為C可以提出:A60萬,B0萬,C40萬B可以提出:A70萬,B30萬,C0萬C可以再提:A80萬,B0萬,C20萬
………
當A分得太多,B、C都分得太少時,B和C會聯(lián)合起來,寧可不得,這時A又會作出讓步。多次博弈的均衡是,按權力指數(shù)來計算分配(實踐中還取決于每一方的談判能力)A50萬,B40萬,C10萬,不合理,因為
民主的方式中,少數(shù)人支持的候選人能贏嗎?一個n個人組成的社會,設n=300,對候選人A和B選舉,如果全民投票,有2/3的人選B,只有1/3會選A,有沒有一種辦法設計一種規(guī)則,通過“民主的”投票使A當選呢?答案是肯定的。
民主規(guī)則也就是大多數(shù)原則,但具體實行方式可以商量?,F(xiàn)在我們將這300人分成3組,每組中誰占多數(shù),誰就贏得這一組,3組中贏得2組,就算贏了。(很公平吧?。┟裰鞯姆绞街校贁?shù)人支持的候選人能贏嗎?答案是肯定的。
現(xiàn)在我們假定第一組50人,第二組100人,第三組150人,第一組中有30人贊成A,第二組有60人贊成A,第三組中有10人贊成A,這樣,A會贏得第一組和第二組的選舉,從而順利當選。如果不分組,直接選舉,B會當選。
布坎南《同意的計算》舉了一例,一個25人的社會,只需9人同意某議案就可使它通過。分成5個區(qū),每區(qū)5個人,只要3個區(qū)中的多數(shù)通過,即9個人,就能使某一議案通過。當人數(shù)更多時,數(shù)學計算表明,通過某議案只需總人數(shù)的1/4多一些即可,而無需多于1/2的人同意。如總數(shù)為39601人(199*199),只需10000人同意?,F(xiàn)在我們假定第一組50人,第二組100人,第三組1下述一次性選舉:有4個人,A、B、C、D,假定26%的人最喜歡A,各有25%的人喜歡B和C,有24%的人最喜歡D,假設B、C、D三個候選對象與A區(qū)別很大,喜歡他們三個的都最不喜歡A,現(xiàn)在進行一次性選舉,誰可能當選?雖然有74%的人最不喜歡A,但A卻當選了。
你可能會說,一次性選舉不是就能避免上述問題嗎?公共選擇與私人選擇的不同,不正當?shù)慕Y果也可能發(fā)生。公民選舉中,最不被喜歡的人可能當選。例如臺灣2000年大選,(陳、宋、連、李)下述一次性選舉:你可能會說,一次性選舉不是就能避免上述問題嗎民主投票的缺陷--不同的選舉規(guī)則導致不同的結果臺灣的選舉是“民主選舉”,各黨派平等競爭。2000年臺灣大選,四個候選人:宋楚瑜、連戰(zhàn)、陳水扁、李敖。最終結果是陳水扁以微弱優(yōu)勢當選。假設臺灣選舉不是直選,選舉規(guī)則是先角逐出兩個候選人而不是多個候選人,然后再在這兩個候選人間進行競選,會出現(xiàn)什么結果呢?美國選舉是間接選舉,而臺灣是直接選舉。
與此相同的例子,中國申辦2000年奧運會,投票規(guī)則是逐步淘汰制,每一輪得票最少的城市被淘汰。前兩輪北京一直領先,剩下北京、悉尼、柏林,第三輪同樣北京獲選票最多,柏林被淘汰,但最后一輪,北京與悉尼角逐時,北京卻輸了。民主投票的缺陷--不同的選舉規(guī)則導致不同的結果與此相同的例子投票的悖論與阿羅不可能定律
三個人(或三組)每一個都有一票,他們必須在跳舞、打牌、看電影三種不同選項進行選擇。這三個人有完全不同的意見:
史密斯打牌>看電影>跳舞布朗看電影>跳舞>打牌
瓊斯跳舞>打牌>看電影投票者投票者對提案的不同選擇跳舞打牌看電影布朗第2第3第1史密斯第3第1第2瓊斯第1第2第3投票的悖論與阿羅不可能定律投票者投票者對提案的不同選擇跳舞打在多數(shù)票規(guī)則下,每個人投出他最喜歡的票。當跳舞與打牌表決時,跳舞勝出,2:1當打牌與看電影表決時,打牌勝出,2:1但是如果跳舞與看電影表決,是不是一定會贏呢?主席在議會中的重要性:確定議程的權力就可能決定結果。結論:加總社會個體成員偏好,不能得知社會的選擇。多數(shù)投票制度并不能告訴我們社會真正想要什么結果。換而言之,不能簡單地將民主理解為“少數(shù)服從多數(shù)”在多數(shù)票規(guī)則下,每個人投出他最喜歡的票。結論:加總社會個體成阿羅:是否存在著任何能夠避免循環(huán)結果的合理投票辦法?結論令人吃驚:那種能保證效率、尊重各人選擇、并且不依賴議事日程的多數(shù)規(guī)則的投票辦法是不存在的。民主與效率是存在矛盾的。阿羅定理還告訴我們,民主并不象盧梭理解的那樣能夠達到"公意",而是象波普爾理解的那樣能夠防止"最壞"的情況發(fā)生,從而嚴格論證了民主的功能究竟何在。阿羅:是否存在著任何能夠避免循環(huán)結果的合理投票辦法?結論令人西方民主世界的領袖美國,經常發(fā)生“議員選選民”的怪現(xiàn)象。
“蜥蜴腳尾”現(xiàn)象美國政治的兩個重要特征。第一,美國社會表面上是個“大熔爐”,其實因種族、宗教、窮富等因素造成的社會分化極其嚴重,如2000年總統(tǒng)大選90%以上黑人選民投票支持戈爾,便是一例。第二,美國選區(qū)的劃分,大都由各州州議會自行決定,是個可以上下其手的過程。舉例說,假設美國選民總體對民主、共和兩黨的支持基本是一半對一半,那么只要一個選區(qū)的黑人比例超過全國平均值幾個百分點,他們90%投民主黨的的選票,就會將這一選區(qū)變成民主黨的“鐵票”地盤。因此產生了美國選區(qū)地圖的“蜥蜴腳尾”現(xiàn)象。此名來自19世紀初的麻薩諸塞州州長杰里,他專搞選區(qū)劃分手腳,以便自己和同黨可以順利當選,結果在地圖上選區(qū)常常奇形怪狀,就像蜥蜴,又長“腳”又長“尾巴”。甚至出現(xiàn)過沿一條公路伸展幾百英里、寬度卻幾乎不出一英里的怪物選區(qū)。西方民主世界的領袖美國,經常發(fā)生“議員選選民”的怪現(xiàn)象。最近,得克薩斯州的共和黨人憑在州議會的多數(shù),強行重劃選區(qū),演出了“蜥蜴腳尾”的新一幕。其中的精彩插曲,是州議會少數(shù)黨民主黨議員為了抵制,兩次大批“逃亡”,使州議會不到法定人數(shù),無法通過議案。結果共和黨控制的州政府要求警方“通緝”逃亡的州議員,上演了一場鬧劇。民主黨最后屈服,得州終于通過了新的國會選區(qū)劃分,例如原先得州西部的第19選區(qū)如今像條細蛇,宛延伸展到得州中部。原先是民主黨地盤的第11選區(qū)被完全重劃,也是又細又長,目的是幫助布什總統(tǒng)的一個盟友當選眾議員。得州南部的新選區(qū)地圖像“一套細條紋西裝”,由許多南北向的狹長選區(qū)組成,目的是將拉美裔的選民集中壓縮到寥寥幾個選區(qū)。《華盛頓郵報》發(fā)表社論《得克薩斯蘇維埃共和國》,批評得州的“蜥蜴腳尾”選區(qū),實質上是“議員選選民”,選舉結果早由這些“蜥蜴腳尾”選區(qū)預定,和前蘇聯(lián)共產黨統(tǒng)治下的“選舉”并無不同。美國以“民主典范”自居,老是要對其他國家指手劃腳??墒敲绹陨淼摹膀狎婺_尾”和近日“得克薩斯蘇維埃共和國”故事,體現(xiàn)了西方諺語:自己住在玻璃房子里,最好別亂扔石頭。
最近,得克薩斯州的共和黨人憑在州議會的多數(shù),強行重劃選區(qū),演美國的人口演變大勢,特別是少數(shù)民族人口的快速增長,總的來說對民主黨有利。但是由于美國選舉的“贏者通吃”制度,加上普遍的“蜥蜴腳尾”游戲,卻造成對民主黨十分不利的局面。
原來民主黨支持者偏于下層收入者和少數(shù)族裔,這些族群的分布往往集中在城市,造成城市選區(qū)的民主黨人高票當選,浪費大量票源。而共和黨的支持者分布比較均勻,再加上“蜥蜴腳尾”選區(qū)劃分,使得共和黨可以在更多的選區(qū)勝出。2000年總統(tǒng)大選,就是一個很好的例子。戈爾在全國贏得多數(shù)票,可是小布什卻贏得更多的州,從而靠“選舉人票”多數(shù)當選總之,議員選選民的“蜥蜴腳尾”把戲,對美國政治有極重要的影響。在這樣的“民主”制度下,例如布什政府這樣的少數(shù)集團,盡管在環(huán)保、墮胎、槍支管制等方面并不代表美國多數(shù)民意,卻能繼續(xù)主導美國的政治。美國的人口演變大勢,特別是少數(shù)民族人口的快速增長,總的來說對演講完畢,謝謝觀看!演講完畢,謝謝觀看!博弈論與決策管理主講老師:王若文博弈論與決策管理主講老師:王若文王若文,湖南長沙人;1987年畢業(yè)于北京大學中興通訊企管部經理、總裁秘書三一重工人力資源總監(jiān)、行政副總裁彩虹集團人力資源總監(jiān)、副總裁神州通集團人力資源總監(jiān)、培訓總監(jiān)中華網(wǎng)CHINA.COM
中國區(qū)人力資源總監(jiān)
2003年深圳首屆“十大金領”人物之一;
2004年深圳百名“特區(qū)之子”人物之一;
2010年最受歡迎的“中式人本管理專家”;
2011年金蝶公司全國巡場“領袖峰會”金牌主持2013年培訓TOP100-最佳人力資源及領導力管理專家。清華大學總裁班、北京大學匯豐商學院、浙江大學、新疆財經大學、上海財經大學EMBA班特聘領導力和人力資源講師。上市企業(yè)現(xiàn)職:廣州通盈投資公司董事長王若文,湖南長沙人;1987年畢業(yè)于北京大學上現(xiàn)職:廣州通盈七“到”輪回獲取思想,更在乎獲得方法;獲得知識,更在乎解決問題。錯少多學心到眼到耳到口到手到悟到做到練為什么要學?習七“到”輪回獲取思想,更在乎獲得方法;錯少多學心到眼到耳到口P-77頁知道悟到做到得到優(yōu)秀管理者的絕密八字P-4頁知道悟到做到得到優(yōu)秀管理者的絕密八字克服貪嗔癡表達"好"心情微笑、主動、回避、韜光幽默、語氣、適可、得讓謙卑、順從、真誠、舍得一打方法:先處理好心情,再學習好課程克服貪嗔癡表達"好"心情微笑、主動、回避、韜光一打方法:先斯大林時代的蘇聯(lián),一個樂隊指揮坐火車時看樂譜,兩個克格勃軍官以為是密碼,就將他抓了起來,他說那是柴可夫斯基的樂譜,但無無濟于事。第二天,克格勃告訴他,已把他的同伙柴可夫斯基也抓起來了,正在招供。他們倆面臨一種艱難的選擇:如一方招供另一方不招,坦白者從寬判1年,抗拒者從嚴判25年;如果雙方都招供,則各以間諜罪判10年;如雙方均不招供,克格勃無法定罪,各自坐牢3年。他們被分別關押,請問應該招、還是不招?招還是不招?這是個問題斯大林時代的蘇聯(lián),一個樂隊指揮坐火車時看樂譜,兩個克格勃軍官可能的思想斗爭是什么?坦白的原因
1、可能會被判的很輕
2、最壞的結果-10,-1,比-25,-3要好抵賴的原因
1、我沒犯罪,不愿意招
2、雙方抵賴各-3,比雙方坦白各-10好
3、人云:坦白從寬牢底坐穿,抗拒從嚴回家過年可能的思想斗爭是什么?一、博弈論簡介
博弈論(GameTheory)又名對策論,游戲論失火了,屋里人很多,你往哪個門跑—這就是博弈你的行動結果不僅取決于你的策略選擇,同時也取決于他人的策略選擇。它研究個體或組織之間存在利益沖突情況下如何進行最優(yōu)決策。一、博弈論簡介博弈論是40年代數(shù)學家馮·諾依曼和經濟學家奧斯卡·摩根斯坦首先提出的。在經濟學、政治學、社會學獲得了巨大的應用。1994年諾貝爾經濟學獎頒發(fā)給了3位博弈論專家:
納什Nash
、澤爾騰Selten
、哈桑尼Harsanyi
。中國人研究博弈論是有優(yōu)勢的:《三國演義》《孫子兵法》《三十六計》《厚黑學》都是博弈論教材,如何在人與人的博弈中取得成功。博弈論是40年代數(shù)學家馮·諾依曼和經濟
1994年諾貝爾經濟學獎獲得者:美國數(shù)學家JohnF.Nash;德國經濟學家ReinhardSelten;美籍匈牙利經濟學家JohnC.Harsanyi。
1928年Nash出生于美國,1950年獲Princeton大學數(shù)學博士學位,曾先后任教于MIT和Princeton大學。其博士論文《非合作博弈》首次區(qū)分了合作博弈與非合作博弈,并且提出了非合作博弈的納什均衡概念。1930年
Selten出生于現(xiàn)屬于波蘭的德國城市,1961年獲法蘭克福大學數(shù)學博士學位,曾先后任教于柏林自由大學、比勒菲爾特大學和波恩大學。Selten的主要貢獻是首次對分析動態(tài)策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年獲布達佩斯大學博士學位,后逃亡澳大利亞,再到美國,1954年獲斯坦福大學博士學位,曾先后任教于澳大利亞國立大學、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,從而為信息經濟學提供了一個理論基礎。1994年諾貝爾經濟學獎獲得者:1928年Nash出生于美1996年,兩位將博弈論應用于不對稱信息下機制設計的經濟學家莫里斯(Mirrlees)和維克里(Vickrey)獲諾貝爾經濟學獎。2001年三位經濟學家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯賓塞(Spence)因運用博弈論研究信息經濟學所取得的成就而成為該年度的諾貝爾經濟學獎得主。2005年諾貝爾經濟學獎授予羅伯特·奧曼和托馬斯·謝林,以表彰他們“運用博弈論的分析方法對現(xiàn)實的政治、經濟問題進行分析,改變了我們對沖突與合作的理解”。1996年,兩位將博弈論應用于不對稱信息下機制設計的經濟學家博弈的分類1、靜態(tài)博弈與動態(tài)博弈參與者行動的先后順序,靜態(tài)博弈是同時作出決策(不了解對手的決策方案),動態(tài)博弈是參與者先后作出決策(后行動的人知道先行動者的行動方案)。2、完全信息博弈與不完全信息博弈對其他參與者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能確切了解其它決策者收益函數(shù)。3、合作博弈與非合作博弈能否達成一個有約束力的協(xié)議,合作博弈強調集體理性。(經濟學主要討論非合作博弈)4、一次性博弈與重復博弈博弈重復多次進行。(注意區(qū)分動態(tài)博弈)博弈的分類1、靜態(tài)博弈與動態(tài)博弈嚴格地講,博弈論并不是經濟學的一個分支,它是一種方法,應用范圍除經濟學外,還包括政治學、軍事學、外交學、國際關系學、犯罪學等。但為何博弈論受到經濟學的重視呢?主要原因有:1、博弈論在經濟學中得到最廣泛、最成功的應用,尤其在寡頭市場理論中得到直接的應用。2、博弈論的許多成果也是借助于經濟學的例子來發(fā)展的,經濟學家對博弈論的貢獻最大。3、博弈論與經濟學的研究模式一樣:理性人在給定約束條件追求自己的效用最大化。
由于上述原因博弈論逐漸成為主流經濟學最重要的組成部分。嚴格地講,二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)(A、B共同犯罪被抓,警察分開審問)
BA
坦白不坦白
A=10年A=25年
B=10年B=1年
A=1年A=3年
B=25年B=3年坦白不坦白每一個人的結局不僅取決于自身的選擇,同時也取決于對手的選擇不管B坦白不坦白,我坦白總是會少坐一些牢1、囚徒博弈二、博弈論基本模型囚徒困境(完全信息靜態(tài)博弈)坦白不坦白每一囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisoners’Dilemma)”,從博弈論角度看,這是一個存在占優(yōu)均衡的博弈:因為對囚犯A,B來說,無論對方如何選擇,“坦白”都是各自的最優(yōu)選擇。雖然從兩名囚犯共同利益看,最好的選擇是合作,即同時選擇保持沉默,然而,由于猜忌,試圖獲得更大好處等競爭性動機阻礙了它們達到更好的互利選擇,我們將看到,寡頭壟斷廠商經常面臨類似的困境。啟示:個體理性決策常常導致集體非理性結果囚徒困境(完全信息下的靜態(tài)博弈)“囚徒的困境(Prisone“囚徒的困境”還對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。這位經濟學圣人在《國富論》中的名言:“每個人都力圖利用好他的資本,使其能實現(xiàn)最大的價值。一般說來,他并不企圖增進公共福利,他所追求的僅僅是他個人的利益。但在他這樣做的時候,有一只看不見的手引導著他去實現(xiàn)另一種目標,這種目標并非是他本意所要追求的東西。通過追逐個人利益,他經常增進社會利益?!卑凑账姑艿睦碚?,在市場經濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。從某種意義上說,納什提出的非合作博弈的囚徒悖論實際上動搖了西方經濟學的基石?!扒敉降睦Ь场边€對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。例:投標總工程量50,賄賂成本5,甲乙雙方實力相當甲賄賂不賄賂
賄賂不賄賂20200454502525問題:賄賂還是不賄賂?均衡:(賄賂,賄賂)乙2、投標博弈例:投標不賄賂200453、智豬博弈背景:在豬圈里住著一大一小兩頭豬。它們從同一個食槽獲得食物。但食槽的按鈕與食物的出口分布在相反的兩端。每按一次按鈕,可得10個單位食物,但需付出2個單位勞動。規(guī)則:若大豬按按鈕:大豬吃6個單位,小豬吃4個單位;若小豬按按鈕:大豬吃9個單位,小豬吃1個單位;若一起去按:大豬吃7個單位,小豬吃3個單位;問題:哪頭豬將會去按按鈕?
小豬按等待按5,14,4
等待9,-10,0大豬3、智豬博弈背景:大豬經濟學中,這頭小豬也被稱為“免費搭便車者”
現(xiàn)實社會之中的大豬和小豬何其之多:山寨版的橫行股份公司治理中的大股東與小股東大企業(yè)的人才培訓與小企業(yè)的挖腳股市中的散戶跟隨大戶體制改革中的出頭者職場團隊中的小組長與組員公共設施或基礎設施投資:富人與窮人…………經濟學中,這頭小豬也被稱為“免費搭便車者”4、斗雞博弈假設兩只公雞遇到一起,每只都有兩個行動選擇:進攻或后退。后退是很丟面子的事情,若雞甲進攻,乙后退,則甲贏。雙方前進,兩敗俱傷。
雞乙進退
雞甲進-4,-41,-1退-1,1-1,-1雙方都沒有占優(yōu)策略存在兩個穩(wěn)定的狀態(tài)(納什均衡):(-1,1);(1,-1)4、斗雞博弈假設兩只公雞遇到一起,每只都有兩個行動選擇:進攻
雙方都避免兩敗俱傷,斗雞博弈有兩個納什均衡,一方前進,另一方后退。由于有兩個均衡點,結果無法預知。具體博弈結果還取決于其他因素。20世紀60年代蘇美間的古巴導彈危機就是一個斗雞博弈的很好例子。古巴導彈危機是冷戰(zhàn)時期蘇美之間最嚴重的一次危機,赫魯曉夫1962年偷偷將導彈運到古巴對付美國,被美國U2飛機偵察到,美國派出攜帶核武器的戰(zhàn)機、航母,威脅蘇聯(lián)限期從古巴撤出導彈。蘇美這兩只大公雞均在考慮進還是退?戰(zhàn)爭的結果當然是兩敗俱傷,但任何一方退下來則是很不光彩的事。博弈結果是蘇聯(lián)從古巴撤回了導彈,做了丟面子的“撤退的雞”,而美國堅持了自己的策略,做了“不退的雞”。當然為了給蘇聯(lián)面子,同時也擔心戰(zhàn)爭,美國也從土耳其撤了一些導彈。雙方都避免兩敗俱傷,斗雞博弈有兩個納什均衡,一方前進例:兩個寡頭進行價格戰(zhàn)博弈的收益矩陣。10,1050,50-50,100100,-50低價低價高價高價廠商B廠商A三、博弈論中的均衡博弈論中的均衡是一組穩(wěn)定的博弈結果。雙方均不愿先改變策略。博弈的均衡是穩(wěn)定的,因而是可以預測的。例:兩個寡頭進行價格戰(zhàn)博弈的收益矩陣。10,1050,50占優(yōu)策略,又稱支配性策略(dominantstrategy)此類博弈中存在一種策略,無論B選擇何行動,該策略對A都是最優(yōu),則稱此策略為博弈者A的占優(yōu)策略。在本例中,廠商A和廠商B都有不受他人策略影響的占優(yōu)策略,即選擇低價。占優(yōu)均衡,支配均衡每個參與者都有并都選擇占優(yōu)策略,由此實現(xiàn)的均衡稱占優(yōu)均衡。本例為(10,10)。1、占優(yōu)均衡占優(yōu)策略,又稱支配性策略(dominantstrategy2、納什均衡納什均衡(非合作性均衡):納什均衡是這樣一組策略,它使所有博弈參與者都不能再提高其收益。此時,雙方在對方給定的策略下均不愿意調整自己的策略。下例中,A有占優(yōu)策略即正常價格策略,而廠商B沒有占優(yōu)策略,它必須根據(jù)A的占優(yōu)策略來確定其戰(zhàn)略選擇,即其選擇受A的選擇的影響。100,20010,10150,-30-20,150高價格正常價格廠商B廠商A高價格正常價格2、納什均衡納什均衡(非合作性均衡):100,20010,13、占優(yōu)均衡與納什均衡的區(qū)別
占優(yōu)均衡:我所做的是:不管你做什么我所能做的最好的。你所做的是:不管我做什么你所能做的最好的。納什均衡:我所做的是:給定你所做的我所能做的最好的。你所做的是:給定我所做的你所能做的最好的。占優(yōu)均衡是納什均衡的一個特例3、占優(yōu)均衡與納什均衡的區(qū)別占優(yōu)均衡:我所做的是:不管四、最大最小策略迄今為止,對廠商行為的分析都建立在利潤最大化基礎上。但在一些競爭激烈的寡頭壟斷市場,馮·諾依曼和摩根斯坦認為決策者也可能采取一種風險厭惡策略,即確保在最壞的結果中得到最好的結果。這種決策規(guī)則稱最大最小策略(MaximinStrategy):博弈者在可能最少的利潤方案中選擇利潤最大的方案。四、最大最小策略迄今為止,對廠商行為的分析都建立在利潤最大化風險與均衡由于納什均衡要求理性共識和一致預期,當人們可能犯小小的錯誤時,納什均衡不一定被選擇。如下面這個博弈中,假定你是A,則多數(shù)人將選擇“下”而不是“上”。上下
左
右8,10-1000,97,66,5只要B有千分之一的概率錯誤地選擇右,A的后果將是災難性的,A將極力避免這種風險,因此會選擇下。所以,出現(xiàn)的不是納什均衡BA風險與均衡由于納什均衡要求理性共識和一致預期,當人們可能犯小
如果企業(yè)謀求利潤最大化,將有兩個納什均衡,一家企業(yè)投資推出新產品,另一家企業(yè)不投資產品。最大最小策略,不是利潤最大化策略,準確說,它是用來避免十分不利結果的。對企業(yè)1來說,如果它不投資新產品,利潤最小是300萬,如果它投資,利潤最小是200萬。對企業(yè)2數(shù)字也相同。兩家企業(yè)都在最小利潤中選最大值。結果是兩家企業(yè)都不投資新產品。因為這樣的策略能保證至少獲得300萬利潤。戰(zhàn)略不投資投資投資4,43,66,32,2廠商1廠商2(單位百萬)不投資
雙寡頭企業(yè)都在考慮是否投資推出新產品。如果企業(yè)謀求利潤最大化,將有兩個納什均衡,一家企業(yè)投資最大最小策略的結果并不是兩種納什均衡中的一種。原因是這種決策所用的準則,不是利潤最大化,而是避免虧損過多,最大最小策略是一種保守的策略。不同的決策目標可能導致人們選擇不同的策略,最終導致不同的博弈結果。最大最小策略的結果并不是兩種納什均衡中的一種。五、重復剔除嚴格劣戰(zhàn)略“重復剔除嚴格劣戰(zhàn)略”的思路如下:1、首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個劣戰(zhàn)略剔除后,剩下的是一個不包含已剔除劣戰(zhàn)略的新的博弈;然后再剔除這個新的博弈中的劣戰(zhàn)略;繼續(xù)這個過程,直到沒有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個唯一的戰(zhàn)略組合就是“重復剔除占優(yōu)均衡”。2、如果這樣的解存在,該博弈是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 全面支持項目拓展項目咨詢服務合同
- 電力電纜敷設合同
- 二手房買賣合同的注意事項
- 苗木購銷合同范本詳細文件
- 活動外包保安服務合同
- 購銷合同中的布料數(shù)量規(guī)定
- 技術引進與技術推廣協(xié)議
- 建筑塔吊勞務合作合同
- 模具購買合同模板
- 軟件購買合同示范文本
- T∕CTSS 38-2021 滇紅工夫紅茶
- 電工二級技師測試題與答案
- 品管圈PDCA持續(xù)質量改進提高靜脈血栓栓塞癥規(guī)范預防率
- 綜合計算工時工作制實施方案42620
- 重力學:第二章 地球正常重力場
- 路面基層厚度、芯樣完整性試驗檢測記錄表(鉆芯法)
- 露天礦采場現(xiàn)場安全檢查表
- 基于MATLAB的三相交流電機調壓調速系統(tǒng)的仿真
- 事業(yè)單位管理崗位職員等級晉升審批表
- 勞技 水仙雕刻造型設計(第一課時)
- 2022年導電炭黑行業(yè)發(fā)展現(xiàn)狀及競爭格局分析
評論
0/150
提交評論