運籌學-決策論_第1頁
運籌學-決策論_第2頁
運籌學-決策論_第3頁
運籌學-決策論_第4頁
運籌學-決策論_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第11章決策論TheoryofDecision11.1決策分析的基本問題11.2確定型和非確定型決策11.3風險型決策

11.4效用理論11.5馬爾可夫決策

運籌學

Operations

Research

11.1決策分析的基本問題決策(DecisionMaking)是一種對已知目標和方案的選擇過程,當人們已知確定需實現(xiàn)的目標是什么,根據(jù)一定的決策準則,在供選方案中做出決策的過程。諾貝爾獎獲得者西蒙認為,管理就是決策,他認為決策是對稀有資源備選分配方案進行選擇排序的過程。學者Gregory在《決策分析》中提及,決策是對決策者將采取的行動方案的選擇過程。決策科學包括決策心理學、決策的數(shù)量化方法、決策評價以及決策支持系統(tǒng)、決策自動化等。隨著計算機和信息通信技術的發(fā)展,決策分析的研究也得到極大的促進,隨之產(chǎn)生了計算機輔助決策支持系統(tǒng)(DecisionSupportSystem),許多問題在計算機的幫助下得以解決,在一定程度上代替了人們對一些常見問題的決策分析過程。11.1決策分析的基本問題11.1.1決策分析基本概念決策狹義決策認為決策就是作決定,單純強調最終結果;廣義決策認為將管理過程的行為都納入決策范疇,決策貫穿于整個管理過程中。決策目標決策者希望達到的狀態(tài),工作努力的目的。一般而言,在管理決策中決策者追求的當然是利益最大化。決策準則決策判斷的標準,備選方案的有效性度量。決策屬性決策方案的性能、質量參數(shù)、特征和約束,如技術指標、重量、年齡、聲譽等,用于評價它達到目標的程度和水平。科學決策過程任何科學決策的形成都必須執(zhí)行科學的決策程序,如圖11-1所示。決策最忌諱的就是決策者拍腦袋決策,只有經(jīng)歷過圖11-1所示的“預決策→決策→決策后”三個階段,才有可能產(chǎn)生科學的決策11.1決策分析的基本問題11.1決策分析的基本問題調查研究確定決策目標搜集有關的信息資料預測技術預測未來的可能情況擬訂各種可行方案可行性研究方案評估決策準則方案選擇方案實施預決策決策實施情況反饋意見決策后圖11-1科學決策過程11.1決策分析的基本問題決策系統(tǒng)狀態(tài)空間、策略空間、損益函數(shù)構成了決策系統(tǒng)。①狀態(tài)空間不以人的意志為轉移的客觀因素,設一個狀態(tài)為Si,有m種不同狀態(tài),其集合記為:S稱狀態(tài)空間,S的元素Si稱為狀態(tài)變量。②策略空間人們根據(jù)不同的客觀情況,可能做出主觀的選擇,記一種策略方案為Ui,有n種不同的策略,其集合為:U稱為策略空間;U的元素Uj稱為決策變量。③損益函數(shù)當狀態(tài)處在Si情況下,人們做出Uj決策,從而產(chǎn)生的損益值Vij,顯然Vij是Si,Uj的函數(shù),即:11.1決策分析的基本問題當狀態(tài)變量是離散型變量時,損益值構成的矩陣叫損益矩陣上述三個主要素組成了決策系統(tǒng),決策系統(tǒng)可以表示為三個主要素的函數(shù):D=D(S,U,V)人們將根據(jù)不同的判斷標準原則,求得實現(xiàn)系統(tǒng)目標的最優(yōu)(或滿意)決策方案。11.1決策分析的基本問題11.1.2決策分析基本原則1.最優(yōu)化(滿意)原則2.系統(tǒng)原則3.可行性原則4.信息對稱、準全原則11.1.3決策分析基本分類表11-1按影響范圍戰(zhàn)略決策、戰(zhàn)役決策、戰(zhàn)術決策按狀態(tài)空間確定型決策、非確定型決策、風險型決策按決策時間程序化決策、半程序化決策、非程序化決策按描述方法定性化決策、定量化決策按目標數(shù)量單目標決策、多目標決策按連續(xù)性單級決策、序貫決策按決策者數(shù)量個人決策、群決策按問題大小宏觀決策、微觀決策表11-2程序化、非程序化、半程序化決策決策類型傳統(tǒng)方法現(xiàn)代方法程序化現(xiàn)有的規(guī)章制度運籌學、管理信息系統(tǒng)(MIS)半程序化經(jīng)驗、直覺灰色系統(tǒng)、模糊數(shù)學等方法非程序化經(jīng)驗、應急創(chuàng)新能力人工智能、風險應變能力培訓11.1決策分析的基本問題下一節(jié):確定型和非確定型決策11.1決策分析的基本問題11.2確定型和非確定型決策11.2確定型和非確定型決策11.2.1確定型決策確定型決策是指決策的未來狀態(tài)是已知的,只需從備選的決策方案中,挑選出最優(yōu)方案?!纠?1.1】某企業(yè)根據(jù)市場需要,需添置一臺數(shù)控機床,可采用的方式有三種:甲方案:引進外國進口設備,固定成本1000萬元,產(chǎn)品每件可變成本為12元;乙方案:用較高級的國產(chǎn)設備,固定成本800萬元,產(chǎn)品每件可變成本為15元;丙方案:用一般國產(chǎn)設備,固定成本600萬元,產(chǎn)品每件可變成本為20元;試確定在不同生產(chǎn)規(guī)模情況下的購置機床的最優(yōu)方案?!窘狻看祟}為確定型決策.利用經(jīng)濟學知識,選取最優(yōu)決策.最優(yōu)決策也就是在不同生產(chǎn)規(guī)模條件下,選擇總成本較低的方案.各方案的總成本線如圖11.2.圖11.2TC甲=F甲+Cv甲Q=1000+12QTC乙=F乙+Cv乙Q=800+15QTC丙=F丙+Cv丙Q=600+20Q圖中出現(xiàn)了A、B、C三個交點,其中A點經(jīng)濟意義:在A點采用甲方案與丙方案成本相同TC甲=TC丙,F(xiàn)甲+Cv甲QA=F丙+Cv丙QA

Q=5011.2確定型和非確定型決策同理:B點TC乙=TC丙,F(xiàn)乙+Cv乙QB=F丙+Cv丙QB

C點:TCL甲=TC乙,F(xiàn)甲+Cv甲QC=F乙+Cv乙QC

B點經(jīng)濟意義為:當生產(chǎn)40萬件時,采用乙方案和采用丙方案成本相同均為1400萬元.圖11.211.2確定型和非確定型決策得到生產(chǎn)規(guī)模最優(yōu)方案為:當生產(chǎn)規(guī)模產(chǎn)量小于40萬件時,采用丙方案;當生產(chǎn)規(guī)模產(chǎn)量大于40萬件,小于200/3萬件時,采用乙方案;當生產(chǎn)規(guī)模產(chǎn)量大于200/3萬件時,采用甲方案.其經(jīng)濟意義為:當生產(chǎn)規(guī)模為萬件時,采用甲、乙方案成本相同.從圖中可知:當生產(chǎn)規(guī)?!躋B時,采用丙方案;當QB<生產(chǎn)規(guī)?!躋C時,采用乙方案;當QC<生產(chǎn)規(guī)模時,采用甲方案.圖11.211.2確定型和非確定型決策11顏.2毛.2非確證定型映決策(1)狀鉤態(tài)空商間偵是指維不以劉人的職意志證為轉饒移的士客觀億因素臂,設偏一個嶺狀態(tài)是為Si,有m種不燭同狀膏態(tài),吃其集州合記般為:S稱狀榆態(tài)空炎間;S的元王素Si稱為望狀態(tài)炎變量馬.由于威在非陸確定睡決策插中,制各種捷決策聰環(huán)境版是不州確定貝的,急所以挽對于弦同一爆個決艷策問政題,悼用不甩同的寬方法脹求值零,將營會得款到不喊同的翻結論移,在舒現(xiàn)實月生活床中,持同一皆個決道策問辰題,名決策零者的歪偏好凱不同挖,也原會使訪得處雁理相比同問溫題的沙原則蛇方法眨不同饑.(2)策每略空內(nèi)間照是指買人們秀根據(jù)刊不同刮的客吵觀情柱況,襯可能云做出衣主觀硬的選高擇,給記一匠種策蛇略方溪案為Ui,有n種不驢同的鈔策略報,其浮集合11野.2確定席型和緣瑞非確辣定型滾決策U稱為木策略凱空間歇;U的元說素Uj稱為副決策然變量捏.(3)損熱益函區(qū)數(shù)茶是撫指當億狀態(tài)寧處在Si情況鑄下,枝人們氧做出Uj決策殊,從年而產(chǎn)鈔生的震損益預值Vij,顯然Vij是Si、Uj的函刻數(shù),撫即當狀兼態(tài)變緒量是歉離散鮮型變屑量時牧,損忌益值交構成瞞的矩示陣叫論損益蘆矩陣貓.11色.2確定指型和吊非確昌定型帽決策或簡懂記為上述嶄三個餡主要挪素組卻成了抗決策呆系統(tǒng)裹,決濫策系喝統(tǒng)可矮以表哲示為置三個魄主要羅素的立函數(shù)刊:D=D(S,U,V)常用授的非齡確定濫型準把則有5種:1.悲觀裂準則2.樂觀草準則3.折衷鐮法、副實用誘主義鏟準則4.等可熔能性撓準則5.最小倉機會論損失襖(后?;冢┗艤蕜t11梳.2確定棒型和劃非確燦定型購決策【例11狗.2感】某公辜司為法經(jīng)營煮業(yè)務須的需鴉要,鄭決定優(yōu)要在拋現(xiàn)有辭生產(chǎn)體條件敘不變遞的情蠟況下寒,生境產(chǎn)一棚種新察產(chǎn)品此,現(xiàn)過可供胸開發(fā)輩生產(chǎn)濟的產(chǎn)賀品有I、朱II霧、I侍II旬、I足V四種獅不同對產(chǎn)品預,對賢應的求方案頭為A1,A2,A3,A4.由于走缺乏蟲相關底資料傘背景須,對館產(chǎn)品續(xù)的市笨場需拖求只促能估下計為糠大中胖小三描種狀少態(tài),過而且?guī)鷮τ诹忝糠N圓狀態(tài)西出現(xiàn)粗的概耕率無肺法預冒測,碼每種勉方案虎在各但種自鄙然狀栗態(tài)下你的效辛益值梨表,退如表11怎.3所示五.表11努.3效益役值表(單位度:萬橡元)自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3A1:生產(chǎn)產(chǎn)品I800320-250A2:生產(chǎn)產(chǎn)品II600300-200A3:生產(chǎn)產(chǎn)品III30015050A4:生產(chǎn)產(chǎn)品IV40025010011汽.2確定采型和編非確增定型鍛決策(1)小袖中取朽大法想(悲秒觀主陽義準濃則ma伙xm押in)則對陜應的A4方案面為決火策方腔案,龍即生貝產(chǎn)產(chǎn)赴品IV幟.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3minmax生產(chǎn)產(chǎn)品I800320-250-250生產(chǎn)產(chǎn)品II600300-200-200生產(chǎn)產(chǎn)品III3001505050生產(chǎn)產(chǎn)品IV400250100100100策略遵值為11詳.2確定怖型和可非確鋒定型拘決策(2哭)大中湖取大欺法(樂觀途主義垃準則ma軟xm阿ax)則對階應的A1方案拳為決夜策方牛案,滲即生俘產(chǎn)產(chǎn)陡品I.自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3maxmax生產(chǎn)產(chǎn)品I800320-250800800生產(chǎn)產(chǎn)品II600300-200600生產(chǎn)產(chǎn)品III30015050300生產(chǎn)產(chǎn)品IV400250100400策略鮮值為11勿.2確定屑型和瘡非確鮮定型趁決策(3)最小走機會礙損失愁準則(Mi敵ni方ma撲xre群gr裝etcr臂it棉er鞭io增n)編制講機會圍損失淹表:找出指每個抄方案稍的最聯(lián)大機清會損惑失Zi:選擇紹最小毅的機付會損扯失值:對應括的方麥案l即為文所決飯策方村案

自然狀態(tài)

生產(chǎn)方案需求量大S1需求量中S2需求量小S3Maximum決策結果A1:生產(chǎn)產(chǎn)品I00350350

A2:生產(chǎn)產(chǎn)品II20020300300生產(chǎn)產(chǎn)品IIA3:生產(chǎn)產(chǎn)品III50017050500

A4:生產(chǎn)產(chǎn)品IV400700400

則應躍選對胞應的A2方案粘為決臉策方廉案,柏即生倘產(chǎn)產(chǎn)剪品Ⅱ11傘.2確定臘型和游非確月定型俘決策策略巧值為(4)等饑可能梅性決亂策準淹則(Eq鎖ua嚼l圖li謙ke桶l(fā)i爭ho酷od穴c爸ri答te這ri通on飯)自然狀態(tài)供選方案Ai需求量大S1需求量中S2需求量小S3E(Ai)max生產(chǎn)產(chǎn)品I800320-250290290生產(chǎn)產(chǎn)品II600300-200700/3生產(chǎn)產(chǎn)品III30015050500/3生產(chǎn)產(chǎn)品IV400250100250則應眉選擇膨對應亂的A1方案搶為決羨策方循案,姿即生瘡產(chǎn)產(chǎn)熟品I11棟.2確定箱型和枝非確嗎定型駐決策(5辭)折衷礎法,最現(xiàn)實押主義獅準則(Hu聽rw衫ic故zcr德it詠er蓬io挺n)ma善x滴mi早n法是處當=0時狀孔態(tài),ma欠x屈ma謀x是=1時狀慚態(tài).原則:決策者給出樂觀系數(shù)則說明決策者越接近悲觀;則說明決策者越接近樂觀.

自然狀態(tài)

0.30.7

生產(chǎn)方案需求量大S1需求量中S2需求量小S3MaxMin加權平均決策結果A1:生產(chǎn)產(chǎn)品I800320-250800-25065

A2:生產(chǎn)產(chǎn)品II600300-200600-20040

A3:生產(chǎn)產(chǎn)品III3001505030050125

A4:生產(chǎn)產(chǎn)品IV400250100400100190生產(chǎn)產(chǎn)品IV則應橋選擇乘對應待的決乒策方碼案A4嗎,即生攪產(chǎn)產(chǎn)尿品IV塞。11磚.2確定國型和再非確寫定型模決策下一驅節(jié):戴風險子型決注策11足.2確定弊型和晉非確攪定型炒決策作業(yè)暮:教值材P2斥68腐T辮1、211厲.3風險期型決堪策11煎.3風險免型決中策風險垮型決朽策是鉆指每丘種自停然狀腥態(tài)出削現(xiàn)的應概率則大體艱可以灣估計摸,并仍可算嘉出在吼不同炮狀態(tài)拔下的單效益哈值.11掃.3鼓.1期望璃值準計則(Ex桂pe炕ct成ed振v蔑al疼ue外c討ri府te綁ri運on療)求效熔益期色望值EM悅V。效益鳳期望墊值=∑條件混效益開值×概率辭,即選擇合最大撓效益軌期望陶值所修對應瘡的方托案為宏決策榮方案1.最大概效益拘期望歸值準互則11杯.3風險辟型決旋策【例11林.3查】某電仗訊公好司決場定開瞎發(fā)新膝產(chǎn)品鼻,需恨要對民產(chǎn)品慕品種旋做出某決策造,有然三種檔產(chǎn)品A1,A2,A3可供離生產(chǎn)遣開發(fā)茅。未墻來市仔場對寧產(chǎn)品廟需求衛(wèi)情況向有三欣種,希即較澆大、石中等經(jīng)、較濤小,停經(jīng)估替計各溉種方沙案在怪各種孩自然敘狀態(tài)莫下的停效益敢值,孫見表11-5.各悲種自偵然狀按態(tài)發(fā)透生的蒜概率草分別邊為0.遼3,0.系4和0.祖3.那艇么工慎廠應始生產(chǎn)毀哪種孤產(chǎn)品競,才釀能使斬其收盜益最孤大歌。表11-5效益咬表(單位唯:萬壁元)方案需求量較大p1=0.3需求量中等p2=0.4需求量較小p3=0.3A15020-20A23025-10A310101011搏.3風險因型決糞策【解加】效益動的期醫(yī)望值你表如蔽下

自然狀態(tài)

期望

生產(chǎn)方案需求量大S1需求量中S2需求量小S3收益決策A1:生產(chǎn)產(chǎn)品I5020-2017生產(chǎn)產(chǎn)品IA2:生產(chǎn)產(chǎn)品II3025-1016

A3:生產(chǎn)產(chǎn)品III10101010

狀態(tài)概率0.30.40.3

因此復選擇詳相應榴方案好,即紫開發(fā)A1產(chǎn)品凱。求每循個方蛋案的交期望徒后悔箏值,奮最小笨期望杰后悔館值對姻應的卸方案駕即為辱所選況方案幸。求虧解過順程留臭給同軍學們霞作練張習。除了影前面7種決臂策準闖則外舍,還乳有完逝全信快息期肢望值療準則(EV炭PI豎:E辰xp燭ec傍te嗓dva參lu述e切of演p協(xié)er窩fe調ct梅i元nf辮or前ma袋ti收on塔)樣本閘信息具期望爹值準撈則Ex螞pe祝ct均ed祥v街al偷ue針o嫌f否sa略mp蘿le妻i繭nf峽or繳ma猴ti積on磚(落EV寫SI夾)完全補信息膜后悔筒值期座望值旅準則Ex凳pe辯ct孟ed叛r態(tài)eg爭re誘t餅va遙lu熔e屑of銷p尚er財fe朝ct眠i泛nf俊or探ma侍ti獨on2最小同期望億后悔價值準雅則(Ex息pe印ct賓ed達r指eg舊re贊t阻va臭lu聽e)11保.3風險檢型決凡策11認.3風險盜型決眨策11即.3塊.2決策愧樹法腥(De報ci然si毫on仗T液re溝e)決策參樹是膽由決生策點茄、事款件點做及結盟果構昏成的魔樹形舉圖,惡一般氏應用爽于序授列決鐵策中復。□:表示痛決策示點,椒也稱芝為樹賢根,沫由它漫引發(fā)夢的分部枝稱暖之為籌方案扇分枝泊,方上案節(jié)腸點被豈稱為滋樹枝猴.n條分姐枝表潛示有n種供系選方脫案.〇:表示輩策略睡點,攜其上碑方數(shù)賴字表惰示該桑方案扯的最拒優(yōu)收若益期夜望值醫(yī),由忌其引崗出的m條線越稱為罷概率射枝表鋒示有m種自超然狀樂態(tài),茅其發(fā)迅生的潑概率織已標液明在姥分枝飲上.△:表忘示每閑個方裳案在瞧相應匯自然損狀態(tài)尋的效論益值幻玉.╫:戀表示保經(jīng)過滋比較麥選擇竄此方草案被掌刪除劑掉了污,稱塌之為裁剪枝搶.方法扇:①根據(jù)紡題意券作出偉決策剃樹圖可;②從右疼向左度計算險各方漸案期格望值嗽,并餃進行蛾標注是;③對期掃望值瘋進行遙比較院,選嘩出最跳大效康益期副望值炊,寫蟻在□上方赴,表比明其慨所對炒應方呈案為與決策駁方案富,同肉時在械其它腸方案模上打練上╫刪除攻.HH1HiHmE(曾H1)E(謙Hi)E(族Hm)V11V1jV1nVi1VijVinVm1VmjVmnpjpnp1pjpnp1pjpn圖14-3決策勻樹圖ma雀x{汪E(共Hi)}11穿.3風險負型決再策【例撓11漫.4嫁】某廠仙決定示生產(chǎn)蝦某產(chǎn)櫻品,寸要對妻機器撐進行窄改造編.投婚入不擦同數(shù)蜓額的慢資金蜂進行拉改造股有三蛋種方互法,篩分別匆為購還新機按器、限大修矛和維喚護,渴根據(jù)努經(jīng)驗,銷路怕好發(fā)述生的嘉概率劉為0.退6.相景關投丙入額端及不漸同銷峰路情隆況下楊的效稼益值豆如表11疾.6所示尿,請掘選擇脾最佳掃方案趨.表11演.6效益曲值表(單位彈:萬爬元)供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4A1:購新1225-20A2:大修820-12A3:維護515-811卡.3風險浴型決僵策供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4A1:購新1225-20A2:大修820-12A3:維護515-8解①根據(jù)阿題意哥,作森出決肯策樹撇,見私圖11-4.②計算濫各方津案的釀效益曉期望持值:③最大披值為選對預應方哄案A3,即維商護機恰器,嗓并將A1,A2剪枝冊.11動.3風險沸型決稠策供選方案投資額Ti銷路好p1=0.6銷路不好p2=0.4期望值A1:購新1225-20-5A2:大修820-12-0.8A3:維護515-80.8A0.旱8A1A2A3-5-0楊.80.曬825好0.壇6-2繼020-1215-8不好0.粗4圖14-4決策閣樹圖好0.兆6不好0.筑4好0.桿6不好0.蜂4購新大修維護11喊.3風險買型決虛策多級床決策耐問題【例11衡.5勺】某公裳司由芝于市催場需林求增勺加,槳使得同公司摟決定翻要擴討大公旨司規(guī)返模,基供選點方案眾有三寇種:坑第一崇種方扶案,恨新建謊一個收大工但廠,松需投麗資25悉0萬元長;第早二種低方案勿,新等建一扭個小肚工廠窗,需扁投資15定0萬元晝;第夕三種震方案描,新群建一湖個小趙工廠偷,2年后薪若產(chǎn)謙品銷躬路好鎖再考分慮擴最建,膚擴建傻需追無加12變0萬元跑,后3年收央益與劈燕新建擁大工擾廠間恐.如表11舅.7所示禍,根瀉據(jù)預挺測該壁產(chǎn)品懼前三厲年暢雞銷和寺滯銷絮的概撐率分濁別為0.垃6,0.伏4.若粉前2年暢階銷,堂則后3年暢務銷后唱滯銷右概率封為0.餓8,0.悉2;若稅前2年滯逢銷,估則后3年一映定滯嫩銷.摸請對突方案招做出決選擇貓.11狐.3風險扭型決跡策表11乖.7效益越值(單位躺:萬防元)自然狀態(tài)概率供選方案與效益前2年后3年大工廠小工廠先小后大前2年后3年暢銷0.6暢銷0.8滯銷0.21508080150滯銷0.4暢銷0滯銷1-502020-50成本250150150120解擁(1)畫狐決策付樹11邊.3風險智型決仔策暢銷0.牙815委0滯銷0.詠2-5熟0533陪06-1富50滯銷1-5融0228暢銷0.距6滯銷0.輛4暢銷0.答880滯銷0.殖220720謹4860滯銷120310術8.取4暢銷0.駁6滯銷0.未4暢銷0.那815雖0滯銷0.久2-5井021預01220虧41121杠0擴建不擴背建9暢銷0.羅8滯銷0.劫2802041020滯銷1暢銷0.辯6滯銷0.張460后3年前2年111往2大工境廠小工債廠先小婦后大11莊2圖11-11決策衫樹圖解盜(1)畫倚決策亂樹12掀015弓015桶025完0比較荒方案,E(尋4)最大廈,則著取最模大值11犧2,對筆應的單方案勻是先膜小后糠大作療為選稿定方腰案,朵即先希建小床廠,饅后擴薦建大股工廠惠的方剖案為喜最終徑方案11棗.3風險臉型決壟策11侄.3粉.3貝葉五斯決筋策Ba遇ye友si規(guī)an慶D滴ec跪is和io騙n開始者人們咱對原趣來的干狀態(tài)邪參數(shù)死提出芹某一程概率華分布筋。后你來通肢過調孫查又啦獲得郊許多企信息柏,只鮮要原暮來信車息不誦是錯敘誤的籍,則把應該交用后囑來的比補充燃信息很修正冒原來泛的認代識。漁用補壟充的俱情報底改進屆原來編的概煌率分藍布。將依帽據(jù)過誓去的爽信息尤或經(jīng)償驗由密決策次者估蘆計的剝概率顯稱之跳為主刷觀概復率.未收丘到新公信息耽時根玩據(jù)已際有信姑息和森經(jīng)驗畏,估養(yǎng)計出即的概菠率分吉布稱當為先驗辮概率;用隨債機試潮驗確勁定出案的概千率稱仿為客觀總概率.收到擱新信填息,修正陡后的垃概率絲式分布代稱為后驗放概率事件B已經(jīng)扯發(fā)生膨的條番件下僑,事閉件A發(fā)生抗的概某率,智稱為頁事件A在給剩定B下的條件琴概率貝葉盟斯公陵式:若A1、A2、…構成街一個婆完備交事件天,P(Ai)>翁0,則對顆任何氣概率托不為掉零的眠事件B,有11肥.3風險撞型決蘇策更一般診地此公式高為后食驗概薦率11元.3風險虜型決燃策產(chǎn)品需求量x0100200300400先驗概率p(xi)0.050.150.30.250.25例如捧,根頁據(jù)以盾往的拘經(jīng)驗刻,產(chǎn)忙品需岡求量峰的概殺率為產(chǎn)品連進入泛市場2個月滿的試州銷后芽,需領求量脅的樣黎本信草息(比例)為產(chǎn)品需求量0100200300400需求量比例0.050.150.350.250.20貝葉須斯公方式:若A1、A2、…構成亦一個友完備矮事件綁,P(Ai)>鈴0,則對債任何闊概率搜不為裕零的味事件B,有11么.3風險鋪型決慕策【例】盒子桃里有10橋0枚均鋼勻的配硬幣郊,有60枚是五正常哥的,40枚兩辯面都四是徽煮。從僑盒子暈中任側取一蔑枚讓陸你猜鞋是哪剖一類壁硬幣期。猜岡中得5元,或猜不托中不臺得錢蓮。你摘猜是假哪一脊類?B1(正常)B1(雙徽)3/52/5A1(猜正常)50A2(猜雙徽)05獲利懶的期叫望值V(保A1)=盼5×謙3/研5+燒0×翁2/紀5=叉3V(緩A2)=謹0×優(yōu)3/忙5+顫5×猾2/董5=劫2正確專的決悠策是串:應鈔該選豬擇猜龜正常11移.3風險護型決托策如果搜現(xiàn)在涉拋擲3次,3次都急出現(xiàn)鋸徽,述你又魚如何漏猜?罵該硬抖幣是挑正常匙的概宿率為施多少刊,是器雙徽柳的概怪率為蚊多少慌。設H為3次出溫現(xiàn)反高面這玩一隨誦機事專件,B1為硬臺幣是稠正常長,B2為硬議幣是命雙徽估,則3次撒都出現(xiàn)抱雙徽沿的概櫻率為摘:11稻.3風險惠型決著策B1(正常)B1(雙徽)3/1916/19A1(猜正常)50A2(猜雙徽)05用后驗蓋概率掘代替委原來炸的概滿率,位決策后矩陣堵為:獲利協(xié)的期按望值V(裂A1)=置5×暴3/注19兵+0扭×2籍/5拐=1濁5/毫19V(烈A2)=鄙0×舌3/睜5+姜5×夫16度/1己9=舒80黎/1飯9正確銹的決嚴策是愚:應榜該選淘擇猜熟雙徽11擾.3風險紛型決抗策根據(jù)樓過去讀經(jīng)驗小可知表當自漆然狀液態(tài)為Nj條件癥下調角查結爪果為Zk的條怒件概執(zhí)率再利儲用貝奪葉斯桶公式綱和全區(qū)概率巧公式糾,求鵝當結鳳果為ZK的條爸件下到自然愁狀態(tài)睛為Nj的條擦件概權率11沙.3風險耽型決浸策在后敵驗分濫析中淋用代替桌先驗極分析禁中的P(Nj),利用仔期望售值準壩則計添算出Ek再根任據(jù)全慮概率斤公式替,可耗知結揮果為Zk的概恨率為因此窯,后醬驗分悟析的姑效益何期望躬值為11錯.3風險奮型決爸策當狀肢態(tài)只攏有兩旦個時饑,后惠驗概述率及鄰期望粉收益群可用功快捷色公式馳計算終。記圣先驗睡概率貓向量鄰為P,條件月概率鈔矩陣減為A,后驗瘡概率甘矩陣帖為B,收益柄矩陣諒為V,有則先因驗收挎益期雷望值元向量情為EM曠V1=PTV后驗棵收益哀期望滅值矩貌陣為Ek=BV11餐.3風險橋型決聚策【例11齊.6銳】某廠江對一舍臺機罷器的想換代儀問題洞做決扭策,宏有三營種方宣案:A1為買譯另一敞臺新茅機器魯;A2為對刊老機基器進乳行改細建;A3是維解護加臺強.珍輸入盾不同近質量咬的原吹料,炎三種哭方案耀的收策益見免表11狐.8.約鑄有30番%的原雖料是凱質量播好的改,還胸可以壇花60瓜0元對顯原料繡的質梨量進日行測污試,役這種片測試撫可靠哲性見兄表11布.9.求華最優(yōu)窮方案就.11洪.3風險錯型決命策原料的實際質量N1好N2差測試結果Z1好0.80.3Z2差0.20.7原料質量Ni購新機器A1改建老機器A2維護老機器A3N1好(0.3)31.00.8N2差(0.7)-1.50.50.6表11頭.9測試艙可靠眨性表11嬸.8收益望表(單位坦:萬活元)11暑.3風險尼型決見策【解】(1)若蹄不做東測試己,各膝方案府的先挎驗收野益應選駐方案3,維溝護老藝機器住。(2勸)計算桂后驗盈概率已知聯(lián)合炒概率難為:11眼.3風險信型決幻玉策邊際粒概率竹為代入鋼(11敵.2)從惕而可膏得后親驗概均率11寶.3風險相型決蛾策則有即當穗測試脹結果菌為原龍料的著質量歷好,殼則購塊買新逼機器臺;若磁測試捕結果緒為原絨材料掘的質策量差尾,則商維護桌老機認器。決策涌為:鑰應花60亮0元進拍行測騰試,初測試祥后若攤質量憲好,顛購入秧新機購器生扭產(chǎn);撲若質拆量差上,維巴護老憐機器藝生產(chǎn)【例】石油幫開發(fā)面決策巾問題收益勘探-250鉆探-150賣出收益90有油時收益800干涸時收益011巴.3風險位型決慘策11陶.3風險搭型決艙策自然狀態(tài)先驗概率好(FSS)不好(USS)有油(Oil)P(O)=0.6P(F|O)=0.8P(U|O)=0.2干涸(Dry)P(D)=0.4P(F|D)=0P(U|D)=1P(嘴Fi羽nd亂in僚g勘探到結果|St鍋at趁e自然割狀態(tài))后驗概率P(自然狀態(tài)|勘探結果)勘探結果邊際概率有油(Oil)干涸(Dry)好(F)不好(U)勘探世好的狗概率饒:P(難F)端=P廢(O夠)*單P(兵F|質O)胖+P粒(D刃)*債P(寒F|支D)=0悠.6削×0陳.8辣+0激.4總×0由=0制.4掌8勘探撐好的湖概率吐:P(宮U)貨=P印(O傻)*芒P(糕U|需O)斯+P揚(D舅)*讓P(播U|密D)=0寒.6怪×0測.2微+0繳.4松×1幟=0圈.5替2勘探閃好時繡有油培的概千率P(料O|低F)狠=巧P(耗O)營*P鄰(F聽|O淺)糠/[睜P(刺O)胡*P冰(F寶|O筋)+住P(你D)岡*P目(F湖|D柴)]=0巨.6樹×0丹.8覽/0拼.4敗8=斷1勘探銅好時燈干涸洽的概稼率P(最D|蝦F)肝=溉P(扎D)叔*P雁(F殖|D勿)需/[收P(襖O)導*P革(F軟|O稈)+貧P(杰D)汪*P墻(F單|D謊)]=0即.4呆×0仆/0揪.4窩8=恰0勘探會不好桿時有傲油的蠻概率P(屋O|戚U)參=并P(百O)額*P戰(zhàn)(U綿|O棵)哈/[現(xiàn)P(翅O)撓*P已(U預|O陶)+億P(有D)門*P聲(U翠|D演)]=0朗.6搞×0氧.2受/0車.5吉2=響0.敗20慘37勘探再不好廳時干癥涸的傍概率P(占D|婦U)藥=幣P(戶D)鞭*P絮(U明|D男)刷/[緊P(殖O)衡*P棕(U銷|O亦)+計P(腎D)述*P孕(U青|D汪)]=0咬.4借×1暫/0叮.5更2=憶0.躍76坊920.趟480.暴5210.款23弓07靠6900.宜76劣92犯31決策槐樹參直看文拉件:DA倚TA壤\c個hp斑t1竭1\弟ch令11稼.x輸ls下一墳節(jié):沿效用若理論作業(yè)?。航虄A材P2酬69床T琴3~711毫.3風險鍬型決拳策11奧.4效用償理論Ut繩il仙it部y頌T新he獲or驢y11狠.4死.1效用貝努愁利(D.音Be訪rn裂eu壓ll在i)首次簽提出錄效用潮概念儉,他捐用圖11艱.7表示務出人屑們對賓錢財蒸的真傾實價底值的岔考慮蕉與其臨錢財先擁有南量之劉間有車對數(shù)饑關系聲.效用講是一符種相耳對的壤指標雞值,票它的拆大小誓表示砍決策巡壽者對集于風眾險的或態(tài)度晴,對滴某事猜物的束傾向遭、偏才差等溉主觀演因素賠的強槐弱程呆度用團于量固度決獸策者盯對于派風險惹的態(tài)舞度.效用U貨幣M圖11-7貝努框利效恰用曲斬線11糊.4效用樸理論Ut仗il晉it中y佩T貌he密or芹y【例】(1)方蒸案A1;穩(wěn)獲10記0元。姓方案B1:用拋越擲硬穴幣的霜方法猜,猜飛對得25拐0元,笨猜錯不不得擊錢。(2)方崇案A2;穩(wěn)獲10類0元。姥方案B2:用拋某擲硬最幣的梢方法叼,直絮到出礙現(xiàn)正馳面為恥止,今第n次出悔現(xiàn)正塔面得希到2n元。大多翅數(shù)選贈擇A1、A2.通過版計算末有E(皂B1)>刪E(錄A1),塊E撥(B2)>煌E(嗓A2)一般紙來說酷效用昂值在[0煩,1秧]之間老取值.凡是打決策牙者最石看好拴、最偽傾向議、最框愿意啟的事慶物(足事件口)的狐效用屆值可減取1;反冰之,獲效用援值取0.當密各方磨案期際望值霸相同葡時,趴一般母用最憐大效厲用值譯決策土準則愛,選杏擇效課用值歲最大紀的方棄案.11迎.4效用報理論Ut書il鋒it國y井T純he丈or姨y通過香效用猛指標常將某逗些難需于量壞化、此有質尊的區(qū)宵別的半事件諸給予單量化費,得采到各釘方案泰的綜眠合效目用值撇,選助擇效春用值緒最大捎的方百案作葛為決備策準絡則。11粗.4溝.2效用拼曲線確定為效用棄曲線脫的基芳本方塔法有驚兩種百:一協(xié)種是中直接提問唐法,需愁要決橡策者敲回答描提問納,主要觀衡絨量.低應用富較少麗;第股二種渣是對比恭提問間法,此隸法使晌用較廳多.設現(xiàn)壟有A0,A1兩種限方案看供選拉.A0表示袖決策損者不每需要鐵花費遮任何僅風險他可獲拼益x0;而A1有兩掉種自蓄然狀癥態(tài),四可以湯概率P獲得揚收益x1,以概散率(1-P)獲得各收益x2;且x1>x0>x2.令yi表示巾效益xi的效銅用值滑.則x0,x1,x2的效這用值患分別唯表示綁為y0,y1,y2.若在滅某條梳件下叢,決裂策者翅認為A0,A1兩方灣案等星價,型則有界:11廉.4效用低理論Ut瞧il釘it博y執(zhí)T動he守or奮y4個數(shù)p,x0,x1,x2中給定3個,筋提問吳第4個變渣量由暑決策籃者確證定,碗求出難效用貌值。一般挺采用顏改進V-西M(富Vo宏n研Ne桐um最an簽n-量Mo敲rg睡en稿st駛er和n)方法貨,固晃定P=0跨.5龍,x1,x2改變x0三次發(fā),得銀出相游應的y的值拜,確鞭定三印點,羅作出速效用痕曲線雅.11纏.4效用息理論Ut繭il稅it桿y律T葵he么or踐y【例11灣.7攻】x1=-六10鼠0,x2=4董00亡,取y(x1)=缺0,y(x2)=斜1-1疲0040坑0第一摧次提肥問:x0為何朗值時躁,上窯式成芬立?巴答:制“0”y(0歡)=史0.畢5×費0+飲0.伐5×價1=奇0.阿51(0罰,0寺.5瓜)第二深次提僚問:x0為何卻值時討,上犧式成碗立?轟答:白“20梯0”y(2軋00飄)=屈0.夾5×以y(蛇0)葛+0禁.5肺×1=約0.姑5×剃0.謊5+晃0.蠢5×耐1=蓮0.化75第三秀次提起問:x0為何氣值時址,上京式成來立?糧答:況“10造0”y(1負00擔)=架0.獻5×范y(活0)梢+0銜.5騎×y循(2旦00茅)=傅0.揭5×籮0.陷5+轟0.桑5×帥0.蹦75獲=0此.6坡25(2秧00先,0鉛.7眉5)(1朗00蘋,0勇.6拌25春)10懇020榆030茄0011謀.4效用蒜理論Ut譜il李it辛y碎T澆he歲or義y不同枯決策申者對葛待風梳險態(tài)表度不櫻同,價因而軌會得譯到不料同形似狀的察效用棚曲線巾.一舅般可挨分為奮保守健型Ⅰ、中側間型Ⅱ、風腳險型Ⅲ,如脾下圖腹.y1IIIx(Xma臨x,1口)(Xmi誓n,0疊)Xma模xXmi補n011吩.4填.3效用肺曲線毀類型圖中I為保固守型天,其勻特點政為:驅當收待益值深較小應時,錢效用協(xié)值增粘加較截快;啊隨收虹益值霉增大貼時,鴿效用踏值增膽加速投度變分慢,坊表明統(tǒng)決策偏者不朽求大暖利,次謹慎醉小心臂,保抬守.圖中II為中武間型漂,其慌特點主為:鏟收益?zhèn)髦岛涂夹в眯灾党善驼葖D,表鞏明決申策者宣完全徹按機月遇辦趣事,烏心平叮氣和奸.圖中II扁I為風六險型協(xié),其祥特點慢為與I保守遵型恰犬好相蘭反,格當收早益值木較小并時,釣效用兇值增登加較輕慢;艙隨收黃益值泊增大博時,屯效用聞值增翻加速究度變余快,衫表明擇決策物者對扭增加鼻收益倚反應暖敏感就,愿膛冒較仔大風豎險,點謀求鍋大利卡,不動怕冒基險.II臉I(yè)11稍.4效用燒理論Ut釋il創(chuàng)it阻y吩T哈he刷or抓y常用穩(wěn)的效虛用函叫數(shù):11雕.4效用虧理論Ut衣il質it誤y凈T險he探or籃y11雪.4咳.4效用蘋值的斥應用【例11夢.8闊】若某膀決策貌問題喬的決擊策樹獄如下波圖所讀示,霜其決趕策者話的效眾用期獄望值悟同時蛛附在趴效益垂期望膏值后啊,請允做出鐘決策街.E(皮2)媽=0基.5北×3北00困+0軟.5懶×(送-2堅00竿)=拐50E(蹦3)調=0肥.5壯×2搏00著+0欠.5積×(遍-1茂00萬)=謙50根據(jù)媽最大雁效益顏期望訪值準是則,愚無法噸判斷西優(yōu)劣紫.y2=0真.5斧×1奏+0喇.5以×0非=0刷.5趣,y3=0貓.5征×0授.9句+0輪.5巡壽×0際.3費=0愛.6解:(1)計掃算效抱益期猛望值檢分別派為11休.4效用果理論Ut址il濁it席y倒T旨he航or用yA2方案綢效用董值>A1方案題效用鼻值,質因此五取A2方案孫為決尾策方陸案.繪制懇效用背曲線堅圖見瓜下圖殘,可塔知,澤該決浙策者重偏向企于保雄守型蹄,不企求大渣利,便謹慎捉小心雞.11學.4效用須理論Ut岔il鍵it繭y鍛T閣he萍or鄉(xiāng)豐y-2恰0030將01010產(chǎn)020劣0-1箭00yx11蠶.5馬爾蟻可夫螺決策Ma妹rk好ov絡D湯ec泊is埋io數(shù)n11治.5馬爾恰可夫兔決策Ma滋rk沒ov抬D自ec脫is鹿io侍n11酒.5者.1馬爾冬可夫阿鏈用X(t)表示坊隨機吊系統(tǒng)正在時適刻t的狀丑態(tài),鈔狀態(tài)奶序列為一坊隨機敵過程笛,如旁果系顏統(tǒng)當押前的電轉移菜概率姜只與驚當前咽的運宜行狀荒態(tài)有背關,幕而與速以前注的狀諒態(tài)無綱關,慮即:沿對隨誓機過挨程若對雞任意日的0<t1<t2…<tn<tn+1及ti∈T,X(tn+1)關于X(t1),徐…,X(tn)的條才件概鹽率恰排好等冷于X(tn+殃1)關于X(tn)的條姐件概使率,蒜用數(shù)惱學符胡號表估示為矛:則稱譽具穿有馬癢爾可更夫性嘉.隨次機過孫程稱撕為馬撈爾可舊夫過溪程。所有摘可能沈的全瀉體取醋值稱耀為過償程的云狀態(tài)約空間畜。若馬墻氏過消程的話狀態(tài)尾空間茫為非部負整巴數(shù)集E=蛙{0古,1曲,2泡,…溝},稱為奴馬氏眉鏈?;ɡ缛A,今桿天下男雨這糞一狀耗態(tài)用水“0”表示鮮,不魔下雨網(wǎng)用“1”表示占,則糟狀態(tài)均空間欣為E=印{0菠,1腿}。天氣根變化摔過程棋符合勵馬Ma抄rk棚ov性。11貓.5花.2轉移億概率記Pij為從帳狀態(tài)X(n)=i轉移設到下笨一個僵狀態(tài)X(n+1)虹=j的概席率,規(guī)一步遞轉移叼概率肉矩陣謎為11骨.5馬爾殊可夫咐決策Ma森rk遠ov亦D述ec歉is蠟io最n【例11軍.9訪】有3家電云器公品司分丘別生館產(chǎn)三逐種不沸同牌守子的信空調腹。各憐自開蕉展廣直告攻予勢促奔銷本水公司茫產(chǎn)品鍬。各睛公司畫所占島的市叨場比往例是聞隨時很間變遇化的鄭。X=穗{Xn,n厲≥0什}構成瘋一個迷以E=族{1荒,2孔,3知}為巴狀態(tài)縮慧空間陰的Ma材rk普ov鏈。理假設軌在任晴一時察刻,眼公司1能留梁住它怖的1/可2的老則顧客禿,其集余的比則對落半購另買另浩兩個她公司搏的產(chǎn)羅品;月公司2的一蒼半顧說客能底留下述,其觸余轉未向公小司1;公綠司3有3/豎4能留托下,汽其余交流向仍公司2。Ma畏rk慨ov鏈的斑轉移言概率皆矩陣思和轉訪移圖陪:①②③1/鉆21/拜41/錯41/擔21/翠21/敞43/麥411陜.5馬爾虜可夫涂決策Ma波rk以ov販D信ec煌is銳io凱n求n期后例公司i的市春場占扁有率炊,n→擔∞時的市場買占有圍率。記Pj(n)=P(革Xn=j感)為Ma沸rk扣ov鏈X時刻n處于偵狀態(tài)j的概孩率,P為初挨始分明布?!径ɡ怼縓=退{Xn,n惰≥0污}為一配個Ma恒rk千ov鏈,衡則有對任意m,鹿n≥退0,有對任意i,j∈E,有此方程陰稱為Ch吧am宅pa衰n-躲Ko只lm雨og逃or馬ov方程租,簡童稱C-嬌K方程11覺.5核.3轉移癥狀態(tài)11彩.5馬爾企可夫勵決策Ma殖rk樣ov紹D療ec澡is施io晉n【例11福.1圾0】假設3個公緣瑞司開滿始的鍛市場父占有率率為(0默.3,0.搞35,0.戒35村),求5個月知后的關市場顆占有跌率(狀態(tài))。【解】P0=安(0進.3冊,0怪.3說5,撤0.都35鍛)11虹.5馬爾礎可夫以決策Ma魯rk頸ov披D喝ec調is曬io堪n遍歷蹤蝶性:具如果蹤蝶一個請齊次咐的馬捷爾可賀夫鏈{X(n),n=1房誠,2較,…陰}的n步轉累移概愛率為Pij(n),對于晚一切毅狀態(tài)i,j,存在乖著不密依賴綁于初礎始狀店態(tài)i的常傅數(shù)Pj,使得成立涉,則掉稱此冊馬爾父可夫厘鏈具語有遍展歷性禽.也罰就是搬說,慢一個扭具有僵遍歷假性的脊馬爾慎可夫寬鏈,捷當轉瘦移的聯(lián)次數(shù)n極大嫩時,舟此系療統(tǒng)轉驅移到彎狀態(tài)j的概葬率為龜一個半常數(shù)Pj,而與醋初始噴狀態(tài)咐無關擦.求【引理】設m階矩鈔陣P具有m個線受性無壘關的再特征錯向量B=乏(b1,b2,文…,bm)對應倚的特壺征值稻為λ1,籍λ2,…珍,λm,則B可逆龍且有P=蹲BΛ日B-1,Pn=BΛnB-1.其中Λ=森di大ag調(λ1,悲λ2,…胸,λm)11定.5馬爾母可夫條決策Ma唯rk家ov傭D辦ec祥is姿io鄉(xiāng)豐n上例臥中,刺求Pn及求轉托移概何率矩虧陣P的特福征值再及特欄征向斥量。收由|λI株-P皆|=寶0得特征逆值及利特征贏向量石矩陣行為11齒.5馬爾堂可夫跪決策Ma原rk振ov腔D卸ec押is瘋io黎n則有11例.5馬爾韻可夫蝕決策Ma灘rk漸ov奮D填ec眾is摔io酒n長期樹后市符場占析有率享各占1/過3由得解方程申得到顧穩(wěn)定撤狀態(tài)麗的概陜率G11員.5馬爾騰可夫殺決策Ma各rk撓ov氧D鳳ec臂is套io摟n【例11史.1賊0】設某政公司背有兩開種狀村態(tài):1和2,1為盈污利,2為虧狗損.錘當其旁處于1時,膨下一攝年仍餐為1的概趁率是1/錦2,因論此下惑一年捏轉為2的概蜜率也姥是1/嚇2.當扇公司共處于懸狀態(tài)2時,磚下一夸年經(jīng)產(chǎn)過努庸力回此到狀決態(tài)1的概滲率為2/勻5,仍施處于就虧損愧狀態(tài)貼的概害率為3/醉5.若與公司?,F(xiàn)處產(chǎn)于狀秧態(tài)1,問鍬經(jīng)過n年后踩該公忽司處插于狀婦態(tài)1和2的概畜率各蘆是多容少?解:巖顯然芽,系龜統(tǒng)有輕兩個瓦狀態(tài)灣,設S為狀依態(tài)空岔間,凈則:S=鍛{i,見j}=皺{1拜,仔2}控.此處猴,p11=1宅/2份,p12=1同/2里,p21=2巷/5厲,p22=3談/5惑.因此設G=毫(g1,g2),由G=親GP11鏈.5馬爾趕可夫隔決策Ma蹈rk斷ov甜D治ec棍is瀉io做n設G=澇(g1,g2),由G=朋GP11真.5馬爾攏可夫立決策Ma涼rk臭ov笑D瓦ec遇is繞io出n11庫.5冊.4收益嬸預測錘模型設系喪統(tǒng)在外第n個時駕期處捉于狀勝態(tài)X(n)=i,轉移因到過縫程終瓜結時底的總萄期望謙收益續(xù)為rij表示捆從狀圍態(tài)X(n)=i轉移熟到下肯一個溪狀態(tài)X(n+1)劍=j相應馬的收拘益,禿則有某:πn表示圖從第n個時假期到擦過程獲終結港的決漢策規(guī)裂則δ的序般列其中δn為第n個時嬸期的畫決策踩規(guī)則棋,11臭.5馬爾莊可夫仔決策Ma厚rk夸ov笛D廟ec線is栗io圾nq(i)表示鏈由狀擺態(tài)i作一飄次轉魚移的咳期望伯報酬哥,即廈狀態(tài)圖的即垮時期外望報雙酬.屑則令或11厘.5馬爾勤可夫玩決策Ma接rk困ov輛D罩ec們is降io虜n若記段數(shù)從糾末端翁開始嫁,上壞式的嗽逆序猛寫法多為:則11麥.7馬爾腹可夫援決策Ma社rk稀ov吧D肯ec震is暖io膝n11撤.7馬爾煮可夫贏決策Ma批rk雷ov蒸D傳ec匆is笨io漿n【例】商品衰的轉欠移概繡率矩站陣和拆利潤熔表如何下暢銷滯銷暢銷0.50.5滯銷0.40.6暢銷滯銷暢銷5010滯銷20-20轉移常概率曉表利潤斬表(萬元)q1=0踏.5著×5偽0+碎0.牧5×化10繳=3通0,盞q2=0嘆.4盜×2飽0+經(jīng)0.錢6×折(-攏20蓮)=果-4n123456f1(n)304454.365.4376.54387.6543f2(n)-45.616.5627.65638.765649.87656期利潤商預測11宣.5眠.5最優(yōu)籍策略撕模型Ma課rk病ov決策添由五家重組搏來描盯述:1.狀態(tài)i2.策略恩集秘,狀圈態(tài)i的策章略規(guī)損則為3.轉移敏概率掏矩陣P4.報酬麥,狀張態(tài)i的策趨略規(guī)懼則為時轉移嘆到狀梅態(tài)j的報魄酬為期望從即時趁報酬喝為5.目標教函數(shù)V(同n)11親.5馬爾滾可夫至決策Ma埋rk需ov正D訊ec為is緣瑞io者nMa鎖rk每ov決策貍(MD用)描述在某一時刻秘(階遙段)嗚隨機做變量X處于疾狀態(tài)i,決策趴者選哄擇某饒個策飲略使因目標蚊最優(yōu)各。MD常用李的目浪標有3種:1.有限脫階段格目標狗;2.折扣牧目標溉;3.平均糖目標有限曠階段槳目標坐最大方。通爐過Z變換盲:11克.5馬爾株可夫摧決策Ma菠rk剪ov竄D美ec稀is捧io嘗n記i=1,趣2,刪…迫,m(1席1.米18嘴)解方程啊組求橡出變糞量fi與v采用裕

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論