版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1,機(jī)器學(xué)習(xí)主講:張莉,第一章 引言,2,什么是機(jī)器學(xué)習(xí),什么是機(jī)器學(xué)習(xí) 計(jì)算機(jī)程序如何隨著經(jīng)驗(yàn)積累自動(dòng)提高性能 系統(tǒng)自我改進(jìn)的過(guò)程 成功應(yīng)用 學(xué)習(xí)識(shí)別人類(lèi)講話 學(xué)習(xí)駕駛車(chē)輛 學(xué)習(xí)分類(lèi)新的天文結(jié)構(gòu) 學(xué)習(xí)對(duì)弈西洋雙陸棋,3,人工智能 學(xué)習(xí)概念的符號(hào)表示 作為搜索問(wèn)題的機(jī)器學(xué)習(xí) 作為提高問(wèn)題求解能力的學(xué)習(xí) 利用先驗(yàn)知識(shí)和訓(xùn)練數(shù)據(jù)來(lái)引導(dǎo)學(xué)習(xí) 計(jì)算復(fù)雜性理論 復(fù)雜性的理論邊界 計(jì)算量、訓(xùn)練數(shù)據(jù)量、錯(cuò)分量,相關(guān)學(xué)科,4,控制論 為了優(yōu)化預(yù)定目標(biāo),學(xué)習(xí)對(duì)各種處理過(guò)程進(jìn)行控制,學(xué)習(xí)預(yù)測(cè)被控過(guò)程的下一狀態(tài) 信息論 熵和信息內(nèi)容的度量 學(xué)習(xí)最小描述長(zhǎng)度方法 統(tǒng)計(jì)學(xué) 根據(jù)有限數(shù)據(jù)樣本,給定精度時(shí),估計(jì)誤差 置信區(qū)
2、間、統(tǒng)計(jì)檢驗(yàn),相關(guān)學(xué)科,5,定義 如果一個(gè)計(jì)算機(jī)針對(duì)某類(lèi)任務(wù)T的用P衡量的性能根據(jù)經(jīng)驗(yàn)E來(lái)自我完善,那么我們稱(chēng)這個(gè)計(jì)算機(jī)程序在從經(jīng)驗(yàn)E中學(xué)習(xí),針對(duì)某類(lèi)任務(wù)T,它的性能用P來(lái)衡量。 西洋跳棋學(xué)習(xí)問(wèn)題的解釋 任務(wù)T:參與比賽 性能標(biāo)準(zhǔn)P:比賽成績(jī)(或贏棋能力,擊敗對(duì)手的百分比) 經(jīng)驗(yàn)E:和自己下棋,學(xué)習(xí)問(wèn)題的標(biāo)準(zhǔn)描述,6,手寫(xiě)識(shí)別學(xué)習(xí)問(wèn)題 任務(wù)T:識(shí)別和分類(lèi)手寫(xiě)文字 性能標(biāo)準(zhǔn):分類(lèi)的正確率 經(jīng)驗(yàn):已知類(lèi)別的手寫(xiě)體文字?jǐn)?shù)據(jù)庫(kù) 機(jī)器人駕駛學(xué)習(xí)問(wèn)題 任務(wù):通過(guò)視覺(jué)傳感器在四車(chē)道高速公路上行使 性能標(biāo)準(zhǔn):平均無(wú)差錯(cuò)行使里程(差錯(cuò)由人來(lái)監(jiān)督裁定) 訓(xùn)練經(jīng)驗(yàn)E:注視人類(lèi)駕駛時(shí)錄制的一系列圖像和駕駛指令,學(xué)習(xí)問(wèn)
3、題的標(biāo)準(zhǔn)描述(2,7,定義太廣泛 甚至包括了以非常直接的方式通過(guò)經(jīng)驗(yàn)自我提高的計(jì)算機(jī)程序 科技型定義 通過(guò)經(jīng)驗(yàn)提高性能的某類(lèi)程序 目的 定義一類(lèi)問(wèn)題 探索解決這類(lèi)問(wèn)題的方法 理解學(xué)習(xí)問(wèn)題的基本結(jié)構(gòu)和過(guò)程,學(xué)習(xí)問(wèn)題的標(biāo)準(zhǔn)描述(3,8,設(shè)計(jì)一個(gè)學(xué)習(xí)系統(tǒng),基本設(shè)計(jì)方法和學(xué)習(xí)途徑 (以西洋跳棋為例) 選擇訓(xùn)練經(jīng)驗(yàn) 選擇目標(biāo)函數(shù) 選擇目標(biāo)函數(shù)的表示 選擇函數(shù)逼近算法 最終設(shè)計(jì),9,第一個(gè)關(guān)鍵屬性,訓(xùn)練經(jīng)驗(yàn)?zāi)芊駷橄到y(tǒng)的決策提供直接或間接的反饋 第二個(gè)重要屬性,學(xué)習(xí)器在多大程度上控制樣例序列 第三個(gè)重要屬性,訓(xùn)練樣例的分布能多好地表示實(shí)例分布,通過(guò)樣例來(lái)衡量最終系統(tǒng)的性能,選擇訓(xùn)練經(jīng)驗(yàn),10,西洋跳棋學(xué)習(xí)問(wèn)
4、題 任務(wù)T,下西洋跳棋 性能標(biāo)準(zhǔn)P,擊敗對(duì)手的百分比 訓(xùn)練經(jīng)驗(yàn)E,和自己進(jìn)行訓(xùn)練對(duì)弈 學(xué)習(xí)系統(tǒng)需要選擇 要學(xué)習(xí)的知識(shí)的確切類(lèi)型 對(duì)于這個(gè)目標(biāo)知識(shí)的表示 一種學(xué)習(xí)機(jī)制,選擇訓(xùn)練經(jīng)驗(yàn)(續(xù),11,目標(biāo)函數(shù)ChooseMove ChooseMove: BM,接受合法棋局集合中的棋盤(pán)狀態(tài)作為輸入,并從合法走子集合中選擇某個(gè)走子作為輸出 問(wèn)題轉(zhuǎn)化 我們把提高任務(wù)T的性能P的問(wèn)題轉(zhuǎn)化(或簡(jiǎn)化)為學(xué)習(xí)像ChooseMove這樣某個(gè)特定的目標(biāo)函數(shù),選擇目標(biāo)函數(shù),12,ChooseMove的評(píng)價(jià) 學(xué)習(xí)問(wèn)題很直觀地轉(zhuǎn)化成這個(gè)函數(shù) 這個(gè)函數(shù)的學(xué)習(xí)很困難,因?yàn)樘峁┙o系統(tǒng)的是間接訓(xùn)練經(jīng)驗(yàn) 另一個(gè)目標(biāo)函數(shù)V 一個(gè)評(píng)估函數(shù),
5、V: BR,它為任何給定棋局賦予一個(gè)數(shù)值評(píng)分,給好的棋局賦予較高的評(píng)分 優(yōu)點(diǎn),學(xué)習(xí)簡(jiǎn)單 V的應(yīng)用 根據(jù)V能夠輕松地找到當(dāng)前棋局的最佳走法,選擇目標(biāo)函數(shù)(2,13,V的設(shè)計(jì),對(duì)于集合B中的任意棋局b,V(b)定義如下 如果b是一最終的勝局,那么V(b)=100 如果b是一最終的負(fù)局,那么V(b)=-100 如果b是一最終的和局,那么V(b)=0 如果b不是最終棋局,那么V(b)=V(b),其中b是從b開(kāi)始雙方都采取最優(yōu)對(duì)弈后可達(dá)到的終局,選擇目標(biāo)函數(shù)(3,14,上面設(shè)計(jì)的缺陷 遞歸定義 運(yùn)算效率低 不可操作 簡(jiǎn)評(píng) 學(xué)習(xí)任務(wù)簡(jiǎn)化成發(fā)現(xiàn)一個(gè)理想目標(biāo)函數(shù)V的可操作描述 通常要完美地學(xué)習(xí)這樣一個(gè)V的可操
6、作的形式是非常困難的 一般地,我們僅希望學(xué)習(xí)算法得到近似的目標(biāo)函數(shù)V,因此學(xué)習(xí)目標(biāo)函數(shù)的過(guò)程常稱(chēng)為函數(shù)逼近,選擇目標(biāo)函數(shù)(4,15,函數(shù)的表示 一張大表,對(duì)于每個(gè)唯一的棋盤(pán)狀態(tài),表中有唯一的表項(xiàng)來(lái)確定它的狀態(tài)值 規(guī)則集合 二項(xiàng)式函數(shù) 人工神經(jīng)網(wǎng)絡(luò),選擇目標(biāo)函數(shù)的表示,16,重要的權(quán)衡過(guò)程 希望選取一個(gè)非常有表現(xiàn)力的描述,以最大可能地逼近理想的目標(biāo)函數(shù) 越有表現(xiàn)力的描述需要越多的訓(xùn)練數(shù)據(jù),使程序能從它表示的多種假設(shè)中選擇,選擇目標(biāo)函數(shù)的表示(2,17,簡(jiǎn)單表示法對(duì)于任何給定的棋盤(pán)狀態(tài),函數(shù)V可以通過(guò)以下棋盤(pán)參數(shù)的線性組合來(lái)計(jì)算 x1,黑子的數(shù)量 x2,紅子的數(shù)量 x3,黑王的數(shù)量 x4,紅王的數(shù)
7、量 x5,被紅子威脅的黑子數(shù)量 x6,被黑子威脅的紅子數(shù)量,選擇目標(biāo)函數(shù)的表示(3,18,目標(biāo)函數(shù) V(b)=w0+w1x1+w2x2+w6x6 其中,w0w6是權(quán)值,表示不同棋局特征的相對(duì)重要性 至此,問(wèn)題轉(zhuǎn)化為學(xué)習(xí)目標(biāo)函數(shù)中的系數(shù)(即權(quán)值,選擇目標(biāo)函數(shù)的表示(4,19,每個(gè)訓(xùn)練樣例表示成二元對(duì) b是棋盤(pán)狀態(tài),Vtrain(b)是訓(xùn)練值 比如,,100 訓(xùn)練過(guò)程 從學(xué)習(xí)器可得到的間接訓(xùn)練經(jīng)驗(yàn)中導(dǎo)出上面的訓(xùn)練樣例 調(diào)整系數(shù)wi,最佳擬合這些訓(xùn)練樣例,選擇函數(shù)逼近算法,20,選擇函數(shù)逼近算法(2,估計(jì)訓(xùn)練值 困難處 一個(gè)簡(jiǎn)單的方法,Vtrain(b)=V(Successor(b) 調(diào)整權(quán)值 最佳
8、擬合的定義,比如誤差平方和最小 尋找算法,比如最小均方方法,LMS Least Mean Squares,21,LMS權(quán)值更新法則,對(duì)于每個(gè)訓(xùn)練樣本 使用當(dāng)前的權(quán)計(jì)算V (b) 對(duì)每個(gè)權(quán)值wi 進(jìn)行如下更新,22,最終設(shè)計(jì),實(shí)驗(yàn)生成器,執(zhí)行系統(tǒng),泛化器,鑒定器,新問(wèn)題,解答路線,假設(shè),訓(xùn)練樣例,23,執(zhí)行系統(tǒng) 用學(xué)會(huì)的目標(biāo)函數(shù)來(lái)解決給定的任務(wù) 鑒定器 以對(duì)弈的路線或歷史記錄作為輸入,輸出目標(biāo)函數(shù)的一系列訓(xùn)練樣例。 泛化器 以訓(xùn)練樣例為輸入,產(chǎn)生一個(gè)輸出假設(shè),作為它對(duì)目標(biāo)函數(shù)的估計(jì)。 實(shí)驗(yàn)生成器 以當(dāng)前的假設(shè)作為輸入,輸出一個(gè)新的問(wèn)題,供執(zhí)行系統(tǒng)去探索,最終設(shè)計(jì)(2,24,圖1-2 第13章理論
9、上的保證 這種學(xué)習(xí)技術(shù)是否確保發(fā)現(xiàn)一個(gè)非常接近的近似。 更復(fù)雜的目標(biāo)函數(shù) 其他學(xué)習(xí)算法 最近鄰算法,存儲(chǔ)訓(xùn)練樣例,尋找保存的最接近的情形來(lái)匹配新的情況 遺傳算法,產(chǎn)生大量候選的西洋跳棋程序,讓它們相互比賽,保留最成功的程序并進(jìn)一步用模擬進(jìn)化的方式來(lái)培育或變異它們 基于解釋的學(xué)習(xí),分析每次成敗的原因,西洋跳棋學(xué)習(xí)的更多討論,25,一個(gè)有效的觀點(diǎn) 機(jī)器學(xué)習(xí)問(wèn)題歸結(jié)于搜索問(wèn)題 本書(shū)給出了對(duì)一些基本表示定義的假設(shè)空間的搜索算法 通過(guò)搜索策略和搜索空間的內(nèi)在結(jié)構(gòu)來(lái)刻畫(huà)學(xué)習(xí)方法,機(jī)器學(xué)習(xí)的一個(gè)觀點(diǎn),26,存在什么樣的算法能從特定的訓(xùn)練數(shù)據(jù)學(xué)習(xí)一般的目標(biāo)函數(shù)呢?如果提供了充足的訓(xùn)練數(shù)據(jù),什么樣的條件下,會(huì)使
10、特定的算法收斂到期望的函數(shù)?哪個(gè)算法對(duì)哪些問(wèn)題和表示的性能最好? 多少訓(xùn)練數(shù)據(jù)是充足的?怎樣找到學(xué)習(xí)到假設(shè)的置信度與訓(xùn)練數(shù)據(jù)的數(shù)量及提供給學(xué)習(xí)器的假設(shè)空間特性之間的一般關(guān)系? 學(xué)習(xí)器擁有的先驗(yàn)知識(shí)是怎樣引導(dǎo)從樣例進(jìn)行泛化的過(guò)程的?當(dāng)先驗(yàn)知識(shí)僅僅是近似正確時(shí),它們會(huì)有幫助嗎,機(jī)器學(xué)習(xí)的問(wèn)題,27,關(guān)于選擇有效的后驗(yàn)訓(xùn)練經(jīng)驗(yàn),什么樣的策略最好?這個(gè)策略的選擇會(huì)如何影響學(xué)習(xí)問(wèn)題的復(fù)雜性。 怎樣把學(xué)習(xí)任務(wù)簡(jiǎn)化為一個(gè)或多個(gè)函數(shù)逼近問(wèn)題?換一種方式,系統(tǒng)該試圖學(xué)習(xí)哪些函數(shù)?這個(gè)過(guò)程本身能自動(dòng)化嗎? 學(xué)習(xí)器怎樣自動(dòng)地改變表示法來(lái)提高表示和學(xué)習(xí)目標(biāo)函數(shù)的能力,機(jī)器學(xué)習(xí)的問(wèn)題,28,第2章,基于符號(hào)和邏輯表示的概念學(xué)習(xí) 第3章,決策樹(shù) 第4章,人工神經(jīng)網(wǎng)絡(luò) 第5章,統(tǒng)計(jì)和估計(jì)理論的基礎(chǔ)概念 第6章,貝葉斯理論 第7章,計(jì)算學(xué)習(xí) 第8章,基于實(shí)例的學(xué)習(xí) 第9章,遺傳算法 第10章,規(guī)則學(xué)習(xí) 第11章,基于解釋的學(xué)習(xí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二四年商業(yè)廣告燈箱安裝施工合同
- 2025年度大曰金地產(chǎn)樓盤(pán)銷(xiāo)售代理合同全案策劃執(zhí)行合同4篇
- 2025年私人住房買(mǎi)賣(mài)合同書(shū)含物業(yè)管理服務(wù)條款范本2篇
- 2025年度高端鈦礦資源批量采購(gòu)合同
- 二零二五版鍋爐設(shè)備買(mǎi)賣(mài)合同附安全使用操作手冊(cè)3篇
- 2025年度醫(yī)療設(shè)備租賃合同擔(dān)保與維修保養(yǎng)服務(wù)范本4篇
- 二零二五年度屋頂防水隔熱一體化合同
- 2025年BEC商務(wù)英語(yǔ)專(zhuān)業(yè)課程研發(fā)與授權(quán)使用合同3篇
- 二零二五版智慧城市基礎(chǔ)設(shè)施用地租賃合同3篇
- 預(yù)應(yīng)力專(zhuān)項(xiàng)施工方案
- 三年級(jí)數(shù)學(xué)寒假作業(yè)每日一練30天
- 二年級(jí)數(shù)學(xué)上冊(cè)100道口算題大全 (每日一套共26套)
- 總住院醫(yī)師管理制度
- 八年級(jí)上冊(cè)歷史 第二單元 社會(huì)主義制度的建立與社會(huì)主義建設(shè)的探索
- DB31T 360-2020 住宅物業(yè)管理服務(wù)規(guī)范
- 園林綠化工程大樹(shù)移植施工方案
- 應(yīng)收賬款最高額質(zhì)押擔(dān)保合同模版
- 基于新型光彈性實(shí)驗(yàn)技術(shù)的力學(xué)實(shí)驗(yàn)教學(xué)方法探索
- 訴前車(chē)輛保全申請(qǐng)書(shū)(5篇)
- 醫(yī)院后勤保障管理組織架構(gòu)圖
- 課件:TTT職業(yè)培訓(xùn)師課程
評(píng)論
0/150
提交評(píng)論