




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第4節(jié)7.4機器學習的基本結(jié)構(gòu)在學習系統(tǒng)的基本結(jié)構(gòu)中,環(huán)境向系統(tǒng)的學習部分提供某些信息,學習部分利用這些信息修改知識庫,以增進系統(tǒng)執(zhí)行部分完成任務的效能,執(zhí)行部分根據(jù)知識庫完成任務,同時把獲得的信息反饋給學習部分。在具體的應用中,環(huán)境、知識庫和執(zhí)行部分決定了工作內(nèi)容,確定了學習部分所需要解決的問題。7.4機器學習的基本結(jié)構(gòu)(1)環(huán)境向系統(tǒng)提供的信息。更具體地說是信息的質(zhì)量,這是影響學習系統(tǒng)設計的最重要的因素。知識庫里存放的是指導執(zhí)行部分動作的一般原則,但環(huán)境向?qū)W習系統(tǒng)提供的信息卻是各種各樣的。如果信息的質(zhì)量比較高,與一般原則的差別比較小,則學習部分比較容易處理。如果向?qū)W習系統(tǒng)提供的是雜亂無章的指導執(zhí)行具體動作的具體信息,則學習系統(tǒng)需要在獲得足夠數(shù)據(jù)之后,刪除不必要的細節(jié),進行總結(jié)推廣,形成指導動作的一般原則,放入知識庫,這樣學習部分的任務就比較繁重,設計起來也較為困難。7.4機器學習的基本結(jié)構(gòu)因為學習系統(tǒng)獲得的信息往往是不完全的,所以學習系統(tǒng)所進行的推理并不完全是可靠的,它總結(jié)出來的規(guī)則可能正確,也可能不正確。這要通過執(zhí)行效果加以檢驗。正確的規(guī)則能使系統(tǒng)的效能提高,應予保留;不正確的規(guī)則應予修改或從數(shù)據(jù)庫中刪除。7.4機器學習的基本結(jié)構(gòu)(2)知識庫。這是影響學習系統(tǒng)設計的第二個因素。知識的表示有多種形式,比如特征向量、一階邏輯語句、產(chǎn)生式規(guī)則、語義網(wǎng)絡和框架等等。這些表示方式各有其特點,在選擇表示方式時要兼顧以下4個方面:①表達能力強。②易于推理。③容易修改知識庫。④知識表示易于擴展。7.4機器學習的基本結(jié)構(gòu)學習系統(tǒng)不能在沒有任何知識的情況下憑空獲取知識,每一個學習系統(tǒng)都要求具有某些知識理解環(huán)境提供的信息,分析比較,做出假設,檢驗并修改這些假設。因此,更確切地說,學習系統(tǒng)是對現(xiàn)有知識的擴展和改進。(3)執(zhí)行部分。是整個學習系統(tǒng)的核心,因為執(zhí)行部分的動作就是學習部分力求改進的動作。同執(zhí)行部分有關的問題有3個:復雜性、反饋和透明性。1基于學習策略的分類2基于所獲取知識的表示形式分類3按應用領域分類4綜合分類第5節(jié)7.5機器學習的分類機器學習按學習策略、所獲取知識的表示形式和應用領域可以有不同的分類。7.5.1基于學習策略的分類學習策略是指學習過程中系統(tǒng)所采用的推理策略。一個學習系統(tǒng)總是由學習和環(huán)境兩部分組成。由環(huán)境(如書本或教師)提供信息,學習部分則實現(xiàn)信息轉(zhuǎn)換,用能夠理解的形式記憶下來,并從中獲取有用的信息。在學習過程中,學生(學習部分)使用的推理越少,他對教師(環(huán)境)的依賴就越大,教師的負擔也就越重。學習策略的分類標準就是根據(jù)學生實現(xiàn)信息轉(zhuǎn)換所需的推理多少和難易程度來分類的,依從簡單到復雜,從少到多的次序分為以下六種基本類型:7.5.1基于學習策略的分類(1)機械學習。學習者無需任何推理或其它的知識轉(zhuǎn)換,直接吸取環(huán)境所提供的信息,如塞繆爾的跳棋程序,紐厄爾和西蒙的LT系統(tǒng)。這類學習系統(tǒng)主要考慮的是如何索引存貯的知識并加以利用。系統(tǒng)的學習方法是直接通過事先編好、構(gòu)造好的程序來學習,學習者不作任何工作或者是通過直接接收既定的事實和數(shù)據(jù)進行學習,對輸入信息不作任何的推理。7.5.1基于學習策略的分類(2)示教學習。學生從環(huán)境(教師或其它信息源如教科書等)獲取信息,把知識轉(zhuǎn)換成內(nèi)部可使用的表示形式,并將新的知識和原有知識有機地結(jié)合為一體。所以要求學生有一定程度的推理能力,但環(huán)境仍要做大量的工作。教師以某種形式提出和組織知識,以使學生擁有的知識可以不斷地增加。這種學習方法和人類社會的學校教學方式相似,學習的任務就是建立一個系統(tǒng),使它能接受教導和建議,并有效地存貯和應用學到的知識。不少專家系統(tǒng)在建立知識庫時使用這種方法去實現(xiàn)知識獲取。示教學習的一個典型應用例是FOO程序。7.5.1基于學習策略的分類(3)演繹學習。學生所用的推理形式為演繹推理。推理從公理出發(fā),經(jīng)過邏輯變換推導出結(jié)論。這種推理是“保真”變換和特化的過程,使學生在推理過程中可以獲取有用的知識。這種學習方法包含宏操作學習、知識編輯和組塊技術。演繹推理的逆過程是歸納推理。(4)類比學習。利用二個不同領域(源域、目標域)中的知識相似性,可以通過類比,從源域的知識(包括相似的特征和其它性質(zhì))推導出目標域的相應知識,從而實現(xiàn)學習。類比學習系統(tǒng)可以使一個已有的計算機應用系統(tǒng)轉(zhuǎn)變?yōu)檫m應于新的領域,來完成原先沒有設計的相類似的功能。7.5.1基于學習策略的分類類比學習需要比上述三種學習方式更多的推理。它一般要求先從知識源(源域)中檢索出可用的知識,再將其轉(zhuǎn)換成新的形式,用到新的狀況(目標域)中去。類比學習在人類科學技術發(fā)展史上起著重要作用,許多科學發(fā)現(xiàn)就是通過類比得到的。例如著名的盧瑟福類比就是通過將原子結(jié)構(gòu)(目標域)同太陽系(源域)作類比,揭示了原子結(jié)構(gòu)的奧秘。7.5.1基于學習策略的分類(5)基于解釋的學習。學生根據(jù)教師提供的目標概念、該概念的一個例子、領域理論及可操作準則,首先構(gòu)造一個解釋來說明為什么該例子滿足目標概念,然后將解釋推廣為目標概念的一個滿足可操作準則的充分條件?;诮忉尩膶W習已被廣泛應用于知識庫求精和改善系統(tǒng)的性能,這樣的著名系統(tǒng)有迪喬恩的GENESIS,米切爾的LEXII和LEAP以及明頓等的PRODIGY。7.5.1基于學習策略的分類(6)歸納學習。是由教師或環(huán)境提供某概念的一些實例或反例,讓學生通過歸納推理得出該概念的一般描述。這種學習的推理工作量遠多于示教學習和演繹學習,因為環(huán)境并不提供一般性概念描述(如公理)。從某種程度上說,歸納學習的推理量也比類比學習大,因為沒有一個類似的概念可以作為“源概念”加以取用。歸納學習是最基本的,發(fā)展也較為成熟的學習方法,在人工智能領域中已經(jīng)得到廣泛的研究和應用。7.5.2基于所獲取知識的表示形式分類學習系統(tǒng)獲取的知識可能有:行為規(guī)則、物理對象的描述、問題求解策略、各種分類及其它用于任務實現(xiàn)的知識類型。對于學習中獲取的知識,主要有以下一些表示形式:(1)代數(shù)表達式參數(shù)。學習的目標是調(diào)節(jié)一個固定函數(shù)形式的代數(shù)表達式參數(shù)或系數(shù)來達到一個理想的性能。(2)決策樹。用決策樹來劃分物體的類屬,樹中每一內(nèi)部節(jié)點對應一個物體屬性,而每一邊對應于這些屬性的可選值,樹的葉節(jié)點則對應于物體的每個基本分類。7.5.2基于所獲取知識的表示形式分類(3)形式文法。在識別一個特定語言的學習中,通過對該語言的一系列表達式進行歸納,形成該語言的形式文法。(4)產(chǎn)生式規(guī)則。表示為條件-動作對,已被極為廣泛地使用。學習系統(tǒng)中的學習行為主要是:生成、泛化、特化或合成產(chǎn)生式規(guī)則。(5)形式邏輯表達式。基本成分是命題、謂詞、變量、約束變量范圍的語句以及嵌入的邏輯表達式。(6)圖和網(wǎng)絡。有的系統(tǒng)采用圖匹配和圖轉(zhuǎn)換方案來有效地比較和索引知識。7.5.2基于所獲取知識的表示形式分類(7)框架和模式。每個框架包含一組槽,用于描述事物(概念和個體)的各個方面。(8)計算機程序和其它的過程編碼。獲取這種形式的知識,目的在于取得一種能實現(xiàn)特定過程的能力,而不是為了推斷該過程的內(nèi)部結(jié)構(gòu)。(9)神經(jīng)網(wǎng)絡。這主要用在聯(lián)接學習中。學習所獲取的知識,最后歸納為一個神經(jīng)網(wǎng)絡。(10)多種表示形式的組合。有時一個學習系統(tǒng)中獲取的知識需要綜合應用上述幾種知識表示形式。7.5.2基于所獲取知識的表示形式分類根據(jù)表示的精細程度,可將知識表示形式分為兩大類:泛化程度高的粗粒度符號表示、泛化程度低的精粒度亞符號表示。像決策樹、形式文法、產(chǎn)生式規(guī)則、形式邏輯表達式、框架和模式等屬于符號表示類;而代數(shù)表達式參數(shù)、圖和網(wǎng)絡、神經(jīng)網(wǎng)絡等則屬亞符號表示類。7.5.3按應用領域分類機器學習最主要的應用領域有專家系統(tǒng)、認知模擬、規(guī)劃和問題求解、數(shù)據(jù)挖掘、網(wǎng)絡信息服務、圖象識別、故障診斷、自然語言理解、機器人和博弈等領域。7.5.3按應用領域分類從機器學習的執(zhí)行部分所反映的任務類型上看,大部分的應用研究領域基本上集中于以下兩個范疇:(1)分類任務:要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式(該模式的描述)作分析,以確定輸入模式的類屬。相應的學習目標就是學習用于分類的準則(如分類規(guī)則)。(2)問題求解:要求對于給定的目標狀態(tài)尋找一個將當前狀態(tài)轉(zhuǎn)換為目標狀態(tài)的動作序列;機器學習在這一領域的研究工作大部分集中于通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。7.5.4綜合分類綜合考慮各種學習方法出現(xiàn)的歷史淵源、知識表示、推理策略、結(jié)果評估的相似性、研究人員交流的相對集中性以及應用領域等諸因素。將機器學習方法區(qū)分為以下六類:(1)經(jīng)驗性歸納學習。采用一些數(shù)據(jù)密集的經(jīng)驗方法(如版本空間法、ID3法,定律發(fā)現(xiàn)方法)對例子進行歸納學習。其例子和學習結(jié)果一般都采用屬性、謂詞、關系等符號表示。它相當于基于學習策略分類中的歸納學習,但扣除聯(lián)接學習、遺傳算法、加強學習的部分。7.5.4綜合分類(2)分析學習。是從一個或少數(shù)幾個實例出發(fā),運用領域知識進行分析。其主要特征為:推理策略主要是演繹,而非歸納;使用過去的問題求解經(jīng)驗(實例)指導新的問題求解,或產(chǎn)生能更有效地運用領域知識的搜索控制規(guī)則。分析學習的目標是改善系統(tǒng)的性能,而不是新的概念描述。分析學習包括應用解釋學習、演繹學習、多級結(jié)構(gòu)組塊以及宏操作學習等技術。7.5.4綜合分類(3)類比學習。相當于基于學習策略分類中的類比學習。在這一類型的學習中比較引人注目的研究是通過與過去經(jīng)歷的具體事例作類比來學習,稱為基于范例的學習,或簡稱范例學習。7.5.4綜合分類(4)遺傳算法。模擬生物繁殖的突變、交換和達爾文的自然選擇(在每一生態(tài)環(huán)境中適者生存)。它把問題可能的解編碼為一個向量,稱為個體,向量的每一個元素稱為基因,并利用目標函數(shù)(相應于自然選擇標準)對群體(個體的集合)中的每一個個體進行評價,根據(jù)評價值(適應度)對個體進行選擇、交換、變異等遺傳操作,從而得到新的群體。遺傳算法適用于非常復雜和困難的環(huán)境,比如,帶有大量噪聲和無關數(shù)據(jù)、事物不斷更新、問題目標不能明顯和精確地定義,以及通過很長的執(zhí)行過程才能確定當前行為的價值等。同神經(jīng)網(wǎng)絡一樣,遺傳算法的研究已經(jīng)發(fā)展為人工智能的一個獨立分支。7.5.4綜合分類(5)聯(lián)接學習。典型的聯(lián)接模型實現(xiàn)為人工神經(jīng)網(wǎng)絡,其由稱為神經(jīng)元的一些簡單計算單元以及單元間的加權聯(lián)接組成。(6)增強學習。特點是通過與環(huán)境的試探性交互來確定和優(yōu)化動作的選擇,以實現(xiàn)所謂的序列決策任務。在這種任務中,學習機制通過選擇并執(zhí)行動作,導致系統(tǒng)狀態(tài)的變化,并有可能得到某種強化信號(立即回報),從而實現(xiàn)與環(huán)境的交互。強化信號就是對系統(tǒng)行為的一種標量化的獎懲。系統(tǒng)學習的目標是尋找一個合適的動作選擇策略,即在任一給定的狀態(tài)下選擇哪種動作的方法,使產(chǎn)生的動作序列可獲得某種最優(yōu)的結(jié)果(如累計立即回報最大)。7.5.4綜合分類在綜合分類中,經(jīng)驗歸納學習、遺傳算法、聯(lián)接學習和增強學習均屬于歸納學習,其中經(jīng)驗歸納學習采用符號表示方式,而遺傳算法、聯(lián)接學習和加強學習則采用亞符號表示方式;分析學習屬于演繹學習。實際上,類比策略可看成是歸納和演繹策略的綜合,因而最基本的學習策略只有歸納和演繹。1應用于物聯(lián)網(wǎng)2應用于聊天機器人3應用于自動駕駛第6節(jié)7.6機器學習的應用機器學習有巨大的潛力來改變和改善世界,使我們正朝著真正的人工智能邁進一大步。機械學習的主要目的是為了從使用者和輸入數(shù)據(jù)等處獲得知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。從而可以減少錯誤,幫助解決更多問題,提高解決問題的效率。它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。機器學習已經(jīng)有了十分廣泛的應用,但是,確切地說,什么是機器學習能產(chǎn)生影響的下一個主要領域呢?7.6.1應用于物聯(lián)網(wǎng)物聯(lián)網(wǎng)(InternetofThings),或者說IoT,是指你家里和辦公室里聯(lián)網(wǎng)的物理設備。流行的物聯(lián)網(wǎng)設備是智能燈泡,其銷售額在過去幾年里猛增。隨著機器學習的進步,物聯(lián)網(wǎng)設備比以往任何時候都更聰明、更復雜。機器學習有兩個主要的與物聯(lián)網(wǎng)相關的應用:使你的設備變得更好和收集你的數(shù)據(jù)。讓設備變得更好是非常簡單的:使用機器學習來個性化您的環(huán)境,比如,用面部識別軟件來感知哪個是房間,并相應地調(diào)整溫度和AC。收集數(shù)據(jù)更加簡單,通過在你的家中保持網(wǎng)絡連接的設備(如亞馬遜回聲)的通電和監(jiān)聽,
像亞馬遜這樣的公司收集關鍵的人口統(tǒng)計信息,將其傳遞
給廣告商,比如電視顯示你正在觀看的節(jié)目、你什么時候
醒來或睡覺、有多少人住在你家。7.6.2應用于聊天機器人在過去的幾年里,我們看到了聊天機器人的激增,成熟的語言處理算法每天都在改進它們。聊天機器人被公司用在他們自己的移動應用程序和第三方應用上,比如
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 青島求實職業(yè)技術學院《小學音樂課程設計與實踐》2023-2024學年第二學期期末試卷
- 河北交通職業(yè)技術學院《實變函數(shù)二》2023-2024學年第二學期期末試卷
- 人教版歷史八年級上冊《第一單元 中國開始淪為半殖民地半封建社會》大單元整體教學設計2022課標
- 幼兒音樂圖譜課件
- 防極端天氣安全教育主題班會
- 2024年一級造價師之建設工程計價題庫必考題 (一)
- 陽臺欄桿施工工藝流程
- 復方氨基酸注射液(17AA-Ⅱ)-藥品臨床應用解讀
- 語文口語表達能力提升試題及答案
- 心理咨詢師考試角色扮演技巧與試題及答案
- 《榜樣9》觀后感心得體會二
- 《西安交通大學》課件
- 管道天然氣泄漏事故案例分析研究報告
- 護理的內(nèi)涵和精髓
- 西門子S7-1200 PLC應用技術項目教程(第3版) 課件 窄屏 9.觸摸屏控制的液體混合系統(tǒng)-LAD
- 鐵路勞動安全 課件 第一章 防暑降溫
- 【MOOC】大學語文-東南大學 中國大學慕課MOOC答案
- 某地區(qū)現(xiàn)代有軌電車施工方案
- 城市軌道交通運營安全風險評估報告
- 蔣詩萌小品《誰殺死了周日》臺詞完整版
- 體重管理健康科普教育
評論
0/150
提交評論