人工智能與學(xué)習(xí)研究_第1頁
人工智能與學(xué)習(xí)研究_第2頁
人工智能與學(xué)習(xí)研究_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

人工智能與學(xué)習(xí)研究

由于沒有嚴(yán)格的定義學(xué)習(xí),機(jī)器學(xué)習(xí)被定義為在學(xué)習(xí)中進(jìn)行的。因此,參數(shù)o不能指定為嚴(yán)格的學(xué)習(xí)定義。從直觀上理解,機(jī)器學(xué)習(xí)就是讓計算機(jī)來模擬人類的學(xué)習(xí)功能,它是一門研究怎樣用機(jī)器來模擬或?qū)崿F(xiàn)人類學(xué)習(xí)活動的一門學(xué)科。也是人工智能中最具有智能特征的前沿研究領(lǐng)域之一。目前,關(guān)于機(jī)器學(xué)習(xí)的研究主要集中在幾個方面:認(rèn)知模擬、理論性分析、面向任務(wù)的研究。1基于神經(jīng)網(wǎng)絡(luò)的人工智能學(xué)習(xí)策略學(xué)習(xí)是一項復(fù)雜的智能活動,學(xué)習(xí)過程與推理過程是緊密相連的,按照學(xué)習(xí)中使用推理的多少,機(jī)器學(xué)習(xí)所采用的策略可分為:機(jī)械學(xué)習(xí)、類比學(xué)習(xí)、示例學(xué)習(xí)、解釋學(xué)習(xí)以及基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。1.1記憶的方法簡單機(jī)械學(xué)習(xí)也稱記憶學(xué)習(xí),它是通過記憶和評價外環(huán)境所提供的信息來達(dá)到學(xué)習(xí)目的的。在這種學(xué)習(xí)方法中,學(xué)習(xí)環(huán)節(jié)對外部提供的信息不進(jìn)行任何變換,只進(jìn)行簡單的記憶。雖然機(jī)械學(xué)習(xí)在方法上看似很簡單,由于計算機(jī)的存儲容量相當(dāng)大,檢索速度又相當(dāng)快,記憶精確、無絲毫誤差,所以也能產(chǎn)生人們難以預(yù)料的結(jié)果。機(jī)械學(xué)習(xí)的典型代表是西蒙的西洋跳棋程序。該程序用極大極小博弈樹搜索來選擇走法。學(xué)習(xí)環(huán)節(jié)記憶了棋局態(tài)勢和倒推得極大極小值。在下棋過程中,只要碰到過去出現(xiàn)過的棋局,就可以直接采用原來的走棋方案。1.2計算當(dāng)前任務(wù)類比學(xué)習(xí)系統(tǒng)只能得到完成類似任務(wù)的有關(guān)知識,因此,學(xué)習(xí)系統(tǒng)必須能夠發(fā)現(xiàn)當(dāng)前任務(wù)與已知任務(wù)的相似點(diǎn),由此制定出完成當(dāng)前任務(wù)的方案,因此,它比上訴兩種學(xué)習(xí)策略需要更多的推理。1.3混合式的歸并學(xué)習(xí)示例學(xué)習(xí)也稱為實例學(xué)習(xí),它是一種從具體示例中導(dǎo)出一般性知識的歸納學(xué)習(xí)方法,這種學(xué)習(xí)方法給學(xué)習(xí)者提供某一概念的一組正例和反例,學(xué)習(xí)者從這些例子中歸納出一個總的概念描述,并使這個描述適合于所有的正例,排除所有的反例。1.4單個問題求解算子解釋學(xué)習(xí)是一種分析學(xué)習(xí)方法。這種方法是在領(lǐng)域知識的指導(dǎo)下,通過對單個問題求解例子的分析,構(gòu)造出求解過程的因果結(jié)構(gòu),并獲取控制知識,以便于以后將其用于類似問題的求解。解釋學(xué)習(xí)在獲取控制性知識、精華知識、軟件重用、計算機(jī)輔助設(shè)計和計算機(jī)輔助教育等方面有較多應(yīng)用。1.5問題的兩種階段神經(jīng)學(xué)習(xí)也稱為聯(lián)接學(xué)習(xí),它是一種基于人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法。利用神經(jīng)網(wǎng)絡(luò)解決問題,一般分為訓(xùn)練和工作兩個階段。訓(xùn)練階段的主要目的是要從訓(xùn)練樣本中提取隱含知識和規(guī)律,并存儲在網(wǎng)絡(luò)中,供工作階段解決問題使用。神經(jīng)學(xué)習(xí)是指神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,其主要表現(xiàn)為聯(lián)接權(quán)值的調(diào)整。2知識能力是環(huán)境,學(xué)習(xí)環(huán)節(jié)是知識。造成知識的兩一個學(xué)習(xí)系統(tǒng)不僅與環(huán)境和知識庫有關(guān),而且還應(yīng)該包含學(xué)習(xí)和執(zhí)行兩個重要環(huán)節(jié),它們之間的關(guān)系如圖1所示。該圖給出了學(xué)習(xí)系統(tǒng)的基本模型,它由四部分組成。其中,環(huán)境是以某種形式表達(dá)的外界信息集合,它代表外界信息來源;學(xué)習(xí)環(huán)節(jié)是將外界信息加工為知識的過程,它先從環(huán)境獲取外部信息,然后通過對這些信息的分析、綜合、類比、歸納等加工形成知識,最后把所形成的知識放入知識庫中;知識庫是以某種形式表示的知識集合,用來存放學(xué)習(xí)環(huán)節(jié)所得到的知識;執(zhí)行環(huán)節(jié)是利用知識庫中的知識完成某種任務(wù)的過程,并把完成任務(wù)過程中所獲得的一些信息反饋給學(xué)習(xí)環(huán)節(jié),以指導(dǎo)進(jìn)一步的學(xué)習(xí)。2.1執(zhí)行環(huán)節(jié)的一般化程度不同環(huán)境中信息的水平和質(zhì)量是影響學(xué)習(xí)系統(tǒng)設(shè)計的第一個重要因素。所謂信息的水平是指信息的一般化程度,或者說是指信息適用范圍的廣泛性。而信息的一般化程度又是相對于執(zhí)行環(huán)節(jié)而言的。高水平信息的一般化程度比較高,能適應(yīng)于更廣泛的問題。低水平信息的一般化程度比較低,只適用于個別問題。無論環(huán)境中信息的水平是高是低,這些信息與執(zhí)行環(huán)節(jié)所需要的信息水平往往是會有差距的,學(xué)習(xí)環(huán)節(jié)的任務(wù)就是要縮小這一差距。如果環(huán)境提供的是高水平信息,學(xué)習(xí)環(huán)節(jié)就是要補(bǔ)充遺漏的細(xì)節(jié),以便于執(zhí)行環(huán)節(jié)能將其用于更具體的情況。如果環(huán)境提供的是低水平信息,學(xué)習(xí)環(huán)節(jié)就要由這些具體實例歸納出適用于一般情況的規(guī)則,以便執(zhí)行環(huán)節(jié)能將其用于更廣的任務(wù)。2.2知識表示方式知識庫的形式和內(nèi)容是影響學(xué)習(xí)系統(tǒng)設(shè)計的又一個因素。知識庫的形式是與知識表示方式直接相關(guān)的。知識的表示有多種形式,如特征向量,一階邏輯語句、產(chǎn)生式規(guī)則、語義網(wǎng)絡(luò)和框架等。這些表示方式各具特點(diǎn),在選擇表示方式時要兼顧以下幾方面:表達(dá)能力強(qiáng)、易于推理、容易修改知識庫、知識表示易于擴(kuò)展。對知識庫中的內(nèi)容,其初始知識是非常重要的。學(xué)習(xí)系統(tǒng)不可能在沒有任何知識的情況下憑空獲取知識,它總是先利用初始知識去理解環(huán)境提供的信息,并依次逐步進(jìn)行學(xué)習(xí)。學(xué)習(xí)系統(tǒng)的學(xué)習(xí)過程實質(zhì)上是對原有知識庫的擴(kuò)充和完善過程。2.3學(xué)習(xí)過程的反饋與評價執(zhí)行環(huán)節(jié)是整個學(xué)習(xí)系統(tǒng)的核心,它與學(xué)習(xí)環(huán)節(jié)之間是相互聯(lián)系的。學(xué)習(xí)環(huán)節(jié)的目的就是要改善執(zhí)行環(huán)節(jié)的行為,而執(zhí)行環(huán)節(jié)的復(fù)雜度、反饋?zhàn)饔靡约巴该餍杂謺催^來對學(xué)習(xí)環(huán)節(jié)產(chǎn)生一定的影響。復(fù)雜度。不同復(fù)雜度的任務(wù),所需要的知識是不一樣的。一般來說,一個任務(wù)越復(fù)雜,它所需要的知識就會越多。反饋。所有的學(xué)習(xí)系統(tǒng)都必須有從執(zhí)行環(huán)節(jié)到學(xué)習(xí)環(huán)節(jié)的反饋信息。這種反饋信息時根據(jù)執(zhí)行環(huán)節(jié)的執(zhí)行情況,對學(xué)習(xí)環(huán)節(jié)所獲知識的評價。學(xué)習(xí)環(huán)節(jié)主要根據(jù)這些反饋信息來決定是否還需要從環(huán)境中進(jìn)一步獲取信息,修改、完善知識庫中的知識。目前,學(xué)習(xí)系統(tǒng)所采用的評價方式主要有兩種,一種是由系統(tǒng)自動進(jìn)行評價,另一種是由人來協(xié)助未按成評價。所謂自由系統(tǒng)自動完成評價,是指把評價時所需要的性能指標(biāo)直接建立在學(xué)習(xí)系統(tǒng)中,然后由系統(tǒng)由系統(tǒng)對執(zhí)行環(huán)節(jié)得到結(jié)果自動進(jìn)行評價;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論