人工智能基礎(chǔ)知識(shí)_第1頁(yè)
人工智能基礎(chǔ)知識(shí)_第2頁(yè)
人工智能基礎(chǔ)知識(shí)_第3頁(yè)
人工智能基礎(chǔ)知識(shí)_第4頁(yè)
人工智能基礎(chǔ)知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能基礎(chǔ)進(jìn)階篇匯報(bào)人:XXXfoundationofartificialintelligence目錄讓人工智能更智能無(wú)監(jiān)督機(jī)器學(xué)習(xí)的方法阿爾法狗背后的秘密CONTENT讓人工智能更智能Makeartificialintelligencesmarter監(jiān)督學(xué)習(xí)需要訓(xùn)練數(shù)據(jù)的標(biāo)注信息的學(xué)習(xí)過(guò)程,就是監(jiān)督學(xué)習(xí)如:分類器從數(shù)據(jù)中學(xué)會(huì)了區(qū)分鳶尾花的品種如:對(duì)圖像、音頻和視頻的分類,都需要類別的標(biāo)注信息,都屬于監(jiān)督學(xué)習(xí)沒有類別的標(biāo)注信息供人工智能參考時(shí),怎么辦?“計(jì)算機(jī)能不能自動(dòng)將照片整理好?”無(wú)監(jiān)督學(xué)習(xí)沒有標(biāo)注信息的學(xué)習(xí)過(guò)程無(wú)類別信息指導(dǎo)很難判斷哪一些鳶尾花是相同品種“計(jì)算機(jī)能不能自動(dòng)將照片整理好?”聚類(clustering)通過(guò)分析數(shù)據(jù)在特征空間的聚集情況,可以將一組數(shù)據(jù)分成不同的類。旨在把一群樣本分為多個(gè)集合,使得同一個(gè)集合內(nèi)的元素盡量“相似”或者“相近”是一種無(wú)監(jiān)督學(xué)習(xí)過(guò)程不需要數(shù)據(jù)的類別標(biāo)注不需要預(yù)先定義類別讓人工智能像真正的科學(xué)家一樣,自己發(fā)掘規(guī)律。問(wèn)題的提出我們希望人工智能在不知道鳶尾花品種的前提下將這N朵鳶尾花分為K類,使得同一類樣本的特征相似程度高,而不同類樣本的特征相似程度低。算法主要思路先從任意一組劃分出發(fā),通過(guò)調(diào)整,逐步達(dá)成上述目標(biāo)算法步驟1.先計(jì)算鳶尾花的聚類中心2.針對(duì)矛盾樣本進(jìn)行調(diào)整3.K均值聚類結(jié)果4.重復(fù)第2、3步驟,直到聚類中心與劃分方式不再發(fā)生變化K均值聚類算法KmeansclusteringalgorithmUnsupervisedmachinelearningmethods無(wú)監(jiān)督機(jī)器學(xué)習(xí)的方法聚類算法示例(鳶尾花分類問(wèn)題)1.先計(jì)算鳶尾花的聚類中心2.針對(duì)矛盾樣本進(jìn)行調(diào)整3.K均值聚類結(jié)果K均值聚類算法Kmeansclusteringalgorithm只要我們能對(duì)照片中的人臉提取特征,用特征空間里的特征點(diǎn)表示每一張人臉,就能使用K均值算法將“相似”的人臉聚集起來(lái)了相冊(cè)中的人臉聚類K均值聚類算法Kmeansclusteringalgorithm聚類數(shù)量過(guò)大會(huì)導(dǎo)致照片劃分得過(guò)細(xì),這樣就失去了實(shí)用性,需要在平均距離與聚類數(shù)量之間取得平衡如圖,在K=3的時(shí)候,曲線產(chǎn)生了一個(gè)明顯的拐點(diǎn),拐點(diǎn)后隨著K的增加平均距離減少得非常慢,因此K=3是個(gè)合適的選擇。K值的確定手肘法(elbowmethod)K均值聚類算法Kmeansclusteringalgorithm潛在語(yǔ)義分析技術(shù)Latentsemanticanalysis針對(duì)文本數(shù)據(jù)“多主題”的特點(diǎn)而設(shè)計(jì)計(jì)算機(jī)可以借助該技術(shù),從海量的文本數(shù)據(jù)中自動(dòng)發(fā)掘潛在的主題,進(jìn)而完成對(duì)文本內(nèi)容的概括和提煉相關(guān)專有名詞語(yǔ)料庫(kù)(corpus):海量的文本數(shù)據(jù)文檔(document):語(yǔ)料庫(kù)中獨(dú)立的文本主題:文檔的中心思想或主要內(nèi)容主題模型與潛在語(yǔ)義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology詞袋模型

詞袋模型(bagofwords

model)是用于描述文本的一個(gè)簡(jiǎn)單的數(shù)學(xué)模型,常用文本特征提取方式之一。詞袋模型將一篇文文件看作是一個(gè)“裝有若干詞語(yǔ)的袋子”,只考慮詞語(yǔ)在文檔中出現(xiàn)的次數(shù),而忽略詞語(yǔ)的順序以及句子的結(jié)構(gòu)。利用詞袋模型構(gòu)建文本特征的基本流程文本的特征中文分詞詞頻特征文檔詞袋刪除停止詞與低頻詞中文分詞中文分詞詞典詞頻率—逆文檔頻率特征主題模型與潛在語(yǔ)義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology中文分詞

對(duì)中文文本進(jìn)行詞袋構(gòu)建之前,我們還需要藉助額外的手段拆分詞語(yǔ),這項(xiàng)技術(shù)稱為中文分詞。中文分詞方法大多基于匹配和統(tǒng)計(jì)學(xué)方法。停止詞與低頻詞停止詞:是文檔常出現(xiàn)的,構(gòu)成中文句子的基本字詞,對(duì)區(qū)分不同文文件的主題沒有任何幫助(不攜帶任何主題信息的高頻詞)低頻詞:通常是一些不常用的專有名詞,只出現(xiàn)于特定的文章中(比如姓名),不能代表某一主題。詞頻率與逆文檔頻率反映一個(gè)詞語(yǔ)對(duì)于一篇文檔的重要性的兩個(gè)指標(biāo)一個(gè)詞語(yǔ)在一篇文文件中出現(xiàn)的頻率即為詞頻率(team

frequency)借助逆文檔頻率(inversedocumentfrequency)來(lái)修正每個(gè)詞語(yǔ)在每篇文檔中的重要性文本的特征主題模型與潛在語(yǔ)義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology主題模型(topic

model)是描述語(yǔ)料庫(kù)及其中潛在主題的一類數(shù)學(xué)模型將文文檔詞頻、主題比重、主題詞頻三者的關(guān)系表示為:D

=

WT,這個(gè)等式建立了語(yǔ)料庫(kù)與潛在主題之間的關(guān)系,是主題模型的核心。通過(guò)主題模型,我們建立了語(yǔ)料庫(kù)與其中潛在主題之間的關(guān)系發(fā)掘文本中潛在的主題主題模型與潛在語(yǔ)義分析技術(shù)TopicModelandLatentSemanticAnalysisTechnology生成對(duì)抗絡(luò)GenerativeAdversarialNetwork概述生成對(duì)抗絡(luò)由生成絡(luò)(generativenetwork)和判別絡(luò)(discriminativenetwork)兩部分構(gòu)成生成絡(luò):用于生成數(shù)據(jù)判別絡(luò):用來(lái)分辨數(shù)據(jù)是真還是假generativeadversarialnetwork,GAN02由“生成”、“對(duì)抗”和“路”三個(gè)詞語(yǔ)構(gòu)成。其中“生成”是指它是一個(gè)生成模型(generativemodel),即它可以隨機(jī)生成觀測(cè)數(shù)據(jù)0103基本思想:通過(guò)生成絡(luò)和判別絡(luò)之間的相互“對(duì)抗”來(lái)學(xué)習(xí)0504數(shù)據(jù)空間與數(shù)據(jù)分布數(shù)據(jù)空間(dataspace)是數(shù)據(jù)所在的空間假定輸入圖片的分辨率為128x128,此時(shí)的數(shù)據(jù)空間就是所有形狀為128x128x3的張量的集合。此時(shí)每張圖片都是此空間里的一個(gè)點(diǎn)(數(shù)據(jù)點(diǎn))數(shù)據(jù)分布(datadistribution)是數(shù)據(jù)點(diǎn)在空間的分布情況生成對(duì)抗絡(luò)GenerativeAdversarialNetwork分類路與生成路工作方式的比較生成絡(luò)生成器(generator)把潛在空間中的分布變換為圖像空間中的分布(生成分布)生成絡(luò)生成的點(diǎn)就叫做生成點(diǎn)生成對(duì)抗絡(luò)GenerativeAdversarialNetwork例:用判別絡(luò)分辨點(diǎn)的來(lái)源判別絡(luò)判別器(discriminator)判斷一張圖片究竟是來(lái)自真實(shí)數(shù)據(jù)還是由生成絡(luò)所生成訓(xùn)練判別絡(luò)訓(xùn)練數(shù)據(jù)標(biāo)注輸入圖片來(lái)自真實(shí)數(shù)據(jù):標(biāo)注數(shù)值1,輸入圖片來(lái)自生成路:標(biāo)注數(shù)值0輸出結(jié)果用一個(gè)數(shù)值來(lái)指示空間中的一個(gè)點(diǎn)來(lái)自真實(shí)數(shù)據(jù)的可能性(概率)生成對(duì)抗絡(luò)GenerativeAdversarialNetwork包含兩個(gè)交替進(jìn)行的階段固定生成路,訓(xùn)練判別路1.給定二分類數(shù)據(jù)集:真實(shí)圖片/隨機(jī)生成圖片2.目標(biāo):使判別路對(duì)真實(shí)圖片的預(yù)測(cè)接近1,而對(duì)生成圖片的預(yù)測(cè)接近0固定判別路,訓(xùn)練生成路1.生成路利用判別路給出的反饋訊息來(lái)調(diào)整路參數(shù)2.目標(biāo):使生成路輸出更接近真實(shí)圖片的生成圖片對(duì)抗過(guò)程生成絡(luò)的訓(xùn)練生成對(duì)抗絡(luò)GenerativeAdversarialNetworkThesecretbehindAlphaDog阿爾法狗背后的秘密深藍(lán)vs卡斯帕羅夫阿爾法狗vs李世石強(qiáng)化學(xué)習(xí)(reinforcementlearning)功不可沒~棋類計(jì)算機(jī)程序的發(fā)展Developmentofchesscomputerprograms價(jià)值絡(luò)阿爾法狗的走棋絡(luò)AlphaDog'sChessNetwork01030402走棋絡(luò)又被稱為策略絡(luò)(policynetwork)該絡(luò)接受當(dāng)前棋盤局面作為輸入,并輸出在當(dāng)前局面下選擇每個(gè)位置的落子概率。策略絡(luò)監(jiān)督學(xué)習(xí)策略絡(luò)強(qiáng)化學(xué)習(xí)策略絡(luò)輸入局面(3000萬(wàn)樣本)深度卷積神經(jīng)絡(luò)落子概率預(yù)測(cè)(s,a)s:當(dāng)前棋局局面狀態(tài)

a:人類的落子方案監(jiān)督學(xué)習(xí)決策絡(luò)可以模仿人類的風(fēng)格下棋,可人類棋手的水平高低不一,并非每個(gè)樣本都是好的落子方案,絡(luò)把好的壞的都學(xué)了,如何提高棋力?監(jiān)督學(xué)習(xí)策略絡(luò)Supervisedlearningstrategynetwork強(qiáng)化學(xué)習(xí)的目的是找到一個(gè)最佳策略,從而使得主體發(fā)出一系列動(dòng)作后,收到的累計(jì)回報(bào)最多策略梯度的強(qiáng)化學(xué)習(xí)技術(shù)監(jiān)督學(xué)習(xí)策略絡(luò)強(qiáng)化學(xué)習(xí)策略絡(luò)A強(qiáng)化學(xué)習(xí)策略絡(luò)B初始化自我對(duì)弈強(qiáng)化學(xué)習(xí)絡(luò)在訓(xùn)練時(shí)的目標(biāo)不再是模擬人類棋手的風(fēng)格,而是以最終贏棋為目標(biāo)強(qiáng)化學(xué)習(xí)策略絡(luò)ReinforcementLearningStrategyNetwork阿爾法元只以棋盤當(dāng)局作為絡(luò)輸入,使用策略迭代的強(qiáng)化學(xué)習(xí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論