版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
人工智能基礎進階篇匯報人:XXXfoundationofartificialintelligence目錄讓人工智能更智能無監(jiān)督機器學習的方法阿爾法狗背后的秘密CONTENT讓人工智能更智能Makeartificialintelligencesmarter監(jiān)督學習需要訓練數據的標注信息的學習過程,就是監(jiān)督學習如:分類器從數據中學會了區(qū)分鳶尾花的品種如:對圖像、音頻和視頻的分類,都需要類別的標注信息,都屬于監(jiān)督學習沒有類別的標注信息供人工智能參考時,怎么辦?“計算機能不能自動將照片整理好?”無監(jiān)督學習沒有標注信息的學習過程無類別信息指導很難判斷哪一些鳶尾花是相同品種“計算機能不能自動將照片整理好?”聚類(clustering)通過分析數據在特征空間的聚集情況,可以將一組數據分成不同的類。旨在把一群樣本分為多個集合,使得同一個集合內的元素盡量“相似”或者“相近”是一種無監(jiān)督學習過程不需要數據的類別標注不需要預先定義類別讓人工智能像真正的科學家一樣,自己發(fā)掘規(guī)律。問題的提出我們希望人工智能在不知道鳶尾花品種的前提下將這N朵鳶尾花分為K類,使得同一類樣本的特征相似程度高,而不同類樣本的特征相似程度低。算法主要思路先從任意一組劃分出發(fā),通過調整,逐步達成上述目標算法步驟1.先計算鳶尾花的聚類中心2.針對矛盾樣本進行調整3.K均值聚類結果4.重復第2、3步驟,直到聚類中心與劃分方式不再發(fā)生變化K均值聚類算法KmeansclusteringalgorithmUnsupervisedmachinelearningmethods無監(jiān)督機器學習的方法聚類算法示例(鳶尾花分類問題)1.先計算鳶尾花的聚類中心2.針對矛盾樣本進行調整3.K均值聚類結果K均值聚類算法Kmeansclusteringalgorithm只要我們能對照片中的人臉提取特征,用特征空間里的特征點表示每一張人臉,就能使用K均值算法將“相似”的人臉聚集起來了相冊中的人臉聚類K均值聚類算法Kmeansclusteringalgorithm聚類數量過大會導致照片劃分得過細,這樣就失去了實用性,需要在平均距離與聚類數量之間取得平衡如圖,在K=3的時候,曲線產生了一個明顯的拐點,拐點后隨著K的增加平均距離減少得非常慢,因此K=3是個合適的選擇。K值的確定手肘法(elbowmethod)K均值聚類算法Kmeansclusteringalgorithm潛在語義分析技術Latentsemanticanalysis針對文本數據“多主題”的特點而設計計算機可以借助該技術,從海量的文本數據中自動發(fā)掘潛在的主題,進而完成對文本內容的概括和提煉相關專有名詞語料庫(corpus):海量的文本數據文檔(document):語料庫中獨立的文本主題:文檔的中心思想或主要內容主題模型與潛在語義分析技術TopicModelandLatentSemanticAnalysisTechnology詞袋模型
詞袋模型(bagofwords
model)是用于描述文本的一個簡單的數學模型,常用文本特征提取方式之一。詞袋模型將一篇文文件看作是一個“裝有若干詞語的袋子”,只考慮詞語在文檔中出現的次數,而忽略詞語的順序以及句子的結構。利用詞袋模型構建文本特征的基本流程文本的特征中文分詞詞頻特征文檔詞袋刪除停止詞與低頻詞中文分詞中文分詞詞典詞頻率—逆文檔頻率特征主題模型與潛在語義分析技術TopicModelandLatentSemanticAnalysisTechnology中文分詞
對中文文本進行詞袋構建之前,我們還需要藉助額外的手段拆分詞語,這項技術稱為中文分詞。中文分詞方法大多基于匹配和統(tǒng)計學方法。停止詞與低頻詞停止詞:是文檔常出現的,構成中文句子的基本字詞,對區(qū)分不同文文件的主題沒有任何幫助(不攜帶任何主題信息的高頻詞)低頻詞:通常是一些不常用的專有名詞,只出現于特定的文章中(比如姓名),不能代表某一主題。詞頻率與逆文檔頻率反映一個詞語對于一篇文檔的重要性的兩個指標一個詞語在一篇文文件中出現的頻率即為詞頻率(team
frequency)借助逆文檔頻率(inversedocumentfrequency)來修正每個詞語在每篇文檔中的重要性文本的特征主題模型與潛在語義分析技術TopicModelandLatentSemanticAnalysisTechnology主題模型(topic
model)是描述語料庫及其中潛在主題的一類數學模型將文文檔詞頻、主題比重、主題詞頻三者的關系表示為:D
=
WT,這個等式建立了語料庫與潛在主題之間的關系,是主題模型的核心。通過主題模型,我們建立了語料庫與其中潛在主題之間的關系發(fā)掘文本中潛在的主題主題模型與潛在語義分析技術TopicModelandLatentSemanticAnalysisTechnology生成對抗絡GenerativeAdversarialNetwork概述生成對抗絡由生成絡(generativenetwork)和判別絡(discriminativenetwork)兩部分構成生成絡:用于生成數據判別絡:用來分辨數據是真還是假generativeadversarialnetwork,GAN02由“生成”、“對抗”和“路”三個詞語構成。其中“生成”是指它是一個生成模型(generativemodel),即它可以隨機生成觀測數據0103基本思想:通過生成絡和判別絡之間的相互“對抗”來學習0504數據空間與數據分布數據空間(dataspace)是數據所在的空間假定輸入圖片的分辨率為128x128,此時的數據空間就是所有形狀為128x128x3的張量的集合。此時每張圖片都是此空間里的一個點(數據點)數據分布(datadistribution)是數據點在空間的分布情況生成對抗絡GenerativeAdversarialNetwork分類路與生成路工作方式的比較生成絡生成器(generator)把潛在空間中的分布變換為圖像空間中的分布(生成分布)生成絡生成的點就叫做生成點生成對抗絡GenerativeAdversarialNetwork例:用判別絡分辨點的來源判別絡判別器(discriminator)判斷一張圖片究竟是來自真實數據還是由生成絡所生成訓練判別絡訓練數據標注輸入圖片來自真實數據:標注數值1,輸入圖片來自生成路:標注數值0輸出結果用一個數值來指示空間中的一個點來自真實數據的可能性(概率)生成對抗絡GenerativeAdversarialNetwork包含兩個交替進行的階段固定生成路,訓練判別路1.給定二分類數據集:真實圖片/隨機生成圖片2.目標:使判別路對真實圖片的預測接近1,而對生成圖片的預測接近0固定判別路,訓練生成路1.生成路利用判別路給出的反饋訊息來調整路參數2.目標:使生成路輸出更接近真實圖片的生成圖片對抗過程生成絡的訓練生成對抗絡GenerativeAdversarialNetworkThesecretbehindAlphaDog阿爾法狗背后的秘密深藍vs卡斯帕羅夫阿爾法狗vs李世石強化學習(reinforcementlearning)功不可沒~棋類計算機程序的發(fā)展Developmentofchesscomputerprograms價值絡阿爾法狗的走棋絡AlphaDog'sChessNetwork01030402走棋絡又被稱為策略絡(policynetwork)該絡接受當前棋盤局面作為輸入,并輸出在當前局面下選擇每個位置的落子概率。策略絡監(jiān)督學習策略絡強化學習策略絡輸入局面(3000萬樣本)深度卷積神經絡落子概率預測(s,a)s:當前棋局局面狀態(tài)
a:人類的落子方案監(jiān)督學習決策絡可以模仿人類的風格下棋,可人類棋手的水平高低不一,并非每個樣本都是好的落子方案,絡把好的壞的都學了,如何提高棋力?監(jiān)督學習策略絡Supervisedlearningstrategynetwork強化學習的目的是找到一個最佳策略,從而使得主體發(fā)出一系列動作后,收到的累計回報最多策略梯度的強化學習技術監(jiān)督學習策略絡強化學習策略絡A強化學習策略絡B初始化自我對弈強化學習絡在訓練時的目標不再是模擬人類棋手的風格,而是以最終贏棋為目標強化學習策略絡ReinforcementLearningStrategyNetwork阿爾法元只以棋盤當局作為絡輸入,使用策略迭代的強化學習
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六年級第一學期教學計劃范文合集三篇
- 九年級化學教學計劃范文錦集7篇
- 銷售部年度工作計劃
- 師德師風的教師演講稿模板5篇
- 人壽保險公司實習報告合集六篇
- 關于年會策劃方案范文合集6篇
- 大學生頂崗實習周記錦集六篇
- 政府績效評估 課件 蔡立輝 第6-10章 政府績效評估的結果應用與改進 -政府績效評估在當代中國的推進
- 2010年高考一輪復習教案:必修1 第四章 非金屬及其化合物 全程教學案
- 2025年農林牧漁專用儀器儀表項目發(fā)展計劃
- 2025中國電信山東青島分公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025年八省聯考高考語文作文真題及參考范文
- 新課標(水平三)體育與健康《籃球》大單元教學計劃及配套教案(18課時)
- 開題報告-鑄牢中華民族共同體意識的學校教育研究
- 計件工勞務合同范例
- 2024年公交車開通儀式講話例文(4篇)
- 2024-2025學年八年級上冊物理 第五章 透鏡以及其應用 測試卷(含答案)
- 《自理理論orem》課件
- 2024年浙江省杭州市下城區(qū)教育局所屬事業(yè)單位招聘學科拔尖人才10人歷年管理單位遴選500模擬題附帶答案詳解
- 研發(fā)項目管理培訓課件講解
- 2024-2030年中國膏劑(膏方)行業(yè)競爭狀況及營銷前景預測報告版
評論
0/150
提交評論