新一代人工智能知識(shí)體系大全_第1頁(yè)
新一代人工智能知識(shí)體系大全_第2頁(yè)
新一代人工智能知識(shí)體系大全_第3頁(yè)
新一代人工智能知識(shí)體系大全_第4頁(yè)
新一代人工智能知識(shí)體系大全_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 一圖看懂新一代人工智能知識(shí)體系大全 摘要:人工智能的發(fā)展離不開基礎(chǔ)支持層和技術(shù)層,基礎(chǔ)支持層包括大數(shù)據(jù)、計(jì)算力和算法;技術(shù)層包括計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言處理。人工智能的技術(shù)本質(zhì)是什么,本文會(huì)詳細(xì)分析。人工智能的發(fā)展離不開基礎(chǔ)支持層和技術(shù)層,基礎(chǔ)支持層包括大數(shù)據(jù)、計(jì)算力和算法;技術(shù)層包括計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言處理。人工智能的技術(shù)本質(zhì)是什么,本文會(huì)詳細(xì)分析??傆[人工智能技術(shù)圖譜基礎(chǔ)支撐層的算法創(chuàng)新發(fā)生在20世紀(jì)80年代末,是大數(shù)據(jù)和計(jì)算力將人工智能推到鎂光燈之下,而建立在這之上的基礎(chǔ)技術(shù)便是計(jì)算機(jī)視覺、語(yǔ)音識(shí)別和自然語(yǔ)言理解,機(jī)器試圖看懂、聽懂人類的世界、用人類的語(yǔ)言和人類交流,研

2、究人類智能活動(dòng)的規(guī)律。1.計(jì)算機(jī)視覺技術(shù)(Computer Vision)1)什么是計(jì)算機(jī)視覺“人的大腦皮層的活動(dòng), 大約70%是在處理視覺相關(guān)信息。視覺就相當(dāng)于人腦的大門,其它如聽覺、觸覺、味覺那都是帶寬較窄的通道。視覺相當(dāng)于八車道的高速, 其它感覺是兩旁的人行道。如果不能處理視覺信息的話,整個(gè)人工智能系統(tǒng)是個(gè)空架子,只能做符號(hào)推理,比如下棋、定理證明, 沒法進(jìn)入現(xiàn)實(shí)世界。計(jì)算機(jī)視覺之于人工智能,它相當(dāng)于說(shuō)芝麻開門。大門就在這里面,這個(gè)門打不開, 就沒法研究真實(shí)世界的人工智能。”朱松純,加州大學(xué)洛杉磯分校UCLA統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授根據(jù)科普中國(guó)撰寫的對(duì)計(jì)算機(jī)視覺的定義,這是一門研究如何讓機(jī)

3、器“看”的科學(xué),更進(jìn)一步的說(shuō),是指用計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺,并進(jìn)一步做圖形處理,使計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。2)計(jì)算機(jī)視覺 VS 機(jī)器視覺計(jì)算機(jī)視覺更關(guān)注圖像信號(hào)本身以及圖像相關(guān)交叉領(lǐng)域(地圖、醫(yī)療影像)的研究;機(jī)器視覺則偏重計(jì)算機(jī)視覺技術(shù)工程化,更關(guān)注廣義上的圖像信號(hào)(激光和攝像頭)和自動(dòng)化控制(生產(chǎn)線)方面的應(yīng)用。3)計(jì)算機(jī)視覺識(shí)別技術(shù)的分類物體識(shí)別分為“1 VS N”對(duì)不同物體進(jìn)行歸類,以及“1 VS 1”對(duì)同類型的物體進(jìn)行區(qū)分和鑒別;物體屬性識(shí)別,結(jié)合地圖模型讓物體在視覺的三維空間里得到記憶的重建,進(jìn)而進(jìn)行場(chǎng)景的分析和判斷;物體行為

4、識(shí)別分為3個(gè)進(jìn)階的步驟,移動(dòng)識(shí)別判斷物體是否做了位移,動(dòng)作識(shí)別判斷物體做的是什么動(dòng)作,行為識(shí)別是結(jié)合視覺主體和場(chǎng)景的交互做出行為的分析和判斷。4)計(jì)算機(jī)視覺的識(shí)別流程計(jì)算機(jī)視覺識(shí)別流程分為兩條路線:訓(xùn)練模型和識(shí)別圖像。訓(xùn)練模型:樣本數(shù)據(jù)包括正樣本(包含待檢目標(biāo)的樣本)和負(fù)樣本(不包含目標(biāo)的樣本),視覺系統(tǒng)利用算法對(duì)原始樣本進(jìn)行特征的選擇和提取訓(xùn)練出分類器(模型);此外因?yàn)闃颖緮?shù)據(jù)成千上萬(wàn)、提取出來(lái)的特征更是翻番,所以一般為了縮短訓(xùn)練的過程,會(huì)人為加入知識(shí)庫(kù)(提前告訴計(jì)算機(jī)一些規(guī)則),或者引入限制條件來(lái)縮小搜索空間。識(shí)別圖像:會(huì)先對(duì)圖像進(jìn)行信號(hào)變換、降噪等預(yù)處理,再來(lái)利用分類器對(duì)輸入圖像進(jìn)行目標(biāo)

5、檢測(cè)。一般檢測(cè)過程為用一個(gè)掃描子窗口在待檢測(cè)的圖像中不斷的移位滑動(dòng),子窗口每到一個(gè)位置就會(huì)計(jì)算出該區(qū)域的特征,然后用訓(xùn)練好的分類器對(duì)該特征進(jìn)行篩選,判斷該區(qū)域是否為目標(biāo)。5 )計(jì)算機(jī)視覺技術(shù)模式圖和對(duì)應(yīng)企業(yè)圖目前世界上圖像識(shí)別最大的數(shù)據(jù)庫(kù),是斯坦福大學(xué)人工智能實(shí)驗(yàn)室提供的ImageNet,針對(duì)諸如醫(yī)療等細(xì)分領(lǐng)域也需要收集相應(yīng)的訓(xùn)練數(shù)據(jù);Google、Microsoft此類科技巨頭會(huì)面向市場(chǎng)提供開源算法框架,為初創(chuàng)視覺識(shí)別公司提供初級(jí)算法。2.語(yǔ)音識(shí)別(Automatic Speech Recognition)1)什么是語(yǔ)音識(shí)別語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,通過信號(hào)處理和識(shí)別技術(shù)讓機(jī)器自動(dòng)識(shí)別和理

6、解人類口述的語(yǔ)言后,將語(yǔ)音信號(hào)轉(zhuǎn)換為相應(yīng)的文本或命令的一門技術(shù)。由語(yǔ)音識(shí)別和語(yǔ)音合成、自然語(yǔ)言理解、語(yǔ)義網(wǎng)絡(luò)等技術(shù)相結(jié)合的語(yǔ)音交互正在逐步成為當(dāng)前多通道、多媒體智能人機(jī)交互的主要方式。2)語(yǔ)音識(shí)別的流程語(yǔ)音識(shí)別流程分為訓(xùn)練和識(shí)別兩條線路。語(yǔ)音信號(hào)經(jīng)過前端信號(hào)處理、端點(diǎn)檢測(cè)等預(yù)處理后,逐幀提取語(yǔ)音特征,傳統(tǒng)的特征類型包括有MFCC、PLP、FBANK等特征,提取好的特征會(huì)送到解碼器,在訓(xùn)練好的聲學(xué)模型、語(yǔ)言模型之下,找到最為匹配的此序列作為識(shí)別結(jié)果輸出。3)語(yǔ)音識(shí)別技術(shù)模式圖和對(duì)應(yīng)企業(yè)圖基礎(chǔ)層:包含大數(shù)據(jù)、計(jì)算力和算法三塊,其中大數(shù)據(jù)等接入的是相應(yīng)領(lǐng)域的第三方服務(wù)商。機(jī)器在識(shí)別人類的語(yǔ)音指令后接

7、入、提供相應(yīng)的服務(wù)。諸如影視、電影票、餐飲等;技術(shù)層:以科大訊飛為首的語(yǔ)音技術(shù)提供商;應(yīng)用層:傳統(tǒng)家居環(huán)境中的電視、音箱廠商都給加上了語(yǔ)音識(shí)別功能,新增交互方式;還有智能車載采用語(yǔ)音交互讓手不離開方向盤提高安全系數(shù);還有搜索廠商基于搜索做出來(lái)的語(yǔ)音助手等。3.自然語(yǔ)言理解(Natural Language Understanding)1)什么是自然語(yǔ)言理解自然語(yǔ)言理解即文本理解,和語(yǔ)音圖像的模式識(shí)別技術(shù)有著本質(zhì)的區(qū)別,語(yǔ)言作為知識(shí)的載體,承載了復(fù)雜的信息量,具有高度的抽象性,對(duì)語(yǔ)言的理解屬于認(rèn)知層面,不能僅靠模式匹配的方式完成。2)自然語(yǔ)言理解的應(yīng)用:搜索引擎+機(jī)器翻譯;自然語(yǔ)言理解最典型兩種

8、應(yīng)用為搜索引擎和機(jī)器翻譯。搜索引擎可以在一定程度上理解人類的自然語(yǔ)言,從自然語(yǔ)言中抽取出關(guān)鍵內(nèi)容并用于檢索,最終達(dá)到搜索引擎和自然語(yǔ)言用戶之間的良好銜接,可以在兩者之間建立起更高效,更深層的信息傳遞。3)自然語(yǔ)言理解技術(shù)在搜索引擎中的應(yīng)用4)自然語(yǔ)言理解技術(shù)在機(jī)器翻譯中的應(yīng)用事實(shí)上搜索引擎和機(jī)器翻譯不分家,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)為其充實(shí)了語(yǔ)料庫(kù)使得其發(fā)展模態(tài)發(fā)生了質(zhì)的改變?;ヂ?lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)除了將原先線下的信息(原有語(yǔ)料)進(jìn)行在線化之外,還衍生出來(lái)的新型UGC模式:知識(shí)分享數(shù)據(jù),像維基百科、百度百科等都是人為校準(zhǔn)過的詞條,噪聲?。簧缃粩?shù)據(jù),像微博和微信等展現(xiàn)用戶的個(gè)性化、主觀化、時(shí)效性,可以用來(lái)做個(gè)性化推薦、情感傾向分析、以及熱點(diǎn)輿情的檢測(cè)和跟蹤等;社區(qū)、論壇數(shù)據(jù),像果殼、知乎等為搜索引擎提供了問答知識(shí)、問答資源等數(shù)據(jù)源。另一方面,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論