人工智能的核心技術(shù)_第1頁
人工智能的核心技術(shù)_第2頁
人工智能的核心技術(shù)_第3頁
人工智能的核心技術(shù)_第4頁
人工智能的核心技術(shù)_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余21頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人工智能的核心技術(shù)人工智能的核心技術(shù)是什么?《人工智能標(biāo)準(zhǔn)化白皮書〔2023》機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)〔MachineLearning〕是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識、靠近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理爭論計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獵取的學(xué)問或技能,重組織已有的學(xué)問構(gòu)造心?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一,爭論從觀測數(shù)據(jù)〔樣本〕動身查找規(guī)律,利用這些規(guī)律對將來數(shù)據(jù)或無法觀測算法的不同,機(jī)器學(xué)習(xí)存在不同的分類方法。依據(jù)學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)視學(xué)習(xí)、無監(jiān)視學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。監(jiān)視學(xué)習(xí)學(xué)習(xí)平衡了學(xué)習(xí)結(jié)果的有效性與學(xué)習(xí)模型的可框架,主要用于有限樣本狀況下的模式分類、共同的重要理論根底之一是統(tǒng)計(jì)學(xué),在自然語言處理、語音識別、圖像識別、信息檢索和生物信息等很多計(jì)算機(jī)領(lǐng)域獲得了廣泛應(yīng)用。深度學(xué)習(xí)的深度學(xué)習(xí)算法包括深度置信網(wǎng)絡(luò)、卷積神經(jīng)〔指層數(shù)超過3神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)爭論中的一Hinton2023深度學(xué)習(xí)源于多層神經(jīng)網(wǎng)絡(luò),其實(shí)質(zhì)是給出了習(xí)的特點(diǎn)是放棄了可解釋性,單純追求學(xué)習(xí)的了諸多深度神經(jīng)網(wǎng)絡(luò)的模型,其中卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)是兩類典型的模型。卷積神絡(luò)在神經(jīng)網(wǎng)絡(luò)中引入了記憶和反響,常被應(yīng)用習(xí)的根底底層框架,一般包含主流的神經(jīng)網(wǎng)絡(luò)API,支持訓(xùn)練GPUTPU帶來前所未有的運(yùn)行速度和有用性。目前主流TensorFlowCaffe/Caffe2、CNTK、MXNetPaddle-paddleTorch/PyTorch、Theano等?!?〕此外,機(jī)器學(xué)習(xí)的常見算法還包括遷移學(xué)習(xí)、主動學(xué)習(xí)和演化學(xué)習(xí)等。遷移學(xué)習(xí)遷移學(xué)習(xí)是指當(dāng)在某些領(lǐng)域無法取得足夠多的數(shù)據(jù)進(jìn)展模型訓(xùn)練時(shí),利用另一領(lǐng)域數(shù)據(jù)獲得模型參數(shù)遷移到的模型指導(dǎo)模型訓(xùn)練,可使用,如基于傳感器網(wǎng)絡(luò)的定位,文字分類和更有挑戰(zhàn)性的問題,如視頻分類、社交網(wǎng)絡(luò)分析、規(guī)律推理等。主動學(xué)習(xí)主動學(xué)習(xí)通過肯定的算法查詢最有用的未標(biāo)記樣本,并交由專家進(jìn)展標(biāo)記,然后用查詢到的能夠選擇性地獲取學(xué)問,通過較少的訓(xùn)練樣本演化學(xué)習(xí)優(yōu)化算法、多目標(biāo)演化算法等。目前針對演化學(xué)習(xí)的爭論主要集中在演化數(shù)據(jù)聚類、對演化確定演化機(jī)制的影響等。學(xué)問圖譜由節(jié)點(diǎn)和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號形式描單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及實(shí)體及其相關(guān)“屬性—值”對。不同實(shí)體之間通過譜中,每個節(jié)點(diǎn)表示現(xiàn)實(shí)世界的圖譜就是把全部不同種類的信息連接在一起而得到的一個關(guān)系網(wǎng)絡(luò),供給了從“關(guān)系”的角詐等公共安全保障領(lǐng)域,需要用到特別分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,學(xué)問圖譜在搜索引擎、可視化展現(xiàn)和精準(zhǔn)營銷噪聲問題,即數(shù)據(jù)本身有錯誤或者數(shù)據(jù)存在冗關(guān)鍵技術(shù)需要突破。自然語言處理自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,爭論能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)展有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問答系統(tǒng)等。機(jī)器翻譯機(jī)器翻譯技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)從一種自然語言到另外一種自然語言的翻譯過程?;诮y(tǒng)計(jì)的機(jī)器翻譯方法突破了之前基于規(guī)章和實(shí)例翻譯方法的局限性,翻譯性能取得巨大提—些場景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和學(xué)問規(guī)律推理力量譯將會在多輪對話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。目前非限定領(lǐng)域機(jī)器翻譯中性能較佳的一種是統(tǒng)計(jì)機(jī)器翻譯,包括訓(xùn)練及解碼兩個階段。訓(xùn)是利用所估量的參數(shù)和給定的優(yōu)化目標(biāo),獵取率計(jì)算、最大熵調(diào)序等步驟?;谏窠?jīng)網(wǎng)絡(luò)的端到端翻譯方法不需要針對雙語句子特地設(shè)計(jì)特征模型,而是直接把源語言句子的詞串送入語言句子的翻譯結(jié)果。在基于端到端的機(jī)器翻譯系統(tǒng)中,通常承受遞歸神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)取語義信息,與基于短語的統(tǒng)計(jì)翻譯相比,其好的效果。語義理解語義理解技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對文本語義理解更留意于對上下文的理解以及對答案精準(zhǔn)程度的把控。隨著MCTest數(shù)據(jù)集的公布,數(shù)據(jù)集和對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語義理解技術(shù)將在智能客服、產(chǎn)品自動問答等相關(guān)的精度。法和自動構(gòu)造填空型問題的方法來有效擴(kuò)大數(shù)習(xí)的方法相繼提出,如基于留意力的神經(jīng)網(wǎng)絡(luò)較大的提升空間。問答系統(tǒng)問答系統(tǒng)分為開放領(lǐng)域的對話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計(jì)算機(jī)像人問答系統(tǒng)提交用自然語言表達(dá)的問題,系統(tǒng)會效勞系統(tǒng)和智能手機(jī)助手等領(lǐng)域中的應(yīng)用,在問答系統(tǒng)魯棒性方面仍舊存在著問題和挑戰(zhàn)。語義、語用和語音等不同層面存在不確定性;現(xiàn)象的不行推測性;三是數(shù)據(jù)資源的不充分使其難以掩蓋簡單的語言現(xiàn)象;四是語義學(xué)問的模糊性和錯綜簡單的關(guān)聯(lián)性難以用簡潔的數(shù)學(xué)模型描述,語義計(jì)算需要參數(shù)浩大的非線性計(jì)算。人機(jī)交互人機(jī)交互主要爭論人和計(jì)算機(jī)之間的信息交換,主要包括人到計(jì)算機(jī)和計(jì)算機(jī)到人的兩局部信的人與計(jì)算機(jī)之間的信息交換主要依靠交互設(shè)備進(jìn)展,主要包括鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼動跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓以下對后四種與人工智能關(guān)聯(lián)親熱的典型交互手段進(jìn)展介紹。語音交互音或機(jī)器合成語音同計(jì)算機(jī)進(jìn)展交互的綜合性技術(shù),結(jié)合了語言學(xué)、心理學(xué)、工程和計(jì)算機(jī)技術(shù)等領(lǐng)域的知識。語音交互不僅要對語音識別包括四局部:語音采集、語音識別、語義理解編碼;語音識別完成語音信息到機(jī)器可識別的的文本字符或命令完成相應(yīng)的操作;語音合成完成文本信息到聲音信息的轉(zhuǎn)換。作為人類溝他交互方式具備更多優(yōu)勢,能為人機(jī)交互帶來情感交互無法理解和適應(yīng)人的心情或心境,缺乏情感理解和表達(dá)力量,計(jì)算機(jī)難以具有類似人一樣的然。情感交互就是要賜予計(jì)算機(jī)類似于人一樣情感交互已經(jīng)成為人工智能領(lǐng)域中的熱點(diǎn)方向,旨在讓人機(jī)交互變得更加自然。目前,在情感交互信息的處理方式、情感描述方式、情感數(shù)多技術(shù)挑戰(zhàn)。體感交互體感交互是個體不需要借助任何簡單的掌握系統(tǒng),以體感技術(shù)為根底,直接通過肢體動作與體感方式與原理的不同,體感技術(shù)主要分為三類:慣性感測、光學(xué)感測以及光學(xué)聯(lián)合感測。體都有了較大的提升,交互設(shè)備向小型化、便攜的約束,使得交互過程更加自然。目前,體感交互在玩耍消遣、醫(yī)療關(guān)心與康復(fù)、全自動三的應(yīng)用。腦機(jī)交互和肌肉等神經(jīng)通道,直接實(shí)現(xiàn)大腦與外界信息動,并將其轉(zhuǎn)化為人工輸出指令,能夠替代、交互作用。腦機(jī)交互通過對神經(jīng)信號解碼,實(shí)現(xiàn)腦信號到機(jī)器指令的轉(zhuǎn)化,一般包括信號采集、特征提取和命令輸出三個模塊。從腦電信侵入式兩大類。除此之外,腦機(jī)接口還有其他常見的分類方式:依據(jù)信號傳輸方向可以分為的類型,可分為自發(fā)式腦機(jī)接口和誘發(fā)式腦機(jī)機(jī)接口、基于功能性核磁共振的腦機(jī)接口以及基于近紅外光譜分析的腦機(jī)接口。計(jì)算機(jī)視覺計(jì)算機(jī)視覺是使用計(jì)算機(jī)仿照人類視覺系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的力量。自動駕駛、機(jī)器人、智能醫(yī)療等領(lǐng)域均需要通過計(jì)算機(jī)視深度學(xué)習(xí)的進(jìn)展,預(yù)處理、特征提取與算法處依據(jù)解決的問題,計(jì)算機(jī)視覺可分為計(jì)算成像學(xué)、圖像理解、三維視覺、動態(tài)視覺和視頻編解碼五大類。計(jì)算成像學(xué)其延長應(yīng)用的科學(xué)。在相機(jī)成像原理方面,計(jì)現(xiàn)代相機(jī)更加輕松,可以適用于不同場景。同成像學(xué)可以提升相機(jī)的力量,從而通過后續(xù)的算法處理使得在受限條件下拍攝的圖像更加完善,例如圖像去噪、去模糊、暗光增加、去霧霾圖像理解似人類視覺系統(tǒng)理解外部世界的一門科學(xué)。通層理解,包括圖像邊緣、圖像特征點(diǎn)、紋理元致分為識別、檢測、分割、姿勢估量、圖像文用于人工智能系統(tǒng),如刷臉支付、才智安防、圖像搜尋等。三維視覺〔三維重建〕以及如何理解所獲取的三維信息的科目圖像重建、多目圖像重建和深度圖像重建等。三維信息理解,即使用三維信息關(guān)心圖像理解或者直接理解三維信息。三維信息理解可分為,淺層:角點(diǎn)、邊緣、法向量等;中層:平面、立方體等;高層:物體檢測、識別、分割等。三才智工廠、虛擬/增加現(xiàn)實(shí)等方向。動態(tài)視覺序圖像的科學(xué)。通常動態(tài)視覺問題可以定義為查找圖像元素,如像素、區(qū)域、物體在時(shí)序上的對應(yīng),以及提取其語義信息的問題。動態(tài)視覺爭論被廣泛應(yīng)用在視頻分析以及人機(jī)交互等方面。視頻編解碼進(jìn)展壓縮。視頻流傳輸中最為重要的編解碼標(biāo)H.261H.263H.264H.265、M-JPEG和MPEG系列標(biāo)準(zhǔn)。視頻壓縮編碼主要分為兩大類:無損壓縮和有損壓縮。無損壓縮據(jù)進(jìn)展重構(gòu)時(shí),重構(gòu)后的數(shù)據(jù)與原來的數(shù)據(jù)有產(chǎn)生誤會。有損壓縮的應(yīng)用范圍廣泛,例如視頻會議、可視、視頻播送、視頻監(jiān)控等。產(chǎn)業(yè)規(guī)模。將來計(jì)算機(jī)視覺技術(shù)的進(jìn)展主要面技術(shù)更好的結(jié)合,計(jì)算機(jī)視覺在解決某些問題度;二是如何降低計(jì)算機(jī)視覺算法的開發(fā)時(shí)間據(jù)與人工標(biāo)注,需要較長的研發(fā)周期以到達(dá)應(yīng)能芯片的消滅,針對不同芯片與數(shù)據(jù)采集設(shè)備的計(jì)算機(jī)視覺算法的設(shè)計(jì)與開發(fā)也是挑戰(zhàn)之一。生物特征識別生物特征識別技術(shù)是指通過個體生理特征或行為特征對個體身份進(jìn)展識別認(rèn)證的技術(shù)。從應(yīng)個階段。注冊階段通過傳感器對人體的生物表采集,利用數(shù)據(jù)預(yù)處理以及特征提取技術(shù)對采集的數(shù)據(jù)進(jìn)展處理,得到相應(yīng)的特征進(jìn)展存儲。識別過程承受與注冊過程全都的信息采集方式取,然后將提取的特征與存儲的特征進(jìn)展比對分析,完成識別。從應(yīng)用任務(wù)看,生物特征識儲庫中確定待識別人身份的過程,是一對多的單人信息進(jìn)行比對,確定身份的過程,是一對一的問題。紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識別過程涉及到圖像處理、計(jì)算機(jī)視覺、語音識別、機(jī)器學(xué)習(xí)等多項(xiàng)技術(shù)。目前生物特征識別作為重要的智能化身份認(rèn)證技術(shù),在金融、公共安全、教育、交通等領(lǐng)域得等技術(shù)進(jìn)展介紹。指紋識別指紋識別過程通常包括數(shù)據(jù)采過光、電、力、熱等物理傳感器獵取指紋圖像;過程。應(yīng)用,從應(yīng)用過程來看,可將人臉識別技術(shù)劃過程。人臉識別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個因素的影響,在約束條件下人臉識別技術(shù)相對成熟,在自由條件下人臉識別技術(shù)還在不斷改進(jìn)。虹膜圖像分割、虹膜區(qū)域歸一化、特征提取和進(jìn)展而來。虹膜識別技術(shù)應(yīng)用的主要難題包含尺寸小且受黑色素遮擋,需在近紅外光源下承受弱變化會引起瞳孔縮放,導(dǎo)致虹膜紋理產(chǎn)生簡單形變,增加了匹配的難度。脈血管中的脫氧血紅蛋白對特定波長范圍內(nèi)的外光對指靜脈進(jìn)展成像與識別的技術(shù)。由于指的唯一性,且屬于人體內(nèi)部特征,不受到外界影聲紋特征識別說話人的技術(shù)。聲紋識別技術(shù)通識別的過程是將某段來自某個人的語音經(jīng)過特征提取后與多復(fù)合聲紋模型庫中的聲紋模型進(jìn)概率模型法等??汕宄上竦纳锾卣?,步態(tài)識別是指通過身高要求的預(yù)處理算法,但步態(tài)識別具有遠(yuǎn)距離、跨角度、光照不敏感等優(yōu)勢。虛擬現(xiàn)實(shí)/增加現(xiàn)實(shí)虛擬現(xiàn)實(shí)〔VR〕/增加現(xiàn)實(shí)〔AR〕是以計(jì)算機(jī)為核心的型視聽技術(shù)。結(jié)合相關(guān)科學(xué)技術(shù),在等方面高度近似的數(shù)字化環(huán)境。用戶借助必要設(shè)備、跟蹤定位設(shè)備、觸力覺交互設(shè)備、數(shù)據(jù)獵取設(shè)備、專用芯片等實(shí)現(xiàn)。虛擬現(xiàn)實(shí)/增加現(xiàn)實(shí)從技術(shù)特征角度,依據(jù)不同處理階段,可以分為獵取與建模技術(shù)、分析與利用技術(shù)交換與分發(fā)技術(shù)展現(xiàn)與交互技術(shù)以及技術(shù)標(biāo)準(zhǔn)與評價(jià)體系五個方面。獵取與建模技術(shù)爭論如何把物理世界或者人類的創(chuàng)意進(jìn)展數(shù)字化和模型化,難點(diǎn)是三維物理世界的數(shù)字化和模型化技術(shù);分析與利用技術(shù)重點(diǎn)爭論對數(shù)字內(nèi)容進(jìn)展分析、理解、搜尋和學(xué)問化方法,其難點(diǎn)是在于內(nèi)容的語義表示和分析;交換與分發(fā)技術(shù)主要強(qiáng)調(diào)各種網(wǎng)絡(luò)環(huán)境下大規(guī)模的數(shù)字化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論