人工智能的核心技術(shù)_第1頁(yè)
人工智能的核心技術(shù)_第2頁(yè)
人工智能的核心技術(shù)_第3頁(yè)
人工智能的核心技術(shù)_第4頁(yè)
人工智能的核心技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能的核心技術(shù)人工智能的核心技術(shù)是什么?《人工智能標(biāo)準(zhǔn)化白皮書〔2023》機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)〔MachineLearning〕是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、靠近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理爭(zhēng)論計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獵取的學(xué)問(wèn)或技能,重組織已有的學(xué)問(wèn)構(gòu)造心?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一,爭(zhēng)論從觀測(cè)數(shù)據(jù)〔樣本〕動(dòng)身查找規(guī)律,利用這些規(guī)律對(duì)將來(lái)數(shù)據(jù)或無(wú)法觀測(cè)算法的不同,機(jī)器學(xué)習(xí)存在不同的分類方法。依據(jù)學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)視學(xué)習(xí)、無(wú)監(jiān)視學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。監(jiān)視學(xué)習(xí)學(xué)習(xí)平衡了學(xué)習(xí)結(jié)果的有效性與學(xué)習(xí)模型的可框架,主要用于有限樣本狀況下的模式分類、共同的重要理論根底之一是統(tǒng)計(jì)學(xué),在自然語(yǔ)言處理、語(yǔ)音識(shí)別、圖像識(shí)別、信息檢索和生物信息等很多計(jì)算機(jī)領(lǐng)域獲得了廣泛應(yīng)用。深度學(xué)習(xí)的深度學(xué)習(xí)算法包括深度置信網(wǎng)絡(luò)、卷積神經(jīng)〔指層數(shù)超過(guò)3神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)爭(zhēng)論中的一Hinton2023深度學(xué)習(xí)源于多層神經(jīng)網(wǎng)絡(luò),其實(shí)質(zhì)是給出了習(xí)的特點(diǎn)是放棄了可解釋性,單純追求學(xué)習(xí)的了諸多深度神經(jīng)網(wǎng)絡(luò)的模型,其中卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)是兩類典型的模型。卷積神絡(luò)在神經(jīng)網(wǎng)絡(luò)中引入了記憶和反響,常被應(yīng)用習(xí)的根底底層框架,一般包含主流的神經(jīng)網(wǎng)絡(luò)API,支持訓(xùn)練GPUTPU帶來(lái)前所未有的運(yùn)行速度和有用性。目前主流TensorFlowCaffe/Caffe2、CNTK、MXNetPaddle-paddleTorch/PyTorch、Theano等?!?〕此外,機(jī)器學(xué)習(xí)的常見(jiàn)算法還包括遷移學(xué)習(xí)、主動(dòng)學(xué)習(xí)和演化學(xué)習(xí)等。遷移學(xué)習(xí)遷移學(xué)習(xí)是指當(dāng)在某些領(lǐng)域無(wú)法取得足夠多的數(shù)據(jù)進(jìn)展模型訓(xùn)練時(shí),利用另一領(lǐng)域數(shù)據(jù)獲得模型參數(shù)遷移到的模型指導(dǎo)模型訓(xùn)練,可使用,如基于傳感器網(wǎng)絡(luò)的定位,文字分類和更有挑戰(zhàn)性的問(wèn)題,如視頻分類、社交網(wǎng)絡(luò)分析、規(guī)律推理等。主動(dòng)學(xué)習(xí)主動(dòng)學(xué)習(xí)通過(guò)肯定的算法查詢最有用的未標(biāo)記樣本,并交由專家進(jìn)展標(biāo)記,然后用查詢到的能夠選擇性地獲取學(xué)問(wèn),通過(guò)較少的訓(xùn)練樣本演化學(xué)習(xí)優(yōu)化算法、多目標(biāo)演化算法等。目前針對(duì)演化學(xué)習(xí)的爭(zhēng)論主要集中在演化數(shù)據(jù)聚類、對(duì)演化確定演化機(jī)制的影響等。學(xué)問(wèn)圖譜由節(jié)點(diǎn)和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號(hào)形式描單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及實(shí)體及其相關(guān)“屬性—值”對(duì)。不同實(shí)體之間通過(guò)譜中,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的圖譜就是把全部不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),供給了從“關(guān)系”的角詐等公共安全保障領(lǐng)域,需要用到特別分析、靜態(tài)分析、動(dòng)態(tài)分析等數(shù)據(jù)挖掘方法。特別地,學(xué)問(wèn)圖譜在搜索引擎、可視化展現(xiàn)和精準(zhǔn)營(yíng)銷噪聲問(wèn)題,即數(shù)據(jù)本身有錯(cuò)誤或者數(shù)據(jù)存在冗關(guān)鍵技術(shù)需要突破。自然語(yǔ)言處理自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,爭(zhēng)論能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)展有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問(wèn)答系統(tǒng)等。機(jī)器翻譯機(jī)器翻譯技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)從一種自然語(yǔ)言到另外一種自然語(yǔ)言的翻譯過(guò)程?;诮y(tǒng)計(jì)的機(jī)器翻譯方法突破了之前基于規(guī)章和實(shí)例翻譯方法的局限性,翻譯性能取得巨大提—些場(chǎng)景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語(yǔ)境表征和學(xué)問(wèn)規(guī)律推理力量譯將會(huì)在多輪對(duì)話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。目前非限定領(lǐng)域機(jī)器翻譯中性能較佳的一種是統(tǒng)計(jì)機(jī)器翻譯,包括訓(xùn)練及解碼兩個(gè)階段。訓(xùn)是利用所估量的參數(shù)和給定的優(yōu)化目標(biāo),獵取率計(jì)算、最大熵調(diào)序等步驟。基于神經(jīng)網(wǎng)絡(luò)的端到端翻譯方法不需要針對(duì)雙語(yǔ)句子特地設(shè)計(jì)特征模型,而是直接把源語(yǔ)言句子的詞串送入語(yǔ)言句子的翻譯結(jié)果。在基于端到端的機(jī)器翻譯系統(tǒng)中,通常承受遞歸神經(jīng)網(wǎng)絡(luò)或卷積神經(jīng)取語(yǔ)義信息,與基于短語(yǔ)的統(tǒng)計(jì)翻譯相比,其好的效果。語(yǔ)義理解語(yǔ)義理解技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)文本語(yǔ)義理解更留意于對(duì)上下文的理解以及對(duì)答案精準(zhǔn)程度的把控。隨著MCTest數(shù)據(jù)集的公布,數(shù)據(jù)集和對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語(yǔ)義理解技術(shù)將在智能客服、產(chǎn)品自動(dòng)問(wèn)答等相關(guān)的精度。法和自動(dòng)構(gòu)造填空型問(wèn)題的方法來(lái)有效擴(kuò)大數(shù)習(xí)的方法相繼提出,如基于留意力的神經(jīng)網(wǎng)絡(luò)較大的提升空間。問(wèn)答系統(tǒng)問(wèn)答系統(tǒng)分為開放領(lǐng)域的對(duì)話系統(tǒng)和特定領(lǐng)域的問(wèn)答系統(tǒng)。問(wèn)答系統(tǒng)技術(shù)是指讓計(jì)算機(jī)像人問(wèn)答系統(tǒng)提交用自然語(yǔ)言表達(dá)的問(wèn)題,系統(tǒng)會(huì)效勞系統(tǒng)和智能手機(jī)助手等領(lǐng)域中的應(yīng)用,在問(wèn)答系統(tǒng)魯棒性方面仍舊存在著問(wèn)題和挑戰(zhàn)。語(yǔ)義、語(yǔ)用和語(yǔ)音等不同層面存在不確定性;現(xiàn)象的不行推測(cè)性;三是數(shù)據(jù)資源的不充分使其難以掩蓋簡(jiǎn)單的語(yǔ)言現(xiàn)象;四是語(yǔ)義學(xué)問(wèn)的模糊性和錯(cuò)綜簡(jiǎn)單的關(guān)聯(lián)性難以用簡(jiǎn)潔的數(shù)學(xué)模型描述,語(yǔ)義計(jì)算需要參數(shù)浩大的非線性計(jì)算。人機(jī)交互人機(jī)交互主要爭(zhēng)論人和計(jì)算機(jī)之間的信息交換,主要包括人到計(jì)算機(jī)和計(jì)算機(jī)到人的兩局部信的人與計(jì)算機(jī)之間的信息交換主要依靠交互設(shè)備進(jìn)展,主要包括鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼動(dòng)跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓以下對(duì)后四種與人工智能關(guān)聯(lián)親熱的典型交互手段進(jìn)展介紹。語(yǔ)音交互音或機(jī)器合成語(yǔ)音同計(jì)算機(jī)進(jìn)展交互的綜合性技術(shù),結(jié)合了語(yǔ)言學(xué)、心理學(xué)、工程和計(jì)算機(jī)技術(shù)等領(lǐng)域的知識(shí)。語(yǔ)音交互不僅要對(duì)語(yǔ)音識(shí)別包括四局部:語(yǔ)音采集、語(yǔ)音識(shí)別、語(yǔ)義理解編碼;語(yǔ)音識(shí)別完成語(yǔ)音信息到機(jī)器可識(shí)別的的文本字符或命令完成相應(yīng)的操作;語(yǔ)音合成完成文本信息到聲音信息的轉(zhuǎn)換。作為人類溝他交互方式具備更多優(yōu)勢(shì),能為人機(jī)交互帶來(lái)情感交互無(wú)法理解和適應(yīng)人的心情或心境,缺乏情感理解和表達(dá)力量,計(jì)算機(jī)難以具有類似人一樣的然。情感交互就是要賜予計(jì)算機(jī)類似于人一樣情感交互已經(jīng)成為人工智能領(lǐng)域中的熱點(diǎn)方向,旨在讓人機(jī)交互變得更加自然。目前,在情感交互信息的處理方式、情感描述方式、情感數(shù)多技術(shù)挑戰(zhàn)。體感交互體感交互是個(gè)體不需要借助任何簡(jiǎn)單的掌握系統(tǒng),以體感技術(shù)為根底,直接通過(guò)肢體動(dòng)作與體感方式與原理的不同,體感技術(shù)主要分為三類:慣性感測(cè)、光學(xué)感測(cè)以及光學(xué)聯(lián)合感測(cè)。體都有了較大的提升,交互設(shè)備向小型化、便攜的約束,使得交互過(guò)程更加自然。目前,體感交互在玩耍消遣、醫(yī)療關(guān)心與康復(fù)、全自動(dòng)三的應(yīng)用。腦機(jī)交互和肌肉等神經(jīng)通道,直接實(shí)現(xiàn)大腦與外界信息動(dòng),并將其轉(zhuǎn)化為人工輸出指令,能夠替代、交互作用。腦機(jī)交互通過(guò)對(duì)神經(jīng)信號(hào)解碼,實(shí)現(xiàn)腦信號(hào)到機(jī)器指令的轉(zhuǎn)化,一般包括信號(hào)采集、特征提取和命令輸出三個(gè)模塊。從腦電信侵入式兩大類。除此之外,腦機(jī)接口還有其他常見(jiàn)的分類方式:依據(jù)信號(hào)傳輸方向可以分為的類型,可分為自發(fā)式腦機(jī)接口和誘發(fā)式腦機(jī)機(jī)接口、基于功能性核磁共振的腦機(jī)接口以及基于近紅外光譜分析的腦機(jī)接口。計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)是使用計(jì)算機(jī)仿照人類視覺(jué)系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的力量。自動(dòng)駕駛、機(jī)器人、智能醫(yī)療等領(lǐng)域均需要通過(guò)計(jì)算機(jī)視深度學(xué)習(xí)的進(jìn)展,預(yù)處理、特征提取與算法處依據(jù)解決的問(wèn)題,計(jì)算機(jī)視覺(jué)可分為計(jì)算成像學(xué)、圖像理解、三維視覺(jué)、動(dòng)態(tài)視覺(jué)和視頻編解碼五大類。計(jì)算成像學(xué)其延長(zhǎng)應(yīng)用的科學(xué)。在相機(jī)成像原理方面,計(jì)現(xiàn)代相機(jī)更加輕松,可以適用于不同場(chǎng)景。同成像學(xué)可以提升相機(jī)的力量,從而通過(guò)后續(xù)的算法處理使得在受限條件下拍攝的圖像更加完善,例如圖像去噪、去模糊、暗光增加、去霧霾圖像理解似人類視覺(jué)系統(tǒng)理解外部世界的一門科學(xué)。通層理解,包括圖像邊緣、圖像特征點(diǎn)、紋理元致分為識(shí)別、檢測(cè)、分割、姿勢(shì)估量、圖像文用于人工智能系統(tǒng),如刷臉支付、才智安防、圖像搜尋等。三維視覺(jué)〔三維重建〕以及如何理解所獲取的三維信息的科目圖像重建、多目圖像重建和深度圖像重建等。三維信息理解,即使用三維信息關(guān)心圖像理解或者直接理解三維信息。三維信息理解可分為,淺層:角點(diǎn)、邊緣、法向量等;中層:平面、立方體等;高層:物體檢測(cè)、識(shí)別、分割等。三才智工廠、虛擬/增加現(xiàn)實(shí)等方向。動(dòng)態(tài)視覺(jué)序圖像的科學(xué)。通常動(dòng)態(tài)視覺(jué)問(wèn)題可以定義為查找圖像元素,如像素、區(qū)域、物體在時(shí)序上的對(duì)應(yīng),以及提取其語(yǔ)義信息的問(wèn)題。動(dòng)態(tài)視覺(jué)爭(zhēng)論被廣泛應(yīng)用在視頻分析以及人機(jī)交互等方面。視頻編解碼進(jìn)展壓縮。視頻流傳輸中最為重要的編解碼標(biāo)H.261H.263H.264H.265、M-JPEG和MPEG系列標(biāo)準(zhǔn)。視頻壓縮編碼主要分為兩大類:無(wú)損壓縮和有損壓縮。無(wú)損壓縮據(jù)進(jìn)展重構(gòu)時(shí),重構(gòu)后的數(shù)據(jù)與原來(lái)的數(shù)據(jù)有產(chǎn)生誤會(huì)。有損壓縮的應(yīng)用范圍廣泛,例如視頻會(huì)議、可視、視頻播送、視頻監(jiān)控等。產(chǎn)業(yè)規(guī)模。將來(lái)計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)展主要面技術(shù)更好的結(jié)合,計(jì)算機(jī)視覺(jué)在解決某些問(wèn)題度;二是如何降低計(jì)算機(jī)視覺(jué)算法的開發(fā)時(shí)間據(jù)與人工標(biāo)注,需要較長(zhǎng)的研發(fā)周期以到達(dá)應(yīng)能芯片的消滅,針對(duì)不同芯片與數(shù)據(jù)采集設(shè)備的計(jì)算機(jī)視覺(jué)算法的設(shè)計(jì)與開發(fā)也是挑戰(zhàn)之一。生物特征識(shí)別生物特征識(shí)別技術(shù)是指通過(guò)個(gè)體生理特征或行為特征對(duì)個(gè)體身份進(jìn)展識(shí)別認(rèn)證的技術(shù)。從應(yīng)個(gè)階段。注冊(cè)階段通過(guò)傳感器對(duì)人體的生物表采集,利用數(shù)據(jù)預(yù)處理以及特征提取技術(shù)對(duì)采集的數(shù)據(jù)進(jìn)展處理,得到相應(yīng)的特征進(jìn)展存儲(chǔ)。識(shí)別過(guò)程承受與注冊(cè)過(guò)程全都的信息采集方式取,然后將提取的特征與存儲(chǔ)的特征進(jìn)展比對(duì)分析,完成識(shí)別。從應(yīng)用任務(wù)看,生物特征識(shí)儲(chǔ)庫(kù)中確定待識(shí)別人身份的過(guò)程,是一對(duì)多的單人信息進(jìn)行比對(duì),確定身份的過(guò)程,是一對(duì)一的問(wèn)題。紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識(shí)別過(guò)程涉及到圖像處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、機(jī)器學(xué)習(xí)等多項(xiàng)技術(shù)。目前生物特征識(shí)別作為重要的智能化身份認(rèn)證技術(shù),在金融、公共安全、教育、交通等領(lǐng)域得等技術(shù)進(jìn)展介紹。指紋識(shí)別指紋識(shí)別過(guò)程通常包括數(shù)據(jù)采過(guò)光、電、力、熱等物理傳感器獵取指紋圖像;過(guò)程。應(yīng)用,從應(yīng)用過(guò)程來(lái)看,可將人臉識(shí)別技術(shù)劃過(guò)程。人臉識(shí)別技術(shù)的應(yīng)用主要受到光照、拍攝角度、圖像遮擋、年齡等多個(gè)因素的影響,在約束條件下人臉識(shí)別技術(shù)相對(duì)成熟,在自由條件下人臉識(shí)別技術(shù)還在不斷改進(jìn)。虹膜圖像分割、虹膜區(qū)域歸一化、特征提取和進(jìn)展而來(lái)。虹膜識(shí)別技術(shù)應(yīng)用的主要難題包含尺寸小且受黑色素遮擋,需在近紅外光源下承受弱變化會(huì)引起瞳孔縮放,導(dǎo)致虹膜紋理產(chǎn)生簡(jiǎn)單形變,增加了匹配的難度。脈血管中的脫氧血紅蛋白對(duì)特定波長(zhǎng)范圍內(nèi)的外光對(duì)指靜脈進(jìn)展成像與識(shí)別的技術(shù)。由于指的唯一性,且屬于人體內(nèi)部特征,不受到外界影聲紋特征識(shí)別說(shuō)話人的技術(shù)。聲紋識(shí)別技術(shù)通識(shí)別的過(guò)程是將某段來(lái)自某個(gè)人的語(yǔ)音經(jīng)過(guò)特征提取后與多復(fù)合聲紋模型庫(kù)中的聲紋模型進(jìn)概率模型法等??汕宄上竦纳锾卣鳎綉B(tài)識(shí)別是指通過(guò)身高要求的預(yù)處理算法,但步態(tài)識(shí)別具有遠(yuǎn)距離、跨角度、光照不敏感等優(yōu)勢(shì)。虛擬現(xiàn)實(shí)/增加現(xiàn)實(shí)虛擬現(xiàn)實(shí)〔VR〕/增加現(xiàn)實(shí)〔AR〕是以計(jì)算機(jī)為核心的型視聽(tīng)技術(shù)。結(jié)合相關(guān)科學(xué)技術(shù),在等方面高度近似的數(shù)字化環(huán)境。用戶借助必要設(shè)備、跟蹤定位設(shè)備、觸力覺(jué)交互設(shè)備、數(shù)據(jù)獵取設(shè)備、專用芯片等實(shí)現(xiàn)。虛擬現(xiàn)實(shí)/增加現(xiàn)實(shí)從技術(shù)特征角度,依據(jù)不同處理階段,可以分為獵取與建模技術(shù)、分析與利用技術(shù)交換與分發(fā)技術(shù)展現(xiàn)與交互技術(shù)以及技術(shù)標(biāo)準(zhǔn)與評(píng)價(jià)體系五個(gè)方面。獵取與建模技術(shù)爭(zhēng)論如何把物理世界或者人類的創(chuàng)意進(jìn)展數(shù)字化和模型化,難點(diǎn)是三維物理世界的數(shù)字化和模型化技術(shù);分析與利用技術(shù)重點(diǎn)爭(zhēng)論對(duì)數(shù)字內(nèi)容進(jìn)展分析、理解、搜尋和學(xué)問(wèn)化方法,其難點(diǎn)是在于內(nèi)容的語(yǔ)義表示和分析;交換與分發(fā)技術(shù)主要強(qiáng)調(diào)各種網(wǎng)絡(luò)環(huán)境下大規(guī)模的數(shù)字化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論