2021人工智能發(fā)展技術(shù)架構(gòu)_第1頁
2021人工智能發(fā)展技術(shù)架構(gòu)_第2頁
2021人工智能發(fā)展技術(shù)架構(gòu)_第3頁
2021人工智能發(fā)展技術(shù)架構(gòu)_第4頁
2021人工智能發(fā)展技術(shù)架構(gòu)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

技術(shù)架構(gòu)(2021年)目錄一、 人工智能技術(shù)發(fā)展概述. 1(一) 人工智能技術(shù)流派發(fā)展簡析 1(二) 深度學(xué)習(xí)帶動本輪人工智能發(fā)展 2二、 基于深度學(xué)習(xí)的人工智能技術(shù)現(xiàn)狀. 3(一) 基于深度學(xué)習(xí)的人工智能技術(shù)體系綜述 3基礎(chǔ)硬件層. 4深度神經(jīng)網(wǎng)絡(luò)模型編譯器. 4軟件框架層. 4基礎(chǔ)應(yīng)用技術(shù). 5(二) 算法發(fā)展趨勢 5算法的設(shè)計邏輯. 5算法的主要任務(wù). 6新算法不斷提出. 7(三) 軟件框架成為技術(shù)體系核心 8開源軟件框架百花齊放各具特點. 8巨頭以開源軟件框架為核心打造生態(tài). 11(四) 編譯器解決不同軟硬件的適配問題 12深度學(xué)習(xí)網(wǎng)絡(luò)模型編譯器解決適應(yīng)性問題. 13中間表示層解決可移植性問題. 14未來亟需模型轉(zhuǎn)換及通用的模型表示. 15(五) AI計算芯片提供算力保障. 16深度學(xué)習(xí)對AI計算芯片的需求. 16典型AI計算芯片的使用現(xiàn)狀. 16(六) 數(shù)據(jù)為算法模型提供基礎(chǔ)資源 19(七) 高性能計算服務(wù)器和服務(wù)平臺快速發(fā)展 20GPU服務(wù)器 20以服務(wù)的形式提供人工智能能力成為趨勢. 21三、 基于深度學(xué)習(xí)的基礎(chǔ)應(yīng)用技術(shù)現(xiàn)狀. 22(一) 智能語音技術(shù)改變?nèi)藱C(jī)交互模式 23智能語音技術(shù)概述. 23智能語音產(chǎn)品和服務(wù)形態(tài)多樣. 23(二) 計算機(jī)視覺技術(shù)已在多個領(lǐng)域?qū)崿F(xiàn)商業(yè)化落地 24計算機(jī)視覺概述. 24計算機(jī)視覺技術(shù)應(yīng)用領(lǐng)域廣闊. 26(三) 自然語言處理成為語言交互技術(shù)的核心 27自然語言處理技術(shù)現(xiàn)狀. 27自然語言處理技術(shù)的應(yīng)用方向. 28四、 問題和趨勢展望. 28(一) 主要問題 28(二) 趨勢展望 30人工智能發(fā)展白皮書-技術(shù)架構(gòu)篇(2021)人工智能發(fā)展白皮書-技術(shù)架構(gòu)篇(2021)人工智能發(fā)展白皮書-技術(shù)架構(gòu)篇(2021)人工智能發(fā)展白皮書-技術(shù)架構(gòu)篇(2021)PAGEPAGE13PAGEPAGE10一、人工智能技術(shù)發(fā)展概述(一)人工智能技術(shù)流派發(fā)展簡析是人工智能發(fā)展歷史上的三大技術(shù)流派。符號主義又稱為邏輯主義,在人工智能早期一直占據(jù)主導(dǎo)地位。70年代機(jī)的出現(xiàn)以及專家系統(tǒng)高昂的成本,使符號學(xué)派在人工智能領(lǐng)域的主導(dǎo)地位逐漸被連接主義取代。連接主義又稱為仿生學(xué)派1943年麥卡洛克和皮茨創(chuàng)立的腦模型,由于2070年代陷入低1982Hopfield19862006Hinton提出了深度學(xué)習(xí)算法,2012AlexNetImageNet競賽中獲得冠軍。行為主義又稱為進(jìn)化主義,AlphaGo取得的突破而AlphaGo戰(zhàn)勝李世石背后最重要的技術(shù)手段。(二)深度學(xué)習(xí)帶動本輪人工智能發(fā)展深度學(xué)習(xí)年,使用深度神經(jīng)網(wǎng)絡(luò)模型的語音識別相對傳統(tǒng)混合高斯模型識別錯誤率降低超過20在圖像分類領(lǐng)域目前針對ImageNet95%以上,可以與人的深度學(xué)習(xí)分為訓(xùn)練(training)和推斷(inference)ProcessingUnit,GPU)等各種更加強(qiáng)大的計(數(shù)據(jù)濃縮成某種知識。當(dāng)前基于深度學(xué)習(xí)的人工智能技術(shù)架構(gòu)如圖1所示。圖1 基于深度學(xué)習(xí)的人工智能技術(shù)應(yīng)用架構(gòu)圖二、基于深度學(xué)習(xí)的人工智能技術(shù)現(xiàn)狀(一)基于深度學(xué)習(xí)的人工智能技術(shù)體系綜述構(gòu)實現(xiàn),深度學(xué)習(xí)算法通過封裝至軟件框架1的方式供開發(fā)者使用。1中的基礎(chǔ)硬件層、深度神經(jīng)網(wǎng)絡(luò)模型編譯器及軟件框架三層。一是針對人二是對算法實現(xiàn)所依托的技術(shù)體系進(jìn)行概述,三是針對深度學(xué)習(xí)所需的數(shù)據(jù)進(jìn)行分析?;A(chǔ)硬件層中(CentralProcessingGPUGPU服務(wù)器集群,各類移動終端設(shè)備以及類腦計算機(jī)等。深度神經(jīng)網(wǎng)絡(luò)模型編譯器其涵蓋范圍包括針對人工智能計算芯片定向優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)模型編譯器,以及針對不同神經(jīng)網(wǎng)絡(luò)模型表示的規(guī)定及格式。軟件框架層(softwareramewor也指為了實現(xiàn)某個軟件組件規(guī)范時,提供規(guī)范所要求之基礎(chǔ)功能的軟件產(chǎn)品?;A(chǔ)應(yīng)用技術(shù)當(dāng)前人工智能的商業(yè)化實現(xiàn)主要是基于計算機(jī)視覺、智能語音、自然語言處理等基礎(chǔ)應(yīng)用技術(shù)實現(xiàn),并形成了相應(yīng)的產(chǎn)品或服務(wù)。本部分將在第三章進(jìn)行詳細(xì)討論。(二)算法發(fā)展趨勢算法的設(shè)計邏輯首先是學(xué)什么(輸入空間和輸出空間)其次是怎么學(xué)算法通過不斷縮小函數(shù)最后是做什么算法的主要任務(wù)一是(正則化(集成方法二是(或其可能性三是算法主要有四種即K均值、仿射傳播、分層/層次和聚類算法(Density-BasedSpatialClusteringofApplicationswith。表1 人工智能主要算法分類回歸任務(wù)分類任務(wù)聚類任務(wù)線性回歸(正則化)回歸樹(集成方法)邏輯回歸(正則化)分類樹(集成方法)K均值仿射傳播最鄰近算法深度學(xué)習(xí)支持向量機(jī)樸素貝葉斯分層/層次聚類算法深度學(xué)習(xí)新算法不斷提出膠囊網(wǎng)絡(luò)是為了克服卷積神經(jīng)網(wǎng)絡(luò)的局限性而提出的一種新的Hinton提出了膠囊網(wǎng)絡(luò)的概念。膠囊網(wǎng)絡(luò)由膠囊而不是由神生成對抗網(wǎng)絡(luò)(GAN:GenerativeAdversarialNetworks)2014有生成效率高、設(shè)計框架靈活、可生成具有更高質(zhì)量的樣本等優(yōu)勢,2016年以來研究工作呈爆發(fā)式增長,已成為人工GAN仍存在難以訓(xùn)練、梯度消失、模式崩潰等問題,仍處于不斷研究探索的階段。遷移學(xué)習(xí)是深度遷移學(xué)習(xí)最簡單(三)軟件框架成為技術(shù)體系核心企業(yè)的軟件框架實現(xiàn)有閉源和開源兩種開源軟件框架百花齊放各具特點人工智能國際巨頭企業(yè)將開源深度學(xué)習(xí)軟件框架作為打造開發(fā)深度學(xué)習(xí)訓(xùn)練軟件框架CPUGPU度學(xué)習(xí)訓(xùn)練軟件框架主要有TensorFlow,MXNet,Caffe/2+PyTorch等。以其功能全面,兼容性廣泛和生態(tài)完備而著稱。該軟件框架由谷歌大腦(GoogleBrain)GPUMXNet以其優(yōu)異性能及全面的平臺支持而著稱。該軟件框架是由亞馬遜公司(Amazon)主導(dǎo)的深度學(xué)習(xí)平臺,目前已經(jīng)捐獻(xiàn)到阿Python、R語言、Julia、C++、Scala、MatlabJavascript的編程接口;二是具有靈活的編CPUGPUCPU/GPU以其在圖像處理領(lǐng)域的深耕和易用性而著稱。該軟件框架是由臉書公司(Facebook)主導(dǎo)的平臺,目前Caffe1/2Caffe有著來越受到數(shù)據(jù)科學(xué)家的喜愛。我國很多人工智能圖像處理團(tuán)隊選擇PyTorch作為主要工作平臺。MicrosoftCognitive(CNTK)以其在智能語音語義領(lǐng)域的2016MIT協(xié)議開源,它具有速度快、可擴(kuò)展性強(qiáng)、商業(yè)級質(zhì)量高以及C++和PythonPaddlePaddle最大特點就是易用性,得益于其對算法的封裝,對于現(xiàn)成算法(卷積VGGResNetLSTM等)的水平較低以及不支持分布式任務(wù)等問題。深度學(xué)習(xí)推斷軟件框架能及功耗等因素的場景下,業(yè)界也開發(fā)了眾多開源的終端側(cè)軟件框架。Caffe2goGPUCPU的優(yōu)化進(jìn)行設(shè)計。LiteAndroidiOSAndroid生態(tài)的神經(jīng)網(wǎng)絡(luò)運行時能夠?qū)崿F(xiàn)較為高效AI移動端應(yīng)用速度。NCNNAI軟件框架,CPU的AI模型應(yīng)用,AI軟件框架。CoreMLiOSAICaffeMXNet等絕大部AIAI是百度自研的移動端Paddle模型部署在手機(jī)端,其支iOSGPU計算。但目前功能相對單一,支持較為有限。是英偉達(dá)(NVIDIA)開發(fā)的深度學(xué)習(xí)推斷工具,已經(jīng)支持Caffe、Caffe2MXNet對NVIDIACUDA編譯器結(jié)合使用。目前主要產(chǎn)業(yè)巨頭均推出了基于自身技術(shù)體系的訓(xùn)練及推斷軟巨頭以開源軟件框架為核心打造生態(tài)一是包括模型互換,模型遷移等技術(shù)聯(lián)合,以對抗谷歌公司。例如臉書和微軟已經(jīng)合作開發(fā)了一個可互換的人工智能軟件框架二是API2Keras為例,它是建立在TheanoCNTKMXNetGluon上運行的高級開源神經(jīng)API四是模型的集群(四)編譯器解決不同軟硬件的適配問題(API):是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件得以訪問一組例程的能力。按照實現(xiàn)功能抽象維度可分為高級API和低級API兩個層級。一是二是適應(yīng)深深度學(xué)習(xí)網(wǎng)絡(luò)模型編譯器解決適應(yīng)性問題(針對人工智能底層計算芯片及上層軟件框架進(jìn)行適配優(yōu)化的編譯器式來解決這個問題。當(dāng)前業(yè)界主流編譯器主要包括英偉達(dá)公司的CUDAnGraph以及華盛頓大學(xué)團(tuán)隊開發(fā)NNVM編譯器。體系架構(gòu)設(shè)計的。LowLevelMachine,是一種應(yīng)用廣泛的開源編譯CUDA源代碼及并行線程執(zhí)CUDACC++FortranGPU的應(yīng)用程序加速。英特爾nGraphTensorFlow/XLA、MXNetONNX架構(gòu)打造NNVM/TVM中間表示層解決可移植性問題(IntermediateRepresentation,架構(gòu)最大優(yōu)點之一就是其有一個表達(dá)形式很好的中間表示層習(xí)網(wǎng)絡(luò)模型編譯器均是通過在中間表示層中增加專屬優(yōu)化的中間件來實現(xiàn)功能演進(jìn)創(chuàng)新的。擴(kuò)充性能的中間表示層是打通深度學(xué)習(xí)計算中多種不同前端訓(xùn)練軟件框架和多種不同后端的表達(dá)橋梁使深度學(xué)習(xí)網(wǎng)絡(luò)模型編譯器架構(gòu)設(shè)計,新增加的專屬中間學(xué)習(xí)網(wǎng)絡(luò)模型編譯器的中間表示層主要分為NNVM/TVM和XLAONNX、NNEF等模型交未來軟件框架之爭的重要一環(huán)。未來亟需模型轉(zhuǎn)換及通用的模型表示TFRecordMXNetPaddlePaddleRecordIO等。深度學(xué)習(xí)網(wǎng)絡(luò)模型的表示規(guī)范分為兩大陣營。第一陣營OpenNeuralNetworkExchange(ONNX,開放神經(jīng)網(wǎng)絡(luò)交換),是一個用Facebook聯(lián)合發(fā)布,該系統(tǒng)支持的軟件框架目前主要包括Caffe2,PyTorch,Cognitive和MXNet,而谷歌的第二陣營NeuralNetworkExchangeFormat(NNEF,神經(jīng)網(wǎng)絡(luò)交換格式),KhronosGroup主導(dǎo)的跨Caffe,,等幾30多家計算芯片企業(yè)參與其中。表2 NNEF及ONNX的主要差別對比NNEFONNX非盈利組織發(fā)起的開源協(xié)議,實現(xiàn)代碼開源企業(yè)發(fā)起的開源項目基于文字的結(jié)構(gòu)化描述,格式化過程數(shù)據(jù)結(jié)構(gòu)導(dǎo)向的工具采用執(zhí)行文件格式描述網(wǎng)絡(luò),能夠描述復(fù)合操作采用扁平化方式描述網(wǎng)絡(luò)能夠在未來通過相似的流程語法描述動態(tài)圖可以通過控制流操作描述動態(tài)圖通過避免涉及到機(jī)器表示及量化的方法加速推斷,采用靈活的優(yōu)化舉措為張量使用固定的數(shù)據(jù)格式(五)AI計算芯片提供算力保障AI計算芯片的需求(Memory)二是計算芯片的發(fā)展過程可以總結(jié)為一直在圍繞如何有效解決存儲與計算單元的提升這兩個問題而展開,成本問題則作為一個舵手控制著最終的航向。AI計算芯片的使用現(xiàn)狀CPUGPUField-ProgrammableGateArray,F(xiàn)PGA)以及專用(ApplicationSpecificIntegrated也發(fā)揮了重ASIC為主。表3 AI計算芯片分類類別通用芯片CPU通用芯片GPU半定制化芯片F(xiàn)PGA全定制化芯片ASIC類腦芯片特點通用性高性能3功耗比低通用性高性能功耗比中通用性一般可編程性能功耗比中可定制性能功耗比高理論階段性能功耗比高CPU在深度學(xué)習(xí)訓(xùn)練場景下表現(xiàn)不佳。最初的深度學(xué)習(xí)場景是使用CPUGoogleBrain就是基于CPU組成的。CPU其本身是通用計算器,大量芯片核心面積要服務(wù)于通用GPU代替。GPU成為目前深度學(xué)習(xí)訓(xùn)練的首要選擇。GPU的關(guān)鍵性能是并一是高帶寬的緩存有效提升大GPU二是多計算核心提升并行計算能力。GPU具有10-100倍于CPU3性能:此處性能是指計算芯片在深度學(xué)習(xí)計算中的性能表現(xiàn)。NVIDIACUDAGPU能夠解決CUDA指令集架構(gòu)(ISA)GPU內(nèi)GPU存在無法靈活適配問題。FPGAFPGAFPGA(通用性也意味著效率的損FPGA寬和I/OFPGAFPGA省去了流片GPU和ASICSpecificIntegrated不可配置的高度定制專用計算芯片。ASIC不同于GPU和FPGAASICASIC作為專用計算芯片性能高于C計算芯片比A計算芯片快5-10倍,同時規(guī)模效應(yīng)會使得ASIC的成本降低。但高昂的研發(fā)成本和研發(fā)周期是未來廣泛應(yīng)用的阻礙。ASICGoogle的TPU系列計算芯片,以及國內(nèi)的寒武紀(jì)、地平線等公司。TPU的核心為脈動陣列機(jī),其設(shè)計思想是將多個運算邏輯單元I/Oandimageprocessing),矩陣算術(shù)(matrixarithmetic)和一些非數(shù)值型應(yīng)用(non-numericapplication)。ASICDianNao系列核心思想(六)數(shù)據(jù)為算法模型提供基礎(chǔ)資源當(dāng)前,人工智能數(shù)據(jù)集的參與主體主要有以下幾類:一是學(xué)術(shù)機(jī)ImageNet為代表,主要用于算法的創(chuàng)新性驗證、學(xué)術(shù)競二是三是四是(用戶當(dāng)前,人工智能基礎(chǔ)數(shù)據(jù)類型主要包括語音語言類(((七)高性能計算服務(wù)器和服務(wù)平臺快速發(fā)展深度學(xué)習(xí)使用GPUGPU服務(wù)器,GPU服務(wù)器的快速發(fā)展;同時,也帶動了以服務(wù)的形式提供GPU服務(wù)器AIGPU的服務(wù)器。GPU服務(wù)器是基于GPUGPUAI云場景對彈性配置能力PCI-EAI模型的線下訓(xùn)練和線上推理兩類場景,AIAI4卡,8卡,10卡等多種類型。GPUDGX-1系NVlink提升了CPU、GPU以及內(nèi)存之間的通信速度和帶寬;同時搭載了集成了NVIDIA開發(fā)的操作系統(tǒng),NVIDIAdockerFramework的Docker鏡像,實現(xiàn)了從底層硬件到上層軟件的緊密耦合。類似的產(chǎn)AGX-1系列服務(wù)器。以服務(wù)的形式提供人工智能能力成為趨勢AI能力時遇到的資金、技術(shù)和運維管理等AI所需要的計算資源一是有效推動社二是三是服務(wù)平臺成為垂直行業(yè)落地的重要基礎(chǔ)。近兩API形式的服務(wù)。平臺類服務(wù)GPU云服務(wù),深度學(xué)習(xí)平(Infrastructureasa(PlatformasaService,PaaS)GPU云服務(wù)是以虛GPU計算資源,可適用于深度學(xué)習(xí)、科學(xué)計算、圖形圖像渲染、視頻解碼等應(yīng)用場景。深度學(xué)習(xí)平臺是以CaffeMXNet等主流深度學(xué)習(xí)軟件框架為基礎(chǔ),提供相應(yīng)的常用深度學(xué)習(xí)算法和模型,組合各種數(shù)據(jù)源、組件模塊,API服務(wù)主要(OpticalCharacterRecognition,OCR)識別、智能鑒黃等服務(wù)。三、基于深度學(xué)習(xí)的基礎(chǔ)應(yīng)用技術(shù)現(xiàn)狀目前隨著深度學(xué)習(xí)算法工程化實現(xiàn)效率的提升和成本的逐漸降2圖2 基礎(chǔ)應(yīng)用架構(gòu)圖(一)智能語音技術(shù)改變?nèi)藱C(jī)交互模式智能語音語義技術(shù)主要研究人機(jī)之間語音信息的處理問題。簡單來說,就是讓計算機(jī)、智能設(shè)備、家用電器等通過對語音進(jìn)行分析、理解和合成,實現(xiàn)人“能聽會說”、具備自然語言交流的能力。智能語音技術(shù)概述語音識別技術(shù)即讓語音評測技術(shù)智能語音產(chǎn)品和服務(wù)形態(tài)多樣智能音箱類產(chǎn)品提升家庭交互的便利性智能音箱是從被動播放查詢天氣、播放音頻等能力。個人智能語音助手重塑了人機(jī)交互模式Siri與蘋果智能家居平臺HomekitGoogleNow為用戶提供關(guān)心的內(nèi)容,如新聞、體育比賽、交通、天氣等等。微軟的Cortana主要優(yōu)勢在于提升個人計算機(jī)的易用性。API形式提供的智能語音服務(wù)成為行業(yè)用戶的重要入口。智APIAPP中。在商業(yè)端,智能客服、教育(口語評測)、醫(yī)療(電子病歷)、金融(業(yè)務(wù)辦理)(二)計算機(jī)視覺技術(shù)已在多個領(lǐng)域?qū)崿F(xiàn)商業(yè)化落地計算機(jī)視覺識別這一人工智能基礎(chǔ)應(yīng)用技術(shù)部分已達(dá)商業(yè)化應(yīng)用水平,被用于身份識別、醫(yī)學(xué)輔助診斷、自動駕駛等場景。計算機(jī)視覺概述一般來講,計算機(jī)視覺主要分為圖像分類、目標(biāo)檢測、目標(biāo)跟蹤和圖像分割四大基本任務(wù)。圖像分類2012年采用深度卷AlexNetImageNet競賽冠軍后,圖像分類開2015ResNet采用殘差思152錯誤率降低到3.57%,遠(yuǎn)低于5.1的人眼識別錯誤率,奪得了ImageNet201

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論