




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
智能制造技術(shù)與工程應(yīng)用第八章智能制造先進(jìn)控制技術(shù)浙江省普通本科高校‘十四五’重點教材目錄2大數(shù)據(jù)Bigdata01云計算Cloudcomputing02機(jī)器學(xué)習(xí)Machinelearning03人工智能時代工業(yè)4.0時代即利用信息化技術(shù)促進(jìn)產(chǎn)業(yè)變革的時代,通常被稱為人工智能時代。其目的是以網(wǎng)絡(luò)實體系統(tǒng)及物聯(lián)網(wǎng)作為技術(shù)條件基礎(chǔ)來提升各大制造業(yè)的智能化水平,建立具有適應(yīng)性、資源效率及基因工程學(xué)的智慧工廠。《中國制造2025》作為中國實施制造強(qiáng)國戰(zhàn)略第一個十年行動綱領(lǐng),指出工業(yè)部門尤其是制造業(yè)需更加體現(xiàn)其創(chuàng)新驅(qū)動和高端要素承載功能。將創(chuàng)新能力、質(zhì)量效益、兩化(工業(yè)化、信息化)融合,積極抓住新一輪科技革命和產(chǎn)業(yè)變革與我國加快轉(zhuǎn)變經(jīng)濟(jì)發(fā)展方式形成歷史性交匯,實施制造業(yè)強(qiáng)國戰(zhàn)略。大數(shù)據(jù)的歷史通過對大量文獻(xiàn)資料追蹤溯源,發(fā)現(xiàn)“大數(shù)據(jù)”這個詞最早出現(xiàn)在1980年的美國,著名的未來學(xué)家托夫勒在其所著的《第三次浪潮》中,將大數(shù)據(jù)熱情地稱頌為“第三次浪潮的華彩樂章”。在2008年9月,《自然》雜志推出了名為“大數(shù)據(jù)”的封面專欄。從2009年開始,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)技術(shù)行業(yè)中的熱門詞匯,被世人推崇和討論。目前,盡管大數(shù)據(jù)的發(fā)展已有幾十年的時間,但仍沒有一個統(tǒng)一、完整、科學(xué)的定義。狹義大數(shù)據(jù)概念定義:用現(xiàn)有的一般技術(shù)難以管理的大量數(shù)據(jù)的集合。早期,高德納(Gartner)咨詢管理公司數(shù)據(jù)分析師MervAdrian認(rèn)為,大數(shù)據(jù)是一種在正常的時間和空間范圍內(nèi),常規(guī)的軟件工具難以計算、提出相關(guān)數(shù)據(jù)分析的能力。2011年,大數(shù)據(jù)研究討論的麥肯錫公司在大數(shù)據(jù)的研究報告給出的定義是:大數(shù)據(jù)指的是規(guī)模已經(jīng)超出了傳統(tǒng)的數(shù)據(jù)庫軟件工具收集、存儲、管理和分析能力的數(shù)據(jù)集。電子商務(wù)行業(yè)的亞馬遜的大數(shù)據(jù)專家JohnRauser對大數(shù)據(jù)的定義:大數(shù)據(jù)指的是超過了一臺計算機(jī)的設(shè)備、軟件等處理能力的數(shù)據(jù)規(guī)模、資料信息海量的數(shù)據(jù)集。總的來說,研究者大多從微觀的視角出發(fā),將大數(shù)據(jù)理解為當(dāng)前的技術(shù)環(huán)境難以處理的一種數(shù)據(jù)集。廣義大數(shù)據(jù)概念廣義的大數(shù)據(jù)定義,主要是以對大數(shù)據(jù)進(jìn)行分析管理、挖掘數(shù)據(jù)背后所蘊含的巨大價值為視角,給出的大數(shù)據(jù)的概念。維基百科對大數(shù)據(jù)給出的定義是:巨量數(shù)據(jù),或稱為大數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過當(dāng)前的技術(shù)軟件和工具在一定的時間內(nèi)進(jìn)行截取、管理、處理,并整理成為需求者所需要的信息進(jìn)行決策。ViktorMayer-Sch?nberger在其專著《大數(shù)據(jù)時代:生活、工作與思維的大變革》中對大數(shù)據(jù)的定義為:大數(shù)據(jù)是人們獲得新的認(rèn)知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機(jī)構(gòu),以及政府與公民關(guān)系的方法他還認(rèn)為大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模的數(shù)據(jù)基礎(chǔ)上是無法完成的。相關(guān)術(shù)語1.數(shù)據(jù)數(shù)據(jù)是可以獲取和存儲的信息。除了直觀的數(shù)字,數(shù)據(jù)也可以是文字、圖像、聲音、視頻等能被記錄下來的信息。2.大數(shù)據(jù)本書對大數(shù)據(jù)的定義為:在特定的時間內(nèi),用現(xiàn)有的一般軟件工具難以進(jìn)行獲取、存儲、處理和分析的超大型數(shù)據(jù)的集合。3.元數(shù)據(jù)元數(shù)據(jù)(Metadata)是提供一個數(shù)據(jù)集的特征和結(jié)構(gòu)信息來描述數(shù)據(jù)屬性的數(shù)據(jù)。元數(shù)據(jù)主要是描述數(shù)據(jù)屬性的信息,用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。這種數(shù)據(jù)主要是由機(jī)器生成的,搜尋元數(shù)據(jù)對于大數(shù)據(jù)的存儲、處理和分析是至關(guān)重要的一步,因為元數(shù)據(jù)提供了數(shù)據(jù)系譜信息以及數(shù)據(jù)處理的起源。相關(guān)術(shù)語4.云計算本書對云計算(CloudComputing)的定義為:云計算是一種基于互聯(lián)網(wǎng)的分布式計算方式,通過這種方式,共享的軟硬件資源和信息可以按需求提供給計算機(jī)和其他設(shè)備。大數(shù)據(jù)離不開云計算,大數(shù)據(jù)要對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,就必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲及虛擬化技術(shù)。云計算是大數(shù)據(jù)分析與處理的一種重要方法,云計算強(qiáng)調(diào)的是計算,而大數(shù)據(jù)則是計算的對象。5.大數(shù)據(jù)技術(shù)大數(shù)據(jù)技術(shù)就是處理大數(shù)據(jù)所用到的技術(shù),一般是指根據(jù)特定的目標(biāo)要求,從各種各樣類型的海量數(shù)據(jù)中快速獲得有價值信息所需要的技術(shù)。常用的大數(shù)據(jù)技術(shù)有:大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)存儲技術(shù)、大數(shù)據(jù)分析處理技術(shù)和大數(shù)據(jù)可視化技術(shù)等。大數(shù)據(jù)的主要特征要確保數(shù)據(jù)的可用性,就要分析大數(shù)據(jù)的數(shù)據(jù)特征。IBM(InternationalBusinessMachinesCorporation)認(rèn)為大數(shù)據(jù)具有3V特征,即數(shù)據(jù)量(Volume)、種類(Variety)和速度(Velocity),故大數(shù)據(jù)是指具有容量難以估計、種類難以計數(shù)且增長速度非??斓臄?shù)據(jù)。IDC(InternetDataCenter)則在IBM的基礎(chǔ)上,將3V發(fā)展為4V,其認(rèn)為大數(shù)據(jù)具有四方面的特征:數(shù)據(jù)量大(Volume)、數(shù)據(jù)種類多(Variety)、數(shù)據(jù)速度快(Velocity)、數(shù)據(jù)價值密度低(Value)。當(dāng)前,從IDC的4V特征四個方面來理解,大數(shù)據(jù)的特征表現(xiàn)為:數(shù)據(jù)量大(數(shù)據(jù)存儲量大和增量大)、數(shù)據(jù)種類多(數(shù)據(jù)來源多,數(shù)據(jù)格式多)、數(shù)據(jù)速度快以及數(shù)據(jù)價值密度低,只有具備這些特征的數(shù)據(jù)才是大數(shù)據(jù)。大數(shù)據(jù)的主要特征下圖為大數(shù)據(jù)的4V特征:圖8?1大數(shù)據(jù)的4V特征大數(shù)據(jù)的主要特征1.數(shù)據(jù)規(guī)模大(Volume)這個“大”源于廣泛采集、多處存儲和大量計算。普通的計算機(jī)存儲容量以GB、TB為單位,而大數(shù)據(jù)則以PB(1024TB)、EB(約100萬TB)為單位。2.數(shù)據(jù)類型多(Variety)大數(shù)據(jù)既包括地理位置信息、數(shù)據(jù)庫、表格等結(jié)構(gòu)化數(shù)據(jù),也包括文本、圖像、音視頻等非結(jié)構(gòu)化數(shù)據(jù)。不同的數(shù)據(jù)類型需要不同的處理程序和算法,所以大數(shù)據(jù)對數(shù)據(jù)的處理方法和技術(shù)也有更高的要求。大數(shù)據(jù)的主要特征3.價值密度低(Value)決策者要獲得必需的信息,就得對大量的數(shù)據(jù)進(jìn)行處理?,F(xiàn)在通用的做法是通過使用強(qiáng)大的機(jī)器算法進(jìn)行數(shù)據(jù)挖掘,進(jìn)而獲得與邏輯業(yè)務(wù)相吻合的結(jié)果。這個過程可以理解為在無邊沙漠中用篩子淘取金沙,其價值密度可想而知。4.處理速度快(Velocity)大數(shù)據(jù)需要處理的數(shù)據(jù)有的是爆發(fā)式產(chǎn)生的,如大型強(qiáng)子對撞機(jī)工作時每秒產(chǎn)生PB級數(shù)據(jù);有的雖然是流水式產(chǎn)生的,但由于用戶數(shù)量眾多,短時間內(nèi)產(chǎn)生的數(shù)據(jù)量(如網(wǎng)站點擊流、系統(tǒng)日志、GPS等數(shù)據(jù))依然龐大。為了滿足實時性需求,數(shù)據(jù)的處理速度必須快,過時的數(shù)據(jù)會貶值。大數(shù)據(jù)的類型大數(shù)據(jù)的種類多種多樣,要存儲、處理這些復(fù)雜的數(shù)據(jù)要將數(shù)據(jù)分成不同的類型,然后針對不同類型的數(shù)據(jù)采取相應(yīng)的存儲和處理方法。根據(jù)數(shù)據(jù)存儲方式和內(nèi)部的組織結(jié)構(gòu),將大數(shù)據(jù)分為三種類型:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。這三種數(shù)據(jù)類型的關(guān)系是由簡單到復(fù)雜,各自有不同的特點,傳統(tǒng)數(shù)據(jù)庫存儲處理的主要是結(jié)構(gòu)化數(shù)據(jù)類型,而大數(shù)據(jù)時代將以半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為主流數(shù)據(jù)類型。圖8?2數(shù)據(jù)增長日益趨向非結(jié)構(gòu)化大數(shù)據(jù)的類型1.結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)格式嚴(yán)格固定,可以由二維表結(jié)構(gòu)來表達(dá)和實現(xiàn)的數(shù)據(jù),也稱作行數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以用關(guān)系型數(shù)據(jù)庫存儲處理,比如在Access數(shù)據(jù)庫軟件中可以查看到類似Excel中的二維表數(shù)據(jù)。這種類型的數(shù)據(jù)關(guān)系最簡單,符合二維映射關(guān)系。應(yīng)用領(lǐng)域:大多數(shù)傳統(tǒng)數(shù)據(jù)技術(shù)主要基于結(jié)構(gòu)化數(shù)據(jù),如銀行數(shù)據(jù)、政企職工工資數(shù)據(jù)、保險業(yè)數(shù)據(jù)、醫(yī)療數(shù)據(jù)等。大數(shù)據(jù)的類型2.半結(jié)構(gòu)化數(shù)據(jù)定義:半結(jié)構(gòu)化數(shù)據(jù)是具有一定結(jié)構(gòu)但沒有固定結(jié)構(gòu)的數(shù)據(jù)。優(yōu)點:與非結(jié)構(gòu)化數(shù)據(jù)相比,半結(jié)構(gòu)化數(shù)據(jù)具有一定的結(jié)構(gòu),但在具有嚴(yán)格理論模型的關(guān)系數(shù)據(jù)庫中,它比結(jié)構(gòu)化數(shù)據(jù)更加靈活。半結(jié)構(gòu)化數(shù)據(jù)雖然不符合關(guān)系數(shù)據(jù)模型的結(jié)構(gòu),但它包含了相關(guān)的標(biāo)簽來分離語義元素和層記錄、字段等,因此也被稱為自我描述型數(shù)據(jù)。在關(guān)系數(shù)據(jù)庫中,存在一個信息系統(tǒng)框架,即模式,它用來描述數(shù)據(jù)及其之間的關(guān)系,模式與數(shù)據(jù)是完全分離的。然而,在半結(jié)構(gòu)化環(huán)境中,模式信息往往包含在數(shù)據(jù)中,即模式與數(shù)據(jù)之間的邊界不明確。大數(shù)據(jù)的類型目前,對半結(jié)構(gòu)化數(shù)據(jù)及其模式主要有以樹或者圖的描述形式。這類數(shù)據(jù)常常用文本文件進(jìn)行存儲,包括電子郵件、配置文件、Web集群等。半結(jié)構(gòu)化數(shù)據(jù)可以通過靈活的鍵值調(diào)整來獲取相應(yīng)的信息,且沒有模式的限定,數(shù)據(jù)可以自由流入系統(tǒng),還可以自由更新,更便于客觀地描述事物。雖然這種動態(tài)性和靈活性可能使查詢處理更加困難,但它給用戶存儲提供了顯著的優(yōu)勢。大數(shù)據(jù)的類型3.非結(jié)構(gòu)化數(shù)據(jù)定義:非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則、不遵循規(guī)范模型的數(shù)據(jù)。這類數(shù)據(jù)可以是文本的,也可以是數(shù)據(jù)的,一般包含在文本文件和二進(jìn)制文件中存儲和傳輸。(這里說的文本文件和二進(jìn)制文件主要討論的是文件數(shù)據(jù)的內(nèi)容,與文件本身的格式無關(guān))文本文件中包含文檔(比如MicrosoftOffice)和ASCII文件,三進(jìn)制文件中包含圖像、聲音及視頻等媒體文件。據(jù)統(tǒng)計,目前大數(shù)據(jù)中以非結(jié)構(gòu)化數(shù)據(jù)為主,其龐大的規(guī)模和復(fù)雜性需要更加智能和高級的技術(shù)來處理和分析。大數(shù)據(jù)應(yīng)用及發(fā)展趨勢1.大數(shù)據(jù)應(yīng)用近年來,隨著大數(shù)據(jù)技術(shù)的逐漸成熟,大量成功的大數(shù)據(jù)應(yīng)用不斷涌現(xiàn)。包含工業(yè)、金融、餐飲、電信、能源、生物和娛樂等在內(nèi)的社會各行各業(yè)都已經(jīng)顯現(xiàn)了融入大數(shù)據(jù)的痕跡。1)互聯(lián)網(wǎng):借助大數(shù)據(jù)技術(shù),可以分析客戶行為,進(jìn)行商品推薦和針對性廣告投放。2)制造業(yè):利用工業(yè)大數(shù)據(jù)提升制造業(yè)水平,包括產(chǎn)品故障診斷與預(yù)測、生產(chǎn)工藝改進(jìn)、生產(chǎn)過程能耗優(yōu)化、工業(yè)供應(yīng)鏈分析、生產(chǎn)計劃與排程等。3)金融:大數(shù)據(jù)在高頻交易、社交情緒分析和信貸風(fēng)險分析三大金融創(chuàng)新領(lǐng)域發(fā)揮了重大作用。大數(shù)據(jù)應(yīng)用及發(fā)展趨勢4)生物醫(yī)學(xué):大數(shù)據(jù)可以實現(xiàn)流行病預(yù)測、智慧醫(yī)療、健康管理,同時還可以解讀DNA,了解更多生命的奧秘。5)智慧城市:利用大數(shù)據(jù)可以實現(xiàn)智能交通、環(huán)保監(jiān)測、城市規(guī)劃和智能安防等。6)能源:隨著智能電網(wǎng)的發(fā)展,電力公司可以掌握海量的用戶用電信息,利用大數(shù)據(jù)技術(shù)分析用戶用電模式,改進(jìn)電網(wǎng)運行,合理設(shè)計電力需求響應(yīng)系統(tǒng),確保電網(wǎng)運行安全。盡管大數(shù)據(jù)已經(jīng)在很多行業(yè)領(lǐng)城的應(yīng)用中嶄露頭角,但就其效果和深度而言,當(dāng)前大數(shù)據(jù)應(yīng)用尚處于初級階段,根據(jù)大數(shù)據(jù)預(yù)測未來、指導(dǎo)實踐的深層次應(yīng)用將成為未來的發(fā)展重點。大數(shù)據(jù)應(yīng)用及發(fā)展趨勢2.大數(shù)據(jù)發(fā)展趨勢大數(shù)據(jù)正在開啟一個嶄新時代,未來大數(shù)據(jù)的發(fā)展趨勢將主要體現(xiàn)在以下幾個方面:1)數(shù)據(jù)科學(xué)成為一門新興學(xué)科各大高校不僅將設(shè)立專門的數(shù)據(jù)科學(xué)類專業(yè),也會催生一批與之相關(guān)的新的就業(yè)崗位。與此同時,基于數(shù)據(jù)這個基礎(chǔ)平臺,也將建立起跨領(lǐng)域的數(shù)據(jù)共享平臺,之后數(shù)據(jù)共享將擴(kuò)展到企業(yè)層面,并且成為未來產(chǎn)業(yè)的核心一環(huán)。2)大數(shù)據(jù)將與物聯(lián)網(wǎng)、云計算、人工智能等熱點技術(shù)領(lǐng)域相互交叉融合,產(chǎn)生很多綜合性應(yīng)用近年來計算機(jī)和信息技術(shù)的發(fā)展趨勢是:前端更前伸,后端更強(qiáng)大。物聯(lián)網(wǎng)與人工智能加強(qiáng)了前端的物理世界和人的交互融合,大數(shù)據(jù)和云計算加強(qiáng)了后端的數(shù)據(jù)存儲管理能力和計算能力。大數(shù)據(jù)應(yīng)用及發(fā)展趨勢3)大數(shù)據(jù)產(chǎn)業(yè)鏈逐漸形成經(jīng)過數(shù)年的發(fā)展,大數(shù)據(jù)初步形成一個較為完整的產(chǎn)業(yè)E,包括數(shù)據(jù)采集、整理、傳輸、存儲、分析、呈現(xiàn)和應(yīng)用,眾多企業(yè)開始參與到大數(shù)產(chǎn)業(yè)鏈中,并形成了一定的產(chǎn)業(yè)規(guī)模。4)數(shù)據(jù)資源化、私有化,進(jìn)而商品化成為持續(xù)的趨勢數(shù)據(jù)資源化的本質(zhì)是實現(xiàn)數(shù)據(jù)共享與服務(wù),在數(shù)據(jù)資源化的過程中,必須建立高效的數(shù)據(jù)交換機(jī)制,實現(xiàn)數(shù)據(jù)的互聯(lián)互通、信息共享、業(yè)務(wù)協(xié)同,將成為整合信息資源,深度利用分散數(shù)據(jù)的有效途徑。同時,基礎(chǔ)數(shù)據(jù)的私有化和獨占問題也成為關(guān)注的焦點,數(shù)據(jù)產(chǎn)權(quán)界定問題日益突出。在數(shù)據(jù)權(quán)屬確定的情況下,數(shù)據(jù)商品化成為必然選擇和趨勢。工業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀工業(yè)大數(shù)據(jù)時代囊括人工智能及大數(shù)據(jù),兩者之間既有區(qū)別又有聯(lián)系。人工智能包括:機(jī)器學(xué)習(xí)、圖像識別等,主要依賴海量數(shù)據(jù)進(jìn)行分析,模擬運算出更加準(zhǔn)確的結(jié)果。作為建立在集群技術(shù)上的大數(shù)據(jù)技術(shù)主要是為人工智能提供強(qiáng)有力的存儲能力和計算能力。大數(shù)據(jù)技術(shù)作為一種挖掘和展現(xiàn)工業(yè)大數(shù)據(jù)中所蘊含價值的技術(shù),囊括了數(shù)據(jù)規(guī)劃、采集、預(yù)處理、存儲、分析挖掘、可視化和智能控制等?!爸袊圃?025”與德國“工業(yè)4.0”的成功對接,使得各行業(yè)以信息化帶動工業(yè)化、以工業(yè)化促進(jìn)信息化,充分利用大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能等技術(shù)作為發(fā)力點,打造新時代智能化工藝流程,積極推進(jìn)現(xiàn)代工業(yè)的智能化轉(zhuǎn)型發(fā)展。云計算的基本概念國家標(biāo)準(zhǔn)《信息技術(shù)云計算參考架構(gòu)》(GB/T-32399)的定義:云計算是一種通過網(wǎng)絡(luò)將可伸縮、彈性的共享物理和虛擬資源池以按需自服務(wù)的方式供應(yīng)和管理的模式。從計算方法的角度看,云計算是分布式計算的一種,它通過網(wǎng)絡(luò)將大量的數(shù)據(jù)計算處理程序分解成多個小程序,通過由多部服務(wù)器組成的系統(tǒng)處理和分析這些小程序得到結(jié)果并返回給用戶。通過該技術(shù),用戶可以在幾秒鐘的時間內(nèi)完成對海量數(shù)據(jù)的處理,提供強(qiáng)大的計算服務(wù)能力。云計算的基本概念從資源利用的角度看,云計算定義了一種IT資源共享樓型,可以方便地隨時隨地按需通過網(wǎng)絡(luò)訪問共享的可配置計算資源(如網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用程序和服務(wù))池,且只需最少的管理工作或服務(wù)提供方交互方式即可快速供應(yīng)和釋放這些資源。云計算有以下五方面重要特征:一、按需自助服務(wù),用戶可以根據(jù)需要供應(yīng)、監(jiān)控和管理計算資源二、資源池化,IT(信息技術(shù))資源以非專用方式為多個應(yīng)用程序和多個用戶所共享三、IT資源可以快速按需伸縮四、按使用量收費,系統(tǒng)對每個應(yīng)用程序和每個用戶跟蹤IT資源使用情況并計費五、廣泛的網(wǎng)絡(luò)訪問,可以通過標(biāo)準(zhǔn)網(wǎng)絡(luò)或者異構(gòu)設(shè)備提供計算服務(wù)云計算的基本概念云計算的核心概念是以互聯(lián)網(wǎng)為中心,在網(wǎng)絡(luò)上提供快速且安全的計算服務(wù)與數(shù)據(jù)存儲服務(wù),讓每一個使用互聯(lián)網(wǎng)的人都可以使用網(wǎng)絡(luò)上的計算資源與存儲資源。云計算是繼互聯(lián)網(wǎng)、計算機(jī)后信息時代的一種革新,是信息時代的一個大飛躍。云計算的特點1)大規(guī)模云計算通常需要數(shù)量眾多的服務(wù)器等設(shè)備作為基礎(chǔ)設(shè)施,例如Google擁有百萬臺服務(wù)器以上的云計算環(huán)境,而一般私有云也通常有幾十臺到上百臺相關(guān)設(shè)備。2)虛擬化虛擬化是云計算的底層支撐技術(shù)之一。當(dāng)用戶向云計算請求某種服務(wù)的時候,他并不知道該服務(wù)是由云計算環(huán)境中哪一臺或幾臺服務(wù)器提供的。云服務(wù)提供商也可以通過虛擬化技術(shù)整合全部系統(tǒng)資源,從而達(dá)到動態(tài)調(diào)度、降低成本的目的。3)伸縮性云計算的設(shè)計架構(gòu)可以使計算機(jī)節(jié)點在無需停止服務(wù)的情況下隨時加入或退出整個集群,從而實現(xiàn)了伸縮性。云計算的特點4)敏捷云計算通過屏蔽底層實現(xiàn)細(xì)節(jié),以服務(wù)的方式對外開放,因此企業(yè)和用戶能夠快速地開發(fā)和部署相關(guān)應(yīng)用軟件與系統(tǒng)。5)按需服務(wù)云計算環(huán)境可以動態(tài)地對資源進(jìn)行調(diào)度,因此用戶可以根據(jù)自己的實際需要訂購相應(yīng)的資源,并且在需求改變的時候也能夠隨時調(diào)整訂單以應(yīng)對快速發(fā)生的變化。6)多租戶云計算使用多租戶技術(shù)來保證用戶之間的服務(wù)相互隔絕而互不干擾。當(dāng)某一個服務(wù)崩潰的時候不會影響其他正在使用的服務(wù)。云計算的特點7)容錯性云計算最早提出時,就是建立在使用消費級(相對于昂貴的高級服務(wù)器而言)計算機(jī)的前提之下。該類設(shè)備的穩(wěn)定性無法支撐長期7x24小時的在線服務(wù),因此節(jié)點失效將成為常態(tài)。云計算擁有良好的容錯機(jī)制,當(dāng)某個節(jié)點發(fā)生故障的時候.可以輕易地通過副本等機(jī)制保證服務(wù)的持續(xù)。8)規(guī)?;?jīng)濟(jì)云計算的規(guī)模通常較大,云計算服務(wù)提供商可以使用多種資源調(diào)度技術(shù)來提高系統(tǒng)資源利用率從而降低使用成本,同時還可以通過通風(fēng)、制冷、供電、網(wǎng)絡(luò)接入的統(tǒng)籌規(guī)劃降低維護(hù)成本,從而實現(xiàn)規(guī)?;?jīng)濟(jì),為用戶提供收費更為低廉的服務(wù)。云計算的關(guān)鍵技術(shù)1.云計算的架構(gòu)云計算平臺體系架構(gòu)可分為:核心服務(wù)、服務(wù)管理、用戶訪問接口三層。核心服務(wù)層:將硬件基礎(chǔ)設(shè)施、軟件運行環(huán)境、應(yīng)用程序抽象成服務(wù),這些服務(wù)具有可靠性強(qiáng)可用性高、規(guī)??缮炜s等特點,能夠滿足多樣化的應(yīng)用需求。服務(wù)管理層:為核心服務(wù)層提供支持,進(jìn)一步確保核心服務(wù)的可靠性、可用性與安全性。用戶訪問接口層:實現(xiàn)端到云端的訪問。圖8?3云計算體系架構(gòu)云計算的架構(gòu)核心服務(wù)層通常可以分為三個子層:IaaS(基礎(chǔ)設(shè)施即服務(wù)層)、PaaS(平臺即服務(wù)層)、SaaS(軟件即服務(wù)層)。圖8?4核心服務(wù)層結(jié)構(gòu)圖云計算的架構(gòu)IaaS把IT環(huán)境的基礎(chǔ)設(shè)施層作為服務(wù)出租出去由云服務(wù)提供商把IT環(huán)境的基礎(chǔ)設(shè)施建設(shè)好,直接對外出租硬件服務(wù)器或者虛擬機(jī)。云服務(wù)提供商負(fù)責(zé)管理機(jī)房基礎(chǔ)設(shè)施、計算機(jī)網(wǎng)絡(luò)、磁盤柜、硬件服務(wù)器和虛擬機(jī),租戶自己安裝和管理操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用軟件和數(shù)據(jù)信息。Pass即把IT環(huán)境的平臺軟件層作為服務(wù)出租出去此時云服務(wù)提供商需要把基礎(chǔ)設(shè)施層和平臺軟件層都搭建好,然后在平臺軟件層上分成小塊(將它稱為容器)并對外出租。租戶此時僅需要安裝、配置和使用應(yīng)用軟件就可以了。云計算的架構(gòu)SaaS即把IT環(huán)境的應(yīng)用軟件層作為服務(wù)出租出去云服務(wù)提供商需要搭建和管理基礎(chǔ)設(shè)施層、平合軟件層和應(yīng)用軟件層,這進(jìn)一步降低了租戶的技術(shù)門檻,他們連應(yīng)用軟件也不需要自己安裝,直接使用軟件。例如,企業(yè)通過郵箱軟件服務(wù)商建立屬于該企業(yè)的電子郵件服務(wù)。該服務(wù)托管于郵箱軟件服務(wù)商的數(shù)據(jù)中心,企業(yè)不必考慮服務(wù)器的管理、維護(hù)問題。云計算的關(guān)鍵技術(shù)2.虛擬化技術(shù)定義:虛擬化指計算單元不在真實的單元上而在虛擬的單元上運行,是一種優(yōu)化資源和簡化管理的計算方案。虛擬化技術(shù)適合在云計算平合中應(yīng)用,虛擬化的核心解決了云計算等對硬件的依賴,提供統(tǒng)一的虛擬化界面;通過虛擬化技術(shù),人們可以在一臺服務(wù)器上運行多臺虛擬機(jī),從而實現(xiàn)了對服務(wù)器的優(yōu)化和整合。優(yōu)點:虛擬化技術(shù)使用動態(tài)資源伸縮的手段,降低了云計算基礎(chǔ)設(shè)施的使用成本,并提高負(fù)載部署的靈活性。云計算的關(guān)鍵技術(shù)3.中間件技術(shù)定義:支持應(yīng)用軟件的開發(fā)、運行、部署和管理的支撐軟件被稱為中間件,它是運行在兩個層次之間的一種組件,是在操作系統(tǒng)和應(yīng)用軟件之問的軟件層次。功能:1.屏蔽硬件和操作系統(tǒng)之間的兼容問題2.具有管理分布式系統(tǒng)中的節(jié)點間的通信、節(jié)點資源和協(xié)調(diào)工作等功能。3.將不同平臺的計算節(jié)點組成一個功能強(qiáng)大的分布式計算系統(tǒng)。4.對云服務(wù)資源進(jìn)行管理,包含用戶管理、任務(wù)管理、安全管理等,為云計算的部署、運行、開發(fā)和應(yīng)用提供高效支撐。云計算的關(guān)鍵技術(shù)4.云存儲技術(shù)在云計算中,云存儲技術(shù)通常和虛擬化技術(shù)相互結(jié)合起來,通過對數(shù)據(jù)資源的虛擬化,提高訪問效率。目前,數(shù)據(jù)存儲技術(shù)HDFS和谷歌公司的GFS具有高吞吐率、分布式和高速傳輸?shù)葍?yōu)點。因此,采用云存儲技術(shù),可滿足云計算為大量用戶提供云服務(wù)的需求。云計算與大數(shù)據(jù)云計算是產(chǎn)業(yè)發(fā)展趨勢,大數(shù)據(jù)是現(xiàn)代信息社會飛速發(fā)展的必然現(xiàn)象。解決大數(shù)據(jù)問題,需要以現(xiàn)代云計算技術(shù)為基礎(chǔ)支撐;而大數(shù)據(jù)的發(fā)展不僅解決了產(chǎn)業(yè)和經(jīng)濟(jì)的現(xiàn)實困難,同時也會促使云計算、物聯(lián)網(wǎng)的深入應(yīng)用和推廣,進(jìn)而又形成更大規(guī)模的大數(shù)據(jù)挑戰(zhàn)。圖8?5云計算與大數(shù)據(jù)的關(guān)系云計算與大數(shù)據(jù)的關(guān)系1.云計算與大數(shù)據(jù)的關(guān)系云計算為大數(shù)據(jù)提供了有力的工具和途徑,大數(shù)據(jù)為云計算提供了用武之地,而大數(shù)據(jù)則通過云計算的形式,將這些數(shù)據(jù)分析、處理,提取有用的信息,即大數(shù)據(jù)分析。下面給出了云計算與大數(shù)據(jù)的總體關(guān)系:1)從技術(shù)上來看,大數(shù)據(jù)和云計算的關(guān)系密不可分。2)大數(shù)據(jù)必然無法用單臺的計算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。3)大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。4)實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百,甚至數(shù)千的計算機(jī)分配工作。云計算與大數(shù)據(jù)的關(guān)系5)大數(shù)據(jù)需要特殊的技術(shù)以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模的并行處理數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴(kuò)展的存儲系統(tǒng)。表8?1云計算與大數(shù)據(jù)之間的異同云計算與大數(shù)據(jù)的融合發(fā)展目前,許多云計算服務(wù)由于規(guī)模的擴(kuò)大,已經(jīng)將大數(shù)據(jù)的存儲和處理集成在后臺。許多企業(yè)云存儲服務(wù)商在基礎(chǔ)數(shù)據(jù)存儲功能的基礎(chǔ)上增加了相應(yīng)的數(shù)據(jù)處理算法和系統(tǒng),服務(wù)于視頻、社交等各種互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)企業(yè)應(yīng)用,提供更便捷、更集成的云服務(wù),滿足企業(yè)用戶不斷發(fā)展的需求。同樣,很多行業(yè)的大數(shù)據(jù)處理系統(tǒng)也選擇在公有云服務(wù)平臺上構(gòu)建大數(shù)據(jù)系統(tǒng),與云服務(wù)融合,再以云服務(wù)的形式提供給行業(yè)。未來,這一趨勢將更加明顯,將會看到更廣泛的云計算和大數(shù)據(jù)融合的服務(wù)和應(yīng)用,它們之間的界限將變得越來越模糊。云計算與大數(shù)據(jù)的融合發(fā)展從行業(yè)來看,云計算和大數(shù)據(jù)已經(jīng)成為中國的國家戰(zhàn)略,相關(guān)技術(shù)和應(yīng)用深入到各個傳統(tǒng)產(chǎn)業(yè)和新興產(chǎn)業(yè),云計算蓬勃的發(fā)展。挑戰(zhàn):1.許多行業(yè)仍然注重基礎(chǔ)硬件的建設(shè)和投入,以及資源服務(wù)水平(如智慧城市寬帶建設(shè)、數(shù)據(jù)中心項目等),缺乏對核心軟件和關(guān)鍵技術(shù)的戰(zhàn)略投入。2.真正規(guī)?;脑朴嬎愫痛髷?shù)據(jù)應(yīng)用也很少。3.大數(shù)據(jù)處理也面臨著數(shù)據(jù)共享、數(shù)據(jù)融合與交換、數(shù)據(jù)權(quán)利確認(rèn)、數(shù)據(jù)安全與隱私保護(hù)等諸多挑戰(zhàn)。大數(shù)據(jù)上云大數(shù)據(jù)上的云實際上有多種含義和選擇。由于大數(shù)據(jù)的特點,企業(yè)需要建立自己的大數(shù)據(jù)存儲和處理平臺,企業(yè)可以選擇將大數(shù)據(jù)存儲在云端?,F(xiàn)在很多云服務(wù)提供商都提供云存儲服務(wù)。大數(shù)據(jù)挖掘的存儲和分析是密切相關(guān)的,如果只把大數(shù)據(jù)放在云端,而把大數(shù)據(jù)處理留在本地,那么每次都要從云端把數(shù)據(jù)拿回來,計算完再保存回來,這顯然不是一個好的選擇。因此,也需要將大數(shù)據(jù)的計算和處理放到云端,讓整個企業(yè)的大數(shù)據(jù)系統(tǒng)成為云服務(wù)。還有一種選擇是混合架構(gòu),即同時構(gòu)建本地大數(shù)據(jù)存儲和處理平臺。核心和機(jī)密數(shù)據(jù)可以本地存儲,一些關(guān)鍵的實時處理場景也可以本地處理,其他可以在云端處理。大數(shù)據(jù)上云當(dāng)前,隨著物聯(lián)網(wǎng)技術(shù)的普及,很多邊緣設(shè)備也都具備了比較強(qiáng)的存儲和計算能力,因而出現(xiàn)了“云計算+邊緣計算”的創(chuàng)新模式。在這種場景下的大數(shù)據(jù)解決方案,也可以采用數(shù)據(jù)存儲和分析構(gòu)建在公有云平臺,采用離線訓(xùn)練模型;再結(jié)合邊緣存儲和計算,在生產(chǎn)現(xiàn)場利用實時數(shù)據(jù)和己經(jīng)訓(xùn)練好的模型或?qū)崟r模型進(jìn)行關(guān)鍵業(yè)務(wù)處理的兩級架構(gòu),以滿足不斷變化的應(yīng)用需求。用這種結(jié)合的模式,可以降低成本、實現(xiàn)彈性擴(kuò)展、提高容災(zāi)性,同時也使得數(shù)據(jù)共享更便利。云計算在制造業(yè)的應(yīng)用定義:制造云是指專用于工業(yè)制造行業(yè)應(yīng)用賦能的云計算平臺和系列云計算服務(wù)的總稱。功能:制造云既有通用云計算平臺的所有服務(wù)能力,又針對制造行業(yè)的特點提供行業(yè)所需的云計算服務(wù),核心是幫助企業(yè)構(gòu)建工業(yè)互聯(lián)網(wǎng)應(yīng)用的工業(yè)互聯(lián)網(wǎng)IIoT平臺、基于其上的大數(shù)據(jù)處理和人工智能應(yīng)用,以及各種工業(yè)場景下的SaaS應(yīng)用服務(wù)。智能制造云會對制造全系統(tǒng)、全生命周期活動中的人、物、環(huán)境、信息等進(jìn)行自主智慧地感交互,形成一種基于泛在網(wǎng)絡(luò),以用戶為中心的智慧制造新模式和“泛在互聯(lián)、數(shù)據(jù)驅(qū)動、共享服務(wù)、萬眾創(chuàng)新”的新業(yè)態(tài)。機(jī)器學(xué)習(xí)的定義目前引用得較多的關(guān)于機(jī)器學(xué)習(xí)的定義是:“機(jī)器學(xué)習(xí)是一種計算機(jī)程序,它可以讓系統(tǒng)在未經(jīng)人為主動編程的情況下,具有從經(jīng)驗(數(shù)據(jù))中自動學(xué)習(xí)并自我改進(jìn)的能力。”機(jī)器學(xué)習(xí)的過程始于對數(shù)據(jù)的觀察,其主要目的是允許計算機(jī)在沒有人工干預(yù)或幫助的情況下自動學(xué)習(xí),并相應(yīng)地調(diào)整操作。機(jī)器學(xué)習(xí)的分類機(jī)器學(xué)習(xí)的本質(zhì)是從數(shù)據(jù)中學(xué)習(xí),所以數(shù)據(jù)的可用信息尤為重要,根據(jù)數(shù)據(jù)可提供的信息進(jìn)行分類,是機(jī)器學(xué)習(xí)最主要的一種分類方式。目前,根據(jù)數(shù)據(jù)集的可用信息將機(jī)器學(xué)習(xí)分為:監(jiān)督學(xué)習(xí)(SupervisedLearning)、無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)、半監(jiān)督學(xué)習(xí)(Semi-supervisedLearning)和強(qiáng)化學(xué)習(xí)(ReinforcementLearning),后兩者也可統(tǒng)稱為弱監(jiān)督學(xué)習(xí)(WeaklySupervisedLearning)。圖8?6機(jī)器學(xué)習(xí)的分類機(jī)器學(xué)習(xí)的分類1)監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)是指:利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。在監(jiān)督學(xué)習(xí)中,每個實例都是由一個輸入對象(通常為矢量)和一個期望的輸出值(也稱為監(jiān)督信號)組成。功能:監(jiān)督學(xué)習(xí)算法是分析該訓(xùn)練數(shù)據(jù),并產(chǎn)生一個推斷的功能,其可以用于映射出新的實例。一個最佳的方案將允許該算法來正確地決定那些看不見的實例的類標(biāo)簽,這就要求學(xué)習(xí)算法是在一種“合理”的方式從一種從訓(xùn)練數(shù)據(jù)到看不見的情況下形成。機(jī)器學(xué)習(xí)的分類2)無監(jiān)督學(xué)習(xí)根據(jù)類別未知(沒有被標(biāo)記)的訓(xùn)練樣本解決模式識別中的各種問題,稱之為無監(jiān)督學(xué)習(xí)。3)半監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)使用大量的未標(biāo)記數(shù)據(jù),以及同時使用標(biāo)記數(shù)據(jù),來進(jìn)行模式識別工作。當(dāng)使用半監(jiān)督學(xué)習(xí)時,將會要求盡量少的人員來從事工作,同時,又能夠帶來比較高的準(zhǔn)確性,因此,半監(jiān)督學(xué)習(xí)正越來越受到人們的重視。機(jī)器學(xué)習(xí)的分類4)強(qiáng)化學(xué)習(xí)定義:強(qiáng)化學(xué)習(xí)是智能體(Agent)以“試錯”的方式進(jìn)行學(xué)習(xí),通過與環(huán)境進(jìn)行交互獲得的獎賞指導(dǎo)行為,目標(biāo)是使智能體獲得最大的獎賞,強(qiáng)化學(xué)習(xí)不同于連接主義學(xué)習(xí)中的監(jiān)督學(xué)習(xí)。主要表現(xiàn)在強(qiáng)化信號上,強(qiáng)化學(xué)習(xí)中由環(huán)境提供的強(qiáng)化信號是對產(chǎn)生動作的好壞作一種評價(通常為標(biāo)量信號),而不是告訴強(qiáng)化學(xué)習(xí)系統(tǒng)RLS(ReinforcementLearningSystem)如何去產(chǎn)生正確的動作。由于外部環(huán)境提供的信息很少,RLS必須靠自身的經(jīng)歷進(jìn)行學(xué)習(xí),通過這種方式,RLS在行動-評價的環(huán)境中獲得知識,改進(jìn)行動方案以適應(yīng)環(huán)境。人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)三者的關(guān)系機(jī)器學(xué)習(xí)是人工智能研究中的核心問題之一,是實現(xiàn)機(jī)器智能化的根本途徑,也是當(dāng)前人工智能理論研究和實際應(yīng)用中非常活躍的研究領(lǐng)域。深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)的一個分支。在很多人工智能問題上,深度學(xué)習(xí)的方法突破了傳統(tǒng)機(jī)器學(xué)習(xí)方法的瓶頸,推動了人工智能領(lǐng)域的快速發(fā)展。圖8?7人工智能和機(jī)器學(xué)習(xí)關(guān)系示意圖機(jī)器學(xué)習(xí)的三個基本要素機(jī)器學(xué)習(xí)的基本要素包括:模型、學(xué)習(xí)準(zhǔn)則(策略)和優(yōu)化算法三個部分。機(jī)器學(xué)習(xí)方法之間的不同,主要來自其模型、學(xué)習(xí)準(zhǔn)則(策略)、優(yōu)化算法的不同。確定了模型、學(xué)習(xí)準(zhǔn)則(策略)、優(yōu)化算法,機(jī)器學(xué)習(xí)的方法也就確定了。機(jī)器學(xué)習(xí)的三個基本要素1.模型機(jī)器學(xué)習(xí)首要考慮的問題是學(xué)習(xí)什么樣的模型(Model)。在監(jiān)督式機(jī)器學(xué)習(xí)中,給定訓(xùn)練集,學(xué)習(xí)的目的是希望能夠擬合一個兩數(shù)來完成從輸入特征向量到輸出標(biāo)簽的映射。這個需要擬合的函數(shù)就稱為模型,它由參數(shù)向量決定,稱為模型參數(shù)向量,所在的空間稱為參數(shù)空間(ParameterSpace)。分類:一般來說,模型有兩種形式,一種形式是概率模型(條件概率分布),另一種形式是非概率模型(決策兩數(shù))。決策函數(shù)還可以再分為線性和非線性兩種,對應(yīng)的模型就稱為線性模型和非線性模型。機(jī)器學(xué)習(xí)的三個基本要素我們將訓(xùn)練得到的模型稱為一個假設(shè),從輸入空間到輸出空間的所有可能映射組成的集合稱為假設(shè)空間(HypothesisSpace)。在監(jiān)督式機(jī)器學(xué)習(xí)中,模型就是所要學(xué)習(xí)的條件概率分布或決策函數(shù)。模型的假設(shè)空間包含所有可能的條件概率分布或決策函數(shù)。例如,假設(shè)決策函數(shù)是輸入特征向量的線性函數(shù),那么模型的假設(shè)空間就是所有這些線性函數(shù)構(gòu)成的函數(shù)集合。假設(shè)空間中的模型一般有無窮多個,而機(jī)器學(xué)習(xí)的目的就是從這個假設(shè)空間中選擇出一個最好的預(yù)測模型,也就是在參數(shù)空間中選擇一個最優(yōu)的估計參數(shù)向量。機(jī)器學(xué)習(xí)的三個基本要素2.學(xué)習(xí)準(zhǔn)則(策略)在明確了模型的假設(shè)空間之后,接下來需要考慮的是按照什么樣的準(zhǔn)則(策略)從假設(shè)空間中選擇最優(yōu)的模型,即學(xué)習(xí)準(zhǔn)則或策略問題。機(jī)器學(xué)習(xí)最后都?xì)w結(jié)為求解最優(yōu)化問題,為了實現(xiàn)某一目標(biāo),需要構(gòu)造出一個“目標(biāo)函數(shù)”(ObjectiveFunction),然后讓目標(biāo)函數(shù)達(dá)到極大值或極小值,從而求得機(jī)器學(xué)習(xí)模型的參數(shù)。如何構(gòu)造出一個合理的目標(biāo)函數(shù),是建立機(jī)器學(xué)習(xí)模型的關(guān)鍵,一旦目標(biāo)函數(shù)確定,接下來就是求解最優(yōu)化問題。機(jī)器學(xué)習(xí)的三個基本要素對于監(jiān)督式機(jī)器學(xué)習(xí)中的分類問題與回歸問題,機(jī)器學(xué)習(xí)本質(zhì)上是給定一個訓(xùn)練樣本數(shù)據(jù)集,嘗試學(xué)習(xí)的映射函數(shù),其中是模型的參數(shù)向量,使得給定一個輸入樣本的數(shù)據(jù)x,即便這個x不在訓(xùn)練樣本中,也能夠為x預(yù)測出一個標(biāo)簽值。在機(jī)器學(xué)習(xí)領(lǐng)域,存在三個容易被混淆的術(shù)語:損失函數(shù)(LossFunction)、代價函數(shù)(CostFunction)和目標(biāo)函數(shù)(ObjectiveFunction)。機(jī)器學(xué)習(xí)的三個基本要素1)損失函數(shù):通常是針對單個訓(xùn)練樣本而言的,用來衡量模型在每個樣本實例上的預(yù)測值與樣本的真實標(biāo)簽值之間的誤差,記作。損失函數(shù)的值越小,說明預(yù)測值與實際觀測值越接近。2)代價函數(shù):通常是針對整個訓(xùn)練樣本集(或者一個Mini-batch)的總損失。常用的代價函數(shù)包括均方誤差、均方根誤差、平均絕對誤差等。代價函數(shù)的值越小,說明模型對訓(xùn)練集樣本數(shù)據(jù)的擬合效果越好。3)目標(biāo)函數(shù):是一個更通用的術(shù)語,表示最終待優(yōu)化的函數(shù)。例如,結(jié)構(gòu)風(fēng)險函數(shù)就是最終待優(yōu)化的目標(biāo)函數(shù)。由于損失函數(shù)和代價函數(shù)只是在針對樣本集上有區(qū)別,因此在有些書中統(tǒng)一使用損失函數(shù)這個術(shù)語,但書中的相關(guān)公式實際上采用的是代價函數(shù)的形式。機(jī)器學(xué)習(xí)的三個基本要素3.優(yōu)化算法在獲得了訓(xùn)練樣本集、確定了假設(shè)空間以及選定了合適的學(xué)習(xí)準(zhǔn)則之后,就要根據(jù)學(xué)習(xí)準(zhǔn)則(策略)從假設(shè)空間中選擇最優(yōu)模型,需要考慮用什么樣的計算方法來求解模型的最優(yōu)參數(shù)估計。機(jī)器學(xué)習(xí)模型的訓(xùn)練和學(xué)習(xí)的過程,實際上就是求解最優(yōu)化問題的過程。如果優(yōu)化問題存在顯式的解析解,則這個最優(yōu)化問題就比較簡單,我們可以求出它的閉式解。但是如果不存在解析解,則需要通過數(shù)值計算的方法來不斷逼近。在機(jī)器學(xué)習(xí)中,很多優(yōu)化兩數(shù)不是凸函數(shù),因此,如何高效地尋找到全局最優(yōu)解,是一個值得研究的問題。機(jī)器學(xué)習(xí)的三個基本要素目前,常用的優(yōu)化算法有:梯度下降法(GradientDescent,CD)、隨機(jī)梯度下降法(StochasticGradientDescent,SCD)、批量梯度下降法(Mini-BatchGradientDescent,MBGD)、牛頓法、擬牛頓法、坐標(biāo)下降法等。機(jī)器學(xué)習(xí)在不同行業(yè)中的應(yīng)用機(jī)器學(xué)習(xí)在交通運輸行業(yè)的應(yīng)用自動駕駛汽車是目前大家討論的一個主要的方面。盡管自動駕駛汽車仍處于測試階段,但它將成為交通運輸?shù)奈磥???茖W(xué)家們正在為這種復(fù)雜的產(chǎn)品開發(fā)各種新的算法,以便使新的功能得以實現(xiàn),例如,分析和優(yōu)化從各種來源收集的數(shù)據(jù),并基于這些數(shù)據(jù)在真實世界中規(guī)劃路線,實現(xiàn)自動駕駛。圖8?8機(jī)器視覺的應(yīng)用使運輸和物流變得更智能、更高效機(jī)器學(xué)習(xí)在不同行業(yè)中的應(yīng)用計算機(jī)視覺和傳感器融合的應(yīng)用程序是自動駕駛汽車中至關(guān)重要的應(yīng)用程序,可幫助分析路面上的不同對象并選擇車輛控制方式。車輛對從不同來源獲得的數(shù)據(jù)進(jìn)行處理和分析,再反饋給控制系統(tǒng),以便進(jìn)行精確決策,并根據(jù)情況做出響應(yīng)。目前,寶馬公司、大眾公司,甚至日本船運公司都建立了由人工智能專家組成的團(tuán)隊,致力于此類產(chǎn)品的研發(fā)。圖8?8機(jī)器視覺的應(yīng)用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 項目需求獲取技巧試題及答案
- 軟考網(wǎng)絡(luò)工程師試題及答案創(chuàng)造力2025年
- 西方立法與行政關(guān)系的試題及答案
- 公共政策中的信任建設(shè)研究試題及答案
- 機(jī)電工程的材料科學(xué)概述與應(yīng)用試題及答案
- 政治權(quán)力的合法性與維持試題及答案
- 西方國家的選舉制度與民主構(gòu)建試題及答案
- 政治權(quán)力的制衡與平衡研究試題及答案
- 解析2025年信息系統(tǒng)項目管理師試題及答案
- 滑坡型變化2025年西方政治制度試題及答案
- 2025年廣東省數(shù)學(xué)九年級中考三輪復(fù)習(xí)壓軸題:相似與幾何綜合練習(xí)
- 2024-2025學(xué)年人教版八年級下冊期末數(shù)學(xué)質(zhì)量檢測試卷(含答案)
- 江蘇省南通市合作盟校2025年高考化學(xué)四模試卷含解析
- 猴痘防控方案培訓(xùn)課件
- 新版GSP《醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范》培訓(xùn)試題
- 新版2025心肺復(fù)蘇術(shù)指南
- DB45T 1056-2014 土地整治工程 第2部分:質(zhì)量檢驗與評定規(guī)程
- 國有企業(yè)合規(guī)管理與風(fēng)險控制
- 2025非開挖施工用球墨鑄鐵管第1部分:頂管法用
- TNXZX 031-2024 牛羊肉電商銷售質(zhì)量服務(wù)規(guī)范
- 調(diào)味品干貨供貨服務(wù)方案
評論
0/150
提交評論