




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第1章人工智能新技術(shù)第2章大數(shù)據(jù)第3章機(jī)器學(xué)習(xí)第4章深度學(xué)習(xí)第5章知識(shí)圖譜第6章AI圖像技術(shù)第7章自然語(yǔ)言處理第8章智慧物聯(lián)第9章數(shù)字工廠第10章智能機(jī)器人第11章智慧城市人工智能應(yīng)用技術(shù)基礎(chǔ)人工智能技術(shù)基礎(chǔ)前言目錄什么是人工智能從簡(jiǎn)單機(jī)器到通用圖靈機(jī)人工智能AI簡(jiǎn)史人工智能與自然智能什么是人工智能人工智能(ArtificialIntelligence),英文縮寫(xiě)為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。一般解釋?zhuān)喝斯ぶ悄芫褪怯萌斯さ姆椒ㄔ跈C(jī)器(計(jì)算機(jī))上實(shí)現(xiàn)的智能行為,也稱(chēng)機(jī)器智能、計(jì)算機(jī)智能。人工智能(AI)AI到底是什么霍金說(shuō)過(guò)人類(lèi)會(huì)被人工智能滅族,現(xiàn)在霍金走了,我有點(diǎn)慌其實(shí),你的生活早已被AI支配了,天真,像是Siri、指紋識(shí)別、人臉識(shí)別、無(wú)人駕駛等總感覺(jué)這種飄渺的高精尖科技離我遠(yuǎn)得很,沒(méi)想到AI已經(jīng)滲透到生活中的點(diǎn)點(diǎn)滴滴了人工智能其實(shí)能讓機(jī)器實(shí)現(xiàn)原本只有人類(lèi)才能完成的任務(wù),AI涉及到計(jì)算機(jī)科學(xué)、心理學(xué)、哲學(xué)和語(yǔ)言學(xué)等學(xué)科指紋識(shí)別人臉識(shí)別無(wú)人駕駛
超人工智能顧名思義,就像超人一樣全方位碾壓人類(lèi)腦力體力
人類(lèi)距離強(qiáng)人工智能還很遠(yuǎn),它能具有自我意識(shí),可以像人腦一樣獨(dú)立思考,并制定解決問(wèn)題的最佳方案
弱人工智能沒(méi)有自主意識(shí),只能完成程序設(shè)定內(nèi)的任務(wù),廣泛用于取代機(jī)械體力勞動(dòng)超強(qiáng)弱1.1從簡(jiǎn)單機(jī)器到通用圖靈機(jī)
數(shù)千年來(lái),人類(lèi)廣泛制造和使用機(jī)器促進(jìn)生產(chǎn)力的發(fā)展??紤]一個(gè)簡(jiǎn)單的杠桿,用巖石和一定長(zhǎng)度的木棒構(gòu)造,或者利用傾斜平面,這臺(tái)機(jī)器都能夠幫助人類(lèi)完成有用的工作。但它們并沒(méi)有學(xué)習(xí)能力,因?yàn)樗鼈兌急蛔陨淼臉?gòu)建方式所限制。一旦構(gòu)建,如果沒(méi)有人類(lèi)干預(yù),它們就不能適應(yīng)不斷變化的需求,如圖顯示了早期不具備學(xué)習(xí)能力的簡(jiǎn)單機(jī)器。
這兩臺(tái)機(jī)器都能完成有用的工作,增強(qiáng)人類(lèi)的能力。知識(shí)同化在它們的參數(shù)當(dāng)中,也就是每個(gè)部件的尺寸。傾斜平面的功能由其長(zhǎng)度和高度決定,杠桿的功能由長(zhǎng)度和高度決定。這些由設(shè)計(jì)和選擇的尺寸參數(shù),本質(zhì)上仍然是依附于設(shè)計(jì)者所擁有的知識(shí)水平進(jìn)行建構(gòu)。1.1.1參數(shù)固定的簡(jiǎn)單機(jī)器
機(jī)器學(xué)習(xí)涉及在機(jī)器運(yùn)行時(shí)不可以改變的參數(shù)。在上述兩個(gè)簡(jiǎn)單機(jī)器的情形中,知識(shí)是通過(guò)參數(shù)的設(shè)計(jì)植入其中的。在某種意義上,參數(shù)體現(xiàn)了設(shè)計(jì)者的想法。因此,知識(shí)是參數(shù)固定化的兩種形式。
今天,許多機(jī)器都能夠適應(yīng)負(fù)載的移動(dòng)或改變,現(xiàn)代起重機(jī)就是適應(yīng)負(fù)載變化的一個(gè)普適例子。如圖所示起重機(jī)吊臂有基本臂和以基本臂當(dāng)中心線的二節(jié)臂、三節(jié)臂二節(jié)臂插裝在基本臂內(nèi),三節(jié)臂插裝在二節(jié)臂內(nèi)……各節(jié)臂之間的相對(duì)運(yùn)動(dòng)是互相關(guān)聯(lián)的,只要確定基本臂的結(jié)構(gòu)尺寸,其他各節(jié)臂的結(jié)構(gòu)尺寸就可以由該尺寸和滑塊尺寸計(jì)算得到。整個(gè)吊臂參數(shù)由基本臂參數(shù)和滑塊參數(shù)確定,由于滑塊是可驅(qū)動(dòng)的,因此,起重機(jī)的吊臂長(zhǎng)度可以根據(jù)操作者的需要而改變。1.1.2參數(shù)可調(diào)節(jié)的機(jī)器
電梯可作為日常生活中熟悉的一個(gè)例子,點(diǎn)擊電梯的樓層就是為電梯輸入?yún)?shù),電梯到達(dá)指定的樓層自動(dòng)開(kāi)門(mén),這是一個(gè)參數(shù)可變的機(jī)器運(yùn)行的案例。
通用圖靈機(jī)是整個(gè)人工智能的基礎(chǔ),用機(jī)械時(shí)代常見(jiàn)的密碼工作設(shè)備,可以設(shè)想一臺(tái)這樣工作的抽象機(jī)器:通過(guò)有限的狀態(tài)和控制規(guī)則讀寫(xiě)一條無(wú)限長(zhǎng)的有孔紙帶。通用圖靈機(jī)是機(jī)器的邏輯形式,是一種抽象設(shè)備模型,它不是計(jì)算工具,而是一臺(tái)呈現(xiàn)人類(lèi)思維活動(dòng)的機(jī)器模型,而這樣的機(jī)器活動(dòng)之前只有人類(lèi)才能進(jìn)行。圖靈機(jī)模型的一個(gè)基本思想和特點(diǎn)是將有限的離散設(shè)備作用于無(wú)限的輸入和輸出。1.1.3通用圖靈機(jī)
我知道圖靈,圖靈獎(jiǎng)是計(jì)算機(jī)界的諾貝爾,我們國(guó)家的姚期智院士在2000年獲得圖靈獎(jiǎng)
圖靈是二戰(zhàn)最偉大的英雄,成功破譯了enigma(恩尼格瑪),讓二戰(zhàn)能夠提前好幾年結(jié)束
他非常喜歡長(zhǎng)跑、下棋還有園藝,經(jīng)常說(shuō)總有一天計(jì)算機(jī)也會(huì)像人一樣做著相似的事情,也會(huì)思考
他的通用圖靈機(jī)理念,被認(rèn)定為當(dāng)代計(jì)算機(jī)的前身,他在1950年《計(jì)算機(jī)器與智能》提出圖靈測(cè)試?yán)?.1
根據(jù)通用圖靈機(jī)工作原理處理下面符號(hào)序列指令,按ASCII碼輸出:++++++++++[>++++++++++<-]>++++.+.
7條指令:
+——
使當(dāng)前數(shù)據(jù)單元的值增1。
-——
使當(dāng)前數(shù)據(jù)單元的值減1。
>——
下一個(gè)單元作為當(dāng)前數(shù)據(jù)單元。
<——
上一個(gè)單元作為當(dāng)前數(shù)據(jù)單元。
[——如果當(dāng)前數(shù)據(jù)單元的值為0,下一條指令在對(duì)應(yīng)的]后;
否則,執(zhí)行下一條指令。
]——如果當(dāng)前數(shù)據(jù)單元的值不為0,下一條指令在對(duì)應(yīng)的[后;否則,執(zhí)行下一條指令。
.——
把當(dāng)前數(shù)據(jù)單元的值作為字符輸出。
解:數(shù)據(jù)單元A、數(shù)據(jù)單元B置于一條無(wú)限長(zhǎng)的紙帶里,依次接收指令,數(shù)據(jù)單元A、B初始值都是0,如圖所示
指令從頭開(kāi)始依次輸入數(shù)據(jù)單元A,每執(zhí)行一次指令“+”,數(shù)據(jù)單元A存儲(chǔ)的值增1,等待下一條指令。圖1-3中指令“>”處,數(shù)據(jù)單元A的值為10,數(shù)據(jù)單元B的值為0。
執(zhí)行完指令“>”后,下一條指令“+”輸入數(shù)據(jù)單元B,每執(zhí)行一次指令“+”,數(shù)據(jù)單元B存儲(chǔ)的值增1,等待下一條指令。圖1-3中指令“<”處數(shù)據(jù)單元B的值為10,數(shù)據(jù)單元A的值為10。
執(zhí)行完指令“<”后,下一條指令“-”輸入數(shù)據(jù)單元A,數(shù)據(jù)單元A的值減1,接著執(zhí)行指令“]”,再執(zhí)行指令“[”后的指令“>”,圖1-2中“>”處數(shù)據(jù)單元B的值為10,數(shù)據(jù)單元A的值為9。
執(zhí)行完指令“>”后,下一條指令“+”輸入數(shù)據(jù)單元B,…,圖1-2中“<”處數(shù)據(jù)單元B的值為20,數(shù)據(jù)單元A的值為9。
圖1-3中此處數(shù)據(jù)單元B的值為100,數(shù)據(jù)單元A的值為1,執(zhí)行下一條指令“-”,數(shù)據(jù)單元A的值為0,又執(zhí)行下一條指令“]”后,再執(zhí)行指令“>”,下一條指令“+”輸入數(shù)據(jù)單元B,數(shù)據(jù)單元B的值為104后,執(zhí)行指令“.”,根據(jù)ASCII碼輸出“h”,數(shù)據(jù)單元B繼續(xù)執(zhí)行指令“+”,再執(zhí)行指令“.”,輸出“i”。
最終,上面程序按ASCII碼輸出:hi。1.2人工智能AI簡(jiǎn)史
哲學(xué)上,古希臘哲學(xué)家亞里士多德(Aristotle)提出了形式邏輯的主要定律,系統(tǒng)論述了演繹推理的基本原則
19世紀(jì)末期,德國(guó)數(shù)學(xué)家弗雷格(G.Frege)提出用機(jī)械推理的思想表示符號(hào)系統(tǒng),開(kāi)創(chuàng)了現(xiàn)代數(shù)理邏輯
數(shù)學(xué)上,英國(guó)邏輯學(xué)家布爾(G.Boole)創(chuàng)立了布爾代數(shù),將數(shù)學(xué)運(yùn)算歸結(jié)為邏輯推理,首次用符號(hào)語(yǔ)言描述了思維活動(dòng)的基本推理準(zhǔn)則。1.2.1機(jī)器與智能(1956年之前)
1936年,一位才華橫溢的英國(guó)年輕人圖靈(Turing)提出一種理想的計(jì)算機(jī)數(shù)學(xué)模型,即通用Turing機(jī)。同年,美國(guó)數(shù)學(xué)家丘奇(A.Church)運(yùn)用λ演算(讀作Lambda演算)清晰地定義了可計(jì)算函數(shù)。通用Turing機(jī)、可計(jì)算函數(shù)、λ演算、遞歸論等本質(zhì)上是等價(jià)的。至此,人工智能大廈堅(jiān)實(shí)的理論奠基業(yè)已竣工
工程上,法國(guó)物理學(xué)家和數(shù)學(xué)家帕斯卡(B.Pascal,1623--1662)設(shè)計(jì)制造了機(jī)械計(jì)算器,也稱(chēng)帕斯卡機(jī)。帕斯卡機(jī)由一連串標(biāo)有0至9這十個(gè)數(shù)字的機(jī)輪構(gòu)成,機(jī)輪彼此連接,當(dāng)一個(gè)機(jī)輪旋轉(zhuǎn)360°時(shí),緊挨著它左邊的機(jī)輪就旋轉(zhuǎn)1/10周,這就是“進(jìn)位1”,帕斯卡用機(jī)輪和齒輪實(shí)現(xiàn)了十進(jìn)制位值系統(tǒng)。帕斯卡機(jī)能夠?qū)κM(jìn)制的整數(shù)進(jìn)行加減運(yùn)算,也可以對(duì)十進(jìn)制的分?jǐn)?shù)與整數(shù)進(jìn)行加法運(yùn)算。帕斯卡機(jī)出售了一部分,有的一直保存至今
德國(guó)數(shù)學(xué)家和哲學(xué)家萊布尼茨(G.W.Leibniz)在帕斯卡機(jī)基礎(chǔ)上制成了能進(jìn)行乘法運(yùn)算的機(jī)器,萊布尼茨把乘法機(jī)械地表示成一系列加法,兩個(gè)數(shù)相乘的過(guò)程是通過(guò)旋轉(zhuǎn)曲柄的把手完成的。他還提出了邏輯機(jī)的設(shè)計(jì)思想,即通過(guò)符號(hào)體系、推理對(duì)象的特征進(jìn)行“推理計(jì)算”,這種思想蘊(yùn)含了人工智能AI的萌芽
1937年,年輕的美國(guó)碩士生香農(nóng)(C.Shannon),這位20世紀(jì)最偉大的科學(xué)家之一,撰文“ASymbolicAnalysisofRelayandSwitchingCircuits”(繼電器和開(kāi)關(guān)電路的符號(hào)分析),香農(nóng)在這篇文章中論述,開(kāi)關(guān)電路和邏輯具有共同的本質(zhì),并將開(kāi)關(guān)的連接方式寫(xiě)成了邏輯表達(dá)式。這樣,布爾將數(shù)學(xué)問(wèn)題歸結(jié)為邏輯問(wèn)題,香農(nóng)將邏輯問(wèn)題歸結(jié)為電氣開(kāi)關(guān)連接,于是,人們可以設(shè)計(jì)專(zhuān)門(mén)的電子機(jī)械,用來(lái)計(jì)算任何可計(jì)算的數(shù)學(xué)函數(shù)
1943年,美國(guó)神經(jīng)心理學(xué)家麥卡洛克(W.Maculloch)和數(shù)學(xué)家皮茨(W.Pitts)撰文“ALogicalCalculusoftheIdeasImmanentinNervousActivity”(神經(jīng)活動(dòng)內(nèi)在概念的邏輯演算),證明了:一定類(lèi)型的神經(jīng)網(wǎng)絡(luò)原則上能夠計(jì)算一定類(lèi)型的邏輯函數(shù)
1946年,在美國(guó)制造出了世界上.
它每秒能完成5000次加法,400次乘法等運(yùn)算。ENIAC為人工智能研究奠定了物質(zhì)基礎(chǔ)
1950年,圖靈發(fā)表“ComputingMachineryandIntelligence”,文中提出了著名的圖靈測(cè)試(TuringTest)
1956年8月,在美國(guó)漢諾斯小鎮(zhèn)寧?kù)o的達(dá)特茅斯(Dartmouth)學(xué)院中,麥卡錫(J.McCarthy)、明斯基、香農(nóng)、紐厄爾(A.Newell)、西蒙(H.Simon,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主)等科學(xué)家集聚一堂,討論會(huì)的主題是:用機(jī)器來(lái)模仿人類(lèi)學(xué)習(xí)以及其他方面的智能。經(jīng)麥卡錫提議,會(huì)上正式?jīng)Q定使用“ArtificialIntelligence”(AI:人工智能),從此,人工智能作為一門(mén)學(xué)科正式誕生
人工智能洶涌的波濤中,交織著兩股不竭的思想源泉:符號(hào)主義、聯(lián)結(jié)主義,在兩者此起彼伏的競(jìng)相發(fā)展過(guò)程中,行為主義獨(dú)辟蹊徑,爭(zhēng)得了一席之地,也形成一股新力量1.2.2
人工智能形成和發(fā)展(1956年至20世紀(jì)末)
LOGO
符號(hào)主義的領(lǐng)軍人物就是被尊稱(chēng)為“人工智能之父”的麥卡錫,他們認(rèn)為邏輯推理是計(jì)算機(jī)智能化的必由之路,其主要成果有:
1956年,紐厄爾(Newell)和西蒙(Simon)等人編制了一個(gè)稱(chēng)為邏輯理論機(jī)(LT)的數(shù)學(xué)定理證明程序,1965年,魯賓遜提出消解法(歸結(jié)原理),掀起了研究計(jì)算機(jī)定理證明的又一次高潮第五代計(jì)算機(jī)編程語(yǔ)言專(zhuān)家系統(tǒng)和知識(shí)工程棋類(lèi)博弈自動(dòng)定理證明
1956年,塞繆爾(Samuel)研制成功了跳棋程序。
1997年,IBM公司制造的計(jì)算機(jī)“深藍(lán)”擊敗了國(guó)際象棋大師卡斯帕羅夫,成為人工智能發(fā)展的一個(gè)重要里程碑。
人工智能的崛起歸根于專(zhuān)家系統(tǒng),專(zhuān)家系統(tǒng)是模擬人類(lèi)專(zhuān)家的知識(shí)和經(jīng)驗(yàn)解決特定領(lǐng)域的問(wèn)題的計(jì)算機(jī)系統(tǒng),專(zhuān)家系統(tǒng)在醫(yī)療,化學(xué),地質(zhì)等領(lǐng)域取得成功,專(zhuān)家系統(tǒng)為人工智能走向工程應(yīng)用和實(shí)現(xiàn)理論聯(lián)系實(shí)際具有特別重大的意義
1959年,麥卡錫發(fā)明了表處理語(yǔ)言LISP語(yǔ)言,成為人工智能程序設(shè)計(jì)的主要通用編程語(yǔ)言。當(dāng)今,Python成為人工智能第三代語(yǔ)言。
日本通商產(chǎn)業(yè)省在1982年開(kāi)啟“第五代計(jì)算機(jī)”大型研究計(jì)劃,其目的是造出像人一樣推理的機(jī)器,意欲搶占計(jì)算機(jī)和人工智能前沿領(lǐng)域,但該項(xiàng)目未能達(dá)到預(yù)期目標(biāo)。第五代計(jì)算機(jī)
聯(lián)結(jié)主義以麥卡洛克和皮茨為代表旗手,打造人工神經(jīng)網(wǎng)絡(luò),起源于人腦模型的研究,不斷創(chuàng)新突破,扎實(shí)推進(jìn),現(xiàn)已成為人工智能主陣地
心理學(xué)家赫布(D.Hebb)提出了突觸聯(lián)系效率可變的假設(shè),提出了改變神經(jīng)網(wǎng)絡(luò)連接強(qiáng)度的Hebb規(guī)則。如果兩個(gè)神經(jīng)元同時(shí)被激發(fā),它們之間的聯(lián)系就會(huì)強(qiáng)化,這種假設(shè)就是調(diào)整權(quán)值。
明斯基(M.Minsky)建立了世界上第一個(gè)神經(jīng)網(wǎng)絡(luò)機(jī)器SNARC。明斯基用40個(gè)神經(jīng)元組成的小網(wǎng)絡(luò)模擬了神經(jīng)信號(hào)的傳遞
計(jì)算機(jī)科學(xué)家羅森布拉特(F.Rosenblatt)提出了感知機(jī)(Perception),首次將神經(jīng)網(wǎng)絡(luò)研究付諸工程實(shí)現(xiàn)
霍普菲爾德(J.Hopfield)提出一種全互聯(lián)型人工神經(jīng)網(wǎng)絡(luò),引入能量函數(shù),給出了網(wǎng)絡(luò)穩(wěn)定性判斷依據(jù)D.Rumelhart、G.Hinton(辛頓)和R.Williams等人提出多層網(wǎng)絡(luò)中的反向傳播算法,即BP網(wǎng)絡(luò),解決了多層神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)問(wèn)題,它依然是目前廣泛使用的神經(jīng)網(wǎng)絡(luò)算法1949年1951年1958年1982年1986年1952年香農(nóng)發(fā)明了可以闖迷宮的機(jī)器老鼠,從而研究機(jī)器老鼠是如何通過(guò)自我學(xué)習(xí)找到走出迷宮的路徑。從老鼠的例子中,我們可以清晰的看到機(jī)器智能是在數(shù)據(jù)的基礎(chǔ)上,掌握更多的數(shù)據(jù),通過(guò)一定的策略算法,消除更多的不確定性,讓機(jī)器具有學(xué)習(xí)能力。1991年
布魯克斯研制的機(jī)器昆蟲(chóng)六足蟲(chóng),就是借鑒的自然界的昆蟲(chóng),沒(méi)有復(fù)雜的大腦,也不會(huì)按照傳統(tǒng)的方式進(jìn)行復(fù)雜的推理和知識(shí)表示,僅憑四肢和關(guān)節(jié)的協(xié)調(diào),就能很好的適應(yīng)環(huán)境,把這些昆蟲(chóng)放到復(fù)雜的地形中的時(shí)候,它們可以快速的爬行還能聰明的避開(kāi)障礙物。1975年
霍蘭德提出遺傳算法,遺傳算法是霍蘭德對(duì)大自然中的生物進(jìn)化進(jìn)行了大膽的抽象,他在計(jì)算機(jī)中用一堆二進(jìn)制串來(lái)模擬自然界中的生物體,開(kāi)創(chuàng)了進(jìn)化計(jì)算的先河。
行為主義又稱(chēng)為進(jìn)化論主義學(xué)派,它和符號(hào)主義學(xué)派和聯(lián)結(jié)主義學(xué)派的出發(fā)點(diǎn)不同,它不是把目標(biāo)放在高級(jí)智能的人類(lèi)身上,而是關(guān)注低級(jí)生物智能智能+安防
人工智能涉及的數(shù)據(jù)、通信和計(jì)算三部分內(nèi)容到了21世紀(jì)都發(fā)生了翻天覆地的變化數(shù)據(jù)的爆發(fā)式增長(zhǎng)為人工智能提供了充分的‘養(yǎng)料’,泛在感知數(shù)據(jù)和圖形處理器等計(jì)算平臺(tái)及新型的以深度學(xué)習(xí)為代表的新方法等因素合力造勢(shì)下,人工智能迎來(lái)了它的蓬勃發(fā)展期。
人類(lèi)已經(jīng)正式跨入了人工智能的時(shí)代。1.2.3人工智能+時(shí)代(進(jìn)入21世紀(jì))智能+制造智能+交通智能+醫(yī)療1.3人工智能與自然智能
宇宙演化史上有兩大標(biāo)志性事件:一是出現(xiàn)了人類(lèi),二是出現(xiàn)了器類(lèi),我們正處在器類(lèi)的前夜;器類(lèi)而不是人類(lèi)才是宇宙生態(tài)的先民
自然界智能水平最高的生物是人類(lèi)自身,不但具有很強(qiáng)的生存能力,而且具有感受復(fù)雜環(huán)境、識(shí)別物體、表達(dá)和獲取知識(shí)、進(jìn)行復(fù)雜的思維推理和判斷的能力。1.3.1器類(lèi)與人類(lèi)
人的思維是有自然的局限性的,人工智能就是解除人類(lèi)思維的這種自然局限性,提升思維能力,這正符合科技發(fā)展的規(guī)律,所有這些提升了思維能力的智能機(jī)器,構(gòu)成了器類(lèi)。人工即人造的,人造制品處處可見(jiàn),如人工湖,人工河,人工纖維,人造衛(wèi)星,人工心臟等等,相比以上的人造制品,模擬人類(lèi)自己的智能難度很大,因?yàn)橹悄軟](méi)有嚴(yán)格的定義,所以人工智能的定義也是眾說(shuō)紛紜,無(wú)法統(tǒng)一。通俗的講,人工智能就是用人工的方法在機(jī)器或者是計(jì)算機(jī)上實(shí)現(xiàn)的智能行為,包括:感知、推理、學(xué)習(xí)、通信和復(fù)雜環(huán)境下的動(dòng)作行為,所以人工智能也被稱(chēng)為機(jī)器智能或計(jì)算機(jī)智能。
人工智能不是人類(lèi)的附屬物、也不是宇宙的怪物,只是在智能的某些表現(xiàn)上器類(lèi)優(yōu)于人類(lèi)。器類(lèi)脫胎于人類(lèi)的懷抱,它將與人類(lèi)一樣,誕生、成長(zhǎng)、發(fā)展壯大,沒(méi)有完整生態(tài)的智能器類(lèi),就不會(huì)有徜徉漫步宇宙的人類(lèi),這是必然,也是人類(lèi)的福祉。機(jī)器智能
人工智能的發(fā)展從一開(kāi)始就讓我們喜憂參半,它帶給我們?nèi)碌捏w驗(yàn)之余,同時(shí)也一直是我們的焦慮和恐懼的所在。最早的時(shí)候可能擔(dān)心機(jī)器人不受掌控,會(huì)起兵造反,現(xiàn)在人工智能發(fā)展越來(lái)越精進(jìn),我們的擔(dān)心轉(zhuǎn)變成了害怕被機(jī)器人所取代人類(lèi)的工作。這個(gè)問(wèn)題也一直是社會(huì)熱點(diǎn)話題,我們身處在智能化的時(shí)代,一定要客觀的認(rèn)識(shí)人工智能1.3.2器類(lèi)的未來(lái)機(jī)器人三法則1)機(jī)器人不得傷害人類(lèi),或因不作為使人類(lèi)受到傷害;2)除非違背第一法則,機(jī)器人必須服從人類(lèi)的命令;3)在不違背第一和第二法則的前提下,機(jī)器人必須保護(hù)自己。非常感謝你的觀看Thankyou!人工智能技術(shù)基礎(chǔ)前言大數(shù)據(jù)大數(shù)據(jù)應(yīng)用場(chǎng)景大數(shù)據(jù)概述商業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)應(yīng)用與案例2.1大數(shù)據(jù)應(yīng)用場(chǎng)景
PM2.5云監(jiān)測(cè)平臺(tái)建設(shè)了多個(gè)無(wú)人值守的PM2.5監(jiān)測(cè)站,運(yùn)用光散射法,通過(guò)自帶GPS定位功能的物聯(lián)網(wǎng)節(jié)點(diǎn)電路板,每15秒采集一次PM2.5數(shù)據(jù),自動(dòng)上傳到云端,動(dòng)態(tài)跟蹤、定位環(huán)境污染源及其污染過(guò)程,同時(shí)通過(guò)PM2.5監(jiān)測(cè)云平臺(tái)網(wǎng)頁(yè)如圖所示與相應(yīng)APP查看空氣情況,便于精細(xì)化監(jiān)測(cè)和實(shí)時(shí)預(yù)警。
云創(chuàng)大數(shù)據(jù)通過(guò)與俄羅斯專(zhuān)業(yè)團(tuán)隊(duì)合作,整合納米新材料技術(shù)、物聯(lián)傳感網(wǎng)絡(luò)技術(shù)與大數(shù)據(jù)處理平臺(tái)技術(shù),利用納米復(fù)合薄膜新材料技術(shù)研制高靈敏的納米傳感器,如圖2-2所示,打造小型化多功能水體、氣體檢測(cè)儀,只需將其置于監(jiān)測(cè)環(huán)境幾分鐘,就能快速捕捉污染因子,對(duì)特定氣體、液體進(jìn)行監(jiān)測(cè)、識(shí)別及度量。2.2大數(shù)據(jù)概述
世界正處于一個(gè)信息爆炸的時(shí)代,Internet的出現(xiàn)縮短了人與人、人與世界之間的距離,整個(gè)世界連成一個(gè)“地球村”。人們通過(guò)網(wǎng)絡(luò)可以無(wú)障礙交流、交換信息和協(xié)同工作。與此同時(shí),借助Internet的高速發(fā)展、數(shù)據(jù)庫(kù)技術(shù)的成熟和普及、高內(nèi)存高性能的存儲(chǔ)設(shè)備和存儲(chǔ)介質(zhì)的出現(xiàn),人類(lèi)在日常學(xué)習(xí)、生活、工作中產(chǎn)生的數(shù)據(jù)量正以指數(shù)形式增長(zhǎng),呈現(xiàn)“爆炸”狀態(tài),如圖所示?!按髷?shù)據(jù)問(wèn)題”(BigDataProblem)就是在這樣的背景下產(chǎn)生的,成為科研學(xué)術(shù)界和相關(guān)產(chǎn)業(yè)界的熱門(mén)話題,吸引著越來(lái)越多的科學(xué)家研究大數(shù)據(jù)相關(guān)的問(wèn)題。2.2.1大數(shù)據(jù)產(chǎn)生的背景
從麥肯錫咨詢(xún)公司對(duì)大數(shù)據(jù)的定義,我們可以看出數(shù)據(jù)集的容量不是大數(shù)據(jù)的唯一標(biāo)準(zhǔn)。
持續(xù)增加的數(shù)據(jù)規(guī)模和通過(guò)傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)不能有效的管理是大數(shù)據(jù)的兩個(gè)關(guān)鍵特征。
一般來(lái)說(shuō),大數(shù)據(jù)意味著通過(guò)傳統(tǒng)的軟件或者硬件無(wú)法在有限時(shí)間內(nèi)獲得有意義的數(shù)據(jù)集,而在經(jīng)過(guò)大數(shù)據(jù)技術(shù)處理后就可以快速獲取有意義數(shù)據(jù)。2010年,ApacheHadoop定義大數(shù)據(jù)為“通過(guò)傳統(tǒng)的計(jì)算機(jī)在可接受的范圍內(nèi)不能捕獲、管理和處理的數(shù)據(jù)集合”。2011年5月,麥肯錫咨詢(xún)公司宣稱(chēng)大數(shù)據(jù)能夠在創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力等方面大有作為。大數(shù)據(jù)意味著通過(guò)傳統(tǒng)的數(shù)據(jù)庫(kù)軟件不能獲得、存儲(chǔ)和管理如此大量的數(shù)據(jù)集。2.2.2大數(shù)據(jù)的概念1Byte=8bit1KB=210(Bytes)Kilobyte1MB=220Megabyte1GB=230Gigabyte1TB=240Terabyte1PB=250Petabytes1EB=260Exabytes1ZB=270Zettabyte1YB=280Yottabyte1BB=290Brontobyte1NB=2100Nonabytes1DB=2110Doggabytes
數(shù)據(jù)基本單位是bit(BinaryDigit),由小到大的順序?yàn)椋篵it、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。它們按照進(jìn)率1024(2的十次方)來(lái)計(jì)算:Volume大數(shù)據(jù)的4V特性:
VelocityValueVariety
體量大。采集、存儲(chǔ)、計(jì)算的數(shù)據(jù)量都非常大,比結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)快10倍到50倍,是傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的10倍到50倍。無(wú)法用常規(guī)方法進(jìn)行分析。
樣式多。包括結(jié)構(gòu)化的表格數(shù)據(jù),半結(jié)構(gòu)化的網(wǎng)頁(yè)數(shù)據(jù),非結(jié)構(gòu)化的視頻音頻、日志數(shù)據(jù),地理位置等
價(jià)值密度低。相比尋常少量核心數(shù)據(jù),大數(shù)據(jù)中價(jià)值密度低,需要挖掘數(shù)據(jù)。
處理速度快。大數(shù)據(jù)時(shí)代,需要對(duì)數(shù)據(jù)快速處理,快速得出結(jié)果。
在大數(shù)據(jù)處理流程中,最核心的部分就是對(duì)于數(shù)據(jù)信息的分析處理,所以其中所運(yùn)用到的處理技術(shù)也就至關(guān)重要。提起大數(shù)據(jù)的處理技術(shù),就不得不提起“云計(jì)算”,這是大數(shù)據(jù)處理的基礎(chǔ),也是大數(shù)據(jù)分析的支撐技術(shù)。分布式文件系統(tǒng)為整個(gè)大數(shù)據(jù)提供了底層的數(shù)據(jù)貯存支撐架構(gòu);為了方便數(shù)據(jù)管理,在分布式文件系統(tǒng)的基礎(chǔ)上建立分布式數(shù)據(jù)庫(kù),提高數(shù)據(jù)訪問(wèn)速度;在一個(gè)開(kāi)源的數(shù)據(jù)實(shí)現(xiàn)平臺(tái)上利用各種大數(shù)據(jù)分析技術(shù)可以對(duì)不同種類(lèi)、不同需求的數(shù)據(jù)進(jìn)行分析整理得出有益信息,最終利用各種可視化技術(shù)形象地顯示給數(shù)據(jù)用戶(hù),滿(mǎn)足用戶(hù)的各種需求。2.2.3大數(shù)據(jù)關(guān)鍵技術(shù)
云計(jì)算是一種大規(guī)模的分布式模型,通過(guò)網(wǎng)絡(luò)將抽象的、可伸縮的、便于管理的數(shù)據(jù)、服務(wù)、存儲(chǔ)方式等傳遞給終端用戶(hù)。
目前,云計(jì)算可以認(rèn)為包含3個(gè)層次的內(nèi)容:基礎(chǔ)設(shè)施即服務(wù)(Iaas)、平臺(tái)即服務(wù)(Paas)和軟件即服務(wù)(Saas)云計(jì)算云計(jì)算的三種服務(wù)模式
所謂“云計(jì)算”,“云”其實(shí)是互聯(lián)網(wǎng)的一個(gè)隱喻?!霸朴?jì)算”其實(shí)就是使用互聯(lián)網(wǎng)來(lái)接入存儲(chǔ)或運(yùn)行在遠(yuǎn)程服務(wù)器端的應(yīng)用,數(shù)據(jù),或者服務(wù)。使用云計(jì)算提供的應(yīng)用或服務(wù),可以按照不同的層級(jí)來(lái)
IaaS:Infrastructure-as-a-Service(基礎(chǔ)設(shè)施即服務(wù))
Infrastructure就是基礎(chǔ)設(shè)施的意思,IaaS有時(shí)候也叫Hardware-as-a-Service。就是提供硬件相關(guān)的服務(wù)。以前,你要建個(gè)網(wǎng)站,建個(gè)FTP,需要自己買(mǎi)服務(wù)器和交換機(jī)等硬件設(shè)備,現(xiàn)在不用了,可以使用IaaS服務(wù)商提供的IaaS服務(wù)。
PaaS:Platform-as-a-Service(平臺(tái)即服務(wù))
P就是Platform,平臺(tái)。某些時(shí)候也叫做中間件。基于硬件之上,平臺(tái)開(kāi)發(fā)都可以在這一層進(jìn)行。PaaS服務(wù)提供商提供各種開(kāi)發(fā)和分發(fā)應(yīng)用的解決方案,比如虛擬服務(wù)器和操作系統(tǒng),以及數(shù)據(jù)庫(kù)系統(tǒng)等。
SaaS:Software-as-a-Service(軟件即服務(wù))
這一層是和你的生活每天接觸的一層,在這一層上,就可以直接訪問(wèn)和使用服務(wù)功能了!例如通過(guò)網(wǎng)頁(yè)瀏覽器收發(fā)電郵,訂購(gòu)商品,查看航班信息等。在你的面前,就是具體的應(yīng)用服務(wù)。
Map(映射)Reduce(歸約)
當(dāng)前的軟件實(shí)現(xiàn)是指定一個(gè)Map(映射)函數(shù),用來(lái)把一組鍵值對(duì)映射成一組新的鍵值對(duì),指定并發(fā)的Reduce(歸約)函數(shù),用來(lái)保證所有映射的鍵值對(duì)中的每一個(gè)共享相同的鍵組MapReduce技術(shù)
MapReduce是面向大數(shù)據(jù)并行處理的計(jì)算模型、框架和平臺(tái)它包含以下三層含義:
1.MapReduce是一個(gè)基于集群的高性能并行計(jì)算平臺(tái)(ClusterInfrastructure)。
2.MapReduce是一個(gè)并行計(jì)算與運(yùn)行軟件框架(SoftwareFramework)。
3.MapReduce是一個(gè)并行程序設(shè)計(jì)模型與方法(ProgrammingModel&Methodology)MapReduce的核心思想在于“分而治之”
首先將數(shù)據(jù)源分為若干部分,每個(gè)部分對(duì)應(yīng)一個(gè)初始的鍵-值(Key/Value)對(duì),并分別給不同的Map任務(wù)區(qū)處理,這時(shí)的Map對(duì)初始的鍵-值(Key/Value)對(duì)進(jìn)行處理,產(chǎn)生一系列中間結(jié)果Key/Value對(duì),MapReduce的中間過(guò)程shuffle將所有具有相同Key值的value值組成一個(gè)集合傳遞給reduce環(huán)節(jié);value接收這些中間結(jié)果,并將相同的value值合并,形成最終的較小value值的集合,如圖所示。
MapReduce系統(tǒng)的提出簡(jiǎn)化了數(shù)據(jù)的計(jì)算過(guò)程,避免了數(shù)據(jù)傳輸過(guò)程中大量的通信開(kāi)銷(xiāo),使得MapReduce可以運(yùn)用到多種實(shí)際問(wèn)題的解決方案里,公布之后獲得了極大的關(guān)注,在各個(gè)領(lǐng)域均有廣泛的應(yīng)用。
在Google之前,沒(méi)有哪一個(gè)公司曾需要處理數(shù)量如此多、種類(lèi)如此繁雜的數(shù)據(jù),因此,Google公司結(jié)合自己的實(shí)際應(yīng)用情況,自行開(kāi)發(fā)了一種分布式文件系統(tǒng)GFS,如圖所示。分布式文件系統(tǒng)(HDFS)
大數(shù)據(jù)時(shí)代對(duì)于數(shù)據(jù)分析、管理都提出了不同程度的新要求,許多傳統(tǒng)的數(shù)據(jù)分析技術(shù)和數(shù)據(jù)庫(kù)技術(shù)已經(jīng)不足以滿(mǎn)足現(xiàn)代數(shù)據(jù)應(yīng)用的需求為了給大數(shù)據(jù)處理分析提供一個(gè)性能更高、可靠性更好的平臺(tái),Dougcutting模仿GFS,為MapReduce開(kāi)發(fā)了一個(gè)云計(jì)算開(kāi)源平臺(tái)Hadoop,用JAVA編寫(xiě),可移植性強(qiáng).
現(xiàn)在Hadoop已經(jīng)發(fā)展為一個(gè)包括分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)以及數(shù)據(jù)分析處理MapReduce等功能模塊在內(nèi)的完整生態(tài)系統(tǒng)(Ecosystem),現(xiàn)已經(jīng)發(fā)展成為目前最流行的大數(shù)據(jù)處理平臺(tái)。HadoopHadoop的框架最核心的就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),MapReduce為海量的數(shù)據(jù)提供了計(jì)算。大數(shù)據(jù)在Hadoop的處理流程:數(shù)據(jù)是通過(guò)了Hadoop的集群處理后得到的結(jié)果
大文件被分成默認(rèn)64M一塊的數(shù)據(jù)塊分布存儲(chǔ)在集群機(jī)器中。
如圖中的文件data1被分成3塊,這3塊以冗余鏡像的方式分布在不同的機(jī)器中。
MapReduce:Hadoop為每一個(gè)inputsplit創(chuàng)建一個(gè)task調(diào)用Map計(jì)算,在此task中依次處理此split中的一個(gè)個(gè)記錄(record),map會(huì)將結(jié)果以key--value的形式輸出,hadoop負(fù)責(zé)按key值將map的輸出整理后作為Reduce的輸入,ReduceTask的輸出為整個(gè)job的輸出,保存在HDFS上.
NameNode中記錄了文件是如何被拆分成block以及這些block都存儲(chǔ)到了哪些DateNode節(jié)點(diǎn)。
NameNode同時(shí)保存了文件系統(tǒng)運(yùn)行的狀態(tài)信息。
DataNode中存儲(chǔ)的是被拆分的blocks。
SecondaryNameNode幫助NameNode收集文件系統(tǒng)運(yùn)行的狀態(tài)信息。
JobTracker當(dāng)有任務(wù)提交到Hadoop集群的時(shí)候負(fù)責(zé)Job的運(yùn)行,負(fù)責(zé)調(diào)度多個(gè)TaskTracker。
TaskTracker負(fù)責(zé)某一個(gè)map或者reduce任務(wù)。Hadoop組成:Hadoop1.x
MapReduce同時(shí)處理業(yè)務(wù)邏輯運(yùn)算和資源調(diào)度,耦合性高Hadoop2.x進(jìn)行改進(jìn),增加Yarn,Yarn負(fù)責(zé)任務(wù)調(diào)度,MapReduce負(fù)責(zé)運(yùn)算大數(shù)據(jù)生態(tài)什么是集群集群技術(shù)特點(diǎn):·通過(guò)多臺(tái)計(jì)算機(jī)完成同一個(gè)工作,達(dá)到更高的效率·兩機(jī)或多機(jī)內(nèi)容、工作過(guò)程完全一樣,如果一臺(tái)死機(jī),另一臺(tái)可以起作用集群:同一個(gè)業(yè)務(wù)部署在多個(gè)服務(wù)器上(不同的服務(wù)器運(yùn)行同樣的代碼,完成同樣的工作)舉個(gè)例子小周在公司寫(xiě)Java程序,但公司業(yè)務(wù)在發(fā)展,一個(gè)Java開(kāi)發(fā)者可能忙不過(guò)來(lái),小周有的時(shí)候也得請(qǐng)個(gè)假呀。于是請(qǐng)了小劉過(guò)去一起做Java開(kāi)發(fā)。平時(shí)小周和小劉就寫(xiě)Java程序,但小劉可能有事要回學(xué)校一趟。沒(méi)事,公司還有小周做Java開(kāi)發(fā)呢,公司開(kāi)發(fā)還能繼續(xù)運(yùn)作。
小劉跟小周都是做Java開(kāi)發(fā)。小劉來(lái)了,小周的工作可以分擔(dān)一些。小劉請(qǐng)假了,還有小周在呢。我寫(xiě)了一個(gè)910便利網(wǎng)發(fā)布到服務(wù)器去了,現(xiàn)在越來(lái)越多的人訪問(wèn)了,訪問(wèn)有點(diǎn)慢,怎么辦???很簡(jiǎn)單,(只有充錢(qián)才能變強(qiáng)),加配置吧(加cpu,加內(nèi)存)。升級(jí)完配置之后,訪問(wèn)人數(shù)越來(lái)越多,于是發(fā)現(xiàn)又不禁用啦,在這臺(tái)機(jī)器上加配置已經(jīng)解決不了了,怎么辦???很簡(jiǎn)單,(只有充錢(qián)才能變強(qiáng)),我再買(mǎi)一臺(tái)服務(wù)器,將910便利網(wǎng)也發(fā)布到新買(mǎi)的這臺(tái)服務(wù)器上去。特點(diǎn):
這兩臺(tái)服務(wù)器都是運(yùn)行同一個(gè)系統(tǒng)——910便利網(wǎng)好處:
·本來(lái)只有一臺(tái)機(jī)器處理訪問(wèn),現(xiàn)在多了一臺(tái),分擔(dān)了壓力
·如果其中一臺(tái)忘記繳費(fèi)了,暫時(shí)用不了了,還有另外一臺(tái)什么是分布式分布式:
分布式系統(tǒng)是一組計(jì)算機(jī),通過(guò)網(wǎng)絡(luò)相互連接傳遞消息與通信后并協(xié)調(diào)它們的行為而形成的系統(tǒng)。組件之間彼此進(jìn)行交互以實(shí)現(xiàn)一個(gè)共同的目標(biāo)。
一個(gè)業(yè)務(wù)分拆多個(gè)子業(yè)務(wù),部署在不同的服務(wù)器上(不同的服務(wù)器,運(yùn)行不同的代碼,為了同一個(gè)目的)舉個(gè)例子
現(xiàn)在公司有小周和小劉一起做Java開(kāi)發(fā),做Java開(kāi)發(fā)一般jQuery,AJAX都能寫(xiě)一點(diǎn),所以這些活都由我們來(lái)干??墒悄?,小劉對(duì)前端不是很熟,有的時(shí)候調(diào)試半天都調(diào)不出來(lái)。老板認(rèn)為小劉是真的菜!于是讓小周專(zhuān)門(mén)來(lái)處理前端的事情。這樣小劉就高興了,可以專(zhuān)心寫(xiě)自己的Java,前端就專(zhuān)門(mén)交由小周負(fù)責(zé)了。于是,小周和小劉就變成了協(xié)作開(kāi)發(fā)。
小劉對(duì)前端不熟,在調(diào)試的時(shí)候可能會(huì)花費(fèi)很多時(shí)間,小周來(lái)專(zhuān)門(mén)做前端的事,小劉可以專(zhuān)心寫(xiě)自己的Java程序了。都是為了項(xiàng)目正常運(yùn)行以及迭代。
我的910便利網(wǎng)已經(jīng)部署到兩臺(tái)服務(wù)器去了,但是越來(lái)越多的人去訪問(wèn)?,F(xiàn)在也逐漸承受不住啦。那現(xiàn)在怎么辦?。??那繼續(xù)充錢(qián)變強(qiáng)??作為一個(gè)理智的我,肯定得想想是哪里有問(wèn)題?,F(xiàn)在910便利網(wǎng)的模塊有好幾個(gè),全都丟在同一個(gè)Tomcat里邊。
其實(shí)有些模塊的訪問(wèn)是很低的(比如后臺(tái)管理),那我可不可以這樣做:將每個(gè)模塊抽取獨(dú)立出來(lái),訪問(wèn)量大的模塊用好的服務(wù)器裝著,沒(méi)啥人訪問(wèn)的模塊用差的服務(wù)器裝著。這樣的好處是:一、資源合理利用了(沒(méi)人訪問(wèn)的模塊用性能差的服務(wù)器,訪問(wèn)量大的模塊單獨(dú)提升性能就好了)。二、耦合度降低了:每個(gè)模塊獨(dú)立出來(lái),各干各的事(專(zhuān)業(yè)的人做專(zhuān)業(yè)的事),便于擴(kuò)展。特點(diǎn):將910便利網(wǎng)的功能拆分,模塊之間獨(dú)立,在使用的時(shí)候再將這些獨(dú)立的模塊組合起來(lái)就是一個(gè)系統(tǒng)了。好處:
·模塊之間獨(dú)立,各做各的事,便于擴(kuò)展,復(fù)用性高
·高吞吐量。某個(gè)任務(wù)需要一個(gè)機(jī)器運(yùn)行10個(gè)小時(shí),將該任務(wù)用10臺(tái)機(jī)器的分布式跑(將這個(gè)任務(wù)拆分成10個(gè)小任務(wù)),可能2個(gè)小時(shí)就跑完了哈希方式:
按照數(shù)據(jù)的某一特征計(jì)算哈希值,并將哈希值與機(jī)器中的機(jī)器建立映射關(guān)系,從而將不同哈希值的數(shù)據(jù)分布到不同的機(jī)器上。特征就是key-value中的key,也可以是其他與應(yīng)用業(yè)務(wù)邏輯相關(guān)的值。數(shù)據(jù)分布方式一致性哈希:
一致性哈希的基本方式是使用一個(gè)哈希函數(shù)計(jì)算數(shù)據(jù)或數(shù)據(jù)特征的哈希值,使得哈希函數(shù)的輸出值域?yàn)橐粋€(gè)封閉的環(huán),也就是說(shuō)哈希函數(shù)的輸出最大值是最小值的前序,將節(jié)點(diǎn)隨機(jī)分布到這個(gè)環(huán)上,每個(gè)節(jié)點(diǎn)負(fù)責(zé)處理從自己開(kāi)始順時(shí)針至下一個(gè)節(jié)點(diǎn)的全部哈希值域上的數(shù)據(jù)數(shù)據(jù)分布方式2.3商業(yè)大數(shù)據(jù)
市場(chǎng)調(diào)研中經(jīng)常需要各種數(shù)據(jù)證明觀點(diǎn),或者從大數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,那么有哪些可以使用的數(shù)據(jù)來(lái)源。目前常用的數(shù)據(jù)源如表所示:2.2.1商業(yè)大數(shù)據(jù)來(lái)源1.數(shù)據(jù)分析2.2.2商業(yè)大數(shù)據(jù)分析
①數(shù)據(jù)獲取及儲(chǔ)存,從各種感知工具中獲取的數(shù)據(jù)通常與空間時(shí)空相關(guān),需要及時(shí)分析技術(shù)處理數(shù)據(jù)并過(guò)濾無(wú)用數(shù)據(jù);
②數(shù)據(jù)信息抽取及無(wú)用信息的清洗,從異構(gòu)的數(shù)據(jù)源當(dāng)中抽取有用的信息,然后轉(zhuǎn)化為統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù)格式;
③數(shù)據(jù)整合及表示,將數(shù)據(jù)結(jié)構(gòu)和語(yǔ)義關(guān)系轉(zhuǎn)換為機(jī)器能夠讀取理解的格式;
④數(shù)據(jù)模型的建立和結(jié)果分析,從數(shù)據(jù)中挖掘出潛在的規(guī)律及信息知識(shí),需要相應(yīng)的數(shù)據(jù)挖掘算法或知識(shí)發(fā)現(xiàn)方法;
⑤結(jié)果闡釋?zhuān)\(yùn)用可視化技術(shù)對(duì)結(jié)果進(jìn)行展示,方便用戶(hù)更加清楚直觀地理解。2.活動(dòng)步驟①識(shí)別目標(biāo)需求
首先必須明確數(shù)據(jù)分析的目標(biāo)需求,從而為數(shù)據(jù)的收集和分析提供清晰方向,該步驟是數(shù)據(jù)分析有效性的首要條件。②采集數(shù)據(jù)
目標(biāo)需求明確之后,就要運(yùn)用合適的方法來(lái)有效收集盡可能多的相關(guān)數(shù)據(jù),從而為數(shù)據(jù)分析過(guò)程的順利進(jìn)行打下基礎(chǔ)。③數(shù)據(jù)預(yù)處理
通過(guò)多種方式采集上來(lái)的數(shù)據(jù)通常是雜亂無(wú)章,高度冗余并且有一定缺失。如果直接對(duì)此類(lèi)數(shù)據(jù)進(jìn)行分析,不僅會(huì)耗費(fèi)大量時(shí)間精力,而且分析得到的結(jié)果也不準(zhǔn)確。為此,需要對(duì)數(shù)據(jù)進(jìn)行必要的預(yù)處理。④數(shù)據(jù)挖掘
數(shù)據(jù)挖據(jù)的目的是在現(xiàn)有數(shù)據(jù)基礎(chǔ)之上利用各類(lèi)有效的算法挖據(jù)出數(shù)據(jù)中隱含的有價(jià)值信息,從而達(dá)到分析推理和預(yù)測(cè)的效果,實(shí)現(xiàn)預(yù)定的高層次數(shù)據(jù)分析需求。3.分析數(shù)據(jù)
在完成對(duì)數(shù)據(jù)的各類(lèi)處理之后,接下來(lái)最重要的任務(wù)就是根據(jù)既定的目標(biāo)需求對(duì)數(shù)據(jù)處理結(jié)果進(jìn)行分析,目前,大數(shù)據(jù)的分析主要依靠4項(xiàng)技術(shù):統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和可視化分析。
統(tǒng)計(jì)分析基于統(tǒng)計(jì)理論,屬于應(yīng)用數(shù)學(xué)的一個(gè)分支。在統(tǒng)計(jì)理論中隨機(jī)性和不確定性由概率理論建模。
數(shù)據(jù)挖掘可以認(rèn)為是發(fā)現(xiàn)大數(shù)據(jù)集中數(shù)據(jù)模式的一種計(jì)算過(guò)程。許多數(shù)據(jù)挖掘算法已經(jīng)在機(jī)器學(xué)習(xí)、人工智能、模式識(shí)別、統(tǒng)計(jì)和數(shù)據(jù)庫(kù)領(lǐng)域得到了應(yīng)用。
機(jī)器學(xué)習(xí)是一門(mén)研究機(jī)器獲取新知識(shí)和新技能,并識(shí)別現(xiàn)有知識(shí)的學(xué)問(wèn),其理論主要是設(shè)計(jì)和分析一些讓計(jì)算機(jī)可以自動(dòng)“學(xué)習(xí)”的算法,機(jī)器學(xué)習(xí)算法從數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。
可視化分析與信息繪圖學(xué)和信息可視化相關(guān)。數(shù)據(jù)可視化的目標(biāo)是以圖形方式清晰有效地展示信息,從而便于解釋數(shù)據(jù)之間的特征和屬性情況。2.4工業(yè)大數(shù)據(jù)2.4.1工業(yè)大數(shù)據(jù)內(nèi)涵IndustrialBigData
工業(yè)大數(shù)據(jù)是指在工業(yè)領(lǐng)域中,圍繞典型智能制造模式,從客戶(hù)需求到銷(xiāo)售、訂單、計(jì)劃、研發(fā)、設(shè)計(jì)、工藝、制造、采購(gòu)、供應(yīng)、庫(kù)存、發(fā)貨和交付、售后服務(wù)、運(yùn)維、報(bào)廢或回收再制造等整個(gè)產(chǎn)品全生命周期各個(gè)環(huán)節(jié)所產(chǎn)生的各類(lèi)數(shù)據(jù)及相關(guān)技術(shù)和應(yīng)用的總稱(chēng)。外部數(shù)據(jù)·與企業(yè)活動(dòng)相關(guān)的外部數(shù)據(jù)·環(huán)境/宏觀經(jīng)濟(jì)/市場(chǎng)需求走向等生產(chǎn)經(jīng)營(yíng)·傳統(tǒng)企業(yè)信息化系統(tǒng)內(nèi)包含的信息·ERP/PLM/SCM,CAD/GAE設(shè)備物聯(lián)·被認(rèn)為是狹義的“工業(yè)大數(shù)據(jù)”·工業(yè)4.0/智能制造等主要方向中國(guó)法國(guó)德國(guó)美國(guó)《2014年全球大數(shù)據(jù)白皮書(shū)》,2018年《美國(guó)先進(jìn)制造領(lǐng)導(dǎo)戰(zhàn)略》2015年,“新工業(yè)法國(guó)計(jì)劃”2017年1月,工業(yè)和信息化部《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》2015年4月,“工業(yè)4.0計(jì)劃”2.4.2工業(yè)大數(shù)據(jù)發(fā)展現(xiàn)狀2.4.3工業(yè)大數(shù)據(jù)的關(guān)鍵技術(shù)(1)平臺(tái)架構(gòu)(2)數(shù)據(jù)平臺(tái)(3)采集技術(shù)
工業(yè)大數(shù)據(jù)技術(shù)參考架構(gòu)以工業(yè)大數(shù)據(jù)的全生命周期為主線,從縱向維度分為平臺(tái)/工具域和應(yīng)用/服務(wù)域。
工業(yè)大數(shù)據(jù)平臺(tái)是工業(yè)大數(shù)據(jù)技術(shù)具體應(yīng)用的載體,是推進(jìn)工業(yè)大數(shù)據(jù)技術(shù)深度應(yīng)用、提升工業(yè)大數(shù)據(jù)在產(chǎn)業(yè)中整體發(fā)展水平的重要基石。
數(shù)據(jù)采集方面,以傳感器為主要采集工具,結(jié)合RFID、條碼掃描器、生產(chǎn)和監(jiān)測(cè)設(shè)備、PDA、人機(jī)交互、智能終端等手段采集制造領(lǐng)域多源、異構(gòu)數(shù)據(jù)信息,并通過(guò)互聯(lián)網(wǎng)或現(xiàn)場(chǎng)總線等技術(shù)實(shí)現(xiàn)原始數(shù)據(jù)的實(shí)時(shí)準(zhǔn)確傳輸。2.4.3工業(yè)大數(shù)據(jù)的關(guān)鍵技術(shù)(4)存儲(chǔ)技術(shù)(5)模態(tài)數(shù)據(jù)集成技術(shù)
工業(yè)大數(shù)據(jù)存儲(chǔ)與管理技術(shù)是針對(duì)工業(yè)大數(shù)據(jù)具有多樣性、多模態(tài)、高通量和強(qiáng)關(guān)聯(lián)等特性,研發(fā)的面向高吞吐量存儲(chǔ)、數(shù)據(jù)壓縮、數(shù)據(jù)索引、查詢(xún)優(yōu)化和數(shù)據(jù)緩存等能力的關(guān)鍵技術(shù)。工業(yè)大數(shù)據(jù)存儲(chǔ)與管理技術(shù)主要有多源異構(gòu)數(shù)據(jù)高效管理技術(shù)和多模態(tài)數(shù)據(jù)集成技術(shù)兩類(lèi)關(guān)鍵技術(shù)。
工業(yè)大數(shù)據(jù)來(lái)源十分廣泛,包括但不限于研發(fā)環(huán)節(jié)的非結(jié)構(gòu)化工程數(shù)據(jù)、傳統(tǒng)的企業(yè)信息管理系統(tǒng)、服務(wù)維修數(shù)據(jù)和產(chǎn)品服役過(guò)程中產(chǎn)生的機(jī)器數(shù)據(jù)等。這些數(shù)據(jù)格式異構(gòu)、語(yǔ)義復(fù)雜且版本多變。2.5應(yīng)用與案例2.5.1H3C大數(shù)據(jù)系統(tǒng)在高校大學(xué)生管理中的應(yīng)用
RBE-BDAS通過(guò)對(duì)學(xué)校人物(教師、學(xué)生等)與事件模型進(jìn)行模式行為識(shí)別,挖掘人物事件之間隱藏的關(guān)系,為智慧校園、平安校園提供強(qiáng)有力的支撐。
學(xué)生版,通過(guò)對(duì)學(xué)生平時(shí)的課堂、學(xué)習(xí)、吃住等資料的分析,對(duì)管理好學(xué)生,維持學(xué)校穩(wěn)定,全面掌握學(xué)生情況,以便及時(shí)、準(zhǔn)確地應(yīng)對(duì)突發(fā)事件與公共危機(jī),及早識(shí)別學(xué)業(yè)預(yù)警、心理異常、沉迷游戲的學(xué)生,提升學(xué)生素質(zhì)起到重要作用。2.5.2西北某大學(xué)大數(shù)據(jù)分析系統(tǒng)建設(shè)案例(1)建設(shè)方案
搭建以大數(shù)據(jù)基礎(chǔ)平臺(tái),建設(shè)Hadoop大數(shù)據(jù)存儲(chǔ)和計(jì)算框架、MPP分布式數(shù)據(jù)庫(kù),采用離線計(jì)算引擎、流式計(jì)算引擎和分布式數(shù)據(jù)庫(kù)引擎融合技術(shù)架構(gòu),進(jìn)行海量數(shù)據(jù)的存儲(chǔ)和計(jì)算,支持未來(lái)大數(shù)據(jù)應(yīng)用的不斷擴(kuò)展。
具體包括,學(xué)生板塊,包含學(xué)生概況、學(xué)生畫(huà)像、學(xué)業(yè)預(yù)警、沉迷游戲、疑似貧困、疑似失聯(lián)、孤僻人群等分析;教師板塊,包含關(guān)鍵指標(biāo)預(yù)警(科研項(xiàng)目進(jìn)度、科研論文、教學(xué)過(guò)程、教學(xué)質(zhì)量)(2)建設(shè)效果
通過(guò)大數(shù)據(jù)分析平臺(tái),該大學(xué)整合了校內(nèi)已有數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘、建模與關(guān)聯(lián)分析,實(shí)現(xiàn)了對(duì)學(xué)生的精細(xì)化管理,同時(shí)對(duì)教師的關(guān)鍵指標(biāo)進(jìn)行可視化管理,方便校領(lǐng)導(dǎo)通過(guò)全量數(shù)據(jù)實(shí)現(xiàn)科學(xué)決策2.5.3西北民族大學(xué)智慧校園項(xiàng)目案例(1)建設(shè)方案(2)建設(shè)具體內(nèi)容(3)建設(shè)效果學(xué)科大數(shù)據(jù)對(duì)學(xué)科進(jìn)行了分析,幫助學(xué)校進(jìn)行自我診斷,為今后發(fā)展提供了依據(jù)論文影響力校外人員挖掘
校際競(jìng)爭(zhēng)力
學(xué)科知識(shí)圖譜爬取與學(xué)生專(zhuān)業(yè)相關(guān)招聘數(shù)據(jù),深入挖局分析構(gòu)建崗位能力模型,如圖所示。分析學(xué)生專(zhuān)業(yè)技能、溝通、文檔讀寫(xiě)、證書(shū)、社會(huì)實(shí)踐等方面的能力并與崗位模型進(jìn)行對(duì)比。通過(guò)對(duì)比結(jié)論為學(xué)生的就業(yè)、能力提升及學(xué)校專(zhuān)業(yè)調(diào)整供參考。大數(shù)據(jù)做什么大數(shù)據(jù)現(xiàn)象是怎樣形成的大數(shù)據(jù)與云計(jì)算
大數(shù)據(jù)干的事情其實(shí)就兩件:提供分布式存儲(chǔ)與分布式計(jì)算的解決方案。(1)數(shù)據(jù)產(chǎn)生方式的改變(2)人類(lèi)的活動(dòng)越來(lái)越依賴(lài)數(shù)據(jù)(3)各行各業(yè)也越來(lái)越依賴(lài)大數(shù)據(jù)手段來(lái)開(kāi)展工作當(dāng)數(shù)據(jù)量、數(shù)據(jù)的復(fù)雜程度、數(shù)據(jù)處理的任務(wù)要求等超出了傳統(tǒng)數(shù)據(jù)存儲(chǔ)與計(jì)算能力時(shí),稱(chēng)之為“大數(shù)據(jù)(現(xiàn)象)”。
大數(shù)據(jù)和云計(jì)算的關(guān)系猶如一枚硬幣的正反面有密不可分的關(guān)系。單臺(tái)計(jì)算的處理無(wú)法滿(mǎn)足大數(shù)據(jù)的需要,只有依托云計(jì)算的分布式處理,采用分布式數(shù)據(jù)庫(kù)、虛擬化技術(shù)和云存儲(chǔ),構(gòu)建分布式架構(gòu),對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,才能發(fā)揮大數(shù)據(jù)的作用。非常感謝你的觀看Thankyou!人工智能技術(shù)基礎(chǔ)前言目錄機(jī)器學(xué)習(xí)應(yīng)用場(chǎng)景數(shù)據(jù)驅(qū)動(dòng)AIK近鄰(KNN)K-Means聚類(lèi)應(yīng)用與案例3.1機(jī)器學(xué)習(xí)應(yīng)用場(chǎng)景鳶尾花分類(lèi)
假設(shè)有一名植物學(xué)家對(duì)她發(fā)現(xiàn)的鳶尾花的品種很感興趣,她收集了每朵鳶尾花的一些測(cè)量數(shù)據(jù):花瓣的長(zhǎng)度和寬度以及花萼的長(zhǎng)度和寬度,所有測(cè)量結(jié)果的單位都是厘米,如圖所示。鳶尾花花瓣(petal)和花萼(sepal)
她還有一些鳶尾花的測(cè)量數(shù)據(jù),這些花之前已經(jīng)被植物學(xué)專(zhuān)家鑒定為屬于setosa(山鳶尾)、versicolor(變色鳶尾)或virginica(維吉尼亞鳶尾)三個(gè)品種之一,如圖所示。通過(guò)這些測(cè)量數(shù)據(jù),她可以確定每朵鳶尾花所屬的品種。我們假設(shè)這位植物學(xué)愛(ài)好者在野外只會(huì)遇到這三種鳶尾花。
我們的目標(biāo)是構(gòu)建一個(gè)機(jī)器學(xué)習(xí)模型,可以從這些已知品種的鳶尾花測(cè)量數(shù)據(jù)中進(jìn)行學(xué)習(xí),從而能夠預(yù)測(cè)新鳶尾花的品種。
因?yàn)槲覀冇幸阎贩N的鳶尾花的測(cè)量數(shù)據(jù),所以這是一個(gè)監(jiān)督學(xué)習(xí)問(wèn)題。在這個(gè)問(wèn)題中,我們要將這些測(cè)量數(shù)據(jù)按一定方法區(qū)分開(kāi),這是一個(gè)分類(lèi)(classification)問(wèn)題,數(shù)據(jù)集中的每朵鳶尾花都屬于三個(gè)類(lèi)別之一,所以這是一個(gè)三分類(lèi)問(wèn)題??赡艿妮敵觯S尾花的不同品種)叫作類(lèi)別(class)。單個(gè)數(shù)據(jù)點(diǎn)(一朵鳶尾花)的預(yù)期輸出是這朵花的品種,對(duì)于一個(gè)數(shù)據(jù)點(diǎn)來(lái)說(shuō),它的品種叫作標(biāo)簽(label)。3.2數(shù)據(jù)驅(qū)動(dòng)AI3.2.1傳感器和海量數(shù)據(jù)傳感器是獲取自然和生產(chǎn)領(lǐng)域中信息的主要途徑與手段。設(shè)備中的傳感器會(huì)產(chǎn)生前所未有的海量數(shù)據(jù)2020年,預(yù)計(jì)有35ZB的數(shù)據(jù)產(chǎn)生,也就是2009年數(shù)據(jù)量的44倍,到時(shí)候,不管是結(jié)構(gòu)化的或更可能是沒(méi)有結(jié)構(gòu)化的數(shù)據(jù)都可以通過(guò)機(jī)器來(lái)處理,從而獲得大量洞見(jiàn)?,F(xiàn)在的海量數(shù)據(jù)和計(jì)算能力都在驅(qū)使機(jī)器學(xué)習(xí)的突破。機(jī)器學(xué)習(xí)的十足威力,看看Google就知道了。Google就是利用機(jī)器學(xué)習(xí),把法國(guó)每一個(gè)企業(yè)的位置、每一個(gè)住房、每一條街都繪制在地圖上了,整個(gè)過(guò)程只需1個(gè)小時(shí)。3.2.2什么是機(jī)器學(xué)習(xí)
第一個(gè)機(jī)器學(xué)習(xí)的定義來(lái)自于亞瑟·塞繆爾(ArthurSamuel)。他定義機(jī)器學(xué)習(xí):在進(jìn)行特定編程的情況下,給予計(jì)算機(jī)學(xué)習(xí)能力的領(lǐng)域。
第二個(gè)定義來(lái)自卡內(nèi)基梅隆大學(xué)TomMitchell定義的機(jī)器學(xué)習(xí):一個(gè)好的學(xué)習(xí)問(wèn)題定義如下,一個(gè)程序被認(rèn)為能從經(jīng)驗(yàn)E中學(xué)習(xí),解決任務(wù)T,達(dá)到性能度量值P,當(dāng)且僅當(dāng),有了經(jīng)驗(yàn)E后,經(jīng)過(guò)P評(píng)判,程序在處理T時(shí)的性能有所提升。這個(gè)定義在學(xué)術(shù)界內(nèi)被多次引用。在垃圾郵件分類(lèi)問(wèn)題中,“一個(gè)程序”指的是需要用到的機(jī)器學(xué)習(xí)算法,比如邏輯回歸算法;“任務(wù)T”是指區(qū)分垃圾郵件的任務(wù);“經(jīng)驗(yàn)E”為已經(jīng)區(qū)分過(guò)是否為垃圾郵件的歷史郵件,在監(jiān)督式機(jī)器學(xué)習(xí)問(wèn)題中,這也被稱(chēng)之為訓(xùn)練數(shù)據(jù);“效果P”為機(jī)器學(xué)習(xí)算法在區(qū)分是否為垃圾郵件任務(wù)上的正確率。通過(guò)垃圾郵件分類(lèi)的問(wèn)題來(lái)解釋機(jī)器學(xué)習(xí)的定義。3.2.3監(jiān)督式/無(wú)監(jiān)督式學(xué)習(xí)機(jī)器學(xué)習(xí)采用兩種類(lèi)型的技術(shù)監(jiān)督式學(xué)習(xí)根據(jù)已知的輸入和輸出訓(xùn)練模型,讓模型能夠預(yù)測(cè)未來(lái)輸出無(wú)監(jiān)督學(xué)習(xí)從輸入數(shù)據(jù)中找出隱藏模式或內(nèi)在結(jié)構(gòu)
監(jiān)督式機(jī)器學(xué)習(xí)能夠根據(jù)已有的包含不確定性的數(shù)據(jù)建立一個(gè)預(yù)測(cè)模型。監(jiān)督式學(xué)習(xí)算法接受已知的輸入數(shù)據(jù)集(包含預(yù)測(cè)變量)和對(duì)該數(shù)據(jù)集的已知響應(yīng)(輸出,響應(yīng)變量),然后訓(xùn)練模型,使模型能夠?qū)π螺斎霐?shù)據(jù)的響應(yīng)做出合理的預(yù)測(cè)。如果您嘗試去預(yù)測(cè)已知數(shù)據(jù)的輸出,則使用監(jiān)督式學(xué)習(xí)。監(jiān)督式學(xué)習(xí)什么是監(jiān)督式學(xué)習(xí)?
如果你在別人的監(jiān)督之下學(xué)習(xí),有人會(huì)當(dāng)場(chǎng)評(píng)判您是否得出了正確答案。同樣,在監(jiān)督式學(xué)習(xí)中,訓(xùn)練算法時(shí)同樣需要一整套帶有標(biāo)記的數(shù)據(jù)。完全標(biāo)記意味著訓(xùn)練數(shù)據(jù)集中的每個(gè)示例都標(biāo)記相對(duì)應(yīng)的類(lèi)別。因此,一個(gè)由花朵圖像組成的有標(biāo)記數(shù)據(jù)集會(huì)告知模型哪些圖片是玫瑰、哪些圖片是雛菊或者水仙。在“看到”新圖像時(shí),模型會(huì)將其與訓(xùn)練示例進(jìn)行比較,以給出正確的標(biāo)記。在監(jiān)督式機(jī)器學(xué)習(xí)中,算法需要通過(guò)有標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。
監(jiān)督式學(xué)習(xí)中鳶尾花數(shù)據(jù)在人工智能眼里的樣子。在類(lèi)別信息的指導(dǎo)下,我們很容易就能找到一條最優(yōu)的直線,將特征空間一分為二,使變色鳶尾和山鳶尾各居一隅監(jiān)督式學(xué)習(xí)兩個(gè)主要的應(yīng)用領(lǐng)域回歸問(wèn)題分類(lèi)問(wèn)題
分類(lèi)問(wèn)題要求算法可以預(yù)測(cè)離散值,將輸入數(shù)據(jù)標(biāo)識(shí)為特定類(lèi)或組的成員。在由動(dòng)物圖像組成的訓(xùn)練數(shù)據(jù)集中,這意味著每張照片已被預(yù)先標(biāo)記為貓、考拉或海龜?shù)?。然后,算法的評(píng)估標(biāo)準(zhǔn)為,算法對(duì)其他考拉和海龜?shù)男聢D像進(jìn)行分類(lèi)的準(zhǔn)確程度。
回歸問(wèn)題則要求算法基于連續(xù)數(shù)據(jù)。比如線性回歸:給出一個(gè)特定的x值,求y變量的值。
溫度的變化或電力需求中的波動(dòng)。典型的應(yīng)用包括電力系統(tǒng)負(fù)荷預(yù)測(cè)和算法交易。
無(wú)監(jiān)督學(xué)習(xí)可發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式或內(nèi)在結(jié)構(gòu)。這種技術(shù)可根據(jù)未做標(biāo)記的輸入數(shù)據(jù)集執(zhí)行推理無(wú)監(jiān)督式學(xué)習(xí)什么是無(wú)監(jiān)督式學(xué)習(xí)?
清晰、完美標(biāo)記的數(shù)據(jù)集并不容易獲得。有時(shí),研究人員會(huì)向算法詢(xún)問(wèn)一些他們未知的問(wèn)題。而這正是無(wú)監(jiān)督式學(xué)習(xí)可以發(fā)揮作用的地方。無(wú)監(jiān)督式學(xué)習(xí)模型自動(dòng)提取特征并在數(shù)據(jù)中找到規(guī)律。無(wú)監(jiān)督學(xué)習(xí)中鳶尾花數(shù)據(jù)在人工智能眼里的樣子??梢钥吹?,沒(méi)有類(lèi)別信息的指導(dǎo),我們很難判斷哪一些鳶尾花是相同的品種,哪一些鳶尾花是不同品種,更別提使用一條直線為鳶尾花分類(lèi)了如何確定使用哪種機(jī)器學(xué)習(xí)算法?算法的選擇還取決于您要處理的數(shù)據(jù)的大小和類(lèi)型、您要從數(shù)據(jù)中獲得的洞察力以及如何運(yùn)用這些洞察力。下面是選擇監(jiān)督式或者無(wú)監(jiān)督機(jī)器學(xué)習(xí)的一些準(zhǔn)則:在以下情況下選擇監(jiān)督式學(xué)習(xí):您需要訓(xùn)練模型進(jìn)行預(yù)測(cè)(例如溫度和股價(jià)等連續(xù)變量的值)或者分類(lèi)(例如根據(jù)網(wǎng)絡(luò)攝像頭的錄像片段確定汽車(chē)的技術(shù)細(xì)節(jié))。在以下情況下選擇無(wú)監(jiān)督學(xué)習(xí):您需要深入了解數(shù)據(jù)并希望訓(xùn)練模型找到好的內(nèi)部表示形式,例如將數(shù)據(jù)拆分到集群中。3.2.4機(jī)器學(xué)習(xí)數(shù)據(jù)處理流程①收集數(shù)據(jù)②準(zhǔn)備輸入數(shù)據(jù)③分析輸入數(shù)據(jù)④訓(xùn)練算法⑤測(cè)試算法⑥使用算法3.3K近鄰(KNN)
KNN算法的核心思想是如果一個(gè)樣本在特征空間中的K個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別,則該樣本也屬于這個(gè)類(lèi)別,并具有這個(gè)類(lèi)別上樣本的特性。3.3.1KNN簡(jiǎn)介下面通過(guò)一個(gè)簡(jiǎn)單的例子說(shuō)明一下:如圖,綠色圓要被決定賦予哪個(gè)類(lèi),是紅色三角形還是藍(lán)色四方形?如果K=3,由于紅色三角形所占比例為2/3,綠色圓將被賦予紅色三角形那個(gè)類(lèi),如果K=5,由于藍(lán)色四方形比例為3/5,因此綠色圓被賦予藍(lán)色四方形類(lèi)由此也說(shuō)明了KNN算法的結(jié)果很大程度取決于K的選擇3.3.2KNN算法三要素1.距離度量歐式距離曼哈頓距離閔可夫斯基距離2.K值
先選一個(gè)較小的值,然后通過(guò)交叉驗(yàn)證選擇一個(gè)合適的最終值。
k越小,即使用較小的領(lǐng)域中的樣本進(jìn)行預(yù)測(cè),訓(xùn)練誤差會(huì)減小,但模型會(huì)很復(fù)雜,以至于過(guò)擬合。
k越大,即使用較大的領(lǐng)域中的樣本進(jìn)行預(yù)測(cè),訓(xùn)練誤差會(huì)增大,模型會(huì)變得簡(jiǎn)單,容易導(dǎo)致欠擬合。3.分類(lèi)決策規(guī)則
K近鄰法中的分類(lèi)決策規(guī)則,常用多數(shù)表決法,當(dāng)然,為了弱化K值的影響,還可以采用加權(quán)表決法。(1)多數(shù)表決
由輸入實(shí)例的K個(gè)鄰近的訓(xùn)練實(shí)例中的多數(shù)類(lèi)決定輸入實(shí)例的類(lèi),不考慮距離加權(quán)影響,每個(gè)投票權(quán)重都為1。(2)加權(quán)表決
由輸入實(shí)例的K個(gè)鄰近的訓(xùn)練實(shí)例中的多數(shù)類(lèi)加權(quán)決定輸入實(shí)例的類(lèi)——即根據(jù)距離的遠(yuǎn)近,對(duì)近鄰的投票進(jìn)行加權(quán),距離越近則權(quán)重越大(權(quán)重為距離平方的倒數(shù))。計(jì)算測(cè)試數(shù)據(jù)與各個(gè)訓(xùn)練數(shù)據(jù)之間的距離按照距離的遞增關(guān)系進(jìn)行排序選取距離最小的K個(gè)點(diǎn)確定前K個(gè)點(diǎn)所在類(lèi)別的出現(xiàn)頻率返回前K個(gè)點(diǎn)中出現(xiàn)頻率最高的類(lèi)別作為測(cè)試數(shù)據(jù)的預(yù)測(cè)分類(lèi)3.3.3KNN算法流程3.3.4KNN示例
假設(shè)大一甲乙兩班學(xué)生合堂上課,座位如圖3—5所示,圖3—5中“△”為甲班學(xué)生,“☆”為乙班學(xué)生,如果后來(lái)進(jìn)來(lái)一個(gè)學(xué)生坐在D處,由于D周邊甲班學(xué)生居多,故預(yù)測(cè)D也是甲班的學(xué)生,這稱(chēng)為投票法。K近鄰法指對(duì)新輸入的實(shí)例,按簡(jiǎn)單投票法則,預(yù)測(cè)其類(lèi)別歸屬。問(wèn)用K近鄰法則預(yù)測(cè)A,B,C各是哪班學(xué)生。解:(1)從上下左右看,
A的上下左右全是“△”為甲班學(xué)生,故A應(yīng)是甲班學(xué)生;B的上下左右全是“☆”為乙班學(xué)生,故B應(yīng)是乙班學(xué)生;C的上下左右,3人是甲班,1人乙班,故C應(yīng)是甲班;D的上下左右全是“△”為甲班學(xué)生,故D應(yīng)是甲班學(xué)生。
(2)從四周看
A的四周有七個(gè)“△”為甲班學(xué)生,故A應(yīng)是甲班學(xué)生;B的四周全是“☆”為乙班學(xué)生,故B應(yīng)是乙班學(xué)生;C的四周,3人是甲班,5人乙班,故C應(yīng)是乙班;D的四周全是“△”為甲班學(xué)生,故D應(yīng)是甲班學(xué)生。KNN算法優(yōu)缺點(diǎn)(1)易于實(shí)現(xiàn),無(wú)需估計(jì)參數(shù),無(wú)需訓(xùn)練,支持增量學(xué)習(xí),能對(duì)超多邊形的復(fù)雜決策空間建模;(2)簡(jiǎn)單好用,容易理解,精度高,理論成熟,既可以用來(lái)做分類(lèi)也可以用來(lái)做回歸;(3)可用于數(shù)值型數(shù)據(jù)和離散型數(shù)據(jù);(4)訓(xùn)練時(shí)間復(fù)雜度為O(n);無(wú)數(shù)據(jù)輸入假定;(5)對(duì)異常值不敏感。優(yōu)點(diǎn)缺點(diǎn)(1)計(jì)算復(fù)雜性高;空間復(fù)雜性高;(2)樣本不平衡問(wèn)題(即有些類(lèi)別的樣本數(shù)量很多,而其他樣本的數(shù)量很少);(3)一般數(shù)值很大的時(shí)候不用這個(gè),計(jì)算量太大。但是單個(gè)樣本又不能太少否則容易發(fā)生誤分;(4)最大的缺點(diǎn)是無(wú)法給出數(shù)據(jù)的內(nèi)在含義3.4K-Means聚類(lèi)
聚類(lèi)的目的也是把數(shù)據(jù)分類(lèi),但是事先我是不知道如何去分的,完全是算法自己來(lái)判斷各條數(shù)據(jù)之間的相似性,相似的就放在一起。在聚類(lèi)的結(jié)論出來(lái)之前,我完全不知道每一類(lèi)有什么特點(diǎn),一定要根據(jù)聚類(lèi)的結(jié)果通過(guò)人的經(jīng)驗(yàn)來(lái)分析,看看聚成的這一類(lèi)大概有什么特點(diǎn)。什么是聚類(lèi)
聚類(lèi)和分類(lèi)最大的不同在于:分類(lèi)的目標(biāo)是事先已知的,而聚類(lèi)則不一樣,聚類(lèi)事先不知道目標(biāo)變量是什么,類(lèi)別沒(méi)有像分類(lèi)那樣被預(yù)先定義出來(lái)。3.4.1K-Means聚類(lèi)簡(jiǎn)介
(1)選取數(shù)據(jù)空間中的K個(gè)對(duì)象作為初始中心,每個(gè)對(duì)象代表一個(gè)聚類(lèi)中心;
(2)對(duì)于樣本中的數(shù)據(jù)對(duì)象,根據(jù)它們與這些聚類(lèi)中心的歐氏距離,按距離最近的準(zhǔn)則將它們分到距離它們最近的聚類(lèi)中心(最相似)所對(duì)應(yīng)的類(lèi)
(3)更新聚類(lèi)中心:將每個(gè)類(lèi)別中所有對(duì)象所對(duì)應(yīng)的均值作為該類(lèi)別的聚類(lèi)中心,計(jì)算目標(biāo)函數(shù)的值
(4)判斷聚類(lèi)中心和目標(biāo)函數(shù)的值是否發(fā)生改變,若不變,則輸出結(jié)果,若改變,則返回到(2)3.4.2K-Means算法流程給定一個(gè)數(shù)據(jù)集根據(jù)K=5初始化聚類(lèi)中心,保證聚類(lèi)中心處于數(shù)據(jù)空間內(nèi)根據(jù)計(jì)算類(lèi)內(nèi)對(duì)象和聚類(lèi)中心之間的相似度指標(biāo),將數(shù)據(jù)進(jìn)行劃將類(lèi)內(nèi)之間數(shù)據(jù)的均值作為聚類(lèi)中心,更新聚類(lèi)中心最后判斷算法結(jié)束與否即可,目的是為了保證算法的收斂3.4.3K-Means聚類(lèi)示例
圖中有5個(gè)特征點(diǎn)A(1.5,0.5),B(2.6,1),C(3,2.4),D(4,1.7),E(4.5,1.5),此外再無(wú)其他信息。怎樣予以分類(lèi)呢?沒(méi)有標(biāo)注信息,這是無(wú)監(jiān)督學(xué)習(xí)問(wèn)題。情景1若K=1,那么A、B、C、D、E屬于同一類(lèi),無(wú)需再學(xué)習(xí)。情景2若K=5,那么A、B、C、D、E各自是一類(lèi),共5類(lèi),也無(wú)需再學(xué)習(xí)。情景3假設(shè)K=2,即將這5個(gè)特征點(diǎn)分成二類(lèi)。由于K=2,任取兩個(gè)特征點(diǎn),不妨極端一點(diǎn),取D、E為初始特征點(diǎn)。無(wú)監(jiān)督學(xué)習(xí),首先要確定分幾個(gè)類(lèi)別,假設(shè)分K個(gè)類(lèi)別,K是聚類(lèi)算法的唯一參數(shù)。
分別計(jì)算A、B、C、D與均值點(diǎn)(2.775,1.4)、E(4.5,1.5)的距離,距離點(diǎn)(2.775,1.4)小的歸為一類(lèi)得聚類(lèi){A,B,C},D與E的距離小于D與(2.775,1.4)的距離,得另一聚類(lèi){D,E},計(jì)算{A,B,C}的均值點(diǎn)為(2.37,1.3),{D,E}的均值點(diǎn)為(4.25,1.6)。分別計(jì)算A、B、C、D、E與均值點(diǎn)(2.37,1.3),(4.25,1.6)的距離,距離點(diǎn)(2.37,1.3)小的歸為一類(lèi)得聚類(lèi){A,B,C},距離點(diǎn)(4.25,1.6)小的歸為另一聚類(lèi){D,E}。結(jié)論同第二步,已收斂第一步第二步第三步
這說(shuō)明了兩點(diǎn):第一,這個(gè)算法最終會(huì)收斂到一個(gè)穩(wěn)定的局部最優(yōu)值,不一定全局最優(yōu),這是由于算法中歐幾里得距離保持不增決定的。第二,分類(lèi)結(jié)果與初始值有關(guān)。3.4.4層次聚類(lèi)
層次聚類(lèi)(HierarchicalClustering)是聚類(lèi)算法的一種,通過(guò)計(jì)算不同類(lèi)別數(shù)據(jù)點(diǎn)間的相似度來(lái)創(chuàng)建一棵有層次的嵌套聚類(lèi)樹(shù)。在聚類(lèi)樹(shù)中,不同類(lèi)別的原始數(shù)據(jù)點(diǎn)是樹(shù)的最低層,樹(shù)的頂層是一個(gè)聚類(lèi)的根節(jié)點(diǎn)。創(chuàng)建聚類(lèi)樹(shù)有自下而上合并和自上而下分裂兩種方法。如何劃分才合適
論數(shù)據(jù)集應(yīng)該聚類(lèi)成多少個(gè)簇,通常是在討論我們?cè)谑裁闯叨壬详P(guān)注這個(gè)數(shù)據(jù)集。層次聚類(lèi)算法相比劃分聚類(lèi)算法的優(yōu)點(diǎn)之一是可以在不同的尺度上(層次)展示數(shù)據(jù)集的聚類(lèi)情況。
基于層次的聚類(lèi)算法(HierarchicalClustering)可以是凝聚的(Agglomerative)或者分裂的(Divisive),取決于層次的劃分是“自底向上”還是“自頂向下”。自底向上的合并算法
層次聚類(lèi)的合并算法通過(guò)計(jì)算兩類(lèi)數(shù)據(jù)點(diǎn)間的相似性,對(duì)所有數(shù)據(jù)點(diǎn)中最為相似的兩個(gè)數(shù)據(jù)點(diǎn)進(jìn)行組合,并反復(fù)迭代這一過(guò)程。簡(jiǎn)單的說(shuō)層次聚類(lèi)的合并算法是通過(guò)計(jì)算每一個(gè)類(lèi)別的數(shù)據(jù)點(diǎn)與所有數(shù)據(jù)點(diǎn)之間的距離來(lái)確定它們之間的相似性,距離越小,相似度越高。并將距離最近的兩個(gè)數(shù)據(jù)點(diǎn)或類(lèi)別進(jìn)行組合,生成聚類(lèi)樹(shù)。相似度的計(jì)算層次聚類(lèi)使用歐式距離來(lái)計(jì)算不同類(lèi)別數(shù)據(jù)點(diǎn)間的距離(相似度)3.4.5影響K-Means聚類(lèi)算法的主要因素初始質(zhì)心的選擇K值的確定距離的計(jì)算方法K-Means算法優(yōu)缺點(diǎn)(1)K值的選取不好把握;(2)對(duì)于不是凸的數(shù)據(jù)集比較難收斂;(3)如果各隱含類(lèi)別的數(shù)據(jù)不平衡,比如各隱含類(lèi)別的數(shù)據(jù)量嚴(yán)重失衡,或者各隱含類(lèi)別的方差不同,則聚類(lèi)效果不佳;(4)采用迭代方法,得到的結(jié)果只是局部最優(yōu);(5)對(duì)噪音和異常點(diǎn)比較地敏感。缺點(diǎn)優(yōu)點(diǎn)(1)原理比較簡(jiǎn)單,實(shí)現(xiàn)也是很容易,收斂速度快;(2)聚類(lèi)效果較優(yōu);(3)算法的可解釋度比較強(qiáng);(4)主要需要調(diào)參的參數(shù)僅僅是簇?cái)?shù)K。3.4.6K-Means聚類(lèi)優(yōu)缺點(diǎn)3.4.7KNN與K-Means比較
K-Means是無(wú)監(jiān)督學(xué)習(xí)的聚類(lèi)算法,沒(méi)有樣本輸出;而KNN是監(jiān)督學(xué)習(xí)的分類(lèi)算法,有對(duì)應(yīng)的類(lèi)別輸出。KNN基本不需要訓(xùn)練,對(duì)測(cè)試集里面的點(diǎn),只需要找到在樣本集中最近的K個(gè)點(diǎn),用這最近的K個(gè)樣本的類(lèi)別來(lái)決定測(cè)試樣本的類(lèi)別。而K-Means則有明顯的訓(xùn)練過(guò)程,找到K個(gè)類(lèi)別的最佳質(zhì)心,從而決定樣本的簇類(lèi)別3.5.1KNN應(yīng)用場(chǎng)景待測(cè)微生物種類(lèi)判別
DNA是多數(shù)生物的遺傳物質(zhì),DNA上的堿基(A,T,C和G)就儲(chǔ)藏了遺傳信息,不同物種的DNA序列在序列長(zhǎng)度和堿基組成上差異顯著。所以我們能夠通過(guò)DNA序列的比較分析,來(lái)判斷DNA序列是來(lái)自哪些物種。由于測(cè)序技術(shù)限制,我們只能得到一定長(zhǎng)度的DNA序列片段。通過(guò)DNA序列片段與已知的微生物DNA序列進(jìn)行比較,可以確定DNA片段的來(lái)源微生物,進(jìn)而確定待測(cè)微生物種類(lèi)。在相關(guān)數(shù)據(jù)基礎(chǔ)上,建立分析方法,在計(jì)算資源消耗盡量小的情況下,盡可能快地給出準(zhǔn)確的結(jié)果,以滿(mǎn)足臨床診斷需求。商品圖片分類(lèi)
京東含有數(shù)以百萬(wàn)計(jì)的商品圖片,“拍照購(gòu)”“找同款”等應(yīng)用必須對(duì)用戶(hù)提供的商品圖片進(jìn)行分類(lèi)。同時(shí),提取商品圖像特征,可以提供給推薦、廣告等系統(tǒng),提高推薦/廣告的效果。通過(guò)對(duì)圖像數(shù)據(jù)進(jìn)行學(xué)習(xí),以達(dá)到對(duì)圖像進(jìn)行分類(lèi)劃分的目的。3.5.2K-Means應(yīng)用場(chǎng)景文檔分類(lèi)器
根據(jù)標(biāo)簽、主題和文檔內(nèi)容將文檔分為多個(gè)不同的類(lèi)別。這是一個(gè)非常標(biāo)準(zhǔn)且經(jīng)典的K-Means算法分類(lèi)問(wèn)題。首先,需要對(duì)文檔進(jìn)行初始化處理,將每個(gè)文檔都用矢量來(lái)表示,并使用術(shù)語(yǔ)頻率來(lái)識(shí)別常用術(shù)語(yǔ)進(jìn)行文檔分類(lèi),這一步很有必要。然后對(duì)文檔向量進(jìn)行聚類(lèi),識(shí)別文檔組中的相似性。這里是用于文檔分類(lèi)的K-Means算法實(shí)現(xiàn)案例。呼叫記錄詳細(xì)分析
通話詳細(xì)記錄(CDR)是電信公司在對(duì)用戶(hù)的通話、短信和網(wǎng)絡(luò)活動(dòng)信息的收集。將通話詳細(xì)記錄與客戶(hù)個(gè)人資料結(jié)合在一起,這能夠幫助電信公司對(duì)客戶(hù)需求做更多的預(yù)測(cè)。使用無(wú)監(jiān)督K-Means聚類(lèi)算法對(duì)客戶(hù)一天24小時(shí)的活動(dòng)進(jìn)行聚類(lèi),來(lái)了解客戶(hù)數(shù)小時(shí)內(nèi)的使用情況。最后一問(wèn)小剛?cè)?yīng)聘某互聯(lián)網(wǎng)公司的算法工程師,面試官問(wèn)他“回歸和分類(lèi)有什么相同點(diǎn)和不同點(diǎn)?”非常感謝你的觀看Thankyou!人工智能應(yīng)用技術(shù)基礎(chǔ)前言目錄4.1深度學(xué)習(xí)應(yīng)用場(chǎng)景4.2從生物神經(jīng)元到M-P模型4.3卷積神經(jīng)網(wǎng)絡(luò)4.4循環(huán)神經(jīng)網(wǎng)絡(luò)4.5應(yīng)用案例什么是深度學(xué)習(xí)?什么是機(jī)器學(xué)習(xí)?學(xué)習(xí)
著名學(xué)者赫伯特·西蒙教授(HerbertSimon,1975年圖靈獎(jiǎng)獲得者、1978年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者)曾對(duì)“學(xué)習(xí)”給了一個(gè)定義:“如果一個(gè)系統(tǒng),能夠通過(guò)執(zhí)行某個(gè)過(guò)程,就此改進(jìn)了它的性能,那么這個(gè)過(guò)程就是學(xué)習(xí)”
從西蒙教授的觀點(diǎn)可以看出,學(xué)習(xí)的核心目的,就是改善性能
遵循西蒙教授的觀點(diǎn),對(duì)于計(jì)算機(jī)系統(tǒng)而言,通過(guò)運(yùn)用數(shù)據(jù)及某種特定的方法(比如統(tǒng)計(jì)的方法或推理的方法),來(lái)提升機(jī)器系統(tǒng)的性能,就是機(jī)器學(xué)習(xí)
卡內(nèi)基梅隆大學(xué)的TomMitchell教授,在他的名作《機(jī)器學(xué)習(xí)》一書(shū)中,也給出了更為具體(其實(shí)也很抽象)的定義:
對(duì)于某類(lèi)任務(wù)(Task,簡(jiǎn)稱(chēng)T)和某項(xiàng)性能評(píng)價(jià)準(zhǔn)則(Performance,簡(jiǎn)稱(chēng)P),如果一個(gè)計(jì)算機(jī)程序在T上,以P作為性能的度量,隨著很多經(jīng)驗(yàn)(Experience,簡(jiǎn)稱(chēng)E)不斷自我完善,那么我們稱(chēng)這個(gè)計(jì)算機(jī)程序在從經(jīng)驗(yàn)E中學(xué)習(xí)了。
一般說(shuō)來(lái),人類(lèi)的知識(shí)在兩個(gè)維度上可分成四類(lèi)。即從可統(tǒng)計(jì)與否上來(lái)看,可分為:是可統(tǒng)計(jì)的和不可統(tǒng)計(jì)的。從能否推理上看,可分為可推理的和不可推理的。
在橫向方向上,對(duì)于可推理的,我們都可以通過(guò)機(jī)器學(xué)習(xí)的方法,最終可以完成這個(gè)推理。傳統(tǒng)的機(jī)器學(xué)習(xí)方法,就是試圖找到可舉一反三的方法,向可推理但不可統(tǒng)計(jì)的象限進(jìn)發(fā)(象限Ⅱ)。目前看來(lái),這個(gè)象限的研究工作(即基于推理的機(jī)器學(xué)習(xí))陷入了不溫不火的境地,能不能峰回路轉(zhuǎn),還有待時(shí)間的檢驗(yàn)。
而在縱向上,對(duì)于可統(tǒng)計(jì)的、但不可推理的(即象限Ⅲ),可通過(guò)神經(jīng)網(wǎng)絡(luò)這種特定的機(jī)器學(xué)習(xí)方法,以期望達(dá)到性能提升的目的。目前,基于深度學(xué)習(xí)的棋類(lèi)博弈(阿爾法狗)、計(jì)算機(jī)視覺(jué)(貓狗識(shí)別)、自動(dòng)駕駛等等,其實(shí)都是在這個(gè)象限做出了了不起的成就。
從圖1可知,深度學(xué)習(xí)屬于統(tǒng)計(jì)學(xué)習(xí)的范疇。用李航博士的話來(lái)說(shuō),統(tǒng)計(jì)機(jī)器學(xué)習(xí)的對(duì)象,其實(shí)就是數(shù)據(jù)。這是因?yàn)椋瑢?duì)于計(jì)算機(jī)系統(tǒng)而言,所有的“經(jīng)驗(yàn)”都是以數(shù)據(jù)的形式存在的。作為學(xué)習(xí)的對(duì)象,數(shù)據(jù)的類(lèi)型是多樣的,可以是各種數(shù)字、文字、圖像、音頻、視頻,也可以是它們的各種組合。
統(tǒng)計(jì)機(jī)器學(xué)習(xí),就是從數(shù)據(jù)出發(fā),提取數(shù)據(jù)的特征(由誰(shuí)來(lái)提取,是個(gè)大是大非問(wèn)題,下面將給予介紹),抽象出數(shù)據(jù)的模型,發(fā)現(xiàn)數(shù)據(jù)中的知識(shí),最后又回到數(shù)據(jù)的分析與預(yù)測(cè)當(dāng)中去。
從圖1可以看出,深度學(xué)習(xí),在本質(zhì)上,屬于可統(tǒng)計(jì)不可推理的范疇?!翱山y(tǒng)計(jì)”是很容易理解的,就是說(shuō),對(duì)于同類(lèi)數(shù)據(jù),它具有一定的統(tǒng)計(jì)規(guī)律,這是一切統(tǒng)計(jì)學(xué)習(xí)的基本假設(shè)。那“不可推理”又是什么概念?其實(shí)就是“剪不斷、理還亂”的非線性狀態(tài)了
在哲學(xué)上講,這種非線性狀態(tài),是具備了整體性的“復(fù)雜系統(tǒng)”,屬于復(fù)雜性科學(xué)范疇。復(fù)雜性科學(xué)認(rèn)為,構(gòu)成復(fù)雜系統(tǒng)的各個(gè)要素,自成體系,但阡陌縱橫,其內(nèi)部結(jié)構(gòu)難以分割。
簡(jiǎn)單來(lái)說(shuō),對(duì)于復(fù)雜系統(tǒng),1+1≠2,也就是說(shuō),一個(gè)簡(jiǎn)單系統(tǒng),加上另外一個(gè)簡(jiǎn)單系統(tǒng),其效果絕不是兩個(gè)系統(tǒng)的簡(jiǎn)單累加效應(yīng),而可能是大于部分之和。
因此,我們必須從整體上認(rèn)識(shí)這樣的復(fù)雜系統(tǒng)。于是,在認(rèn)知上,就有了從一個(gè)系統(tǒng)或狀態(tài)(end)直接整體變遷到另外一個(gè)系統(tǒng)或狀態(tài)(end)的形態(tài)。這就是深度學(xué)習(xí)背后的方法論。
與之對(duì)應(yīng)的是“DivideandConquer(分而治之)”,其理念正好相反,在哲學(xué)它屬于“還原主義(reductionism,或稱(chēng)還原論)”。在這種方法論中,有一種“追本溯源”的蘊(yùn)意包含其內(nèi),即一個(gè)系統(tǒng)(或理論)無(wú)論多復(fù)雜,都可以分解、分解、再分解,直到能夠還原到邏輯原點(diǎn)。
在意象上,還原主義就是“1+1=2”,也就是說(shuō),一個(gè)復(fù)雜的系統(tǒng),都可以由簡(jiǎn)單的系統(tǒng)簡(jiǎn)單疊加而成(可以理解為線性系統(tǒng)),如果各個(gè)簡(jiǎn)單系統(tǒng)的問(wèn)題解決了,那么整體的問(wèn)題也就得以解決。比如說(shuō),很多的經(jīng)典力學(xué)問(wèn)題,不論形式有多復(fù)雜,通過(guò)不斷的分解和還原,最后都可以通過(guò)牛頓的三大定律得以解決。
經(jīng)典機(jī)器學(xué)習(xí)(位于第Ⅱ象限),在哲學(xué)上,在某種程度上,就可歸屬于還原主義。傳統(tǒng)的機(jī)器學(xué)習(xí)方式,通常是用人類(lèi)的先驗(yàn)知識(shí),把原始數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國(guó)鐵路機(jī)車(chē)車(chē)輛配件制造行業(yè)十三五規(guī)劃及發(fā)展前景分析報(bào)告
- 2025-2030年中國(guó)金屬鉍行業(yè)運(yùn)行現(xiàn)狀及發(fā)展前景分析報(bào)告
- 2025-2030年中國(guó)過(guò)氧化氫行業(yè)市場(chǎng)運(yùn)行動(dòng)態(tài)與營(yíng)銷(xiāo)策略研究報(bào)告
- 2025-2030年中國(guó)調(diào)壓器市場(chǎng)運(yùn)行現(xiàn)狀及發(fā)展前景預(yù)測(cè)報(bào)告
- 2025-2030年中國(guó)空氣清新機(jī)行業(yè)運(yùn)行現(xiàn)狀及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 貴州工程應(yīng)用技術(shù)學(xué)院《運(yùn)動(dòng)醫(yī)務(wù)監(jiān)督與康復(fù)治療》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年海南省安全員《B證》考試題庫(kù)
- 2025年建筑安全員B證考試題庫(kù)
- 山東現(xiàn)代學(xué)院《建筑設(shè)備CAD》2023-2024學(xué)年第二學(xué)期期末試卷
- 朔州師范高等專(zhuān)科學(xué)?!峨姽y(cè)試技術(shù)(上)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024初中數(shù)學(xué)課程標(biāo)準(zhǔn)測(cè)試題(含答案)精華版
- 2024年陜西延長(zhǎng)石油集團(tuán)礦業(yè)公司招聘筆試參考題庫(kù)含答案解析
- 人教版新教材高一上學(xué)期期末考試數(shù)學(xué)試卷及答案(共五套)
- 人文關(guān)懷與優(yōu)質(zhì)護(hù)理課件
- 知識(shí)圖譜可視化-Neo4j(windows)
- 光伏電站作業(yè)危險(xiǎn)點(diǎn)分析及預(yù)控措施手冊(cè)
- 2021年深圳實(shí)驗(yàn)學(xué)校初中部七年級(jí)入學(xué)分班考試數(shù)學(xué)試卷及答案解析
- 水文流量測(cè)驗(yàn)
- 合作共贏商務(wù)合作PPT模板(基礎(chǔ)教育)
- 鋁的陽(yáng)極氧化和著色
- 信用社(銀行)清產(chǎn)核資實(shí)施方案
評(píng)論
0/150
提交評(píng)論