人工智能與大數(shù)據(jù)開發(fā)入門背景知識(shí)簡(jiǎn)介_第1頁
人工智能與大數(shù)據(jù)開發(fā)入門背景知識(shí)簡(jiǎn)介_第2頁
人工智能與大數(shù)據(jù)開發(fā)入門背景知識(shí)簡(jiǎn)介_第3頁
人工智能與大數(shù)據(jù)開發(fā)入門背景知識(shí)簡(jiǎn)介_第4頁
人工智能與大數(shù)據(jù)開發(fā)入門背景知識(shí)簡(jiǎn)介_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基本知識(shí)入門簡(jiǎn)介

學(xué)生:岳清泉指導(dǎo)老師:鄢然副教授2018年4月人工智能及大數(shù)據(jù)開發(fā)2021/5/91主要內(nèi)容

1 人工智能簡(jiǎn)介

1.1 AI的定義及研究目標(biāo) 1.2 AI的產(chǎn)生與發(fā)展 1.3 AI研究中的三大學(xué)派 1.4 AI的兩個(gè)不同層次 1.5 AI的應(yīng)用

2 大數(shù)據(jù)簡(jiǎn)介

2.1 大數(shù)據(jù)的概念 2.2 大數(shù)據(jù)的特點(diǎn) 2.3 大數(shù)據(jù)面臨的主要問題 2.4 大數(shù)據(jù)和人工智能的關(guān)系

3 相關(guān)算法基礎(chǔ) 3.1 基于模擬機(jī)制的人工智能算法分類方法 3.2 人工智能知識(shí)網(wǎng)絡(luò)系統(tǒng)總結(jié) 3.3 蒙特卡洛樹搜索樹算法簡(jiǎn)介

4 編程語言Python簡(jiǎn)介 4.1 認(rèn)識(shí)Python 4.2 Python的應(yīng)用領(lǐng)域2021/5/92主要內(nèi)容 4.3 Python是人工智能首選語言

5 總結(jié)

2021/5/93

人工智能簡(jiǎn)介11.1 AI的定義及其研究目標(biāo)

人工智能(ArtificialIntelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,該領(lǐng)域的研究包括機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。

人類智能人工智能研究領(lǐng)域語言智能自然語言處理,如Siri,訊飛翻譯邏輯判斷機(jī)器證明及符號(hào)運(yùn)算神經(jīng)控制神經(jīng)網(wǎng)絡(luò),如人機(jī)象棋視覺機(jī)器視覺和圖像識(shí)別自然觀察能力模式識(shí)別多種智能組合人工智能2021/5/94

人工智能簡(jiǎn)介11.2 AI的產(chǎn)生與發(fā)展

2021/5/95

人工智能簡(jiǎn)介1

誕生與早期研究 1950年,圖靈發(fā)表了一篇?jiǎng)潟r(shí)代的論文,并提出著名的“圖靈測(cè)試”:由艾倫·麥席森·圖靈發(fā)明,指測(cè)試者與被測(cè)試者(一個(gè)人和一機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,如果有超出30%的測(cè)試者不能確定出被測(cè)試者是人還是機(jī)器,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能 1956年,達(dá)特茅斯會(huì)議:AI的誕生 1957年,紐厄爾、肖(J.Shaw)和西蒙等人的心理學(xué)小組研制了稱為邏輯理論機(jī)的數(shù)學(xué)定理證明程序。 1962年,由塞謬爾在IBM704計(jì)算機(jī)上研制的具有自學(xué)習(xí)和適應(yīng)能力的西洋跳棋程序打敗了一個(gè)州的冠軍。

挫折和教訓(xùn) 1958年,西蒙曾預(yù)言:十年內(nèi),計(jì)算機(jī)將稱為國際冠軍;計(jì)算機(jī)將發(fā)現(xiàn)和證明有意義的數(shù)學(xué)定理;計(jì)算機(jī)將能譜寫優(yōu)美的樂曲;計(jì)算機(jī)將能實(shí)現(xiàn)大多數(shù)的心理學(xué)理論。后兩個(gè)到目前為止都未能實(shí)現(xiàn)。

在博弈方面,塞謬爾的程序與世界冠軍比賽時(shí),5局輸了4局

在定理證明方面,當(dāng)時(shí)用歸結(jié)原理證明兩個(gè)連續(xù)函數(shù)之和還是連續(xù)函數(shù)時(shí),推了10萬步,也沒有證明出來。2021/5/96

人工智能簡(jiǎn)介1

在神經(jīng)生理學(xué)方面,發(fā)現(xiàn)人腦有10^12以上的神經(jīng)元,用機(jī)器從結(jié)構(gòu)上根本無法模擬

在其他方面,人工智能也遇到了不少的困難,因此那段時(shí)間,在全世界范圍,人工智能陷入了低谷。

以知識(shí)為中心的研究

1972年,費(fèi)根鮑勃開始研究MYCIN專家系統(tǒng),并于1976年研制成功,它可以協(xié)助內(nèi)科醫(yī)生診斷細(xì)菌感染疾病并提供最佳處方。 1976年,斯坦福大學(xué)研制出地質(zhì)勘探專家系統(tǒng)PROSPECTOR

這一時(shí)期同時(shí)發(fā)展的還有計(jì)算機(jī)視覺和機(jī)器人,自然語言理解和機(jī)器翻譯翻譯等

新的問題

專家系統(tǒng)所存在的知識(shí)領(lǐng)域狹窄、缺乏常識(shí)性知識(shí)、知識(shí)獲取難、推理方法單一、沒有分布式功能、不能訪問現(xiàn)存數(shù)據(jù)庫的問題逐漸暴露出來

第三次AI興起浪潮 2006年后,大數(shù)據(jù)的廣泛應(yīng)用使得機(jī)器學(xué)習(xí)迅速發(fā)展,并進(jìn)一步產(chǎn)生了深度學(xué)習(xí) 2016年3月,AlphaGo對(duì)戰(zhàn)世界圍棋冠軍、職業(yè)九段選手李世石,并以4:1的總比分獲勝。 2017年5月23日至27日在中國嘉興烏鎮(zhèn)進(jìn)行的三番棋比賽,AlphaGo以總比分3比0戰(zhàn)勝世界排名第一的柯潔。2021/5/97

人工智能簡(jiǎn)介11.3 AI研究中的三大學(xué)派

符號(hào)主義學(xué)派聯(lián)結(jié)主義學(xué)派行為主義學(xué)派基于符號(hào)運(yùn)算的人工智能學(xué)派。他們認(rèn)為知識(shí)可以用符號(hào)來表示,認(rèn)知可以通過符號(hào)運(yùn)算來實(shí)現(xiàn)。如專家系統(tǒng)。從大腦和神經(jīng)系統(tǒng)的生理背景出發(fā)模擬它們的工作機(jī)理和學(xué)習(xí)方式。之后,隨著模糊邏輯和進(jìn)化計(jì)算的逐步成熟,又形成了“計(jì)算智能”主要進(jìn)行行為主義的模擬。如1991年,麻省理工學(xué)院布魯克教授研究成功能較為自由活動(dòng)的6條腿機(jī)器蟲。奠基人:西蒙(CMU)奠基人:明斯基(MIT)奠基人:維納(MIT)隨著研究和應(yīng)用的深入,人們逐漸意識(shí)到,三個(gè)學(xué)派各有所長(zhǎng),各有所短,如今的人工智能研究是將這三大學(xué)派的方法加以相互結(jié)合。2021/5/98

人工智能簡(jiǎn)介11.4 AI的兩個(gè)不同層次

弱人工智能強(qiáng)人工智能令機(jī)器進(jìn)行智能的行動(dòng)。弱人工智能經(jīng)常是擅長(zhǎng)某一單方面的人工智能。比如能戰(zhàn)勝圍棋世界冠軍的人工智能,但它只會(huì)下棋,你問它其他事情,它就無法處理。另一個(gè)典型代表是微軟小冰。它不僅安裝在Windows系統(tǒng)的pc上,它還擔(dān)任著東方衛(wèi)視《天氣預(yù)報(bào)》主持人的角色。強(qiáng)人工智能:令機(jī)器像人一樣思考。其基本定義為:人類制造出的具有自主推理和解決一般性問題的智能程序。此類程序具備知覺和自我意識(shí),可以完成自我編程和開發(fā)新人工智能的工作。到目前為止,真正意義上的強(qiáng)人工智能還沒有研制出來,并且很可能在最近幾十年都還研制不出來2021/5/99

人工智能簡(jiǎn)介11.5 AI的應(yīng)用

AI在互聯(lián)網(wǎng)領(lǐng)域類的應(yīng)用2021/5/910

人工智能簡(jiǎn)介1

人工智能對(duì)社會(huì)經(jīng)濟(jì)的影響

新時(shí)代下,機(jī)器人產(chǎn)業(yè)將迎來井噴式的增長(zhǎng),并開始充斥在社會(huì)的各個(gè)角落,成為推動(dòng)社會(huì)進(jìn)步的強(qiáng)大力量??梢灶A(yù)見,未來將會(huì)是商業(yè)、社會(huì)與機(jī)器人的聯(lián)合大接軌。

人工智能機(jī)器人將會(huì)在如下方面改變著人們的生活。

(1)引領(lǐng)時(shí)尚生活的服務(wù)機(jī)器人:餐廳服務(wù)機(jī)器人、家庭掃地機(jī)器人、達(dá)芬奇手術(shù)機(jī)器人、助殘機(jī)器人

(2)風(fēng)靡制造業(yè)的工業(yè)機(jī)器人:比如海爾美的中的六軸串聯(lián)機(jī)器人,負(fù)責(zé)搬運(yùn)工作

(3)農(nóng)業(yè)機(jī)器人:育苗、采摘、蔬果分級(jí)練選、戶外載具、畜產(chǎn)機(jī)器人

(4)教育機(jī)器人,文化領(lǐng)域的助理

(5)特種機(jī)器人,深入險(xiǎn)地,執(zhí)行特種任務(wù)

(6)太空機(jī)器人,探索宇宙,開啟神秘之旅

(7)云機(jī)器人:云計(jì)算與機(jī)器人的聯(lián)合

(8)仿生機(jī)器人:仿魚鳥等

(9)仿人機(jī)器人

對(duì)社會(huì)的影響

產(chǎn)業(yè)變革:人工智能的發(fā)展勢(shì)必形成產(chǎn)業(yè)變革,很多商業(yè)模式開始重新洗牌,對(duì)創(chuàng)業(yè)者來說既是機(jī)遇也是挑戰(zhàn)

2021/5/911

人工智能簡(jiǎn)介1

失業(yè)和社會(huì)保障問題:人工智能的大規(guī)模使用,尤其是機(jī)器人的出現(xiàn),大量可重復(fù)性的工作將被機(jī)器人取代,導(dǎo)致很多人失業(yè)

貧富差距問題:將會(huì)進(jìn)一步加大,利用人工智能,有錢人將會(huì)更有錢,而窮人因?yàn)槭スぷ髯兊母F

地區(qū)發(fā)展不平衡問題:人工智能屬于高科技產(chǎn)業(yè),前期的投入非常大,一旦大規(guī)模市場(chǎng)化,則可以幫助所在地區(qū)提高生產(chǎn)效率,這意味著,缺乏人工智能技術(shù)的地區(qū),發(fā)展速度會(huì)比擁有人工智能地區(qū)慢很多,兩地發(fā)展不平衡的差距將會(huì)越來越大

產(chǎn)業(yè)結(jié)構(gòu)調(diào)整:人工智能時(shí)代,人與機(jī)器的分工,會(huì)促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整

人工智能時(shí)代的服務(wù)業(yè):服務(wù)升級(jí),下崗人員可以從事貼心的關(guān)愛型服務(wù),同時(shí)提升企業(yè)的收益

對(duì)個(gè)人的影響

失業(yè)和社會(huì)保障問題

心理層面的問題:人員的自我價(jià)值、人類的自我實(shí)現(xiàn)、人機(jī)協(xié)同時(shí)代的人類心理學(xué)

2021/5/912

大數(shù)據(jù)簡(jiǎn)介22.1 大數(shù)據(jù)的概念

大數(shù)據(jù)(bigdata):指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。

主要解決,海量數(shù)據(jù)的存儲(chǔ)和海量數(shù)據(jù)的分析計(jì)算問題。2.2 大數(shù)據(jù)的特點(diǎn)

Volume(大量):截至目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,而歷史上全人類總共說過的話的數(shù)據(jù)量大約是5EB。當(dāng)前,典型個(gè)人計(jì)算機(jī)硬盤的容量為TB量級(jí),而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級(jí)。按順序給出數(shù)據(jù)存儲(chǔ)單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

2021/5/913

大數(shù)據(jù)簡(jiǎn)介2

Velocity(高速):

這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”的報(bào)告,預(yù)計(jì)到2020年,全球數(shù)據(jù)使用量將達(dá)到35.2ZB。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是企業(yè)的生命。

天貓雙十一:2017年3分01秒,天貓交易額超過100億2021/5/914

大數(shù)據(jù)簡(jiǎn)介2

Variety(多樣):

這種類型的多樣性也讓數(shù)據(jù)被分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以數(shù)據(jù)庫/文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求。 Value(低價(jià)值密度):價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。比如公安部門的天網(wǎng)監(jiān)控視頻中,每天每一分鐘每一秒都在存儲(chǔ)數(shù)據(jù),但是公安部門關(guān)心的僅僅是發(fā)生交通事故時(shí)的那么幾分鐘的事發(fā)過程的視頻內(nèi)容。2021/5/915

大數(shù)據(jù)簡(jiǎn)介22.3 大數(shù)據(jù)面臨的主要問題

大數(shù)據(jù)時(shí)代已經(jīng)來臨,全球數(shù)據(jù)量正呈指數(shù)級(jí)的增長(zhǎng),其主要原因如下:

(1)各種傳感器的劇增及互聯(lián)網(wǎng)產(chǎn)生的各類數(shù)據(jù)、高清晰度的圖像和視頻數(shù)據(jù)

(2)自然科學(xué)研究產(chǎn)生的數(shù)據(jù)量劇增。

(3)企業(yè)及商業(yè)活動(dòng)產(chǎn)生的數(shù)據(jù)量劇增。

大數(shù)據(jù)處理的一般流程包括大數(shù)據(jù)獲取、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲(chǔ)于管理、大數(shù)據(jù)分析與挖掘及大數(shù)據(jù)可視化?;诖髷?shù)據(jù)處理流程,大數(shù)據(jù)面臨的主要問題為:

獲取問題、存儲(chǔ)問題和管理問題

第一階段即大數(shù)據(jù)的獲取、存儲(chǔ)和管理。其中,大數(shù)據(jù)獲取是指針對(duì)海量數(shù)據(jù)進(jìn)行智能化識(shí)別、定位、跟蹤及采集。大數(shù)據(jù)存儲(chǔ)和管理是指如何將采集到的大規(guī)模數(shù)據(jù)有效地存儲(chǔ)起來,建立相應(yīng)的存儲(chǔ)機(jī)制,并進(jìn)行管理和調(diào)用。

(1)網(wǎng)絡(luò)爬蟲搜索策略

(2)圖像壓縮編碼問題

檢索問題、挖掘問題和發(fā)現(xiàn)問題

第二個(gè)階段是實(shí)現(xiàn)信息檢索、數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)。這也是大數(shù)據(jù)處理流程的核心。

(1)特征向量降維:高維的文本特征向量增加了數(shù)據(jù)處理時(shí)間和復(fù)雜2021/5/916

大數(shù)據(jù)簡(jiǎn)介2度,需要降維。

(2)挖掘方法效率和效果

(3)模式評(píng)價(jià)及優(yōu)化:對(duì)挖掘出的模式進(jìn)行評(píng)價(jià)

可視化和安全問題

大數(shù)據(jù)處理的最后階段即實(shí)現(xiàn)數(shù)據(jù)可視化和確保數(shù)據(jù)的隱私和安全。面對(duì)海量的數(shù)據(jù),如何將數(shù)據(jù)或從數(shù)據(jù)中挖掘的知識(shí)清晰明朗的展現(xiàn)給用戶是大數(shù)據(jù)處理面臨的巨大挑戰(zhàn);此外,如何在分享私人數(shù)據(jù)的同時(shí),限制用戶隱私的泄露,是大數(shù)據(jù)處理面臨的另一個(gè)挑戰(zhàn)。2.4 大數(shù)據(jù)與人工智能的關(guān)系

任何智能的發(fā)展,其實(shí)都需要一個(gè)學(xué)習(xí)的過程。而近期人工智能之所以能取得突飛猛進(jìn)的進(jìn)展,不能不說是因?yàn)檫@些年來大數(shù)據(jù)長(zhǎng)足發(fā)展的結(jié)果。正是由于各類感應(yīng)器和數(shù)據(jù)采集技術(shù)的發(fā)展,我們開始擁有以往難以想象的的海量數(shù)據(jù),同時(shí),也開始在某一領(lǐng)域擁有深度的、細(xì)致的數(shù)據(jù)。而這些,都是訓(xùn)練某一領(lǐng)域“智能”的前提。

如果我們把人工智能看成一個(gè)嗷嗷待哺擁有無限潛力的嬰兒,某一領(lǐng)域?qū)I(yè)的海量的深度的數(shù)據(jù)就是喂養(yǎng)這個(gè)天才的奶粉。奶粉的數(shù)量決定了嬰兒是否能長(zhǎng)大,而奶粉的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。2021/5/917

相關(guān)算法基礎(chǔ)33.1 基于模擬機(jī)制的人工智能算法分類方法

(1)有機(jī)機(jī)制模擬 ①基于個(gè)體的模擬 模糊計(jì)算:模擬人對(duì)客觀世界認(rèn)識(shí)的不確定性 神經(jīng)網(wǎng)絡(luò):模擬人腦神經(jīng)元 支持向量機(jī):通過非線性變換將輸入空間變換到一個(gè)高維空間,然后在這個(gè)新的空間中求取最優(yōu)分類超平面 免疫計(jì)算:借鑒和利用生物免疫系統(tǒng)的信息處理機(jī)制而發(fā)展的信息處理技術(shù)

DNA計(jì)算:模擬生物分子DNA結(jié)構(gòu)進(jìn)行計(jì)算的新方法 ②基于種群的模擬 進(jìn)化計(jì)算:基于生物進(jìn)化的思想和原理來解決世界問題 群體智能:是一種在自然界生物群體行為的啟發(fā)下提出的人工智能算法實(shí)現(xiàn)模式

粒群優(yōu)化:一種基于群體搜索的算法,它建立在模擬鳥群社會(huì)的基礎(chǔ)上 蟻群算法:是一種源于大自然中生物世界的新的仿生類算法 智能代理模型 多Agent系統(tǒng)

2021/5/918

相關(guān)算法基礎(chǔ)3

(2)無機(jī)機(jī)制模擬 模擬退火:如果說神經(jīng)網(wǎng)絡(luò)和進(jìn)化計(jì)算是模擬有機(jī)界產(chǎn)生的計(jì)算方法,那么模擬退火是成功模擬無極界自然規(guī)律的結(jié)晶。 自然計(jì)算可以描述成所有新興計(jì)算分支的交集的映射集合 量子計(jì)算 (3)人造機(jī)制模擬 粗糙集:作為一種處理不精確、不確定和不完全數(shù)據(jù)的新的數(shù)學(xué)計(jì)算理論,能夠有效的處理各種不確定的信息 禁忌搜索 序數(shù)優(yōu)化 粒度計(jì)算 混沌尋優(yōu)算法 局部搜索算法 分形科學(xué)2021/5/919

相關(guān)算法基礎(chǔ)33.2 人工智能知識(shí)網(wǎng)絡(luò)系統(tǒng)總結(jié) 3.2.1

數(shù)學(xué)基礎(chǔ)

微積分、線代、概率論、信息論、集合論和圖論、博弈論 3.2.2

計(jì)算機(jī)基礎(chǔ)

計(jì)算機(jī)原理、程序設(shè)計(jì)語言(C++,Python,R)、操作系統(tǒng)、分布式系統(tǒng)、算法基礎(chǔ) 3.2.3

機(jī)器學(xué)習(xí)算法

機(jī)器學(xué)習(xí)基礎(chǔ):估計(jì)方法、特征方程

線性模型:線性回歸

邏輯回歸

決策樹模型:GBDT

支持向量機(jī)

貝葉斯分類器

神經(jīng)網(wǎng)絡(luò):深度學(xué)習(xí)——MLP,CNN,RNN,LSTM,GAN(深度學(xué)習(xí)介紹見4.6)

聚類算法:K均值算法 3.2.4

機(jī)器學(xué)習(xí)分類

監(jiān)督學(xué)習(xí)——分類任務(wù)、回歸任務(wù)

無監(jiān)督學(xué)習(xí)——聚類任務(wù)

遷移學(xué)習(xí)2021/5/920

相關(guān)算法基礎(chǔ)3

強(qiáng)化學(xué)習(xí) 3.2.5

神經(jīng)網(wǎng)絡(luò)

語言識(shí)別、字符識(shí)別——手寫識(shí)別、機(jī)器視覺、自然語言處理——機(jī)器翻譯、自動(dòng)控制、游戲理論和人機(jī)對(duì)弈(象棋、圍棋、德州撲克、星際爭(zhēng)霸)、數(shù)據(jù)挖掘 3.2.6

機(jī)器學(xué)習(xí)架構(gòu)

加速芯片:CPU、GPU、FPGA、ASIC——TPU

虛擬化:容器——Decker

分布式結(jié)構(gòu):Spark

庫和計(jì)算框架:TensorFlow、scikt-learn、Caffe、MXNET、Theano、Torch、MicrosoftCNTK

可視化解決方案

云服務(wù):AmazonML、GoogleCloudML、MicrosoftAzureML、阿里云ML 3.2.7

數(shù)據(jù)集和競(jìng)賽 ImageNet、MSCOCC、Kaggle、阿里天池 3.2.8

其他相關(guān)的人工智能技術(shù)

知識(shí)圖譜、統(tǒng)計(jì)語言模型、專家系統(tǒng)2021/5/921

相關(guān)算法基礎(chǔ)33.3 蒙特卡洛樹搜索樹算法簡(jiǎn)介 3.3.1 介紹 蒙特卡洛樹搜索是前里爾大學(xué)助理教授RemiCoulom在圍棋程序Crazystone中首先引入的方法。從最直觀的角度來看,蒙特卡洛樹搜索有一個(gè)主要目的:給出一個(gè)【游戲狀態(tài)】并選擇【勝率最高的下一步】。事實(shí)上,蒙特卡洛樹搜索是在完美信息博弈場(chǎng)景中進(jìn)行決策的算法。簡(jiǎn)單來說,完美信息博弈是指每個(gè)玩家在任意時(shí)間點(diǎn)都具有關(guān)于之前發(fā)生過的所有事件行動(dòng)的完美信息的博弈。這樣的博弈案例有國際象棋、圍棋和井子棋。但并不是說每一步行動(dòng)都已知就意味著可以計(jì)算和推斷出每一個(gè)可能的結(jié)果。比如,圍棋中合法的可能局面的數(shù)量就超過了10^170。 3.3.2 基本概念 蒙特卡洛樹搜索會(huì)多次模擬博弈,并嘗試根據(jù)模擬結(jié)果預(yù)測(cè)最優(yōu)的移動(dòng)方案。蒙特卡洛樹搜索的主要概念是搜索,即沿著博弈樹向下的一組遍歷過程。單次遍歷的路徑會(huì)從根節(jié)點(diǎn)(當(dāng)前博弈狀態(tài))延伸到?jīng)]有完全展開的節(jié)點(diǎn),未完全展開的節(jié)點(diǎn)表示其子節(jié)點(diǎn)至少有一個(gè)未訪問到。遇到未完全展開的節(jié)點(diǎn)時(shí),它的一個(gè)未訪問子節(jié)點(diǎn)將會(huì)作為單次模擬的根節(jié)點(diǎn),隨后模擬的結(jié)果將會(huì)反向傳播回當(dāng)前樹的根節(jié)點(diǎn)并更新博弈樹的節(jié)點(diǎn)統(tǒng)計(jì)數(shù)據(jù)。一旦搜索受限于時(shí)間或者計(jì)算力而終止,下一步行動(dòng)將會(huì)基于收集到的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行決策。 在模擬中,行動(dòng)可以通過rollout策略函數(shù)選擇 蒙特卡羅算法:采樣越多,越近似最優(yōu)解;

2021/5/922

相關(guān)算法基礎(chǔ)3圖片展示了如何更新節(jié)點(diǎn)的勝率,選擇勝率大的分支進(jìn)行搜索(7/10->5/6->3/3),到了3/3葉子節(jié)點(diǎn)進(jìn)行展開選擇一個(gè)action,然后進(jìn)行模擬,評(píng)估這個(gè)action的結(jié)果。然后把結(jié)果向上回溯到根節(jié)點(diǎn)。

2021/5/923

相關(guān)算法基礎(chǔ)3節(jié)點(diǎn)的統(tǒng)計(jì)數(shù)據(jù):包括模擬獎(jiǎng)勵(lì)Q(v)和總訪問次數(shù)N(v),分別反映該節(jié)點(diǎn)的潛在價(jià)值(總模擬獎(jiǎng)勵(lì))和它被探索的程度(總訪問次數(shù))。高獎(jiǎng)勵(lì)的節(jié)點(diǎn)是很好的可以利用候選,而那些訪問次數(shù)很少的也可能是有價(jià)值的。

蒙特卡羅樹搜索方法一共有四個(gè)步驟: 選舉(selection)是根據(jù)當(dāng)前獲得所有子步驟的統(tǒng)計(jì)結(jié)果,選擇一個(gè)最優(yōu)的子步驟。 擴(kuò)展(expansion)在當(dāng)前獲得的統(tǒng)計(jì)結(jié)果不足以計(jì)算出下一個(gè)步驟時(shí),隨機(jī)選擇一個(gè)子步驟。 模擬(simulation)模擬游戲,進(jìn)入下一步。 反向傳播(Back-Propagation)根據(jù)游戲結(jié)束的結(jié)果,計(jì)算對(duì)應(yīng)路徑上統(tǒng)計(jì)記錄的值。

2021/5/924

編程語言Python簡(jiǎn)介44.1 認(rèn)識(shí)Python

Python(英國發(fā)音:/?pa?θ?n/),是一種面向?qū)ο蟮慕忉屝陀?jì)算機(jī)程序設(shè)計(jì)語言,由荷蘭人GuidovanRossum(吉多·范羅蘇姆)于1989年發(fā)明,第一個(gè)公開發(fā)行版發(fā)行于1991年,已經(jīng)有了28年的歷史。 Python是純粹的免費(fèi)、開源軟件。 Python語法簡(jiǎn)潔清晰,簡(jiǎn)單易學(xué)。 Python具有豐富和強(qiáng)大的庫。常被稱為膠水語言,能夠把用其他語言制作的各種模塊(尤其是C/C++)很輕松地聯(lián)結(jié)在一起。很多人工智能相關(guān)庫使用Python寫的,因此Python是人工智能首選語言。2017年,全球編程語言排行中,Python語言排名第四2021/5/925

編程語言Python簡(jiǎn)介4

①一種腳本語言——與之對(duì)比,C是一種編譯型語言。 編譯型語言:就是需要用該語言的編譯器將源代碼編譯為可執(zhí)行程序,然后才能運(yùn)行可執(zhí)行程序的語言。即先將源代碼編譯為目標(biāo)文件,然后把目標(biāo)文件加上必要的庫文件,最后再鏈接為最終的可執(zhí)行文件。 腳本語言:無需用編譯器編譯源代碼,可直接運(yùn)行該源碼形式腳本文件的語言。而能夠直接運(yùn)行腳本文件的背后,是當(dāng)前環(huán)境中存在著此腳本的解析器。解析器負(fù)責(zé)讀入此腳本源碼,以及后續(xù)解析并執(zhí)行的動(dòng)作。

②一種解釋型語言

這是因?yàn)槟_本語言的天然特點(diǎn)之一就是解釋性。解釋器解析每一行的過程通俗講就是:讀一行,解釋一行,執(zhí)行一行。

③一種高級(jí)語言

低級(jí)語言:匯編(語言本身直接和硬件打交道,而缺少對(duì)計(jì)算機(jī)細(xì)節(jié)的抽象,相對(duì)而言不是那么好理解和使用)

高級(jí)語言:在本身的設(shè)計(jì)層面會(huì)考慮到對(duì)計(jì)算機(jī)細(xì)節(jié)的封裝和抽象。Python也完全具有常用的基本元素,如各種普通變量、列表、函數(shù)等 Python能做其他高級(jí)語言做的事情——①可以像其他高級(jí)語言一樣用來開發(fā)各種不同功能的軟件;②和其他高級(jí)語言一樣不能直接操作底層硬件。

2021/5/926

編程語言Python簡(jiǎn)介4

④一種面向?qū)ο蟮恼Z言

什么是面向?qū)ο蟮模ǜ呒?jí))語言:在設(shè)計(jì)該語言本身時(shí),對(duì)于語言本身的基本元素是以對(duì)象的方式設(shè)計(jì)的,而不同的對(duì)象之間的交互則成為整個(gè)程序運(yùn)行的主要表現(xiàn)形式。4.2 Python的應(yīng)用領(lǐng)域

目前使用Python語言的企業(yè)有很多 1.著名的Google公司在其網(wǎng)絡(luò)搜索系統(tǒng)中廣泛應(yīng)用Python語言。同時(shí)還聘用了Python之父(GuidovanRossum) 2.國外知名的YouTube視頻分享網(wǎng)站,一些重要的服務(wù)也幾乎都是用Python編寫的程序;

3.P2P文件分享系統(tǒng)Bittorrent是一個(gè)Python程序。

4.Intel(英特爾)、Cisco(思科)、Hewlett-Packard(惠普)、Seagate(希捷)、Qualcomm(高通)和IBM也都使用Python進(jìn)行硬件測(cè)試 5.JPMorganChase(摩根大通集團(tuán))、UBS(瑞士聯(lián)合銀行集團(tuán))、Getco和Citadel使用Python,經(jīng)濟(jì)市場(chǎng)預(yù)測(cè)領(lǐng)域也能看到Python的身影。 6.高科技含量的領(lǐng)域也有Python語言的身影,像是NASA(美國國家航空航天局)、LosAlamos(洛斯阿拉莫斯洛杉磯國家實(shí)驗(yàn)室)、Fermilab(費(fèi)米實(shí)驗(yàn)室)、JPL(噴氣推進(jìn)實(shí)驗(yàn)室)等使用Python實(shí)現(xiàn)科學(xué)計(jì)算任務(wù);2021/5/927

編程語言Python簡(jiǎn)介4 7.IRobot公司使用Python開發(fā)了商業(yè)機(jī)器人真空吸塵器; 8.NSA(美國國家安全局)在加密和智能分析中使用Python。

9.IronPort業(yè)界領(lǐng)先的互聯(lián)網(wǎng)信息安全產(chǎn)品提供商,也在電子郵件服務(wù)器產(chǎn)品中使用了超過100萬行的Python代碼實(shí)現(xiàn)其工作;

10.Python在用戶圖形接口領(lǐng)域也很受歡迎

Python語言的簡(jiǎn)潔和快速的開發(fā)周期,讓它十分適合開發(fā)GUI(圖形用戶界面)程序。Python內(nèi)置的TKinter的標(biāo)準(zhǔn)面向?qū)ο蠼涌赥kGUIAPI,使Python程序可以生成可移植的本地觀感的GUI。 Python編程語言應(yīng)用領(lǐng)域非常廣泛,像是游戲、圖像、人工智能、XML、機(jī)器人等等。從語言本身來講,它能實(shí)現(xiàn)其他主流語言能實(shí)現(xiàn)的所有功能,只是在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論