




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《Python人工智能技術(shù)與應(yīng)用》能力模塊一
對(duì)人工智能與自動(dòng)駕駛的基本認(rèn)知任務(wù)一調(diào)研分析人工智能技術(shù)TaskImport任務(wù)導(dǎo)入
某高校計(jì)劃舉辦“面向未來(lái):數(shù)字革命與人工智能”的講座。
你是一名人工智能科技公司的研發(fā)工程師,現(xiàn)高校計(jì)劃邀請(qǐng)你向參加講座的學(xué)生科普介紹人工智能這門新興技術(shù),你應(yīng)該如何準(zhǔn)備你的講座內(nèi)容。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)了解人工智能技術(shù)的定義與應(yīng)用。掌握人工智能技術(shù)的三要素。了解人工智能的分類。技能目標(biāo)能夠簡(jiǎn)單介紹人工智能技術(shù)的發(fā)展歷程。能夠簡(jiǎn)單介紹人工智能的發(fā)展現(xiàn)狀及面臨挑戰(zhàn)。立足專業(yè)技能,明確未來(lái)職業(yè)方向。新
授人工智能的定義與應(yīng)用01CONTENTS目錄人工智能的三要素02人工智能的分類03人工智能技術(shù)的發(fā)展歷程04人工智能技術(shù)的發(fā)展現(xiàn)狀05人工智能的定義與應(yīng)用01人工智能定義人工智能技術(shù)本質(zhì)人工智能(ArtificialIntelligence,以下簡(jiǎn)稱AI)是指研究、模擬人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。人工智能技術(shù)本質(zhì)是對(duì)人的意識(shí)和思想過(guò)程的模擬,賦予機(jī)器模擬、延伸、擴(kuò)展類人智能,實(shí)現(xiàn)會(huì)聽(tīng)、會(huì)看、會(huì)說(shuō)、會(huì)思考、會(huì)學(xué)習(xí)、會(huì)行動(dòng)等功能。人工智能的定義與應(yīng)用創(chuàng)造力智能感知能力認(rèn)知能力01人工智能四大能力人工智能的定義與應(yīng)用(一)感知能力01語(yǔ)音識(shí)別聽(tīng)電腦視覺(jué)、圖像識(shí)別、人臉識(shí)別、對(duì)象偵測(cè)看語(yǔ)音生成、文本轉(zhuǎn)換語(yǔ)音說(shuō)自然語(yǔ)言處理、語(yǔ)音轉(zhuǎn)換文本讀機(jī)器翻譯寫指的是人類通過(guò)感官所受到環(huán)境的刺激、察覺(jué)消息的能力,簡(jiǎn)單地說(shuō)就是人類五官的感知能力人工智能的定義與應(yīng)用(二)認(rèn)知能力01如AI下圍棋、自動(dòng)駕駛車、健保詐欺判斷、癌癥判斷等判斷如機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、增強(qiáng)式學(xué)習(xí)學(xué)習(xí)如醫(yī)學(xué)圖像分析、產(chǎn)品推薦、垃圾郵件辨識(shí)、法律案件分析、犯罪偵測(cè)、信用風(fēng)險(xiǎn)分析、消費(fèi)行為分析等。分析辨識(shí)如AI執(zhí)行的預(yù)防性維修(PredictiveMaintenance)、智慧天然災(zāi)害預(yù)測(cè)與防治。預(yù)測(cè)人工智能的定義與應(yīng)用(二)認(rèn)知能力01指的是人類透過(guò)學(xué)習(xí)、判斷、分析等等心理活動(dòng)來(lái)了解訊息、獲取知識(shí)的過(guò)程與能力,對(duì)人類認(rèn)知的模仿與學(xué)習(xí)也是目前AI第二個(gè)焦點(diǎn)領(lǐng)域。利用人工智能提高醫(yī)療質(zhì)量消費(fèi)者行為分析人工智能的定義與應(yīng)用(三)創(chuàng)造力01
AI作曲
AI作詩(shī)
AI設(shè)計(jì)
AI小說(shuō)AI繪畫知識(shí)智力能力個(gè)性潛意識(shí)指的是人類產(chǎn)生新思想,新發(fā)現(xiàn),新方法,新理論,新設(shè)計(jì),創(chuàng)造新事物的能力。人工智能的定義與應(yīng)用(四)智能01價(jià)值觀人類自我意識(shí)自我認(rèn)知指的是人類深刻了解人、事、物的真相,能探求真實(shí)真理、明辨是非,指導(dǎo)人類可以過(guò)有意義生活的一種能力。人工智能的三要素02數(shù)據(jù)、算法和算力是人工智能的三要素,是人工智能發(fā)展的基礎(chǔ)。定義人工智能的三要素例如:大量的歷史數(shù)據(jù),用戶行為數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù),視頻數(shù)據(jù)等。在計(jì)算機(jī)內(nèi)部,所有數(shù)據(jù)都以二進(jìn)制形式存儲(chǔ),每一位數(shù)據(jù)都由0和1組成。機(jī)器世界的數(shù)據(jù)“0”和“1數(shù)據(jù)是提供給機(jī)器學(xué)習(xí)算法的原材料02(一)數(shù)據(jù)人工智能的三要素其可以使計(jì)算機(jī)根據(jù)輸入的數(shù)據(jù),自動(dòng)執(zhí)行一系列步驟,以達(dá)到指定的目標(biāo)。生活中的算法一烹飪紅燒肉02(二)算法算法是一種特定的解決問(wèn)題的規(guī)則集人工智能的三要素02(三)算力算力是運(yùn)行算法的計(jì)算能力,指的是人工智能系統(tǒng)可以處理的任務(wù)的數(shù)量和復(fù)雜程度。算力的單位為TOPS,1TOPS代表處理器每秒鐘可進(jìn)行一萬(wàn)億次。我們熟知的8155芯片算力是8TOPS,英偉達(dá)orin芯片算力為254TOPS。人工智能的分類03超人工智能弱人工智能強(qiáng)人工智能人工智能按照與人類智能程度的匹配程度可以分人工智能的分類智能語(yǔ)音助手Siri蘋果公司語(yǔ)音助手Siri為語(yǔ)音識(shí)別領(lǐng)域的人工智能,用戶可以通過(guò)語(yǔ)音調(diào)用Siri查找信息、撥打電話、發(fā)送信息、獲取路線、播放音樂(lè)、查找蘋果設(shè)備等。例如指的是專注于且只能解決特定領(lǐng)域問(wèn)題的人工智能。(一)弱人工智能03人工智能的分類強(qiáng)人工智能思考、計(jì)劃、解決問(wèn)題、抽象思維、理解復(fù)雜理念、快速學(xué)習(xí)和從經(jīng)驗(yàn)中學(xué)習(xí)等操作,并且和人類一樣得心應(yīng)手,目前仍未發(fā)展出此技術(shù)。包含屬于人類級(jí)別的人工智能,在各方面都能與人類勝任。(二)強(qiáng)人工智能03人工智能的分類超人工智能“科學(xué)創(chuàng)新、通識(shí)和社交技能”,這是人工智能的終極目標(biāo),目前仍未實(shí)現(xiàn)。包含牛津哲學(xué)家、知名人工智能思想家尼克·博斯特倫(NickBostrom)把超人工智能定義為“在幾乎所有領(lǐng)域都比最聰明的人類大腦都聰明很多。(三)超人工智能03人工智能技術(shù)的發(fā)展歷程04人工智能產(chǎn)業(yè)化第二階段人工智能誕生第一階段人工智能爆發(fā)第三階段人工智能的發(fā)展歷程卷積神經(jīng)網(wǎng)絡(luò)的基本原理《羅素姆萬(wàn)能機(jī)器人》1921年在布拉格演出時(shí)的舞臺(tái)劇照(一)神話,幻想和預(yù)言中的AI03如:赫淮斯托斯的黃金機(jī)器人和皮格馬利翁的伽拉忒亞。19世紀(jì)的幻想小說(shuō)中出現(xiàn)了人造人和會(huì)思考的機(jī)器之類題材,例如瑪麗·雪萊的《弗蘭肯斯坦》和卡雷爾·恰佩克的《羅素姆的萬(wàn)能機(jī)器人》。希臘神話中已經(jīng)出現(xiàn)了機(jī)械人和人造人人工智能技術(shù)的發(fā)展歷程(二)人工智能的起源04英國(guó)數(shù)學(xué)家艾倫·圖靈(AlanTuring)于1950年提出著名的圖靈測(cè)試:如果一臺(tái)機(jī)器能夠與人類展開(kāi)對(duì)話(通過(guò)電傳設(shè)備)而不能被辨別出其機(jī)器身份,那么稱這臺(tái)機(jī)器具有智能。這一簡(jiǎn)化使得圖靈能夠令人信服地說(shuō)明“思考的機(jī)器”是可能的。1956年,在達(dá)特茅斯的人工智能研討會(huì)上,人工智能的創(chuàng)始人之一、美國(guó)計(jì)算機(jī)科學(xué)家約翰·麥卡錫(JohnMcCarthy)正式提出“人工智能”這個(gè)概念,人工智能被確立為一門學(xué)科,該年被公認(rèn)是現(xiàn)代人工智能學(xué)科的起始元年。1950年提出圖靈測(cè)試1956年提出“人工智能”概念人工智能技術(shù)的發(fā)展歷程(三)人工智能的第一次浪潮與困境0470年代,即使最優(yōu)秀的AI程序也只能解決簡(jiǎn)單問(wèn)題,無(wú)法再往上突破。研究者們?cè)庥隽藷o(wú)法克服的基礎(chǔ)性障礙,包括計(jì)算機(jī)的運(yùn)算能力有限、計(jì)算復(fù)雜性和指數(shù)爆炸、常識(shí)與推理等問(wèn)題。隨后,各國(guó)政府和機(jī)構(gòu)也停止或減少了資金投入。心理治療機(jī)器人在回答用戶的問(wèn)題達(dá)特茅斯會(huì)議之后的數(shù)年是大發(fā)現(xiàn)的時(shí)代計(jì)算機(jī)可以解決代數(shù)應(yīng)用題、證明幾何定理、學(xué)習(xí)和使用英語(yǔ)人工智能技術(shù)的發(fā)展歷程(四)人工智能的第二次浪潮與困境0420世紀(jì)80年代初開(kāi)始卡內(nèi)基梅隆大學(xué)為DEC(數(shù)字設(shè)備公司)設(shè)計(jì)了名為XCON的專家系統(tǒng)。1980年1981年1985年全世界的公司都開(kāi)始研發(fā)和應(yīng)用專家系統(tǒng),到1985年它們已在AI上投入十億美元以上,大部分用于公司內(nèi)設(shè)的AI部門。AI技術(shù)發(fā)展緩慢,政府停止對(duì)AI的資助。加上電腦市場(chǎng)的沖擊,AI進(jìn)入第二次發(fā)展困境期。XCON等最初大獲成功的專家系統(tǒng)維護(hù)費(fèi)用居高不下。它們難以升級(jí),難以使用,脆弱(當(dāng)輸入異常時(shí)會(huì)出現(xiàn)莫名其妙的錯(cuò)誤),暴露各類問(wèn)題。80年代后期日本經(jīng)濟(jì)產(chǎn)業(yè)省撥款八億五千萬(wàn)美元支持第五代計(jì)算機(jī)項(xiàng)目。其目標(biāo)是造出能夠與人對(duì)話,翻譯語(yǔ)言,解釋圖像,并且像人一樣推理的機(jī)器。引領(lǐng)力量是知識(shí)工程和專家系統(tǒng),專家系統(tǒng)實(shí)際上是一套程序軟件,能夠從專門的知識(shí)庫(kù)系統(tǒng)中,通過(guò)推理找到一定規(guī)律,像人類專家那樣解決某一特定領(lǐng)域的問(wèn)題。人工智能技術(shù)的發(fā)展歷程(五)人工智能的第三次浪潮與困境0420世紀(jì)90年代,計(jì)算機(jī)算力性能不斷突破,英特爾的處理器每18—24個(gè)月晶體管體積可以縮小二分之一,同樣體積上的集成電路密集度增長(zhǎng)一倍、同樣計(jì)算機(jī)的處理運(yùn)算能力可以翻一倍。20世紀(jì)90年代4G時(shí)代的到來(lái)和智能手機(jī)的普及與移動(dòng)互聯(lián)網(wǎng)的發(fā)展為神經(jīng)網(wǎng)絡(luò)訓(xùn)練迭代提供了海量的數(shù)據(jù),而IoT物聯(lián)網(wǎng)的興起和邊緣計(jì)算的支持也使傳感器時(shí)序數(shù)據(jù)指數(shù)級(jí)生成。4G時(shí)代2006年亞馬遜發(fā)布AWS云計(jì)算平臺(tái),大幅提升了人工智能網(wǎng)絡(luò)模型計(jì)算所需要的算力。2007年華裔女科學(xué)家李飛飛教授開(kāi)源了世界上最大的圖像識(shí)別數(shù)據(jù)集(超過(guò)1400萬(wàn)、2萬(wàn)多標(biāo)注類別的圖像數(shù)據(jù)集),為人工智能計(jì)算機(jī)視覺(jué)項(xiàng)目提供了強(qiáng)大的數(shù)據(jù)支持。2007-至今基于大數(shù)據(jù)的深度升級(jí)網(wǎng)絡(luò)讓人工智能重新活躍起來(lái),人工智能思維方式發(fā)生巨大改變。人工智能技術(shù)發(fā)展現(xiàn)狀和面臨挑戰(zhàn)AI已經(jīng)被廣泛應(yīng)用于交通、金融、農(nóng)業(yè)、軍事等領(lǐng)域,尤其是疫情期間,AI在醫(yī)療保健和生物醫(yī)學(xué)領(lǐng)域發(fā)揮了重要作用,例如加速了新冠病毒相關(guān)藥物的發(fā)現(xiàn),以及解決了長(zhǎng)期以來(lái)的蛋白質(zhì)折疊生物學(xué)難題。AI初創(chuàng)公司PostEra的機(jī)器學(xué)習(xí)技術(shù)能夠在48小時(shí)內(nèi)完成此前需要3~4周時(shí)間進(jìn)行的化學(xué)合成路線設(shè)計(jì),加速了新冠病毒相關(guān)藥物的發(fā)現(xiàn)。AI逐步走向產(chǎn)業(yè)化AI系統(tǒng)現(xiàn)在可以合成文本、音頻和圖像,而且水平足夠高,如得益于機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)的進(jìn)步,機(jī)器能在視覺(jué)問(wèn)答中提供更加準(zhǔn)確的自然語(yǔ)言答案。AI技術(shù)進(jìn)一步完善(一)發(fā)展現(xiàn)狀05人工智能技術(shù)發(fā)展現(xiàn)狀和面臨挑戰(zhàn)(二)面臨挑戰(zhàn)05三要素仍需不斷突破人工智能存在安全隱患帶來(lái)新的就業(yè)問(wèn)題人工智能技術(shù)發(fā)展現(xiàn)狀和面臨挑戰(zhàn)(二)面臨挑戰(zhàn)05缺乏高質(zhì)量的數(shù)據(jù)資源:Keras是一個(gè)高層次的深度學(xué)習(xí)框架,它可以用于搭建和訓(xùn)練各種神經(jīng)網(wǎng)絡(luò)模型。模型泛化能力較弱:人工智能的模型泛化能力是指,在訓(xùn)練集中學(xué)習(xí)到的模型能夠成功地應(yīng)用到未知的數(shù)據(jù)集上,從而達(dá)到準(zhǔn)確的預(yù)測(cè)結(jié)果。算力瓶頸仍然有待突破:人工智能系統(tǒng)的算力瓶頸主要源于計(jì)算機(jī)硬件的性能和能力的局限性。三要素仍需不斷突破人工智能技術(shù)發(fā)展現(xiàn)狀和面臨挑戰(zhàn)(二)面臨挑戰(zhàn)05人工智能存在安全隱患黑客對(duì)自動(dòng)駕駛中的人工智能系統(tǒng)造成威脅由于人工智能系統(tǒng)的復(fù)雜性,攻擊者可能會(huì)利用漏洞攻擊系統(tǒng),從而導(dǎo)致安全隱患。漏洞帶來(lái)的安全隱患由于人工智能系統(tǒng)可以自主學(xué)習(xí),因此它們可能會(huì)做出意想不到的決策,導(dǎo)致安全風(fēng)險(xiǎn)。自主學(xué)習(xí)帶來(lái)的安全隱患人工智能技術(shù)發(fā)展現(xiàn)狀和面臨挑戰(zhàn)(二)面臨挑戰(zhàn)05終身學(xué)習(xí)的要求:人工智能的快速發(fā)展已經(jīng)開(kāi)始或逐步取代一些傳統(tǒng)勞動(dòng)力,創(chuàng)造出新的就業(yè)崗位需求,且其快速學(xué)習(xí)和更新的能力對(duì)就業(yè)市場(chǎng)上的求職者提出了終身學(xué)習(xí)的要求。職業(yè)被大量的智能機(jī)器替代:據(jù)2013年英國(guó)牛津大學(xué)的研究報(bào)告稱,未來(lái)有700多種職業(yè)都有被智能機(jī)器替代的可能性,醫(yī)療、教育等需要高技能積累的行業(yè)也將受到人工智能的影響。帶來(lái)的新就業(yè)問(wèn)題《Python人工智能技術(shù)與應(yīng)用》任務(wù)二調(diào)研分析人工智能關(guān)鍵技術(shù)NEXT:《Python人工智能技術(shù)與應(yīng)用》能力模塊一對(duì)人工智能與自動(dòng)駕駛的基本認(rèn)知任務(wù)二調(diào)研分析人工智能關(guān)鍵技術(shù)TaskImport任務(wù)導(dǎo)入
某公司研發(fā)和銷售人工智能產(chǎn)品,客戶想了解你們公司人工智能產(chǎn)品用到了哪些人工智能技術(shù)。
你作為該公司的產(chǎn)品售后人員,需要向客戶介紹產(chǎn)品背后的人工智能關(guān)鍵技術(shù)。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)了解人類神經(jīng)元和人工神經(jīng)元。了解常見(jiàn)的深度學(xué)習(xí)算法。了解深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用。了解神經(jīng)網(wǎng)絡(luò)技術(shù)和機(jī)器學(xué)習(xí)技術(shù)原理。技能目標(biāo)掌握機(jī)器學(xué)習(xí)的流程。掌握機(jī)器學(xué)習(xí)的分類方法。掌握人工智能項(xiàng)目的生命周期,感受項(xiàng)目性思維,培養(yǎng)統(tǒng)籌思考的能力。新
授機(jī)器學(xué)習(xí)技術(shù)原理與流程01CONTENTS目錄機(jī)器學(xué)習(xí)的分類方法02深度學(xué)習(xí)技術(shù)原理與常用方法03深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用04人工智能項(xiàng)目實(shí)現(xiàn)周期05機(jī)器學(xué)習(xí)技術(shù)原理與流程01機(jī)器學(xué)習(xí)的基本原理是,計(jì)算機(jī)通過(guò)不斷從輸入數(shù)據(jù)中提取信息(數(shù)據(jù)特征)和結(jié)果(數(shù)據(jù)標(biāo)簽),學(xué)習(xí)數(shù)據(jù)標(biāo)簽和數(shù)據(jù)特征之間的相關(guān)、依存或隱藏結(jié)構(gòu)等關(guān)系或內(nèi)在規(guī)律,以優(yōu)化自身的性能,并生成最優(yōu)模型以輸出最優(yōu)結(jié)果。機(jī)器學(xué)習(xí)從數(shù)據(jù)中“學(xué)習(xí)”,“成為”最優(yōu)模型原理機(jī)器學(xué)習(xí)技術(shù)原理與流程模型構(gòu)建模型評(píng)估數(shù)據(jù)準(zhǔn)備特征工程01機(jī)器學(xué)習(xí)技術(shù)的流程機(jī)器學(xué)習(xí)的分類方法02強(qiáng)化學(xué)習(xí)半監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)機(jī)器學(xué)習(xí)的分類方法機(jī)器學(xué)習(xí)的分類方法02(一)監(jiān)督學(xué)習(xí)是指我們給算法一個(gè)數(shù)據(jù)集,并且給定正確答案。機(jī)器通過(guò)數(shù)據(jù)來(lái)學(xué)習(xí)正確答案的計(jì)算方法。通過(guò)大量人工打標(biāo)簽來(lái)幫助機(jī)器學(xué)習(xí)的方式就是監(jiān)督學(xué)習(xí)。機(jī)器學(xué)會(huì)如何識(shí)別貓和狗?操作一:給照片打上標(biāo)簽用于訓(xùn)練
操作二:計(jì)算機(jī)給出答案機(jī)器學(xué)習(xí)的分類方法02(二)非監(jiān)督學(xué)習(xí)非監(jiān)督學(xué)習(xí)中,給定的數(shù)據(jù)集沒(méi)有“正確答案”,所有的數(shù)據(jù)都是一樣的。計(jì)算機(jī)需要從給定的數(shù)據(jù)集中,通過(guò)不同的非監(jiān)督學(xué)習(xí)的算法,挖掘出潛在的結(jié)構(gòu)和關(guān)聯(lián)規(guī)則。計(jì)算機(jī)非監(jiān)督學(xué)習(xí)分類貓和狗機(jī)器學(xué)習(xí)的分類方法02(三)強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)更接近生物學(xué)習(xí)的本質(zhì),它關(guān)注的是智能體如何在環(huán)境中采取一系列行為,從而獲得最大的累積回報(bào)。通過(guò)強(qiáng)化學(xué)習(xí),一個(gè)智能體應(yīng)該知道在什么狀態(tài)下應(yīng)該采取什么行為。谷歌公司開(kāi)發(fā)的Alpha人工智能程序2016年3月9日以4比1的比分擊敗歐洲圍棋冠軍李世石,它使用深度強(qiáng)化學(xué)習(xí)來(lái)訓(xùn)練自己,以改進(jìn)自身的棋藝。機(jī)器學(xué)習(xí)的分類方法02(三)監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的聯(lián)系和區(qū)別三類學(xué)習(xí)共同點(diǎn)三類學(xué)習(xí)的聯(lián)系和區(qū)別機(jī)器學(xué)習(xí)的分支1通過(guò)數(shù)據(jù)和算法來(lái)解決問(wèn)題2通過(guò)訓(xùn)練數(shù)據(jù)來(lái)完成模型的構(gòu)建3模型的構(gòu)建也是基于數(shù)學(xué)模型的4學(xué)習(xí)方式數(shù)據(jù)有無(wú)標(biāo)簽學(xué)習(xí)目標(biāo)應(yīng)用場(chǎng)景監(jiān)督學(xué)習(xí)有標(biāo)簽預(yù)測(cè)準(zhǔn)確性分類或回歸無(wú)監(jiān)督學(xué)習(xí)無(wú)標(biāo)簽挖掘數(shù)據(jù)結(jié)構(gòu)聚類或降維強(qiáng)化學(xué)習(xí)無(wú)標(biāo)簽解決特定問(wèn)題行為策略深度學(xué)習(xí)技術(shù)原理與常用算法03深度學(xué)習(xí)是一種以人腦為模型的機(jī)器學(xué)習(xí)技術(shù),深度學(xué)習(xí)算法使用與人類類似的邏輯結(jié)構(gòu)來(lái)分析數(shù)據(jù)。深度學(xué)習(xí)使用被稱為人工神經(jīng)網(wǎng)絡(luò)的智能系統(tǒng)分層處理信息。數(shù)據(jù)從輸入層經(jīng)過(guò)多個(gè)“深度”隱藏的神經(jīng)網(wǎng)絡(luò)層,然后進(jìn)入輸出層。額外的隱藏層支持比標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)模型更強(qiáng)大的學(xué)習(xí)能力。深度學(xué)習(xí)最早可以追溯到1957年,當(dāng)時(shí)由美國(guó)計(jì)算機(jī)科學(xué)家FrankRosenblatt提出了“感知器”模型,這是深度學(xué)習(xí)的第一個(gè)模型,它允許機(jī)器從輸入信號(hào)中學(xué)習(xí),并從中提取模式。隨后,Hinton等人提出了反向傳播算法,使深度學(xué)習(xí)得以發(fā)展。此后,深度學(xué)習(xí)繼續(xù)發(fā)展,經(jīng)過(guò)幾十年的發(fā)展,已經(jīng)成為當(dāng)今最流行的機(jī)器學(xué)習(xí)技術(shù)。深度學(xué)習(xí)技術(shù)原理與常用算法(一)人類神經(jīng)元和人工神經(jīng)元03人類神經(jīng)元是由細(xì)胞體、樹突和軸突組成的,樹突接收神經(jīng)沖動(dòng)信號(hào),將其傳遞給細(xì)胞體,細(xì)胞體根據(jù)接收到的信號(hào)決定是否將其傳遞到軸突,最終通過(guò)軸突將信號(hào)傳遞給下一個(gè)神經(jīng)元或目標(biāo)組織。人類神經(jīng)元深度學(xué)習(xí)技術(shù)原理與常用算法(一)人類神經(jīng)元和人工神經(jīng)元03人工神經(jīng)網(wǎng)絡(luò)在人工神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元都有一些輸入,它們被加權(quán)并加上偏置,然后通過(guò)激活函數(shù)進(jìn)行非線性轉(zhuǎn)換。這個(gè)非線性轉(zhuǎn)換類似于人類神經(jīng)元中的信號(hào)處理過(guò)程。人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)原理與常用算法(一)人類神經(jīng)元和人工神經(jīng)元03加權(quán):在這個(gè)過(guò)程中,每個(gè)輸入信號(hào)都與一個(gè)權(quán)重相關(guān)聯(lián)。權(quán)重表示每個(gè)輸入信號(hào)對(duì)神經(jīng)元的影響程度。全連接層類似于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),第一層為輸入層,中間若干個(gè)隱藏層,最后一個(gè)輸出層。偏置:是一個(gè)常數(shù),它可以控制神經(jīng)元的激活閾值,用公式表示,一個(gè)神經(jīng)元的輸出可以表示為:Output=ActivationFunction(WeightedSumofInputs+Bias)其中,ActivationFunction是激活函數(shù),WeightedSumofInputs是輸入信號(hào)的加權(quán)和,Bias是偏置。即輸出結(jié)果y=激活函數(shù)f(k(x)+b。03深度學(xué)習(xí)技術(shù)原理與常用算法(二)神經(jīng)網(wǎng)絡(luò)技術(shù)原理
信息流程:輸入層—〉隱藏層—〉輸出層輸入層輸入層接收外部輸入;01輸入層輸出層產(chǎn)生神經(jīng)網(wǎng)絡(luò)的輸出;02隱藏層隱藏層則在輸入層和輸出層之間進(jìn)行信息處理。層與層之間的神經(jīng)元可以相互連接,形成神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu);0303深度學(xué)習(xí)技術(shù)原理與常用算法(三)常見(jiàn)的深度學(xué)習(xí)算法卷積神經(jīng)網(wǎng)絡(luò)提取數(shù)字“7”流程架構(gòu)卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)技術(shù),它使用卷積運(yùn)算來(lái)提取圖像中的特征,以實(shí)現(xiàn)圖像分類和識(shí)別。它的結(jié)構(gòu)類似于人類視覺(jué)系統(tǒng),可以模擬人類的視覺(jué)感知過(guò)程,因此可以在圖像分類和識(shí)別任務(wù)上取得更好的效果。卷積神經(jīng)網(wǎng)絡(luò)03深度學(xué)習(xí)技術(shù)原理與常用算法(三)常見(jiàn)的深度學(xué)習(xí)算法深度循環(huán)神經(jīng)網(wǎng)絡(luò)的架構(gòu)循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)是一種特殊的神經(jīng)網(wǎng)絡(luò),它具有循環(huán)結(jié)構(gòu),能夠處理具有時(shí)間和序列特征的數(shù)據(jù)。RNN具有記憶功能,能夠記住之前某個(gè)時(shí)刻的信息,并在之后的時(shí)刻使用這些信息。RNN在自然語(yǔ)言處理,語(yǔ)音識(shí)別,機(jī)器翻譯,機(jī)器學(xué)習(xí),時(shí)間序列分析等領(lǐng)域有著廣泛的應(yīng)用。循環(huán)神經(jīng)網(wǎng)絡(luò)03深度學(xué)習(xí)技術(shù)原理與常用算法(三)常見(jiàn)的深度學(xué)習(xí)算法生成對(duì)抗網(wǎng)絡(luò)——“生成器”和“判別器”生成對(duì)抗網(wǎng)絡(luò)(GANs)是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),用于生成新的有趣的圖像或文本。它通過(guò)分別訓(xùn)練兩個(gè)模型(生成器和判別器)來(lái)實(shí)現(xiàn),其中生成器用于生成新的圖像,判別器用于判斷圖像的真實(shí)性。這兩個(gè)模型互相抵消,使得生成器可以生成更加真實(shí)的圖像。生成對(duì)抗網(wǎng)絡(luò)在近年來(lái)在眾多領(lǐng)域中取得了廣泛的應(yīng)用和熱門,例如在自然語(yǔ)言應(yīng)用領(lǐng)域,可以用于對(duì)話系統(tǒng)中的回復(fù)生成、文本摘要、語(yǔ)音轉(zhuǎn)文本等任務(wù)。生成對(duì)抗網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(一)深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)04深度學(xué)習(xí)是一種基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法,它使用多層次的神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜的問(wèn)題。高效的特征提取能力更高的計(jì)算效率更強(qiáng)的泛化能力諸多優(yōu)勢(shì)傳統(tǒng)機(jī)器學(xué)習(xí)VS深度學(xué)習(xí)04深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(一)深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)深度學(xué)習(xí)具有更強(qiáng)大的特征提取能力深度神經(jīng)網(wǎng)絡(luò)可以通過(guò)多個(gè)層次的變換,從原始輸入數(shù)據(jù)中自動(dòng)學(xué)習(xí)和提取出具有高度表征能力的表征信息。更好地捕捉數(shù)據(jù)的本質(zhì)特征,從而更準(zhǔn)確地預(yù)測(cè)結(jié)果完成后續(xù)任務(wù)。01深度學(xué)習(xí)模型具有更高的計(jì)算效率深度學(xué)習(xí)模型可以利用大量的計(jì)算資源,從而更快地訓(xùn)練模型,提高計(jì)算效率。02深度學(xué)習(xí)模型具有更強(qiáng)的泛化能力深度學(xué)習(xí)模型可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到更多的特征,從而提高模型的泛化能力,更好地應(yīng)用到新數(shù)據(jù)中。03特征提取04深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(二)深度學(xué)習(xí)技術(shù)的應(yīng)用幫助呼叫中心座席并對(duì)呼叫進(jìn)行自動(dòng)分類;將臨床對(duì)話實(shí)時(shí)轉(zhuǎn)換為文檔;為視頻和會(huì)議記錄添加準(zhǔn)確的字幕以實(shí)現(xiàn)更廣泛的內(nèi)容覆蓋范圍。深度學(xué)習(xí)模型可以分析人類語(yǔ)音,盡管說(shuō)話模式、音調(diào)、語(yǔ)氣、語(yǔ)言和口音不盡相同。虛擬助手(如AmazonAlexa)和自動(dòng)轉(zhuǎn)錄軟件使用語(yǔ)音識(shí)別執(zhí)行以下任務(wù):深度學(xué)習(xí)與語(yǔ)音識(shí)別04深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(二)深度學(xué)習(xí)技術(shù)的應(yīng)用汽車研發(fā)人員正在使用深度學(xué)習(xí)來(lái)自動(dòng)檢測(cè)物體,如停車標(biāo)志和紅綠燈。此外,深度學(xué)習(xí)還用于探查行人,這有助于減少交通事故。計(jì)算機(jī)視覺(jué)是指計(jì)算機(jī)從圖像和視頻中提取信息及見(jiàn)解的能力,計(jì)算機(jī)視覺(jué)具有多種應(yīng)用,如上所示。內(nèi)容審核圖像分類面部識(shí)別深度學(xué)習(xí)與自動(dòng)駕駛汽車深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)04(一)數(shù)據(jù)自動(dòng)虛擬座席和聊天機(jī)器人自動(dòng)總結(jié)文件或新聞文章長(zhǎng)格式文檔(如電子郵件和表格)的業(yè)務(wù)情報(bào)分析用于表示情緒(如社交媒體上的正面和負(fù)面評(píng)論)的關(guān)鍵短語(yǔ)索引功能計(jì)算機(jī)使用深度學(xué)習(xí)算法從文本數(shù)據(jù)和文檔中收集見(jiàn)解和意義。這種處理自然的、人工創(chuàng)建的文本的能力有幾個(gè)使用場(chǎng)景。深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用人工智能項(xiàng)目實(shí)現(xiàn)周期05人工智能項(xiàng)目是指利用人工智能技術(shù)來(lái)解決實(shí)際問(wèn)題的研究項(xiàng)目,其中包括機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、機(jī)器視覺(jué)等技術(shù)。它們可以應(yīng)用于自動(dòng)駕駛、語(yǔ)音識(shí)別、智能家居等領(lǐng)域,實(shí)現(xiàn)智能化的解決方案。需求分析:需要確定項(xiàng)目的目標(biāo),評(píng)估需求,設(shè)計(jì)概念,并確定可行性。數(shù)據(jù)收集:需要收集用于訓(xùn)練人工智能模型的數(shù)據(jù)。模型訓(xùn)練:盡可能減小模型預(yù)測(cè)值與實(shí)際值之間的差異。模型評(píng)估:需要評(píng)估模型的性能,并對(duì)其進(jìn)行優(yōu)化。模型部署:將訓(xùn)練好的模型應(yīng)用于實(shí)際場(chǎng)景的過(guò)程,是人工智能項(xiàng)目的最終目標(biāo)。常見(jiàn)的部署方式有云端部署、邊緣部署、本地部署、移動(dòng)端部署。一般會(huì)分為以下幾個(gè)階段《Python人工智能技術(shù)與應(yīng)用》任務(wù)三調(diào)研分析人工智能技術(shù)在智能駕駛汽車中的應(yīng)用NEXT:《Python人工智能技術(shù)與應(yīng)用》能力模塊一
對(duì)人工智能與自動(dòng)駕駛的基本認(rèn)知任務(wù)三調(diào)研分析人工智能技術(shù)在智能駕駛汽車中的應(yīng)用TaskImport任務(wù)導(dǎo)入
某互聯(lián)網(wǎng)科技公司的打算尋找傳統(tǒng)汽車制造廠商合作開(kāi)發(fā)無(wú)人駕駛汽車。你作為該公司的市場(chǎng)方案人員,需要向傳統(tǒng)汽車制造廠商介紹人工智能技術(shù)如何為傳統(tǒng)汽車賦能。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)了解人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用。了解人工智能技術(shù)在智能座艙應(yīng)用場(chǎng)景中的作用。了解人工智能技術(shù)在智能汽車維護(hù)和管理中的應(yīng)用。技能目標(biāo)能夠列舉3條以上人工智能在自動(dòng)駕駛的應(yīng)用場(chǎng)景。能夠區(qū)分人工智能在自動(dòng)駕駛中的不同層面的應(yīng)用,培養(yǎng)邏輯分析思維能力。新
授人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用01CONTENTS目錄人工智能技術(shù)在智能座艙應(yīng)用場(chǎng)景中的應(yīng)用02人工智能技術(shù)在智能汽車維護(hù)與管理中的應(yīng)用03人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用01自動(dòng)車道控制ALC實(shí)現(xiàn)技術(shù)20世紀(jì)90年代,當(dāng)時(shí)美國(guó)國(guó)家公路交通安全管理局(NHTSA)的研究人員開(kāi)始使用機(jī)器視覺(jué)技術(shù)來(lái)研究自動(dòng)駕駛。他們開(kāi)發(fā)了一種名為“自動(dòng)車道控制”(ALC)的系統(tǒng)。該系統(tǒng)可以檢測(cè)車輛前方的路況,并自動(dòng)控制車輛的轉(zhuǎn)向、加速和減速。此外,研究人員還利用機(jī)器學(xué)習(xí)技術(shù)來(lái)研究自動(dòng)駕駛,以實(shí)現(xiàn)自動(dòng)化的駕駛行為。配置“自動(dòng)車道控制”(ALC)系統(tǒng)功能顯示01技術(shù)融合:人工智能應(yīng)用于汽車自動(dòng)駕駛,主要是將計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)與GPS定位技術(shù)、傳感器技術(shù)、大數(shù)據(jù)技術(shù)等進(jìn)行有機(jī)融合。深度學(xué)習(xí):獲取大量的地圖數(shù)據(jù)、行車軌跡數(shù)據(jù)、駕駛行為數(shù)據(jù)、場(chǎng)景數(shù)據(jù)等,并進(jìn)行深度學(xué)習(xí)。決策控制:制定精確的汽車路徑規(guī)劃和駕駛行為決策,實(shí)現(xiàn)汽車的自感知、自學(xué)習(xí)、自適應(yīng)和自控制,實(shí)現(xiàn)對(duì)汽車的自動(dòng)化、智能化控制。人工智能應(yīng)用于汽車自動(dòng)駕駛?cè)斯ぶ悄芗夹g(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用01(一)感知技術(shù)汽車自動(dòng)駕駛通過(guò)人工智能的環(huán)境感知功能,實(shí)現(xiàn)對(duì)汽車駕駛環(huán)境的全面、高效、無(wú)死角、無(wú)時(shí)差的感知,提供更加正確、精確、安全的駕駛軌跡預(yù)測(cè)和建議,從而提升駕駛安全性。利用傳感器、激光雷達(dá)、攝像頭、定位技術(shù)等對(duì)交通燈、交通標(biāo)志、車道線、動(dòng)態(tài)物體、車道軌跡、汽車定位等進(jìn)行即時(shí)的檢測(cè)、識(shí)別和跟蹤。即時(shí)地檢測(cè)、識(shí)別和跟蹤01(一)感知技術(shù)汽車自動(dòng)駕駛通過(guò)人工智能的環(huán)境感知功能,實(shí)現(xiàn)對(duì)汽車駕駛環(huán)境的全面、高效、無(wú)死角、無(wú)時(shí)差的感知,提供更加正確、精確、安全的駕駛軌跡預(yù)測(cè)和建議,從而提升駕駛安全性。并利用深度學(xué)習(xí)和線性回歸算法等進(jìn)行算法支持?jǐn)?shù)據(jù)分析。數(shù)據(jù)分析人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用01人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用通過(guò)大量的環(huán)境交互數(shù)據(jù),利用深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)算法,實(shí)現(xiàn)對(duì)行車路徑規(guī)劃和駕駛行為決策的最優(yōu)設(shè)計(jì)和即時(shí)提供,以提升汽車自動(dòng)駕駛的安全性和精確性。利用神經(jīng)網(wǎng)絡(luò)決定是否“超車”(二)規(guī)劃決策01(三)車輛控制汽車自動(dòng)駕駛中的車輛控制是車輛在智能系統(tǒng)的控制指令下達(dá)后進(jìn)行車輛設(shè)備進(jìn)行精確、即時(shí)操作,實(shí)現(xiàn)對(duì)汽車的自動(dòng)控制。人工智能在車輛控制領(lǐng)域主要通過(guò)模糊控制技術(shù)模型預(yù)測(cè)控制技術(shù)模糊控制技術(shù)是智能系統(tǒng)對(duì)傳感器傳來(lái)的信息進(jìn)行綜合分析、計(jì)算和處理,通過(guò)模糊算法對(duì)控制指令的優(yōu)先級(jí)進(jìn)行判斷,然后發(fā)布操作指令,對(duì)汽車控制模塊進(jìn)行電氣控制;模型預(yù)測(cè)控制技術(shù)是將大量的模型控制數(shù)據(jù)和情況推理過(guò)程等形成的數(shù)據(jù)信息,由智能系統(tǒng)進(jìn)行深度學(xué)習(xí),然后對(duì)汽車的實(shí)際情況進(jìn)行分析,和模型控制數(shù)據(jù)進(jìn)行比對(duì)、模擬和預(yù)測(cè)。人工智能技術(shù)在自動(dòng)駕駛技術(shù)中的應(yīng)用02可以用來(lái)實(shí)現(xiàn)智能座艙應(yīng)用場(chǎng)景中的智能交互:如語(yǔ)音控制、視覺(jué)檢測(cè)。智能交互中的人工智能:如多媒體音樂(lè),AR增強(qiáng)現(xiàn)實(shí)技術(shù)的HUD等人工智能人工智能在智能座艙應(yīng)用場(chǎng)景中的應(yīng)用人工智能在智能座艙應(yīng)用場(chǎng)景中的應(yīng)用(一)語(yǔ)音控制02提供有關(guān)車輛當(dāng)前狀態(tài)自動(dòng)駕駛控制功能控制車輛的安全功能氣候控制
導(dǎo)航和音頻系統(tǒng)
車道偏離警告
自動(dòng)緊急制動(dòng)
燃油量
速度和位置(二)視覺(jué)檢測(cè)02指紋識(shí)別智能座艙中的視覺(jué)交互技術(shù)增強(qiáng)現(xiàn)實(shí)人臉識(shí)別虛擬娛樂(lè)乘客的身份驗(yàn)證虛擬現(xiàn)實(shí)虹膜識(shí)別人工智能在智能座艙應(yīng)用場(chǎng)景中的應(yīng)用03人工智能技術(shù)在智能汽車維護(hù)與管理中的應(yīng)用預(yù)測(cè)性維護(hù)通過(guò)采用監(jiān)控和預(yù)測(cè)建模來(lái)確定機(jī)器的狀況并預(yù)測(cè)可能發(fā)生故障的內(nèi)容以及何時(shí)會(huì)發(fā)生。它試圖預(yù)測(cè)未來(lái)的問(wèn)題,而不是已經(jīng)存在的問(wèn)題。在這方面,預(yù)測(cè)性維護(hù)可以為自動(dòng)駕駛汽車提供。(一)監(jiān)控車輛狀況03來(lái)自車輛的數(shù)據(jù)日志包含有關(guān)駕駛員行為的信息,這些信息可用于交通事故分析。在自動(dòng)駕駛汽車的使用中,這些數(shù)據(jù)可用于處理索賠。(二)保險(xiǎn)數(shù)據(jù)收集人工智能技術(shù)在智能汽車維護(hù)與管理中的應(yīng)用《Python人工智能技術(shù)與應(yīng)用》任務(wù)一認(rèn)知Python基礎(chǔ)命令NEXT:《Python人工智能技術(shù)與應(yīng)用》能力模塊二
掌握Python人工智能的基礎(chǔ)應(yīng)用任務(wù)一認(rèn)知Python基礎(chǔ)命令TaskImport任務(wù)導(dǎo)入某專注于汽車行業(yè)的傳統(tǒng)商業(yè)咨詢公司計(jì)劃開(kāi)發(fā)屬于自己公司內(nèi)部的可視化商業(yè)智能BI(BusinessIntelligence)產(chǎn)品,可以幫助汽車公司、經(jīng)銷商、零部件供應(yīng)商等各種汽車行業(yè)相關(guān)企業(yè)進(jìn)行數(shù)據(jù)分析和決策支持。你作為團(tuán)隊(duì)中的Python助理工程師,你的崗位職責(zé)是協(xié)助開(kāi)發(fā)團(tuán)隊(duì)進(jìn)行調(diào)試、測(cè)試等事宜?,F(xiàn)你需要為團(tuán)隊(duì)搭建好Python的開(kāi)發(fā)環(huán)境并運(yùn)行一些Python的基礎(chǔ)命令測(cè)試開(kāi)發(fā)環(huán)境,方便團(tuán)隊(duì)后續(xù)對(duì)項(xiàng)目的開(kāi)發(fā)。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)了解人工智能項(xiàng)目開(kāi)發(fā)方式。了解Python的變量以及變量賦值。了解Python標(biāo)準(zhǔn)數(shù)據(jù)類型以及數(shù)據(jù)類型之間的轉(zhuǎn)換。了解Python變量運(yùn)算及運(yùn)算符優(yōu)先級(jí)。了解Python的選擇和循環(huán)語(yǔ)句以及函數(shù)。技能目標(biāo)掌握Python的虛擬環(huán)境和環(huán)境變量。掌握Python的安裝及其環(huán)境的搭建。掌握Python編譯器JupyterNotebook的安裝和啟動(dòng)。培養(yǎng)勤于實(shí)踐的職業(yè)習(xí)慣。新
授Python函數(shù)06CONTENTS目錄Python文件操作07Python安裝環(huán)境搭建08Python在人工智能中的應(yīng)用01Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)化02Python變量與賦值03Python變量運(yùn)算及與運(yùn)算優(yōu)先級(jí)04Python選擇和循環(huán)語(yǔ)句05機(jī)器學(xué)習(xí)技術(shù)原理與流程01(一)人工智能項(xiàng)目開(kāi)發(fā)方式無(wú)代碼開(kāi)發(fā)人工智能項(xiàng)目是指使用可視化工具來(lái)構(gòu)建和部署人工智能應(yīng)用,而無(wú)需編寫代碼。常用的平臺(tái)有GoogleAutoML、BigML、H20.ai、AzureMLStudio。無(wú)代碼開(kāi)發(fā)
AzureMLStudio的編輯界面機(jī)器學(xué)習(xí)技術(shù)原理與流程01(一)人工智能項(xiàng)目開(kāi)發(fā)方式常用的開(kāi)發(fā)人工智能項(xiàng)目的編程語(yǔ)言有Python、Java、C++等編程語(yǔ)言開(kāi)發(fā)人工智能項(xiàng)目無(wú)代碼開(kāi)發(fā)可以快速構(gòu)建出一個(gè)原型,快速驗(yàn)證設(shè)計(jì)的想法。但無(wú)法實(shí)現(xiàn)復(fù)雜的功能、可擴(kuò)展性差,無(wú)法滿足項(xiàng)目的長(zhǎng)期發(fā)展需求。學(xué)習(xí)使用編程語(yǔ)言實(shí)現(xiàn)人工智能項(xiàng)目的開(kāi)發(fā)可掌握項(xiàng)目的實(shí)現(xiàn)過(guò)程,從而更好地改進(jìn)和調(diào)整項(xiàng)目的功能。04Python結(jié)構(gòu)簡(jiǎn)單比如定義變量時(shí)不需要指明數(shù)據(jù)類型,允許給同一個(gè)變量賦值不同類型的數(shù)據(jù)。深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(二)Python是最受歡迎的人工智能語(yǔ)言和傳統(tǒng)的c/C++、Java、C#等語(yǔ)言相比04Python擁有豐富的數(shù)據(jù)結(jié)構(gòu),支持列表、字典、元組等多種數(shù)據(jù)結(jié)構(gòu),可以方便地操作和處理數(shù)據(jù)。Python支持類似NumPy和Pandas的數(shù)據(jù)處理模塊,可以快速處理大量數(shù)據(jù)。Python還擁有多種數(shù)據(jù)可視化工具,可以將處理后的數(shù)據(jù)可視化,更容易理解和分析數(shù)據(jù)。強(qiáng)大的數(shù)據(jù)處理能力Python擁有強(qiáng)大的數(shù)據(jù)處理能力,可以幫助開(kāi)發(fā)者快速處理大量數(shù)據(jù),提高工作效率滿足各種復(fù)雜的數(shù)據(jù)處理需求。深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(二)Python是最受歡迎的人工智能語(yǔ)言04跨平臺(tái)性:支持Linux、Windows、MacosX等操作系統(tǒng)。兼容性:支持x86、ARM和Powerpc等處理器架構(gòu)。優(yōu)秀的跨平臺(tái)性和兼容性Python具有良好的跨平臺(tái)性和兼容性,使得人工智能項(xiàng)目的開(kāi)發(fā)和部署可以在多種操作系統(tǒng)上運(yùn)行,并且可以在不同的處理器架構(gòu)上運(yùn)行。深度學(xué)習(xí)技術(shù)的優(yōu)勢(shì)與應(yīng)用(二)Python是最受歡迎的人工智能語(yǔ)言機(jī)器學(xué)習(xí)的分類方法02隨著人工智能技術(shù)的飛速發(fā)展,Python編程語(yǔ)言成了實(shí)現(xiàn)人工智能的最佳選擇。表中羅列了學(xué)習(xí)人工智能技術(shù)需要掌握的Python相關(guān)知識(shí)。Python基礎(chǔ)知識(shí)語(yǔ)法、變量、數(shù)據(jù)類型、控制結(jié)構(gòu)、函數(shù)、類、模塊等Python數(shù)據(jù)科學(xué)庫(kù)NumPy、Pandas、Matplotlib、SciPy等機(jī)器學(xué)習(xí)和深度學(xué)習(xí)庫(kù)Scikit-Learn、TensorFlow、Keras等計(jì)算機(jī)視覺(jué)庫(kù)OpenCV、Pillow、scikit-image等自然語(yǔ)言處理庫(kù)NLTK、StanfordNLP、Gensim等語(yǔ)音識(shí)別庫(kù)SpeechRecognition、PyAudio等
人工智能相關(guān)的Python知識(shí)(三)人工智能相關(guān)的Python知識(shí)機(jī)器學(xué)習(xí)的分類方法02在Python中,一系列類、函數(shù)會(huì)封裝在模塊中,構(gòu)成一個(gè)個(gè)優(yōu)秀的庫(kù)(Library),方便使用者在各種場(chǎng)合使用。簡(jiǎn)而言之就是指封裝特定的功能,完成特定任務(wù)的文件。(三)人工智能相關(guān)的Python知識(shí)標(biāo)準(zhǔn)庫(kù)(StandardLibrary)第三方庫(kù)(ThirdLibrary)Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換02Python數(shù)據(jù)類型轉(zhuǎn)換函數(shù)描述int(x[,base])將x轉(zhuǎn)換為一個(gè)整數(shù)float(x)將x轉(zhuǎn)換到一個(gè)浮點(diǎn)數(shù)complex(real[,imag])創(chuàng)建一個(gè)復(fù)數(shù)str(x)將對(duì)象x轉(zhuǎn)換為字符串repr(x)將對(duì)象x轉(zhuǎn)換為表達(dá)式字符串eval(str)用來(lái)計(jì)算在字符串中的有效Python表達(dá)式,并返回一個(gè)對(duì)象tuple(s)將序列s轉(zhuǎn)換為一個(gè)元組list(s)將序列s轉(zhuǎn)換為一個(gè)列表set(s)轉(zhuǎn)換為可變集合dict(d)創(chuàng)建一個(gè)字典。d必須是一個(gè)(key,value)元組序列。frozenset(s)轉(zhuǎn)換為不可變集合chr(x)將一個(gè)整數(shù)轉(zhuǎn)換為一個(gè)字符ord(x)將一個(gè)字符轉(zhuǎn)換為它的整數(shù)值hex(x)將一個(gè)整數(shù)轉(zhuǎn)換為一個(gè)十六進(jìn)制字符串oct(x)將一個(gè)整數(shù)轉(zhuǎn)換為一個(gè)八進(jìn)制字符串(一)標(biāo)準(zhǔn)數(shù)據(jù)類型標(biāo)準(zhǔn)數(shù)據(jù)類型是指編程語(yǔ)言中定義的一組有限的數(shù)據(jù)類型,它們用于定義一個(gè)程序中的變量、常量、表達(dá)式等。它們的作用是提供給程序員一種方便的方式來(lái)表示和操作數(shù)據(jù),從而提高程序的可讀性和可維護(hù)性。Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換02(二)Python標(biāo)準(zhǔn)數(shù)據(jù)類型整型(int)
浮點(diǎn)型(float)字符串(str)布爾型(bool)
列表(list)
元組(tuple)字典(dict)等存儲(chǔ)在內(nèi)存中的數(shù)據(jù)可以有多種類型。例如,一個(gè)人的年齡存儲(chǔ)為一個(gè)數(shù)值,他或她的地址存儲(chǔ)為字母數(shù)字字符。
在Python中每一個(gè)變量都有指定的變量類型,即Python標(biāo)準(zhǔn)數(shù)據(jù)類型,用于定義數(shù)據(jù)可能進(jìn)行的操作以及每種數(shù)據(jù)的存儲(chǔ)方法。Python標(biāo)準(zhǔn)數(shù)據(jù)類型Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換02(二)Python標(biāo)準(zhǔn)數(shù)據(jù)類型用于存儲(chǔ)數(shù)值
類似于List(列表)
集合類的數(shù)據(jù)結(jié)構(gòu)
最靈活的內(nèi)置數(shù)據(jù)結(jié)構(gòu)由數(shù)字、字母、下劃線組成數(shù)字字符串列表元組字典例:var1=1,var2=10例:s
=
'ilovepython'例:list
=
['apple',
'jack',
798,
2.22,
36]例:Tuple=("a","b","c","d")Tuple=([1,2,3],"a",3,)例:dict={'name':'yqq','school':'bj','age':25}Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換02(二)Python標(biāo)準(zhǔn)數(shù)據(jù)類型對(duì)數(shù)據(jù)內(nèi)置的類型進(jìn)行轉(zhuǎn)換,數(shù)據(jù)類型的轉(zhuǎn)換,一般情況下只需要將數(shù)據(jù)類型作為函數(shù)名即可。Python數(shù)據(jù)類型轉(zhuǎn)換可以分為兩種隱式類型轉(zhuǎn)換和顯示類型轉(zhuǎn)換:數(shù)據(jù)類型轉(zhuǎn)換隱式數(shù)據(jù)類型轉(zhuǎn)換顯式數(shù)據(jù)類型轉(zhuǎn)換Python標(biāo)準(zhǔn)數(shù)據(jù)類型及數(shù)據(jù)類型轉(zhuǎn)換02(二)Python標(biāo)準(zhǔn)數(shù)據(jù)類型通過(guò)使用int()、float)、strl)等預(yù)定義函數(shù),限制已定義類型變量的類型,來(lái)執(zhí)行顯式類型轉(zhuǎn)換。顯式數(shù)據(jù)類型轉(zhuǎn)換例如對(duì)兩種不同類型的數(shù)據(jù)進(jìn)行運(yùn)算,較低數(shù)據(jù)類型(整數(shù))就會(huì)自動(dòng)轉(zhuǎn)換為較高數(shù)據(jù)類型(浮點(diǎn)數(shù))以避免數(shù)據(jù)丟失。隱式數(shù)據(jù)類型轉(zhuǎn)換Python隱式類型轉(zhuǎn)換示例Python變量與賦值03在編程語(yǔ)言中,將數(shù)據(jù)放入變量的過(guò)程叫做賦值(Assignment)。Python使用等號(hào)=作為賦值運(yùn)算符,例如這里的a=3。賦值可以看成一個(gè)小箱子,專門用來(lái)“盛裝”程序中的數(shù)據(jù)。每個(gè)變量都擁有獨(dú)一無(wú)二的名字,通過(guò)變量的名字就能找到變量中的數(shù)據(jù),這里a是變量的名字,3是存放在這個(gè)變量中的數(shù)據(jù)。變量Python變量賦值——將“3”賦值到“a”中Python變量運(yùn)算及與運(yùn)算優(yōu)先級(jí)04運(yùn)算符說(shuō)明Python運(yùn)算符優(yōu)先級(jí)算術(shù)運(yùn)算符+、-、*、/、%、//從左至右比較運(yùn)算符==、!=、<、>、<=、>=從左至右賦值運(yùn)算符=、+=、-=、*=、/=從右至左邏輯運(yùn)算符and、or、not從左至右成員運(yùn)算符in、notin從左至右是指使用變量來(lái)完成數(shù)學(xué)計(jì)算的過(guò)程。Python變量運(yùn)算包括加減乘除、取余、比較運(yùn)算等。Python運(yùn)算符也稱Python操作符,主要包含有算術(shù)運(yùn)算符、比較運(yùn)算符、賦值運(yùn)算符、邏輯運(yùn)算符、成員運(yùn)算符。變量運(yùn)算又稱變量操作Python主要運(yùn)算符優(yōu)先級(jí)說(shuō)明Python變量運(yùn)算及與運(yùn)算優(yōu)先級(jí)04優(yōu)先級(jí)排序括號(hào)比較運(yùn)算符邏輯運(yùn)算符成員運(yùn)算符算術(shù)運(yùn)算符賦值運(yùn)算符Python選擇和循環(huán)語(yǔ)句05Python中的選擇和循環(huán)語(yǔ)句是用來(lái)控制程序的執(zhí)行流程,它們可以讓程序在特定條件下執(zhí)行不同的操作,提供了一種通過(guò)條件來(lái)控制代碼執(zhí)行順序的方法,從而實(shí)現(xiàn)更復(fù)雜的功能。Python選擇和循環(huán)語(yǔ)句05(一)選擇語(yǔ)句if語(yǔ)句elif語(yǔ)句else語(yǔ)句if語(yǔ)句檢查一個(gè)條件,如果條件為真,則執(zhí)行相應(yīng)的代碼塊,如果條件為假,則跳過(guò)代碼塊。lif語(yǔ)句用于檢查其他條件,如果條件為真,則執(zhí)行相應(yīng)的代碼塊,如果條件為假,則跳過(guò)代碼塊。else語(yǔ)句用于在所有條件都不滿足的情況下執(zhí)行代碼塊。Python選擇和循環(huán)語(yǔ)句05(二)循環(huán)語(yǔ)句while語(yǔ)句for語(yǔ)句while循環(huán)檢查一個(gè)條件,如果條件為真,則重復(fù)執(zhí)行代碼塊,直到條件為假。for循環(huán)用于遍歷一個(gè)集合中的每個(gè)元素,每次循環(huán)都會(huì)執(zhí)行一次代碼塊,直到遍歷完所有元素。Python函數(shù)06函數(shù)是一個(gè)可以接收輸入,并返回一個(gè)輸出的可重復(fù)使用的代碼塊。函數(shù)可以組織代碼,減少重復(fù),并使程序更容易維護(hù)和調(diào)試。函數(shù)參數(shù)函數(shù)體返回值Python函數(shù)關(guān)鍵概念內(nèi)建函數(shù),比如print()提供創(chuàng)建函數(shù)的功能,即用戶自定義函數(shù)Python函數(shù)有兩類函數(shù)機(jī)器學(xué)習(xí)的分類方法02函數(shù)體是函數(shù)定義中的一部分,用于定義函數(shù)執(zhí)行的功能,函數(shù)體可以包含多條語(yǔ)句,也可以是空語(yǔ)句。倒數(shù)第二層是函數(shù)定義時(shí)聲明的變量,用于接收外部傳入的實(shí)參值,以便在函數(shù)體內(nèi)使用。最上層函數(shù)返回值是函數(shù)執(zhí)行的結(jié)果,可以是任何類型的值,也可以是空值,用于指示函數(shù)的執(zhí)行結(jié)果,以便調(diào)用者可以根據(jù)返回值作出相應(yīng)的處理。最底層Python用戶自定義函數(shù)的結(jié)構(gòu)Python文件操作07文件的輸入(Input)和輸出(Output)功能,即編程語(yǔ)言中的文件I/O功能。比如把用鍵盤來(lái)敲代碼看作輸入,那對(duì)應(yīng)的輸出便是顯示器顯示圖案,磁盤中的I/O指的是硬盤和內(nèi)存之間的輸入輸出。計(jì)算機(jī)程序Python程序程序計(jì)算機(jī)中文件
文件可以長(zhǎng)久保存數(shù)據(jù)將程序中的數(shù)據(jù)輸出到文件中Output從文件中讀取數(shù)據(jù)輸入到程序中:InputPython文件的輸入與輸出(文件I/O流程)深度學(xué)習(xí)技術(shù)原理與常用算法07
Python提供了I/O函數(shù),實(shí)現(xiàn)文件的基本操作,比如打開(kāi)文件、讀取和追加數(shù)據(jù)、插入和刪除數(shù)據(jù)、關(guān)閉文件、刪除文件等。Python常用文件操作及其解釋說(shuō)明Python文件操作解釋說(shuō)明打開(kāi)/關(guān)閉文件使用open()函數(shù)打開(kāi)文件,使用close()函數(shù)關(guān)閉文件讀寫文件使用read()函數(shù)讀取文件,使用write()函數(shù)寫入文件查找文件使用os.walk()函數(shù)查找文件文件復(fù)制使用shutil.copy()函數(shù)復(fù)制文件文件移動(dòng)使用shutil.move()函數(shù)移動(dòng)文件刪除文件使用os.remove()函數(shù)刪除文件Python安裝環(huán)境搭建(一)Python環(huán)境變量和虛擬環(huán)境08Windows和DOS操作系統(tǒng)中的PATH環(huán)境變量,當(dāng)要求系統(tǒng)運(yùn)行一個(gè)程序而沒(méi)有告訴它程序所在的完整路徑時(shí),系統(tǒng)除了在當(dāng)前目錄下面尋找此程序外,還應(yīng)到PATH中指定的路徑去找。用戶通過(guò)設(shè)置環(huán)境變量,當(dāng)在系統(tǒng)中從命令行運(yùn)行任何非默認(rèn)程序時(shí),機(jī)器會(huì)在當(dāng)前文件夾或WindowsPATH中查找可執(zhí)行文件,使得用戶無(wú)需在每一次運(yùn)行程序的時(shí)候輸入程序的完整路徑。運(yùn)行Pvthon的時(shí)候同樣如此,需要在Windows操作系統(tǒng)上將Pvthon添加到PATH,才可以運(yùn)行Pvthon解釋器、啟動(dòng)虛擬編程環(huán)境。Python環(huán)境變量環(huán)境變量是描述環(huán)境的變量,是指在操作系統(tǒng)中用來(lái)指定操作系統(tǒng)運(yùn)行環(huán)境的變量。它包含了一個(gè)或者多個(gè)應(yīng)用程序所將使用到的信息。Python安裝環(huán)境搭建(一)Python環(huán)境變量和虛擬環(huán)境08Python虛擬環(huán)境虛擬環(huán)境是一個(gè)包含了特定Python解析器以及所依賴的特定版本的第三方庫(kù),不同的應(yīng)用程序可以使用不同的虛擬環(huán)境,從而解決了依賴沖突問(wèn)題,而且虛擬環(huán)境中只需要安裝應(yīng)用相關(guān)的包或者模塊,可以給部署提供便利。虛擬環(huán)境解釋說(shuō)明virtualenvvirtualenv是一個(gè)創(chuàng)建獨(dú)立Python環(huán)境的工具,它可以在不同的項(xiàng)目之間分隔和隔離Python環(huán)境。condaconda是一個(gè)開(kāi)源的包管理系統(tǒng),可以安裝,運(yùn)行和管理多個(gè)Python版本的軟件包及其依賴關(guān)系。pyenvpyenv是一個(gè)Python版本管理工具,可用于在不同的Python版本之間切換,并且可以輕松地將應(yīng)用程序部署到不同的環(huán)境中。Python函數(shù)06集成開(kāi)發(fā)環(huán)境(IntegratedDevelopmentEnvironment,IDE)是一種軟件工具,用于支持軟件開(kāi)發(fā)人員編寫、組織、測(cè)試和調(diào)試代碼。IDE通常提供一個(gè)集成的用戶界面,以幫助開(kāi)發(fā)人員更容易地編寫、調(diào)試和測(cè)試代碼。AnacondaPyCharmSpyderPython的集成開(kāi)發(fā)環(huán)境(IDE)為開(kāi)發(fā)者提供了一系列靈活的工具(二)Python集成開(kāi)發(fā)環(huán)境Python安裝環(huán)境搭建08Anaconda兼容性強(qiáng),在Windows、MacOSX和Linux上都可以運(yùn)行,支持Python2.7和Python3.5及更高版本。Anaconda提供了一個(gè)可以使用簡(jiǎn)單pip命令和conda命令安裝第三方包的環(huán)境,可以用來(lái)編寫和調(diào)試Python程序。Anaconda還提供了一個(gè)JupyterNotebook,可以用來(lái)創(chuàng)建和共享文檔,其中包含代碼、數(shù)學(xué)方程、可視化和更多內(nèi)容。AnacondaAnaconda是一個(gè)由ContinuumAnalytics開(kāi)發(fā)的Python發(fā)行版,它包含了conda、Python等180多個(gè)第三方庫(kù)。Anaconda的目標(biāo)是簡(jiǎn)化包管理和部署。(二)Python集成開(kāi)發(fā)環(huán)境Python安裝環(huán)境搭建08JupyterNotebook提供了一個(gè)環(huán)境,可以在其中記錄代碼,運(yùn)行代碼,查看結(jié)果,可視化數(shù)據(jù)并在查看輸出結(jié)果。JupyterNotebook成為一款執(zhí)行端到端數(shù)據(jù)科學(xué)工作流程的便捷工具,可以用于數(shù)據(jù)清理,統(tǒng)計(jì)建模,構(gòu)建和訓(xùn)練機(jī)器學(xué)習(xí)模型,可視化數(shù)據(jù)以及許多其他用途。
JupyterNotebook是當(dāng)前應(yīng)用最廣泛的人工智能項(xiàng)目程序運(yùn)行工具。JupyterNotebookJupyterNotebook是一個(gè)交互式編程環(huán)境,可以用來(lái)創(chuàng)建和共享文檔,其中包含代碼,數(shù)學(xué)方程,可視化和文本。同時(shí)可創(chuàng)建并共享代碼和文檔。(二)Python集成開(kāi)發(fā)環(huán)境JupyterNotebook工具特點(diǎn)《Python人工智能技術(shù)與應(yīng)用》任務(wù)二完成Python網(wǎng)絡(luò)爬蟲實(shí)訓(xùn)NEXT:《Python人工智能技術(shù)與應(yīng)用》能力模塊二
掌握Python人工智能的基礎(chǔ)應(yīng)用任務(wù)二完成Python網(wǎng)絡(luò)爬蟲實(shí)訓(xùn)TaskImport任務(wù)導(dǎo)入
BI產(chǎn)品需要大量的高質(zhì)量的數(shù)據(jù),該商業(yè)咨詢公司已擁有的數(shù)據(jù)量無(wú)法形成較大的數(shù)據(jù)規(guī)模,現(xiàn)需要解決數(shù)據(jù)的來(lái)源問(wèn)題。你作為該公司商業(yè)智能團(tuán)隊(duì)中的Python爬蟲工程師,你的主要職責(zé)是開(kāi)發(fā)和維護(hù)一個(gè)自動(dòng)化的爬蟲系統(tǒng),從互聯(lián)網(wǎng)上獲取大量的數(shù)據(jù)。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)認(rèn)識(shí)網(wǎng)絡(luò)爬蟲的基本流程。了解Python爬蟲工具庫(kù)及其使用方法。了解Python實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲的流程及其Python實(shí)現(xiàn)。掌握使用Selenium庫(kù)實(shí)現(xiàn)對(duì)汽車之家網(wǎng)站的連接和訪問(wèn)。技能目標(biāo)掌握使用Lxml庫(kù)實(shí)現(xiàn)對(duì)汽車之家網(wǎng)站的解析。掌握使用xlswriter實(shí)現(xiàn)對(duì)爬取后的汽車之家口碑?dāng)?shù)據(jù)進(jìn)行保存。能夠思考確定Python爬取汽車之家口碑?dāng)?shù)據(jù)的整體思路,培養(yǎng)開(kāi)拓進(jìn)取的職業(yè)態(tài)度。新
授CONTENTS目錄網(wǎng)絡(luò)爬蟲基本流程01常見(jiàn)Python爬蟲工具庫(kù)02爬取汽車之家口碑?dāng)?shù)據(jù)項(xiàng)目實(shí)訓(xùn)0301難以滿足不同用戶的檢索目的和需求有限的搜索引擎服務(wù)器資源與無(wú)限的網(wǎng)絡(luò)數(shù)據(jù)資源之間的矛盾圖片、數(shù)據(jù)庫(kù)、音頻、視頻多媒體等不同數(shù)據(jù)的發(fā)現(xiàn)和獲取基于關(guān)鍵字的檢索難以支持基于語(yǔ)義信息的查詢。網(wǎng)絡(luò)爬蟲基本流程搜索引擎可以幫助人們檢索信息,如百度、搜狗、谷歌等,但也存在一定的局限性。01網(wǎng)絡(luò)爬蟲基本流程網(wǎng)絡(luò)爬蟲(又稱網(wǎng)頁(yè)蜘蛛,網(wǎng)絡(luò)機(jī)器人,在FOAF社區(qū)中間,更經(jīng)常地被稱為網(wǎng)頁(yè)追逐者),是一種按照一定的規(guī)則,自動(dòng)地抓取萬(wàn)維網(wǎng)信息的程序或者腳本。網(wǎng)絡(luò)爬蟲是一種程序,可以自動(dòng)化地從互聯(lián)網(wǎng)上收集信息。確定要爬取的網(wǎng)站和頁(yè)面發(fā)送HTTP請(qǐng)求解析HTML內(nèi)容提取數(shù)據(jù)存儲(chǔ)數(shù)據(jù)循環(huán)迭代網(wǎng)絡(luò)爬蟲概念網(wǎng)絡(luò)爬蟲基本流程01網(wǎng)絡(luò)爬蟲基本流程當(dāng)目標(biāo)網(wǎng)站響應(yīng)請(qǐng)求時(shí),它會(huì)返回一個(gè)HTML文檔。你需要解析HTML文檔,以提取你感興趣的信息。Python中常用的解析庫(kù)有BeautifulSoup和Ixml等。解析HTML內(nèi)容一旦你解析了HTML內(nèi)容,你需要提取你需要的數(shù)據(jù)。你可以使用Pvthon中的正則表達(dá)式或解析庫(kù)提供的工具來(lái)查找和提取信息。提取數(shù)據(jù)首先,你需要確定要爬取的網(wǎng)站和頁(yè)面。你可以選擇從一個(gè)或多個(gè)網(wǎng)站開(kāi)始,然后選擇要爬取的頁(yè)面。確定要爬取的網(wǎng)站和頁(yè)面在開(kāi)始爬取之前,需要向目標(biāo)網(wǎng)站發(fā)送HTTP請(qǐng)求。這可以通過(guò)使用Python中的請(qǐng)求庫(kù)(例如Requests庫(kù))來(lái)完成。你需要向目標(biāo)網(wǎng)站發(fā)送請(qǐng)求,并等待它們響應(yīng)。發(fā)送HTTP請(qǐng)求01網(wǎng)絡(luò)爬蟲基本流程首先,你需要確定要爬取的網(wǎng)站和頁(yè)面。你可以選擇從一個(gè)或多個(gè)網(wǎng)站開(kāi)始,然后選擇要爬取的頁(yè)面。確定要爬取的網(wǎng)站和頁(yè)面在開(kāi)始爬取之前,需要向目標(biāo)網(wǎng)站發(fā)送HTTP請(qǐng)求。這可以通過(guò)使用Python中的請(qǐng)求庫(kù)(例如Requests庫(kù))來(lái)完成。你需要向目標(biāo)網(wǎng)站發(fā)送請(qǐng)求,并等待它們響應(yīng)。發(fā)送HTTP請(qǐng)求網(wǎng)絡(luò)爬蟲的基本流程示意圖常見(jiàn)Python爬蟲工具庫(kù)02(一)Selenium庫(kù)序號(hào)描述命令1創(chuàng)建一個(gè)Chrome瀏覽器對(duì)象driver=webdriver.Chrome()2打開(kāi)指定的網(wǎng)頁(yè)driver.get(url)3查找一個(gè)網(wǎng)頁(yè)元素,通過(guò)XPath定位element=driver.find_element_by_xpath(xpath)4查找一個(gè)網(wǎng)頁(yè)元素,通過(guò)CSS選擇器定位element=driver.find_element_by_css_selector(css_selector)5在網(wǎng)頁(yè)元素中輸入文本element.send_keys(keys)6單擊網(wǎng)頁(yè)元素element.click()7在瀏覽器中執(zhí)行JavaScript代碼driver.execute_script(script)8獲取當(dāng)前網(wǎng)頁(yè)源代碼driver.page_source9返回上一個(gè)網(wǎng)頁(yè)driver.back()Python的Selenium庫(kù)是一個(gè)用于自動(dòng)化測(cè)試和網(wǎng)頁(yè)爬取的工具,它可以模擬用戶在瀏覽器中的操作,如打開(kāi)網(wǎng)頁(yè)、填寫表單、點(diǎn)擊按鈕等,可以對(duì)JavaScript生成的內(nèi)容進(jìn)行操作,并獲取網(wǎng)頁(yè)中的數(shù)據(jù)。右表為Selenium庫(kù)操作流程。常見(jiàn)Python爬蟲工具庫(kù)02(二)Lxml庫(kù)Python的Lxml庫(kù)是一個(gè)用于處理XML和HTML文檔的Python庫(kù),它是基于C實(shí)現(xiàn)的,具有高性能和高效率的特點(diǎn)。Lxml庫(kù)提供了ElementTreeAPI的增強(qiáng)版,支持XPath和CSS選擇器等高級(jí)功能,能夠?qū)ML和HTML文檔進(jìn)行解析、修改和生成等操作。右表為L(zhǎng)xml庫(kù)操作流程。序號(hào)描述命令1導(dǎo)入lxml庫(kù)中的etree模塊fromlxmlimportetree2將HTML字符串轉(zhuǎn)換為lxml.etree._Element對(duì)象etree.HTML(html_string)3將HTML文件解析為lxml.etree._ElementTree對(duì)象etree.parse(file_path)4在元素中使用XPath表達(dá)式搜索子元素并返回結(jié)果列表etree.xpath(xpath_expression)5獲取元素的指定屬性值etree.get('attribute_name')6獲取元素的文本內(nèi)容etree.text7獲取元素的標(biāo)簽名稱etree.tag8獲取元素的父元素etree.getparent()9查找所有具有指定標(biāo)簽名稱的子元素etree.findall('tag_name')10查找第一個(gè)具有指定標(biāo)簽名稱的子元素etree.find('tag_name')11返回元素的迭代器,可以使用for循環(huán)遍歷子元素etree.iter()12返回元素的子元素列表etree.getchildren()13將元素及其子元素序列化為字符串etree.tostring(element)14將元素及其子元素序列化為Unicode字符串etree.tostring(element,encoding='unicode')常見(jiàn)Python爬蟲工具庫(kù)02(三)xlsxwriter庫(kù)xlsxwriter是Python的第三方庫(kù),用于在Excel文件中創(chuàng)建和編輯電子表格。它提供了許多功能,如自動(dòng)調(diào)整列寬、格式化單元格、插入圖表和公式等。右表為xlsxwriter庫(kù)操作流程。序號(hào)描述指令1安裝xlswriterpipinstallXlsxWriter2創(chuàng)建Excel文件#創(chuàng)建一個(gè)新的Excel文件workbook=xlsxwriter.Workbook('example.xlsx')3創(chuàng)建工作表#創(chuàng)建一個(gè)名為“Sheet1”的工作表worksheet=workbook.add_worksheet('Sheet1')4編寫數(shù)據(jù)#寫入數(shù)據(jù)到單元格(A1)worksheet.write('A1','Hello')5指定單元格格式#創(chuàng)建文本格式對(duì)象text_format=workbook.add_format({'num_format':'@'})#在單元格(A2)寫入文本,并應(yīng)用文本格式worksheet.write('A2','World',text_format)#創(chuàng)建數(shù)字格式對(duì)象num_format=workbook.add_format({'num_format':'0.00'})#在單元格(B1)寫入數(shù)字,并應(yīng)用數(shù)字格式worksheet.write('B1',123.456,num_format)6保存Excel文件#關(guān)閉Excel文件workbook.close()03汽車之家是一個(gè)汽車行業(yè)門戶網(wǎng)站,它提供了廣泛的汽車信息,包括汽車口碑?dāng)?shù)據(jù)。汽車之家的口碑?dāng)?shù)據(jù)是基于用戶提交的評(píng)論、評(píng)分和其他數(shù)據(jù)編制的??刹捎萌缦路绞綄?shí)現(xiàn)案例:爬取汽車之家口碑?dāng)?shù)據(jù)項(xiàng)目實(shí)訓(xùn)(一)實(shí)現(xiàn)思路使用Selenium打開(kāi)汽車之家網(wǎng)站
使用Lxml庫(kù)解析網(wǎng)頁(yè)
將數(shù)據(jù)保存到excel文件03爬取汽車之家口碑?dāng)?shù)據(jù)項(xiàng)目實(shí)訓(xùn)(二)實(shí)現(xiàn)流程使用Selenium打開(kāi)汽車之家網(wǎng)站,獲取頁(yè)面的HTML源碼創(chuàng)建一個(gè)ChromeOptions對(duì)象,并添加了一些參數(shù)來(lái)配置瀏覽器選項(xiàng);通過(guò)指定ChromeDriver的路徑和選項(xiàng)來(lái)創(chuàng)建一個(gè)WebDriver對(duì)象,用它來(lái)控制瀏覽器進(jìn)行打開(kāi)指定網(wǎng)頁(yè)和獲取網(wǎng)頁(yè)HTML代碼的操作;通過(guò)XPath解析器lxml.html.fromstring()將HTML代碼轉(zhuǎn)換成可操作的樹形結(jié)構(gòu),返回給調(diào)用者。03爬取汽車之家口碑?dāng)?shù)據(jù)項(xiàng)目實(shí)訓(xùn)(二)實(shí)現(xiàn)流程使用Lxml庫(kù)解析網(wǎng)頁(yè)使用Lxml庫(kù)中的tree.xpath方法解析汽車之家網(wǎng)頁(yè)數(shù)據(jù)的車系名稱、購(gòu)買車型、用戶名稱、綜合口碑得分等。將數(shù)據(jù)保存到excel文件使用xlswriter的Workbook、add_worksheet、activate的方法將數(shù)據(jù)保存到excel?!禤ython人工智能技術(shù)與應(yīng)用》任務(wù)三
Python數(shù)據(jù)探索性分析NEXT:《Python人工智能技術(shù)與應(yīng)用》能力模塊二
掌握Python人工智能的基礎(chǔ)應(yīng)用任務(wù)三
Python數(shù)據(jù)探索性分析TaskImport任務(wù)導(dǎo)入解決了產(chǎn)品開(kāi)發(fā)和數(shù)據(jù)來(lái)源的問(wèn)題,BI產(chǎn)品的最后一步是進(jìn)行數(shù)據(jù)探索性分析,通過(guò)對(duì)數(shù)據(jù)進(jìn)行探索,更好地理解客戶、發(fā)現(xiàn)業(yè)務(wù)機(jī)會(huì)、幫助決策制定等。
作為該商業(yè)咨詢公司商業(yè)智能團(tuán)隊(duì)中的Python數(shù)據(jù)分析師,你的主要職責(zé)是使用Python編程語(yǔ)言和數(shù)據(jù)分析工具來(lái)處理和分析大量數(shù)據(jù),具體包括數(shù)據(jù)清洗和預(yù)處理、數(shù)據(jù)分析和建模、可視化和報(bào)告等,現(xiàn)在需要你通過(guò)使用Python腳本在該BI產(chǎn)品中對(duì)數(shù)據(jù)進(jìn)行探索性分析,確定影響汽車銷售量?jī)r(jià)格、保險(xiǎn)費(fèi)用等關(guān)鍵因素,了解汽車市場(chǎng)的潛在需求和趨勢(shì),為汽車市場(chǎng)研究和市場(chǎng)策略制定提供支持。素養(yǎng)目標(biāo)引導(dǎo)問(wèn)題的過(guò)程中,培養(yǎng)學(xué)生形成勤于思考的能力獲得分析解決問(wèn)題以及多元化思考解決問(wèn)題的方法,形成創(chuàng)新意識(shí)。TaskObject任務(wù)目標(biāo)知識(shí)目標(biāo)了解數(shù)據(jù)探索性分析的定義。了解數(shù)據(jù)探索性分析的流程。了解Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)。能夠判斷數(shù)據(jù)集特征的類別。技能目標(biāo)掌握使用matplotlib實(shí)現(xiàn)對(duì)不同類別數(shù)據(jù)的可視化。掌握使用numpy庫(kù)、Pandas庫(kù)實(shí)現(xiàn)對(duì)數(shù)據(jù)的缺失值、異常值、變量相關(guān)關(guān)系的洞察.能夠思考并確定對(duì)汽車產(chǎn)品數(shù)據(jù)探索性分析的思路。在實(shí)踐中培養(yǎng)決策分析的職業(yè)能力。新
授Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05CONTENTS目錄汽車產(chǎn)品數(shù)據(jù)探索性分析項(xiàng)目實(shí)現(xiàn)06數(shù)據(jù)探索性分析技術(shù)認(rèn)知01數(shù)據(jù)分類02數(shù)據(jù)可視化03洞察數(shù)據(jù)0401數(shù)據(jù)探索性分析技術(shù)認(rèn)知數(shù)據(jù)探索性分析主要用于查看哪些數(shù)據(jù)可以揭示超出常規(guī)建模或假設(shè)檢驗(yàn)任務(wù)的洞察,幫助更好地理解數(shù)據(jù)集變量以及它們之間的關(guān)系;數(shù)據(jù)探索性分析是成功實(shí)現(xiàn)人工智能與機(jī)器學(xué)習(xí)的第一步;數(shù)據(jù)是用來(lái)描述特定事物或概念的信息,可以是文本、數(shù)字、圖像或其他形式的信息;探索性數(shù)據(jù)分析被數(shù)據(jù)科學(xué)家用于分析和調(diào)查數(shù)據(jù)集并總結(jié)其主要特征,通常采用數(shù)據(jù)可視化方法;01數(shù)據(jù)探索性分析技術(shù)認(rèn)知探索報(bào)表數(shù)據(jù)的趨勢(shì)數(shù)據(jù)分類02數(shù)據(jù)探索性分析步驟探索性數(shù)據(jù)分析的過(guò)程大致分為3步:數(shù)據(jù)分類、數(shù)據(jù)可視化、洞察數(shù)據(jù)。數(shù)據(jù)分類02在數(shù)據(jù)科學(xué)領(lǐng)域,一般將數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。而對(duì)應(yīng)地,非表格形式組織的都是非結(jié)構(gòu)化數(shù)據(jù)。例如:文本、圖片、視頻等。世界上20%數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù),80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)指的是能夠用表格來(lái)組織的數(shù)據(jù)。例如:Excel里的數(shù)據(jù)、數(shù)據(jù)庫(kù)MySQL里的數(shù)據(jù)等。結(jié)構(gòu)化數(shù)據(jù)
結(jié)構(gòu)化數(shù)據(jù)VS非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)分類02結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)定類等級(jí)定比等級(jí)定序等級(jí)定距等級(jí)定性數(shù)據(jù)定量數(shù)據(jù)數(shù)據(jù)分類02結(jié)構(gòu)化數(shù)據(jù)在定類等級(jí)的基礎(chǔ)上加了自然排序,這樣我們就可以對(duì)不同數(shù)據(jù)進(jìn)行比較。例如:餐廳的評(píng)星,公司的考核等級(jí)。定序等級(jí)是數(shù)據(jù)的第一個(gè)等級(jí),其結(jié)構(gòu)最弱。只需要按照名稱來(lái)分類。例如:血型(A,B,AB,O)、姓名、顏色。定類等級(jí)數(shù)據(jù)的4個(gè)等級(jí)示意數(shù)據(jù)分類02結(jié)構(gòu)化數(shù)據(jù)是在定距等級(jí)的基礎(chǔ)上,加入了絕對(duì)零點(diǎn),不但可以做加減的運(yùn)算,還可以做乘除的運(yùn)算。例如:金錢、重量。定比等級(jí)一定是數(shù)值類型的,并且這些數(shù)值不僅可以用來(lái)排序,還可以用來(lái)加減。例如:華氏度、攝氏度(溫度有負(fù)數(shù),不可以進(jìn)行乘除運(yùn)算)。定距等級(jí)數(shù)據(jù)的4個(gè)等級(jí)示意數(shù)據(jù)可視化03
數(shù)據(jù)可視化是一種將數(shù)據(jù)抽象成圖表或圖形的過(guò)程,它可以幫助人們更容易理解數(shù)據(jù),從而更快捷地分析出數(shù)據(jù)中的趨勢(shì)和模式。用于表示一組數(shù)據(jù)的分布情況,可以很直觀地看出每個(gè)分組所占的比例。餅圖數(shù)據(jù)可視化03
數(shù)據(jù)可視化是一種將數(shù)據(jù)抽象成圖表或圖形的過(guò)程,它可以幫助人們更容易理解數(shù)據(jù),從而更快捷地分析出數(shù)據(jù)中的趨勢(shì)和模式。用于表示一組數(shù)據(jù)的分布情況,可以很直觀地看出每個(gè)分組的大小。條形圖數(shù)據(jù)可視化03
數(shù)據(jù)可視化是一種將數(shù)據(jù)抽象成圖表或圖形的過(guò)程,它可以幫助人們更容易理解數(shù)據(jù),從而更快捷地分析出數(shù)據(jù)中的趨勢(shì)和模式。用于表示兩個(gè)變量之間的關(guān)系,比如時(shí)間與價(jià)格之間的關(guān)系或者不同產(chǎn)品之間的銷量關(guān)系。拆線圖數(shù)據(jù)可視化03
數(shù)據(jù)可視化是一種將數(shù)據(jù)抽象成圖表或圖形的過(guò)程,它可以幫助人們更容易理解數(shù)據(jù),從而更快捷地分析出數(shù)據(jù)中的趨勢(shì)和模式。箱線圖是一種用于表示數(shù)據(jù)分布情況的圖表,它由一個(gè)箱子和兩條線組成箱線圖03不同數(shù)據(jù)等級(jí)對(duì)應(yīng)的可視化方法數(shù)據(jù)可視化數(shù)據(jù)等級(jí)屬性描述性統(tǒng)計(jì)圖表定類離散、無(wú)序頻率占比、眾數(shù)條形圖、餅圖定序有序類別、比較頻率、眾數(shù)、中位數(shù)、百分位數(shù)條形圖、餅圖定距數(shù)字差別有意義頻率、眾數(shù)、中位數(shù)、均值、標(biāo)準(zhǔn)差條形圖、餅圖、箱線圖定比連續(xù)均值、標(biāo)準(zhǔn)差條形圖、曲線圖、餅圖、箱線圖04缺失值:如果數(shù)據(jù)中存在缺失值,可能會(huì)導(dǎo)致模型的結(jié)果不準(zhǔn)確,或者無(wú)法獲得正確的結(jié)論。例如,在分析一個(gè)用戶的消費(fèi)行為時(shí),如果某個(gè)用戶的收入數(shù)據(jù)缺失,則無(wú)法準(zhǔn)確判斷該用戶的消費(fèi)能力。異常值:如果數(shù)據(jù)中存在異常值,可能會(huì)導(dǎo)致模型的結(jié)果不準(zhǔn)確,或者無(wú)法獲得正確的結(jié)論。例如,在分析一個(gè)用戶的消費(fèi)行為時(shí),如果某個(gè)用戶的收入數(shù)據(jù)存在異常值,則無(wú)法準(zhǔn)確判斷該用戶的消費(fèi)能力。重復(fù)值:如果數(shù)據(jù)中存在重復(fù)值,可能會(huì)導(dǎo)致模型的結(jié)果不準(zhǔn)確,或者無(wú)法獲得正確的結(jié)論。例如,在分析一個(gè)用戶的消費(fèi)行為時(shí),如果某個(gè)用戶的收入數(shù)據(jù)存在重復(fù)值,則無(wú)法準(zhǔn)確判斷該用戶的消費(fèi)能力。洞察數(shù)據(jù)(一)檢查數(shù)據(jù)中是否存在缺失值、異常值或重復(fù)值04例如,一家公司想要探究為什么他們的產(chǎn)品銷量不佳,那么他們應(yīng)該先區(qū)分出對(duì)于銷量最重要的數(shù)據(jù),比如產(chǎn)品價(jià)格、宣傳渠道、產(chǎn)品質(zhì)量等,而不重要的數(shù)據(jù)就可以忽略,比如產(chǎn)品的顏色、外觀等。洞察數(shù)據(jù)(二)區(qū)分重要數(shù)據(jù)
區(qū)分出重要與不重要的數(shù)據(jù)對(duì)于探究問(wèn)題至關(guān)重要,因?yàn)檫@樣可以更好地把握關(guān)鍵信息,更加準(zhǔn)確地分析出問(wèn)題的根源,從而給出更有效的解決方案。04(三)探究數(shù)據(jù)之間的關(guān)聯(lián)洞察數(shù)據(jù)探究數(shù)據(jù)之間的關(guān)聯(lián)可以幫助我們更好地了解數(shù)據(jù)之間的聯(lián)系,從而更好地理解數(shù)據(jù)的分布特點(diǎn),并有針對(duì)性地對(duì)數(shù)據(jù)進(jìn)行分析和處理。例如,假設(shè)我們正在研究一個(gè)城市的人口變化,我們可以通過(guò)探究不同年齡段人口數(shù)量的變化,以及不同性別人口數(shù)量的變化,來(lái)探究城市人口的變化趨勢(shì),并從中分析出相關(guān)的結(jié)論。Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(一)Matplotlib庫(kù)實(shí)現(xiàn)數(shù)據(jù)的可視化Matplotlib庫(kù)Matplotlib是一個(gè)強(qiáng)大的數(shù)據(jù)可視化的Python庫(kù),在數(shù)據(jù)探索性分析中可以幫助用戶快速可視化數(shù)據(jù),從而更好地理解數(shù)據(jù)的特征和分布。Matplotlib提供了一系列用于繪制圖形的函數(shù)和工具。它可以用于創(chuàng)建各種各樣的2D圖表,包括線型圖,條形圖,散點(diǎn)圖,折線圖,餅圖,直方圖,箱形圖,熱圖等。它還可以用于創(chuàng)建3D圖形。Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(一)Matplotlib庫(kù)實(shí)現(xiàn)數(shù)據(jù)的可視化功能命令導(dǎo)入matplotlib庫(kù)importmatplotlib.pyplotasplt畫圖plt.plot()設(shè)置圖形大小plt.figure(figsize=(x,y))設(shè)置標(biāo)題plt.title()設(shè)置坐標(biāo)軸標(biāo)簽plt.xlabel()、plt.ylabel()設(shè)置坐標(biāo)軸刻度plt.xticks()、plt.yticks()設(shè)置圖例plt.legend()設(shè)置網(wǎng)格線plt.grid()顯示圖形plt.show()Matplotlib基礎(chǔ)功能及其命令Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(一)Matplotlib庫(kù)實(shí)現(xiàn)數(shù)據(jù)的可視化Matplotlib繪制不同類型的圖形圖形類型繪制函數(shù)直方圖matplotlib.pyplot.hist()折線圖matplotlib.pyplot.plot()散點(diǎn)圖matplotlib.pyplot.scatter()餅圖matplotlib.pyplot.pie()條形圖matplotlib.pyplot.bar()箱線圖matplotlib.pyplot.boxplot()Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(二)Numpy庫(kù)和Pandas庫(kù)實(shí)現(xiàn)數(shù)據(jù)的洞察Numpy可以用來(lái)執(zhí)行快速的數(shù)據(jù)分析和探索性分析。例如快速計(jì)算統(tǒng)計(jì)量,計(jì)算矩陣運(yùn)算,以及處理復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。它還可以用來(lái)進(jìn)行數(shù)據(jù)可視化,以及創(chuàng)建更復(fù)雜的數(shù)據(jù)可視化,以及利用其他類庫(kù)進(jìn)行更復(fù)雜的數(shù)據(jù)分析。NumPy基礎(chǔ)Numpy支持二維數(shù)組(2DArray)三維數(shù)組(3DArray)一維數(shù)組(1DArray)Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(二)Numpy庫(kù)和Pandas庫(kù)實(shí)現(xiàn)數(shù)據(jù)的洞察NumPy基礎(chǔ)Numpy數(shù)組結(jié)構(gòu)圖Numpy數(shù)組定義圖Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(二)Numpy庫(kù)和Pandas庫(kù)實(shí)現(xiàn)數(shù)據(jù)的洞察ndarrary是NumPy中專門用于操作數(shù)組的模塊,通過(guò)ndarrary可實(shí)現(xiàn)數(shù)組之間的基本算術(shù)運(yùn)算與索引、切片等高級(jí)運(yùn)算。ndarrary基礎(chǔ)操作數(shù)組的創(chuàng)建:numpy.empty,numpy.zeros,numpy.ones數(shù)組的算術(shù)運(yùn)算:numpy.arrary.sum()、numpy.arrary.max()、numpy.arrary.min()等。數(shù)組的索引和切片:arrary[2:7:2]、arrary[1:]、arrary[2:5]數(shù)組的屬性查詢:numpy.arrary.dtype、numpy.arrary.ndim、numpy.arrary.size等。Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(二)Numpy庫(kù)和Pandas庫(kù)實(shí)現(xiàn)數(shù)據(jù)的洞察Pandas是一個(gè)強(qiáng)大的數(shù)據(jù)分析庫(kù),它可以幫助用戶從原始數(shù)據(jù)中提取有用的信息,并將其轉(zhuǎn)換為更容易理解的形式。Pandas可以用來(lái)清洗和準(zhǔn)備數(shù)據(jù),以及對(duì)數(shù)據(jù)進(jìn)行匯總、聚合、排序和繪圖等操作。Pandas還允許用戶從數(shù)據(jù)中提取模式和趨勢(shì),從而幫助他們做出更好的決策。Pandas基礎(chǔ)
Pandas中DataFrame數(shù)據(jù)框和Series數(shù)據(jù)序列處理結(jié)構(gòu)圖Python實(shí)現(xiàn)數(shù)據(jù)探索性分析的常用庫(kù)05(二)Numpy庫(kù)和Pandas庫(kù)實(shí)現(xiàn)數(shù)據(jù)的洞察Pandas的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)是Series和DataFrame。Series是一種一維的數(shù)據(jù)結(jié)構(gòu),由一組數(shù)據(jù)和一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(索引)組成。DataFrame是一種二維的數(shù)據(jù)結(jié)構(gòu),由一組有序的列和一組帶標(biāo)簽的行組成。Pandas基礎(chǔ)
Series代碼形式示例例子代碼形式時(shí)間為索引的溫度序列pd.Series([20,22,24,26,28],index=['2020/1/1','2020/1/2','2020/1/3','2020/1/4','2020/1/5'])城市人口序列pd.Series([20000,30000,40000,50000,60000],index=['北京','上海','廣州','深圳','杭州'])電影評(píng)分序列pd.Series([9.2,8.5,8.9,7.8,6.5],index=['肖申克的救贖','教父','阿甘正傳','泰坦尼克號(hào)','美國(guó)往事'])汽車品牌序列pd.Series(['寶馬','奔馳','特斯拉','路虎','奧迪'],index=[1,2,3,4,5])國(guó)家GDP序列
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 會(huì)計(jì)代理委托協(xié)議書
- 房產(chǎn)項(xiàng)目測(cè)繪合同
- 三農(nóng)地區(qū)農(nóng)業(yè)基礎(chǔ)設(shè)施建設(shè)方案
- 與客戶溝通的商務(wù)信函樣本
- 中山噴水降溫施工方案
- 大型戶外投影施工方案
- 人工挖樁施工方案
- 蒸壓加氣混凝土砌塊施工方案
- 音樂(lè)公司人員管理方案
- 門簾施工方案
- 失語(yǔ)癥的分類及臨床特征
- 循環(huán)流化床鍋爐操作工安全技術(shù)操作規(guī)程模版(3篇)
- 2024院感培訓(xùn)課件
- 2024-2030年中國(guó)稅務(wù)師事務(wù)所行業(yè)管理模式及投資前景展望報(bào)告版
- 2024年全國(guó)高考英語(yǔ)試題及答案-湖南卷
- 《少兒汽車知識(shí)講座》課件
- 部編人教版小學(xué)四年級(jí)下冊(cè)道德與法治全冊(cè)教案及每課教學(xué)反思
- 中建吊籃安拆專項(xiàng)施工方案(專家論證版)
- 《汽車維修接待實(shí)務(wù)》 課件全套 孫麗學(xué)習(xí)情景1-8 汽車維修服務(wù)接待認(rèn)知 -新能源汽車維修接待
- 2020年礦建監(jiān)理工作總結(jié)
- 獸醫(yī)學(xué)英語(yǔ)詞匯【參考】
評(píng)論
0/150
提交評(píng)論