版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能應(yīng)用導(dǎo)論全套可編輯PPT課件項(xiàng)目一認(rèn)識(shí)人工智能——揭開人工智能的面紗項(xiàng)目二駕馭物體識(shí)別——讓機(jī)器更聰明項(xiàng)目三語(yǔ)音識(shí)別技術(shù)應(yīng)用——讓機(jī)器對(duì)你言聽計(jì)從項(xiàng)目四人臉識(shí)別技術(shù)應(yīng)用——機(jī)器也認(rèn)識(shí)你項(xiàng)目五多姿多彩的生活——人工智能應(yīng)用秀項(xiàng)目一
認(rèn)識(shí)人工智能——揭開人工智能的面紗全套可編輯PPT課件目錄CONTNETS人工智能知識(shí)認(rèn)知人工智能應(yīng)用支撐認(rèn)知人工智能技術(shù)發(fā)展歷程探究1234探究新職業(yè)——人工智能訓(xùn)練師知識(shí)目標(biāo)1.了解人工智能的定義。2.理解現(xiàn)代人工智能及分類。3.了解人工智能發(fā)展歷程。4.了解我國(guó)人工智能發(fā)展現(xiàn)狀和戰(zhàn)略規(guī)劃。技能目標(biāo)1.會(huì)搜集信息、辨別信息。2.能制作符合模型訓(xùn)練要求的圖像數(shù)據(jù)集。素養(yǎng)目標(biāo)1.樹立文化自信,增強(qiáng)民族自豪感。2.培養(yǎng)學(xué)生正確面對(duì)曲折和困難的人生觀。人工智能知識(shí)認(rèn)知01全套可編輯PPT課件一、人工智能的概念23145(5)應(yīng)用領(lǐng)域的“人工智能”。人工智能是一門綜合學(xué)科,主旨是研究和開發(fā)出智能實(shí)體,在這一點(diǎn)上它屬于工程學(xué)。(4)研究領(lǐng)域的人工智能。人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)學(xué)科,它是計(jì)算機(jī)科學(xué)的一個(gè)分支。(2)《人工智能標(biāo)準(zhǔn)化白皮書(2018年)》里的人工智能。人工智能是利用數(shù)字計(jì)算機(jī)或者由數(shù)字計(jì)算機(jī)控制的機(jī)器。(3)人工智能之父眼里的人工智能。人工智能之父——約翰·麥卡錫對(duì)人工智能的定義是“制造智能機(jī)器的科學(xué)與工程,特別是智能計(jì)算機(jī)程序”。(1)新華詞典在線版里的人工智能。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,研究應(yīng)用計(jì)算機(jī)來(lái)模擬人類的某些智力活動(dòng),從而代替人類的某些腦力勞動(dòng)。全套可編輯PPT課件名人故事如果說(shuō)阿蘭圖靈是人工智能的奠基者,駝明斯基則可以說(shuō)是人工智能的推動(dòng)者。其一生雖不像圖靈那樣傳奇,但也足以享譽(yù)后世。聯(lián)合發(fā)起達(dá)特茅斯會(huì)議人工智能的起源,公認(rèn)是1956年的達(dá)特茅斯會(huì)議。這年夏季,達(dá)特茅斯學(xué)院數(shù)學(xué)助理教授麥卡錫(JohnMcCarthy)、時(shí)任哈佛大學(xué)數(shù)學(xué)與神經(jīng)學(xué)初級(jí)研究員的馬文明斯基、IBM信息研究經(jīng)理羅切斯特(NathanielRochester)、信息論的創(chuàng)始人克勞德香農(nóng)(Claude
Shannon)等一批有遠(yuǎn)見卓識(shí)的年輕人聚集在一起,圍繞著“自動(dòng)計(jì)算機(jī)”、“如何為計(jì)算機(jī)編程使其能夠使用語(yǔ)言”、"神經(jīng)網(wǎng)絡(luò)”、“計(jì)算規(guī)模理論”等-系列對(duì)于當(dāng)時(shí)的世人而言完全陌生的話題,共同進(jìn)行了探討和研究,并首次提出了"人工智能”這一術(shù)語(yǔ),標(biāo)志著“人工智能”這門新興學(xué)科的正式誕生。(二)感知智能感知智能是指機(jī)器具有類似人的感知能力,如視覺、聽覺等,不僅可以聽懂、看懂,還可以基于此做出判斷并做出反饋或采取行動(dòng),即“能聽會(huì)說(shuō),能看會(huì)認(rèn)”。(一)計(jì)算智能計(jì)算智能是指機(jī)器可以像人類一樣存儲(chǔ)、計(jì)算和傳遞信息,幫助人類存儲(chǔ)和快速處理海量數(shù)據(jù),有利于算法的優(yōu)化和硬件的技術(shù)進(jìn)步。這一階段是感知智能和認(rèn)知智能的基礎(chǔ)。(三)認(rèn)知智能認(rèn)知智能是指機(jī)器能夠像人一樣主動(dòng)思考并采取行動(dòng),全面輔助或替代人類工作,是人工智能的最高級(jí)形態(tài),也是行業(yè)未來(lái)的著力點(diǎn)。二、人工智能的三個(gè)方面三、人工智能的未來(lái)人工智能在未來(lái)是否會(huì)擁有意識(shí),現(xiàn)在我們還不得而知。但是,很多研發(fā)人員和工程師希望人工智能可以擁有意識(shí)。數(shù)字克隆人是人工智能在未來(lái)的發(fā)展方向之一。數(shù)字克隆人是人類個(gè)體的思維方式和興趣愛好的數(shù)字復(fù)制品,但是,數(shù)字克隆人的開發(fā)可能只是一種用于實(shí)現(xiàn)人格的技術(shù)。2015年左右,人們已經(jīng)開發(fā)出用于實(shí)現(xiàn)此目標(biāo)的傳感技術(shù)。由此實(shí)現(xiàn)了很多事情,例如,根據(jù)圖像來(lái)推測(cè)面部表情,并將其與情緒關(guān)聯(lián)等。今后利用傳感技術(shù)模擬人格的嘗試會(huì)越來(lái)越多。知識(shí)鏈接金融本來(lái)就是數(shù)字的游戲,不過現(xiàn)在正從數(shù)字(number)轉(zhuǎn)向數(shù)據(jù)(data)。金融機(jī)構(gòu)通過數(shù)據(jù)分析客戶信用,進(jìn)行詐騙檢測(cè)、證券交易等。三、金融3現(xiàn)階段,工業(yè)企業(yè)在智能制造趨勢(shì)下紛紛開始探索智能化轉(zhuǎn)型的路徑,基于工業(yè)大數(shù)據(jù)分析的工業(yè)智能蘊(yùn)藏著巨大商業(yè)價(jià)值的革命性技術(shù),越來(lái)越多地受到企業(yè)青睞。一、工業(yè)1人工智能可以在醫(yī)療行業(yè)多個(gè)流程中發(fā)揮價(jià)值,問診、醫(yī)療報(bào)告生成、初步篩查、醫(yī)療影像的輔助診斷等。四、醫(yī)療4目前,人工智能在商業(yè)中得到了廣泛的應(yīng)用,其包括智能客服機(jī)器人、決策支持、預(yù)測(cè)營(yíng)銷、語(yǔ)音搜索、圖像識(shí)別等,相信人工智能在商業(yè)中的應(yīng)用將有著良好的發(fā)展前景。二、商業(yè)2人工智能技術(shù)發(fā)展歷程探究02一、人工智能的第一次高峰1950年,一名在校大四學(xué)生馬文·明斯基與他的同學(xué)鄧恩·埃德蒙建造了世界上第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī),這被視為人工智能的起點(diǎn)。1956年,在達(dá)特茅斯學(xué)院舉辦的一次會(huì)議上,計(jì)算機(jī)專家約翰·麥卡錫提出了“人工智能”一詞。人們?cè)谶_(dá)特茅斯會(huì)議上正式確立了人工智能這一術(shù)語(yǔ),對(duì)人工智能的學(xué)術(shù)研究也正式拉開序幕。二、人工智能的第一次低谷20世紀(jì)70年代,人工智能進(jìn)入了一段痛苦而艱難的歲月??蒲腥藛T在人工智能的研究中對(duì)項(xiàng)目難度預(yù)估不足,導(dǎo)致與美國(guó)國(guó)防高級(jí)研究計(jì)劃署的合作計(jì)劃失敗,使人工智能的前景蒙上了一層陰影。與此同時(shí),社會(huì)輿論的壓力也慢慢壓向人工智能這邊,導(dǎo)致很多研究經(jīng)費(fèi)被轉(zhuǎn)移到了其他項(xiàng)目上。當(dāng)時(shí),人工智能面臨三個(gè)技術(shù)瓶頸:①計(jì)算機(jī)性能不足。②問題的復(fù)雜性高。③數(shù)據(jù)量嚴(yán)重不足。三、人工智能的崛起1980年,卡內(nèi)基梅隆大學(xué)為數(shù)字設(shè)備公司設(shè)計(jì)了一套名為XCON的“專家系統(tǒng)”。這是一種采用人工智能程序的系統(tǒng),是具有完整專業(yè)知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能系統(tǒng),可以簡(jiǎn)單地將其理解為“知識(shí)庫(kù)+推理機(jī)”的組合。這套系統(tǒng)在1986年之前能為公司每年節(jié)省下來(lái)超過4000萬(wàn)美元的經(jīng)費(fèi)。這種商業(yè)模式衍生出了像Symbolics、LispMachines等和IntelliCorp、Aion等硬件、軟件公司。在這個(gè)時(shí)期,僅專家系統(tǒng)產(chǎn)業(yè)的價(jià)值就高達(dá)5億美元,人工智能應(yīng)用再次進(jìn)入繁榮期。四、人工智能的第二次低谷1987年,蘋果和IBM公司生產(chǎn)的臺(tái)式機(jī)性能都超過了Symbolics等廠商生產(chǎn)的專家系統(tǒng)通用計(jì)算機(jī),從此,專家系統(tǒng)風(fēng)光不再,曾經(jīng)轟動(dòng)一時(shí)的人工智能系統(tǒng)就此宣告結(jié)束其歷史進(jìn)程,人工智能應(yīng)用再次進(jìn)入低谷期。五、人工智能再次崛起1997年5月11日,IBM的計(jì)算機(jī)系統(tǒng)“深藍(lán)”戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫。20世紀(jì)90年代中期,隨著AI技術(shù)尤其是神經(jīng)網(wǎng)絡(luò)技術(shù)的逐步發(fā)展,以及人們對(duì)AI開始抱有客觀理性的認(rèn)知,人工智能技術(shù)開始進(jìn)入平穩(wěn)發(fā)展時(shí)期。2006年,Hinton在神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)領(lǐng)域取得突破,人類又一次看到機(jī)器趕超人類的希望,這是人工智能標(biāo)志性的技術(shù)進(jìn)步。2009年,IBM首席執(zhí)行官彭明盛首次提出“智慧地球”這一概念。1978年3月,鄧小平發(fā)表了“科學(xué)技術(shù)是生產(chǎn)力”的重要講話,提出“向科學(xué)技術(shù)現(xiàn)代化進(jìn)軍”的戰(zhàn)略決策。20世紀(jì)70年代末至20世紀(jì)80年代前期,一些人工智能相關(guān)項(xiàng)目已被納入國(guó)家科研計(jì)劃。一、科研起步階段二、產(chǎn)業(yè)快速發(fā)展階段清華大學(xué)成功研發(fā)出的人臉識(shí)別系統(tǒng)以及智能問答技術(shù)都已經(jīng)獲得了應(yīng)用。中科院自動(dòng)化所成功研發(fā)了“寒武紀(jì)”芯片并建成了類腦智能研究平臺(tái)。華為也推出了MoKA人工智能系統(tǒng)。知識(shí)鏈接新技術(shù)推動(dòng)學(xué)科建設(shè)和催生新職業(yè)。2018年4月,教育部在研究制定《高等學(xué)校引領(lǐng)人工智能創(chuàng)新行動(dòng)計(jì)劃》時(shí)確定設(shè)立人工智能專業(yè),進(jìn)一步完善中國(guó)高校人工智能學(xué)科體系,旨在培養(yǎng)中國(guó)人工智能產(chǎn)業(yè)的應(yīng)用型人才,推動(dòng)人工智能一級(jí)學(xué)科建設(shè)。三、國(guó)家戰(zhàn)略規(guī)劃發(fā)展階段四、國(guó)際上人工智能領(lǐng)域的發(fā)展現(xiàn)狀(一)資源層:數(shù)據(jù)及算力的大幅提升將AI推向浪潮之巔(二)技術(shù)環(huán)境:開源框架大幅降低開發(fā)門檻(三)外部環(huán)境:政策助力,人工智能迎來(lái)發(fā)展良機(jī)知識(shí)鏈接探究新職業(yè)——人工智能訓(xùn)練師03一、創(chuàng)建圖像分類模型(5)信息填寫完成后,單擊“完成創(chuàng)建”按鈕即可創(chuàng)建成功。在左側(cè)導(dǎo)航欄“我的模型”標(biāo)簽頁(yè)中即可看到所創(chuàng)建的模型。(4)在信息填寫頁(yè)面中填入“模型名稱”“郵箱地址”“聯(lián)系方式”和“業(yè)務(wù)描述”,選擇“模型歸屬”,所有帶有星號(hào)的選項(xiàng)都必須填寫。(1)打開EasyDL圖像官網(wǎng),進(jìn)入EasyDL圖像頁(yè)面。(3)進(jìn)入圖像分類模型管理界面,在左側(cè)的導(dǎo)航欄中,選擇“我的模型”標(biāo)簽頁(yè)。(2)單擊“立即使用”按鈕,在彈出來(lái)的“選擇模型類型”對(duì)話框中選擇“圖像分類”選項(xiàng),進(jìn)入登錄界面,輸入賬號(hào)和密碼。二、上傳數(shù)據(jù)(1)選擇左側(cè)導(dǎo)航欄中的“數(shù)據(jù)總覽”標(biāo)簽頁(yè),單擊“創(chuàng)建數(shù)據(jù)集”按鈕,進(jìn)入創(chuàng)建數(shù)據(jù)集信息填寫頁(yè)面。01(2)按照提示填寫信息。在“數(shù)據(jù)集名稱”一欄可輸入你自己取的數(shù)據(jù)集名稱,其他均為默認(rèn)項(xiàng),無(wú)需修改。02(3)數(shù)據(jù)集創(chuàng)建成功后,在界面中將出現(xiàn)該模型的數(shù)據(jù)集信息,包括版本、數(shù)據(jù)集ID、數(shù)據(jù)量、標(biāo)注類型、標(biāo)注狀態(tài)、清洗狀態(tài)等。03(4)單擊“導(dǎo)入”鏈接,進(jìn)入導(dǎo)入數(shù)據(jù)頁(yè)面,在“數(shù)據(jù)標(biāo)注狀態(tài)”一欄選中“無(wú)標(biāo)注信息”單選按鈕,在“導(dǎo)入方式”一欄選擇“本地導(dǎo)入”和“上傳壓縮包”選項(xiàng)。04(5)此時(shí)數(shù)據(jù)開始導(dǎo)入,數(shù)據(jù)導(dǎo)入狀態(tài),等待數(shù)據(jù)全部導(dǎo)入。05三、標(biāo)注數(shù)據(jù)(1)數(shù)據(jù)集導(dǎo)入完成后,可以看到最近導(dǎo)入狀態(tài)已更新為“已完成”,數(shù)據(jù)量、標(biāo)注狀態(tài)操作都有變化。(2)添加標(biāo)簽“貓”和“狗”,單擊“添加標(biāo)簽”按鈕,輸入“貓”,單擊“確定”按鈕,標(biāo)簽就添加成功了。(3)標(biāo)簽添加完成后,即可進(jìn)行數(shù)據(jù)標(biāo)注。(5)利用相同的方法完成“貓”的圖像的標(biāo)注,全部標(biāo)注完成后的效果。(4)選中所有代表狗的圖像,單擊右側(cè)標(biāo)簽欄下對(duì)應(yīng)的標(biāo)簽名“狗”,即可進(jìn)行標(biāo)注。四、訓(xùn)練模型(2)添加完數(shù)據(jù)集,訓(xùn)練模型頁(yè)面的添加數(shù)據(jù)集效果,其他參數(shù)取默認(rèn)值,然后單擊“開始訓(xùn)練”按鈕。(3)在彈出的對(duì)話框中,單擊“繼續(xù)訓(xùn)練”按鈕,即可繼續(xù)進(jìn)行訓(xùn)練。(5)在版本配置界面,可以查看該訓(xùn)練任務(wù)的開始時(shí)間、任務(wù)時(shí)長(zhǎng)、訓(xùn)練時(shí)長(zhǎng)及訓(xùn)練算法等基本信息。(4)單擊“訓(xùn)練狀態(tài)”→“訓(xùn)練中”旁的感嘆號(hào)圖標(biāo),可查看訓(xùn)練進(jìn)度。(1)選擇模型訓(xùn)練,進(jìn)入訓(xùn)練模型頁(yè)面,分別選擇模型、選擇算法、添加數(shù)據(jù)集。五、校驗(yàn)和發(fā)布(1)單擊“校驗(yàn)”鏈接,進(jìn)入校驗(yàn)?zāi)P晚?yè)面,單擊“啟動(dòng)校驗(yàn)”按鈕,再單擊頁(yè)面中間的“點(diǎn)擊添加圖片”按鈕。(2)校驗(yàn)完成后,在頁(yè)面中可以看到模型的識(shí)別結(jié)果,在頁(yè)面右側(cè)可以查看預(yù)測(cè)分類及其對(duì)應(yīng)的置信度。(6)進(jìn)入“體驗(yàn)H5”的“完成”頁(yè)面。此時(shí)即可拿起手機(jī),掃二維碼進(jìn)行測(cè)試。(4)回到我的模型列表中,模型服務(wù)狀態(tài)為“發(fā)布中”。(5)模型發(fā)布成功后,服務(wù)狀態(tài)為“已發(fā)布”,同時(shí)操作頁(yè)面中會(huì)增加“體驗(yàn)H5”鏈接。(3)選擇“發(fā)布模型”進(jìn)入發(fā)布模型頁(yè)面,填寫服務(wù)名稱和接口地址,完成后單擊“提交申請(qǐng)”按鈕后進(jìn)入發(fā)布狀態(tài)。一、認(rèn)識(shí)人工智能訓(xùn)練師人工智能訓(xùn)練師的主要任務(wù)包括以下五個(gè)方面。(1)標(biāo)注和加工圖片、文字、語(yǔ)音等業(yè)務(wù)的原始數(shù)據(jù)。(2)分析提煉專業(yè)領(lǐng)域特征,訓(xùn)練和評(píng)測(cè)人工智能產(chǎn)品相關(guān)算法、功能和性能。(3)設(shè)計(jì)人工智能產(chǎn)品的交互流程和應(yīng)用解決方案。(4)監(jiān)控、分析、管理人工智能產(chǎn)品應(yīng)用數(shù)據(jù)。(5)調(diào)整、優(yōu)化人工智能產(chǎn)品參數(shù)和配置。二、人工智能訓(xùn)練師典型工作任務(wù)(一)數(shù)據(jù)標(biāo)注數(shù)據(jù)標(biāo)注是使用工具對(duì)未經(jīng)處理的圖片、文本、語(yǔ)音及其他原始數(shù)據(jù)進(jìn)行加工處理,并進(jìn)一步轉(zhuǎn)換為機(jī)器可識(shí)別信息的過程。(二)模型訓(xùn)練人工智能的模型本質(zhì)上就是訓(xùn)練機(jī)器用不同的算法來(lái)掌握一個(gè)個(gè)不同的規(guī)則,然后舉一反三。知識(shí)鏈接知識(shí)拓展人工智能訓(xùn)練師職業(yè)技能標(biāo)準(zhǔn)1.具備扎實(shí)的人工智能學(xué)科知識(shí)和技能,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言處理等相關(guān)領(lǐng)域的理論和實(shí)踐能力。2.能夠熟練運(yùn)用常用的人工智能算法和工具,如TensorFlow、PyTorch、Scikit-learn等,用于數(shù)據(jù)預(yù)處理、模型訓(xùn)練和評(píng)估。3.具備良好的編程能力,熟悉常見的編程語(yǔ)言,如Python、Java、C++等,能夠編寫高效且可維護(hù)的代碼。4.具備豐富的數(shù)據(jù)處理和數(shù)據(jù)分析經(jīng)驗(yàn),能夠從大規(guī)模數(shù)據(jù)中提取特征、進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)可視化等,為模型的訓(xùn)練提供有力支持。5.能夠獨(dú)立完成人工智能項(xiàng)目的設(shè)計(jì)、開發(fā)和部署,具備項(xiàng)目管理和團(tuán)隊(duì)協(xié)作的能力,能夠有效地與產(chǎn)品經(jīng)理、工程師和領(lǐng)導(dǎo)進(jìn)行溝通。6.具備出色的問題解決和創(chuàng)新能力,能夠從多個(gè)角度分析和解決復(fù)雜的人工智能問題,提供有效的解決方案和改進(jìn)建議。人工智能應(yīng)用支撐認(rèn)知04一、人工智能技術(shù)基礎(chǔ)支撐——算力AI芯片部署的位置有云端、終端兩種。云端,即數(shù)據(jù)中心,在深度學(xué)習(xí)的訓(xùn)練階段需要極大的數(shù)據(jù)量和運(yùn)算量,單一處理器無(wú)法獨(dú)立完成,因此,訓(xùn)練環(huán)節(jié)只能在云端實(shí)現(xiàn)。(三)AI芯片應(yīng)用近年來(lái),已有不少超算中心運(yùn)用了人工智能芯片和服務(wù)器來(lái)強(qiáng)化其算力,用于提升對(duì)人工智能產(chǎn)業(yè)的服務(wù)能力,也可以說(shuō)是對(duì)傳統(tǒng)超算中心進(jìn)行“AI化”。(四)智算中心算力(也稱作計(jì)算力),是設(shè)備的計(jì)算能力,也是數(shù)據(jù)處理的能力。AI的許多數(shù)據(jù)處理涉及矩陣乘法和加法。(一)人工智能的算力從廣義范疇上講,面向AI計(jì)算應(yīng)用的芯片都可以稱為AI芯片。在狹義上,AI芯片指專門針對(duì)AI算法做了特殊加速設(shè)計(jì)的芯片,以GPU、FPGA、ASIC為代表的AI芯片,是基于傳統(tǒng)芯片架構(gòu)對(duì)某類特定算法或者場(chǎng)景進(jìn)行AI計(jì)算加速的芯片。(二)AI芯片二、人工智能技術(shù)基礎(chǔ)支撐——算法1234(一)算法的定義算法是指在解決某個(gè)問題的時(shí)候,按照某種計(jì)算方法及步驟進(jìn)行處理的過程。(二)機(jī)器學(xué)習(xí)的概念機(jī)器學(xué)習(xí)用于研究怎樣讓計(jì)算機(jī)具備像人類一樣的學(xué)習(xí)能力,通過數(shù)據(jù)或經(jīng)驗(yàn)不斷優(yōu)化計(jì)算機(jī)算法的性能,是人工智能的核心部分。機(jī)器學(xué)習(xí)根據(jù)學(xué)習(xí)方式的不同可以分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)三類。(三)深度學(xué)習(xí)的概念深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,是指通過模仿人類大腦的思考和學(xué)習(xí)方式。(四)神經(jīng)網(wǎng)絡(luò)的概念生物神經(jīng)網(wǎng)絡(luò)是指由生物的大腦神經(jīng)元、細(xì)胞、觸點(diǎn)等組成的網(wǎng)絡(luò)。三、人工智能技術(shù)基礎(chǔ)支撐——數(shù)據(jù)(一)數(shù)據(jù)采集(二)數(shù)據(jù)的采集源及采集方式(四)數(shù)據(jù)預(yù)處理(五)數(shù)據(jù)標(biāo)注(三)采集的數(shù)據(jù)類型劃分通常情況下,數(shù)據(jù)可以被分為非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)化數(shù)據(jù)三種類型。在數(shù)據(jù)處理流程中,采集的數(shù)據(jù)決定了數(shù)據(jù)分析挖掘的上限。第一類是終端數(shù)據(jù)。第二類是開放數(shù)據(jù)。第三類是專有平臺(tái)的數(shù)據(jù)。第四類是物理數(shù)據(jù)。第五類是主觀性數(shù)據(jù)。第六類是數(shù)據(jù)庫(kù)的數(shù)據(jù)。1.數(shù)據(jù)清洗2.數(shù)據(jù)集成3.數(shù)據(jù)變換4.數(shù)據(jù)規(guī)約標(biāo)注原始數(shù)據(jù)并準(zhǔn)備將其應(yīng)用于機(jī)器學(xué)習(xí)模型和其他AI工作流的過程稱為數(shù)據(jù)標(biāo)注。知識(shí)鏈接1.數(shù)理邏輯方法與專家系統(tǒng)2.模糊控制技術(shù)3.計(jì)算智能與進(jìn)化計(jì)算及遺傳算法5.神經(jīng)網(wǎng)絡(luò)4.分布式人工智能與多智能體技術(shù)0105040302人工智能技術(shù)的主要技術(shù)領(lǐng)域有以下五個(gè)方面。感謝觀看人工智能應(yīng)用導(dǎo)論
項(xiàng)目二
駕馭物體識(shí)別——讓機(jī)器更聰明目錄CONTNETS植物檢測(cè)手寫數(shù)字識(shí)別探究鳶尾花品種1234識(shí)別圖像中的動(dòng)物知識(shí)目標(biāo)1.了解圖像識(shí)別、生物特征識(shí)別。2.了解智能識(shí)別的應(yīng)用及發(fā)展。3.了解圖像分類問題類型以及常見圖像分類方法步驟。技能目標(biāo)1.能根據(jù)項(xiàng)目需求采用合理方法進(jìn)行數(shù)據(jù)采集。2.會(huì)對(duì)采集后的數(shù)據(jù)進(jìn)行簡(jiǎn)單處理。3.能夠聯(lián)系實(shí)際生活,列舉出智能識(shí)別的應(yīng)用。素養(yǎng)目標(biāo)1.培養(yǎng)學(xué)生科技創(chuàng)新意識(shí)。2.養(yǎng)成正向的人工智能對(duì)社會(huì)發(fā)展的價(jià)值觀。植物檢測(cè)01一、植物檢測(cè)中的數(shù)據(jù)采集要實(shí)現(xiàn)目標(biāo)檢測(cè),就需要對(duì)有答案的目標(biāo)圖片進(jìn)行學(xué)習(xí)。本次植物檢測(cè)項(xiàng)目需要檢測(cè)上海青、生菜、芹菜和苦苣菜四類植物,因此,我們需要大量采集這四類植物不同生長(zhǎng)狀態(tài)、不同角度的圖像數(shù)據(jù),為后續(xù)的數(shù)據(jù)標(biāo)注、機(jī)器學(xué)習(xí)做準(zhǔn)備。目前采集圖像數(shù)據(jù)的方式有很多種,比如以下幾種:(1)使用手機(jī)(相機(jī))拍攝照片。(2)使用手機(jī)(相機(jī))拍攝視頻,然后轉(zhuǎn)換為圖像。(3)使用爬蟲技術(shù)從網(wǎng)絡(luò)上獲取。二、數(shù)據(jù)標(biāo)注(一)安裝LabelImg工具在進(jìn)行數(shù)據(jù)標(biāo)注之前,需要先安裝LabelImg。在Anaconda中安裝和啟動(dòng)LabelImg的方法如下:(1)打開Anacondaprompt,輸入命令pipinstalllabelimg進(jìn)行安裝。(2)安裝成功后,直接輸入命令labelimg即可打開LabelImg標(biāo)注工具。LabelImg軟件界面,如圖2-1所示。二、數(shù)據(jù)標(biāo)注(二)使用LabelImg標(biāo)注并制作植物檢測(cè)的數(shù)據(jù)集(1)準(zhǔn)備兩個(gè)文件夾JPEGImages和Annotations,將要進(jìn)行標(biāo)注的圖片全部放到JPEGImages里面,Annotations用來(lái)保存標(biāo)注好的xml圖像信息文件。01(2)選擇數(shù)據(jù)集格式。02(4)打開要標(biāo)注的圖像文件后,使用工具欄中的Create\nRectBox開始畫框。04(3)加載數(shù)據(jù)和確定數(shù)據(jù)保存文件夾。03(5)點(diǎn)擊左側(cè)工具欄的NextImage圖標(biāo)轉(zhuǎn)到下一張圖片。05三、搭建YOLOv3虛擬環(huán)境(一)創(chuàng)建虛擬環(huán)境步驟1:打開AnacondaPrompt,輸入condacreate-ntf_115python==3.7指令,即創(chuàng)建一個(gè)名字為tf_115的虛擬環(huán)境。接著會(huì)提示是否繼續(xù),輸入“y”繼續(xù)創(chuàng)建,如圖2-6所示。步驟2:安裝tensorflow-gpu1.15版本,并測(cè)試tensorflow是否成功調(diào)用GPU。輸入命令pipinstalltensorflow-gpu==1.15。注意:本任務(wù)對(duì)應(yīng)的是tensorflow-gpu1.15版本。三、搭建YOLOv3虛擬環(huán)境(二)安裝本任務(wù)需要的其他庫(kù)打開AnacondaPrompt,注意要先進(jìn)入之前創(chuàng)建的tf_115的虛擬環(huán)境(即輸入命令condaactivatetf_115),然后分別輸入以下命令:pipinstallopencv-pythonpipinstallkeras==2.1.5pipinstallpillowpipinstallmatplotlibpipinstallnumpypipinstallh5py==2.10運(yùn)行命令后的效果如圖2-11所示。四、制作數(shù)據(jù)集23145(5)修改model_data文件夾下的voc_classes.txt文件,將類別修改為植物檢測(cè)中的四類標(biāo)注信息。(4)運(yùn)行voc_annotation.py文件,會(huì)得到3個(gè)后綴為.txt的文件,它們對(duì)應(yīng)的是訓(xùn)練集、測(cè)試集以及驗(yàn)證集的圖片的名稱。(2)回到PyCharm中,在VOC2007文件夾中新建train_text.py文件,并寫入如下代碼,目的是將我們的xml文件切分為訓(xùn)練集和測(cè)試集,這里設(shè)置的兩者比例是8∶2。(3)此時(shí),test.txt、train.txt、val.txt這幾個(gè)文件并不能直接被YOLOv3讀取,需要再進(jìn)行一次轉(zhuǎn)換。(1)把數(shù)據(jù)集文件夾放在項(xiàng)目文件夾的根目錄下。五、使用Kmeans算法獲得先驗(yàn)框anchor_box事實(shí)上,制作完數(shù)據(jù)集后就可以對(duì)其進(jìn)行訓(xùn)練了。但是因?yàn)楫?dāng)前的anchor_box是原作者在coco數(shù)據(jù)集上通過Kmeans得到的,并不一定適合我們現(xiàn)在的植物檢測(cè)數(shù)據(jù)集,所以我們需要在植物檢測(cè)數(shù)據(jù)上使用Kmeans得到9個(gè)適合當(dāng)前數(shù)據(jù)集的anchor_box,以得到最好的檢測(cè)框。六、模型訓(xùn)練(一)制作生成器在開始訓(xùn)練之前,我們需要把數(shù)據(jù)集制作成一個(gè)生成器的結(jié)構(gòu),以便一邊訓(xùn)練,一邊讀取數(shù)據(jù),可以大大減輕內(nèi)存的壓力。(四)main函數(shù)定義一個(gè)main函數(shù),并對(duì)其進(jìn)行調(diào)用。(五)建立文件夾目錄在keras-yolo3-master文件夾下建立文件夾目錄logs/000,用于保存訓(xùn)練生成的模型。(二)編寫其他函數(shù)與構(gòu)建模型編寫其他函數(shù)用來(lái)讀取txt文件中的數(shù)據(jù)以及構(gòu)建訓(xùn)練模型。具體內(nèi)容包括獲取數(shù)據(jù)標(biāo)注的標(biāo)簽名稱、獲取anchors_box、創(chuàng)建模型結(jié)構(gòu)。(三)編寫訓(xùn)練函數(shù)我們?cè)谟?xùn)練時(shí)還可以使用回調(diào)函數(shù)對(duì)訓(xùn)練過程進(jìn)行控制。比如,使用ModelCheckpoint()函數(shù)可以自動(dòng)保存最佳的模型,使用ReduceLRonPlateau()函數(shù)可以控制學(xué)習(xí)自動(dòng)率衰減。知識(shí)鏈接一、目標(biāo)檢測(cè)算法——YOLO(二)YOLOv2YOLOv2是YOLO系列的第一個(gè)改進(jìn)版本,它首次提出了以DarkNet19作為主干網(wǎng)絡(luò),并使用全卷積代替了全連接。(四)YOLOv4YOLOv4是YOLO系列的第三個(gè)改進(jìn)版本,它將YOLOv3中的算法和目前主流的算法通過實(shí)驗(yàn)進(jìn)行整合。(一)YOLOv1YOLOv1首先將resize(圖像大小)調(diào)整到448×448并輸入448×448×3的一個(gè)彩色圖像,然后輸出7×7×30的多維向量。這里的7×7×30可分為7×7和30兩個(gè)部分。(三)YOLOv3YOLOv3是YOLO系列的第二個(gè)改進(jìn)版本,它將YOLOv2中的DarkNet19改為特征提出能力更強(qiáng)的DarkNet53。1234知識(shí)鏈接搭建植物檢測(cè)模型訓(xùn)練平臺(tái)需要用到Anaconda、PyCharm和Keras。Anaconda使用的是一個(gè)開源的Python發(fā)行版本,包含了conda、Python等180多個(gè)科學(xué)包及其依賴項(xiàng)。PyCharm是由JetBrains打造的一款PythonIDE,帶有一整套可以幫助用戶在使用Python語(yǔ)言開發(fā)時(shí)提高其效率的工具。Keras是一個(gè)用Python編寫的高級(jí)神經(jīng)網(wǎng)絡(luò)API。三、植物檢測(cè)模型訓(xùn)練平臺(tái)搭建(一)VOC數(shù)據(jù)集VOC數(shù)據(jù)集實(shí)際上是一個(gè)名為PASCALVOC的世界級(jí)的計(jì)算機(jī)視覺挑戰(zhàn)賽中的數(shù)據(jù)集,很多模型都基于此數(shù)據(jù)集推出,如目標(biāo)檢測(cè)領(lǐng)域的YOLO、SSD等。(二)COCO數(shù)據(jù)集COCO數(shù)據(jù)集的英文全稱為MicrosoftCommonObjectsinContext(MSCOCO),它是一個(gè)包括大規(guī)模的對(duì)象檢測(cè)、分割、關(guān)鍵點(diǎn)檢測(cè)和字幕數(shù)據(jù)集。二、目標(biāo)檢測(cè)中的公開數(shù)據(jù)集小貼士拍攝花朵小技巧1.靈活找角度有時(shí)候拍照會(huì)發(fā)現(xiàn)怎么拍都不好看,那可能就是角度的問題,你要多用雙腳尋找好的角度,靈活運(yùn)用不同的角度,拍照后對(duì)比一下,選出最好看的一張來(lái)。2.學(xué)會(huì)構(gòu)圖構(gòu)圖是欣賞者的第一感,它決定了畫面的沖擊力,給人整體觀感上的美。構(gòu)圖一是要大氣,線條、輪廓要鮮明、有力,畫面要完整,細(xì)部符合黃金分割律;這么說(shuō)可能有點(diǎn)抽象,最簡(jiǎn)單的構(gòu)圖辦法就是把手機(jī)自帶的九宮格線對(duì)上,焦點(diǎn)選在線條之間的交叉點(diǎn)上。3.裁剪大小如果沒有特別需求(比如做壁紙或者封面)的話,可以裁剪、自定義尺寸最好,裁剪的目的是為了精準(zhǔn)構(gòu)圖,還是用構(gòu)圖線作參考,把邊角上雜七雜八的畫面都裁掉。這些不裁可能會(huì)干擾視線。探究鳶尾花品種02一、確定鳶尾花最佳的品種數(shù)k值(一)導(dǎo)入相關(guān)的第三方庫(kù)及模塊因?yàn)橐獙?duì)鳶尾花樣本數(shù)據(jù)進(jìn)行聚類,在讀取樣本數(shù)據(jù)的基礎(chǔ)上,除進(jìn)行聚類操作外,還要計(jì)算輪廓系數(shù)和繪制輪廓系數(shù)的變化折線圖,所以要通過以下代碼導(dǎo)入相關(guān)的第三方庫(kù)及模塊。fromsklearn.clusterimportKMeansfromsklearn.metricsimportsilhouette_scoreimportmatplotlib.pyplotaspltimportpandasasp一、確定鳶尾花最佳的品種數(shù)k值(二)繪制k值與輪廓系數(shù)的變化關(guān)系圖假設(shè)k的取值范圍為[2,8],在不同k值條件下,對(duì)樣本數(shù)據(jù)進(jìn)行聚類訓(xùn)練,然后計(jì)算對(duì)應(yīng)的輪廓系數(shù),最后繪制出k值與輪廓系數(shù)的變化關(guān)系圖。實(shí)現(xiàn)代碼如下。1iris_datas=pd.read_csv(r'data\iris.csv',sep=',')2sc=[]3foriinrange(2,9):4kmeans=KMeans(n_clusters=i,random_state=151).fit(iris_datas)5score=silhouette_score(iris_datas,kmeans.labels_)6sc.append(score)7plt.plot(range(2,9),sc,linestyle='-')8plt.xlabel('k')二、繪制鳶尾花聚類后的結(jié)果散點(diǎn)圖(一)按k=3對(duì)鳶尾花樣本數(shù)據(jù)進(jìn)行聚類鳶尾花有4個(gè)特征數(shù)據(jù),取所有特征數(shù)據(jù)進(jìn)行k均值算法訓(xùn)練,代碼如下。iris_datas=pd.read_csv(r'data\iris.csv',sep=',')kmeans3=KMeans(n_clusters=3,random_state=151).fit(iris_datas)訓(xùn)練結(jié)束后,通過以下代碼觀察聚類后的簇號(hào)分布情況。kmeans3.labels_代碼的運(yùn)行結(jié)果,如圖2-28所示。二、繪制鳶尾花聚類后的結(jié)果散點(diǎn)圖(二)繪制聚類后樣本的散點(diǎn)圖為比較直觀清晰地了解聚類后的樣本分布情況,按鳶尾花不同的特征數(shù)據(jù)來(lái)繪制對(duì)應(yīng)散點(diǎn)圖,用不同的顏色來(lái)區(qū)分樣本類別。代碼如下。1plt.rcParams['font.sans-serif']=['SimHei']2plt.figure(figsize=(15,8))3ax1=plt.subplot(221)4plt.scatter(iris_datas['Sepal.Length'],iris_datas['Sepal.Width'],c=kmeans3.labels_)5ax1.set_xlabel('(a)花萼長(zhǎng)度')6ax1.set_ylabel('花萼寬度')7ax2=plt.subplot(222)知識(shí)鏈接(一)何為聚類分析聚類分析是一種典型的無(wú)監(jiān)督學(xué)習(xí),也就是在事先不知道每個(gè)樣本的類別,沒有對(duì)應(yīng)標(biāo)簽值的情況下,將未知類別的樣本按照一定的規(guī)則劃分成若干個(gè)類簇。(三)聚類性能度量聚類性能度量指標(biāo)用于對(duì)聚類后的結(jié)果進(jìn)行評(píng)估,分為內(nèi)部指標(biāo)和外部指標(biāo)兩大類。外部指標(biāo)要事先指定聚類模型作為參考來(lái)評(píng)估聚類結(jié)果的好壞,稱為有標(biāo)簽的評(píng)估;而內(nèi)部指標(biāo)是指不借助任何外部參考,只用參與聚類的樣本本身評(píng)估聚類結(jié)果的好壞。(二)常見聚類方法1.基于劃分的聚類2.基于層次的聚類3.基于密度的聚類一、聚類分析知識(shí)鏈接二、k均值聚類k均值聚類算法原理易懂、易于實(shí)現(xiàn),當(dāng)簇間的區(qū)別較明顯時(shí),聚類效果較好。(一)k均值聚類算法原理k均值算法通過樣本間的距離來(lái)衡量它們之間的相似度,兩個(gè)樣本距離越遠(yuǎn),則相似度越低,否則相似度越高。(二)K均值聚類算法步驟及流程要通過KMeans類來(lái)構(gòu)建一個(gè)k均值模型,然后利用該模型進(jìn)行聚類。k均值模型的主要參數(shù)。(四)認(rèn)識(shí)KMeans類1.k的初值2.初始質(zhì)心的選擇3.簇號(hào)4.聚類結(jié)束條件(三)k均值算法應(yīng)用提示01040302知識(shí)鏈接什么是降維?為什么要降維?前文已經(jīng)談到,在衡量采用什么方法來(lái)分析數(shù)據(jù)之前,最好能對(duì)數(shù)據(jù)的全貌有一個(gè)可視化的了解,能從中發(fā)現(xiàn)一些內(nèi)在規(guī)律或啟示,以便更好地指導(dǎo)人們選擇相對(duì)合理的方法來(lái)解決問題。通常只在二維或三維的空間可視化數(shù)據(jù),但原始數(shù)據(jù)的實(shí)際維度可能是四維甚至更高維度。采用數(shù)據(jù)降維的方法將原始數(shù)據(jù)的維度降為二維或三維,以便進(jìn)行可視化處理來(lái)直觀了解數(shù)據(jù)的分布。除此之外,數(shù)據(jù)降維還有提高計(jì)算速度、提高模型擬合度等好處。三、數(shù)據(jù)降維小貼士數(shù)據(jù)降維的注意事項(xiàng)1.確定降維目標(biāo):在進(jìn)行數(shù)據(jù)降維時(shí),需要明確其目標(biāo),通常是將數(shù)據(jù)壓縮或轉(zhuǎn)換成更少的特征并保留其變化率中最重要的部分。對(duì)于不同的應(yīng)用場(chǎng)合,可以確定不同的數(shù)據(jù)降維目標(biāo)。2.確定降維算法:選擇適當(dāng)?shù)慕稻S算法是非常重要的,可以通過PCA、LDA、t-SNE和UMAP等算法進(jìn)行數(shù)據(jù)降維,要根據(jù)數(shù)據(jù)特點(diǎn)、降維目標(biāo)、所需時(shí)間等綜合考慮選擇使用哪種算法。3.數(shù)據(jù)的預(yù)處理:在進(jìn)行降維之前,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,如歸一化、標(biāo)準(zhǔn)化等,以消除數(shù)據(jù)集的分散性,減少噪聲影響。4.檢查數(shù)據(jù)質(zhì)量:在進(jìn)行降維之前,需要檢查數(shù)據(jù)質(zhì)量,數(shù)據(jù)質(zhì)量不高會(huì)影響降維結(jié)果的準(zhǔn)確性。如果數(shù)據(jù)存在異常值或不符合分布,需要進(jìn)行必要的處理,如刪除異常值、填充缺失值等。5.選擇適當(dāng)?shù)木S度個(gè)數(shù):在進(jìn)行降維之后,需要確定數(shù)據(jù)的最終維數(shù),不同問題下最適合使用的維度個(gè)數(shù)不同。選擇合適的維度個(gè)數(shù)可以充分體現(xiàn)數(shù)據(jù)的重要特征,同時(shí)也可以減少噪聲和冗余。識(shí)別圖像中的動(dòng)物03一、ImageAI模塊的安裝安裝Pillow模塊,安裝命令如下。pip3installpillow安裝Matplotlib模塊,安裝命令如下。pip3installmatplotlib安裝Numpy的版本在1.13.1以上,安裝命令如下。pip3installnumpy安裝TensorFlow的版本在1.4.0以上,安裝命令如下。pip3installtensorflow安裝OpenCV模塊,安裝命令如下。pip3installopencv-python安裝SciPy的版本在0.19.1以上,安裝命令如下。pip3installscipy二、ImageAI模塊實(shí)現(xiàn)物體檢測(cè)ImageAI模塊中提供了ObjectDetection物體檢測(cè)的方法,調(diào)用此方法后,使用預(yù)先訓(xùn)練好的模型文件,在模型選擇上首選YOLO,因?yàn)樗俣瓤?,yolo.h5就是YOLO算法的權(quán)重文件,加載模型文件后,就可以根據(jù)模型文件的內(nèi)置算法從圖像中進(jìn)行物體檢測(cè)。具體代碼如下。fromimageai.DetectionimportObjectDetectionimportosexecution_path=os.getcwd()detector=ObjectDetection()detector.setModelTypeAsYOLOv3()detector.setModelPath(os.path.join(execution_path,"models/yolo.h5"))detector.loadModel()detections=detector.detectObjectsFromImage(input_image=os.path.join(execution_path,"pandas.png"),output_image_path=os.path.知識(shí)鏈接ImageAI支持圖像文件的文件路徑(默認(rèn))、圖像數(shù)組和圖像文件流3種輸入類型,以及圖像文件(默認(rèn))和數(shù)字?jǐn)?shù)組2種輸出類型。這意味著可以在生產(chǎn)應(yīng)用程序中執(zhí)行對(duì)象檢測(cè),例如,在以上述任何格式返回文件的Web服務(wù)器和系統(tǒng)上。要使用numpy數(shù)組或文件流輸入執(zhí)行對(duì)象檢測(cè),只需在.detectObjectsFromImage()函數(shù)或.detectCustomObjectsFromImage()函數(shù)中聲明輸入類型。請(qǐng)參見下面的示例。detections=detector.detectObjectsFromImage(input_type="array”,input_image=image_array,output_image_path=os.path.join(execution_path,"image.jpg”))#numpy數(shù)組輸入detections=detector.detectObjectsFromImage(input_type="stream",input_image=image_stream,output_image_path=os.path.join(execution_path,"test2new.jpg"))#文件流輸入手寫數(shù)字識(shí)別04(一)導(dǎo)入相關(guān)的庫(kù)因?yàn)橐婕拔募僮骱蛨D像處理,所以要在源程序文件中導(dǎo)入os庫(kù)和Image模塊。代碼如下。importosfromPILimportImage(二)定義轉(zhuǎn)換函數(shù)imgtotext本函數(shù)首先將含有數(shù)字的圖像進(jìn)行縮放和灰度化處理,然后對(duì)圖像逐行掃描,按每個(gè)像素點(diǎn)的像素灰度值大小將其轉(zhuǎn)換成0或者1,轉(zhuǎn)換規(guī)則如下。大于等于128:轉(zhuǎn)換成0(表示白色)。小于128:轉(zhuǎn)換成1(表示黑色)。(三)調(diào)用函數(shù)生成TXT文件通過如下形式調(diào)用函數(shù)imgtotext,將寫有數(shù)字“3”的圖像信息保存為文本信息。imgtotext(r'data\3.jpg',r'data\3_0.txt')一、數(shù)字圖像信息轉(zhuǎn)存為TXT文件(二)生成所有樣本的特征值和標(biāo)簽值所有的訓(xùn)練樣本數(shù)據(jù)和測(cè)試樣本數(shù)據(jù)分別保存在trainingDigits、testDigits文件夾下,因此,需要定義一個(gè)函數(shù)convert2dataset,將文件夾下所有的TXT文件轉(zhuǎn)換成樣本的特征值及對(duì)應(yīng)的標(biāo)簽值,代碼如下所示。1defconvert2dataset(file_path):2list_file=os.listdir(file_path)3m=len(list_file)4datas=np.zeros((m,1024))5labels=[]6foriinrange(m):7num=int(list_file[i][0])8labels.append(num)9datas[i,:]=txt2array(一)定義一個(gè)樣本的數(shù)據(jù)轉(zhuǎn)換函數(shù)定義函數(shù)txt2array,將一個(gè)TXT文件數(shù)據(jù)轉(zhuǎn)換成數(shù)值類型的數(shù)組,代碼如下所示。1deftxt2array(filename):2X=np.zeros((1,1024))3f=open(filename)4foriinrange(32):5lineStr=f.readline()6forjinrange(32):7X[0,32*i+j]=int(lineStr[j])8returnX二、批量生成樣本數(shù)據(jù)導(dǎo)入模塊sklearn.neighbors中的KNeighborsClassifier分類器,代碼如下。fromsklearn.neighborsimportKNeighborsClassifier(一)導(dǎo)入KNN類(二)構(gòu)建分類模型利用KNeighborsClassifier類生成KNN模型對(duì)象,代碼如下。knn=KNeighborsClassifier(n_neighbors=43,weights='distance',p=2)三、構(gòu)建KNN模型四、訓(xùn)練KNN模型(一)用訓(xùn)練集x_train、y_train來(lái)訓(xùn)練模型調(diào)用fit方法對(duì)模型進(jìn)行訓(xùn)練,代碼如下。knn.fit(x_train,y_train)上述代碼實(shí)際上就是讓模型“記住”每個(gè)樣本的特征值對(duì)應(yīng)的是哪個(gè)數(shù)字標(biāo)簽,經(jīng)過大量樣本的這種反復(fù)訓(xùn)練,模型就知道靠哪些特征值來(lái)識(shí)別出對(duì)應(yīng)的數(shù)字了。(二)對(duì)訓(xùn)練后的模型進(jìn)行評(píng)估為了解該模型訓(xùn)練后的效果,可以從準(zhǔn)確率方面做觀察,執(zhí)行以下代碼。knn=score(x_train,y_train)執(zhí)行結(jié)果如下。Out[88]:1.0五、評(píng)估模型效果(一)測(cè)試模型性能測(cè)試模型性能就是基于測(cè)試樣本用訓(xùn)練后的模型來(lái)預(yù)測(cè)對(duì)應(yīng)的分類標(biāo)簽值y_labels,并將其與真實(shí)的標(biāo)簽值y_test進(jìn)行對(duì)比,來(lái)驗(yàn)證模型的正確率、召回率和F1值等性能指標(biāo)。代碼如下。1fromsklearn.metricsimportclassification_report2y_pred=knn.predict(x_test)3print(classification_report(y_test,y_pred))代碼行1導(dǎo)入classification_report類,代碼行2對(duì)模型進(jìn)行測(cè)試,代碼行3是輸出模型性能測(cè)試報(bào)告,報(bào)告內(nèi)容如圖2-40所示。五、評(píng)估模型效果(二)通過交叉表了解模型的錯(cuò)分情況為更全面地了解所有數(shù)字的識(shí)別情況,可以通過計(jì)算標(biāo)簽的真實(shí)值與預(yù)測(cè)值的交叉表來(lái)詳細(xì)了解0~9當(dāng)中每個(gè)數(shù)字被錯(cuò)誤分類的整體分布情況。執(zhí)行以下代碼以生成混淆矩陣。1fromsklearn.metricsimportconfusion_matrix2y_test=np.array(y_test)3confusion_matrix(y_test,y_pred)4pd.crosstab(y_test,y_pred,rownames=['真實(shí)值'],colnames=['預(yù)測(cè)值'],margins=True)代碼行1導(dǎo)入計(jì)算混淆矩陣函數(shù),代碼行2進(jìn)行類型轉(zhuǎn)換,將y_test轉(zhuǎn)換成與y_pred同類型的變量。代碼行3生成測(cè)試集的實(shí)際值與預(yù)測(cè)值的混淆矩陣,代碼行4生成分類結(jié)果對(duì)比交叉表。運(yùn)行結(jié)果如圖2-43所示。知識(shí)鏈接1.樣本特征提取樣本特征提取是分類器工作的首要任務(wù),如果待分類對(duì)象沒有提取特征,也就沒有分類的依據(jù),就無(wú)從辨別對(duì)象的種類。2.正、負(fù)樣本針對(duì)分類問題,正樣本是指想要正確分類出的類別所對(duì)應(yīng)的樣本,負(fù)樣本是指不屬于這一類別的樣本。3.分類器分類器通過學(xué)習(xí)得到一個(gè)目標(biāo)函數(shù)或模型(以下統(tǒng)稱為模型),它能把樣本的特征集X映射到一個(gè)預(yù)先定義的類別號(hào)y。(二)分類器如何工作分類是數(shù)據(jù)挖掘、智能分析中的一種非常重要的方法,利用分類器能夠把數(shù)據(jù)映射到給定類別的某一個(gè)類別,從而提供對(duì)數(shù)據(jù)有價(jià)值的觀察視角,可以幫助機(jī)器更好地理解數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)。(一)什么是分類器一、分類器知識(shí)鏈接二、幾種主要的分類器(一)決策樹決策樹是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來(lái)求取凈現(xiàn)值的期望值大于等于零的概率,評(píng)價(jià)項(xiàng)目風(fēng)險(xiǎn),判斷其可行性的決策分析方法,是直觀運(yùn)用概率分析的一種圖解法。(五)神經(jīng)網(wǎng)絡(luò)分類器神經(jīng)網(wǎng)絡(luò)分類器由輸入層、隱藏層和輸出層構(gòu)成,它通過模仿人腦神經(jīng)系統(tǒng)的組織結(jié)構(gòu)及其某些活動(dòng)機(jī)理,來(lái)呈現(xiàn)人腦的許多特征。(四)支持向量機(jī)支持向量機(jī)是一種有監(jiān)督學(xué)習(xí)方式,可以進(jìn)行分類,也可以進(jìn)行回歸分析。(二)貝葉斯分類器貝葉斯分類器就是對(duì)于給定的分類項(xiàng),利用貝葉斯定理,求解該分類項(xiàng)在預(yù)先給定條件下各類別中出現(xiàn)的概率,哪個(gè)概率最大,就將其劃分為哪個(gè)類別。(三)k近鄰分類器把每個(gè)具有n個(gè)特征的樣本看作n維空間的一個(gè)點(diǎn),對(duì)于給定的新樣本,先計(jì)算該點(diǎn)與其他點(diǎn)的距離(相似度),然后將新樣本指派為周圍k個(gè)最近鄰的多數(shù)類。感謝觀看
人工智能應(yīng)用導(dǎo)論
項(xiàng)目三
語(yǔ)音識(shí)別技術(shù)應(yīng)用——讓機(jī)器對(duì)你言聽計(jì)從目錄CONTNETS語(yǔ)音數(shù)據(jù)采集聊天機(jī)器人語(yǔ)音轉(zhuǎn)文字1234語(yǔ)音合成5校園智能客服知識(shí)目標(biāo)1.理解語(yǔ)音識(shí)別原理。2.了解語(yǔ)音識(shí)別技術(shù)應(yīng)用。3.了解自然語(yǔ)言處理關(guān)鍵技術(shù)。技能目標(biāo)1.會(huì)語(yǔ)音采集和處理的方法。2.能調(diào)用API進(jìn)行語(yǔ)音識(shí)別的應(yīng)用開發(fā)。素養(yǎng)目標(biāo)1.培養(yǎng)精益求精、專心細(xì)致的工作作風(fēng)。2.培養(yǎng)數(shù)據(jù)保護(hù)意識(shí)。語(yǔ)音數(shù)據(jù)采集01任務(wù)實(shí)施1.安裝pyaudio、wave依賴庫(kù)。我們采用pipinstall命令方式。2.新建一個(gè)Python文件,通過importpyaudio創(chuàng)建PyAudio對(duì)象,打開聲卡,創(chuàng)建緩存空間。3.錄音10秒,并且將音頻數(shù)據(jù)存儲(chǔ)到列表。5.錄音結(jié)束后,停止并關(guān)閉聲卡,參考代碼。不管從數(shù)據(jù)安全還是資源管理方面,這一步操作都是必需的。4.通過wave庫(kù)將音頻數(shù)據(jù)寫到wav格式的文件中。SMART32154知識(shí)鏈接一、語(yǔ)音識(shí)別的過程語(yǔ)音識(shí)別是一個(gè)非常復(fù)雜的任務(wù),能達(dá)到今天的實(shí)際應(yīng)用水準(zhǔn)實(shí)屬不易。它涉及的技術(shù)領(lǐng)域主要有信號(hào)處理、模式識(shí)別、概率論、發(fā)聲機(jī)理、聽覺機(jī)理和人工智能等。大家都知道,機(jī)器只能處理數(shù)字信號(hào),不能直接處理人的語(yǔ)音信號(hào)。另外,人在說(shuō)話的時(shí)候,語(yǔ)速有快有慢,每個(gè)人的語(yǔ)音、語(yǔ)調(diào)也不盡相同,且說(shuō)話時(shí)周圍可能有一定的噪音影響。此外,即便發(fā)音相同(如“擬定”“你定”),但到底表達(dá)的是什么意思還要結(jié)合語(yǔ)境和上下文來(lái)進(jìn)一步確定。還有,機(jī)器要進(jìn)行預(yù)學(xué)習(xí),以了解人類在語(yǔ)言交流中要用到哪些語(yǔ)料庫(kù)等。不難想象,想讓機(jī)器聽懂人的話是很困難的任務(wù),語(yǔ)音識(shí)別過程如圖3-7所示。知識(shí)鏈接一、語(yǔ)音識(shí)別的過程1.語(yǔ)音信號(hào)處理2.特征提取3.聲學(xué)模型4.語(yǔ)言模型5.解碼搜索(一)語(yǔ)音識(shí)別的關(guān)鍵要素(1)采集一小段語(yǔ)音,把它轉(zhuǎn)換成數(shù)字信號(hào),然后進(jìn)行預(yù)加重、分幀和濾波處理,將其分成若干小段。(2)按FBank特征或梅爾頻率倒譜系數(shù)(MelFrequencyCepstralCoefficients,MFCC)特征進(jìn)行特征提取工作,為聲學(xué)模型提供合適的特征向量。(二)語(yǔ)音識(shí)別的具體步驟0102知識(shí)鏈接二、語(yǔ)音信號(hào)文件wav格式wav是微軟開發(fā)的一種文件格式規(guī)范。wav文件分為兩部分。第一部分是“總文件頭”,包括chunkID和ChunkSize兩個(gè)信息。chunkID,其值為“RIFF”,占四個(gè)字節(jié);ChunkSize,其值是整個(gè)wav文件除去chunkID和ChunkSize,后面所有文件大小的字節(jié)數(shù),占四個(gè)字節(jié)。第二部分是Format,其值為“wave”,占四個(gè)字節(jié)。它包括兩個(gè)子chunk(塊),分別是“fmt”和“data”。fmt子chunk中定義了該文件格式的參數(shù)信息,對(duì)于音頻而言,包括采樣率、通道數(shù)、位寬、編碼等等;data部分是“數(shù)據(jù)塊”,即一幀一幀的二進(jìn)制數(shù)據(jù),對(duì)于音頻而言,就是原始的PCM數(shù)據(jù)。從語(yǔ)音識(shí)別的原理可以知道,將語(yǔ)音數(shù)據(jù)文件存儲(chǔ)為wav格式是最好的。知識(shí)鏈接三、Python語(yǔ)音識(shí)別庫(kù)Python使用者可通過各大平臺(tái)提供的開源API在線使用一些語(yǔ)音識(shí)別服務(wù),且其中大部分也提供了PythonSDK。如PyPI(PythonPackageIndex,Python語(yǔ)言的官方軟件包索引)中就有很多現(xiàn)成的語(yǔ)音識(shí)別軟件包,包括:Apiai;google-cloud-speech;pocketsphinx;SpeechRcognition;watson-developer-cloud;wit。法律小貼士關(guān)于個(gè)人收集音頻、視頻證據(jù)的相關(guān)法律規(guī)定根據(jù)《最高人民法院關(guān)于民事訴訟證據(jù)的若干規(guī)定》第六十八條以侵害他人合法權(quán)益或者違反法律禁止性規(guī)定的方法取得的證據(jù),不能作為認(rèn)定案件事實(shí)的依據(jù)。第六十九條下列證據(jù)不能單獨(dú)作為認(rèn)定案件事實(shí)的依據(jù):(一)未成年人所作的與其年齡和智力狀況不相當(dāng)?shù)淖C言;(二)與一方當(dāng)事人或者其代理人有利害關(guān)系的證人出具的證言;(三)存有疑點(diǎn)的視聽資料;(四)無(wú)法與原件、原物核對(duì)的復(fù)印件、復(fù)制品;(五)無(wú)正當(dāng)理由未出庭作證的證人證言。因此,如果錄音證據(jù)的持有者采用了侵犯他人隱私或者違反法律禁止性的規(guī)定,比如錄有他人隱私或在其工作或住所竊聽取得的錄音資料,仍然會(huì)被排除使用。另外,單憑錄音、視頻證據(jù)單證一個(gè)事實(shí),證據(jù)容易有瑕疵,需要其他書證或者證人證言佐證。語(yǔ)音轉(zhuǎn)文字02任務(wù)實(shí)施1.進(jìn)入百度AI官網(wǎng),注冊(cè)賬號(hào)并領(lǐng)取語(yǔ)音識(shí)別服務(wù)資源,創(chuàng)建語(yǔ)音識(shí)別應(yīng)用。(1)通過單擊百度AI官網(wǎng)首頁(yè)右上角的“登錄”鏈接,如圖3-15所示,進(jìn)入用戶注冊(cè)頁(yè)面,如圖3-16所示,填寫注冊(cè)信息完成注冊(cè)。任務(wù)實(shí)施1.進(jìn)入百度AI官網(wǎng),注冊(cè)賬號(hào)并領(lǐng)取語(yǔ)音識(shí)別服務(wù)資源,創(chuàng)建語(yǔ)音識(shí)別應(yīng)用。(2)注冊(cè)成功后請(qǐng)登錄,單擊頁(yè)面右上角的“管理控制臺(tái)”,如圖3-17所示,進(jìn)入管理中心頁(yè)面,接著打開左側(cè)產(chǎn)品服務(wù)列表,選擇“人工智能”→“語(yǔ)音技術(shù)”,進(jìn)入“語(yǔ)音技術(shù)-概覽”頁(yè)面,選擇“創(chuàng)建應(yīng)用”。任務(wù)實(shí)施1.進(jìn)入百度AI官網(wǎng),注冊(cè)賬號(hào)并領(lǐng)取語(yǔ)音識(shí)別服務(wù)資源,創(chuàng)建語(yǔ)音識(shí)別應(yīng)用。(3)在創(chuàng)建應(yīng)用頁(yè)面填寫新應(yīng)用的信息完成應(yīng)用創(chuàng)建,如圖3-20所示。創(chuàng)建成功后單擊左側(cè)的“應(yīng)用列表”可以查看列表信息,包括應(yīng)用的AppID、APIKey和SecretKey,這些信息后面調(diào)用API的時(shí)候需要用到。應(yīng)用列表頁(yè)面。(4)在“語(yǔ)音技術(shù)-概覽”頁(yè)面領(lǐng)取語(yǔ)音識(shí)別和語(yǔ)音合成的免費(fèi)資源額度。任務(wù)實(shí)施2.安裝Python依賴包baidu-aip和SpeechRecognition。前面已經(jīng)安裝過wave和pyaudio庫(kù)了,此處我們就可以直接引用,但還需要安裝baidu-aip和SpeechRecognition包,參考命令如下:pipinstallbaidu-aippipinstallSpeechRecognition3.學(xué)習(xí)百度的官方文檔,根據(jù)官方文檔簡(jiǎn)介和接口說(shuō)明編寫代碼實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文本功能。4.從result中提取轉(zhuǎn)換后的文本并輸出到屏幕。5.在輸出文本后,播放錄音進(jìn)行校對(duì)。小貼士錄音轉(zhuǎn)換成文字的注意事項(xiàng)首先,最重要的一點(diǎn)是確保高質(zhì)量的錄音文件,錄音質(zhì)量有別于錄像錄音,可以說(shuō)是以聲音來(lái)創(chuàng)造文本的一種方式。其次,需要根據(jù)錄音內(nèi)容的主題選擇合適的錄音轉(zhuǎn)換軟件,不同的軟件具有不同的適用范圍,如果選擇的軟件不符合錄音文件的特點(diǎn),可能會(huì)影響轉(zhuǎn)換文本的質(zhì)量,不僅影響表達(dá)效果,還可能使文本內(nèi)容無(wú)法正確地理解,從而影響后期應(yīng)用。再次,要在錄音前做好充分的準(zhǔn)備,如進(jìn)行錄音場(chǎng)所的檢查,確保環(huán)境安靜,除去外界雜音和其它可能影響錄音質(zhì)量的因素,使錄音文件質(zhì)量達(dá)到最佳;同時(shí),還要根據(jù)具體錄音內(nèi)容確定好順序,了解對(duì)象能力,劃分段落,幫助避免不必要的重復(fù)說(shuō)話,并加快錄音轉(zhuǎn)換文本的速度和質(zhì)量。最后,在轉(zhuǎn)換文本的過程中,要確保錄音轉(zhuǎn)換質(zhì)量,注意檢查關(guān)鍵詞的拼寫及語(yǔ)法,檢查翻譯和術(shù)語(yǔ)的準(zhǔn)確性,以及句子的連貫性,確保文本盡量形象地表達(dá)出錄音內(nèi)容,讓讀者能夠準(zhǔn)確理解錄音的主題,可以在每段文字之后留出一點(diǎn)時(shí)間來(lái)檢查其質(zhì)量。知識(shí)鏈接1234(一)通過硬件輸入聲音信號(hào)(二)對(duì)輸入的音頻進(jìn)行信號(hào)處理,即進(jìn)行幀(毫秒級(jí))拆分(三)形成音素(四)將音素組成字詞并串連成句一、語(yǔ)音識(shí)別的原理知識(shí)鏈接二、語(yǔ)音識(shí)別技術(shù)(一)端點(diǎn)檢測(cè)(二)特征提?。ㄋ模┱Z(yǔ)音識(shí)別開源平臺(tái)和開放平臺(tái)(三)聲學(xué)模型01040302語(yǔ)音合成03任務(wù)實(shí)施參考官網(wǎng)技術(shù)文檔中的“接口說(shuō)明”,調(diào)用synthesis方法將text轉(zhuǎn)換成音頻并以MP3文件保存到本地。3與“語(yǔ)音轉(zhuǎn)文字任務(wù)”一樣,導(dǎo)入AipSpeech,再利用百度應(yīng)用賬號(hào)創(chuàng)建一個(gè)client對(duì)象。14.利用playsound播報(bào)MP3音頻文件。4定義變量text,用來(lái)存儲(chǔ)從鍵盤輸入的文本內(nèi)容,也就是我們需要轉(zhuǎn)換為語(yǔ)音的文本內(nèi)容。2知識(shí)鏈接一、語(yǔ)音語(yǔ)音包括三大關(guān)鍵部分——語(yǔ)音信息、語(yǔ)音音色和語(yǔ)音韻律。語(yǔ)音信息是指說(shuō)話的內(nèi)容,就是要轉(zhuǎn)換成語(yǔ)言的文本信息的內(nèi)容。語(yǔ)音音色是指說(shuō)話者聲音的特色、個(gè)性,俗話說(shuō)的“未見其人先聞其聲”就說(shuō)明了音色的重要性。對(duì)于語(yǔ)音合成來(lái)說(shuō),音色的選擇與內(nèi)容要匹配,比如,播報(bào)新聞聯(lián)播的聲音用動(dòng)漫里面的“娃娃音”就不合適。語(yǔ)音韻律就是說(shuō)話的方式,即說(shuō)話時(shí)聲音的高低、快慢等。知識(shí)鏈接二、語(yǔ)音合成技術(shù)原理語(yǔ)音合成技術(shù)中的聲學(xué)系統(tǒng)合成從最初只能合成元音和單音到現(xiàn)在已經(jīng)與真人發(fā)聲無(wú)異的效果,科學(xué)家們經(jīng)過了長(zhǎng)期的努力。根據(jù)技術(shù)實(shí)現(xiàn)方式大致可以將語(yǔ)言合成技術(shù)分為以下六個(gè)階段。1.機(jī)械模擬階段2.電子合成器階段3.共振峰合成器階段4.單元挑選拼接合成階段5.基于HMM參數(shù)合成階段6.基于深度學(xué)習(xí)的語(yǔ)音合成階段(二)聲學(xué)系統(tǒng)部分1.文本結(jié)構(gòu)與語(yǔ)種判斷當(dāng)需要合成的文本輸入后,先要判斷是什么語(yǔ)種,再根據(jù)對(duì)應(yīng)語(yǔ)種的語(yǔ)法規(guī)則,把整段文字切分為單個(gè)的句子。2.文本標(biāo)準(zhǔn)化在輸入需要合成的文本中,若有阿拉伯?dāng)?shù)字或字母,則需要將其轉(zhuǎn)化為文字。3.文本轉(zhuǎn)音素在漢語(yǔ)的語(yǔ)音合成中,基本上是以拼音對(duì)文字標(biāo)注的。4.句讀韻律預(yù)測(cè)人類在語(yǔ)言表達(dá)的時(shí)候總是附帶著語(yǔ)氣與感情,TTS合成的音頻是為了模仿真實(shí)的人聲,所以需要對(duì)文本進(jìn)行韻律預(yù)測(cè)。(一)語(yǔ)言分析部分知識(shí)鏈接三、語(yǔ)音合成技術(shù)API服務(wù)現(xiàn)在我國(guó)各大AI企業(yè)都有對(duì)應(yīng)的免費(fèi)開放的API為開發(fā)者提供應(yīng)用服務(wù),例如,百度2018年6月份就發(fā)布了百度語(yǔ)音識(shí)別無(wú)限量使用。表3-1列舉了我國(guó)提供語(yǔ)音合成技術(shù)API的部分企業(yè)和其語(yǔ)音合成的技術(shù)優(yōu)勢(shì)。知識(shí)鏈接四、語(yǔ)音合成的應(yīng)用(二)智能服務(wù)類智能服務(wù)類產(chǎn)品包括智能語(yǔ)音機(jī)器人、智能音響應(yīng)用等。智能語(yǔ)音機(jī)器人產(chǎn)品遍布各行各業(yè)。(三)特殊領(lǐng)域一些特殊領(lǐng)域也非常需要語(yǔ)音合成。比如,對(duì)于視障人士來(lái)講,以往只能依賴雙手來(lái)獲取信息。(一)App應(yīng)用類語(yǔ)音合成技術(shù)在銀行、醫(yī)院的信息播報(bào)系統(tǒng),汽車導(dǎo)航系統(tǒng)及自動(dòng)應(yīng)答呼叫中心等都有廣泛應(yīng)用。聊天機(jī)器人04任務(wù)實(shí)施1.導(dǎo)入requests、json、time和random依賴庫(kù)。3.定義一個(gè)函數(shù)xiaoxin,調(diào)用YungeAPI,發(fā)送text然后獲得回復(fù)。2.利用random函數(shù)和time方法創(chuàng)建一個(gè)隨機(jī)字符串,用來(lái)區(qū)分每一次對(duì)話的對(duì)象。4.調(diào)用xiaoxin函數(shù),創(chuàng)建閑聊機(jī)器人,為了不間斷聊天,我們循環(huán)輸入問題并調(diào)用xiaoxin函數(shù)。知識(shí)鏈接一、神經(jīng)網(wǎng)絡(luò)(一)神經(jīng)元結(jié)構(gòu)1943年,心理學(xué)家WarrenMcCulloch和數(shù)學(xué)家WalterPits發(fā)明了神經(jīng)元模型,非常類似人類的神經(jīng)元,x1到xm模擬樹突的輸入,不同的權(quán)重參數(shù)衡量不同的輸入對(duì)輸出的影響,通過加權(quán)求和、增加偏置值的方式傳輸出來(lái),再通過激活函數(shù),得到輸出,傳遞下去。(二)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)是由多個(gè)神經(jīng)元組成的網(wǎng)絡(luò),如圖3-53所示。以手寫數(shù)字識(shí)別的項(xiàng)目為例,它們由像素組成,每個(gè)像素的值作為輸入層的x1到xn,輸入層的信號(hào)傳給不同深度、數(shù)量的神經(jīng)元,并進(jìn)行加權(quán)計(jì)算,神經(jīng)元再把信號(hào)傳給下一級(jí),最后輸出一個(gè)結(jié)果y,代表是0~9中的某個(gè)數(shù)字。二、聊天機(jī)器人(三)Disney——用虛構(gòu)人物解決犯罪問題迪士尼使用聊天機(jī)器人來(lái)扮演動(dòng)畫電影中的角色,邀請(qǐng)電影的粉絲一起解決電影中的犯罪問題。(四)聯(lián)合國(guó)兒童基金會(huì)——幫助邊緣化社區(qū)這款機(jī)器人專注于通過民意調(diào)查收集大規(guī)模數(shù)據(jù),定期發(fā)布針對(duì)一系列緊急社會(huì)問題的民意調(diào)查,用戶(即“U-Reporters”)可以回復(fù)他們的意見。(一)Endurance——阿爾茨海默病患者的伴侶俄羅斯科技公司Endurance開發(fā)了伴侶聊天機(jī)器人,通過機(jī)器人采集聊天記錄,醫(yī)生和家人可以通過患者與機(jī)器人的聊天記錄來(lái)判斷患者識(shí)別記憶功能的潛在退化和患者病情惡化的交流障礙。(二)Casper——幫助失眠者度過漫漫長(zhǎng)夜Casper是一個(gè)旨在讓失眠者與其他人交談的網(wǎng)絡(luò)聊天機(jī)器人,可驅(qū)散失眠者的孤獨(dú),陪伴其度過漫漫長(zhǎng)夜。三、聊天機(jī)器人API01(一)圖靈機(jī)器人API圖靈機(jī)器人具有智能對(duì)話、知識(shí)庫(kù)、技能服務(wù)三種核心功能,它能準(zhǔn)確地對(duì)中文語(yǔ)義進(jìn)行理解,人們可以借助圖靈機(jī)器人的API接口,根據(jù)自己的需要?jiǎng)?chuàng)建聊天機(jī)器人、客服機(jī)器人、領(lǐng)域?qū)υ拞柎饳C(jī)器人、兒童陪伴機(jī)器人等在線服務(wù)。02(二)青云客API青云客提供了聊天機(jī)器人的調(diào)用接口,并提供了API文檔,目前不需要注冊(cè),完全免費(fèi)。03(三)騰訊閑聊機(jī)器人API騰訊閑聊機(jī)器人基于AILab領(lǐng)先的NLP引擎能力、數(shù)據(jù)運(yùn)算能力和千億級(jí)互聯(lián)網(wǎng)語(yǔ)料數(shù)據(jù)的支持,同時(shí)集成了廣泛的知識(shí)問答能力,可實(shí)現(xiàn)上百種自定義屬性配置,以及男、女不同的語(yǔ)言風(fēng)格及說(shuō)話方式,從而讓聊天變得更睿智、簡(jiǎn)單和有趣。小貼士聊天機(jī)器人背后的風(fēng)險(xiǎn)(一)數(shù)據(jù)安全風(fēng)險(xiǎn)以ChatGPT用戶數(shù)據(jù)泄漏事故為例,在使用AI產(chǎn)品的過程中,相關(guān)個(gè)人、金融、商業(yè)隱私等的敏感信息數(shù)據(jù)存儲(chǔ)于各個(gè)AIGC公司的數(shù)據(jù)庫(kù)中,一旦泄露容易對(duì)用戶的個(gè)人隱私安全造成威脅。(二)虛假、違法信息傳播風(fēng)險(xiǎn)AI產(chǎn)品的開發(fā)和改進(jìn)需要一個(gè)包含公眾反饋的迭代過程,而當(dāng)下市場(chǎng)上的產(chǎn)品架構(gòu)遠(yuǎn)遠(yuǎn)未到成熟階段,不可避免地存在漏洞。一旦被攻擊者利用,加入偽裝數(shù)據(jù)或者惡意樣本,會(huì)讓模型產(chǎn)生不正確或誤導(dǎo)性的結(jié)果,甚至可能生成虛假信息、誘騙信息等不良信息,破壞網(wǎng)絡(luò)輿論生態(tài)。(三)知識(shí)產(chǎn)權(quán)/著作權(quán)侵權(quán)風(fēng)險(xiǎn)AI產(chǎn)品,尤其是聊天機(jī)器人的答案生成需要依托于海量的文本數(shù)據(jù),通過對(duì)數(shù)據(jù)集進(jìn)行監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)從而優(yōu)化輸出的內(nèi)容。(四)深度偽造風(fēng)險(xiǎn)AI產(chǎn)品還存在著被用于制作虛假的文本、音頻、視頻等深度偽造的內(nèi)容的風(fēng)險(xiǎn)。例如AI換臉、語(yǔ)音模擬、人臉合成、視頻生成等深度偽造技術(shù)應(yīng)用場(chǎng)景。校園智能客服05(二)分詞處理——jieba庫(kù)中文自然語(yǔ)言分詞處理中最簡(jiǎn)單實(shí)用的就是jieba分詞處理,也稱為jieba庫(kù),是完全“MadeinChina”的一個(gè)分詞處理技術(shù)。(一)建立問答庫(kù)FAQ(FrequentlyAskedQuestions)指常見問題的解答,具體形式是問題和與問題相關(guān)的答案組成的問答對(duì)(QApair)。(三)分詞過濾——停用詞在信息檢索中,為節(jié)省存儲(chǔ)空間和提高搜索效率,在處理自然語(yǔ)言數(shù)據(jù)(或文本)之前或之后會(huì)自動(dòng)過濾掉某些字或詞,這些字或詞即被稱為停用詞(StopWords)。一、構(gòu)建語(yǔ)料庫(kù)二、語(yǔ)料庫(kù)訓(xùn)練基于信息檢索是實(shí)現(xiàn)智能問答系統(tǒng)的經(jīng)典方法,詞頻—逆向文檔頻度(TermFrequency-InverseDocumentFrequency,TF-IDF)就是其中常用的信息檢索算法。TF-IDF算法是一種針對(duì)關(guān)鍵詞的統(tǒng)計(jì)分析方法,用來(lái)評(píng)估一個(gè)詞對(duì)一個(gè)文件集或者一個(gè)語(yǔ)料庫(kù)的重要程度。TF-IDF算法認(rèn)為,一個(gè)詞的重要程度跟它在文章中出現(xiàn)的次數(shù)成正比,但跟它在語(yǔ)料庫(kù)中出現(xiàn)的次數(shù)成反比。TF-IDF實(shí)際包含兩層含義:一層是TF(TermFrequency),表示“詞頻”;另一層是IDF(InverseDocumentFrequency),表示“逆向文檔頻率”。三、句子相似度計(jì)算句子相似度是指兩個(gè)句子之間相似的程度,在自然語(yǔ)言處理中有很大的用處。譬如,在對(duì)話系統(tǒng)、文本分類、信息檢索、語(yǔ)義分析等應(yīng)用場(chǎng)景中,它可以提供更快的檢索信息方式,并且得到的信息更加準(zhǔn)確。若要快速為輸入的問題找到對(duì)應(yīng)的回答,就需要計(jì)算輸入的句子與語(yǔ)料庫(kù)中句子的相似度,找出相似度最高的幾個(gè)句子從而為解答做準(zhǔn)備。這里我們利用詞袋模型來(lái)實(shí)現(xiàn)。詞袋模型(Bag-of-WordsModel)是在自然語(yǔ)言處理和信息檢索(IR)下被簡(jiǎn)化的表達(dá)模型,在此模型下可以像用一個(gè)袋子裝著組成句子的詞一樣的方式來(lái)表現(xiàn)句子,這種表現(xiàn)方式不考慮文法以及詞的順序。四、輸入問題獲取答案在完成以上三個(gè)步驟后,我們就可以輸入問題,計(jì)算句子的相似度,從而從語(yǔ)料庫(kù)中搜索到最匹配的回答,參考代碼如圖3-67所示,這里找出了相似度值排名前三的回答,最終輸出相似度最高(即排名第一)的回答。知識(shí)鏈接一、機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)是一個(gè)多學(xué)科交叉領(lǐng)域,涵蓋計(jì)算機(jī)科學(xué)、概率論知識(shí)、統(tǒng)計(jì)學(xué)知識(shí)、近似理論知識(shí)。目前有以下幾種定義。(1)機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對(duì)象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。(2)機(jī)器學(xué)習(xí)是對(duì)能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究。(3)機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)系統(tǒng)的性能。(一)機(jī)器學(xué)習(xí)的定義1.有監(jiān)督學(xué)習(xí)有監(jiān)督學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個(gè)函數(shù),當(dāng)新的數(shù)據(jù)到來(lái)時(shí),可以根據(jù)這個(gè)函數(shù)預(yù)測(cè)結(jié)果。監(jiān)督學(xué)習(xí)的訓(xùn)練集要求是輸入和輸出,也可以說(shuō)是特征和目標(biāo),訓(xùn)練集中的目標(biāo)是由人標(biāo)注的。2.無(wú)監(jiān)督學(xué)習(xí)與有監(jiān)督學(xué)習(xí)相比,無(wú)監(jiān)督學(xué)習(xí)訓(xùn)練集是沒有人為標(biāo)注的。無(wú)監(jiān)督機(jī)器學(xué)習(xí)的應(yīng)用模式主要包括聚類算法和關(guān)聯(lián)規(guī)則抽取。(二)機(jī)器學(xué)習(xí)算法的分類0102知識(shí)鏈接二、自然語(yǔ)言處理(一)自然語(yǔ)言處理的概念指用計(jì)算機(jī)對(duì)自然語(yǔ)言的形、音、義等信息進(jìn)行處理,即對(duì)字、詞、句、篇章的輸入、輸出、識(shí)別、分析、理解、生成等的操作和加工。(二)自然語(yǔ)言處理的一般流程在自然語(yǔ)言處理時(shí),通常有獲取語(yǔ)料、語(yǔ)料預(yù)處理、特征工程、特征選擇、模型選擇、模型訓(xùn)練、模型評(píng)估7個(gè)步驟。也有部分學(xué)者弱化模型選擇和模型評(píng)估這兩個(gè)步驟。(三)自然語(yǔ)言處理的常用技術(shù)1.語(yǔ)言處理基礎(chǔ)技術(shù)2.語(yǔ)言處理應(yīng)用技術(shù)3.理解與交互技術(shù)4.文本審核技術(shù)5.智能寫作技術(shù)知識(shí)鏈接三、搜索技術(shù)搜索技術(shù)滲透于各種人工智能系統(tǒng)中,在專家系統(tǒng)、自然語(yǔ)言處理、自動(dòng)程序設(shè)計(jì)、模式識(shí)別、機(jī)器人學(xué)、信息檢索和博弈等領(lǐng)域均有廣泛的應(yīng)用。搜索是大多數(shù)人生活的一部分。幾乎每個(gè)人都有找不到鑰匙而檢查口袋、翻箱倒柜的經(jīng)歷,而更多的時(shí)候,搜索可能是在大腦中直接進(jìn)行的,人的思維過程就可以看作一個(gè)搜索過程。你可能突然想不起一個(gè)英文單詞的拼寫,忘掉了身邊同事的名字,唱不出曾經(jīng)爛熟于心的歌詞,這個(gè)時(shí)候就需要你在大腦中進(jìn)行搜索,通常很快就能得出答案。但是計(jì)算機(jī)處理搜索和人的思維過程不完全相同。計(jì)算機(jī)能夠更加深刻地體現(xiàn)出符號(hào)主義的思想。以大家熟悉的走迷宮為例。假設(shè)我們面前有一幅迷宮圖,如圖3-75所示,通常我們會(huì)用一支筆或直接用手指點(diǎn)在圖上向出口的方向移動(dòng)。感謝觀看
人工智能應(yīng)用導(dǎo)論
項(xiàng)目四
人臉識(shí)別技術(shù)應(yīng)用——機(jī)器也認(rèn)識(shí)你目錄CONTNETS人臉檢測(cè)照片智能搜索人臉特征提取1234人臉識(shí)別5口罩檢測(cè)賦能衛(wèi)生防護(hù)知識(shí)目標(biāo)1.了解人臉識(shí)別的基本流程。2.了解計(jì)算機(jī)視覺庫(kù)基本知識(shí)。3.知道卷積神經(jīng)網(wǎng)絡(luò)及其原理。技能目標(biāo)1.會(huì)用Dlib庫(kù)進(jìn)行人臉檢測(cè)。2.能利用已訓(xùn)練的模型face_net進(jìn)行人臉識(shí)別。3.能調(diào)用人臉識(shí)別模型進(jìn)行人臉特征提取并存儲(chǔ)。素養(yǎng)目標(biāo)1.培養(yǎng)學(xué)生技術(shù)服務(wù)人類的意識(shí)。2.樹立正確的肖像保護(hù)意識(shí),關(guān)愛五官有殘缺的弱勢(shì)群體。3.培養(yǎng)學(xué)生保護(hù)隱私、合理文明使用視頻的意識(shí)。人臉檢測(cè)01任務(wù)實(shí)施1231.獲取實(shí)時(shí)的視頻流在實(shí)施本任務(wù)前,需要具備一個(gè)攝像頭,并且已經(jīng)配置好OpenCV的環(huán)境(可以使用pip3installopencv-python下載)。2.在視頻流中使用Haar分類器進(jìn)行人臉檢測(cè)在開始本任務(wù)之前,我們可以通過以下方式得到已經(jīng)訓(xùn)練好的人臉檢測(cè)模型haarcascade_frontalface_default.xml。3.保存人臉ROI區(qū)域在機(jī)器視覺、圖像處理中,在被處理的圖像中以方框、圓、橢圓、不規(guī)則多邊形等方式勾勒出需要處理的區(qū)域,這個(gè)區(qū)域被稱為感興趣區(qū)域ROI。知識(shí)鏈接一、計(jì)算機(jī)視覺庫(kù)——OpenCV23145(五)OpenCV中的繪圖函數(shù)OpenCV繪圖函數(shù)主要有cv2.line()、cv2.circle()、cv2.rectangle()等,分別用來(lái)繪制直線、圓形、矩形、橢圓,以及添加文字。(四)利用OpenCV保存圖像使用函數(shù)cv2.imwrite()來(lái)保存一個(gè)圖像。保存時(shí)首先需要一個(gè)文件名,之后才是要保存的圖像,如cv2.imwrite('lena2.png',img)。(二)利用OpenCV讀入圖像使用函數(shù)cv2.imread(filepath,flags)讀入圖像。filepath是指圖像在此程序的工作路徑或者完整路徑,flags是讀取該圖像的方式。(三)利用OpenCV顯示圖像讀入圖像后使用函數(shù)cv2.imshow()可以顯示圖像。在顯示圖像時(shí),窗口會(huì)自動(dòng)調(diào)整為圖像大小。(一)安裝OpenCV進(jìn)入命令提示符窗口,輸入pipinstallopencv-python(這里請(qǐng)注意,我們安裝的是opencv-python,而不是opencv)。知識(shí)鏈接二、使用Haar分類器進(jìn)行人臉檢測(cè)的原理Haar特征是用于物體檢測(cè)的矩形的數(shù)字圖像特征。這類矩形特征模板由兩個(gè)或多個(gè)全等的黑白矩形相鄰組合而成(一)Haar特征對(duì)于一幅灰度的圖像,積分圖像中的任意一點(diǎn)(x,y)的值是指從該圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有的點(diǎn)的灰度值之和。(二)積分圖Adaboost是一種迭代算法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的分類器(即弱分類器),通過對(duì)這些弱分類器進(jìn)行加權(quán)和獲得最終分類器(即強(qiáng)分類器)。通過積分圖像我們獲得了大量的人臉特征,要從中選出最好的特征就要使用Adaboost分類器。(三)Adaboost分類器案例分析衛(wèi)浴門店自動(dòng)抓取人臉信息:2021年央視“3·15”晚會(huì)點(diǎn)名某衛(wèi)浴門店收集人臉數(shù)據(jù)的問題。該衛(wèi)浴門店在全國(guó)上千家門店,每個(gè)門店安裝有人臉識(shí)別功能的攝像頭,消費(fèi)者只要走進(jìn)門店,在不知情的情況下,就會(huì)被攝像頭抓取并自動(dòng)生成編號(hào),標(biāo)注顧客第幾次到店、男女、年齡等信息。所涉收集人臉數(shù)據(jù),能通過人臉識(shí)別信息解決精準(zhǔn)營(yíng)銷,抓取的人臉數(shù)據(jù)信息累計(jì)上億。安防公司泄露人臉信息:2019年2月,深圳某“AI+安防”公司人臉識(shí)別數(shù)據(jù)庫(kù)缺乏保護(hù),導(dǎo)致大規(guī)模的數(shù)據(jù)泄露。該數(shù)據(jù)庫(kù)包含了超過256萬(wàn)用戶的信息,包括身份證號(hào)碼、地址、出生日期、識(shí)別其身份的位置。分析:人臉是重要的隱私信息,利用各種技術(shù)和手段,在未經(jīng)同意允許或批準(zhǔn)的前提下,通過公開或非法手段,收集、保存、盜取正常的人臉數(shù)據(jù),一旦信息出現(xiàn)泄露,不僅被不法分子進(jìn)行用于詐騙,更可能被反復(fù)販賣牟利。人臉特征提取023.獲得人臉特征向量在main函數(shù)中調(diào)用這兩個(gè)函數(shù),即可獲得人臉特征向量。4.搭建人臉特征庫(kù)搭建人臉特征庫(kù)最簡(jiǎn)單的方法是直接保存人臉圖片,但是這種方法有兩個(gè)缺點(diǎn):①在進(jìn)行網(wǎng)絡(luò)傳輸時(shí)開銷較大;②在終端進(jìn)行加載時(shí)速度較慢(因?yàn)樾枰匦抡业饺四槪@取特征)。1.獲得人臉ROI區(qū)域這里可以將人臉檢測(cè)任務(wù)的實(shí)現(xiàn)過程通過get_face_roi()函數(shù)封裝起來(lái),方便后面直接調(diào)用。2.獲取人臉特征接下來(lái),我們定義一個(gè)函數(shù)get_face_features(),用來(lái)獲取人臉特征。任務(wù)實(shí)施知識(shí)鏈接一、人臉特征和人臉特征提取方法人臉特征提取是指通過一些數(shù)字來(lái)表征人臉信息。常見的人臉特征分為幾何特征和表征特征兩類。幾何特征是指眼睛、鼻子和嘴等面部器官之間的幾何關(guān)系,如距離、面積和角度等。各器官之間歐氏距離、角度及其大小和外形被量化成一系列參數(shù),用來(lái)衡量人臉特征,所以對(duì)眼、鼻、嘴等器官的定位工作就十分重要。在用于人臉特征提取的算法中,為了減少計(jì)算量,只利用了一些直觀的特征。而在實(shí)際應(yīng)用中,需要用到的幾何特征點(diǎn)不能精確選擇,從而限制了它的應(yīng)用范圍。另外,當(dāng)出現(xiàn)光照變化、人臉有外物遮擋或發(fā)生面部表情變化等情況時(shí),幾何特征變化較大,魯
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國(guó)串串香行業(yè)營(yíng)銷創(chuàng)新戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)智能公交行業(yè)開拓第二增長(zhǎng)曲線戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)螢石行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)XRF儀器行業(yè)全國(guó)市場(chǎng)開拓戰(zhàn)略制定與實(shí)施研究報(bào)告
- 化學(xué)品 快速雄激素干擾活性報(bào)告試驗(yàn) 征求意見稿
- 安徽省房屋建筑安徽省工程建筑信息模型(BIM)審查數(shù)據(jù)標(biāo)準(zhǔn)(2025版)
- 2025年鋁制桌椅項(xiàng)目可行性研究報(bào)告
- 燒烤排煙知識(shí)培訓(xùn)課件
- 實(shí)驗(yàn)學(xué)校上學(xué)期工作參考計(jì)劃
- 防詐騙安全知識(shí)培訓(xùn)課件
- 2024年股東股權(quán)繼承轉(zhuǎn)讓協(xié)議3篇
- 2025年中央歌劇院畢業(yè)生公開招聘11人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 北京市高校課件 開天辟地的大事變 中國(guó)近代史綱要 教學(xué)課件
- 監(jiān)事會(huì)年度工作計(jì)劃
- 2024中國(guó)近海生態(tài)分區(qū)
- 山東省濟(jì)南市2023-2024學(xué)年高一上學(xué)期1月期末考試化學(xué)試題(解析版)
- 北師大版五年級(jí)數(shù)學(xué)下冊(cè)第3單元第1課時(shí)分?jǐn)?shù)乘法(一)課件
- 2024-2030年中國(guó)汽車保險(xiǎn)杠行業(yè)市場(chǎng)發(fā)展現(xiàn)狀及前景趨勢(shì)分析報(bào)告
- 智研咨詢發(fā)布:中國(guó)種豬行業(yè)市場(chǎng)現(xiàn)狀、發(fā)展概況、未來(lái)前景分析報(bào)告
- 六年級(jí)上冊(cè)分?jǐn)?shù)四則混合運(yùn)算100題及答案
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識(shí)
評(píng)論
0/150
提交評(píng)論