數(shù)據(jù)標(biāo)注工程PPT課件_第1頁(yè)
數(shù)據(jù)標(biāo)注工程PPT課件_第2頁(yè)
數(shù)據(jù)標(biāo)注工程PPT課件_第3頁(yè)
數(shù)據(jù)標(biāo)注工程PPT課件_第4頁(yè)
數(shù)據(jù)標(biāo)注工程PPT課件_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材數(shù)據(jù)標(biāo)注工程劉 鵬 張 燕 總主編劉 鵬 主編 第一章數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景1.3 有多少智能,就有多少人工1.5 作業(yè)與練習(xí)大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材1.4 數(shù)據(jù)越多,智能越好1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述 數(shù)據(jù)標(biāo)注即通過(guò)分類(lèi)、畫(huà)框、標(biāo)注、注釋等,對(duì)圖片、語(yǔ)音、文本等數(shù)據(jù)進(jìn)行處理,標(biāo)記對(duì)象的特征,以作為機(jī)器學(xué)習(xí)基礎(chǔ)素材的過(guò)程。“這是一輛汽車(chē)”1.1.1 什么是數(shù)據(jù)標(biāo)注1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述正是人類(lèi)像教育小孩一樣培養(yǎng)了Alpha

2、Go,才讓其“學(xué)會(huì)”下棋。 不同AlphaGo版本的棋力比較1.1.1 什么是數(shù)據(jù)標(biāo)注1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述 圖像標(biāo)注1.1.1 什么是數(shù)據(jù)標(biāo)注1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述 語(yǔ)音標(biāo)注1.1.2 數(shù)據(jù)標(biāo)注分類(lèi)概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述 文本標(biāo)注1.1.2 數(shù)據(jù)標(biāo)注分類(lèi)概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展 第一章 數(shù)據(jù)標(biāo)注概述 數(shù)據(jù)標(biāo)注流程1.1.3 數(shù)據(jù)標(biāo)注流程概述第一章數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景1.3 有多少智能,就有多少人工1.5 作業(yè)與練習(xí)大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材1.4 數(shù)據(jù)

3、越多,智能越好1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.1 出行行業(yè)常見(jiàn)應(yīng)用:以矩形框或描點(diǎn)對(duì)車(chē)輛進(jìn)行標(biāo)注;以矩形框或描點(diǎn)標(biāo)注人體輪廊;采集地址興趣點(diǎn),在地圖上做出相應(yīng)地理位置信息標(biāo)記的POI(Point of Interest)標(biāo)記等。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.2 金融行業(yè)文字翻譯、語(yǔ)義分析、語(yǔ)音轉(zhuǎn)錄、圖像標(biāo)注等,都是具有代表性的重要應(yīng)用。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.3 醫(yī)療行業(yè)通過(guò)人體標(biāo)框、3D畫(huà)框、骨骼點(diǎn)標(biāo)記、病歷轉(zhuǎn)錄等應(yīng)用,機(jī)器學(xué)習(xí)能夠快速完成醫(yī)學(xué)編碼和注釋,以及在遠(yuǎn)程醫(yī)療、醫(yī)療機(jī)器人、醫(yī)療影像、藥物挖掘等場(chǎng)景的應(yīng)

4、用。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.4 家居行業(yè)主要包括應(yīng)用矩形框標(biāo)記人臉,進(jìn)行人臉精細(xì)分割;對(duì)家居物品進(jìn)行畫(huà)框標(biāo)記;通過(guò)描點(diǎn)的方式進(jìn)行區(qū)域劃分;采集語(yǔ)音并進(jìn)行標(biāo)注處理等。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.5 安防行業(yè)對(duì)于數(shù)據(jù)標(biāo)注人員而言,需要做的正是對(duì)訓(xùn)練圖片中人物的性別、年齡、膚色、表情、頭發(fā)以及是否帶帽帶眼鏡等進(jìn)行分類(lèi)標(biāo)注,或者對(duì)行人做標(biāo)框處理,幫助機(jī)器獲取快速識(shí)別能力。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.6 公共服務(wù)確定內(nèi)容是否符合描述的內(nèi)容審核,對(duì)具有相同意思的語(yǔ)句進(jìn)行歸類(lèi)的語(yǔ)義分析、將音頻轉(zhuǎn)化為文字的語(yǔ)音轉(zhuǎn)錄,以及查

5、看視頻是否符合要求的視頻審核等都是數(shù)據(jù)標(biāo)注中的常見(jiàn)應(yīng)用。1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景 第一章 數(shù)據(jù)標(biāo)注概述1.2.7 電子商務(wù)通過(guò)對(duì)產(chǎn)品打上結(jié)構(gòu)化標(biāo)簽,包括品牌、顏色、型號(hào)、價(jià)格、款式、瀏覽量、購(gòu)買(mǎi)量、用戶評(píng)價(jià)等,建立360度的全景畫(huà)像,從而為個(gè)性化推薦提供先決條件。第一章數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景1.3 有多少智能,就有多少人工1.5 作業(yè)與練習(xí)大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材1.4 數(shù)據(jù)越多,智能越好1.3 有多少智能,就有多少人工 第一章 數(shù)據(jù)標(biāo)注概述1.3.1 有監(jiān)督的機(jī)器學(xué)習(xí)有監(jiān)督學(xué)習(xí)通過(guò)訓(xùn)練樣本找出規(guī)律,對(duì)模型進(jìn)行優(yōu)化,使其具有判斷與預(yù)知能力,這是向

6、“樣本”學(xué)習(xí)的過(guò)程。數(shù)據(jù)處理的量級(jí)與質(zhì)量又直接關(guān)系到機(jī)器的智能程度,也就是我們所說(shuō)的“有多少智能,就有多少人工”。1.3 有多少智能,就有多少人工 第一章 數(shù)據(jù)標(biāo)注概述1.3.2 最后一批人工智能的“老師”隨著人工智能由弱人工智能向強(qiáng)人工智能直至超人工智能的轉(zhuǎn)變,以及有監(jiān)督學(xué)習(xí)向無(wú)監(jiān)督學(xué)習(xí)或遷移學(xué)習(xí)的轉(zhuǎn)變,數(shù)據(jù)標(biāo)注的需求將大幅度削減,人工標(biāo)注最終可能將不復(fù)存在。數(shù)據(jù)標(biāo)注工程師將是陪伴人工智能成長(zhǎng)壯大的最后一批“老師”,很可能成為最后被替代的人類(lèi)。手動(dòng)標(biāo)記和流體標(biāo)注對(duì)比(相差無(wú)幾)第一章數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景1.3 有多少智能,就有多少人工1.5 作業(yè)

7、與練習(xí)大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材1.4 數(shù)據(jù)越多,智能越好1.4數(shù)據(jù)越多,智能越好 第一章 數(shù)據(jù)標(biāo)注概述在谷歌和 CMU聯(lián)合發(fā)布的一篇論文中明確指出,深度學(xué)習(xí)的成功歸功于:(a)高容量的模型;(b)越來(lái)越強(qiáng)的計(jì)算能力;(c)可用的大規(guī)模標(biāo)簽數(shù)據(jù)。研究當(dāng)數(shù)據(jù)規(guī)模成百倍成千倍增長(zhǎng)時(shí),人工智能研究的精度與準(zhǔn)確性會(huì)怎么改變呢?1.4數(shù)據(jù)越多,智能越好 第一章 數(shù)據(jù)標(biāo)注概述為了得到確實(shí)的結(jié)果,研究人員應(yīng)用Google建立的內(nèi)部數(shù)據(jù)集JFT-300M(數(shù)據(jù)是ImageNet 的 300 倍,含有超過(guò)10億個(gè)標(biāo)簽)進(jìn)行研究。結(jié)果顯示,任務(wù)性能與訓(xùn)練數(shù)據(jù)之間關(guān)系緊密,大規(guī)模數(shù)據(jù)有助于表征學(xué)習(xí),同時(shí)隨著訓(xùn)練數(shù)據(jù)

8、的數(shù)量級(jí)增長(zhǎng),模型性能呈線性增長(zhǎng),大規(guī)模的數(shù)據(jù)集對(duì)于預(yù)訓(xùn)練而言大有助益。測(cè)試性能隨數(shù)據(jù)量呈線性增長(zhǎng)第一章數(shù)據(jù)標(biāo)注概述1.1 數(shù)據(jù)標(biāo)注的起源與發(fā)展1.2 數(shù)據(jù)標(biāo)注的應(yīng)用場(chǎng)景1.3 有多少智能,就有多少人工大數(shù)據(jù)應(yīng)用人才培養(yǎng)系列教材1.5 作業(yè)與練習(xí)1.4 數(shù)據(jù)越多,智能越好1如何理解數(shù)據(jù)標(biāo)注與人工智能的關(guān)系?2什么是數(shù)據(jù)標(biāo)注?3數(shù)據(jù)標(biāo)注對(duì)象可以劃分為哪幾類(lèi)?4數(shù)據(jù)標(biāo)注流程包括哪些環(huán)節(jié)?5數(shù)據(jù)標(biāo)注有哪些應(yīng)用場(chǎng)景?6如何理解“有多少智能,就有多少人工”?7. 數(shù)據(jù)量級(jí)與智能程度之間存在怎樣的聯(lián)系?習(xí)題:AIRack人工智能實(shí)驗(yàn)平臺(tái)一站式的人工智能實(shí)驗(yàn)平臺(tái)DeepRack深度學(xué)習(xí)一體機(jī)開(kāi)箱即用的AI科研平臺(tái)BDRack大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)一站式的大數(shù)據(jù)實(shí)訓(xùn)平臺(tái)云計(jì)算頭條微信號(hào):chinacloudnj中國(guó)大數(shù)據(jù)微信號(hào):cstorbigdata劉鵬看未來(lái)微信號(hào):lpoutlook云創(chuàng)大數(shù)據(jù)訂閱號(hào)微信號(hào):cStor_cn云創(chuàng)公眾號(hào)推薦深度學(xué)習(xí)世界微信號(hào):dl-world云創(chuàng)大數(shù)據(jù)服務(wù)號(hào)微信號(hào):cstorfw高校大數(shù)據(jù)與人工智能微信號(hào):

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論