視頻智能技術(shù)與平臺(tái)論壇_第1頁(yè)
視頻智能技術(shù)與平臺(tái)論壇_第2頁(yè)
視頻智能技術(shù)與平臺(tái)論壇_第3頁(yè)
視頻智能技術(shù)與平臺(tái)論壇_第4頁(yè)
視頻智能技術(shù)與平臺(tái)論壇_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

主題:視頻智能技術(shù)與平臺(tái)論壇時(shí)間:2017年9月15日地點(diǎn):國(guó)家會(huì)議中心主持人:尊敬的各位來(lái)賓、各位朋友,大家下午好,歡迎大家蒞臨2017百度云智峰會(huì)智能視頻技術(shù)與平臺(tái)專(zhuān)題論壇。我是本場(chǎng)論壇的主持人,我叫康盛,謝謝大家。風(fēng)云際會(huì),AI先行,百度在今年6月份的AI開(kāi)發(fā)者大會(huì)上,百度COO陸奇發(fā)布了Allin(英文)AI的主題演講,在上午的會(huì)議中百度總裁張亞勤以及百度云總經(jīng)理尹世明分別介紹了ABC驅(qū)動(dòng)時(shí)代的發(fā)展,以及百度云如何在ABC時(shí)代喚醒萬(wàn)物,賦能各行各業(yè)。今天我們有幸邀請(qǐng)到了視頻行業(yè)各位專(zhuān)家,以及百度云在媒體行業(yè)的技術(shù)專(zhuān)家,來(lái)一起討論,ABC如何賦能視頻行業(yè)。首先我們有請(qǐng)百度多媒體云總經(jīng)理李旭來(lái)為本場(chǎng)論壇點(diǎn)題-ABCinspire媒體行業(yè)。有請(qǐng)。百度多媒體云總經(jīng)理李旭李旭:歡迎大家來(lái)到視頻技術(shù)論壇。我相信大家聽(tīng)過(guò)早上主論壇演講已經(jīng)感知到了百度通過(guò)ABC技術(shù)給各個(gè)行業(yè)的變革做改變的這樣一個(gè)決心和力量,所以接下來(lái)這個(gè)論壇我們重點(diǎn)講一下百度ABC技術(shù)是怎么給視頻相關(guān)行業(yè)帶來(lái)變革的。我們以媒體行業(yè)作為例子,其實(shí)媒體行業(yè)從活字印刷術(shù)這個(gè)技術(shù)被發(fā)明創(chuàng)造出來(lái)到如今,每一項(xiàng)新技術(shù)都給媒體行業(yè)帶來(lái)一次新的革命,讓我們媒體行業(yè)從原來(lái)的紙質(zhì)圖文方式開(kāi)始往視頻方向去演進(jìn),如今視頻已經(jīng)取代了圖文,變成了傳遞信息的主要載體。視頻特別是通過(guò)移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),直播短視頻這種新型視頻技術(shù)已經(jīng)成為人們傳播文化和,表達(dá)情感的主要途徑。當(dāng)人工智能時(shí)代成為移動(dòng)互聯(lián)網(wǎng)下一幕的時(shí)候,我們整個(gè)視頻時(shí)代也進(jìn)入了下一幕。去年,一年之前我們其實(shí)就提出了視頻時(shí)代的下一幕:讀懂視頻,今年我們給各位在座的朋友們?nèi)R報(bào)一下,我們?cè)谶^(guò)去這一年時(shí)間百度云做了什么,我們整個(gè)行業(yè)發(fā)生了什么樣的變化?首先來(lái)看一下整個(gè)視頻人工智能技術(shù)的發(fā)展。首先是我們視頻人工智能技術(shù)所依托底層的硬件,當(dāng)傳統(tǒng)處理期CPU已經(jīng)逐漸不再照著摩爾定律去發(fā)展的時(shí)候,其實(shí)在AI領(lǐng)域包含像GPU,TPU以及百度早上發(fā)布的XPU這種AI專(zhuān)業(yè)的芯片仍然在高速發(fā)展,依托于這樣一個(gè)AI的硬件基礎(chǔ),我們各種適應(yīng)不同場(chǎng)景的深度學(xué)習(xí)框架開(kāi)元開(kāi)源開(kāi)放,為訓(xùn)練出更優(yōu)的計(jì)算機(jī)視覺(jué)、NLP的AI服務(wù)帶來(lái)了可能。特別是在計(jì)算機(jī)視覺(jué)這個(gè)領(lǐng)域,AI技術(shù)已經(jīng)逼近了人類(lèi)的判斷,在視頻領(lǐng)域我們權(quán)威的評(píng)測(cè)集合在指數(shù)級(jí)的增長(zhǎng),意味著AI感知能力在不斷地提升,在圖片領(lǐng)域、在理想情況下AI感知能力已經(jīng)超越了人類(lèi)感知。所以當(dāng)整個(gè)行業(yè)技術(shù)在發(fā)生翻天覆地變化的時(shí)候,整個(gè)人工智能包括大數(shù)據(jù)的技術(shù)在給整個(gè)視頻行業(yè),包括互聯(lián)網(wǎng),包括視頻監(jiān)控,包括廣電領(lǐng)域帶來(lái)了很多革命。在電視編目,短視頻生產(chǎn),搜索推薦和視頻場(chǎng)景化營(yíng)銷(xiāo)方面,人工智能和大數(shù)據(jù)無(wú)不帶來(lái)變化,百度也及時(shí)抓住了行業(yè)發(fā)展脈搏,我們把整個(gè)云計(jì)算帶代入了一個(gè)2.0時(shí)代,我們?cè)诎褌鹘y(tǒng)云計(jì)算之上引入了人工智能和大數(shù)據(jù)能力,通過(guò)三位一體的云計(jì)算技術(shù),我們賦能企業(yè)發(fā)展的核心環(huán)節(jié),流量獲取,流量變現(xiàn),市場(chǎng)推廣,在每一個(gè)核心環(huán)節(jié)都有很多實(shí)現(xiàn)的方式,這些方式如何進(jìn)行有機(jī)的結(jié)合,這才是企業(yè)贏得市場(chǎng)的關(guān)鍵。所以百度云視頻ABC就是為了企業(yè)視頻業(yè)務(wù)的發(fā)展所帶來(lái)的最佳實(shí)踐。我們通過(guò)ABC的這種視頻技術(shù)的結(jié)合在依托于百度的內(nèi)容生態(tài),我們會(huì)通過(guò)提供技術(shù)革新的視頻基礎(chǔ)云的技術(shù),幫助我們互聯(lián)網(wǎng)直播平臺(tái)帶來(lái)更好的觀看體驗(yàn),通過(guò)業(yè)內(nèi)首創(chuàng)的視頻AI產(chǎn)品,幫助廣電融媒體做更好的內(nèi)容審核和我們內(nèi)容的編目效率的提升。幫助我們的視頻監(jiān)控領(lǐng)域帶來(lái)更多更及時(shí)的行為檢測(cè),我們的合作伙伴中科大洋,央廣視訊,包括威創(chuàng)集團(tuán),包括天聞數(shù)媒都將給大家?guī)?lái)相關(guān)方向的分享。在視頻大數(shù)據(jù)這塊,我們也結(jié)合視頻人工智能技術(shù)兩者相結(jié)合給我們短視頻社交帶來(lái)最佳實(shí)踐,人人視頻也帶來(lái)在這塊的分享。最后通過(guò)我們的百度內(nèi)容生態(tài)連接給各行各業(yè)企業(yè)帶來(lái)更多的流量曝光的渠道和能力。我們希望通過(guò)百度云ABC的技術(shù),能夠?yàn)橛脩?hù)帶來(lái)視聽(tīng)體驗(yàn)的質(zhì)變,這就是百度在視頻行業(yè)的使命。接下來(lái)由我同事為大家?guī)?lái)精彩的分享,謝謝大家!黃鋒百度云高級(jí)產(chǎn)品專(zhuān)家黃鋒:大家好,剛才李總介紹了整個(gè)視頻的ABC和生態(tài)怎么樣賦能我們視頻相關(guān)的行業(yè),我的這個(gè)部分重點(diǎn)針對(duì)其中A的這一部分,也就是AI這一部分來(lái)介紹一下百度云在這方面的一些產(chǎn)品。大家知道,通過(guò)我們看到一些權(quán)威數(shù)據(jù),互聯(lián)網(wǎng)上產(chǎn)生的這些流量當(dāng)中,視頻流量占73%,而這個(gè)數(shù)字預(yù)計(jì)到2021年達(dá)到82%。在互聯(lián)網(wǎng)泛云的領(lǐng)域全國(guó)有數(shù)百家直播平臺(tái),每天有數(shù)百萬(wàn)主播在進(jìn)行著直播。在我們國(guó)內(nèi)有很多短視頻平臺(tái)上所有的PGC,UGC每天會(huì)產(chǎn)生上百萬(wàn)的新增的視頻,全國(guó)有上千個(gè)電視臺(tái),幾千個(gè)頻道也在每天新增著很多電視節(jié)目。每年我國(guó)會(huì)新增數(shù)千萬(wàn)個(gè)攝像頭,而這些攝像頭其實(shí)無(wú)時(shí)無(wú)刻不在產(chǎn)生著新的數(shù)據(jù),視頻數(shù)據(jù)其實(shí)非常重要,它的價(jià)值很大,而我們對(duì)于它的這種理解其實(shí)有非常地困難。傳統(tǒng)的做法是其實(shí)大家都會(huì)組建一個(gè)人工的這種審核標(biāo)注團(tuán)隊(duì),由人來(lái)理解這個(gè)視頻打一些標(biāo)簽,做一些審核,人工審核有一些什么樣的問(wèn)題呢?首先第一個(gè)問(wèn)題成本比較高。這個(gè)成本包括人力成本、培訓(xùn)成本,我們知道人力成本其實(shí)每年都在逐漸地往上漲。我們看到有些客戶(hù)特別是廣電領(lǐng)域有一些四級(jí)的編目,分析一個(gè)小時(shí)的視頻花費(fèi)數(shù)百元。第二個(gè)問(wèn)題是效率低,還拿四級(jí)編目來(lái)看,分析一個(gè)小時(shí)視頻需要兩個(gè)多小時(shí)才能完成。第三,召回比較低。因?yàn)槟惴治鲞@件事情其實(shí)對(duì)于分析員、對(duì)于人的要求是比較高的,同樣一個(gè)視頻可能不同人去看,大家對(duì)它的理解是不一樣的。所以質(zhì)量其實(shí)也是參差不齊的。我在想,能不能用機(jī)器,用AI的技術(shù)來(lái)替代人工做繁瑣的這種事情呢?實(shí)際上,在百度內(nèi)部視頻AI相關(guān)的這些基礎(chǔ)的AI能力早在百度內(nèi)部得到了廣泛使用,比如說(shuō)圖像識(shí)別技術(shù),其中文字識(shí)別,人臉識(shí)別,物體識(shí)別,圖像審核,這樣的技術(shù)早已經(jīng)用于百度的圖像搜索,包括貼吧這樣一些產(chǎn)品線(xiàn)。語(yǔ)音識(shí)別也都用于比方說(shuō)百度的語(yǔ)音輸入法度秘這樣的產(chǎn)品,百度擁有17年的自然語(yǔ)言處理技術(shù),包括百度的搜索,百度的新聞,其實(shí)后臺(tái)都是自然源處理,這是一個(gè)非常重要的一個(gè)功能。今年我們今年這個(gè)團(tuán)隊(duì)很大的一個(gè)重心就是怎么樣利用百度已有這樣一些視頻AI的基礎(chǔ)能力,實(shí)現(xiàn)真正視頻這個(gè)層面的一些AI的能力,我們今年跟上百個(gè)種子客戶(hù)一起去摸索探索應(yīng)用場(chǎng)景,去優(yōu)化我們的技術(shù),去迭代,非常高興也看到了我們的技術(shù),對(duì)我們客戶(hù)的業(yè)務(wù)產(chǎn)生了價(jià)值。所以今天我會(huì)發(fā)布三個(gè)視頻AI的產(chǎn)品,分別是視頻內(nèi)容分析VC,視頻內(nèi)容審核VCR和視頻封面選圖VCS。我們首先看VC,VC做了一件什么事情呢?將某一個(gè)視頻結(jié)構(gòu)化,因?yàn)槲覀冎酪粋€(gè)視頻它包含的信息很多,往往我們對(duì)于視頻里面的一些信息,如果人不去做,不去看很難去理解,我這個(gè)結(jié)構(gòu)化包含哪幾個(gè)部分?首先第一是場(chǎng)景識(shí)別,我們可以識(shí)別出來(lái)一個(gè)視頻它是一個(gè)體育比賽,還是一個(gè)娛樂(lè)節(jié)目,還是一個(gè)演唱會(huì)。這個(gè)可能更多是一些比較泛的這樣一些標(biāo)簽。包括我們也可以識(shí)別出來(lái)視頻里面畫(huà)面中出現(xiàn)的公眾的人物,識(shí)別出畫(huà)面中出現(xiàn)的一些物體,還得到了一系列關(guān)鍵詞的標(biāo)簽。同樣我們還可以得到一個(gè)人識(shí)別不了,但是機(jī)器能識(shí)別的視頻的特征向像量(音)。整個(gè)VC的這種分析的原理是什么?首先我們知道,一個(gè)視頻它是由音頻和一系列聯(lián)合國(guó)的幀組成的,首先我們將視頻分層,會(huì)在整個(gè)視頻大的維度進(jìn)行視頻場(chǎng)景識(shí)別的模型,真正地去從一個(gè)宏觀角度去看這個(gè)視頻是在講什么?從細(xì)力度的來(lái)看我們從圖像維度會(huì)做,首先會(huì)在圖像中通過(guò)(英文)找到一些關(guān)鍵幀,對(duì)這些幀做一些人臉識(shí)別,物體識(shí)別這樣的處理。對(duì)于音頻來(lái)講,我們將音頻通過(guò)語(yǔ)音識(shí)別的技術(shù)轉(zhuǎn)成文字,然后圖片和語(yǔ)音這種細(xì)力度的數(shù)據(jù)產(chǎn)生非常多的這樣一些文本,我們?cè)儆米匀徽Z(yǔ)言處理的技術(shù),將分析它的一些詞性,詞頻得到一些標(biāo)簽,多個(gè)維度再做一些交叉驗(yàn)證,最終輸出各個(gè)維度的標(biāo)簽,最后對(duì)視頻進(jìn)行結(jié)構(gòu)化的描述。相信大家上午參加主論壇可以看到演示的最終效果。我們VC有什么樣的特點(diǎn)和優(yōu)勢(shì)呢?首先,在整個(gè)視頻主體場(chǎng)景識(shí)別這個(gè)維度,我們積累了有上千萬(wàn)訓(xùn)練標(biāo)注好的這種數(shù)據(jù),訓(xùn)練我們場(chǎng)景識(shí)別的模型,我們可以識(shí)別出來(lái)5000多個(gè)場(chǎng)景,在今年8月份剛剛結(jié)束的國(guó)際權(quán)威的Activity(英文)這樣一個(gè)視頻內(nèi)容分析的一個(gè)比賽當(dāng)中百度獲得了第一名。在視頻的人物識(shí)別這個(gè)維度,我們擁有世界領(lǐng)先的人臉識(shí)別技術(shù),這不是最重要的,重要的是我們還有全球最大的百度百科公眾人物的人臉庫(kù),并且我們技術(shù)也可以支持客戶(hù)自定義自己的人臉庫(kù)。在視頻的物體識(shí)別這個(gè)維度,我們識(shí)別超過(guò)4萬(wàn)種的物體,通過(guò)人工來(lái)講,整個(gè)AI分析效率可以提升5倍,每天吞吐能力可以相當(dāng)于一萬(wàn)個(gè)人,并且這個(gè)吞吐能力可以隨著我的機(jī)器水平擴(kuò)展。我們分析的成本相比于人工降低了50%,召回率提高了10倍。我們通過(guò)VC得到了包括視頻里面的一些人、物體、時(shí)間、地點(diǎn)等等這樣一些結(jié)構(gòu)化的表述,它有什么用呢?通過(guò)上半年我們跟種子客戶(hù)的一些交流探索去摸索這樣一些應(yīng)用場(chǎng)景,我們目前看到的有幾個(gè)比較典型的應(yīng)用場(chǎng)景。第一,視頻內(nèi)容搜索,我可以搜索出某一個(gè)視頻里面某個(gè)人講了什么樣的話(huà),在哪一秒鐘,在哪個(gè)畫(huà)面中出現(xiàn)了一個(gè)什么樣的物體,這個(gè)更常見(jiàn)于我們電視臺(tái)內(nèi)部很多這種素材的檢索,特別是在制作一些新的電視節(jié)目的時(shí)候。第二,視頻的個(gè)性化推薦和相關(guān)性推薦。這個(gè)在短視頻平臺(tái)里面比較常見(jiàn),關(guān)于搜索和推薦后面有一個(gè)主體,我的同事張爽會(huì)詳細(xì)介紹,還有一個(gè)應(yīng)用場(chǎng)景,就是場(chǎng)景化營(yíng)銷(xiāo)。比方說(shuō)我在看一個(gè)手機(jī)評(píng)測(cè)視頻的時(shí)候有可能直接推給我關(guān)于這個(gè)手機(jī)的一個(gè)購(gòu)買(mǎi)鏈接,我可能購(gòu)買(mǎi)的欲望就很強(qiáng),轉(zhuǎn)化率很好,比方說(shuō)我在看一個(gè)旅游的視頻節(jié)目,給我推薦一個(gè)飛機(jī)票這樣一個(gè)購(gòu)買(mǎi)鏈接,我也很有可能去點(diǎn)擊購(gòu)買(mǎi),這其實(shí)都是一些營(yíng)銷(xiāo)相關(guān)的一些應(yīng)用場(chǎng)景。其實(shí),在VC它的能力開(kāi)放出來(lái)了之后,我們會(huì)看到可能還有很多我們現(xiàn)在還不知道的應(yīng)用場(chǎng)景,這些應(yīng)用場(chǎng)景就靠我們一起去探索。為大家介紹的第二個(gè)產(chǎn)品是視頻內(nèi)容審核VCR。顧名思義內(nèi)容審核就是將視頻里面的色情、暴恐、政治人物、廣告等等各種不太合規(guī)的內(nèi)容識(shí)別出來(lái),我們識(shí)別的原理是什么呢?同樣跟VC類(lèi)似,我們也是將視頻分層,分為幀和音頻,首先我們會(huì)過(guò)一個(gè)視頻指紋的黑庫(kù),這個(gè)黑庫(kù)是客戶(hù)之前通過(guò)人工或者通過(guò)其他方式標(biāo)記過(guò)的確認(rèn)是違規(guī)的一些內(nèi)容,同樣我們提取圖樣的一些特征,生成文的一些特征,通過(guò)這兩個(gè)特征對(duì)在視頻黑庫(kù)里面進(jìn)行比對(duì)。這種比對(duì)方式比傳統(tǒng)的鏡頭檢測(cè),或者純圖像維度的特征抗干擾能力會(huì)更強(qiáng),確保有一些被命中的一些視頻可以被找出來(lái)。如果命中那可能直接就封禁掉,如果沒(méi)有命中,那我們?cè)龠M(jìn)行一些實(shí)時(shí)的審核,同樣從兩個(gè)維度,從圖像維度我們對(duì)圖像幀進(jìn)行色情識(shí)別,政治人物識(shí)別和暴恐識(shí)別,和文本識(shí)別,我們文本審核出來(lái)的文字再在過(guò)文本的黑庫(kù)。從語(yǔ)音維度分兩個(gè)層面,一個(gè)將語(yǔ)音轉(zhuǎn)成文字,將這些文字過(guò)文本黑庫(kù)。另外一個(gè)維度,就是純語(yǔ)音的維度,有一些交傳識(shí)別的模型,可以發(fā)現(xiàn)這種非常隱蔽的違規(guī)的內(nèi)容。綜合我們從圖像和音頻得到了這樣一些結(jié)果,我們最終會(huì)輸出整個(gè)視頻整體的一個(gè)審核結(jié)果,要么沒(méi)有違規(guī)內(nèi)容通過(guò),要么確認(rèn)是違規(guī)的我們就可以把它封禁掉,有一些疑似的我們可以推給人工再二次審核,我們跟合作伙伴央廣視訊有一個(gè)合作,既有人審還有機(jī)審神。其實(shí)VCR還有更多應(yīng)用場(chǎng)景,比如說(shuō)視頻去重,有很多上傳上來(lái)的視頻有的僅僅是分辨率不一樣,有的是加了一些貼片,其實(shí)它的主體內(nèi)容是一樣的,我們就可以用VCR里面視頻比對(duì)的技術(shù),來(lái)查出來(lái)這種重復(fù)的內(nèi)容。第二個(gè)廣播監(jiān)播,我們看到一個(gè)應(yīng)用場(chǎng)景,我們可以對(duì)電視臺(tái)直播流里面的一些視頻廣告進(jìn)行檢測(cè),可以統(tǒng)計(jì)出來(lái)某一支只廣告在哪些頻道,什么時(shí)段進(jìn)行了播出,對(duì)廣告投放效果進(jìn)行一些數(shù)據(jù)分析。第三個(gè)應(yīng)用場(chǎng)景,就是侵權(quán)檢測(cè),我們可以把一些版權(quán)內(nèi)容入庫(kù),如果UGC,或者PGC上傳上來(lái)的內(nèi)容跟我們版權(quán)庫(kù)的這個(gè)有重復(fù),說(shuō)明它很有可能涉及侵權(quán),我們也可以把這個(gè)視頻找出來(lái),當(dāng)然VCR可能還有很多很多我們目前還沒(méi)有探索到的應(yīng)用場(chǎng)景,同樣也需要跟我們的客戶(hù)合作伙伴一起去探索。最后介紹的產(chǎn)品是視頻封面選圖VCS,我在市面上主流的幾款視頻APP做了首頁(yè)的截圖,大家可以看到,其實(shí)這個(gè)封面圖在視頻APP里面的顯示占比非常大吸引網(wǎng)民去點(diǎn)擊有兩個(gè)因素,要么是這個(gè)標(biāo)題比較吸引人,要么你的圖片,這個(gè)封面比較吸引人,所以視頻質(zhì)量的好壞其實(shí)一定程度上決定了網(wǎng)民要不要點(diǎn)進(jìn)去,要不要去看,間接的決定了用戶(hù)的在線(xiàn)停留時(shí)長(zhǎng),就是你視頻APP的黏性。針對(duì)這個(gè)問(wèn)題,我們發(fā)布了一個(gè)VCS這個(gè)產(chǎn)品,首先我們會(huì)用(英文)這樣的技術(shù)去識(shí)別分析出來(lái)找到一些關(guān)鍵幀,然后對(duì)這些每一幀進(jìn)行一些主觀和客觀質(zhì)量的過(guò)濾,包括美觀程度,色彩搭配、清晰度這樣一些主客觀的質(zhì)量,篩選過(guò)后會(huì)得到一些侯選的集,當(dāng)時(shí)我們讀懂了這個(gè)內(nèi)容,可以找出這個(gè)相似度的某一幀更能代表視頻主體的內(nèi)容,它可能更能夠吸引網(wǎng)民去點(diǎn)擊。同樣一個(gè)視頻我上傳到了國(guó)內(nèi)幾個(gè)主流的視頻APP上,多數(shù)情況下大家截的都是首幀,首幀的畫(huà)面是一個(gè)播音員,是一個(gè)播音員是很難讓網(wǎng)民播音員知道,這個(gè)視頻內(nèi)容里面講的是什么的。我們看更多的一些視頻封面選圖的一些效果,這是兩個(gè)百度的一些宣傳片的視頻,通過(guò)常規(guī)的通用這種封面圖選取的技術(shù),會(huì)得到上面這兩幅圖,通過(guò)VCS得到下面這兩幅圖,下面的圖更加吸引人去點(diǎn)擊瀏覽。上面跟大家分享的三款產(chǎn)品其實(shí)已經(jīng)在百度云的官網(wǎng)開(kāi)放了,大家感興趣的話(huà)可以登陸我們的官網(wǎng)去申請(qǐng),我們會(huì)線(xiàn)下跟大家去對(duì)接,去探索更多應(yīng)用場(chǎng)景,去測(cè)試,包括我們希望我們的技術(shù)還是能夠賦能大家,能夠?yàn)榇蠹业臉I(yè)務(wù)產(chǎn)生真正的價(jià)值,謝謝大家!主持人:感謝旭哥的主題演講以及黃鋒對(duì)百度云視頻AI產(chǎn)品的重磅發(fā)布。讓大家也感受到了我們視頻時(shí)代的下一幕是讀懂視頻,通過(guò)百度云視頻的AI能力可以理解視頻的內(nèi)容,深度去挖掘視頻的價(jià)值,相信在百度云的視頻AI能力將為媒體行業(yè)帶來(lái)前所未有的變革。接下來(lái)我們將舉行一個(gè)神圣的簽約儀式。百度云將和天江智媒科技(北京)有限公司簽署戰(zhàn)略合作協(xié)議,雙方將在智能內(nèi)容生產(chǎn)方面、智能媒體內(nèi)容運(yùn)營(yíng)等多方面展開(kāi)合作,推動(dòng)傳統(tǒng)媒體行業(yè)結(jié)合百度人工智能技術(shù)進(jìn)行技術(shù)轉(zhuǎn)型,更好的服務(wù)大眾。接下來(lái)有請(qǐng)簽約人天江智媒科技(北京)有限公司董事長(zhǎng)肖志彥,以及百度云渠道與生態(tài)總經(jīng)理吳凱立上來(lái)簽約。還有4位鑒簽人,天聞數(shù)媒科技(北京)有限公司董事長(zhǎng)向江,天聞數(shù)媒提問(wèn)舒眉媒體業(yè)務(wù)部總裁韋宇鵬和百度多媒體云總經(jīng)理李旭。有請(qǐng)。開(kāi)始簽約。(簽約儀式)主持人:謝謝各位領(lǐng)導(dǎo),可以場(chǎng)下先休息一下。感謝簽約人以及鑒簽人,相信百度云的智能多媒體服務(wù),能夠讓更多的傳統(tǒng)媒體行業(yè)進(jìn)行轉(zhuǎn)型,結(jié)合百度云的人工智能技術(shù),讓機(jī)器去替代人力,讓采編播更高效、更智能。接下來(lái)我們有請(qǐng)?zhí)炻剶?shù)媒媒體業(yè)務(wù)部總裁韋宇鵬韋總,用實(shí)例來(lái)給大家分享如何借力人工智能,推進(jìn)媒體融合。有請(qǐng)韋總。韋宇鵬:天聞數(shù)媒媒體業(yè)務(wù)部總裁韋宇鵬各位下午好,我們也是剛剛跟百度云建立了一個(gè)傳媒行業(yè)的戰(zhàn)略合作,我就給各位行業(yè)專(zhuān)家,還有各位行業(yè)朋友,給大家匯報(bào)一下我們對(duì)于人工智能在傳媒行業(yè)應(yīng)用的簡(jiǎn)單一些探索。如果說(shuō)媒體行業(yè)最熱門(mén)的詞應(yīng)該是“媒體融合”,媒體融合的需求本質(zhì)是什么?其實(shí)它還是在互聯(lián)網(wǎng)環(huán)境下怎么樣拉通用戶(hù)和內(nèi)容之間傳統(tǒng)媒體,承擔(dān)的還是這樣一個(gè)橋梁的作用。如果我們套用通常的互聯(lián)網(wǎng)+的說(shuō)法,它有兩層含義,一層就是互聯(lián)網(wǎng)+宣傳。因?yàn)槲覀兊膫鹘y(tǒng)媒體,或者說(shuō)主流媒體代表的是黨和國(guó)家的發(fā)聲,它是有宣傳的屬性,歸結(jié)起來(lái)就是我們提的四力,傳播力,影響力,引導(dǎo)力,和公信力,另外還有一個(gè)有互聯(lián)網(wǎng)+資訊的增值屬性,要向用戶(hù)提供個(gè)性化、定制化資訊私訊的服務(wù),在大背景下,互聯(lián)網(wǎng)行業(yè)經(jīng)歷了幾個(gè)探索的過(guò)程,第一,做的是載體的升級(jí),更多偏重于新媒體端的建設(shè),微博、微信、客戶(hù)端,可能還有現(xiàn)在小程序新的模式,大部分的媒體在全國(guó)范圍內(nèi)已經(jīng)完成了這一步的建設(shè)。第二步就是中央廚房的建設(shè),中央廚房目前偏重業(yè)務(wù)流程的升級(jí),包括建立統(tǒng)一的這樣一個(gè)大屏指揮的中心,建立相關(guān)的采編播平臺(tái)的升級(jí),包括統(tǒng)一稿庫(kù)的升級(jí),這一步在很多央媒基本上已經(jīng)實(shí)現(xiàn),去年開(kāi)始在今年各個(gè)省的地方媒體已經(jīng)開(kāi)始在緊鑼密鼓的在進(jìn)行,下一步中央廚房2.0,或者說(shuō)我們媒體融合的再在新一個(gè)階段往哪里走?在我們看來(lái),更多是要把大數(shù)據(jù),把人工智能這些技術(shù)融入,把我們現(xiàn)在的一個(gè)媒體越來(lái)越向這樣一個(gè)智慧媒體的方向去走,這個(gè)就是我們現(xiàn)在理解的媒體融合后面,我們理解的演進(jìn)方向。天聞數(shù)媒是一家科技和文化合作的公司,是新聞出版業(yè)技術(shù)出版實(shí)驗(yàn)室,專(zhuān)注于在文化傳媒領(lǐng)域這樣一個(gè)相關(guān)的發(fā)展,我們現(xiàn)在已經(jīng)服務(wù)了眾多中央級(jí)的媒體和部委,借助于百度的人工智能的技術(shù),我們認(rèn)為可以從資源、發(fā)布、生產(chǎn)、增值等多個(gè)方向與傳統(tǒng)的媒體行業(yè)發(fā)酵,為了進(jìn)一步加強(qiáng)我們也是和湖南五江集團(tuán)一個(gè)比較強(qiáng)大的資本方合作成立了天江智媒,一家公司專(zhuān)注于AI和大數(shù)據(jù)技術(shù)在媒體行業(yè)的應(yīng)用的公司。我們現(xiàn)在基本的產(chǎn)品構(gòu)思就是基于百度云提供的強(qiáng)大(英文)的技術(shù),主要是天算,天像,天智,天文在媒體領(lǐng)域長(zhǎng)期業(yè)務(wù)的探索和對(duì)行業(yè)一個(gè)理解,我們將從資源管理,內(nèi)容生產(chǎn)、發(fā)布傳播、內(nèi)容增值這四個(gè)層面去做對(duì)應(yīng)的產(chǎn)品和這方面(英文)的應(yīng)用,為這個(gè)行業(yè)客戶(hù)提供更加優(yōu)質(zhì)的服務(wù),這是我們從資源生產(chǎn)傳播領(lǐng)域做的一些簡(jiǎn)單的梳理。今天因?yàn)闀r(shí)間相對(duì)比較寶貴。我主要就談三個(gè)點(diǎn)。第一點(diǎn),智能化的資源管理。任何一個(gè)媒體單位它都有它自己的資源,資源是它的一個(gè)重中之重,資源一般我們都會(huì)放的是所謂的一個(gè)資源庫(kù),在報(bào)社一般叫稿庫(kù),在電視臺(tái)一般是叫媒資庫(kù),隨著互聯(lián)網(wǎng)的發(fā)展出現(xiàn)了三個(gè)比較大的問(wèn)題,第一個(gè)大量的互聯(lián)網(wǎng)信息,互聯(lián)網(wǎng)的稿件信息進(jìn)入你的資源庫(kù),怎么樣進(jìn)行處理,第二個(gè)是大量的富賦媒體信息,圖片、音頻、視頻進(jìn)入你的資源庫(kù),我怎么進(jìn)行處理,特別是它的混和處理。第三個(gè)層面,就是知識(shí)體系,現(xiàn)在我這個(gè)資源不希望是一個(gè)零散的信息孤島,我希望我的資源可以形成一個(gè)可重構(gòu)可重組的支持服務(wù)的框架,這個(gè)怎么進(jìn)行處理,有兩個(gè)技術(shù)難點(diǎn),第一個(gè)就是富賦媒體的處理,我怎么抽取它的公眾人物,包括它的字幕、語(yǔ)音等等,這個(gè)一直是困擾行業(yè)的問(wèn)題。第二就是知識(shí)化的處理,我一系列一個(gè)龐大的資源,我里邊人物、場(chǎng)景,我相關(guān)的學(xué)科信息,我相關(guān)的地域信息怎么樣給它做知識(shí)的量化,我要實(shí)現(xiàn)這兩步,第一個(gè)先把它打碎,然后再融合起來(lái)。非常好的是,現(xiàn)在百度云提供了它的智能化的處理一個(gè)手段,像VCA,VCR這樣一個(gè)核心能力,我們借助于百度它的大數(shù)據(jù)的文字處理,借助于它的圖像處理,借助于視頻處理,我們就可以實(shí)現(xiàn),把所有的資源素材全部打碎,按照統(tǒng)一的邏輯進(jìn)行重組,按照知識(shí)化的框架去進(jìn)行一個(gè)重新的構(gòu)建,基本上我們會(huì)經(jīng)歷這樣一個(gè)采集、加工、智能化的管理,再對(duì)外提供統(tǒng)一的服務(wù)。服務(wù)的能力有兩類(lèi),一類(lèi)的是常規(guī)的檢索調(diào)用。第二類(lèi)就是深度應(yīng)用,媒體這些靜態(tài)的資產(chǎn)想要變現(xiàn),我們想要做運(yùn)營(yíng)化資產(chǎn)化,一定它要具備這樣相關(guān)的能力,通過(guò)這樣的能力我們可以支持一些智能刊物,智能的創(chuàng)作,包括一些行業(yè)深度的洞察和應(yīng)用,更多的能力都是可以逐步去進(jìn)行一個(gè)發(fā)掘,這是我分享的第一個(gè)結(jié)合百度AI產(chǎn)品的方向,我們智能的一個(gè)媒資庫(kù)。第二,我分享一下智能的內(nèi)容生產(chǎn),智能內(nèi)容生產(chǎn)現(xiàn)在就是行業(yè)里比較熱的,就所謂的一個(gè)機(jī)器人創(chuàng)作,智能內(nèi)容生產(chǎn)第一步,我們定義為智能的輔助創(chuàng)作,第一個(gè)環(huán)節(jié)是輔助的選題策劃,現(xiàn)在基于互聯(lián)網(wǎng),我用戶(hù)關(guān)注的點(diǎn)是什么?關(guān)注的話(huà)題是什么?我要把相關(guān)的話(huà)題,包括話(huà)題的一些報(bào)道角度,報(bào)道的一些推薦我要傳遞給編輯記者,讓他知道我現(xiàn)在要干什么?第二步,就是我們基于已經(jīng)選擇好的一個(gè)報(bào)道角度,我給他自動(dòng)化的推薦相關(guān)的這些內(nèi)容,給它拼成一個(gè)相對(duì)粗的稿件,這是我們叫做機(jī)器全自動(dòng)的撰稿,但是這個(gè)撰寫(xiě)出來(lái)的稿件是相對(duì)比較糙操的東西。第三步人工要接入了,我們叫做智能化寫(xiě)作的一個(gè)參考,我們可以對(duì)這些稿件進(jìn)行一些精細(xì)化的修改,我們通過(guò)AI的技術(shù)會(huì)推給它一些相關(guān)的內(nèi)容,給它自動(dòng)摘要,一些相關(guān)的話(huà)題,甚至互聯(lián)網(wǎng)報(bào)道的情況,自動(dòng)給它進(jìn)行這種分析?;旧贤ㄟ^(guò)這樣一個(gè)手段,這篇稿件就具有了雛形,最后就是一些輔助的手段,包括配上一些對(duì)應(yīng)專(zhuān)家的信息庫(kù),一些語(yǔ)句自動(dòng)的修改,通過(guò)這樣一個(gè)手段可以非常方便的輔助一個(gè)內(nèi)容的生產(chǎn)者實(shí)現(xiàn)一個(gè)半自動(dòng)的一個(gè)機(jī)器的生產(chǎn)。生產(chǎn)出來(lái)的內(nèi)容在發(fā)布之前還要做的就是智能刊物,過(guò)去的校對(duì)系統(tǒng)核心是在于對(duì)于拼寫(xiě)錯(cuò)誤的檢查,但是對(duì)于它的內(nèi)容本身是否有錯(cuò),是否有些領(lǐng)導(dǎo)人的文字和圖片不匹配,是否有一些經(jīng)典語(yǔ)錄的描述錯(cuò)誤,包括有一些涉政,涉敏的一些內(nèi)容,這些我們通過(guò)AI在智能刊物系統(tǒng)里都可以得到處理。但是這里邊核心也用到了百度對(duì)這個(gè)圖片、視頻這樣一個(gè)智能刊物的手段。我們這個(gè)文章寫(xiě)出來(lái),經(jīng)過(guò)了智能的刊物,下一步就可以做智能的發(fā)布,在除了傳統(tǒng)的編輯記者發(fā)稿以外,我們還可以提供互聯(lián)網(wǎng)的新聞生產(chǎn)的模式,我從主流網(wǎng)站抓新聞,自動(dòng)化的轉(zhuǎn)載,同時(shí)我后邊的自動(dòng)生產(chǎn)的系統(tǒng)可以用機(jī)器人創(chuàng)作這個(gè)新聞來(lái)進(jìn)行一個(gè)填充,也就是說(shuō)我們可以把這個(gè)重量新聞,或者深度比較淺的淺表新聞,可以把它的內(nèi)容量做得比較大。通過(guò)智能生產(chǎn)的體系可以極大的解決現(xiàn)在的傳統(tǒng)媒體它的內(nèi)容生產(chǎn)量不足的問(wèn)題,以及提高生產(chǎn)效率把它的生產(chǎn)的效率,過(guò)去生產(chǎn)的文章我過(guò)去需要五千塊錢(qián),現(xiàn)在只需要一千塊錢(qián),更多的編輯記者做更多更深更好的內(nèi)容的生產(chǎn)。第三個(gè)點(diǎn),智能運(yùn)營(yíng)傳播這樣一個(gè)體系。智能運(yùn)營(yíng)傳播就是我們的新聞已經(jīng)上了互聯(lián)網(wǎng),用戶(hù)已經(jīng)可以看到了,傳統(tǒng)的APP在用戶(hù)沒(méi)有產(chǎn)生相關(guān)瀏覽記錄的時(shí)候是沒(méi)有用戶(hù)行為的,我沒(méi)有辦法對(duì)用戶(hù)做相關(guān)服務(wù)的,但是現(xiàn)在有了互聯(lián)網(wǎng)平臺(tái)廠家一個(gè)借助,有了像百度它的基于全平臺(tái)用戶(hù)的畫(huà)像,它基于這些畫(huà)像提供給我們一些非常好的服務(wù),基于這個(gè)聽(tīng)不清服務(wù),這個(gè)白用戶(hù)第一次進(jìn)入我的APP,我就知道你大概的喜好,我就知道該給你推薦什么樣的內(nèi)容,這是最典型的就是新聞的智能推薦,一個(gè)用戶(hù)進(jìn)入我只需要把用戶(hù)ID,還有對(duì)應(yīng)新聞的整個(gè)一個(gè)列表上傳到百度云,百度云就可以把它的一個(gè)推薦結(jié)果告訴我。也就是說(shuō)對(duì)于新用戶(hù)我有了一個(gè)更好的處理辦法,隨著我的用戶(hù)行為記錄的逐步提高,我可以把云和本地化兩套作為一個(gè)部署,不斷提高向用戶(hù)服務(wù)的精準(zhǔn)度,這個(gè)既包含了內(nèi)容,也包含了對(duì)應(yīng)的一些廣告。聽(tīng)不清我們做這些的目的是什么?就是為了在互聯(lián)網(wǎng)環(huán)境下做更好用戶(hù)的運(yùn)營(yíng),我怎么樣提高我用戶(hù)的黏性,提高我用戶(hù)的活躍度,我怎么樣做出來(lái)更多的優(yōu)質(zhì)用戶(hù),進(jìn)而把這些用戶(hù)去做變現(xiàn),從哪個(gè)渠道獲取用戶(hù)的方式更好,這個(gè)我們也是有一套基于百度云一套運(yùn)營(yíng)分析的一個(gè)產(chǎn)品,可以去做一個(gè)比較好的支撐。剛才做了一個(gè)簡(jiǎn)單的分享,的運(yùn)營(yíng)分析的數(shù)據(jù)。剛才做了一個(gè)分析,這個(gè)就是基本上我們現(xiàn)在說(shuō)在看到傳媒領(lǐng)域,從資源管理到內(nèi)容生產(chǎn),到生產(chǎn)好的內(nèi)容在互聯(lián)網(wǎng)上進(jìn)行傳播,這樣跟AI、大數(shù)據(jù)相結(jié)合的契合點(diǎn),當(dāng)然我相信我們還有更多的契合點(diǎn)去發(fā)現(xiàn),我們天聞數(shù)媒,還有天江智媒,我們也有信心,也非常希望能跟百度一起,跟在座的各位朋友一起我們?nèi)ヌ剿鬟@個(gè)人工智能怎么樣更好的為這個(gè)行業(yè)服務(wù),最后真的達(dá)到我們智慧媒體這樣一個(gè)最終的效果,謝謝大家。主持人:感謝韋總,讓大家看到了結(jié)合百度云多媒體AI技術(shù),實(shí)現(xiàn)資源管理的智能化、內(nèi)容生產(chǎn)的智能化、運(yùn)營(yíng)傳播的智能化。接下來(lái),我們來(lái)分享一個(gè)視頻AI在廣電行業(yè)的應(yīng)用實(shí)踐。我們非常有幸請(qǐng)到了中科大洋能力產(chǎn)品部經(jīng)理杜偉給大家?guī)?lái)視頻AI在廣電行業(yè)的應(yīng)用實(shí)踐分享。謝謝!杜偉中科大洋能力產(chǎn)品部經(jīng)理杜偉:大家好,我來(lái)自中科大洋的杜偉,我給大家分享的是視頻AI在廣電行業(yè)里面的應(yīng)用實(shí)踐。我先簡(jiǎn)單介紹一下我們公司。我們公司成立的時(shí)間也比較長(zhǎng),1989年,在廣電這個(gè)行業(yè)也是一個(gè)非常知名的公司,我們公司給自己的定位是做泛傳媒產(chǎn)業(yè)的一個(gè)技術(shù)服務(wù)提供商,我們公司因?yàn)闅v史比較長(zhǎng),合作的客戶(hù)非常地多,包括什么中央臺(tái)、新華社,反正就是廣電行業(yè)的各種用戶(hù),在過(guò)去取得了一些成績(jī)。這是我們公司主要提供的一個(gè)產(chǎn)品架構(gòu),可以給大家簡(jiǎn)單介紹一下,我們本身是一個(gè)做產(chǎn)品的公司,我們產(chǎn)品線(xiàn)相對(duì)比較全,在傳媒行業(yè)有所謂的采編自保制播存的業(yè)務(wù)版權(quán),我們做的東西,包括像新聞產(chǎn)品,新媒體,包括一些后期制作、圖文包裝,還有播出,還有前面大家提到的媒資、內(nèi)容管理,這樣一些?;谶@些產(chǎn)品線(xiàn)我們會(huì)形成各個(gè)業(yè)務(wù)方面的一些解決方案,包括內(nèi)容生產(chǎn)的解決方案,內(nèi)容管理的解決方案,分發(fā)方面的,最后我們主要服務(wù)的對(duì)象,主要是電視臺(tái)、網(wǎng)絡(luò)運(yùn)營(yíng)商、互聯(lián)網(wǎng)機(jī)構(gòu)、各種內(nèi)容制作的。這是我們公司大概的情況。最近這些年廣電這個(gè)行業(yè),在我們廣電行業(yè)自己內(nèi)部的一些會(huì)議,或者論壇,像CCBN,BRTV這些行業(yè)會(huì)議上面討論的非常多,因?yàn)槲覀儚V電行業(yè)確實(shí)受到了很大的挑戰(zhàn)和沖擊,現(xiàn)在大家都在想怎么去做,怎么去轉(zhuǎn)型,另外我們廣電行業(yè)也有是一個(gè)比較特殊的定位,我們確實(shí)是主流媒體一個(gè)輿論陣地,這個(gè)也是一個(gè)國(guó)家戰(zhàn)略。從政策層面,剛剛這位同事也提到了,國(guó)家對(duì)這一塊,包括廣電的轉(zhuǎn)型,怎么去做融合生產(chǎn)?怎么去做新媒體的這些融合的業(yè)務(wù),最新的這個(gè)在今年1月份,中宣部發(fā)布了一個(gè)文章,打造新型媒體,打造中央廚房是一個(gè)非常重要的目標(biāo)和實(shí)踐。因?yàn)橹醒霃N房這個(gè)話(huà)題在我們廣電領(lǐng)域里面是非常地火熱,現(xiàn)在很多項(xiàng)目也都在做,都在上,我們公司也有幸和人民日?qǐng)?bào)社有一個(gè)戰(zhàn)略合作,雙方一塊來(lái)建設(shè)這個(gè)中央廚房,現(xiàn)在也形成了一個(gè)標(biāo)桿,大家都非常感興趣。有很多人在問(wèn),中央廚房這個(gè)詞相對(duì)來(lái)說(shuō)它有一點(diǎn)不太好理解,大家不都是做廣播傳媒的嗎?你建廚房啥意思呢?廚房的意思我們簡(jiǎn)單總結(jié)一下,它就是有4個(gè)一,第一個(gè)一,有一個(gè)統(tǒng)一的工作平面,從這個(gè)上面看到的,它有一個(gè)類(lèi)似于航母這樣的結(jié)構(gòu),有一個(gè)中心指揮區(qū),有一些工作區(qū),技術(shù)區(qū),這是一個(gè)統(tǒng)一的工作平面。第二個(gè)一,有一個(gè)統(tǒng)一的資源庫(kù),前面也講到了媒資,因?yàn)槲覀円鋈襟w融合化的話(huà),統(tǒng)一的資源庫(kù)是一個(gè)合一,因?yàn)楝F(xiàn)在除了以前傳統(tǒng)的來(lái)源,包括現(xiàn)在的互聯(lián)網(wǎng)來(lái)源,還有PGC,UGC移動(dòng)端的來(lái)源,所以統(tǒng)一資源庫(kù)是非常重要的一部分,不管是稿件也好,素材也好,產(chǎn)品節(jié)目也好都會(huì)在一個(gè)統(tǒng)一的資源庫(kù)里面,有了這個(gè)東西最后才能形成一個(gè)資源的共通共享,發(fā)布到所謂的兩微一端,還有一條,現(xiàn)在還有頭條。第三個(gè)一,統(tǒng)一的技術(shù)支撐體系。這個(gè)跟百度講的話(huà)題比較有關(guān)系了,因?yàn)樗袕V電廠房也好,或者廣電客戶(hù)也好大家都會(huì)做這方面的考慮,因?yàn)橐郧敖ㄏ到y(tǒng)都是一個(gè)一個(gè)獨(dú)立建的,現(xiàn)在大家技術(shù)體系都會(huì)做一個(gè)通盤(pán)的考慮,統(tǒng)一的建大數(shù)據(jù)分析平臺(tái),輿情的平臺(tái)。第四個(gè)一,有一個(gè)統(tǒng)一的從生產(chǎn)到反饋一個(gè)統(tǒng)一的閉環(huán),這也是非常重要的。這邊的圖它展現(xiàn)的是有一個(gè)統(tǒng)一的指揮調(diào)度,包括統(tǒng)一的看到之后你在不同發(fā)布的渠道,不同的途徑,最后傳播的情況怎么樣,所謂的閉環(huán),嗎?它是怎么分發(fā)出去的,怎么傳播的,反饋如何?回過(guò)頭來(lái)再來(lái)指導(dǎo)生產(chǎn)。所以簡(jiǎn)單說(shuō)中央廚房大概就是這么一個(gè)概念。然后今天大家的會(huì)議主要是說(shuō),我主要講的是AI這一塊,因?yàn)樵谇懊嬲f(shuō)做融合生產(chǎn),做中央廚房建設(shè),這些東西很多方面AI都可以提供一個(gè)非常好的助力,因?yàn)槲冶救艘恢笔亲鲅邪l(fā)的,現(xiàn)在也還是在做研發(fā)這方面的管理工作,所以我技術(shù)方面講的稍微多一點(diǎn)。我們總結(jié)來(lái)說(shuō),在幾個(gè)業(yè)務(wù)領(lǐng)域,內(nèi)容匯聚、內(nèi)容管理、內(nèi)容生產(chǎn)、內(nèi)容分發(fā)。這幾個(gè)大的生產(chǎn)環(huán)節(jié)上面,我們可以引入的技術(shù)有這么一些。重點(diǎn)說(shuō)一下內(nèi)容管理這一塊,大家前面都說(shuō)了VCA,VCR,到了生產(chǎn)的領(lǐng)域我們要編片子,做節(jié)目,做新媒體的加工生產(chǎn),做出東西來(lái),在這一塊人臉保護(hù),智能拆條,還有同期聲字幕制作,這也是非常實(shí)用。到了分發(fā)環(huán)節(jié)就是人臉黑名單過(guò)濾。這個(gè)是我們公司自己開(kāi)發(fā)的一個(gè),就是為了集成員工人工智能有一個(gè)基礎(chǔ)框架,人工智能是各種能力,我們自己開(kāi)發(fā)的框架它本身是一個(gè)分公司的框架,因?yàn)槲覀児疽恢倍际亲鲆曨l的公司,所以我們自己有很強(qiáng)的,因?yàn)樗麬I有的時(shí)候不是直接拿過(guò)來(lái)就可以用的,它有的是支持的格式,或者說(shuō)支持的形式是有一定局限的,因?yàn)閺V電行業(yè)有的時(shí)候是有一些特殊的東西,比如說(shuō)一些特殊的編輯格式等等可以做一些預(yù)處理,基于這個(gè)框架我們可以很容易的像百度的人工智能這些服務(wù),在電視臺(tái)也好,或者說(shuō)我們服務(wù)的廠商能夠很容易的落地。這個(gè)場(chǎng)景就是現(xiàn)在電視臺(tái)里面非常感興趣的場(chǎng)景,大家都知道,在做一個(gè)節(jié)目的時(shí)候,像所有的節(jié)目都有字幕,比如做字幕這個(gè)過(guò)程,我們會(huì)用小蜜蜂這樣的系統(tǒng),基本上靠人工扒詞核對(duì),工作量很大,也比較繁瑣,所以我們現(xiàn)在就通過(guò)我們的編劇工具,視頻節(jié)目生產(chǎn)的工具和語(yǔ)音識(shí)別,語(yǔ)音轉(zhuǎn)寫(xiě)做一個(gè)深度融合,恩就能夠很好的提高這個(gè)工作效率,直接把語(yǔ)音識(shí)別的結(jié)果甚至直接可以轉(zhuǎn)換成字幕文件,基本上能達(dá)到,比如像普通話(huà),如果聲音還比較好,準(zhǔn)確率訪談?lì)惖哪苓_(dá)到95%以上,所以這個(gè)極大地提高了他們的生產(chǎn)效率,這個(gè)我們和一些電視臺(tái)也一塊做這方面的嘗試和科研項(xiàng)目。這個(gè)就是VCA這一塊的介紹,我就不多說(shuō)了,因?yàn)榍懊嬗邪俣犬a(chǎn)品的同事已經(jīng)說(shuō)的非常多了。我要說(shuō)的就是,它解決的問(wèn)題主要還是傳統(tǒng)編目的成本比較高的問(wèn)題,而且現(xiàn)在你比如說(shuō)像我們?cè)谝恍╇娨暸_(tái)做的媒資系統(tǒng)都是用的這種編目方式,當(dāng)然現(xiàn)在所有的電視臺(tái)都在做融合媒體,融合生產(chǎn)的轉(zhuǎn)型,談到以前的媒資庫(kù),就變成了融合資源庫(kù),融合資源庫(kù)之后就會(huì)有大量的PGC,UGC的內(nèi)容進(jìn)來(lái),如果還用原來(lái)的四級(jí)編目的方式顯然不太現(xiàn)實(shí),因?yàn)榱刻罅?,而且這個(gè)內(nèi)容可能價(jià)值也沒(méi)有那么大,如果你都這樣做編目的話(huà)就非常地不劃算。所以我們用了VCA這個(gè)技術(shù)之后,這是我們軟件界面的截圖,這是一個(gè)資源的詳情界面,分幾個(gè)部分,第一塊通過(guò)VCA直接提取出來(lái)的標(biāo)簽,標(biāo)簽會(huì)有一些維度,前面應(yīng)該有介紹,識(shí)別圈場(chǎng)景的標(biāo)簽,還有里面物件的標(biāo)簽,還有通過(guò)語(yǔ)音識(shí)別的結(jié)果,還有OCR的結(jié)果產(chǎn)生的標(biāo)簽。另外一塊還有一個(gè)中間結(jié)果,像語(yǔ)音識(shí)別的文本在資源庫(kù)里面是可以直接使用的,比如說(shuō)我們會(huì)跟一些客戶(hù)合作。比如像新聞聯(lián)播,或者他認(rèn)為比較重要的一些節(jié)目,也是可以把文本直接審核出來(lái),可以做全文檢索或者做瀏覽等等,還有人臉結(jié)果也是可以直接識(shí)別出來(lái)的,在后面會(huì)對(duì)資源的查詢(xún)檢索會(huì)起到一個(gè)作用。前面就說(shuō)到了VCA它最后出來(lái)的結(jié)果是提取的標(biāo)簽,但是它的價(jià)值還不只這些,現(xiàn)在更大的問(wèn)題,我們現(xiàn)在很多客戶(hù)都在向我們抱怨,因?yàn)槲覀冇凶龊芏噘Y源庫(kù)的項(xiàng)目,因?yàn)楝F(xiàn)在存在一個(gè)問(wèn)題,東西不好找,原因就是用戶(hù)通過(guò)一些調(diào)研總結(jié),他們就是說(shuō)有幾個(gè)問(wèn)題。第一,比如說(shuō)我一個(gè)電視臺(tái),我是做體育的,你是做新聞的,我們都去找一個(gè)資源,我輸入一個(gè)北京這個(gè)詞,這個(gè)檢索結(jié)構(gòu)是一樣的,因?yàn)闁|西太多了,都找不到,比如像中央臺(tái)他的資源都是幾千量級(jí)的,所以東西還是非常多,因?yàn)橘Y源庫(kù)的東西它不會(huì)減少,只會(huì)增加,所以到后來(lái)就會(huì)越來(lái)越不好找,東西非常多,所以我們就結(jié)合到前面VCA的技術(shù),加上前面說(shuō)到的用戶(hù)畫(huà)像,把這兩者結(jié)合起來(lái)就能夠比較好的解決這個(gè)問(wèn)題,大概的意思就是說(shuō),因?yàn)槲覀兿到y(tǒng)里面都會(huì)記錄,因?yàn)槲覀儥z索系統(tǒng)都有日志的,會(huì)記錄用戶(hù)的信息,他的檢索歷史,瀏覽歷史,下載的歷史都是會(huì)記的。剛才我們說(shuō)到,通過(guò)VCA這個(gè)技術(shù)又給所有資源打了若干的標(biāo)簽,有場(chǎng)景的標(biāo)簽,人物的標(biāo)簽,還有一些語(yǔ)音識(shí)別的標(biāo)簽,還有一些關(guān)鍵詞標(biāo)簽等等。通過(guò)這個(gè)用戶(hù)的行為記錄,加上用戶(hù)自己的基本信息,我們就可以通過(guò)他的這個(gè)下載歷史,或者是檢索歷史,就可以給這些用戶(hù)打上一些標(biāo)簽,而這個(gè)用戶(hù)的標(biāo)簽其實(shí)和資源標(biāo)簽完全是一個(gè)體系的,就是標(biāo)簽體系肯定是一個(gè)的。這個(gè)用戶(hù)標(biāo)簽?zāi)墚a(chǎn)生出來(lái)的標(biāo)簽,完全取決于他對(duì)什么資源感興趣,結(jié)果把資源標(biāo)簽帶到了用戶(hù)的身上,變成了用戶(hù)的標(biāo)簽。因?yàn)槲覀冊(cè)谧鲋醒霃N房或者做融合資源庫(kù)這樣一些場(chǎng)景的時(shí)候,它和我們平常說(shuō)的,比如我們?cè)谟冒俣鹊乃阉饕?,或者我們平常?gòu)物,和這個(gè)用戶(hù)標(biāo)簽的概念是不一樣的,因?yàn)樵谖覀內(nèi)诤仙a(chǎn)的過(guò)程中,或者說(shuō)在我們?nèi)诤腺Y源庫(kù)的使用過(guò)程中,或者在中央廚房業(yè)務(wù)開(kāi)展過(guò)程中,大家都還是在工作,是要完成自己的工作,而不是一個(gè)大家個(gè)人一個(gè)娛樂(lè)的事情。在我們這個(gè)里面所有的用戶(hù)標(biāo)簽都是和資源相關(guān)的,相當(dāng)于你的個(gè)人愛(ài)好如何。有了用戶(hù)標(biāo)簽之后,就可以應(yīng)用于檢索的排序和優(yōu)化,我同樣去搜索一個(gè)詞,它的結(jié)果級(jí)其實(shí)是一樣的,檢索到的數(shù)量是一樣的,但是排序不一樣,第一頁(yè)展現(xiàn)出來(lái)的東西不一樣,這樣對(duì)樣對(duì)用戶(hù)來(lái)說(shuō)它就有一個(gè)個(gè)性化,是一個(gè)很好的體驗(yàn)。再一個(gè)有了用戶(hù)的標(biāo)簽,再通過(guò)協(xié)同過(guò)濾我們可以給出相關(guān)的推薦,這樣在我們中央廚房非常重要的融合資源庫(kù)能夠大大地提升它日常做工作做業(yè)務(wù)的體驗(yàn)。這是我們用戶(hù)畫(huà)像的一些維度,分成幾個(gè)方面,也有編目類(lèi)的,因?yàn)橄扔械木幠啃畔?,也是非常重要的一個(gè)資源,我們現(xiàn)在可以通過(guò)語(yǔ)音分析這樣的能力,因?yàn)橛械馁Y源它并沒(méi)有標(biāo)簽體系,當(dāng)然它有很豐富的編目原數(shù)據(jù),這也是可以的,你也可以從編目原數(shù)據(jù)里面提一些標(biāo)簽出來(lái),再加上它資源的類(lèi)型、日期,包括它是哪個(gè)欄目的,包括它時(shí)間上分布的,也就是說(shuō)它一般的下載是最近的,還是歷史的,還是怎么樣的,這樣還有一些資源方面的偏好,比如下載方式,這個(gè)人是喜歡整段下載還是喜歡分段下載等等,就是這么樣一些維度。剛才說(shuō)到的是VCA的在資源庫(kù)當(dāng)中的應(yīng)用。最后簡(jiǎn)單介紹一下VCR這一塊,前面技術(shù)方面百度同事已經(jīng)講的比較好了,這個(gè)在現(xiàn)在很多業(yè)務(wù)場(chǎng)景下面也是用得非常多,因?yàn)槲覀儸F(xiàn)在也是處在很多人落馬這樣的事件,我們可以緊急的做一些處理,把他的東西屏蔽掉,包括新華社也有這樣的需求,因?yàn)楝F(xiàn)在人太多了,有的人都不認(rèn)識(shí),都不知道這些人是出了問(wèn)題的人,所以這個(gè)功能也是像敏感人物識(shí)別,在出庫(kù)的時(shí)候或者再利用的時(shí)候有一個(gè)識(shí)別和提醒,就能夠讓大家的工作能夠做得更好。好,我今天分享的內(nèi)容就是這些,謝謝大家。主持人:感謝杜總,大家看到百度云的VCA服務(wù)在傳統(tǒng)廣電行業(yè)的應(yīng)用大大提高了視頻內(nèi)容標(biāo)簽效率,讓我們想象一下,未來(lái)我們?cè)诤A康囊曨l資源中,可以通過(guò)一個(gè)畫(huà)面、一個(gè)人物,一句話(huà),就能快遞定位到具體的視頻以及該內(nèi)容的截取內(nèi)容,這將為視頻行業(yè)提供多么便捷和強(qiáng)大的搜索服務(wù)。以上是VCA產(chǎn)品服務(wù)傳統(tǒng)廣電行業(yè),接下來(lái)我們介紹一個(gè)百度云VCR在新媒體行業(yè)的應(yīng)用,我們請(qǐng)到了央廣視訊創(chuàng)新項(xiàng)目總監(jiān)張海敏張總,為大家?guī)?lái)新媒體移動(dòng)直播的融合發(fā)展模式的分享。有請(qǐng)張總。張海敏央廣視訊創(chuàng)新項(xiàng)目總監(jiān)張海敏:感謝大家今天來(lái)到百度ABC的視頻論壇,我是央廣視訊的張海敏。我今天給大家來(lái)分享的主題是新媒體移動(dòng)直播的融合發(fā)展模式。眾所周知,2016年是網(wǎng)絡(luò)直播的元年,在短短的一年之內(nèi)我們?cè)谝苿?dòng)直播端的用戶(hù)規(guī)模迅速趕超了PC端多年來(lái)的用戶(hù)規(guī)模的積累,我們的直播平臺(tái)的一些業(yè)務(wù)模式也從最早的一個(gè)傳統(tǒng)秀場(chǎng)的業(yè)務(wù)模式,轉(zhuǎn)變到現(xiàn)在的一個(gè)泛生活、泛娛樂(lè)的一個(gè)直播時(shí)代。更多的一些技術(shù)類(lèi)的,包括VR直播,包括視頻直播,音頻直播被更多的移動(dòng)互聯(lián)網(wǎng)的企業(yè)所去采用,然后通過(guò)直播的方式能夠給這些平臺(tái)帶來(lái)更多的一個(gè)用戶(hù)流量和用戶(hù)的交互。我們其實(shí)從這個(gè)圖表上可以看到,我們?cè)?016年一個(gè)泛娛樂(lè)直播市場(chǎng)的規(guī)模同比2015年是達(dá)到了162%的一個(gè)增長(zhǎng)率,我們?cè)?017年整體直播市場(chǎng)的一個(gè)規(guī)模是在340個(gè)億,在2020年我們預(yù)測(cè)能達(dá)到600個(gè)億或者更多,整體的直播在線(xiàn)用戶(hù)從2015年1.93個(gè)億到現(xiàn)在2017年預(yù)計(jì)到3.94個(gè)億,整體是做了一個(gè)翻番。2018年可能整個(gè)數(shù)字想象空間會(huì)更大。目前的移動(dòng)直播主要分為五大塊的一個(gè)商業(yè)模式。第一個(gè)部分,就是我們的廣告付費(fèi)模式,這部分其實(shí)我們就會(huì)在直播的一個(gè)業(yè)務(wù)形態(tài)當(dāng)中加上了我們一個(gè)貼片廣告的一個(gè)形態(tài),可以是視頻的,可以是圖片的。通過(guò)相應(yīng)的廣告的部分向相應(yīng)的平臺(tái)帶來(lái)相應(yīng)的收益。第二部分就是我們的情感付費(fèi),其實(shí)在我們現(xiàn)在的秀場(chǎng)類(lèi)直播,包括泛娛樂(lè)直播平臺(tái)上普遍的被采用,這種模式通常的形態(tài)就是為主播來(lái)打賞,用甚至購(gòu)買(mǎi)禮物、點(diǎn),甚至點(diǎn)贊的方式,也是現(xiàn)在在整體的移動(dòng)視頻直播這個(gè)行業(yè)帶來(lái)最大收益的一個(gè)業(yè)務(wù)形態(tài)。第三個(gè)就是營(yíng)銷(xiāo)付費(fèi)。越來(lái)越多的B端的企業(yè)用戶(hù)也會(huì)通過(guò)線(xiàn)上和線(xiàn)下聯(lián)動(dòng)模式為更多他的潛在一些客戶(hù)提供他的一些企業(yè)營(yíng)銷(xiāo)。在這里面比如說(shuō)我們做一些新聞發(fā)布會(huì),比如說(shuō)做一些更多的行業(yè)論壇交流。有很多人是不能到現(xiàn)場(chǎng)來(lái)參加活動(dòng),我們就可以通過(guò)線(xiàn)上的方式為更多一些意向用戶(hù)來(lái)提供一個(gè)相應(yīng)的傳播。在這里面就是像這些B端的一些客戶(hù)就會(huì)希望直播平臺(tái)或者是一些新聞平臺(tái)給他們更多的一些曝光量,在一些直播平臺(tái)上有首頁(yè)或者優(yōu)勢(shì)資源位的推薦,這也是一種付費(fèi)的形態(tài),向這些企業(yè)提供一個(gè)相應(yīng)的收費(fèi)模式。第四個(gè),就是我們直播的內(nèi)容付費(fèi)。眾所周知像音視頻的一些平臺(tái)現(xiàn)在的內(nèi)容付費(fèi)已經(jīng)被越來(lái)越多的用戶(hù)所接受。像愛(ài)奇藝,包括騰訊、優(yōu)酷、土豆的一些VIP的付費(fèi)。我們現(xiàn)在在直播這個(gè)行業(yè)可能越來(lái)越多的包括體育類(lèi)的直播,包括演唱會(huì)的直播,包括知識(shí)分享類(lèi)的直播都可以開(kāi)始嘗試做付費(fèi)類(lèi)的一個(gè)直播間的方式,這部分其實(shí)是用戶(hù)為優(yōu)質(zhì)的PCC的內(nèi)容提供方來(lái)進(jìn)行買(mǎi)單。第五個(gè),就是我們的電商直播,這個(gè)過(guò)程當(dāng)中實(shí)際上現(xiàn)在在淘寶包括京東他們已經(jīng)都在開(kāi)始做一些業(yè)務(wù)類(lèi)的嘗試,主播可以在直播過(guò)程當(dāng)中向用戶(hù)他的粉絲推薦更多的商品,促進(jìn)這些商品一個(gè)快速成效,縮短我們的一個(gè)用戶(hù)決策的時(shí)間。所有的一個(gè)業(yè)務(wù)形態(tài)其中最終還會(huì)落到我們一些直播平臺(tái)的一個(gè)流量的情況當(dāng)中去,我們從這個(gè)圖表可以看到其中70%的一個(gè)業(yè)務(wù)收入都是匯聚到前十大的直播平臺(tái),這部分的流量,包括它的業(yè)務(wù)收益都是普遍會(huì)集中在這些平臺(tái)上,一些比較中小的一些直播平臺(tái),它的日活本身就不夠高,所以用戶(hù)在他的平臺(tái)上帶來(lái)的收益也比較少,所以這種情況下這些直播平臺(tái)普遍在內(nèi)容,包括博取眼球方面都提出了更多的一些創(chuàng)新的想法,當(dāng)然有些想法確實(shí)是很正面的,但是更多的一些情況可能是我們都會(huì)走一些擦邊,或者是走一些非違規(guī)的一些操作,在這個(gè)過(guò)程當(dāng)中,其實(shí)我們就發(fā)現(xiàn)了廣電總局、包括網(wǎng)信辦,文化部,從去年2016年4月份開(kāi)始集中對(duì)整個(gè)直播平臺(tái),包括音視頻平臺(tái)去做一些內(nèi)容方面的一些監(jiān)管要求。大家可以看到,這是一個(gè)相應(yīng)的時(shí)間軸,從去年4月份到今年6月份各個(gè)部委都普遍發(fā)布了一些對(duì)直播平臺(tái),包括音視頻平臺(tái)的一些安全播出,包括健康播出的一些要求。普遍的一個(gè)主題其實(shí)向大家來(lái)揭示的就是要求直播平臺(tái)能夠持證上崗,就是必須持有廣電這邊頒發(fā)的信息網(wǎng)絡(luò)傳播視聽(tīng)許可證,像網(wǎng)信辦發(fā)布的互聯(lián)網(wǎng)的直播的服務(wù)管理辦法當(dāng)中也明確的要求,如果我們的直播內(nèi)容是做新聞?lì)惖闹辈?,或者時(shí)政類(lèi)的直播必須也是持證上崗的,這部分要求我們的主持人或者是記者是持證的,要求我們平臺(tái)也是持證的,這個(gè)平臺(tái)你是做新聞的,你就是要去廣電或者是網(wǎng)信辦去做一個(gè)相應(yīng)的報(bào)備,他們審批通過(guò)了之后你們才能做相應(yīng)的直播。其實(shí)大家也會(huì)通過(guò)更多的一些社交平臺(tái)了解到,近期網(wǎng)信辦、廣電,包括文化部都在約談一些現(xiàn)在比較大的一些媒體平臺(tái),我說(shuō)的是新媒體平臺(tái),這些新媒體平臺(tái),包括新浪、騰訊、騰訊的微信公眾號(hào)、包括百度的百家號(hào)(音)的體系,包括現(xiàn)在我們的一個(gè)鳳凰網(wǎng)的一些新聞的那個(gè)視頻直播,包括A站和B站視頻內(nèi)容的一些正確的發(fā)布,這些已經(jīng)越來(lái)越多的信號(hào)傳遞出我們的政策導(dǎo)向是會(huì)對(duì)這些內(nèi)容要求更多的一些嚴(yán)管。我們其實(shí)更多關(guān)注在四個(gè)方面的一個(gè)內(nèi)容審核的要求。第一,政治敏感。其實(shí)大家前面也都說(shuō)到了,包括在整個(gè)視頻或者是內(nèi)容過(guò)程當(dāng)中的一些國(guó)家領(lǐng)導(dǎo)人,包括一些政治敏感人物他的文本、圖像、語(yǔ)音這些內(nèi)容能不能在平臺(tái)上做安全的播出。第二,廣告的審核。其實(shí)國(guó)家對(duì)整體的廣告這部分也做了很多要求,這個(gè)廣告屬于過(guò)程當(dāng)中什么樣的類(lèi)別?能不能播放?,什么樣的類(lèi)別在這個(gè)平臺(tái)上是定義為違規(guī)的內(nèi)容發(fā)布?,我們都可以通過(guò)廣告審核模塊來(lái)解決。在色情審核這部分,在更多直播平臺(tái)所關(guān)注的一個(gè)點(diǎn),這里面就包括它對(duì)于聲音的管控,包括對(duì)圖片的管控,包括對(duì)文字的管控,其實(shí)我們都可以有相應(yīng)的一個(gè)AI的技術(shù)來(lái)管理。第三,就是暴恐審核。就是海外音視頻內(nèi)容里面會(huì)有涉及到恐怖分子的頭像投降,包括一些血腥畫(huà)面,我們做一些內(nèi)容審核和監(jiān)察查。說(shuō)了那么多,其實(shí)我想向像大家來(lái)介紹一下央廣視訊是怎么樣的一個(gè)公司呢?央廣視訊是中央人民廣播電臺(tái)旗下的新媒體公司,獨(dú)家授權(quán)運(yùn)營(yíng)中央人民廣播電臺(tái)的信息網(wǎng)絡(luò)視聽(tīng)許可證,這個(gè)視聽(tīng)許可證當(dāng)中有兩張牌照,一個(gè)是自辦服務(wù)牌照,一個(gè)是集成播控牌照,這兩個(gè)牌照是我們拿來(lái)可以去做相應(yīng)的音視頻內(nèi)容的一個(gè)審核。大家可以看一下,這兩張牌照一個(gè)具體的區(qū)別。我的右手邊這張牌照是移動(dòng)互聯(lián)網(wǎng)視聽(tīng)節(jié)目服務(wù)牌照,大家可以看到在整個(gè)牌照當(dāng)中,央廣視訊拿到的牌照是第一類(lèi)的時(shí)政和新聞的首發(fā)和轉(zhuǎn)載。第二類(lèi)的一些文藝、娛樂(lè)、科技、體育、財(cái)政等方面的一些內(nèi)容的評(píng)論和轉(zhuǎn)載。包括像電影、電視劇,包括一些動(dòng)畫(huà)類(lèi)的視聽(tīng)節(jié)目的轉(zhuǎn)載服務(wù)。這張證實(shí)際上廣電總局目前為止發(fā)了500多張,大多都是國(guó)內(nèi)一些新聞媒體機(jī)構(gòu)獲得了這張牌照。越來(lái)越多的直播企業(yè)進(jìn)入到整個(gè)這個(gè)市場(chǎng),包括音視頻的企業(yè)進(jìn)入到這個(gè)市場(chǎng),他其實(shí)是想要做一些合規(guī)的運(yùn)營(yíng),怎么能夠合規(guī)的運(yùn)營(yíng)呢?在廣電的體系下就必須要持這張證才能進(jìn)行一個(gè)合規(guī)的運(yùn)營(yíng)和管理。我的左手邊還有一張證,是我們的手機(jī)電視集成播控服務(wù)的牌照,這張牌照廣電總局就發(fā)了6張,央廣是其中一張,這張牌照的作用是我們可以匯集大量的各種類(lèi)別的精品的內(nèi)容,包括音視頻的內(nèi)容,包括點(diǎn)播和直播類(lèi)的內(nèi)容,我們通過(guò)集成播控平臺(tái)把內(nèi)容匯聚了以后進(jìn)行播控審核,然后再做二次分發(fā),分發(fā)到相應(yīng)的平臺(tái)當(dāng)中去以后,這個(gè)內(nèi)容就是一個(gè)安全的沒(méi)有問(wèn)題的內(nèi)容,幫這個(gè)平臺(tái)獲得了更多的一個(gè)政策,包括安全播出的一個(gè)輸出。我們其實(shí)跟百度云在2017年3月份雙方簽訂了戰(zhàn)略合作協(xié)議共同打造視頻云+播控審核這樣的解決方案,我們通過(guò)百度云ABC智能審核的技術(shù),加上央廣視訊的集成播控牌照,包括匹配我們專(zhuān)業(yè)的具有豐富經(jīng)驗(yàn)的人工審核團(tuán)隊(duì),共同的為音視頻的點(diǎn)播和直播平臺(tái)提供相應(yīng)的審核服務(wù)。我們使用的技術(shù)包括物體識(shí)別、語(yǔ)音識(shí)別、文字識(shí)別和人臉識(shí)別,包括場(chǎng)景識(shí)別,匯聚在黃反、資質(zhì)、廣告、暴恐等梁應(yīng)領(lǐng)域,我們?yōu)檫@些平臺(tái)做相應(yīng)的保駕護(hù)航的工作。這個(gè)PPT我們匯聚了兩方面一個(gè)能力的輸出,一部分是我們的直播能力的輸出,因?yàn)楦嗟闹辈テ脚_(tái)它其實(shí)內(nèi)容都是通過(guò)流的方式,通過(guò)接口方式傳到我們視頻內(nèi)容審核服務(wù)平臺(tái)當(dāng)中來(lái),我們?nèi)プ鱿鄳?yīng)同步的一個(gè)審核,審核過(guò)以后我們就時(shí)時(shí)的會(huì)把審核結(jié)果輸出給到平臺(tái),如果這個(gè)內(nèi)容是違規(guī)的,我們直接就做下線(xiàn)處理,如果這個(gè)內(nèi)容是存疑的,由人工團(tuán)隊(duì)來(lái)做判斷,是否在這個(gè)平臺(tái)上繼續(xù)去播出。音視頻點(diǎn)播VOD的系統(tǒng)也是同樣存在這樣一個(gè)服務(wù)功能,我們通過(guò)接口方式把更多媒資庫(kù)內(nèi)容進(jìn)行相應(yīng)審核,同步以接口的方式返回結(jié)果。這是我們一個(gè)播控流程,前端通過(guò)接口方式傳到集成播控中心,第二段由我們審核人員做審核,最終我們會(huì)把審核結(jié)果做一個(gè)相應(yīng)的輸出和備案,同時(shí)把審核過(guò)的內(nèi)容在內(nèi)容媒資庫(kù)里面去做留檔。大家看到這張圖,這是我們最后做內(nèi)容審核過(guò)程當(dāng)中,我們右手邊是播控中心,就是我們會(huì)把整體的視頻直播和音頻點(diǎn)播的內(nèi)容會(huì)在我們的平臺(tái)上給展示出來(lái),央視出來(lái)了以后如果是說(shuō)有存疑讓人工進(jìn)行復(fù)審,最后通過(guò)播控的一些音視頻的內(nèi)容就會(huì)由我們的播控平臺(tái)直接添加我們的水印,CNR集成播控的水印,這樣我們?cè)谧罱K播出的時(shí)候就知道,哪些內(nèi)容是經(jīng)過(guò)我們的審核的,是它是安全的一個(gè)內(nèi)容。我們其實(shí)自身也在積極地探索更多的一些商業(yè)化的合作模式。本身我們也會(huì)整合更多的一些優(yōu)質(zhì)的PCC和直播資源方的內(nèi)容到我們手上,然后我們通過(guò)集成播控中心審核過(guò)了以后,為更多的直播平臺(tái)輸出內(nèi)容,因?yàn)楝F(xiàn)在直播平臺(tái)普遍存在的一個(gè)問(wèn)題就是,他們?nèi)狈?yōu)質(zhì)的內(nèi)容,缺乏好的安全的內(nèi)容。我們本身就在做播控審核的部分,我們就可以把這個(gè)內(nèi)容審核過(guò)以后,并且經(jīng)過(guò)版權(quán)方的一個(gè)同意,為更多的直播平臺(tái)去提供這塊的輸出。這是我們AI機(jī)器學(xué)習(xí)的模型,包括在圖像技術(shù),語(yǔ)音技術(shù),自然語(yǔ)言技術(shù)和用戶(hù)畫(huà)像技術(shù)上做了探索,包括我們說(shuō)的人臉識(shí)別,OCR識(shí)別,色情識(shí)別,暴恐識(shí)別和一些語(yǔ)音識(shí)別模塊的輸出。我們其實(shí)在人臉識(shí)別的準(zhǔn)確率已經(jīng)可以做到99%以上,包括字幕的識(shí)別、二維碼的識(shí)別和水印識(shí)別也做的非常棒了。百度在國(guó)內(nèi)這塊的技術(shù)已經(jīng)是可以做到NO.1了,謝謝大家今天下午抽時(shí)間來(lái)跟我一起探討我們?cè)谝粢曨l直播方面的一些探索,希望有機(jī)會(huì)跟在座的各位可以有更多的機(jī)會(huì)去合作,謝謝大家!主持人:感謝張總,讓大家了解到百度云VCR的黃反審核、暴恐審核、廣告審核、政治敏感審核、資質(zhì)審核、文字流審核,都能夠大大降低視頻審核的難度以及人力的投入。有了百度VCR媽媽再也不用擔(dān)心我看到不該看的視頻了,兒童的健康發(fā)展不僅在視頻審核方面需要下功夫,還需要一起用AI,用愛(ài)與責(zé)任來(lái)守護(hù)兒童的成長(zhǎng)。我們有幸請(qǐng)到了中國(guó)最大的幼兒園管理集團(tuán),威創(chuàng)集團(tuán)董事、副總經(jīng)理何一名給大家?guī)?lái)視頻AI在幼教方面的分享。有請(qǐng)。何一名威創(chuàng)集團(tuán)董事、副總經(jīng)理何一名:各位好,各位百度的合作伙伴,百度的朋友大家下午好,首先非常感謝今天有機(jī)會(huì)受百度云的邀請(qǐng)來(lái)到這里跟大家分享關(guān)于兒童成長(zhǎng)方面威創(chuàng)在做的一些事情,以及威創(chuàng)和百度牽手在這個(gè)行業(yè)做的事情和嘗試。首先我想問(wèn)一下在場(chǎng)有沒(méi)有年輕孩子的父母,為數(shù)不少。我想做一個(gè)市場(chǎng)調(diào)研,說(shuō)到兒童成長(zhǎng),我想大家對(duì)這個(gè)概念可能比較新,大家對(duì)幼兒的成長(zhǎng)在傳統(tǒng)中可能是理解為幼教,或者是幼兒園教育,但是今天其實(shí)主觀和客觀上大家對(duì)于學(xué)齡前小孩的成長(zhǎng)關(guān)注度和重要性已經(jīng)發(fā)生了本質(zhì)的變化,我打個(gè)比方,從以前的托兒所到后來(lái)的幼兒園,到今天我們內(nèi)部命名為兒童成長(zhǎng)基地,代表了大家對(duì)兒童成長(zhǎng)的認(rèn)知的關(guān)注度的理解的需求已經(jīng)發(fā)生了本質(zhì)的變化,所以今天來(lái)到這個(gè)大會(huì)上我非常興奮。有兩個(gè)地方,一個(gè)是聽(tīng)到了很多關(guān)鍵詞,尤其是今天早上引尹總給我們提到的,是我們思考了那么久覺(jué)得最能夠總結(jié)幼兒成長(zhǎng)的本質(zhì)(英文),幼兒成長(zhǎng)不是一個(gè)知識(shí)教育,不是一個(gè)技能教育,我們?cè)谛袃?nèi)有一句玩笑話(huà),我們?cè)谟?0年前的方法培養(yǎng)20年后的人,現(xiàn)在的小孩20年后社會(huì)的主人。,我們能不能做一些探索,在智慧的時(shí)代我們能不能結(jié)合智能科技更好的賦能他們的成長(zhǎng),這所以今天是我今天分享的一個(gè)主題。首先我簡(jiǎn)單介紹一下威創(chuàng),大家如果有關(guān)注兒童成長(zhǎng)產(chǎn)業(yè)也會(huì)留意到威創(chuàng),威創(chuàng)目前是一家以賦能或者是服務(wù)于兒童成長(zhǎng)的綜合型集團(tuán),我們現(xiàn)在的主要業(yè)務(wù)是幫助幼兒園的教學(xué)和管理的提升,目前威創(chuàng)旗下有5個(gè),我們控股的幼兒園的加盟品牌以及圍繞著兒童成長(zhǎng)相關(guān)的服務(wù)和產(chǎn)品的戰(zhàn)略合作伙伴。我們目前在全國(guó)不同城市、不同區(qū)域,服務(wù)超過(guò)4500家幼兒園,影響超過(guò)百萬(wàn)個(gè)兒童和兒童背后的家庭。對(duì)于兒童成長(zhǎng)我想給大家分享幾個(gè)核心的概念。第一,大家從這個(gè)產(chǎn)業(yè)地圖可以看得到,今天的兒童成長(zhǎng)其實(shí)跟我們以往的理解幼兒園教育已經(jīng)有本質(zhì)的變化了,在整個(gè)教育鏈條中我們客戶(hù)是最年輕的,我們的間接客戶(hù)家長(zhǎng)也是最年輕的,現(xiàn)在基本上我們的家長(zhǎng)都是80后,90后慢慢也會(huì)加入成為主流,所以今天主觀來(lái)說(shuō)這些家長(zhǎng)對(duì)于兒童成長(zhǎng),或者幼兒教育大家的需求已經(jīng)發(fā)生了本質(zhì)上的變化,變得更多元,更豐富,有幼兒園內(nèi)的,有幼兒園外的,有產(chǎn)品,有內(nèi)容,有線(xiàn)上的有線(xiàn)下的,這是今天的兒童成長(zhǎng)背后的一個(gè)特點(diǎn)。另外,我想接下來(lái)分享我們和百度的合作和在這個(gè)產(chǎn)業(yè)的探索很重要的背景,就是兒童成長(zhǎng)一個(gè)非常關(guān)鍵的特點(diǎn),我們總結(jié)叫不可逆和關(guān)鍵期,大家可能都有聽(tīng)過(guò)中國(guó)有一句古語(yǔ)說(shuō)三歲看大,七歲看老,本質(zhì)上是說(shuō)這兩個(gè)東西,大家在圖上可以看得到,在一個(gè)人的人生發(fā)展中有很多核心的品質(zhì)和能力,其實(shí)是在7歲以前,也就是在0到6這個(gè)階段已經(jīng)定型了,在我們行內(nèi)一個(gè)專(zhuān)業(yè)術(shù)語(yǔ)我們叫“敏感期”,大家可能體會(huì)比較深的時(shí)候是我們小時(shí)候?qū)W語(yǔ)言特別簡(jiǎn)單,三門(mén)四門(mén)都不是問(wèn)題,可能我們有的時(shí)候總結(jié)的時(shí)候發(fā)現(xiàn),是不是那個(gè)時(shí)候不害羞,特別敢說(shuō),敢聽(tīng)。,現(xiàn)在科學(xué)已經(jīng)證明,在一個(gè)人的發(fā)展過(guò)程當(dāng)中他語(yǔ)言敏感期就是在0到6歲,如果錯(cuò)過(guò)了,尤其是在發(fā)音上面,再去重新培養(yǎng),重新幫助,效率會(huì)大大減低,也是為什么我們今天再去學(xué)一門(mén)外語(yǔ)口音會(huì)很重,已經(jīng)很難回到我們小時(shí)候?qū)W語(yǔ)言的從容感了,這是大家比較直觀能夠感受到的。所以,我們總結(jié)兒童成長(zhǎng)的本質(zhì),就像零售的本質(zhì)是便捷,餐飲的本質(zhì)是好吃安全,兒童成長(zhǎng)的本質(zhì)是安全、健康、有效、及時(shí)的成長(zhǎng)服務(wù)。所以我們跟百度的合作是圍繞著兒童成長(zhǎng)的有效及時(shí)性來(lái)開(kāi)展的。這里我給大家分享一個(gè)場(chǎng)景,可能大家如果做過(guò)家長(zhǎng)的話(huà)會(huì)關(guān)注到,幼兒園除了是線(xiàn)下最專(zhuān)業(yè)的一個(gè)兒童成長(zhǎng)的服務(wù)的據(jù)點(diǎn),其實(shí)我們更定位為是兒童成長(zhǎng)的終端和關(guān)鍵的數(shù)據(jù)入口,從一個(gè)小孩子每周一到五,每天有超過(guò)三分之一的時(shí)間,扣除休息,有超過(guò)一半的時(shí)間是在幼兒園里面度過(guò)的,當(dāng)中存在大量的一個(gè)小孩子關(guān)鍵的成長(zhǎng)數(shù)據(jù)。剛才說(shuō)了,今天在互聯(lián)網(wǎng)年代已經(jīng)從產(chǎn)品為中心變?yōu)榈揭杂脩?hù)為中心,其實(shí)在兒童成長(zhǎng)更為重要,因?yàn)榫拖駝偛耪f(shuō)的,每個(gè)小孩都是不一樣的個(gè)體,3歲的小孩子每一個(gè)的差異性比30歲的一個(gè)人會(huì)差別很大,所以他們更需要個(gè)性化及時(shí)性的成長(zhǎng)服務(wù)?;氐浇裉?,以用戶(hù)為中心的很大的一個(gè)支撐,就是我們對(duì)一個(gè)小孩,對(duì)一個(gè)兒童他的了解,他的信息,他數(shù)據(jù)的及時(shí)性,但是回到今天,如果大家當(dāng)過(guò)家長(zhǎng)的話(huà),一個(gè)小孩放學(xué)最經(jīng)典的問(wèn)題是今天開(kāi)心嗎?吃了什么?學(xué)了什么?老師教了什么?小孩很簡(jiǎn)單,開(kāi)心,吃飽了,今天學(xué)了英文,明天學(xué)的中文,這些大量的核心的兒童成長(zhǎng)相關(guān)的數(shù)據(jù)其實(shí)是被封閉屏蔽掉,甚至消失掉的,而且是日益累積的消失掉。所以我們內(nèi)部用一句話(huà)來(lái)總結(jié)就是,今天的兒童成長(zhǎng)環(huán)境是封閉的、是割裂的,大大減低了我們作為兒童成長(zhǎng)的從業(yè)者和參與者幫助兒童成長(zhǎng)的效率的及時(shí)性和有效性。在傳統(tǒng)的方式和資源下大家試想一下,一個(gè)老師每天對(duì)著三十甚至四十時(shí)個(gè)小孩子,他真的能夠關(guān)注你的小孩子嗎?能夠個(gè)性化教好你的小孩子嗎?不可能的,我們總結(jié)的大量特定場(chǎng)景下要么是無(wú)法實(shí)現(xiàn),或者是十倍以上成本才能實(shí)現(xiàn)的需求,但回到今天智能的時(shí)代,科技和智能科技給到我們這個(gè)產(chǎn)業(yè)一個(gè)升級(jí)的機(jī)會(huì),這也是我們和百度牽手的一個(gè)大背景。所以回到今天的主題百度云,或者是今天這個(gè)分會(huì)場(chǎng)的主題,視頻AI怎么賦能兒童成長(zhǎng)?核心點(diǎn)是回到剛才的痛點(diǎn),第一步的核心是重新打開(kāi)這些黑匣子,將不同的割裂的兒童成長(zhǎng)環(huán)境重新用智能的方式聚合起來(lái),激活起來(lái)。所以第一步,我們跟百度云的合作是從感知的層面,重新將這些結(jié)合我們對(duì)場(chǎng)景的理解,我個(gè)人非常認(rèn)可李彥宏先生的一句話(huà),在AI時(shí)代的核心是將數(shù)據(jù)的整合利用科技的手段,以及對(duì)場(chǎng)景的理解,要吃透一個(gè)場(chǎng)景,幫助整個(gè)產(chǎn)業(yè)來(lái)升級(jí),所以今天也是我們和百度和百度云合作的一個(gè)非常大的背景。第一步是圍繞著我們的主題,以?xún)和砷L(zhǎng)為中心來(lái)打開(kāi)這些傳統(tǒng)場(chǎng)景下的一個(gè)一個(gè)黑匣子,把它們重新激活,重新聚合。在介紹我們具體產(chǎn)品之前,我想從三個(gè)方面威創(chuàng)現(xiàn)在和百度云在做的事情。第一,是利用最基礎(chǔ)的,現(xiàn)在非常成熟的人臉識(shí)別技術(shù)和視頻的搜索技術(shù),我們重新把視頻內(nèi)容,因?yàn)橐曨l內(nèi)容我們認(rèn)為是潛在價(jià)值最大的數(shù)據(jù)媒體之一,當(dāng)中蘊(yùn)含著大量我們非常有價(jià)值的潛在數(shù)據(jù),但這些數(shù)據(jù)是需要結(jié)合合適有效的手段將它重新激活,有效科學(xué)的挖掘出來(lái),所以第一步我們是用人臉識(shí)別技術(shù)以及視頻的搜索技術(shù),將我們的小孩子真正地做到以小孩子或者兒童為中心,將這些視頻內(nèi)容重新組合和整合。第二,我們需要進(jìn)一步去訓(xùn)練,用今天早上的關(guān)鍵詞來(lái)說(shuō),或者是要加強(qiáng)的是,我們將專(zhuān)業(yè)資源,包括威創(chuàng)體系內(nèi)的專(zhuān)家和體系外的專(zhuān)家整合回來(lái)后,對(duì)于兒童成長(zhǎng)在視頻中關(guān)鍵的數(shù)據(jù)重新的抽取和將它結(jié)構(gòu)化,讓它變成真正成為可用的,可以賦能給我們的參與者做決策做服務(wù)的數(shù)據(jù)。包括我這里以幼兒園這個(gè)場(chǎng)景為例,我們第一步把兒童的個(gè)體切開(kāi)了,但每個(gè)兒童他個(gè)性化的行為我們是不是又能夠利用智能的科技有效的做成一個(gè)我們互聯(lián)網(wǎng)年代的用戶(hù)畫(huà)像,是絕對(duì)有可能的。包括音頻,因?yàn)樵趦和砷L(zhǎng)有一句話(huà)叫環(huán)境即教育,在視頻里面除了圖像,聲音是非常非常關(guān)鍵的一個(gè)數(shù)據(jù)來(lái)源,一個(gè)小孩子哭沒(méi)哭,他的情緒是怎么樣,很多時(shí)候是可以用音頻判斷出來(lái)的。所以接下來(lái)我會(huì)分享兩款威創(chuàng)近期會(huì)推出的我們關(guān)于AI賦能兒童成長(zhǎng)的落地產(chǎn)品以及與百度的探索,也是最后我想做一個(gè)市場(chǎng)調(diào)研,看在場(chǎng)如果是有兒童的父母,大家有多少動(dòng)力來(lái)用這款產(chǎn)品。第一,我們叫今日寶寶,核心要解決的問(wèn)題是高效及時(shí)的將園內(nèi)和園外精準(zhǔn)信息互通起來(lái),因?yàn)榻裉靸和砷L(zhǎng)的環(huán)境除了幼兒園,家庭以及家庭外的社會(huì)是三位一體,是不可或缺的。所以像幼兒園的兒童行為我們分類(lèi),將它總結(jié)為五大場(chǎng)景,像家長(zhǎng)非常關(guān)注的,以及他在家里面怎么配合幼兒園對(duì)于兒童成長(zhǎng)的,怎么聯(lián)動(dòng)起來(lái)和幼兒園的老師和園長(zhǎng),一個(gè)很重要的基礎(chǔ)他需要知道,我的小孩今天在幼兒園到底學(xué)了什么?這個(gè)時(shí)間點(diǎn)老師給他的關(guān)鍵發(fā)展是什么?他的健康情況怎么樣?他安不安全?就像我說(shuō)今天在幼兒園的場(chǎng)景里面都是消失掉的。但如果只是簡(jiǎn)單的視頻,簡(jiǎn)單的攝像,大家會(huì)看到這樣的情況,我們無(wú)所適從,我們不知道怎么利用好視頻里面大量蘊(yùn)含的數(shù)據(jù),但如果結(jié)合視頻AI,我們第一步可以把你的孩子,你關(guān)注的東西,你關(guān)注的主體重新組合,以及根據(jù)威創(chuàng)和威創(chuàng)體系內(nèi)的專(zhuān)業(yè)資源,按照一個(gè)在幼兒園的場(chǎng)景它有一個(gè)關(guān)鍵詞叫一日流程,所有小孩他的發(fā)展情況,他在幼兒園的流程其實(shí)是系統(tǒng)化整理好的,結(jié)合我們個(gè)性化抽取出來(lái)的,圍繞著特定兒童的視頻和圖片家長(zhǎng)呈現(xiàn)到的,或者接受到的是從入園,從早餐,從早上的早神操,從他上的美術(shù)課,音樂(lè)課,他睡覺(jué)睡了多少,他吃飯的時(shí)候你的寶寶有沒(méi)有吃飽,他喜歡吃什么,他對(duì)什么顏色有興趣,這些都是能非常簡(jiǎn)單的實(shí)現(xiàn)的,結(jié)合今天的以及非常成熟的手段有效的傳遞到我們的家庭客戶(hù)。再往下延伸,其實(shí)學(xué)前教育有一個(gè)非常大的特點(diǎn),不知道大家有沒(méi)有感知得,像K12或者是高等教育,成人教育他的結(jié)果是有標(biāo)準(zhǔn)的,就是我們傳統(tǒng)意義上所說(shuō)的“分”,像大家上小學(xué)要考初中高中,考高中初中,高中初中畢業(yè)要考大學(xué),其實(shí)都是圍繞著一個(gè)我們潛意識(shí)中存在的標(biāo)準(zhǔn)結(jié)果,但是其實(shí)在兒童成長(zhǎng),大家心里面是沒(méi)有一個(gè)特定的標(biāo)準(zhǔn)。今天在威創(chuàng)體系內(nèi)我們有超過(guò)百萬(wàn)的兒童,有超過(guò)上億級(jí)別的數(shù)據(jù)點(diǎn),其實(shí)在這樣的數(shù)據(jù)規(guī)模下,我們有了一個(gè)能夠及時(shí)干預(yù)非常好的基礎(chǔ),比如像現(xiàn)在顯示的自閉癥的傾向,注意力的不集中,注意力的廣度問(wèn)題等等,其實(shí)在具備數(shù)據(jù)規(guī)模的情況下給到我們的核心價(jià)值是圍繞著這些關(guān)鍵指標(biāo),我們有了一個(gè)參考值,所以回到我們兒童成長(zhǎng)的本質(zhì)上,如果這個(gè)參考值它不是一個(gè)絕對(duì)參加值,是一個(gè)相對(duì)參考值,它是根據(jù)數(shù)據(jù)的規(guī)模以及背后的科學(xué)理論來(lái)產(chǎn)生的,但是一旦有了這個(gè)參考值以后,我們對(duì)兒童成長(zhǎng)的及時(shí)性就有了極大的干預(yù)能力。比如說(shuō),今天我用一個(gè)最直觀的例子,今天您的小孩47個(gè)月,47個(gè)月的其他小孩在中國(guó)同等環(huán)境下,他的身高是怎么樣呢?你的孩子到底算是高,還是矮,你有概念嗎?那我們有了這個(gè)參考值之后,我們是不是可以給背后的家長(zhǎng),背后的參與者做一些精準(zhǔn)的推送,這個(gè)是絕對(duì)可以的,而且產(chǎn)生的價(jià)值是巨大的,因?yàn)閮和砷L(zhǎng)0到6這個(gè)階段是不可逆,是關(guān)鍵期。每個(gè)家長(zhǎng)認(rèn)識(shí)之后,其實(shí)他的精準(zhǔn)個(gè)性化的教育需求是非常迫切的。所以最后的總結(jié),有了規(guī)模用戶(hù),加上規(guī)模的數(shù)據(jù),以及有效獲取數(shù)據(jù)的手段,再結(jié)合科學(xué)以數(shù)據(jù)支撐的指數(shù),我們就能夠打通園語(yǔ)言、家、+社會(huì)的兒童成長(zhǎng)環(huán)境,真正的做到有效及時(shí)的兒童成長(zhǎng)服務(wù)。所以威創(chuàng)與百度牽手的背景用一句話(huà)總結(jié),我們希望能夠以數(shù)據(jù)驅(qū)動(dòng),以AI賦能兒童成長(zhǎng),讓家長(zhǎng)能夠更了解他的孩子,讓老師能夠因材施教,讓兒童成長(zhǎng)這個(gè)產(chǎn)業(yè)里面的合作伙伴能夠精準(zhǔn)的接觸到服務(wù)到他們的目標(biāo)客戶(hù),以及精準(zhǔn)的把握到商業(yè)價(jià)值,這就是我今天的分享,謝謝。主持人:感謝何總,用科技讓復(fù)雜的世界更簡(jiǎn)單!用AI守護(hù)兒童成長(zhǎng)。百度云也非常有幸能夠跟威創(chuàng)企業(yè)一起為我們的下一代付出我們自己的一份力量。以上是ABCinspire媒體行業(yè)中A的實(shí)際應(yīng)用介紹,接下來(lái)我們開(kāi)啟B,bigdata視頻大數(shù)據(jù)應(yīng)用的演講,有請(qǐng)百度云大數(shù)據(jù)產(chǎn)品經(jīng)理張爽為大家?guī)?lái)視頻大數(shù)據(jù)應(yīng)用-視頻推薦與檢索的分享。有請(qǐng)張爽。張爽百度云大數(shù)據(jù)產(chǎn)品經(jīng)理張爽:謝謝康盛,各位來(lái)賓下午好!我今天要分享的是百度云視頻推薦與搜索解決方案。我也提到一個(gè)概念叫2016年,2016年其實(shí)至今乃至以后大家都會(huì)發(fā)現(xiàn)這樣一個(gè)問(wèn)題,就是搶占互聯(lián)網(wǎng)用戶(hù)的流量而獲取紅利的這個(gè)時(shí)代結(jié)束了,隨之而來(lái)就是搶占用戶(hù)的時(shí)間成為了新的戰(zhàn)場(chǎng),而我們每一個(gè)用戶(hù)來(lái)講,其實(shí)每一天我們都只有有限的那么一點(diǎn)點(diǎn)時(shí)間,通過(guò)手機(jī)其他的上網(wǎng)設(shè)備去獲取一些信息。我們希望在有限的時(shí)間里面去獲得更有價(jià)值的信息。對(duì)于一個(gè)企業(yè)來(lái)講,他它最希望的就是能夠快速抓到用戶(hù)眼球,用有價(jià)值信息去換取用戶(hù)的時(shí)間,從而在同質(zhì)化產(chǎn)品當(dāng)中脫穎而出。如何才能夠抓到用戶(hù)的眼球和時(shí)間呢,我認(rèn)為有以下三點(diǎn)。第一,深知用戶(hù)。第二是認(rèn)知產(chǎn)品。第三就是價(jià)值的一個(gè)轉(zhuǎn)化。首先深知用戶(hù)就是要有一個(gè)全方位的對(duì)于用戶(hù)的行為、特征,以及他的意圖能做一個(gè)深度的洞察。認(rèn)知產(chǎn)品,我想不僅僅是從我們企業(yè)所生產(chǎn)的產(chǎn)品定位的一個(gè)認(rèn)知,更重要的是你能不能對(duì)于產(chǎn)品所承載的內(nèi)容或者資源的一個(gè)認(rèn)知。比如說(shuō)我們拿一個(gè)視頻的APP做一個(gè)例子,視頻APP所承載的內(nèi)容就是視頻,對(duì)于視頻解析我們可以從人工標(biāo)注標(biāo)簽,或者從視頻一段描述當(dāng)中去理解它,更重要的就是能不能通過(guò)解析視頻的內(nèi)容,更多維化的更全面的去理解視頻的特征,從而對(duì)這個(gè)產(chǎn)品有一個(gè)更立體的認(rèn)知。第三,是價(jià)值轉(zhuǎn)化。這里面就會(huì)有各種各樣的手段,比如說(shuō)有的通過(guò)學(xué)習(xí)的算法,有的通過(guò)各種方式,把用戶(hù)與產(chǎn)品建立一個(gè)價(jià)值的聯(lián)系,然后促進(jìn)沉默用戶(hù)到活躍用戶(hù)的一個(gè)轉(zhuǎn)化。我們百度云視頻推薦的方案就是一站式幫大家解決掉了深知用戶(hù),認(rèn)知產(chǎn)品到價(jià)值轉(zhuǎn)化這樣一個(gè)過(guò)程。有四大核心優(yōu)勢(shì)。第一,叫做百度畫(huà)像,深知用戶(hù)。百度畫(huà)像的數(shù)據(jù)可以通過(guò)多唯維的ID方式與企業(yè)數(shù)據(jù)打通,對(duì)于用戶(hù)行為做一個(gè)深刻的認(rèn)知。第二,就是領(lǐng)先技術(shù),盡在其中,以機(jī)器為核心,我們還融入了對(duì)于視頻內(nèi)容的分析,自然語(yǔ)言的處理,還有一個(gè)點(diǎn)擊率的預(yù)估技術(shù),我們都會(huì)放到我們推薦的解決方案當(dāng)中,而這些技術(shù)都是在百度風(fēng)潮鳳巢廣告搜索等多個(gè)產(chǎn)品線(xiàn)當(dāng)中多年的沉淀積累多年所驗(yàn)證的技術(shù)。第三個(gè)優(yōu)勢(shì)叫做算法策略,專(zhuān)屬定制,其實(shí)推薦系統(tǒng)大家都知道發(fā)展了好多年,這個(gè)過(guò)程其實(shí)沉淀了很多這樣的策略,比如說(shuō)協(xié)同過(guò)濾,比如說(shuō)基于內(nèi)容的推薦等等。而我們的推薦方案,把這些主流的算法都會(huì)融入進(jìn)來(lái)。但是同時(shí)有一個(gè)問(wèn)題也誕生了,什么問(wèn)題?就是通用這樣一些算法其實(shí)并不能夠滿(mǎn)足很多行業(yè)的它的一些訴求。所以我們會(huì)支持對(duì)于算法,包括它參數(shù)的調(diào)優(yōu)及定制。還有另外一個(gè)問(wèn)題,找到了這個(gè)對(duì)應(yīng)的推薦內(nèi)容,其實(shí)對(duì)于推薦結(jié)果要有一個(gè)排序過(guò)程,這個(gè)排序過(guò)程中可能有很多的策略,還有就是比如說(shuō)我們把一些召回當(dāng)中的新熱的沒(méi)聽(tīng)懂,還有就是冷啟動(dòng)的策略算法當(dāng)中都會(huì)納入進(jìn)來(lái)。所以我們對(duì)于這些策略也是支持專(zhuān)屬定制的,為了達(dá)到更好的一個(gè)推進(jìn)的效果。沒(méi)聽(tīng)懂第四個(gè),叫做SAAS服務(wù),簡(jiǎn)單接入,我們推薦結(jié)果以服務(wù)的形式接入的,我們客戶(hù)只需要完成兩步。第一把數(shù)據(jù)接入進(jìn)來(lái)。第二調(diào)用服務(wù),整個(gè)過(guò)程就可以了,我們不用去關(guān)心所謂的運(yùn)維相關(guān)的問(wèn)題。下面我們先來(lái)看一下剛才所提到的百度畫(huà)像,百度畫(huà)像其實(shí)是打通了百度內(nèi)部有大約40多款以上的產(chǎn)品,比如大家熟知的百度地圖、手機(jī)百度等等。而這些產(chǎn)品當(dāng)中,大約會(huì)有至少十多款以上的產(chǎn)品其實(shí)都是用戶(hù)過(guò)億的,我們獲取到的這些數(shù)據(jù)當(dāng)中包含了用戶(hù)瀏覽、點(diǎn)擊、購(gòu)買(mǎi)、搜索、評(píng)論等各個(gè)方面的維度的數(shù)據(jù)。對(duì)這些數(shù)據(jù)我們通過(guò)深度學(xué)習(xí)的方式把它形成了一個(gè)百度畫(huà)像,然后可以通多種維度的方式基于與企業(yè)的數(shù)據(jù)打通,我們助力企業(yè)能夠?qū)τ谒挠脩?hù)有很好的認(rèn)知與增強(qiáng)。另外一個(gè)方面大家可以看到,其實(shí)百度畫(huà)像有很多的維度,至少有五千多個(gè)標(biāo)簽,我們會(huì)把它放到個(gè)性化的推薦當(dāng)中,由于對(duì)于用戶(hù)用度識(shí)別的更加地豐富,更加地廣,所以在最后的個(gè)性化推薦中它的一個(gè)精準(zhǔn)度和多樣性,自然就會(huì)有大幅度的提升,借助百度畫(huà)像還可以解決什么問(wèn)題呢?就是冷啟動(dòng)的問(wèn)題,比如一個(gè)新的用戶(hù)來(lái)了,我不知道他的畫(huà)像特征,好,百度畫(huà)像幫助你去識(shí)別,對(duì)于這一類(lèi)特征的用戶(hù)我該推薦一些什么呢?百度畫(huà)像能夠找到相似用戶(hù)推薦的一些產(chǎn)品,把這些產(chǎn)品推薦給這個(gè)新用戶(hù)。同樣我們可以反過(guò)來(lái)想一下,如果一個(gè)新的視頻來(lái)了,我也可以找到相應(yīng)視頻感興趣的用戶(hù)的視頻,這是百度畫(huà)像帶給大家巨大的作用。我們?cè)賮?lái)看一下核心的一些技術(shù),其中有一個(gè)重點(diǎn)的技術(shù)就今天多次強(qiáng)調(diào)的叫做視頻內(nèi)容一個(gè)解析技術(shù),我們叫VCA,通過(guò)視頻解析我們可以通過(guò)人工標(biāo)注的方式,也可以從當(dāng)中提取特征,但是都不會(huì)有很多方面對(duì)它進(jìn)行一個(gè)立體化的描述,而視頻內(nèi)容一個(gè)解析卻能夠從更多維度去解析視頻的內(nèi)容,比如說(shuō)人物、文字、物體、地標(biāo)、場(chǎng)景、語(yǔ)音等,還有我們對(duì)于視頻的特征能夠解析到4096個(gè)維度,可以想象一下如果我把這4096個(gè)維度用于對(duì)比兩個(gè)事情的一個(gè)相關(guān)性,這種一個(gè)對(duì)比概念是一個(gè)多么豐富的一個(gè)對(duì)比,也之所以能夠這樣如此豐富的去對(duì)比,才能夠使相關(guān)推薦當(dāng)中的視頻的數(shù)量會(huì)有所提升,相關(guān)視頻產(chǎn)生的推薦效果會(huì)更加新穎和多樣。還有推薦結(jié)果排序上,我們也可以從人物、文字、位置等多個(gè)維度去對(duì)結(jié)果進(jìn)行排序。第二個(gè)技術(shù),剛才也提了一點(diǎn),叫做點(diǎn)擊率預(yù)估技術(shù),我們叫做CTR,這個(gè)技術(shù)就是對(duì)于用戶(hù)歷史的點(diǎn)擊行為,通過(guò)分析去預(yù)估他未來(lái)的一個(gè)點(diǎn)擊行為,有一個(gè)核心的模塊,我們把它叫做特征增量,我們?cè)诜治鰵v史點(diǎn)擊行為當(dāng)中,去考慮某一條點(diǎn)擊記錄當(dāng)中用戶(hù)的特征,它的標(biāo)簽是什么樣的,它的偏好是什么樣的,同樣也會(huì)考慮這條點(diǎn)擊記錄中被點(diǎn)擊的那個(gè)物品的特征是一個(gè)什么樣的維度,另外點(diǎn)擊的時(shí)間、點(diǎn)擊時(shí)手機(jī)的一個(gè)情況,位置的一個(gè)情況,我們把這些叫做一個(gè)環(huán)境的特征,會(huì)放入到這個(gè)特征工程當(dāng)中,綜合上面的各類(lèi)特征,我們通過(guò)訓(xùn)練來(lái)預(yù)估未來(lái)的點(diǎn)擊情況,這個(gè)點(diǎn)擊技術(shù)是鳳巢廣告十年總結(jié)下來(lái)的,我們?nèi)ビ?jì)算一下用戶(hù)對(duì)某一個(gè)視頻的一個(gè)點(diǎn)擊得分,把得分高的排在前面,就會(huì)有效的去提升一個(gè)用戶(hù)的點(diǎn)擊轉(zhuǎn)化率。再來(lái)看一下除了視頻推薦方案之后,我們其實(shí)還有其他的一些推薦方案,比如說(shuō)新聞資訊類(lèi)的推薦,還有電商類(lèi)的,這個(gè)是即將上線(xiàn)的,視頻推薦這一塊我們今天也請(qǐng)來(lái)了重要的客戶(hù)人人視頻,新聞資訊類(lèi)這個(gè)我們有很多的央視類(lèi)的各種新聞媒體的一些客戶(hù),在這兒就不和大家介紹了。然后我們來(lái)看一下視頻搜索方案,我們的視頻搜索目標(biāo)就是讓一切可以被索引,其實(shí)大家可以了解到,隨著技術(shù)的發(fā)展,人們對(duì)于視頻搜索的需求也更加垂直化,更加的立體化,所以就要求我們對(duì)于搜索引擎的能力會(huì)有全面的提升,具體體現(xiàn),比如說(shuō)第一,我們要對(duì)信息的收錄更加廣。第二,我們對(duì)內(nèi)容的搜索更加地立體。第三,其實(shí)就對(duì)于搜索結(jié)果的一個(gè)精準(zhǔn)定位。分別來(lái)看一下,搜索的一個(gè)全面收錄。十年以前做搜索的時(shí)候,其實(shí)我們只是基于文本的內(nèi)容去做搜索,后來(lái)的時(shí)候我們可以對(duì)于文本附件中的內(nèi)容去做搜索,隨著人工智能技術(shù)的發(fā)展,我們其實(shí)已經(jīng)做到了在圖片中進(jìn)行搜索以及對(duì)于視頻內(nèi)容的一個(gè)搜索。首先我們會(huì)把視頻中的內(nèi)容、場(chǎng)景、聲音、字幕等這樣的信息全部收錄下來(lái),正是因?yàn)槭珍浀男畔⒏拥貜V和全面,才能夠讓搜索引擎讀懂視頻的內(nèi)容,這樣也才會(huì)為后面立體化的搜索以及精準(zhǔn)定位去奠定一個(gè)基礎(chǔ)。立體的搜索。其實(shí)對(duì)于一個(gè)視頻大家也看得到,它有很多的維度,比如說(shuō)聲音是它的維度,字幕是它的維度,圖像也是它的維度,定位到視頻當(dāng)中的某一幀,都會(huì)從這三個(gè)層面上去體現(xiàn),那么就會(huì)出現(xiàn)一個(gè)問(wèn)題,在同一時(shí)刻不同的維度,不同的層面,其實(shí)暴露的信息是不一樣的,所以我們的搜索一定是從一個(gè)立體方面的搜索,并且是基于用戶(hù)意圖的一個(gè)立體化的搜索。我們來(lái)舉一個(gè)例子,比如說(shuō)我們要搜索吳亦凡說(shuō)freestyle,首先我們要來(lái)解析一下這個(gè)的意圖,比如說(shuō)他的意圖可能會(huì)定義在幾個(gè)維度上。比如說(shuō)我們把這個(gè)搜索意圖定位到圖像、聲音和字幕這三個(gè)維度上,有可能是說(shuō)在圖像中出現(xiàn)吳亦凡這個(gè)人物,而在聲音或者字幕中出現(xiàn)freestyle,我們搜索了之后,定義到了不同維度上,推動(dòng)對(duì)不同維度的打分進(jìn)行計(jì)算,最后能夠?qū)⑺阉鞯慕Y(jié)果定位到視頻的某一些幀的上面。這個(gè)例子體現(xiàn)了我們通過(guò)多維度方式進(jìn)行搜索。可以再看下一個(gè)例子,精準(zhǔn)的定位,比如說(shuō)有一些學(xué)習(xí)類(lèi)的,視頻類(lèi)的學(xué)習(xí)網(wǎng)站,其實(shí)它的主要的用戶(hù)角色可能兩類(lèi),第一就是初學(xué)者。第二是進(jìn)階者。初學(xué)者更關(guān)注來(lái)到這個(gè)視頻網(wǎng)站上我能夠系統(tǒng)的學(xué)習(xí),所以他會(huì)看到整個(gè)的視頻。而進(jìn)階者是對(duì)于視頻中的某一些概念做一些重復(fù)的溫故知新,所以對(duì)于這兩者的一個(gè)定位,我們的搜索反饋的結(jié)果肯定是不同的。好,對(duì)于初學(xué)者來(lái)說(shuō)我們會(huì)給他返回所有視頻的內(nèi)容,他針對(duì)視頻內(nèi)容去看就好了,而針對(duì)進(jìn)階者來(lái)說(shuō),我們就會(huì)幫助他去搜索視頻中內(nèi)容的某一些概念,比如說(shuō)我們搜索核心概念,我們不能僅僅地去搜索核心概念,因?yàn)檫@個(gè)返回的結(jié)果一定就是一個(gè)視頻,對(duì)于進(jìn)階者來(lái)說(shuō)不需要從頭到尾再看一遍視頻,所以我們會(huì)通過(guò)對(duì)內(nèi)容的解析搜索核心概念,這一個(gè)概念定位到視頻當(dāng)中的某一幀,這樣把這個(gè)結(jié)果去返回給進(jìn)階者,才是他想要的內(nèi)容,這個(gè)例子體現(xiàn)了我們對(duì)于搜索一個(gè)定位的準(zhǔn)確。以上就是我本次分享內(nèi)容,謝謝大家!主持人:感謝張爽對(duì)百度視頻大數(shù)據(jù)的介紹,以及給大家分享了一些技術(shù)干貨和最佳實(shí)踐。接下來(lái)讓我們通過(guò)一個(gè)實(shí)際案例來(lái)了解下,視頻大數(shù)據(jù)一些應(yīng)用,在視頻大數(shù)據(jù)這一塊百度云是如何結(jié)合人人視頻,給人人視頻提升了日均播放量以及如何優(yōu)化人力成本,我們有幸請(qǐng)到了人人視頻CTO葉懋為大家介紹一下好風(fēng)憑借力,送我上度云。葉懋人人視頻CTO葉懋:大家下午好,我是來(lái)自人人視頻的葉懋,非常榮幸在百度云峰會(huì)看

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論