大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用_第1頁
大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用_第2頁
大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用_第3頁
大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用_第4頁
大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)挖掘在媒體領(lǐng)域的應(yīng)用背景隨著社會(huì)的進(jìn)步和信息通信技術(shù)的發(fā)展,信息產(chǎn)生的數(shù)量越來越多,產(chǎn)生速度也越來越快。在這種情況下我們每天都接收著來自四面八方的信息,這些信息帶給了我們極大的便利并改變著我們的生活。但是我們享受著海量的信息的同時(shí)也陷入了困頓,如今困擾我們的不是信息太少而是太多,多到讓你不知如何選擇,也無從辨別。那么,究竟如何從海量信息中準(zhǔn)確提取出有價(jià)值的信息呢? 這就涉及到一項(xiàng)核心技術(shù)數(shù)據(jù)挖掘。什么是數(shù)據(jù)挖掘?數(shù)據(jù)挖掘(英語: Data mining ),又稱資料探勘、數(shù)據(jù)采礦。一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處

2、理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)和模式識(shí)別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。簡(jiǎn)單來說,數(shù)據(jù)挖掘就是從未經(jīng)處理過的數(shù)據(jù)中提取信息的過程,重點(diǎn)是找到相關(guān)性和模式分析。大數(shù)據(jù)和數(shù)據(jù)挖掘之間有什么關(guān)系?大數(shù)據(jù)是指無法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn);而數(shù)據(jù)挖掘則是從大數(shù)據(jù)海量信息資源中通過數(shù)據(jù)計(jì)算分析獲取有效信息的過程。因此,大數(shù)據(jù)可以看作是進(jìn)行數(shù)據(jù)挖掘的一個(gè)前提條件。大數(shù)據(jù)挖掘具有數(shù)據(jù)量大,結(jié)構(gòu)復(fù)雜,數(shù)據(jù)更新速度快等特征。由于互聯(lián)網(wǎng)發(fā)展速度加快,全球的數(shù)據(jù)量正在不斷膨脹,這給數(shù)據(jù)

3、挖掘的實(shí)施提出了挑戰(zhàn)。大數(shù)據(jù)挖掘的價(jià)值我們?cè)谡f大數(shù)據(jù)挖掘價(jià)值之前,先來看一個(gè)經(jīng)典案例,即尿布和啤酒的故事。說的是在一家超市把尿布和啤酒擺在一起出售。但是這個(gè)奇怪的舉措?yún)s使尿布和啤酒的銷量雙雙增加了。后來經(jīng)過分析才發(fā)現(xiàn)原來,美國的婦女們經(jīng)常會(huì)囑咐她們的丈夫下班以后要為孩子買尿布,而丈夫在買完尿布之后又要順手買回自己愛喝的啤酒,因此啤酒和尿布放在一起使得兩種商品的銷量都大大增加。之所以能發(fā)現(xiàn)尿布和啤酒的關(guān)系,則是因?yàn)閷?duì)超市一年多原始交易數(shù)字進(jìn)行詳細(xì)分析的結(jié)果。從這個(gè)案例中,我們已經(jīng)可以看出數(shù)據(jù)挖掘的重要性,通過對(duì)數(shù)據(jù)進(jìn)行挖掘分析,超市可以制定更加合適的銷售策略。除了超市營銷以外,大數(shù)據(jù)挖掘還能為政

4、府、企業(yè)等各級(jí)部門提供基于場(chǎng)景、以及關(guān)鍵字的海量信息過濾、提醒以及事件分析。從而使得政府,企業(yè)對(duì)于互聯(lián)網(wǎng)的輿情事件保持高度的敏捷性,針對(duì)性地提升內(nèi)容制作精準(zhǔn)性。大數(shù)據(jù)挖掘在媒體行業(yè)的應(yīng)用如今隨著傳統(tǒng)媒體和新媒體的融合進(jìn)程加快,信息傳遞的邊界正在消融,每個(gè)人都成了新的信息發(fā)聲口。因此,及時(shí)獲取用戶關(guān)注信息對(duì)于媒體宣傳來說顯得尤為重要。當(dāng)前,大數(shù)據(jù)挖掘已經(jīng)成為媒體應(yīng)對(duì)行業(yè)競(jìng)爭(zhēng),打破發(fā)展瓶頸的新工具。目前大數(shù)據(jù)挖掘在媒體領(lǐng)域主要應(yīng)用在以下這些場(chǎng)景中。一、用戶運(yùn)營通過對(duì)用戶觀看時(shí)間、觀看內(nèi)容、觀看習(xí)慣等數(shù)據(jù)進(jìn)行挖掘分析,電視臺(tái)以及網(wǎng)絡(luò)媒體能夠更加了解用戶群體,以及他們關(guān)注的內(nèi)容,然后進(jìn)行精準(zhǔn)的活動(dòng)廣告運(yùn)營。二、節(jié)目編排此外,通過大數(shù)據(jù)挖掘可以更加準(zhǔn)確的了解用戶需求,以便根據(jù)用戶需求,調(diào)整節(jié)目編排,開發(fā)新類型節(jié)目。三、信息收集大數(shù)據(jù)挖掘可以實(shí)現(xiàn)從冗繁的信息中過濾出有價(jià)值的內(nèi)容,進(jìn)而滿足受眾對(duì)信息的需求。其次在內(nèi)容生產(chǎn)中利用大數(shù)據(jù)進(jìn)行信息匯聚,從而使內(nèi)容生產(chǎn)具有多樣性。索貝云線索數(shù)據(jù)挖掘索貝媒體云基于大數(shù)據(jù)挖掘提供云線索服務(wù)。云線索在云端基于分布式云計(jì)算架構(gòu),實(shí)現(xiàn)多種數(shù)據(jù)匯聚與共享,包括網(wǎng)站內(nèi)容、微博、微信、 UGC、 PGC、新聞素材遠(yuǎn)程回傳,支持用戶訂閱,幫助用戶迅速找到關(guān)注的新聞熱點(diǎn),支持云端加工整理并一鍵報(bào)題到互聯(lián)網(wǎng)平臺(tái)和臺(tái)內(nèi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論