



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
大數(shù)據(jù)技術(shù)在出版領域的應用
隨著物聯(lián)網(wǎng)、云計算等技術(shù)的日新月異,信息技術(shù)的發(fā)展逐漸進入了一個新階段。規(guī)?;臄?shù)據(jù)以及對規(guī)?;瘮?shù)據(jù)的開發(fā)和利用,成為數(shù)字時代發(fā)展的一個新趨勢。英國著名學者維克托·邁爾·舍恩伯格在其《大數(shù)據(jù)時代》一書稱這樣一個時代為大數(shù)據(jù)時代。他認為,大數(shù)據(jù)時代的到來意味著一個新的技術(shù)革命浪潮的到來。圍繞大數(shù)據(jù),人類社會的生產(chǎn)和生活方式將發(fā)生新的變革。全球著名的戰(zhàn)略思想庫麥肯錫全球研究院在2011年發(fā)布的《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》報告中指出,數(shù)據(jù)將成為未來人類社會賴以生存的新的重要的戰(zhàn)略性生產(chǎn)資料,將是未來社會創(chuàng)新、競爭和生產(chǎn)力的下一個前沿。作為數(shù)字時代發(fā)展的新趨勢,大數(shù)據(jù)技術(shù)的應用無疑將對包括出版業(yè)在內(nèi)的社會方方面面產(chǎn)生重要的影響。那么,大數(shù)據(jù)技術(shù)的應用將會對出版業(yè)的發(fā)展,尤其是出版業(yè)的轉(zhuǎn)型升級產(chǎn)生什么樣的影響?這是出版界必須思考的重要問題。一、大數(shù)據(jù)技術(shù)的應用從字面意義上來看,大數(shù)據(jù)指規(guī)?;暮A繑?shù)據(jù)。實際上是指大小超出了典型數(shù)據(jù)庫軟件的采集、儲存、管理和分析能力的數(shù)據(jù)集。這樣一個數(shù)據(jù)集,數(shù)據(jù)量從TB級發(fā)展到PB級,不僅信息量大,且數(shù)據(jù)來源多樣化、數(shù)據(jù)類型多種化,同時這樣的數(shù)據(jù)集還具有數(shù)據(jù)增長速度快和數(shù)據(jù)處理速度要求高的特征,這就決定了大數(shù)據(jù)庫的建立,不是現(xiàn)有的數(shù)據(jù)庫軟件所能處理的,也不是現(xiàn)有的信息技術(shù)基礎設施所能承載的。大數(shù)據(jù)對傳統(tǒng)信息處理有這么高的要求,卻受到人們的推崇,根本原因在于它具有很強的商業(yè)價值,在未來可能形成變革時代的商業(yè)模式。一般認為,大數(shù)據(jù)特征可用4個“V”來概括。一是VolumeBig,即數(shù)據(jù)規(guī)模容量大,計算能力要求高,從TB到PB,甚而EB和ZB。如此海量的數(shù)據(jù)信息遠非現(xiàn)有信息基礎設施和IT架構(gòu)所能承擔。二是VariableType,即數(shù)據(jù)類型多樣,數(shù)據(jù)來源多種。既有結(jié)構(gòu)化數(shù)據(jù),又有半結(jié)構(gòu)化數(shù)據(jù),更有非結(jié)構(gòu)化數(shù)據(jù),且將以網(wǎng)頁、視頻、圖像與位置等形態(tài)的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為最主要的數(shù)據(jù)類型。三是VelocityFast,即數(shù)據(jù)處理實時速度要求快。大數(shù)據(jù)的數(shù)據(jù)流是高速實時數(shù)據(jù)流,換言之為動態(tài)數(shù)據(jù),因此對數(shù)據(jù)處理速度和持續(xù)性要求非常高。四是ValueHigh,即商業(yè)價值高。但大數(shù)據(jù)的商業(yè)價值高和價值密度低是相伴而存的,也就是獲取的具有高度價值的信息,是通過海量數(shù)據(jù)處理而來的,可謂“千淘萬漉真辛苦,狂沙吹盡才到金”。大數(shù)據(jù)技術(shù)的應用能夠形成一種商業(yè)模式的奧秘在于,大數(shù)據(jù)不僅是一種資源,更是一種工具。作為一種工具,利用大數(shù)據(jù)進行數(shù)據(jù)分析,可進行趨勢判斷,從而進行商業(yè)價值開發(fā)。如2009年,在甲型H1N1流感病毒爆發(fā)之前,美國谷歌公司的工程師在《自然》雜志發(fā)表了一篇令人矚目的論文。在該論文中,數(shù)據(jù)分析師分析了美國人最頻繁檢索的5000萬詞條,然后運用不同的數(shù)學模型,將其與美國疾控中心2003年至2008年季節(jié)性流感傳播期的數(shù)據(jù)進行了對比研究,最后得出的預測結(jié)果與官方數(shù)據(jù)的相關(guān)性高達97%。令人感到震驚的是,谷歌公司利用大數(shù)據(jù)分析,不僅能夠準確地預判流感的來源地,且預判的時間要領先于疾控中心數(shù)據(jù)分析一周之早。利用數(shù)據(jù)進行分析,從而進行產(chǎn)品開發(fā)無疑具有巨大的商業(yè)空間??傮w來看,大數(shù)據(jù)技術(shù)利用的商業(yè)模式,主要是大數(shù)據(jù)分析所開發(fā)的新的產(chǎn)品。這些產(chǎn)品,或可優(yōu)化企業(yè)管理,或可提升企業(yè)服務能力,或可提升企業(yè)產(chǎn)品的價值,甚至形成新的信息產(chǎn)品。大數(shù)據(jù)技術(shù)的運用是基于海量數(shù)據(jù)的獲取。數(shù)據(jù)的獲取能力,是決定大數(shù)據(jù)分析和開發(fā)的關(guān)鍵。大數(shù)據(jù)技術(shù)運營的過程中,其數(shù)據(jù)主要來源是什么呢?一般認為,這種來源主要包括3個方面。一是企業(yè)內(nèi)部的經(jīng)營交易信息,二是物聯(lián)網(wǎng)世界中商品和物流信息,三是互聯(lián)網(wǎng)世界中人與人交互信息和位置信息。這3大數(shù)據(jù)信息的海量集聚,才是大數(shù)據(jù)產(chǎn)業(yè)化和價值化的關(guān)鍵。從流程來看,大數(shù)據(jù)的運營模式應由這樣一些環(huán)節(jié)構(gòu)成:首先是數(shù)據(jù)獲取,其次是數(shù)據(jù)分析,最后是數(shù)據(jù)產(chǎn)業(yè)化。二、大數(shù)據(jù)技術(shù)應用帶來的挑戰(zhàn)大數(shù)據(jù)標志著數(shù)字時代發(fā)展的新趨勢。出版業(yè)作為文化產(chǎn)業(yè)的核心組成部分,正在經(jīng)歷著數(shù)字轉(zhuǎn)型的艱難挑戰(zhàn),無疑也受到大數(shù)據(jù)技術(shù)應用的深刻影響。這種影響具體到出版業(yè)本身,主要表現(xiàn)在以下幾個方面。1.大數(shù)據(jù)時代出版管理的新趨勢大數(shù)據(jù)不僅是一種工具,更是一種哲學觀和方法論。這種哲學觀就是人類社會的發(fā)展已進入以數(shù)據(jù)資源為基礎的階段,數(shù)據(jù)思維將是人類發(fā)展的一個主要思維方式。正如《大數(shù)據(jù)時代的歷史機遇》一書所說:“缺少數(shù)據(jù)資源,無以談產(chǎn)業(yè)。缺少數(shù)據(jù)思維,無以言未來。”在大數(shù)據(jù)時代,數(shù)據(jù)成為一種與能源和物質(zhì)同等重要的生產(chǎn)資料,圍繞數(shù)據(jù)進行產(chǎn)品開發(fā)和服務升級,將成為未來信息產(chǎn)業(yè)競爭的新趨勢。這就要求包括出版業(yè)在內(nèi)的各種社會企業(yè)都要有數(shù)據(jù)思維,要認識到數(shù)據(jù)的價值,以開放和創(chuàng)新視野來謀劃數(shù)據(jù)和開發(fā)數(shù)據(jù)。具體到出版業(yè)本身,首先意味著出版管理將發(fā)生前所未有的變革。換言之,出版管理將步入一個以數(shù)據(jù)為中心的階段。如出版企業(yè)的很多生產(chǎn)經(jīng)營行為將形成一個數(shù)據(jù)庫,這個數(shù)據(jù)庫通過一定的管理軟件,可將企業(yè)內(nèi)部所有部門和所有員工的業(yè)務行為記錄在案,并形成數(shù)據(jù)庫。在這個軟件平臺上,企業(yè)外部讀者通過網(wǎng)絡或手機應用平臺進入企業(yè)的大量行為也將形成一個數(shù)據(jù)庫。與此同時,出版企業(yè)所擁有的原創(chuàng)圖書內(nèi)容本身就是一個具有無限價值的數(shù)據(jù)資產(chǎn)。這無疑對傳統(tǒng)出版管理提出了很大挑戰(zhàn),要求其管理觀念和管理系統(tǒng)全面創(chuàng)新和升級。2.大數(shù)據(jù)時代為出版綜合分析提供了重要數(shù)據(jù)參考大數(shù)據(jù)時代的到來,為出版選題策劃水平的提升提供了新的可能。大數(shù)據(jù)的本質(zhì)就是通過對數(shù)據(jù)證析,進行數(shù)據(jù)研判,從而優(yōu)化產(chǎn)品、提升質(zhì)量。對于出版業(yè)而言,通過對讀者閱讀偏好等數(shù)據(jù)的分析,可更精準地進行選題策劃,從而提高選題質(zhì)量。如利用大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù),對受眾瀏覽過的網(wǎng)頁內(nèi)容進行分析,可很容易地判斷幾億受眾閱讀信息的特征,從而在此基礎上判斷受眾到底喜歡什么。眾所周知,傳統(tǒng)的出版受眾調(diào)查,都是基于抽樣調(diào)查展開的,而在大數(shù)據(jù)時代則不同,巨量數(shù)據(jù)為事物發(fā)展趨勢的研判帶來了可能。人們在大數(shù)據(jù)時代,更熱衷于尋找事物的相關(guān)關(guān)系,而不是因果關(guān)系。也即通過大數(shù)據(jù)來判斷市場受眾的閱讀需求和閱讀品味,將變得更加精確。如對亞馬遜網(wǎng)站受眾在網(wǎng)站上的查詢行為進行分析,就可發(fā)現(xiàn)讀者的閱讀需求偏好。在這方面,西方一些出版機構(gòu)有一些做法很值得借鑒。如MSN網(wǎng)站2011年上線的msnNow數(shù)字出版企業(yè),在對Twitter、Facebook、Bing和BreakingN等網(wǎng)站數(shù)據(jù)內(nèi)容分析的基礎上,以分為單位識別熱門話題,然后在此基礎上組織編輯團隊策劃撰寫了100字左右的話題故事,在當時就很受受眾青睞。再如美國的Netflix公司,此前主要從事影片租賃服務,近兩年卻在數(shù)字內(nèi)容數(shù)據(jù)分析服務上嶄露頭角,成為數(shù)字內(nèi)容選題輔助分析的數(shù)據(jù)供應商,很受市場歡迎。該公司利用大數(shù)據(jù)分析對海量用戶信息了如指掌,不僅僅限于哪位受眾喜歡什么方面的數(shù)字內(nèi)容,而是精確到受眾的具體行為:哪些受眾喜歡在周末晚上用平板電腦看喜劇影視或閱讀武俠小說?哪位受眾會進入視頻就直接跳過片頭片尾?看到哪個演員出場會跳過不看?或看到哪個形象角色會略過不看?看到哪段劇情會重放或重新閱讀?這些較為精確的受眾閱讀偏好和閱讀行為的分析,無疑為出版選題策劃提供了重要數(shù)據(jù)參考。利用大數(shù)據(jù)分析來輔助出版選題策劃,無疑是未來出版策劃不可或缺的重要方向。3.數(shù)據(jù)平臺精準化投放當前,大數(shù)據(jù)的市場應用還主要集中在廣告市場的投放上,促使數(shù)字廣告從面向群體的推廣,升級為面向個體的精準化和個性化的推廣轉(zhuǎn)變。這方面,大數(shù)據(jù)運營平臺能夠通過大數(shù)據(jù)平臺準確分析受眾的行為,從而在此基礎上精準化和個性化地投放廣告,如弄清廣告投放的時間、地點、內(nèi)容和對象。這樣的精準化投放怎么實現(xiàn)呢?這里有一些思路可供參考。比如大城市的書店超市每天都有成千上萬的讀者逗留體驗,可通過手機應用確定讀者的地域范圍,找出近期在書店逗留時間較長的人員,然后在此基礎上,除去書店每天上班的工作人員,剩下的人就是潛在讀者。大數(shù)據(jù)鎖定的這些目標,無疑對精準化圖書營銷具有重要意義。此外,利用搜索引擎對受眾網(wǎng)絡行為的數(shù)據(jù)分析,同樣可給圖書營銷提供很好的信息。三、大數(shù)據(jù)時代出版轉(zhuǎn)型升級的路徑大數(shù)據(jù)技術(shù)已成為推動出版轉(zhuǎn)型升級的重要工具。出版業(yè)要充分認識大數(shù)據(jù)技術(shù)應用對出版發(fā)展的深刻影響,采取積極措施發(fā)展大數(shù)據(jù)技術(shù),開發(fā)數(shù)據(jù)價值,從而更好地推動出版轉(zhuǎn)型升級。具體來講,有以下幾個方面。1.內(nèi)部數(shù)據(jù)庫的開發(fā)大數(shù)據(jù)技術(shù)應用的前提,是擁有海量的數(shù)據(jù)獲取能力。一是內(nèi)部數(shù)據(jù)庫建設,二是外部數(shù)據(jù)庫發(fā)展。內(nèi)部數(shù)據(jù)庫就是通過對傳統(tǒng)出版內(nèi)容資源的數(shù)據(jù)化轉(zhuǎn)換和內(nèi)部管理資源的數(shù)據(jù)化處理,形成一個大的開放的數(shù)據(jù)網(wǎng)絡。外部數(shù)據(jù)庫發(fā)展,是數(shù)據(jù)資源的必要補充,一方面可通過出版企業(yè)的網(wǎng)絡平臺獲取用戶行為數(shù)據(jù),另一方面可通過合作、購買、交換等方式來從其他數(shù)據(jù)供應商獲取數(shù)據(jù)資源。2.提高出版企業(yè)大數(shù)據(jù)應用能力對于傳統(tǒng)出版業(yè)來講,網(wǎng)絡和信息技術(shù)的應用是短板。但大數(shù)據(jù)商業(yè)價值的開發(fā),又離不開數(shù)據(jù)技術(shù)應用。因此,出版企業(yè)要想在大數(shù)據(jù)時代勇立潮頭,就須在大數(shù)據(jù)技術(shù)應用上提高運用能力和水平。一方面要推動傳統(tǒng)數(shù)據(jù)獲取和應用能力的發(fā)展,一方面要推進新型的包含統(tǒng)計分析、信息智能和語言處理等綜合性數(shù)據(jù)挖掘技術(shù)能力的提升。只有通過數(shù)據(jù)技術(shù)應用能力的提升,推動數(shù)據(jù)應用廣度、深度和厚度上的提高,出版業(yè)的大數(shù)據(jù)商業(yè)價值開發(fā)才能做到最優(yōu)。3.開發(fā)出版業(yè)務對于出版業(yè)而言,大數(shù)據(jù)技術(shù)應用既是挑戰(zhàn),更是機遇。通過大數(shù)據(jù)技術(shù)的應用,深入推進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工產(chǎn)品批發(fā)商銷售技能提升考核試卷
- 儀器制造中的質(zhì)量控制與檢測技術(shù)考核試卷
- 機器人情感識別與表達考核試卷
- 高級審計培訓課件
- 批發(fā)市場魚品安全監(jiān)管考核試卷
- 批發(fā)市場的小批量訂單處理考核試卷
- 飼料店轉(zhuǎn)讓合同范本
- 教學加盟合同范本
- 材料合同范本簡易圖表
- 食品運輸儲藏合同范本
- 內(nèi)科學講義(唐子益版)
- GB/T 19845-2005機械振動船舶設備和機械部件的振動試驗要求
- GB 9706.14-1997醫(yī)用電氣設備第2部分:X射線設備附屬設備安全專用要求
- 測繪安全生產(chǎn)專題培訓課件
- 心肺復蘇簡易呼吸器使用除顫儀使用
- 油缸裝配作業(yè)指導書
- 2022年濟南工程職業(yè)技術(shù)學院單招綜合素質(zhì)考試筆試試題及答案解析
- 初中數(shù)學競賽試題匯編
- GB∕Z 27735-2022 野營帳篷
- 高分子材料研究方法 X 射線法
- 【課件】第二單元第三節(jié)漢族民歌課件-2021-2022學年高中音樂人音版(2019)必修音樂鑒賞
評論
0/150
提交評論