大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文_第1頁
大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文_第2頁
大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文_第3頁
大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文_第4頁
大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、大數(shù)據(jù)時代中小旅游網(wǎng)站的發(fā)展趨勢分析論文摘 要:隨著大數(shù)據(jù)(big data)時代中小旅游的到來,網(wǎng)絡(luò)信息行業(yè)和旅游行業(yè)兩大“朝陽產(chǎn)業(yè)”相互滲透,共同發(fā)展。旅游企業(yè)的營銷方式也隨之發(fā)生了翻天覆地的變化,網(wǎng)絡(luò)營銷已成為旅游企業(yè)營銷方式的重要發(fā)展趨勢。有關(guān)數(shù)據(jù)顯示旅游企業(yè)網(wǎng)絡(luò)營銷銷售額占網(wǎng)絡(luò)營銷銷售總額的24%以上,并連續(xù)五年以上以超過35%的速度增長。這對旅游企業(yè)來說既是機遇也是挑戰(zhàn)。旅游企業(yè)應(yīng)積極探索和研究創(chuàng)新發(fā)展旅游業(yè)網(wǎng)絡(luò)營銷的有效措施,盡可能滿足更多旅游客戶的多樣性需求,爭取更加廣闊的市場空間和經(jīng)濟效益最大化。 大數(shù)據(jù)時代帶來的變革已在商界初露端倪,媒體行業(yè)亦敏銳地察覺到大數(shù)據(jù)將帶來巨大的

2、變革,因此各媒體通過平臺合作的方式擴大對資源的利用、增強對數(shù)據(jù)的分析能力。但無論紙質(zhì)媒體、電視媒體、網(wǎng)絡(luò)媒體或社交媒體,對大數(shù)據(jù)的使用尚處于摸索階段。媒體在大數(shù)據(jù)時代的變革首先體現(xiàn)在新聞時效性方面,在下一階段,媒體應(yīng)充分借助大數(shù)據(jù)的預(yù)測功能進(jìn)行預(yù)測性新聞報道;變革之二應(yīng)體現(xiàn)在新聞采編方式上,媒體可利用“記者錄入語音數(shù)據(jù)和大數(shù)據(jù)后臺同步提取、分析、編寫新聞以及報紙等”的方式進(jìn)行新聞編寫工作;變革之三應(yīng)體現(xiàn)在擴大數(shù)據(jù)庫規(guī)模上,媒體可借助媒介社區(qū)平臺擴大現(xiàn)有數(shù)據(jù)庫。此外,大數(shù)據(jù)時代媒體可通過媒介融合方式挖掘信息的二次價值。關(guān)鍵詞:大數(shù)據(jù)、發(fā)展現(xiàn)狀、預(yù)測性報道、媒介社區(qū)、媒介融合 引言:在大

3、數(shù)據(jù)時代,數(shù)據(jù)分析、數(shù)據(jù)挖掘工作面臨著機遇與挑戰(zhàn),本文從數(shù)據(jù)分析的角度,結(jié)合國內(nèi)外相關(guān)研究,試圖回答大數(shù)據(jù)是什么,如何應(yīng)對大數(shù)據(jù)的問題。 正文:近年來,業(yè)界、學(xué)術(shù)界興起了大數(shù)據(jù)討論,一夜間大數(shù)據(jù)時代到來了。大數(shù)據(jù)給學(xué)術(shù)界帶來了新的思潮,大數(shù)據(jù)正在顛覆著很多傳統(tǒng)行業(yè)的模式,帶來變革。有人預(yù)測,大數(shù)據(jù)必將成為商業(yè)、政府、科研、教育、醫(yī)療等各行業(yè)面臨的一個挑戰(zhàn)。在大數(shù)據(jù)時代,數(shù)據(jù)分析、數(shù)據(jù)挖掘工作面臨著機遇與挑戰(zhàn),本文從數(shù)據(jù)分析的角度,結(jié)合國內(nèi)外相關(guān)研究,試圖回答大數(shù)據(jù)的產(chǎn)生于發(fā)展、大數(shù)據(jù)是什么、如何應(yīng)對大數(shù)據(jù)的問題。 一、大數(shù)據(jù)的產(chǎn)生與發(fā)展  早在1980年,著名未來

4、學(xué)家阿爾文托夫勒便在第三次浪潮一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。 隨著移動通訊技術(shù)、云計算、互聯(lián)網(wǎng)等技術(shù)的發(fā)展,數(shù)據(jù)的積累已經(jīng)達(dá)到前所未有的地步。大數(shù)據(jù)的發(fā)展基于以云計算為代表的存儲量的基礎(chǔ)之上,計算機存儲單位已從G、T發(fā)展到P (1P=1024T)。可以說,沒有云計算的迅速發(fā)展,不會有大數(shù)據(jù)時代的到來。業(yè)界通常將大數(shù)據(jù)的特點歸納為四個“V”,即多樣性(Variety)、體量(Volume)、速度(Velocity)和價值(Value)。IBM網(wǎng)站關(guān)于大數(shù)據(jù)四個特點的界定中,則用真實性(Veracit

5、y)替代了“價值”。 大數(shù)據(jù)的出現(xiàn)首先對商業(yè)產(chǎn)生了重大影響,觸感敏銳的商家逐漸舍棄被動的銷售模式,轉(zhuǎn)而通過分析客戶以往的消費習(xí)慣,主動為其推薦“可能需要的產(chǎn)品”,如卓越、當(dāng)當(dāng)?shù)染W(wǎng)站會推薦“可能感興趣的書”,在“淘寶”網(wǎng)站上進(jìn)行購物時會出現(xiàn)“瀏覽過此寶貝的人還瀏覽過”等信息。我們不難發(fā)現(xiàn),商界已經(jīng)優(yōu)先于其他領(lǐng)域,牢牢抓住大數(shù)據(jù)的契機,通過對客戶消費習(xí)慣的分析,總結(jié)出客戶選擇的偏好,從而制定個性化的推薦服務(wù)。 二、認(rèn)識大數(shù)據(jù)  (1)大數(shù)據(jù)的宗旨:經(jīng)過分析的數(shù)據(jù)才有價值  大數(shù)據(jù)要發(fā)揮作用必須經(jīng)過分析,這是由大數(shù)據(jù)的4V特性(數(shù)據(jù)量大、數(shù)據(jù)類型多、要求處理速

6、度快、低密度)決定的。也就是說,數(shù)據(jù)都是高維、低密度的,從單個數(shù)據(jù)中難以看出規(guī)律。因此,必須經(jīng)過分析,針對高維進(jìn)行降維,提煉大量低密度信息中的價值,才能發(fā)揮作用。否則,大數(shù)據(jù)背景下,反而更容易使得“活”信息混跡在大量“死”數(shù)據(jù)中被淹沒。面向大數(shù)據(jù)的分析要“簡單、迅速、規(guī)?;薄?#160;(2)大數(shù)據(jù)的目標(biāo):實現(xiàn)基于數(shù)據(jù)的決策與資源配置 大數(shù)據(jù)最終要實現(xiàn)科學(xué)決策,基于信息對稱的有效資源配置。隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,可利用數(shù)據(jù)來源從線下封閉的數(shù)據(jù)庫、數(shù)據(jù)倉庫擴展到開放性的O2O(Online To Offline)融合數(shù)據(jù),可分析數(shù)據(jù)結(jié)構(gòu)從原來以數(shù)值為主的結(jié)構(gòu)化數(shù)據(jù)發(fā)展到涵蓋文本、視

7、頻、音頻等多媒體數(shù)據(jù)。從而,大數(shù)據(jù)將逐步改變我們的決策目標(biāo)和社會資源配置方式。基于數(shù)據(jù)的科學(xué)決策是一貫追求的目標(biāo)。然而,信息不對稱是常態(tài),因此傳統(tǒng)決策目標(biāo)是建立相對滿意而非最優(yōu)(決策科學(xué)家Simon提出),資源配置效率基于市場優(yōu)于基于計劃。大數(shù)據(jù)背景下,迅速獲取分析更多輔助決策信息成為可能,因此決策目標(biāo)可實現(xiàn)向最優(yōu)的無限逼近,實現(xiàn)基于數(shù)據(jù)的“計劃”資源配置將更有效率。 (3)大數(shù)據(jù)的角度:個性化服務(wù)+中觀指數(shù)+宏觀連結(jié) 目前發(fā)展大數(shù)據(jù),主要有基于數(shù)據(jù)為客戶提供個性化營銷服務(wù)、預(yù)測中觀行業(yè)或區(qū)域趨勢指數(shù)、基于連結(jié)的宏觀資源配置方案等角度。這不僅僅體現(xiàn)在阿里小微融資的個性化風(fēng)控

8、決策、高端品牌在線特賣品牌和定價動態(tài)決策(基于阿里巴巴網(wǎng)商活躍度指數(shù)和零售商品價格指數(shù))、Discern group企業(yè)發(fā)展戰(zhàn)略咨詢報告上,還體現(xiàn)在阿里巴巴商務(wù)智能指數(shù)(預(yù)測經(jīng)濟發(fā)展態(tài)勢)和基于公共氣象數(shù)據(jù)的各行業(yè)資源配置優(yōu)化服務(wù)上。 互聯(lián)網(wǎng)金融是大數(shù)據(jù)發(fā)展各角度的前沿陣地。在金融領(lǐng)域,要實現(xiàn)從金融互聯(lián)網(wǎng)向互聯(lián)網(wǎng)金融的快速轉(zhuǎn)型。傳統(tǒng)模式下的金融企業(yè)開展網(wǎng)上業(yè)務(wù),如:網(wǎng)上銀行、網(wǎng)上理財,并不是真正的互聯(lián)網(wǎng)金融?;ヂ?lián)網(wǎng)金融是指通過互聯(lián)網(wǎng)新技術(shù)為客戶實現(xiàn)搜索或風(fēng)控等服務(wù)增值,比較有代表性的是,消除供求雙方結(jié)構(gòu)不對稱的P2P貸款,提高存取效率的保值理財產(chǎn)品余額寶。 (4)大數(shù)據(jù)的關(guān)

9、鍵點:保證數(shù)據(jù)質(zhì)量 要發(fā)展大數(shù)據(jù)分析,首先要保證數(shù)據(jù)質(zhì)量。錯誤的輸入必然導(dǎo)致錯誤的輸出。沒有數(shù)據(jù)質(zhì)量,一切都是浮云。數(shù)據(jù)質(zhì)量沒有保證,是不敢用的。數(shù)據(jù)質(zhì)量是一項耗時、費力的基礎(chǔ)工作。 保證數(shù)據(jù)質(zhì)量要求數(shù)據(jù)采集與清洗過程中秉持兩大原則:相關(guān)性和低噪聲。第一,大數(shù)據(jù),數(shù)據(jù)并非越“大”越好,而是相關(guān)數(shù)據(jù)越“大”越好。特別是,在數(shù)據(jù)采集中,要以采集盡可能多的“相關(guān)”數(shù)據(jù)為目標(biāo),而非不加篩選越多越好。第二,大數(shù)據(jù),首先數(shù)據(jù)獲取時要保證不存在誘導(dǎo)傾向的干擾因素,同時進(jìn)行去噪處理。 保證數(shù)據(jù)質(zhì)量要建立數(shù)據(jù)的數(shù)據(jù)。針對數(shù)據(jù)質(zhì)量建立數(shù)據(jù)標(biāo)簽,才有進(jìn)步。有了對數(shù)據(jù)質(zhì)量的數(shù)據(jù),數(shù)據(jù)才能

10、被決策者更為安全科學(xué)有效地使用。 (5)大數(shù)據(jù)競爭的核心:分析人才的競爭 大數(shù)據(jù)時代,作為一種資源,數(shù)據(jù)不再是稀缺資源?;ヂ?lián)網(wǎng)、門戶網(wǎng)站、社交網(wǎng)站、微博、微信等新媒體積累了大量數(shù)據(jù),缺乏的是對這些數(shù)據(jù)的分析人員。缺乏專業(yè)的分析人才,即使守著數(shù)據(jù)的“金山”,也只能望“山”興嘆。因此,美國Turbo Financial Group采用最新的大數(shù)據(jù)分析技術(shù)聚焦被FICO遺忘的15%人群建模,阿里提出建立大數(shù)據(jù)分析的開放式平臺,希望能夠集結(jié)更多專家智慧,同時培養(yǎng)阿里分析人才,挖掘阿里數(shù)據(jù)“金礦”。 三、把握大數(shù)據(jù) 大數(shù)據(jù)對社會生活帶來方方面面的影響,我們?nèi)绾伟盐?/p>

11、大數(shù)據(jù)時代的機遇,需要慎重對待大數(shù)據(jù)帶來的挑戰(zhàn)。總結(jié)起來,主要有三個方面: (一)大數(shù)據(jù)時代,數(shù)據(jù)整理和清洗工作 (1)數(shù)據(jù)整理和清洗工作是數(shù)據(jù)分析的基礎(chǔ)。大數(shù)據(jù)專家根據(jù)經(jīng)驗,普遍認(rèn)為該工作是一項基礎(chǔ)性工作,耗時多且簡單,占到數(shù)據(jù)分析工作量的60%以上,是數(shù)據(jù)分析前提和基礎(chǔ)。在此基上,數(shù)據(jù)分析工作需要對數(shù)據(jù)進(jìn)行標(biāo)識,進(jìn)行深度分析,撰寫專題報告,確保結(jié)果可以執(zhí)行,最終落實到?jīng)Q策和實施。 (2)大數(shù)據(jù)時代,需要充分借助IT技術(shù)管理數(shù)據(jù)質(zhì)量工作。在大數(shù)據(jù)時代,人工逐筆發(fā)現(xiàn)、解決數(shù)據(jù)質(zhì)量問題的方式成本高、效率低,不可持續(xù)。要盡量規(guī)范化、系統(tǒng)化、自動化管理數(shù)據(jù)質(zhì)量工作,將節(jié)

12、省下的人力資源投入到新問題的研究中。 (二)大數(shù)據(jù)時代,數(shù)據(jù)分析的特點 (1)采用倒金字塔模式分配“思考、工作、分享”的時間比重。數(shù)據(jù)分析工作包括三部分:“思考”,分析實際問題,將實際問題轉(zhuǎn)化成數(shù)學(xué)模型,提出解決方案的過程;“工作”,將解決方案程序化,得出結(jié)果的過程;“分享”,將分析的結(jié)果,轉(zhuǎn)化為決策,付諸實施的過程。在時間分配上,金字塔結(jié)構(gòu)或柱形結(jié)構(gòu)的分布形式不是最佳結(jié)構(gòu),倒金字塔結(jié)構(gòu)比較合理。即,思考的過程花得時間長些,可以減少后期工作量,少走彎路。 (2)通過數(shù)據(jù)分析進(jìn)行科學(xué)決策。很多人存在誤區(qū),認(rèn)為數(shù)據(jù)分析就是做報表、寫報告。在大數(shù)據(jù)時代,數(shù)據(jù)分析不僅僅停

13、留在此,需要進(jìn)行深度分析,建立數(shù)據(jù)化決策的流程。要尊重數(shù)據(jù)、認(rèn)識數(shù)據(jù),但不迷信數(shù)據(jù)。在尊重數(shù)據(jù)、尊重事實的前提下,減少主觀因素的干擾,快速做出數(shù)據(jù)化決策,這是一種能力。 (3)大數(shù)據(jù)時代,數(shù)據(jù)分析的要義是簡單、迅速、規(guī)?;?。數(shù)據(jù)分析的結(jié)果要簡潔、易懂;數(shù)據(jù)分析的時間要短,盡可能的自動化地出結(jié)果,要快速的滿足客戶的需求;數(shù)據(jù)分析的方法能夠?qū)崿F(xiàn)大批量規(guī)?;?yōu)秀的數(shù)據(jù)分析師應(yīng)具有全局的預(yù)見性,一有問題可以馬上把該問題打成很碎、很多的問題,甚至把一個問題克隆出很多問題,從而與業(yè)務(wù)人員建立信任,降低工作量。  (4)從“死”信息中,分離出“活”的信息。大數(shù)據(jù)有數(shù)據(jù)量大的問題產(chǎn)生大量

14、的“死”數(shù)據(jù)。錯誤數(shù)據(jù)是指數(shù)據(jù)與實際情況不一致,異常數(shù)據(jù)是指數(shù)據(jù)正確但數(shù)據(jù)遠(yuǎn)離群體的大多數(shù),這類數(shù)據(jù)情況的處理手段比較成熟。而大數(shù)據(jù)時代,大量數(shù)據(jù)是不活躍主體,即“死”數(shù)據(jù)。因此,需要從高維低密度數(shù)據(jù)中,提取“活”的信息,發(fā)現(xiàn)規(guī)律。防止由于“死”信息的存在,導(dǎo)致分析結(jié)果不能正確反映“活”的群體特征。 (三)大數(shù)據(jù)時代,數(shù)據(jù)分析師的培養(yǎng)  (1)培養(yǎng)核心技術(shù)人才,確保長期競爭力。美國在建立全國醫(yī)療系統(tǒng)時,將系統(tǒng)外包給了加拿大的一家公司,系統(tǒng)運行的第一天就出現(xiàn)了崩潰。美國政府為此對該模式進(jìn)行了反思,概括起來有三點: 外包公司設(shè)計時只顧滿足甲方的眼前利益,不會為甲方的長遠(yuǎn)利益考慮

15、;項目外包造成美國技術(shù)骨干人員斷層,導(dǎo)致出現(xiàn)問題后自身無法解決;采用該模式導(dǎo)致美國沒有了核心技術(shù)。 因此,在采用項目外包模式的同時,需要掌握其核心技術(shù)。在大數(shù)據(jù)時代,從數(shù)據(jù)分析、信息管理、IT技術(shù)三個方面保持核心競爭力。需要培養(yǎng)和保持業(yè)務(wù)、產(chǎn)品設(shè)計、數(shù)據(jù)分析、數(shù)據(jù)架構(gòu)等方面的骨干隊伍。 (2)建立專業(yè)化的大數(shù)據(jù)分析團(tuán)隊。大數(shù)據(jù)分析的核心是數(shù)學(xué)建模,基礎(chǔ)是實際業(yè)務(wù),結(jié)果是自動化程序。在實際工作中需要正確、合理的使用數(shù)學(xué)建模的思維,構(gòu)建以數(shù)學(xué)模型做為基礎(chǔ)的數(shù)據(jù)分析,建立量化管理風(fēng)險的理念。深刻認(rèn)識并正確駕馭大數(shù)據(jù)分析,大數(shù)據(jù)分析的方法是處于不斷發(fā)展過程中的,需要根據(jù)實際問題,結(jié)

16、合實際數(shù)據(jù),靈活構(gòu)建模型。 三、媒體大數(shù)據(jù)發(fā)展現(xiàn)狀 隨著商界充分挖掘大數(shù)據(jù)潛藏的巨大價值,傳統(tǒng)媒體、網(wǎng)絡(luò)媒體、社交媒體等也逐漸意識到大數(shù)據(jù)可能帶來的巨大變革,開始摸索著向大數(shù)據(jù)時代前進(jìn)。 紙質(zhì)媒體依靠紙質(zhì)平臺很難用客觀的數(shù)據(jù)對新聞報道的好壞進(jìn)行分析(好壞是指單篇報道的受歡迎程度),因此目前其主要借助網(wǎng)絡(luò)媒體、社交媒體的平臺,通過分析這些平臺上所轉(zhuǎn)載新聞的點擊率、轉(zhuǎn)發(fā)率等數(shù)據(jù)進(jìn)行分析。據(jù)中國微博元年市場白皮書的統(tǒng)計數(shù)據(jù)顯示,截止2010年8月,全國共有466家主流新聞機構(gòu)開通了“新浪微博”,其中包括118家報紙、243家雜志、36家電視臺和69家電臺3。借助“微博”

17、平臺,編輯可以根據(jù)“微博”評論量和轉(zhuǎn)發(fā)率來判斷一條新聞的好壞,適當(dāng)調(diào)整新聞采編的方向。解放日報報業(yè)集團(tuán)社長尹明華曾說:“一篇稿子好不好,不能光憑主觀判斷,而是要有數(shù)據(jù)分析。這些數(shù)據(jù)可能有一部分來自內(nèi)部專業(yè)人士,更多的則來自社會。4” 此外,紙質(zhì)媒體也通過與網(wǎng)絡(luò)媒體聯(lián)手的方式擁抱數(shù)據(jù)時代。2012年7月,解放日報報業(yè)集團(tuán)和深圳騰訊公司聯(lián)手打造了“大申網(wǎng)”,上海網(wǎng)絡(luò)用戶只要登錄QQ,就會獲得最即時的定向推介。此次合作對解放集團(tuán)有兩大益處,其一,借用騰訊網(wǎng)平臺可以實現(xiàn)新聞的實時報道,彌補了紙質(zhì)媒體在時效性方面的天然缺陷;其二,騰訊網(wǎng)可以通過分析用戶瀏覽新聞的習(xí)慣,定向推介特定的新聞,增強了

18、新聞報道的影響力。 其次,有少量傳媒集團(tuán)著手與專業(yè)調(diào)查機構(gòu)合作,深入開發(fā)大數(shù)據(jù)的潛在功能。如浙江報業(yè)集團(tuán)去年開始投資數(shù)據(jù)分析項目,將目光放在了未來社交網(wǎng)絡(luò)數(shù)據(jù)的深度挖掘上1;2012年2月,佛山傳媒集團(tuán)與尼爾森公司合作,佛山傳媒集團(tuán)希望借助尼爾森大數(shù)據(jù)分析的平臺,通過對數(shù)據(jù)的整合、分析、管理,為他們的轉(zhuǎn)型發(fā)展提供戰(zhàn)略性的策略依據(jù)5。 在大數(shù)據(jù)時代的發(fā)展背景下,電視媒體主要通過依靠數(shù)字技術(shù)收集受眾信息以及與網(wǎng)站合作的方式參與其中。目前,數(shù)字電視收視率可以通過數(shù)字機頂盒實時記錄電視家庭戶的頻道及廣告收視、電視互動服務(wù)使用的情況,從而形成了實時的海量數(shù)據(jù)流,通過回傳通道傳給位于前

19、端的匯總服務(wù)器。 走在大數(shù)據(jù)前列的大型網(wǎng)站,已經(jīng)意識到大數(shù)據(jù)時代的核心在于海量數(shù)據(jù)及其存儲分析能力,正在這兩方面尋求突破。如優(yōu)酷土豆股份有限公司的搜索平臺擬挖掘和推算出4億多視頻用戶的瀏覽行為數(shù)據(jù);搜狐網(wǎng)站正著手搭建基于云計算的大數(shù)據(jù)平臺,將旗下數(shù)據(jù)資產(chǎn)全面打通整合,獲取每月9億多人次的用戶數(shù)據(jù)資產(chǎn)。 可以說,無論傳統(tǒng)媒體還是新媒體,都已經(jīng)意識到大數(shù)據(jù)將帶來的巨大變革,但是大數(shù)據(jù)究竟會對其產(chǎn)生什么樣的影響、帶來哪些變革,尚處于摸索階段。 四、大數(shù)據(jù)可推動媒體預(yù)測性報道的興起 大數(shù)據(jù)究竟會給媒體帶來什么變革?筆者認(rèn)為,第一個方面體現(xiàn)在對傳統(tǒng)新聞時效性定義的

20、顛覆上。 目前我國學(xué)界較認(rèn)同的新聞的定義為:新近發(fā)生的事實的報道6。但在大數(shù)據(jù)時代的背景下,新聞報道如果僅僅滿足于“對新近事實的報道”是遠(yuǎn)遠(yuǎn)不夠的。大數(shù)據(jù)的核心就是預(yù)測7。為了牢牢把握住受眾的眼球,媒體有必要借助新的大數(shù)據(jù)技術(shù)、憑借自身龐大的數(shù)據(jù)庫資源,做到一些高準(zhǔn)確率的、預(yù)測性的報道。 事實上,在美國已經(jīng)出現(xiàn)利用計算機分析撰寫報道的先例。Narrative是一家擁有大約30名員工的美國公司,它運用Narrative Science算法,大約每30秒就能夠撰寫出一篇新聞報道。2011年該軟件通過收集相關(guān)信息寫出了大約40萬則關(guān)于少年棒球聯(lián)盟的新聞報道。2012年這一數(shù)字預(yù)計

21、將達(dá)到150萬2。 但是由于社會環(huán)境的復(fù)雜性,以及計算機本身計算能力的限制,這種預(yù)測性新聞并不適合所有的領(lǐng)域。計算機相對人腦而言不夠靈活,需要人工對其進(jìn)行重復(fù)訓(xùn)練才可以達(dá)到自行分析、編寫新聞的目的,具體而言就是要提供給計算機很多不同的新聞數(shù)據(jù),然后根據(jù)一定的準(zhǔn)則將這些數(shù)據(jù)分割,通過固定的計算機算法,計算機會學(xué)習(xí)到一定的概率信息,以后碰到相似問題,計算機就可以按照之前給出的新聞模板生產(chǎn)新聞。但通過這種方式制作的新聞會顯得過于千篇一律。并且,由于計算機需要在一遍遍重復(fù)訓(xùn)練后才可以變得準(zhǔn)確度更高,因此,對于數(shù)據(jù)量過小的新聞領(lǐng)域而言,其錯誤率顯得過高,目前只在體育新聞及金融新聞可行性較大。&

22、#160;因此,在新聞報道中,僅僅將大數(shù)據(jù)的預(yù)測功能作為一種輔助功能,即僅作為提示記者下一個關(guān)注點的一種工具,具體采寫過程應(yīng)該由記者自己完成。 五、大數(shù)據(jù)可改變新聞采編方式 從上述論證來看,要挖掘大數(shù)據(jù)的預(yù)測功能尚有很長的路需要探索,并且給我們提出一種警示,在媒體發(fā)展過程中想最大限度地發(fā)揮大數(shù)據(jù)的優(yōu)勢,勢必采取人機合作的方式,這種合作方式首先應(yīng)該體現(xiàn)在對傳統(tǒng)新聞采編方式的改變上。目前,記者的新聞編寫工作主要通過電腦輸入來完成,雖然較之以往的手寫方式便捷許多,但由于記者工作性質(zhì)的特殊性,需要四處移動,有時無法在截稿時間節(jié)點前完成稿件的輸送。 記者可以在專業(yè)的數(shù)據(jù)采集

23、平臺錄入音頻或者圖片數(shù)據(jù),而后通過后臺完成數(shù)據(jù)的抓取以及新聞編寫工作,當(dāng)然這僅僅指可以套用模版的小稿件。具體操作模式為:記者只要在采訪過程中隨時錄下所需的音頻數(shù)據(jù),并且在音頻數(shù)據(jù)末尾輸入特殊的“符號”,其后通過專業(yè)的數(shù)據(jù)抓取平臺提取相關(guān)數(shù)據(jù)并加以分析,由計算機后臺按照一定的編寫模式撰寫稿件,在得到記者確認(rèn)后提交稿件庫。比如,在“新浪微博”的博文中添加“愛馬克”的信息后,“愛馬克”軟件自動為讀者收藏“微博”中的網(wǎng)頁,從而提取讀者感興趣的網(wǎng)頁、文字等數(shù)據(jù)。筆者認(rèn)為,可以開發(fā)一個類似“愛馬克”的軟件,記者只需在數(shù)據(jù)錄入過程中添加一個數(shù)據(jù)提取的道口就可以利用大數(shù)據(jù)分析后臺進(jìn)行新聞的編寫工作。 

24、;根據(jù)現(xiàn)狀來看,大數(shù)據(jù)時代對于音頻、圖片等方面數(shù)據(jù)的分析并非不可能。在IBM發(fā)布的一份名為分析: 大數(shù)據(jù)在現(xiàn)實世界中的使用的報告中顯示,組織在大數(shù)據(jù)工作中主要利用的內(nèi)部數(shù)據(jù)源有38%來自音頻數(shù)據(jù)、34%來自靜態(tài)圖片或音頻。而在大數(shù)據(jù)分析能力方面,25%的受訪者報告正在利用語音來分析大數(shù)據(jù)8。 如果這種新的采編方式得以實現(xiàn),那么將大大加快媒體的發(fā)稿率。 六、媒體應(yīng)充分利用媒介社區(qū)資源 此外,在大數(shù)據(jù)時代,數(shù)據(jù)本身的價值遠(yuǎn)遠(yuǎn)大于其技術(shù)革新的價值,數(shù)據(jù)本身是大數(shù)據(jù)時代的最重要的部分。媒體若要在大數(shù)據(jù)時代處于行業(yè)領(lǐng)先地位,就必須在現(xiàn)有數(shù)據(jù)庫資源基礎(chǔ)上拓展數(shù)據(jù)庫規(guī)模。

25、60;目前,新聞記者獲取新聞源主要通過三種方式:第一,條線記者會定期收到來自條線通訊員提供的信源;第二,從報社的爆料平臺獲取信源;第三,從網(wǎng)絡(luò)上獲取信源。前兩種方式雖然在一定程度上保證信源的可靠性,但戈夫曼曾在日常生活中的一種自我呈現(xiàn)中指出,當(dāng)個體處于他人面前時,常常會在他的行動中注入各種各樣的符號,這些符號戲劇性地突出并生動勾畫出了若干原本含混不清的事實,即通訊員可能出于對自己利益保護(hù)的原因,刻意隱瞞某些事實,致使報道存在片面性的缺陷,并且信源的渠道有限。第三種獲取信源的方式雖然擴大了信源的數(shù)量及規(guī)模,但逐一瀏覽網(wǎng)頁、辨別信源真?zhèn)魏馁M記者大量精力。 筆者認(rèn)為,在大數(shù)據(jù)時代下,可以充

26、分利用媒介社區(qū)資源,擴大信源采集量。對于媒介社區(qū)的概念在學(xué)界尚存在爭議,爭論的焦點主要集中在對社區(qū)概念的認(rèn)定上。目前對社區(qū)概念的理解主要有三種,一種說法認(rèn)為社區(qū)是“社會共同體”,是人組成的“群體”;另一種說法認(rèn)為社區(qū)是“地理區(qū)域”,或者是指定的“物理空間”;第三種觀點認(rèn)為,社區(qū)概念是上述兩派的合集。 本文涉及的媒介社區(qū)主要指第三種,即“社會共同體”和“地理區(qū)域”的集合體。所謂“社會共同體”簡而言之就是具有相同興趣愛好、宗教信仰、共同話題等群體,而“地理區(qū)域”主要涉及生活環(huán)境、血緣關(guān)系等方面。 自15世紀(jì)古登堡發(fā)明印刷機以來,媒介社區(qū)逐步開始形成,首先出現(xiàn)的是以讀書會的形式存

27、在的媒介社區(qū),在以廣播為代表的電子媒體出現(xiàn)之后,形成了以廣播節(jié)目的“粉絲”為主的媒介社區(qū),在網(wǎng)絡(luò)時代,又形成了以虛擬社區(qū)為主的媒介社區(qū),所謂虛擬社區(qū)就是擁有共同興趣愛好的群體在網(wǎng)絡(luò)上形成的小社會。本文所指的媒介社區(qū)主要涉及以網(wǎng)絡(luò)為主的虛擬社區(qū),但這些虛擬社區(qū)既有“社會共同體”特性,又具有“地理區(qū)域”特性。 從“社會共同體”這一定義出發(fā)分析媒介社區(qū)發(fā)展現(xiàn)狀,目前主要通過形成大量專業(yè)型網(wǎng)站、“討論組”、“討論群”、“貼吧”等方式來實現(xiàn),比如以吸引汽車愛好者為主的“汽車之家論壇”、以音樂愛好者為主的“音悅臺”網(wǎng)站,其討論的內(nèi)容往往圍繞一個主題,經(jīng)常發(fā)布諸如新的行業(yè)動態(tài)、內(nèi)幕爆料等信息。從“

28、地理區(qū)域”這一概念出發(fā)分析媒介社區(qū)的發(fā)展現(xiàn)狀,主要由于生活在某一相同地理社區(qū)中的居民,或出于維護(hù)自身利益的目的、或出于在同一社區(qū)里分享飲食、購物、交通、房地產(chǎn)等方面信息的目的,成立了大量的社區(qū)生活網(wǎng)站、“討論群”等,比如上海眾多區(qū)縣擁有諸如“南匯生活網(wǎng)”、“閘北生活網(wǎng)”等生活服務(wù)類的論壇網(wǎng)站。 無論是依托“社會共同體”還是“地理區(qū)域”存在的媒介社區(qū),由于處在媒介社會中的個體對所在社區(qū)文化、環(huán)境等內(nèi)容較為熟悉,其提供的信源具有較高的可靠性,并且數(shù)據(jù)量巨大。在大數(shù)據(jù)時代,紙質(zhì)媒體可以考慮抓取這些媒介社區(qū)資源,通過與以往數(shù)據(jù)進(jìn)行對比、分析,推選出可靠性較高的信源,供相關(guān)條線的記者使用。&#

29、160;七、媒體應(yīng)挖掘信息的二次價值 縱觀各大媒體目前的運營模式,其所擁有的人脈資源以及采編所得的新聞資源只顯現(xiàn)出一次利用的價值,這種價值僅僅產(chǎn)生于引起受眾的關(guān)注以及由此產(chǎn)生的廣告價值。當(dāng)然,獲得這種一次價值的前提是我們所采集的信息能夠引起受眾的興趣,否則或許連一次價值都無法體現(xiàn)。但由此產(chǎn)生的成本卻是高昂的。對于信息這一特殊商品而言,發(fā)布一次信息與發(fā)布10次信息所產(chǎn)生的成本差異不大,因此,應(yīng)盡量挖掘信息二次利用的價值。 所謂二次價值主要涉及兩方面,其一,指對數(shù)據(jù)的重復(fù)使用所能產(chǎn)生的額外的經(jīng)濟效益;其二,指在對數(shù)據(jù)的二次利用過程中產(chǎn)生的對整個媒體的戰(zhàn)略布局等產(chǎn)生深刻影響的作用

30、。 從第一個方面來看,信息的二次利用最易產(chǎn)生經(jīng)濟利益的方式就是授權(quán)其他媒體進(jìn)行轉(zhuǎn)發(fā),但在國內(nèi)目前知識產(chǎn)權(quán)保護(hù)極度不完善的情況下,這種二次利用幾乎產(chǎn)生不了多大的價值。 對傳統(tǒng)媒體而言,信息二次利用的真正價值在于通過對龐大的數(shù)據(jù)庫進(jìn)行分析、整合,從而預(yù)測出市場走向。大數(shù)據(jù)技術(shù)的革命并非像以往的技術(shù)革命一樣,在技術(shù)層面完全顛覆之前的技術(shù)。大數(shù)據(jù)是基于現(xiàn)有的網(wǎng)絡(luò)技術(shù),通過對海量數(shù)據(jù)的收集、分析和預(yù)測,得到數(shù)據(jù)或者事件之間的相關(guān)性的方式。在大數(shù)據(jù)時代,最重要的部分在于現(xiàn)在已經(jīng)擁有的龐大的數(shù)據(jù)庫資源。大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無法完

31、成的。大數(shù)據(jù)是人們獲得新的知識、創(chuàng)造新的價值的源泉。 八、大數(shù)據(jù)促進(jìn)紙質(zhì)媒體、網(wǎng)絡(luò)平臺融合 哈羅德伊尼斯認(rèn)為,每種傳播技術(shù)都有自身的偏好,他在傳播的偏向一書中指出,根據(jù)傳播媒介的特征,某種媒介可能更適合在時間上的縱向傳播,而不是適合知識在空間上的橫向傳播,尤其是該媒介笨重而持久,不適合運輸?shù)臅r候;它也可能更加適合知識在時間上的縱向傳播,尤其是該媒介輕巧而便于運輸?shù)臅r候11。紙質(zhì)媒體作為一種以文字為載體的傳播媒介,有著可以保存、流傳的特征,便于對數(shù)據(jù)進(jìn)行分析,實現(xiàn)價值的二次挖掘。但由于大數(shù)據(jù)時代是建立在以云計算等數(shù)據(jù)大存儲量的基礎(chǔ)之上發(fā)展起來的,紙質(zhì)媒體假如希望自身的數(shù)據(jù)能夠

32、得到大量地、快捷地分析和利用,首先應(yīng)該完成由傳統(tǒng)編輯平臺向“電子平臺”的轉(zhuǎn)變,然后利用電子平臺的大數(shù)據(jù)分析能力起到對新聞事件的分析、預(yù)測功能。 此外,利用大數(shù)據(jù)的預(yù)測功能,可以分析讀者的偏好,正確把握市場走向。大數(shù)據(jù)是一種基于相關(guān)分析法的預(yù)測方式,它只關(guān)注事物與事物之間的相關(guān)性,而不關(guān)注他們的因果關(guān)系,它僅基于已獲得的客觀數(shù)據(jù),而不依賴主觀推斷。 眾所周知,目前一份報紙為了預(yù)測其市場前景,一般都會采取市場調(diào)研的方式來實現(xiàn)。但我們必須認(rèn)識到,一個個體一旦脫離其日常生活的常態(tài),參與到某種調(diào)查過程之中,無論他是有意還是無意,或出于保護(hù)自己的目的、或出于討好調(diào)查者的目的,在潛意識中

33、會提供一些偽數(shù)據(jù),即無論在調(diào)查過程中如何嚴(yán)格按照調(diào)查步驟采集數(shù)據(jù),他們所采集到的數(shù)據(jù)往往與真實數(shù)據(jù)是有偏差的。 可能有人會提出反對意見,認(rèn)為大數(shù)據(jù)同樣可能存在數(shù)據(jù)虛假的問題。但大數(shù)據(jù)之于一般市場調(diào)查樣本分析相比,其樣本量巨大,因此可以忽略某些數(shù)據(jù)誤差,從而更接近真實數(shù)據(jù)。因此,由大數(shù)據(jù)分析得出的有關(guān)受眾偏好的數(shù)據(jù)更為可信,因為它只關(guān)注被調(diào)查者已經(jīng)采取的行為,并通過這種行為推斷出受眾的行為偏好,這種預(yù)測范圍既可以統(tǒng)括某個整體,也可以具體到某個特定的個體。只有與網(wǎng)絡(luò)平臺合作,紙質(zhì)媒體才可以等準(zhǔn)確地獲得這些信息。 對于網(wǎng)絡(luò)媒體而言,雖然可在網(wǎng)絡(luò)平臺獲取海量數(shù)據(jù),但信源的不可靠性嚴(yán)

34、重阻礙其在大數(shù)據(jù)時代的發(fā)展。例如筆者分別在百度地圖、谷歌地圖和丁丁地圖上搜“浦東新區(qū)惠南鎮(zhèn)社會保障服務(wù)中心”這一信息,卻意外獲得三種不同答案。百度地圖將其定位在惠南鎮(zhèn)城西路附近,并沒有給出精確的位置;谷歌地圖顯示的地址是“上海市浦東新區(qū)惠東路4號”;而丁丁地圖顯示的地址為“靖海路201-205號”,可見網(wǎng)絡(luò)平臺的數(shù)據(jù)可靠性不高。 而報紙媒體雖然近幾年來遭受公信力下降的詬病,但與網(wǎng)絡(luò)媒體相比,其數(shù)據(jù)的可靠性仍處在較高水平。因此,報紙媒體與網(wǎng)絡(luò)平臺的合作,可以相互揚長避短。  九、大數(shù)據(jù)促進(jìn)電視臺、網(wǎng)絡(luò)平臺融合 電視媒體雖然具有強烈的畫面沖擊感以及新聞的時效性等天然優(yōu)

35、勢,但近幾年隨著網(wǎng)絡(luò)視頻的發(fā)展,逐漸出現(xiàn)收視率、廣告量下降的趨勢。筆者認(rèn)為,在大數(shù)據(jù)時代發(fā)展前景下,在媒體行業(yè)內(nèi),或許電視媒體受到的沖擊最大。因此,電視媒體謀求與網(wǎng)絡(luò)媒體的融合發(fā)展勢在必行。 根據(jù)央視索福瑞媒介研究有限公司的監(jiān)測數(shù)據(jù)顯示,2013年央視春晚在央視一套的收視率僅為11.36%,低于2012年的收視率17.37%,以及2011年的18.34%。(如圖1所示)12。而據(jù)CNTV提供的數(shù)據(jù),2013年春晚網(wǎng)絡(luò)視頻直播累計觀看人數(shù)達(dá)2.09億人次,較去年上升141%,最高同時在線人數(shù)達(dá)2255萬,較去年上升97%13。這意味著,現(xiàn)在越來越多的受眾選擇視頻網(wǎng)站取代電視來觀看春晚。

36、并且在未來的發(fā)展過程中,網(wǎng)絡(luò)平臺除了電視臺的頻道資源無法獲得之外,其余資源均可通過各種途徑獲得。因此,電視臺的競爭力逐漸喪失。 圖1 2007年至2013年央視一套(CCTV-1)央視春晚收視率 有些電視臺已經(jīng)預(yù)見大數(shù)據(jù)時代電視臺的轉(zhuǎn)型勢在必行,正在摸索“多屏融合”的合作方式,即電視機、計算機、手機等平臺相互合作,進(jìn)行視頻資源的共享。 2013年3月,樂視網(wǎng)(視頻網(wǎng)站)在北京召開發(fā)布會,宣布與富士康科技集團(tuán)達(dá)成戰(zhàn)略合作,與富士康合作開發(fā)互聯(lián)網(wǎng)電視機頂盒產(chǎn)品。樂視機頂盒就是直接通過互聯(lián)網(wǎng)觀看視頻內(nèi)容,其視頻量遠(yuǎn)遠(yuǎn)大于電視媒體的供應(yīng)量。互聯(lián)網(wǎng)電視機頂盒若成功開拓市場,

37、那么意味著海量的網(wǎng)絡(luò)視頻資源將消化電視臺現(xiàn)有的觀眾或者說用戶資源。其實,互聯(lián)網(wǎng)電視機頂盒的發(fā)展已有6、7年的歷史,但由于政府管控等原因一直沒有得到發(fā)展空間。2011年年底,廣電總局下發(fā)了持有互聯(lián)網(wǎng)電視牌照機構(gòu)運營管理要求,規(guī)定只要與獲得牌照的7家內(nèi)容集成商(截止今年1月,廣電總局共頒發(fā)了7張互聯(lián)網(wǎng)電視集成業(yè)務(wù)牌照,詳見圖2)的平臺對接,就可以讓自己的視頻內(nèi)容獲得除電腦、智能手機、平板電腦外的終端支持,此前被叫停的一些視頻網(wǎng)站的機頂盒產(chǎn)品,如小米盒子等也獲得了新的市場空間15。市場調(diào)研公司奧維咨詢的調(diào)研報告指出,2011年智能電視的年出貨量將突破340萬臺,而互聯(lián)網(wǎng)電視保有量將達(dá)到1700萬臺,到2014年互聯(lián)網(wǎng)電視滲透率將上升到80%16。 據(jù)筆者認(rèn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論