大數據如何啟迪未來培訓資料_第1頁
大數據如何啟迪未來培訓資料_第2頁
大數據如何啟迪未來培訓資料_第3頁
大數據如何啟迪未來培訓資料_第4頁
大數據如何啟迪未來培訓資料_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 入木三分分:“大數據據”如何啟啟迪未來來也就是這這一兩年年的光景景,我們們在朦朧朧之中仿仿佛已經經進入了了一個言言必稱“大數據據”的時代代。就像像望遠鏡鏡讓我們們能夠感感受宇宙宙,顯微微鏡讓我我們能夠夠觀測微微生物一一樣,大大數據正正在改變變我們的的生活以以及理解解世界的的方式,成成為新發(fā)發(fā)明和新新服務的的源頭,而而更多的的改變正正蓄勢待待發(fā)。大大數據激激發(fā)了一一場思想想風暴,導導演了一一場思維維變革。大數據據正以前前所未有有的速度度顛覆人人們探索索世界的的方法,引引起社會會、經濟濟、學術術、科研研、國防防、軍事事等領域域的深刻刻變革。執(zhí)迷于于精確性性已然成成為信息息缺乏時時代、模模擬時代代

2、的產物物;允許許不精確確、寬容容混雜性性將不可可竭力避避免,而而是被證證明的標標準途徑徑。那些些總是愛愛追因溯溯源、刨刨根問底底的人們們或許會會被遺棄棄,因為為大數據據時代里里,由果果追因已已經是明明日黃花花的“伎倆”,只要要“是什么么”“不要要問我為為什么”成為了了最佳答答案。因因為數據據呈現的的相關性性已經可可以滿足足大部分分人的認認知需求求,而透透過大數數據現象象挖掘事事物本質質,個中中成本(時時間、物物質)也也不是深深諳博弈弈之道的的人們所所愿擔負負的。數數據成為為資產、產業(yè)垂垂直整合合、泛互互聯(lián)網化化是大數數據時代代的三大大發(fā)展趨趨勢。數數據資產產成為和和土地、資本、人力并并駕齊驅驅

3、的關鍵鍵生產要要素。圍圍繞數據據資產,一一幕幕跌跌宕起伏伏的產業(yè)業(yè)大戲已已經上演演。本文文就將帶帶您去深深入了解解“大數據據”概念,帶帶領您去去領略大大數據時時代的“造化”。為您您送上一一顆“子彈”,引發(fā)發(fā)您的“頭腦風風暴”,覆滅滅您的保保守之心心,怠慢慢之氣!大數據:引領人人類數據據生成方方式步入入高級階階段數據生成成的“自主時時代”人類歷史史上從未未有哪個個時代和和今天一一樣產生生如此海海量的數數據。數數據的產產生已經經完全不不受時間間、地點點的限制制。從開開始采用用數據庫庫作為數數據管理理的主要要方式開開始,人人類社會會的數據據產生方方式大致致經歷了了三個階段段,而正正是數據據產生方方式

4、的巨巨大變化化才最終終導致大大數據的的產生。首先是運運營式系系統(tǒng)階段段。數據據庫的出出現使得得數據管管理的復復雜度大大大降低低,實際際中數據據庫大都都為運營營系統(tǒng)所所采用,作作為運營營系統(tǒng)的的數據管管理子系系統(tǒng)。比比如超市市的銷售售記錄系系統(tǒng),銀銀行的交交易記錄錄系統(tǒng)、醫(yī)院病病人的醫(yī)醫(yī)療記錄錄等。人人類社會會數據量量第一次次大的飛飛躍正是是建立在在運營式式系統(tǒng)開開始廣泛泛使用數數據庫開開始。這這個階段段最主要要特點是是數據往往往伴隨隨著一定定的運營營活動而而產生并并記錄在在數據庫庫中的,比比如超市市每銷售售出一件件產品就就會在數數據庫中中產生相相應的一一條銷售售記錄。這種數數據的產產生方式式是

5、被動動的。然后是用用戶原創(chuàng)創(chuàng)內容階階段?;セヂ?lián)網的的誕生促促使人類類社會數數據量出出現第二二次大的的飛躍。但是真真正的數數據爆發(fā)發(fā)產生于于Webb 2.0 時時代,而而Webb 2.0 的的最重要要標志就就是用戶戶原創(chuàng)內內容(UUGC,Useer GGeneeratted Conntennt)。這類數數據近幾幾年一直直呈現爆爆炸性的的增長,主主要有兩兩個方面面的原因因。首先先是以博博客、微微博為代代表的新新型社交交網絡的的出現和和快速發(fā)發(fā)展,使使得用戶戶產生數數據的意意愿更加加強烈。其次就就是以智智能手機機、平板板電腦為為代表的的新型移移動設備備的出現現,這些些易攜帶帶、全天天候接入入網絡的的

6、移動設設備使得得人們在在網上發(fā)發(fā)表自己己意見的的途徑更更為便捷捷。這個個階段數數據的產產生方式式是主動動的。而今,我我們進入入了感知知式系統(tǒng)統(tǒng)階段。人類社社會數據據量第三三次大的的飛躍最最終導致致了大數數據的產產生,今今天我們們正處于于這個階階段。這這次飛躍躍的根本本原因在在于感知知式系統(tǒng)統(tǒng)的廣泛泛使用。隨著技技術的發(fā)發(fā)展,人人們已經經有能力力制造極極其微小小的帶有有處理功功能的傳傳感器,并并開始將將這些設設備廣泛泛的布置置于社會會的各個個角落,通通過這些些設備來來對整個個社會的的運轉進進行監(jiān)控控。這些些設備會會源源不不斷的產產生新數數據,這這種數據據的產生生方式是是自動的的。簡單來說說,數據

7、據產生經經歷了被被動、主主動和自自動三個個階段。這些被被動、主主動和自自動的數數據共同同構成了了大數據據的數據據來源,但但其中自自動式的的數據才才是大數數據產生生的最根根本原因因。正如Goooglle 的的首席經經濟學家家Hall Vaariaan 所所說,數數據是廣廣泛可用用的,所所缺乏的的是從中中提取出出知識的的能力。數據收收集的根根本目的的是根據據需求從從數據中中提取有有用的知知識,并并將其應應用到具具體的領領域之中中。從“池塘塘捕魚”到“大海捕捕魚”“大數據據時代的的預言家家”維克托托邁爾-舍恩伯伯格(VVikttor Mayyer-Schh nbbergger),在在其所著著的大大數

8、據時時代一一書中就就闡釋所所謂“大數據據”的含義義,即不僅僅人類生生產和生生活中“有意義義”的信息息海量產產生,相相比以往往呈幾何何數級的的爆炸式式增長,“無意義”的數據的膨脹速度也同樣驚人;而且,政府、企業(yè)已經具備了全面采集“大數據”并予以無遺漏分析的技術能力。大數據本本身是一一個比較較抽象的的概念,單單從字面面來看,它它表示數數據規(guī)模模的龐大大。但是是僅僅數數量上的的龐大顯顯然無法法看出大大數據這這一概念念和以往往的“海量數數據”(Maassiive Datta)、“超大規(guī)規(guī)模數據據”(Veery Larrge Datta)等等概念之之間有何何區(qū)別。對于大大數據尚尚未有一一個公認認的定義義

9、,不同同的定義義基本是是從大數數據的特特征出發(fā)發(fā),通過過這些特特征的闡闡述和歸歸納,試試圖給出出其定義義。在這這些定義義中,比比較有代代表性的的是3VV 定義義,即認認為大數數據需滿滿足三個特點點:規(guī)模模性(VVoluume)、多樣樣性(VVariietyy)和高高速性(Vellociity)。除此此之外,還還有提出出4V 定義的的,即嘗嘗試在33V 的的基礎上上增加一一個新的的特性。關于第第四個VV 的說說法并不不統(tǒng)一,IIDC市市場研究究公司(Intternnatiionaal DDataa Coorpoorattionn全球領領先之科科技產業(yè)業(yè)媒體、研究及及活動公公司)認為大大數據還還應

10、當具具有價值值性(VValuue),大大數據的的價值往往往呈現現出稀疏疏性的特特點。而而IBMM (Intternnatiionaal BBusiinesss MMachhineesCoorpoorattionn國際商商業(yè)機器器有限公公司)認為大大數據必必然具有有真實性性(Veeraccityy)。維維基百科科對大數數據的定定義則簡簡單明了了:大數數據是指指利用常常用軟件件工具捕捕獲、管管理和處處理數據據所耗時時間超過過可容忍忍時間的的數據集集。從數據庫庫(Daatabbasee, DDB)到到大數據據(Biig DDataa, BBD),看看似只是是一個簡簡單的技技術演進進,但細細細考究究不

11、難發(fā)發(fā)現兩者者有著本本質上的的差別。大數據據的出現現,必將將顛覆傳傳統(tǒng)的數數據管理理方式。在數據據來源、數據處處理方式式和數據據思維等等方面都都會對其其帶來革革命性的的變化。如果要要用簡單單的方式式來比較較傳統(tǒng)的的數據庫庫和大數數據的區(qū)區(qū)別的話話,我們們認為“池塘捕捕魚”和“大海捕捕魚”是個很很好的類類比。“池塘捕捕魚”代表著著傳統(tǒng)數數據庫時時代的數數據管理理方式,而而“大海捕捕魚”則對應應著大數數據時代代的數據據管理方方式,“魚”是待處處理的數數據?!安遏~”環(huán)境條條件的變變化導致致了“捕魚”方式的的根本性性差異。這些差差異主要要體現在在如下幾幾個方面面:數據規(guī)模模:“池塘”和“大?!弊钊菀滓?/p>

12、發(fā)現的的區(qū)別就就是規(guī)模模?!俺靥痢币?guī)模相相對較小小,即便便是先前前認為比比較大的的“池塘”,譬如如VLDDB(VVeryy Laargee Daatabbasee),和和“大?!盭LDDB(EExtrremeely Larrge Dattabaase)相比仍仍舊偏小小?!俺靥痢钡奶幚砝韺ο笸ㄍǔR訫MB 為為基本單單位,而而“大?!眲t常常常以GBB,甚至至是TBB、PBB為基本本處理單單位。數據類型型:過去去的“池塘”中,數數據的種種類單一一,往往往僅僅有有一種或或少數幾幾種,這這些數據據又以結結構化數數據為主主。而在在“大海”中,數數據的種種類繁多多,數以以千計,而而這些數數據又包包含著結結

13、構化、半結構構化以及及非結構構化的數數據,并并且半結結構化和和非結構構化數據據所占份份額越來來越大。模式(SScheema)和數據據的關系系:傳統(tǒng)統(tǒng)的數據據庫都是是先有模模式,然然后才會會產生數數據。這這就好比比是先選選好合適適的“池塘”,然后后才會向向其中投投放適合合在該“池塘”環(huán)境生生長的“魚”。而大大數據時時代很多多情況下下難以預預先確定定模式,模模式只有有在數據據出現之之后才能能確定,且且模式隨隨著數據據量的增增長處于于不斷的的演變之之中。這這就好比比先有少少量的魚魚類,隨隨著時間間推移,魚魚的種類類和數量量都在不不斷的增增長。魚魚的變化化會使大大海的成成分和環(huán)環(huán)境處于于不斷的的變化之

14、之中。處理對象象:在“池塘”中捕魚魚,“魚”僅僅是是其捕撈撈對象。而在“大?!敝校棒~”除了是是捕撈對對象之外外,還可可以通過過某些“魚”的存在在來判斷斷其他種種類的“魚”是否存存在。也也就是說說傳統(tǒng)數數據庫中中數據僅僅作為處處理對象象。而在在大數據據時代,要要將數據據作為一一種資源源來輔助助解決其其他諸多多領域的的問題。處理工具具:捕撈撈“池塘”中的“魚”,一種種漁網或或少數幾幾種基本本就可以以應對,也也就是所所謂的OOne Sizze FFitss Alll。但但是在“大海”中,不不可能存存在一種種漁網能能夠捕獲獲所有的的魚類,也也就是說說No Sizze FFitss Alll。從“池塘

15、塘”到“大?!?,不僅僅僅是規(guī)規(guī)模的變變大。傳傳統(tǒng)的數數據庫代代表著數數據工程程(Daata Enggineeeriing)的處理理方式,大大數據時時代的數數據已不不僅僅只只是工程程處理的的對象,需需要采取取新的數數據思維維來應對對。圖靈靈獎獲得得者、著著名數據據庫專家家Jimm Grray 博士觀觀察并總總結人類類自古以以來,在在科學研研究上,先先后歷經經了實驗驗、理論論和計算算三種范范式。當當數據量量不斷增增長和累累積到今今天,傳傳統(tǒng)的三三種范式式在科學學研究,特特別是一一些新的的研究領領域已經經無法很很好的發(fā)發(fā)揮作用用,需要要有一種種全新的的第四種種范式來來指導新新形勢下下的科學學研究?;?/p>

16、于這這種考慮慮,Jiim GGrayy 提出出了一種種新的數數據探索索型研究究方式,被被他自己己稱之為為科學研研究的“第四種種范式”(Thhe FFourrth Parradiigm)。第四種范范式的實實質就是是從以計計算為中中心,轉轉變到以以數據處處理為中中心,也也就是我我們所說說的數據據思維。這種方方式需要要我們從從根本上上轉變思思維。正正如前面面提到的的“捕魚”,在大大數據時時代,數數據不再再僅僅是是“捕撈”的對象象,而應應當轉變變成一種種基礎資資源,用用數據這這種資源源來協(xié)同同解決其其他諸多多領域的的問題。計算社社會科學學(Coompuutattionnal SocciallSciie

17、ncce)基基于特定定社會需需求,在在特定的的社會理理論指導導下,收收集、整整理和分分析數據據足跡(dattaprrintt),以以便進行行社會解解釋、監(jiān)監(jiān)控、預預測與規(guī)規(guī)劃的過過程和活活動。計計算社會會科學是是一種典典型的需需要采用用第四種種范式來來做指導導的科學學研究領領域。DDunccan J. Wattts 在自自然雜雜志上的的文章AAtweentyy-fiirstt ceentuury sciiencce也也指出借借助于社社交網絡絡和計算算機分析析技術,221 世世紀的社社會科學學有可能能實現定定量化的的研究,從從而成為為一門真真正的自自然科學學。從云計算算到大數數據如今,大大數據的

18、的重要性性越來越越明顯,但但就和云云計算一一樣,它它也不是是一個從從天而降降的新事事物,而而是在三三個主要要因素的的驅動下下,逐步步成長成成熟的。大數據的的驅動力力第一個驅驅動力,就就是業(yè)界界常說的的大數據據的三個個V(VVoluume, Vaarieety, Veeloccityy),而而這三個個V可以以有多種種解讀。首先來看看看第一一個V,巨巨大的數數據量與與數據完完整性。IT業(yè)業(yè)界所指指的數據據,誕生生不過660多年年。而一一直到PPC普及及到千家家萬戶之之前,由由于存儲儲、計算算和分析析工具的的技術和和成本限限制,許許多自然然界和人人類社會會值得記記錄的信信號,并并未形成成數據幾十十年

19、前,氣氣象、地地質、石石油物探探、出版版業(yè)、媒媒體業(yè)和和影視業(yè)業(yè)是大量量、持續(xù)續(xù)產出信信號的行行業(yè),但但那時990%以以上采用用的是存存儲模擬擬信號,難難以通過過計算設設備和軟軟件進行行直接分分析。那那些擁有有大量資資金和人人才的政政府和企企業(yè),也也只能把把少量最最關鍵的的信號,進進行抽取取、轉換換、裝載載到數據據庫中。 值得注意意的是,業(yè)業(yè)界對達達到怎樣樣的數量量級才算算是大數數據并無無定論,其其實在很很多行業(yè)業(yè)的應用用場景里里,數據據集本身身的大小小并不是是最重要要的,是是否完整整才最重重要。第二個VV,在海海量、種種類繁多多的數據據間發(fā)現現其內在在關聯(lián)?;ヂ?lián)網網時代,各各種設備備通過TT

20、CP/IP網網絡連成成了一個個整體。進入WWeb 2.00時代,PPC用戶戶不單單單可以通通過網絡絡獲取信信息,還還成為了了信息的的制造者者和傳播播者。這這個階段段,不僅僅是數據據量開始始了爆炸炸式增長長,數據據種類也也開始變變得繁多多從技技術角度度看,可可以稱之之為結構構化數據據、半結結構化數數據、非非結構化化數據和和流式數數據。220055年,微微軟亞洲洲研究院院一年一一度的“21世世紀的計計算”大會將將主題設設定為“Datta CCenttricc Coompuutinng”,也就就是“以數據據為中心心的計算算”,那時時業(yè)界就已已建立了了這樣的的認知:價值來來自于數數據,或或者說,數數據

21、一直直都是有有價值的的商業(yè)資資產此前,人人們往往往過于重重視“計算和和存儲性性能的提提升”;而從從那時起起,業(yè)界界就已更更關注“數據分分析和處處理的效效率”對海海量數據據進行分分析、處處理和集集成,找找出原本本看來毫毫無關系系的那些些數據的的“關聯(lián)性性”,把似似乎沒有有用的數數據變成成有用的的信息,以以支持我我們做出出的判斷斷。 第三個VV,可以以理解為為更快地地滿足實實時性需需求。如如今,通通過各種種有線和和無線電電網絡,人人和人、人和各各種機器器、機器器和機器器之間無無處不在在的連接接,這些些連接不不可避免免地帶來來數據交交換,而而數據交交換的關關鍵是降降低延遲遲要解解決數據據產生、傳輸、

22、處理、存儲、抽取、分析、可視化化等各個個環(huán)節(jié)帶帶來的延延時,以以近乎實實時(這這意味著著小于2250毫毫秒)的的方式呈呈獻給用用戶。 如今,數數據的實實時化需需求越來來越清晰晰。用戶戶想駕車車去吃飯飯,先用用地圖應應用查詢詢餐廳的的位置、預計行行車路線線的擁堵堵情況、停車場場信息甚甚至是其其他用戶戶對餐廳廳的評論論。吃飯飯的過程程中,他他會用手手機拍攝攝食物的的照片,編編輯簡短短的評論論,發(fā)布布到微博博上,還還可以用用LBSS應用查查找在同同一間餐餐廳吃飯飯的人,看看有沒有有好友在在附近第二個驅驅動力,是是云計算算的普及及和成為為主流。云計算算和大數數據到底底有什么么區(qū)別?前兩年年大家都都在講

23、云云計算,現現在怎么么又變成成大數據據了?微微軟全球球資深副副總裁,微微軟(中中國)有有限公司司董事長長張亞勤勤對此解解釋說,其實,云計算和大數據是一個硬幣的兩面,云計算是大數據的IT基礎,而大數據是云計算的一個殺手級應用。由于云計算的普及和成為主流,讓上述三個V不再成為挑戰(zhàn),反而成為大數據成長的驅動力。另一方面由于數據越來越多、越來越復雜、越來越實時,這就更加需要云計算去處理,所以二者之間是相輔相成的。舉例而言,30年前存儲1TB數據的成本大約是16億美元,如今存儲到云上只需不到100美元;但存儲下來的數據,如果不以云計算進行挖掘和分析,就只是僵死的數據,沒有太大價值。 第三個驅驅動力,是是

24、人工智智能、機機器學習習和數據據挖掘等等技術的的迅速發(fā)發(fā)展。在在這樣的的背景下下,以微軟為例例,它已已經可以以為用戶戶提供三三個層次次的端到到端大數數據解決決方案其一一是數據據管理,即即如何獲獲取、存存儲和保保護數據據;其二二是數據據豐富,即即如何清清洗、發(fā)發(fā)現不同同數據間間的數據據相關性性;其三三是,數數據洞察察力,即即通過分分析、呈呈現與決決策工具具,獲得得洞察力力,并最最終通過過付諸行行動,產產生價值值。 通俗的說說,就是是將信號號轉化為為數據,將將數據分分析為信信息,將將信息提提煉為知知識,以以知識促促成決策策和行動動。歸根根到底,大大數據的的最終意意義在于于獲得洞洞察力和和價值,這這

25、也正是是大數據據的第四四個V(VValuue),這這個V比比前面的的三個VV都更重重要。大數據塑塑造科技技、商業(yè)新態(tài)態(tài)勢在科技、商業(yè)領領域,大大數據具具備極大大的想象象空間。上個世世紀七十十年代,紐紐約的治治安狀況況很糟糕糕。一位位名叫杰杰克邁普(JJackk Maaplee)的年年輕警察察根據個個人警務務經驗,發(fā)發(fā)明了一一種名為為“未來圖圖表”(Chhartts oof tthe futturee)的犯犯罪預測測方法論論,可以以根據過過往搶劫劫案的記記錄數據據來推測測新案件件可能發(fā)發(fā)生的時時間與地地點。這這種方法法真的有有效,119944年,新新上任的的紐約市市警察局局局長開開發(fā)了“未來圖圖

26、表”的電子子版,將將之更名名為“CommpSttat”,推廣廣至全市市的警務務系統(tǒng)。CommpSttat的的技術核核心是犯犯罪測繪繪系統(tǒng)(CCrimme MMapppingg Syysteem)和和數據庫庫采集系系統(tǒng)(DDataabasse CColllecttionn Syysteem),而而微軟的的Miccrossoftt MaapPoointt、Acccesss、EExceel等產產品為兩兩個系統(tǒng)統(tǒng)提供了了堅實的的支撐基于于大量的的數據采采擷、挖挖掘和分分析工作作,紐約約警察局局嘗試對對歷史上上犯罪分分子的行行為規(guī)律律進行歸歸納和總總結,并并有效地地改善了了城市的的治安。數據顯顯示,在在

27、CommpSttat得得到推廣廣應用后后,19995年年,紐約約的兇殺殺案發(fā)生生率降低低了約225%,車車輛盜竊竊案發(fā)生生率降低低了約224%,而而且這些些數字還還隨著IIT軟硬硬件技術術的持續(xù)續(xù)更新和和CommpSttat系系統(tǒng)的不不斷完善善而逐年年下降。 未來,透透過技術術手段完完全遏制制犯罪行行為,讓讓每一個個城市和和地區(qū)的的居民時時時刻刻刻都安全全無虞這或或許不是是夢想。20112年88月,紐紐約市長長邁克爾爾布隆伯伯格(MMichhaell Blloommberrg)親親手揭開開了紐約約警察局局與微軟軟攜手開開發(fā)的城城域感知知系統(tǒng)(DDAS,DDomaain Awaarennesss

28、 Syysteem)的的面紗。該系統(tǒng)統(tǒng)將覆蓋蓋整個紐紐約市的的30000多個個監(jiān)控攝攝像頭、26000多枚枚輻射探探測器、幾百個個車牌信信息讀取取裝置所所收集的的信息匯匯總到警警方數據據庫中,可可結合探探測數據據、實時時影像、9111報警電電話和警警方積累累的罪案案歷史檔檔案,幫幫助警方方更準確確地偵測測并鎖定定即將發(fā)發(fā)生的犯犯罪活動動及嫌疑疑人。 對商業(yè)競競爭的參參與者們們來說,大大數據意意味著激激動人心心的業(yè)務務與服務務創(chuàng)新機機會。零零售連鎖鎖企業(yè)、電商業(yè)業(yè)巨頭都都已在大大數據挖挖掘與營營銷創(chuàng)新新方面有有著很多多的成功功案例,它它們都是是商業(yè)嗅嗅覺極其其敏銳、敢于投投資未來來的公司司,也因

29、因此獲得得了豐厚厚的回報報。 而對于那那些擁有有行業(yè)經經驗,并并熟練掌掌握云計計算開發(fā)發(fā)和應用用技能的的小型企企業(yè),尤尤其是初初創(chuàng)企業(yè)業(yè)來說,則則更是意意義非凡凡。最近近幾年,我我們看到到的一些些明星初初創(chuàng)公司司,比如如Clooudeera, Spplunnk, Kloout, TeellAAparrt等,人人員規(guī)模模只在數數十人,但但對某個個行業(yè)擁擁有深厚厚知識,并并能通過過云和大大數據的的技術手手段,快快速解決決該行業(yè)業(yè)的共性性需求和和痛點在未未來數年年,這樣樣的“小而精精”、“快而準準”企業(yè)會會越來越越多,并并做出有有可能改改變世界界的顛覆覆性產品品。很高高興看到到,在北北京中關關村,在

30、在微軟的的云加速速器二期期,也有有類似的的初創(chuàng)企企業(yè)加入入,和硅硅谷、海海法的創(chuàng)創(chuàng)業(yè)者們們一起,把把握住了了時代的的脈搏。大數據時時代的到到來大數據時時代的急急先鋒紐約時時報把把20112年定定義為“大數據據的十字字路口”。大數據據之所以以進入主主流大眾眾的視野野,源自自三種趨趨勢的合合力:第一,許許多高端端消費品品公司加加強了對對大數據據的應用用。社交交網絡巨巨擎 FFaceeboook 使使用大數數據來追追蹤用戶戶在其網網絡的行行為,通通過識別別你在它它的網絡絡中的好好友,從從而給出出新的好好友推薦薦建議,用用戶擁有有越多的的好友,他他們與 Facceboook之之間的黏黏度就越越高。更更

31、多的好好友意味味著用戶戶會分享享更多照照片、發(fā)發(fā)布更多多狀態(tài)更更新、玩玩更多的的游戲。商業(yè)網網站LiinkddIn則則使用大大數據在在求職者者和招聘聘職位之之間建立立關聯(lián)。有了LLinkkdInn,獵頭頭們再也也不用向向潛在的的受聘者者打陌生生電話來來碰運氣氣,而可可以通過過簡單的的搜索找找出潛在在受聘者者并聯(lián)系系他們。與此相相似,求求職者也也可以通通過聯(lián)系系網站上上其他人人,自然然而然地地將自己己推銷給給潛在的的雇主。第二,以以上兩家家公司都都在20012年年早些時時候陸續(xù)續(xù)上市。Facceboook 在納斯斯達克上上市,LLinkkedIIn 在在紐約證證券交易易所上市市。這兩兩家企業(yè)業(yè)和

32、谷歌歌一樣,雖雖然表面面上是消消費品公公司,然然而其本本質是大大數據企企業(yè)。除除去這兩兩家,SSpluunk 也在 20112 年年完成了了上市,它是一一家?guī)椭笾行托推髽I(yè)提提供運營營智能的的大數據據企業(yè)。這些企企業(yè)的公公開上市市提高了了華爾街街對于大大數據的的興趣。這種興興趣帶來來了空前前的盛況況硅谷谷的風險險投資家家們開始始前仆后后繼地投投資大數數據企業(yè)業(yè)。大數數據將引引發(fā)下一一波創(chuàng)業(yè)業(yè)大潮,而而這次浪浪潮有望望讓硅谷谷在未來來幾年取取代華爾爾街。第三,亞亞馬遜、Facceboook、LinnkeddIn 和其他他以數據據為核心心消費品品的活躍躍用戶們們,開始始期待自自己在工工作中也也能

33、獲得得暢通無無阻地使使用大數數據的體體驗,而而不再僅僅僅限于于生活娛娛樂。用用戶們此此前一直直想不通通,既然然互聯(lián)網網零售商商亞馬遜遜可以推推薦閱讀讀書目、推薦電電影、推推薦可供供購買的的產品,為為什么他他們所在在的企業(yè)業(yè)卻做不不到類似似的事情情。比如如,既然然汽車租租賃公司司擁有客客戶過去去租車的的信息和和現有可可用車輛輛庫存的的信息,這這些公司司為何就就不能在在向不同同的租車車人提供供合適的的車輛方方面做得得更智能能一點?公司還還可以通通過新的的技術,將將公開信信息利用用起來比如如某個特特定市場場的狀況況,會議議活動信信息,以以及其他他可能會會影響市市場需求求和供給給的事件件。通過過將內部

34、部供應鏈鏈數據和和外部市市場數據據結合在在一起,公公司就可可以更加加精確地地預測什什么車輛輛可用,以以及可用用時間。與此類類似,零零售商應應當可以以將來自自外部的的公開數數據和內內部數據據結合在在一起,利利用這種種混合的的數據進進行產品品定價和和市場布布局。同同時還可可以同時時考慮影影響現貨貨供應能能力的多多種因素素以及消消費者購購物習慣慣,包括括哪兩種種產品相相搭配會會賣得更更好,這這樣零售售商就可可以提升升消費者者的平均均購買量量,從而而獲得更更高的利利潤。大數據時時代的急急先鋒谷歌歌。谷歌的的體量和和規(guī)模,使使它擁有有比其他他大多數數企業(yè)更更多的應應用大數數據的途途徑。谷谷歌的優(yōu)優(yōu)勢之一

35、一在于,它它擁有一一支軟件件工程師師部隊,這這使得谷谷歌能夠夠從無到到有地建建立大數數據技術術。谷歌歌的另一一個優(yōu)勢勢在于它它所擁有有的基礎礎設施。谷歌搜搜索引擎擎本身的的設計,就就旨在讓讓它能夠夠無縫鏈鏈接成千千上萬的的服務器器。如果果出現更更多的處處理或存存儲需要要,抑或或某臺服服務器崩崩潰,谷谷歌的工工程師們們只要再再添加更更多的服服務器就就能輕松松搞定。谷歌軟件件技術的的設計也也秉持著著同樣的的基礎設設施理念念。MaapReeducce(谷谷歌開發(fā)發(fā)的編程程工具,用用于大規(guī)規(guī)模數據據集的并并行運算算。)和和谷歌文文件系統(tǒng)統(tǒng)(Goooglle FFilee Syysteem)就就是兩個個

36、典型的的例子。連線線雜志志在 220122年初夏夏曾報道道稱,這這兩個軟軟件系統(tǒng)統(tǒng)“重塑了了谷歌建建立搜索索索引的的方式”。為數眾眾多的企企業(yè)如今今開始使使用Haadooop, 它是MMapRReduuce和和谷歌文文件系統(tǒng)統(tǒng)的一種種開源衍衍生產品品。Haadooop允許許橫跨多多臺電腦腦,對龐龐大的數數據集合合進行分分布式處處理。在在其他企企業(yè)剛剛剛開始使使用Haadooop的時時候,谷谷歌早已已多年深深耕大數數據技術術,這讓讓它在行行業(yè)中獲獲得了巨巨大的領領先優(yōu)勢勢。如今谷歌歌正在進進一步開開放數據據處理領領域,將將其和更更多第三三方共享享。谷歌歌最近剛剛剛推出出webb服務BBigQQu

37、erry。該該項服務務允許使使用者對對超大量量數據集集進行交交互式分分析。按按照谷歌歌目前的的狀況,“超大量”,意味著數十億行數據。BigQuery 就是按指令在云端運行的數據分析。除此以外外,谷歌歌還坐擁擁人們在在谷歌網網站進行行搜索及及經過其其網絡時時所產生生的大量量機器數數據。用用戶所輸輸入的每每一個搜搜索請求求,都會會讓谷歌歌知道他他在尋找找什么,所所有人類類行為都都會在互互聯(lián)網上上留下痕痕跡路徑徑,而谷谷歌占領領了一個個絕佳的的點位來來捕捉和和分析該該路徑。不僅如如此,谷谷歌在搜搜索之外外還有更更多獲取取數據的的途徑。企業(yè)安安裝“谷歌分分析(GGooggle Anaalytticss

38、)”之類的的產品來來追蹤訪訪問者在在其站點點的足跡跡,而谷谷歌也可可獲得這這些數據據。網站站還使用用“谷歌廣廣告聯(lián)盟盟(Goooglle AAdseensee)”,將來來自谷歌歌廣告客客戶網的的廣告展展示在其其站點,因因此,谷谷歌不僅僅可以洞洞察自己己網站上上廣告的的展示效效果,同同樣還可可以對其其他廣告告發(fā)布站站點的展展示效果果一覽無無余。將將所有這這些數據據集合在在一起所所帶來的的結果是是:企業(yè)業(yè)不僅從從最好的的技術中中獲益,同同樣還可可以從最最好的信信息中獲獲益。在在信息技技術方面面,許多多企業(yè)可可謂耗資資巨大,然然而在信信息技術術的組成成部分之之一信息領領域,谷谷歌所進進行的龐龐大投入

39、入和所獲獲得的巨巨大成功功,卻罕罕有企業(yè)業(yè)能望其其項背。大數據時時代的急急先鋒亞馬馬遜。谷歌并并不是惟惟一一個個推行大大數據的的大型技技術公司司?;ヂ?lián)聯(lián)網零售售商亞馬馬遜已經經采取了了一些激激進的舉舉動,令令其有可可能成為為谷歌的的最大威威脅。曾曾有分析析者預測測,亞馬馬遜20015年年營收將將超過110000億美元元,它即即將趕超超沃爾瑪瑪成為世世界最大大的零售售商。如如同谷歌歌一樣,亞亞馬遜也也要處理理海量數數據,只只不過它它處理數數據帶有有更強的的電商傾傾向。消消費者們們在亞馬馬遜的網網站上對對想看的的電視節(jié)節(jié)目或是是想買的的產品所所進行的的每一次次搜索,都都會讓亞亞馬遜對對該消費費者的

40、了了解有所所增加?;谒阉阉骱彤a產品購買買行為,亞亞馬遜就就可以知知道接下下來應該該推薦什什么產品品。而亞亞馬遜的的聰明之之處還不不止于此此,它還還會在網網站上持持續(xù)不斷斷地測試試新的設設計方案案,從而而找出轉轉化率最最高的方方案。中國大數數據企業(yè)業(yè):領跑跑人還是是追風者者?阿里巴巴巴:大數數據=產業(yè)資資本近年來,中中國的大大數據企企業(yè)如雨雨后春筍筍般興盛盛起來,百百度等大大數據巨巨頭和各各專門大大數據公公司引領領“風騷”。而最最為可貴貴的是,在在如同阿阿里巴巴巴等企業(yè)業(yè)里,已已經實現現了數據據的資產產化,我們不得得不佩服服馬云的的前瞻性性。20009年年9月,阿阿里巴巴巴集團就就投資設設立阿

41、里里云計算算有限公公司,在在杭州、北京和和硅谷等等地設有有研發(fā)中中心和運運營機構構。阿里里云的目目標是要要打造互互聯(lián)網數數據分享享的第一一平臺,成成為以數數據為中中心的先先進的云云計算服服務公司司。在220111年,阿阿里巴巴巴收購了了流量統(tǒng)統(tǒng)計技術術服務提提供商CCNZZZ,意味味著阿里里巴巴在在其電子子商務產產業(yè)鏈整整合布局局上又完完成關鍵鍵性一步步。CNNZZ是是由IDDG投資資的網絡絡技術服服務公司司,專注注于為互互聯(lián)網各各類站點點提供獨獨立的第第三方數數據統(tǒng)計計分析。同時,CCNZZZ擁有互互聯(lián)網數數據采集集、統(tǒng)計計和挖掘掘三大技技術,從從事互聯(lián)聯(lián)網數據據監(jiān)測、統(tǒng)計分分析的技技術研究

42、究、產品品開發(fā)和和應用??梢哉f說,在大大數據時時代,阿阿里巴巴巴下了一一盤很大大的棋。將大數據據與商業(yè)業(yè)投資緊緊密結合合,也是是阿里巴巴巴的強強項所在在。例如如近期成成立小微微金融集集團,為為商家和和用戶提提供支付付、小貸貸、擔保保及保險險業(yè)務。其中,最最為人傳傳道的是是被金融融界人士稱稱為“虛擬信信用卡”的“信用支支付”,它是是阿里巴巴巴面對對網上個個人買家家的個人人消費金金融信貸貸服務產產品,而而授信的的基礎便便是龐大大的用戶戶交易數數據。支支付寶平平臺將根根據用戶戶交易數數據,對對用戶進進行授信信,信用用額度可可用于在在淘寶等等購物支支付,用用戶需要要在還款款日之前前進行還還款,最最長可

43、以以獲得338天免免息期這也也意味著著,支付付寶的“虛擬信信用卡”真的來來了。按照阿里里金融設設計的“信用支支付”商業(yè)模模式,通通過數據據來確定定買家信信用支付付額度,合合作銀行行通過支支付寶來來授信,阿阿里巴巴巴成立的的商誠擔擔保公司司將為買買家的“信用支支付”做擔保保,買家家在手機機支付時時可使用用自己的的“信用支支付”額度購購物,合合作銀行行把錢支支付給賣賣家。支支付寶從從合作商商家那里里抽取11%的“信用支支付”服務費費。虛擬擬信用卡卡與大數數據的融融合,產產生了重重大的影影響。一一些銀行行界人士士已經開開始擔心心,由于于阿里巴巴巴集團團擁有的的龐大客客戶群和和寶貴的的數據庫庫,阿里里

44、“虛擬信信用卡”可能構構成對銀銀行信用用卡的競競爭,對對傳統(tǒng)銀銀行造成成沖擊。對此,筆筆者認為為這是一一個不可可避免的的趨勢,唯唯一可以以做的就就是把它它規(guī)范化化、制度度化。紫光股份份:大數數據企業(yè)業(yè)的并購購者20133年7月月,啟迪迪控股旗旗下的紫紫光股份份發(fā)布公公告稱,公公司擬通通過向特特定對象象非公開開發(fā)行股股份及支支付現金金方式購購買能通通科技股股份有限限公司和和深圳市市融創(chuàng)天天下科技技股份有有限公司司1000%股份份,并募募集配套套資金。紫光股股份此次次借助資資本市場場,一舉舉并購兩兩家相關關公司,在在云計算算、ITT運維服服務、移移動互聯(lián)聯(lián)網應用用和大數數據處理理方面將將取得先先發(fā)

45、優(yōu)勢勢。能通通科技股股份有限限公司致致力于重重點行業(yè)業(yè)信息化化解決方方案和公共安安全信息息管理解解決方案案。公司發(fā)發(fā)展方向向涉及云云計算、智慧城城市等領領域,業(yè)業(yè)務領域域涵蓋IIT運維維及ITT基礎設設施服務務及智慧慧城市等等重點行行業(yè)信息息化解決決方案、數據中中心基礎礎環(huán)境建建設等相相關服務務,是國國內領先先的ITT服務提提供商。深圳市融融創(chuàng)天下下科技股股份有限限公司是是國內領領先的移移動互聯(lián)聯(lián)網平臺臺服務提提供商。以國際際領先的的核心技技術、核核心技術術產品化化和移動動互聯(lián)網網運營為為突出優(yōu)優(yōu)勢,成成為提供供移動互互聯(lián)網多多媒體平平臺應用用服務的的領先企企業(yè),是是國家級級高新技技術企業(yè)業(yè)。

46、融創(chuàng)創(chuàng)天下在在20009年入入選號稱稱“硅谷圣圣經”和“投資風風向標”Reed HHerrringg(紅紅鯡魚)雜雜志最具具投資價價值企業(yè)業(yè)全球1100強強;在220088年NOOKIAA 組織織的全球球MOBBILEE RUULESS 大賽賽中,入入圍全球球核心科科技類最最強十二二名,是是流媒體體領域唯唯一一名名,同時時為中國國區(qū)唯一一一名。公司已已形成移移動多媒媒體運營營、移動動互聯(lián)網網運營平平臺能力力輸出、三網融融合硬件件終端產產品研發(fā)發(fā)與銷售售的三大大業(yè)務體體系。公公司6年年持續(xù)投投資超過過3億在在移動互互聯(lián)網底底層核心心技術的的研發(fā)上上,具有有國內及及國際技技術發(fā)明明專利上上百項,形

47、形成了以以T3、TIVVC和TTMCMM云計算算中間件件三大核核心技術術的移動動多媒體體技術體體系,已已成為具具備技術術優(yōu)勢、平臺產產品優(yōu)勢勢和運營營優(yōu)勢、商業(yè)模模式創(chuàng)新新優(yōu)勢的的綜合性性新銳企企業(yè)。紫光收購購案其實實宣示了了企業(yè)發(fā)發(fā)展的一一種新走走向,大大數據不不光作為為一種產產業(yè)將大大放異彩彩,也將將成為科科技企業(yè)業(yè)的中樞樞板塊。田溯寧寧(寬帶帶資本董董事長)說說:“正像人人類幾百百年前在在大航海海時代,發(fā)發(fā)現、征征服海洋洋,尋找找到新大大陸的機機遇一樣樣,我們們突然身身處過去去無法想想象的數數據海洋洋,通過過征服這這個數據據海洋,可可以抵達達人類知知識的新新邊疆?!薄拔磥韥砥髽I(yè)將將都會是

48、是數據驅驅動的企企業(yè),無論論你處于于什么行行業(yè),企企業(yè)規(guī)模模大小”,王京京文(用用友軟件件股份有有限公司司董事長長兼CEEO)如如是說。王明夫夫(和君君咨詢董董事長)預預測:“傳統(tǒng)產產業(yè)、各各行各業(yè)業(yè),都面面臨在大大數據和和移動互互聯(lián)網時時代如何何徹底轉轉型和再再造問題題。我喊喊了十幾幾年的產產業(yè)整合合,也在在大數據據時代出出現了全全新的整整合邏輯輯和實現現契機?!贝髷祿夹g改改變了信信息的生生產、傳傳播、加加工和組組織方式式,打破破了傳統(tǒng)統(tǒng)的信息息不對稱稱和物理理區(qū)域壁壁壘,對對各業(yè)界界的生存存環(huán)境和和方式帶帶來了顯顯著的影影響。大大數據專專家趙國國棟、易易歡歡、糜萬軍軍、鄂維維南在共共同

49、著述述大數數據時代代的歷史史機遇-產業(yè)變變革與數數據科學學一書書中宣稱稱:“缺少數數據資源源,無以以為談產產業(yè)。缺缺少數據據思維,無無以言未未來。數數據的積積累、挖挖掘、分分析、歸歸納、整整理,是是一只優(yōu)優(yōu)秀團隊隊所必須須具備的的基本素素養(yǎng),沒沒有它,你你永遠是是匹夫之之勇?!币蚨鴶禂祿季S維與數據據資產在在未來的的重要性性不言而而喻?!白瞎?10000”:全球首首臺“云計算算機”20133年122月100日,啟啟迪控股股旗下紫紫光股份份有限公公司在京京召開“紫光股股份云服服務戰(zhàn)略略暨紫光光云計算算機”發(fā)布會會。會上上,紫光光股份總總裁齊聯(lián)聯(lián)發(fā)布了了公司的的“云服務務”戰(zhàn)略,率率先提出出“云計

50、算算機”的概念念,同時時推出了了擁有自自主知識識產權的的全球首首臺“紫光云云計算機機”。紫光股份份將“云計算算機”定義為為:采用用與個人人計算機機和超級級計算機機完全不不同的分分布式體體系架構構,借助助于云計計算的虛虛擬化技技術,由由多個成成本相對對較低的的計算資資源融合合而成的的一臺具具有強大大計算能能力的計計算機。它可高高效支持持大數據據處理、高吞吐吐率和高高安全信信息服務務等多類類應用需需求,其其計算能能力和存存儲能力力可動態(tài)態(tài)伸縮并并無限擴擴展。紫光云計計算機有有著廣闊闊的應用用前景,可可滿足金金融、電電信、公公安、交交通、衛(wèi)衛(wèi)生、廣廣電等大大數據行行業(yè)用戶戶提出的的高性能能、低成成本

51、、高高可靠性性和高可可擴展性性的要求求,也將將促進信信息技術術在物聯(lián)聯(lián)網、智智慧城市市、智能能電網、智能交交通、智智能醫(yī)療療、食品品安全等等大數據據應用領領域的廣廣泛應用用。例如如,按“平安城城市”建設要要求,一一個中等等城市的的視頻監(jiān)監(jiān)控數據據量為3300PPB/年年,用一一臺紫光光云計算算機可在在保存三三個月監(jiān)監(jiān)控記錄錄的同時時,對所所有數據據完成處處理。紫光股份份在云計計算領域域已具備備了一定定的技術術和產業(yè)業(yè)基礎。20112年,在在工信部部的大力力支持下下,紫光光股份與與南京市市秦淮區(qū)區(qū)合作,聯(lián)聯(lián)合實施施“紫云工工程”,在南南京市中中國云計計算創(chuàng)新新基地建建立了云云信息服服務產業(yè)業(yè)創(chuàng)新

52、中中心。中中心是集集云計算算、大數數據新技技術研發(fā)發(fā)、科技技成果轉轉化、培培育新興興產業(yè)、人才培培養(yǎng)為一一體的產產業(yè)化創(chuàng)創(chuàng)新基地地,將為為區(qū)域內內的智能能電網、新興通通訊、智智能交通通、物聯(lián)聯(lián)網、智智慧城市市、電子子商務、移動互互聯(lián)提供供云計算算的SPPI(SSaaSS、PaaaS、IaaaS)服服務。目目前“紫云工工程”已取得得階段性性重大成成果,“紫云工工程”被工信信部命名名為“新秦淮淮模式”,標志志著紫光光股份在在云計算算及大數數據產業(yè)業(yè)創(chuàng)新方方面已達達到國際際領先水水平。紫光云計計算機的的研制成成功,標標志著紫紫光股份份已在分分布式計計算、虛虛擬資源源管理和和快速部部署等云云計算核核心

53、技術術領域取取得重大大突破,掌掌握并擁擁有自主主可控的的云計算算技術體體系和成成套軟硬硬件系統(tǒng)統(tǒng),使我我國的云云計算核核心產業(yè)業(yè)達到了了國際先先進水平平,為云云計算在在我國信信息化建建設中發(fā)發(fā)揮重要要作用奠奠定了堅堅實的技技術和產產業(yè)化基基礎。同同時,其其開放式式平臺可可以使國國產CPPU等核核心硬件件和基礎礎軟件有有機會在在大數據據時代發(fā)發(fā)揮出與與國外同同等產品品相當的的性能,從從而帶動動我國信信息產業(yè)業(yè)國產化化水平的的大幅提提高,為為保障國國家信息息安全發(fā)發(fā)揮重要要作用。數據思維維與數據據資產大數據思思維的重重要性遠遠遠超過過數據資資產,具具備大數數據思維維,才能能夠積累累數據資資產;不不

54、具備大大數據思思維,則則可能棄棄珍寶如如敝履。公司最最重要的的是建立立大數據據思維,而而非僅僅僅盯住數數據資產產。優(yōu)秀秀的數據據思維,必必然反映映在優(yōu)質質數據資資產。人人們難以以定量評評價一個個人的數數據思維維,所以以只好退退而求其其次,關關心在數數據思維維的影響響下,數數據資產產的優(yōu)劣劣。依據據大數數據時代代的歷史史機遇-產業(yè)變變革與數數據科學學一書書,數據據資產的的價值可可以從五五個維度度來評估估,分別別是規(guī)模模、活性性、多維維度、關關聯(lián)性、顆粒度度。這五五個維度度,沒有有絕對的的數值可可以參考考,而且且具體到到每個行行業(yè)有所所不同。數據資產產的“五維”所謂顆粒粒度指標標反映數數據的精精細

55、化程程度。那那些宏觀觀的數據據,價值值含量較較低。相相反那些些細化到到個人、單品的的數據,才才會帶來來前所未未有的洞洞察力,這這也是和和精細化化管理的的思想緊緊密相關關的。顆顆粒度是是反映數數據資產產質量的的第一個個維度。細化到到個人、單品,個個別網絡絡、門派派、零件件,夸張張的說一一粒沙子子,也要要清清爽爽爽地記記錄下它它的位置置、大小小、重量量,甚至至,因為為風吹浪浪打漂流流的痕跡跡。不要要忘了“一沙一一世界,一一花一天天堂”。多維度指指標借用用空間維維度的概概念,來來指代數數據來源源的豐富富性。每每增加一一個數據據維度,會會影響所所有用原原數據的的分析和和判斷,甚甚至會帶帶來顛覆覆性的證

56、證據。我我們以美美國的FFICOO信用評評分機制制(由美美國個人人消費信信用評估估公司開開發(fā)出的的一種個個人信用用評級法法)為例例,幾乎乎每個美美國人都都有一個個FICCO信用用評分,當當人們申申請信用用卡、汽汽車貸款款、住房房貸款時時,大多多數的信信貸機構構會參考考這一評評分。但但是,在在其發(fā)展展的初期期,FIICO模模型中,僅僅僅依賴賴申請人人在現有有住址住住了多久久、為現現在的企企業(yè)工作作了多久久、申請請人賬號號開設了了多久等等數據。根據這這個評估估,幾乎乎所有330歲以以下的人人,都會會存在很很大的風風險。現現在人們們知道淘淘寶上的的購買主主力,恰恰恰是以以年輕人人為主。所以零零售商們

57、們群起反反對,這這些條款款限制了了發(fā)卡人人數,不不利于刺刺激消費費。當FFICOO增加了了評估數數據的維維度后,譬譬如納入入教育水水平、職職業(yè)等指指標,那那些受到到過良好好教育、從事體體面職業(yè)業(yè)的人,也也就獲得得了信用用卡。事事實證明明,他們們的違約約率極低低。在多維度度指標中中,人們們尤其重重視一類類“先驗”維度。比如,人人們在買買股票的的時候,一一定先觀觀察一只只股票的的行情走走勢;人人們在購購商品的的時候,一一定會對對比和詢詢價。互互聯(lián)網有有助于把把這些數數據收集集起來,進進行分析析,從而而預測未未來人們們是否會會買入股股票或者者商品?;钚灾笜藰说拿?,帶有有感性的的色彩。其原意意是指

58、生生物體內內發(fā)生的的生理過過程或處處于活動動的狀態(tài)態(tài)或屬性性。數據據的活性性,指代代數據被被更新的的頻次。頻次越越高,活活性越大大。FAACEBBOOKK公司220122年100月,慶慶祝月度度活躍用用戶超過過10億億個。這這里的活活躍用戶戶和數據據的活性性緊密相相關。股股民對換換手率指指標非常常熟悉,換換手率標標志股票票交易是是否活躍躍,成為為判斷股股價走勢勢非常重重要的指指標。新新浪微博博的數據據,無疑疑是最具具活性的的數據之之一,體體現出實實時的價價值。利利用微博博數據,進進行實時時的精準準營銷,是是許多公公司孜孜孜以求的的目標。規(guī)模指標標最容易易理解。沒有“量”的積累累,就沒沒有“質”

59、的突破破。數據據量的增增長,即即是數據據規(guī)模的的擴大。但是到到底有多多大規(guī)模模,才能能算是“大”數據,的的確是各各行各業(yè)業(yè)都很關關心的問問題。譬譬如互聯(lián)聯(lián)網應用用,如果果沒有110000萬個AA股賬戶戶,那絕絕對是呼呼風喚雨雨的“老大”。規(guī)模模這個指指標很重重要,但但不需要要執(zhí)著于于此指標標。不同同行業(yè),不不同的業(yè)業(yè)務,對對規(guī)模的的定義完完全不同同。數據據思維要要先于數數據規(guī)模模。關聯(lián)度指指標反映映不同多多維數據據的內在在聯(lián)系。之所以以把關聯(lián)聯(lián)度拿出出來單獨獨討論,主主要原因因就是同同一企業(yè)業(yè)內部存存在大量量的“孤島”現象,不不同部門門之間積積累的數數據無法法融合,形形不成合合力。關于數據據思

60、維與與數據資資產的運運籌,大數據時代的歷史機遇-產業(yè)變革與數據科學給出了建議:“(一)天下武功,唯快不破。越快地處理數據,越早地獲取信息,就會越及時地做出商業(yè)選擇。(二)更多的數據來源,比更多的數據量更重要。這也是為什么數據資產評價模型中,要把關聯(lián)性和多維度作為重要指標的原因。(三)數據量含多種信息,取決于觀察視角。不要因為短期內沒有用途,而隨意丟棄。(四)面對數據量指數般的增長,要早作打算。(五)大數據不是核心問題,要聚焦于業(yè)務發(fā)展,善于從大數據中挖掘利于業(yè)務發(fā)展的信息。(六)分享,而非保密。數據在流動中增值。流水不腐,戶樞不蠹?!睌祿茖W學家大數據作作為資產產,其搜搜尋、識識別、篩篩選、組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論