大數(shù)據(jù)時(shí)代電子商務(wù)的挑戰(zhàn)與機(jī)遇研究畢業(yè)設(shè)計(jì)論文_第1頁(yè)
大數(shù)據(jù)時(shí)代電子商務(wù)的挑戰(zhàn)與機(jī)遇研究畢業(yè)設(shè)計(jì)論文_第2頁(yè)
大數(shù)據(jù)時(shí)代電子商務(wù)的挑戰(zhàn)與機(jī)遇研究畢業(yè)設(shè)計(jì)論文_第3頁(yè)
大數(shù)據(jù)時(shí)代電子商務(wù)的挑戰(zhàn)與機(jī)遇研究畢業(yè)設(shè)計(jì)論文_第4頁(yè)
大數(shù)據(jù)時(shí)代電子商務(wù)的挑戰(zhàn)與機(jī)遇研究畢業(yè)設(shè)計(jì)論文_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目 錄 TOC o 1-4 h z u HYPERLINK l _Toc385840419 摘要 PAGEREF _Toc385840419 h 1 HYPERLINK l _Toc385840420 Abstract PAGEREF _Toc385840420 h II HYPERLINK l _Toc385840421 第1章 緒論 PAGEREF _Toc385840421 h 1 HYPERLINK l _Toc385840422 選題背景與意義 PAGEREF _Toc385840422 h 1 HYPERLINK l _Toc385840423 電子商務(wù)的發(fā)展現(xiàn)狀 PAGEREF

2、_Toc385840423 h 2 HYPERLINK l _Toc385840424 我國(guó)電子商務(wù)的發(fā)展階段 PAGEREF _Toc385840424 h 3 HYPERLINK l _Toc385840425 電子商務(wù)的PC互聯(lián)時(shí)代 PAGEREF _Toc385840425 h 3 HYPERLINK l _Toc385840426 電子商務(wù)的移動(dòng)互聯(lián)時(shí)代 PAGEREF _Toc385840426 h 4 HYPERLINK l _Toc385840427 電子商務(wù)的大數(shù)據(jù)時(shí)代 PAGEREF _Toc385840427 h 4 HYPERLINK l _Toc385840428 1

3、.4研究方法與主要研究?jī)?nèi)容 PAGEREF _Toc385840428 h 5 HYPERLINK l _Toc385840429 第2章 電子商務(wù)的大數(shù)據(jù)時(shí)代 PAGEREF _Toc385840429 h 6 HYPERLINK l _Toc385840430 電子商務(wù)大數(shù)據(jù)時(shí)代概述 PAGEREF _Toc385840430 h 6 HYPERLINK l _Toc385840431 電子商務(wù)大數(shù)據(jù)時(shí)代的特點(diǎn) PAGEREF _Toc385840431 h 8 HYPERLINK l _Toc385840432 數(shù)據(jù)量大 PAGEREF _Toc385840432 h 8 HYPERLI

4、NK l _Toc385840433 數(shù)據(jù)類型多樣 PAGEREF _Toc385840433 h 9 HYPERLINK l _Toc385840434 數(shù)據(jù)處理速度快 PAGEREF _Toc385840434 h 10 HYPERLINK l _Toc385840435 數(shù)據(jù)價(jià)值密度低 PAGEREF _Toc385840435 h 10 HYPERLINK l _Toc385840436 電子商務(wù)大數(shù)據(jù)時(shí)代的SWOT分析 PAGEREF _Toc385840436 h 11 HYPERLINK l _Toc385840437 優(yōu)勢(shì)分析 PAGEREF _Toc385840437 h 1

5、1 HYPERLINK l _Toc385840438 劣勢(shì)分析 PAGEREF _Toc385840438 h 12 HYPERLINK l _Toc385840439 機(jī)會(huì)分析 PAGEREF _Toc385840439 h 12 HYPERLINK l _Toc385840440 威脅分析 PAGEREF _Toc385840440 h 13 HYPERLINK l _Toc385840441 電子商務(wù)大數(shù)據(jù)時(shí)代的發(fā)展前景 PAGEREF _Toc385840441 h 13 HYPERLINK l _Toc385840442 第3章 電子商務(wù)大數(shù)據(jù)時(shí)代面對(duì)的問(wèn)題與挑戰(zhàn) PAGEREF

6、_Toc385840442 h 16 HYPERLINK l _Toc385840443 3.1 企業(yè)對(duì)大數(shù)據(jù)的認(rèn)知程度 PAGEREF _Toc385840443 h 16 HYPERLINK l _Toc385840444 競(jìng)爭(zhēng)情報(bào)系統(tǒng)的數(shù)據(jù)處理能力 PAGEREF _Toc385840444 h 17 HYPERLINK l _Toc385840445 競(jìng)爭(zhēng)情報(bào)體系組織模式 PAGEREF _Toc385840445 h 18 HYPERLINK l _Toc385840446 相應(yīng)的問(wèn)題解決方案分析 PAGEREF _Toc385840446 h 18 HYPERLINK l _Toc

7、385840447 第4章 電子商務(wù)大數(shù)據(jù)時(shí)代的機(jī)遇 PAGEREF _Toc385840447 h 20 HYPERLINK l _Toc385840448 重構(gòu)精準(zhǔn)營(yíng)銷模式 PAGEREF _Toc385840448 h 20 HYPERLINK l _Toc385840449 大數(shù)據(jù)時(shí)代電商IT基礎(chǔ)設(shè)施的變革 PAGEREF _Toc385840449 h 22 HYPERLINK l _Toc385840450 大數(shù)據(jù)處理模式 PAGEREF _Toc385840450 h 22 HYPERLINK l _Toc385840451 信息檢索服務(wù)的強(qiáng)大性 PAGEREF _Toc3858

8、40451 h 24 HYPERLINK l _Toc385840452 處理能力快速性 PAGEREF _Toc385840452 h 25 HYPERLINK l _Toc385840453 數(shù)據(jù)分析的精準(zhǔn)性 PAGEREF _Toc385840453 h 25 HYPERLINK l _Toc385840454 信息的安全服務(wù) PAGEREF _Toc385840454 h 25 HYPERLINK l _Toc385840455 第5章 阿里巴巴電子商務(wù)大數(shù)據(jù)時(shí)代實(shí)證分析 PAGEREF _Toc385840455 h 27 HYPERLINK l _Toc385840456 阿里大數(shù)

9、據(jù)信息采集與推送 PAGEREF _Toc385840456 h 27 HYPERLINK l _Toc385840457 阿里大數(shù)據(jù)戰(zhàn)略發(fā)展歷程 PAGEREF _Toc385840457 h 28 HYPERLINK l _Toc385840458 數(shù)據(jù)產(chǎn)品戰(zhàn)略 PAGEREF _Toc385840458 h 28 HYPERLINK l _Toc385840459 數(shù)據(jù)平臺(tái)戰(zhàn)略 PAGEREF _Toc385840459 h 28 HYPERLINK l _Toc385840460 阿里大數(shù)據(jù)戰(zhàn)略存在的安全隱患及解決對(duì)策 PAGEREF _Toc385840460 h 29 HYPERL

10、INK l _Toc385840461 結(jié)束語(yǔ) PAGEREF _Toc385840461 h 30 HYPERLINK l _Toc385840462 致謝 PAGEREF _Toc385840462 h 31 HYPERLINK l _Toc385840463 參考文獻(xiàn) PAGEREF _Toc385840463 h 32第1章 緒論根據(jù)IDC機(jī)構(gòu)的定義,“大數(shù)據(jù)”是指為了更經(jīng)濟(jì)、更有效地從高頻率、大容量、不同結(jié)構(gòu)類型的數(shù)據(jù)中獲取有價(jià)值的信息而設(shè)計(jì)的新一代架構(gòu)技術(shù),人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展創(chuàng)新。十年之前,電影天下無(wú)賊中的經(jīng)典對(duì)白“21世紀(jì)什么

11、最貴?人才”被人們爭(zhēng)相傳頌;十年之后,這個(gè)問(wèn)題的答案與時(shí)俱進(jìn)地變?yōu)楫?dāng)前市場(chǎng)熱點(diǎn)數(shù)據(jù)!當(dāng)然,此數(shù)據(jù)已非傳統(tǒng)意義的數(shù)據(jù),而是海量、爆發(fā)式增長(zhǎng)的“大數(shù)據(jù)”。作為繼云計(jì)算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)的又一次顛覆性技術(shù)浪潮,大數(shù)據(jù)被人們視為智慧城市的源泉、精準(zhǔn)營(yíng)銷的根基,其與傳統(tǒng)BI究竟有何區(qū)別?未來(lái)企業(yè)應(yīng)該如何挖掘海量數(shù)據(jù)背后的潛在價(jià)值?自2009年以來(lái),從IBM、甲骨文到谷歌、亞馬遜、Face book,從IDC、Gartner到麥肯錫、普華永道、埃森哲,從紐約時(shí)報(bào)到福布斯、財(cái)富周刊,從科學(xué)、自然雜志到MIT斯隆管理評(píng)論產(chǎn)業(yè)巨頭的實(shí)踐探索、連篇累牘的新聞報(bào)道,令“大數(shù)據(jù)”概念深入人心。顧名思義,“大數(shù)據(jù)”的

12、精髓在于“大”,其不僅說(shuō)明數(shù)據(jù)的數(shù)量龐大,還意味著數(shù)據(jù)種類繁多、結(jié)構(gòu)復(fù)雜,變化速度飛快。大數(shù)據(jù)呈現(xiàn)三種特性:Volume(極多的數(shù)據(jù)量)、Velocity(極快的處理速度)、Variety(極繁的數(shù)據(jù)種類)。Volume指的是數(shù)據(jù)量龐大。如今有許多企業(yè)已面臨單日數(shù)據(jù)量以數(shù)十、數(shù)百TB(萬(wàn)億字節(jié),1TB=1024GB)的速度增加,而近幾年累加的總數(shù)據(jù)量也達(dá)到了PB(1000個(gè)TB)甚至EB(一百萬(wàn)個(gè)TB)等級(jí),這樣的數(shù)據(jù)量令傳統(tǒng)的數(shù)據(jù)庫(kù)不堪重負(fù)。Velocity指企業(yè)數(shù)據(jù)增加的速度越來(lái)越快。諸如移動(dòng)“大數(shù)據(jù)”成就“智慧營(yíng)銷”產(chǎn)業(yè)聚焦Estate Focus、社交網(wǎng)絡(luò)的廣泛應(yīng)用,使得數(shù)據(jù)增加的速度

13、比傳統(tǒng)的應(yīng)用程式快了很多,而在數(shù)據(jù)迅猛增生的背后,處理、分析的能力和速度必須緊跟其后加以完善。Variety則是指數(shù)據(jù)的多樣性、復(fù)雜性。一方面,互聯(lián)網(wǎng)在產(chǎn)生文字資訊的同時(shí),也不斷產(chǎn)出與以往不同的數(shù)據(jù):照片、視頻、微博等;另一方面,IT遍及工作生活的每個(gè)角落,各種各樣的傳感器、監(jiān)控器也不斷產(chǎn)生新的數(shù)據(jù),各種機(jī)器資訊數(shù)據(jù)的形式日趨復(fù)雜多樣,從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù)不斷轉(zhuǎn)化,催生了對(duì)大數(shù)據(jù)技術(shù)的強(qiáng)烈需求。當(dāng)前,從搜索引擎、社交網(wǎng)絡(luò)的普及,到“人手一機(jī)”的智能移動(dòng)終端應(yīng)用,全球互聯(lián)網(wǎng)上的信息總量正以每年30%50%的增速不斷爆漲。人們每天在Facebook分享幾億條內(nèi)容,在Twitter轉(zhuǎn)發(fā)15TB

14、信息,在淘寶瀏覽十億條店鋪、商品,創(chuàng)造上億的成交、收藏紀(jì)錄及3000多萬(wàn)條傳感器資訊IDC發(fā)布的數(shù)字宇宙研究報(bào)告顯示,2011年全球創(chuàng)造的信息數(shù)量達(dá)到1800EB,如果把這些數(shù)據(jù)刻錄到CD碟片中,這些碟片可環(huán)繞地球30圈。而目前這個(gè)數(shù)字還在以每年50%的速度增長(zhǎng),到2020年,全球每年產(chǎn)生的數(shù)字信息將達(dá)到40ZB(1ZB=1024EB),估計(jì)是地球上所有沙粒數(shù)量的57倍?!霸诖髷?shù)據(jù)時(shí)代,信息將呈爆發(fā)式增長(zhǎng),而數(shù)據(jù)價(jià)值密度非常低,找到有價(jià)值的數(shù)據(jù)如同大海撈針,通過(guò)怎樣的產(chǎn)品平臺(tái)和方式提煉數(shù)據(jù)價(jià)值,是關(guān)乎公共事業(yè)發(fā)展和企業(yè)生存的大計(jì),值得大家從戰(zhàn)略角度去思索”在2012年百度世界營(yíng)銷分論壇上,百度

15、商業(yè)產(chǎn)品與技術(shù)執(zhí)行總監(jiān)鄭子斌關(guān)于“大數(shù)據(jù)”時(shí)代的見(jiàn)解,贏得了產(chǎn)業(yè)界的廣泛認(rèn)同。電子商務(wù)的發(fā)展現(xiàn)狀隨著電子商務(wù)的發(fā)展,企業(yè)開(kāi)始應(yīng)用“虛擬購(gòu)物”手段在眾多購(gòu)物場(chǎng)所開(kāi)展逼近現(xiàn)實(shí)的市場(chǎng)研究,以期借助電腦系統(tǒng)在信息處理方面的優(yōu)勢(shì),用靈活、科學(xué)的方法去觀察和分析消費(fèi)行為,加速市場(chǎng)研究過(guò)程。根據(jù)哈佛商學(xué)院研究人員對(duì)多種產(chǎn)品銷售的分析?!疤摂M購(gòu)物”能獲得較為可靠、準(zhǔn)確的市場(chǎng)信息,其記錄數(shù)據(jù)與實(shí)際購(gòu)物數(shù)據(jù)之間的相關(guān)系數(shù)大多在90%以上。由此看來(lái),“虛擬購(gòu)物”能夠克服傳統(tǒng)市場(chǎng)研究手段的缺點(diǎn),對(duì)企業(yè)營(yíng)銷大有裨益。但電子商務(wù)對(duì)營(yíng)銷的影響并不局限在市場(chǎng)研究的范圍內(nèi)?;ヂ?lián)網(wǎng)是一個(gè)國(guó)際性的開(kāi)放系統(tǒng),企業(yè)一旦涉足其中,就要面

16、對(duì)世界各國(guó)的潛在顧客即訪問(wèn)者,于是自覺(jué)或不覺(jué)地成為進(jìn)行國(guó)際營(yíng)銷的國(guó)際性企業(yè)。這就促使企業(yè)特別是以往針對(duì)本地市場(chǎng)的中小企業(yè)去考慮更為復(fù)雜的營(yíng)銷戰(zhàn)略問(wèn)題。根據(jù)目前對(duì)“在線購(gòu)物”所進(jìn)行的研究,企業(yè)與顧客在互聯(lián)網(wǎng)上的交易一般是起源于顧客對(duì)企業(yè)或產(chǎn)品、服務(wù)的尋找,即對(duì)互聯(lián)網(wǎng)上相關(guān)企業(yè)或產(chǎn)品、服務(wù)信息的瀏覽或訪問(wèn)。這與以往市場(chǎng)交易的起始方向似正相反,從而帶來(lái)營(yíng)銷及相應(yīng)經(jīng)營(yíng)規(guī)則的重大改變:其一,根據(jù)顧客的訪問(wèn)信息,企業(yè)可以更明確地界定潛在市場(chǎng)。營(yíng)銷的重點(diǎn),是最大限度地令訪問(wèn)者成為消費(fèi)者,該項(xiàng)工作也可望因企業(yè)在互聯(lián)網(wǎng)上對(duì)多媒體展示內(nèi)容的巧妙運(yùn)用而達(dá)到很高的成功率;其二,在顧客對(duì)企業(yè)的訪問(wèn)過(guò)程中,雙方在互聯(lián)網(wǎng)上

17、必然產(chǎn)生交互作用,企業(yè)因此及時(shí)獲得顧客對(duì)其產(chǎn)品、服務(wù)的信息反饋。當(dāng)這些信息被輸入先進(jìn)的生產(chǎn)經(jīng)營(yíng)系統(tǒng)時(shí),就可以用批量處理的效率去提供滿足不同顧客需求的產(chǎn)品、服務(wù),實(shí)現(xiàn)比批量生產(chǎn)更勝一籌的批量個(gè)人化。從一定意義上講,電子商務(wù)的國(guó)際化發(fā)展,預(yù)示著未來(lái)企業(yè)經(jīng)營(yíng)革命的方向。電子商務(wù)也對(duì)企業(yè)管理產(chǎn)生影響。在企業(yè)內(nèi)部管理方面,管理人員以往注重對(duì)企業(yè)施加充分的控制以完成效率目標(biāo)。組織結(jié)構(gòu)的設(shè)立和辦公、生產(chǎn)經(jīng)營(yíng)場(chǎng)所的界定,使管理者得以結(jié)合等級(jí)制進(jìn)行現(xiàn)場(chǎng)管理控制,控制的主要對(duì)象之一,是可以觀測(cè)到的員工行為。此時(shí)企業(yè)的經(jīng)營(yíng)效率將更多地取決于組織內(nèi)部的合作溝通情況,而合作溝通又與組織成員之間的信任程度密切相關(guān)。類似的

18、情況也出現(xiàn)在企業(yè)間及企業(yè)外部管理方面。由于外聯(lián)網(wǎng)的出現(xiàn),多個(gè)企業(yè)得以共享國(guó)際化、專業(yè)化程度高、靈活性強(qiáng)、反應(yīng)速度快等好處。但是在外聯(lián)網(wǎng)這種松散的“虛擬”聯(lián)盟體系中,一個(gè)企業(yè)很難對(duì)其伙伴企業(yè)施加那些在合資合作企業(yè)和一般戰(zhàn)略聯(lián)盟中行之有效的控制手段,整個(gè)外聯(lián)網(wǎng)運(yùn)作的成敗主要取決于各成員企業(yè)之間的相互信任和溝通。然而對(duì)于在電子商務(wù)方面起步較晚的發(fā)展中國(guó)家如中國(guó)及其企業(yè)來(lái)說(shuō),這一機(jī)遇同時(shí)也是嚴(yán)峻的挑戰(zhàn)。實(shí)際上,發(fā)達(dá)國(guó)家的企業(yè)在應(yīng)用電子商務(wù)以后,經(jīng)營(yíng)過(guò)程的資源處理活動(dòng)相對(duì)減少,信息處理活動(dòng)相對(duì)增加;能源應(yīng)用相對(duì)減少,知識(shí)應(yīng)用相對(duì)增加。這種向信息、知識(shí)密集型經(jīng)營(yíng)轉(zhuǎn)換的直接結(jié)果,是越來(lái)越多的行業(yè)出現(xiàn)了類似于

19、“馬太效應(yīng)”的報(bào)酬遞增竟?fàn)帣C(jī)制。從這個(gè)角度看,電子商務(wù)有可能像過(guò)去二三百年間對(duì)發(fā)端于西方國(guó)家的許多重大技術(shù)進(jìn)步的應(yīng)用那樣,在推動(dòng)人類物質(zhì)文明進(jìn)步的同時(shí),也導(dǎo)致發(fā)達(dá)國(guó)家與發(fā)展中國(guó)家之間在經(jīng)濟(jì)發(fā)展和企業(yè)經(jīng)營(yíng)等方面差距的進(jìn)一步擴(kuò)大。 HYPERLINK l _Toc23367 電子商務(wù)的PC互聯(lián)時(shí)代電子商務(wù)的起源可以追溯到互聯(lián)網(wǎng)(Internet)和電子數(shù)據(jù)交換的出現(xiàn)。前者為電子商務(wù)的推廣應(yīng)用奠定了基礎(chǔ);后者是電子商務(wù)的初始應(yīng)用方式,至今仍是電子商務(wù)的重要組成部分。60年代末期,美國(guó)國(guó)防部高級(jí)項(xiàng)目管理處建立了聯(lián)接美國(guó)各大學(xué)與國(guó)防工業(yè)合同商之間的電腦網(wǎng)絡(luò)ARPANE,繼而開(kāi)發(fā)了該網(wǎng)絡(luò)的標(biāo)準(zhǔn)通訊協(xié)議TC

20、P/IP。至80年代中期,美國(guó)國(guó)家科學(xué)基金會(huì)利用ARPANET的模式形成了自己的電腦網(wǎng)絡(luò)NSFNE,并逐漸與ARpA NET合并。與此同時(shí),諸如Usenet、ll TNET,經(jīng)由各自的電腦系統(tǒng)以共用的交易標(biāo)準(zhǔn)進(jìn)行商業(yè)信息的交換,這就是電子數(shù)據(jù)交換。70年代中期,美國(guó)運(yùn)輸行業(yè)制定了T l)cc交易標(biāo)準(zhǔn),率先應(yīng)用這一先進(jìn)的商務(wù)手段。其后美國(guó)國(guó)家標(biāo)準(zhǔn)局在T l)CC的基礎(chǔ)上制定了ANslX12交易標(biāo)準(zhǔn),并負(fù)責(zé)對(duì)增值網(wǎng)的合格認(rèn)證工作,促進(jìn)了電子數(shù)據(jù)交換在多個(gè)產(chǎn)業(yè)部門的應(yīng)用。近年來(lái),電子數(shù)據(jù)交換的管道進(jìn)一步從私人線路和增值網(wǎng)擴(kuò)展到互聯(lián)網(wǎng)上。用戶急劇增多。據(jù)估計(jì),目前全美使用電子數(shù)據(jù)交換的企業(yè)已經(jīng)超過(guò)5萬(wàn)

21、家,到2000年時(shí)將達(dá)20萬(wàn)家左右,其應(yīng)用前景由此可見(jiàn)一斑。1993年9月,美國(guó)克林頓政府發(fā)布規(guī)劃信息高速公路的行動(dòng)綱領(lǐng),將電子商務(wù)、遠(yuǎn)程教學(xué)、電子醫(yī)療列為三大信息支柱項(xiàng)目,一系列旨在加速信息高速公路建設(shè)的公共政策也相繼出臺(tái),這對(duì)推廣電子商務(wù)的應(yīng)用有很大的幫助。與此同時(shí),www服務(wù)器及相關(guān)技術(shù)的出現(xiàn),為企業(yè)提供了在互聯(lián)網(wǎng)上傳輸內(nèi)容豐富、栩栩如生的多媒體信息的手段,從而得以在網(wǎng)絡(luò)上開(kāi)展內(nèi)外部經(jīng)營(yíng)管理活動(dòng),如生產(chǎn)經(jīng)營(yíng)管理、人力資源管理、財(cái)務(wù)管理、營(yíng)銷、咨詢服務(wù)等。企業(yè)界和一般消費(fèi)者對(duì)新一代基于互聯(lián)網(wǎng)信息技術(shù)的逐步接受,也成為電子商務(wù)應(yīng)用的另一種不容忽視的推動(dòng)力。目前電子商務(wù)的內(nèi)容已經(jīng)十分廣泛,覆蓋

22、企業(yè)經(jīng)營(yíng)的許多個(gè)方面。電子商務(wù)的一般框架可圖示如下:圖1電子商務(wù)的概念框架電子商務(wù)的移動(dòng)互聯(lián)時(shí)代移動(dòng)互聯(lián)網(wǎng)是一個(gè)全國(guó)性的、以寬帶IP為技術(shù)核心的,可同時(shí)提供語(yǔ)音、 、數(shù)據(jù)、圖像、多媒體等高品質(zhì)電信服務(wù)的新一代開(kāi)放的電信基礎(chǔ)網(wǎng)絡(luò)。簡(jiǎn)單地說(shuō),移動(dòng)互聯(lián)網(wǎng)能讓用戶在移動(dòng)中通過(guò)移動(dòng)設(shè)備(如 、iPod等移動(dòng)終端)隨時(shí)、隨地訪問(wèn)Internet、獲取信息,進(jìn)行商務(wù)、娛樂(lè)等各種網(wǎng)絡(luò)服務(wù)。終端、網(wǎng)絡(luò)與應(yīng)用是移動(dòng)互聯(lián)網(wǎng)的3個(gè)要素。正是由于中國(guó)3G網(wǎng)絡(luò)的投入運(yùn)營(yíng),iPhone、Android等智能 終端以及應(yīng)用平臺(tái)的出現(xiàn),才使得移動(dòng)互聯(lián)網(wǎng)得以如此迅猛地發(fā)展。中國(guó)目前約有8.4億的 用戶、3.02億的 網(wǎng)民,新興且

23、前景光明的移動(dòng)互聯(lián)網(wǎng)成為眾企業(yè)垂涎的蛋糕。諸如新浪微博、街旁、米聊等,甚至是開(kāi)心網(wǎng)、優(yōu)酷也都紛紛推出自己的 客戶端。中國(guó)社會(huì)化媒體幾乎都可以從國(guó)外找到原型,從You tube到優(yōu)酷、土豆,從Twitter到新浪、騰訊微博,以及各種消費(fèi)點(diǎn)評(píng)、問(wèn)答百科、位置服務(wù)等,這些媒體為普通用戶提供了極大的互動(dòng)交流空間。隨著中國(guó)的互聯(lián)網(wǎng)產(chǎn)業(yè)進(jìn)入一個(gè)持續(xù)、快速、穩(wěn)定的發(fā)展時(shí)期,豐富多彩的互聯(lián)網(wǎng)應(yīng)用已成為國(guó)人生活中必不可少的部分。移動(dòng)互聯(lián)網(wǎng)應(yīng)用繽紛多彩,娛樂(lè)、商務(wù)、信息服務(wù)等各種各樣應(yīng)用開(kāi)始滲入人們的基本生活。 電視、視頻通話、 音樂(lè)下載、 游戲、 IM、移動(dòng)搜索、移動(dòng)支付等移動(dòng)數(shù)據(jù)業(yè)務(wù)開(kāi)始帶給用戶新的體驗(yàn)。電子

24、商務(wù)的大數(shù)據(jù)時(shí)代大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。業(yè)界將其特點(diǎn)歸結(jié)為4VVolume(數(shù)據(jù)體量巨大)、Velocity(數(shù)據(jù)類型繁多)、Variety(價(jià)值密度低)、Veracity(處理速度快)。與傳統(tǒng)數(shù)據(jù)相比較,大數(shù)據(jù)包含數(shù)據(jù)交換、互聯(lián)、質(zhì)量、安全等數(shù)據(jù)體系建設(shè)以及建設(shè)上層數(shù)據(jù)應(yīng)用的整個(gè)生態(tài)圈。在大數(shù)據(jù)時(shí)代浪潮中,時(shí)間每過(guò)去3分鐘,全球?qū)?huì)產(chǎn)生6.12億封郵件,6000萬(wàn)張照片,將會(huì)有18.3萬(wàn)小時(shí)的音樂(lè)被下載,有76.4個(gè)視頻在優(yōu)酷被上傳,有14.

25、1萬(wàn)個(gè)程序在蘋果商店被使用,支付寶上將產(chǎn)生4400萬(wàn)人民幣的交易額。這種爆炸性增長(zhǎng)的數(shù)據(jù)量對(duì)于企業(yè)發(fā)展來(lái)說(shuō),是一筆取之不盡、用之不竭的財(cái)富。阿里巴巴、京東商城等眾多網(wǎng)絡(luò)巨頭正因?yàn)榭粗辛诉@座金礦,紛紛提出將數(shù)據(jù)作為未來(lái)發(fā)展的重要戰(zhàn)略之一。2013年,電商的競(jìng)爭(zhēng)很大程度上就是大數(shù)據(jù)的競(jìng)爭(zhēng),大數(shù)據(jù)將貫穿整個(gè)電商的業(yè)務(wù)流程,成為公司核心競(jìng)爭(zhēng)力。目前,大數(shù)據(jù)在現(xiàn)實(shí)世界中已有著非常廣泛的分布和應(yīng)用,包括醫(yī)療信息、視頻監(jiān)控、移動(dòng)設(shè)備、智能設(shè)備、非傳統(tǒng)IT設(shè)備、傳統(tǒng)IT信息的非傳統(tǒng)應(yīng)用以及特定行業(yè)需求等。 HYPERLINK l _Toc24543 近年來(lái),伴隨著互聯(lián)網(wǎng)、3S技術(shù)(GPS、GIS、RS)、以及

26、智能 的迅速發(fā)展,人文社會(huì)科學(xué)領(lǐng)域的研究數(shù)據(jù)獲取與處理已經(jīng)出現(xiàn)了新的趨向。主要包括:利用軟件對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘;利用GPS或LBS設(shè)備,結(jié)合GIS或網(wǎng)絡(luò)日志來(lái)采集與分析居民行為數(shù)據(jù);利用網(wǎng)絡(luò)地圖對(duì)獲取的數(shù)據(jù)進(jìn)行可視化開(kāi)發(fā)。這些技術(shù)可以作為大數(shù)據(jù)時(shí)代城市時(shí)空間行為研究數(shù)據(jù)的重要來(lái)源,將有利于擴(kuò)大研究的范圍,并增加研究結(jié)果的精確性。網(wǎng)絡(luò)數(shù)據(jù)挖掘是計(jì)算機(jī)科學(xué)研究的重要內(nèi)容,包括內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用挖掘3種類型。其中,內(nèi)容挖掘是對(duì)網(wǎng)頁(yè)文本和媒體數(shù)據(jù)的獲取,用于研究用戶活動(dòng)狀態(tài)和特征;結(jié)構(gòu)挖掘是對(duì)網(wǎng)頁(yè)鏈接結(jié)構(gòu)進(jìn)行分析,用于評(píng)估網(wǎng)頁(yè)的資源量;使用挖掘則是通過(guò)挖掘網(wǎng)頁(yè)訪問(wèn)的日志記錄,以便提供個(gè)性化的產(chǎn)品

27、和服務(wù)以此來(lái)研究電子商務(wù)的大數(shù)據(jù)時(shí)代。 HYPERLINK l _Toc30878 第2章 電子商務(wù)的大數(shù)據(jù)時(shí)代近年來(lái),以互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電信網(wǎng)、廣電網(wǎng)、無(wú)線寬帶網(wǎng)為基礎(chǔ)的智慧城市建設(shè)帶來(lái)了數(shù)據(jù)量的爆發(fā)式增長(zhǎng),“大數(shù)據(jù)”像血液一樣遍布智慧交通、智慧醫(yī)療、智慧生活、智慧營(yíng)銷等城市生活的方方面面,并推動(dòng)社會(huì)職能部門及企業(yè)決策者們從“經(jīng)驗(yàn)治理”向“科學(xué)治理”轉(zhuǎn)型。如何挖掘海量數(shù)據(jù)的潛在價(jià)值,為城市治理、市民生活、企業(yè)營(yíng)銷提供可靠的決策建議,是智慧城市發(fā)展所面臨的重要課題,亦是企業(yè)在未來(lái)市場(chǎng)競(jìng)爭(zhēng)中搶占先機(jī)的關(guān)鍵。電子商務(wù)大數(shù)據(jù)時(shí)代概述“大數(shù)據(jù)”時(shí)代(“Age of Big Data”)這一說(shuō)法的流行得

28、力于全球知名咨詢公司麥肯錫的倡導(dǎo),英國(guó)牛津大學(xué)教授維克托邁爾舍恩伯格更在其大數(shù)據(jù)時(shí)代:生活、工作和思維的改變中大聲疾呼,斷言一個(gè)史無(wú)前例的大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨!“大數(shù)據(jù)”(“Big data”)顯然并不是一個(gè)嚴(yán)格的學(xué)理性概念,而更多地是一個(gè)描述性話語(yǔ)。所謂大數(shù)據(jù),也就是大型數(shù)據(jù)集,一般在10TB規(guī)模左右。多個(gè)數(shù)據(jù)集一整合,就會(huì)形成PB級(jí),甚至以E、Z等為計(jì)量單位的數(shù)據(jù)量。過(guò)去幾年全世界產(chǎn)生的數(shù)據(jù)量甚至超過(guò)了歷史上4萬(wàn)年來(lái)產(chǎn)生的數(shù)據(jù)量的總和。這種激增的數(shù)據(jù)量勢(shì)必突破傳統(tǒng)常規(guī)軟件的信息處理能力極限。大數(shù)據(jù)的說(shuō)法正是在與傳統(tǒng)數(shù)據(jù)庫(kù)的比照中形成的,也注定只能是一個(gè)暫時(shí)性的權(quán)宜說(shuō)法。隨著信息技術(shù)的進(jìn)一步發(fā)

29、展,更大的數(shù)據(jù)集合會(huì)不斷出現(xiàn),今日所謂的“大數(shù)據(jù)”勢(shì)必相形見(jiàn)絀。IT業(yè)界通常將大數(shù)據(jù)的特征概括為四個(gè)“V”:體量(volumes)巨、類別(variety)多、速度(Velocity)快、價(jià)值(Value)大。大數(shù)據(jù)之大首先是指體量大。大數(shù)據(jù)和傳統(tǒng)所說(shuō)的數(shù)據(jù)庫(kù)有所不同。誕生在20世紀(jì)70年代的傳統(tǒng)數(shù)據(jù)庫(kù)是小型的、單一的、孤立的,基于小范圍的抽樣樣本統(tǒng)計(jì)。而大數(shù)據(jù)則要求窮盡一切相關(guān)樣本,搜集盡可能全面的數(shù)據(jù),大數(shù)據(jù)的數(shù)據(jù)集擁有的不是支離破碎的割裂數(shù)據(jù),不是數(shù)據(jù)片段,而是完整的數(shù)據(jù)。數(shù)據(jù)的海量與數(shù)據(jù)的完整性使大數(shù)據(jù)有著傳統(tǒng)的數(shù)據(jù)庫(kù)無(wú)法比擬的信息優(yōu)勢(shì)。大數(shù)據(jù)之大還在于氣魄大、境界大。大數(shù)據(jù)的來(lái)源也有

30、別于傳統(tǒng)的數(shù)據(jù)庫(kù),顯示出了跨領(lǐng)域、跨門類、多類別的整合氣魄和越界意識(shí),如果說(shuō)非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)一直沒(méi)有被納入經(jīng)典數(shù)據(jù)庫(kù)技術(shù)SQL的視野,那么大數(shù)據(jù)的數(shù)據(jù)則源自多種數(shù)據(jù)源,是一種綜合數(shù)據(jù),兼收并蓄了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等各種類別和格式的數(shù)據(jù),尤其是包含了大量的視頻音頻數(shù)據(jù)。這使其信息占有量和信息復(fù)雜度為傳統(tǒng)數(shù)據(jù)庫(kù)所無(wú)法比擬。這些海量數(shù)據(jù)本身就會(huì)凸顯以往不為人們注意的事物的多方面的關(guān)聯(lián)性,因此這種數(shù)據(jù)更能顯示出多方面的信息內(nèi)涵,信息質(zhì)量更為優(yōu)化,信息意味更為繁復(fù)。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)的差異還在于它并不是一個(gè)整齊排列,有著固定層次結(jié)構(gòu)、劃一技術(shù)標(biāo)準(zhǔn)、反饋遲滯后延的物態(tài)化的實(shí)體

31、,而是一個(gè)靈活、越界、即時(shí)、交互、綜合的動(dòng)態(tài)過(guò)程,可以在瞬間完成信息分析,形成數(shù)據(jù)圖譜,滿足社會(huì)各界人士的實(shí)時(shí)性需求。大數(shù)據(jù)之大更在于處理信息的手筆大。大數(shù)據(jù)的要害不在于數(shù)據(jù)存儲(chǔ)技術(shù)的升級(jí)躍進(jìn),大數(shù)據(jù)的“大”不是指存儲(chǔ)和備份的數(shù)據(jù)大,在根本上它是指處理數(shù)據(jù)所使用的模式“大”。大數(shù)據(jù)在今天的時(shí)代里儼然成為了一種新的產(chǎn)業(yè)資源,通過(guò)盡力搜集整理全面數(shù)據(jù)、完整數(shù)據(jù)、綜合數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行深度智能分析和建模,可以顯示出各種事物的潛在關(guān)聯(lián),挖掘出各種以往不為人知的相關(guān)性,判斷事物發(fā)生的概率,預(yù)測(cè)事物變化的走向,預(yù)見(jiàn)某種社會(huì)趨勢(shì),從而使魚龍混雜的信息在大數(shù)據(jù)時(shí)代的社會(huì)管理、商業(yè)營(yíng)銷、產(chǎn)業(yè)開(kāi)發(fā)、文化創(chuàng)意、醫(yī)療保

32、健等方面更能發(fā)揮見(jiàn)微知著的預(yù)見(jiàn)性價(jià)值,據(jù)此各行各業(yè)都可以有的放矢地制定新策略,成就新創(chuàng)意,開(kāi)發(fā)新產(chǎn)品,推出新業(yè)務(wù)。雖然早在1980年著名未來(lái)學(xué)家阿爾文托夫勒在其第三次浪潮一書中已經(jīng)提到“大數(shù)據(jù)”一詞。在20世紀(jì)90年代,“數(shù)據(jù)倉(cāng)庫(kù)之父”比爾伊蒙(Bill In mon)更明確提出了“大數(shù)據(jù)”的概念。但在當(dāng)時(shí)“大數(shù)據(jù)”的說(shuō)法并沒(méi)有引起世人的高度關(guān)注。最近幾年大數(shù)據(jù)一說(shuō)不脛而走,顯然與信息量的持續(xù)攀升、大數(shù)據(jù)的俯拾即是、云計(jì)算的大量運(yùn)用息息相關(guān)。一夜之間,人類儼然進(jìn)入了一個(gè)全新的“大數(shù)據(jù)”時(shí)代。實(shí)際上,大數(shù)據(jù)時(shí)代的到來(lái)早有征兆。20世紀(jì)80、90年代所謂的信息爆炸可謂是今日的大數(shù)據(jù)潮流的先聲。只不

33、過(guò),目前物聯(lián)網(wǎng)、移動(dòng)通訊、互聯(lián)網(wǎng)每時(shí)每刻都在不斷滋生潮水般的海量數(shù)據(jù),人類的信息數(shù)據(jù)在以幾何指數(shù)形式激增。根據(jù)市場(chǎng)調(diào)研公司IDC的報(bào)告,全球信息總量每過(guò)兩年就會(huì)增長(zhǎng)一倍。據(jù)統(tǒng)計(jì),1分鐘內(nèi),微博網(wǎng)站推特上新發(fā)信息超過(guò)10萬(wàn)條,臉譜上的瀏覽量超過(guò)600萬(wàn),蘋果應(yīng)用商店下載次數(shù)以萬(wàn)計(jì),淘寶可賣出幾萬(wàn)件商品,百度能產(chǎn)生百萬(wàn)次搜索記錄。而以往的數(shù)字化信息存儲(chǔ)和處理能力嚴(yán)重限制了信息的采集、存儲(chǔ)量。這些TB級(jí)、PB級(jí)海量數(shù)據(jù)的存儲(chǔ)、挖掘、處理、分析、利用對(duì)于以往時(shí)代來(lái)說(shuō)是不可想象的。在過(guò)去,存儲(chǔ)的主要是模擬數(shù)據(jù),報(bào)紙、書籍、圖片、磁帶等媒介是信息存儲(chǔ)的主要載體,甚至在2000年的時(shí)候,數(shù)字存儲(chǔ)信息仍只占全

34、球數(shù)據(jù)量的四分之一;當(dāng)時(shí),另外四分之三的信息都存儲(chǔ)在報(bào)紙、膠片、黑膠唱片和盒式磁帶這類媒介上。P23數(shù)據(jù)處理技術(shù)和處理能力的局限使大量在交通、醫(yī)療、商業(yè)、管理中產(chǎn)生的數(shù)據(jù)資料都難以得到長(zhǎng)期有效的存儲(chǔ)。直到MPP、MapReduce、Hadoop平臺(tái)、云計(jì)算等新的數(shù)據(jù)處理技術(shù)誕生后,海量的大數(shù)據(jù)才被深度挖掘。處理,顯示出了前所未有的價(jià)值。但大數(shù)據(jù)潮流的深層根源顯然還是利潤(rùn)最大化的商業(yè)沖動(dòng),大數(shù)據(jù)產(chǎn)業(yè)說(shuō)到底不過(guò)是數(shù)字經(jīng)濟(jì)、知識(shí)經(jīng)濟(jì)的最新形態(tài),這也是“大數(shù)據(jù)”這個(gè)為管理咨詢公司、經(jīng)濟(jì)學(xué)家、IT界巨頭歡欣鼓舞的概念招人質(zhì)疑的重要原因。但是商業(yè)化潮流既可能導(dǎo)致文化的沙化、社會(huì)的急功近利、商業(yè)的唯利是圖,

35、也會(huì)成為文化創(chuàng)新的不竭動(dòng)力,開(kāi)啟知識(shí)創(chuàng)造的新天地和新境界。事實(shí)上,正是近年來(lái)數(shù)字化領(lǐng)域的商業(yè)逐利沖動(dòng)驅(qū)使商家不斷改換思路,升級(jí)設(shè)備,實(shí)現(xiàn)數(shù)字技術(shù)創(chuàng)新,提升數(shù)字服務(wù)水準(zhǔn),開(kāi)辟新的產(chǎn)業(yè)領(lǐng)域,開(kāi)發(fā)新的文化產(chǎn)品,開(kāi)創(chuàng)了蔚為潮流的大數(shù)據(jù)產(chǎn)業(yè),也開(kāi)啟了有別于互聯(lián)網(wǎng)時(shí)代的“數(shù)字化生存“的新境界。2.2電子商務(wù)大數(shù)據(jù)時(shí)代的特點(diǎn)大數(shù)據(jù)是一個(gè)較為抽象的概念,正如信息學(xué)領(lǐng)域大多數(shù)新興概念,大數(shù)據(jù)至今尚無(wú)確切、統(tǒng)一的定義。在維基百科中關(guān)于大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具來(lái)獲取、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集。個(gè)人認(rèn)為,這并不是一個(gè)精確的定義,因?yàn)闊o(wú)法確定常用軟件工具的范圍,可容忍時(shí)間也是個(gè)概略

36、的描述。IDC在對(duì)大數(shù)據(jù)作出的定義為:大數(shù)據(jù)一般會(huì)涉及2種或2種以上數(shù)據(jù)形式。它要收集超過(guò)100TB的數(shù)據(jù),并且是高速、實(shí)時(shí)數(shù)據(jù)流;或者是從小數(shù)據(jù)開(kāi)始,但數(shù)據(jù)每年會(huì)增長(zhǎng)60%以上。這個(gè)定義給出了量化標(biāo)準(zhǔn),但只強(qiáng)調(diào)數(shù)據(jù)量大,種類多,增長(zhǎng)快等數(shù)據(jù)本身的特征。研究機(jī)構(gòu)Gartner給出了這樣的定義:大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。這也是一個(gè)描述性的定義,在對(duì)數(shù)據(jù)描述的基礎(chǔ)上加入了處理此類數(shù)據(jù)的一些特征,用這些特征來(lái)描述大數(shù)據(jù)。當(dāng)前,較為統(tǒng)一的認(rèn)識(shí)是大數(shù)據(jù)有四個(gè)基本特征:數(shù)據(jù)規(guī)模大(Volume),數(shù)據(jù)種類多(Variety),數(shù)

37、據(jù)要求處理速度快(Velocity),數(shù)據(jù)價(jià)值密度低(Value),即所謂的四V特性。這些特性使得大數(shù)據(jù)區(qū)別于傳統(tǒng)的數(shù)據(jù)概念。大數(shù)據(jù)的概念與“海量數(shù)據(jù)”不同,后者只強(qiáng)調(diào)數(shù)據(jù)的量,而大數(shù)據(jù)不僅用來(lái)描述大量的數(shù)據(jù),還更進(jìn)一步指出數(shù)據(jù)的復(fù)雜形式、數(shù)據(jù)的快速時(shí)間特性以及對(duì)數(shù)據(jù)的分析、處理等專業(yè)化處理,最終獲得有價(jià)值信息的能力。數(shù)據(jù)量大大數(shù)據(jù)聚合在一起的數(shù)據(jù)量是非常大的,根據(jù)IDC的定義至少要有超過(guò)100TB的可供分析的數(shù)據(jù),數(shù)據(jù)量大是大數(shù)據(jù)的基本屬性。導(dǎo)致數(shù)據(jù)規(guī)模激增的原因有很多,首先是隨著互聯(lián)網(wǎng)絡(luò)的廣泛應(yīng)用,使用網(wǎng)絡(luò)的人、企業(yè)、機(jī)構(gòu)增多,數(shù)據(jù)獲取、分享變得相對(duì)容易,以前,只有少量的機(jī)構(gòu)可以通過(guò)調(diào)查、

38、取樣的方法獲取數(shù)據(jù),同時(shí)發(fā)布數(shù)據(jù)的機(jī)構(gòu)也很有限,人們難以短期內(nèi)獲取大量的數(shù)據(jù),而現(xiàn)在用戶可以通過(guò)網(wǎng)絡(luò)非常方便的獲取數(shù)據(jù),同時(shí)用戶在有意的分享和無(wú)意的點(diǎn)擊、瀏覽都可以快速的提供大量數(shù)據(jù);其次是隨著各種傳感器數(shù)據(jù)獲取能力的大幅提高,使得人們獲取的數(shù)據(jù)越來(lái)越接近原始事物本身,描述同一事物的數(shù)據(jù)量激增。早期的單位化數(shù)據(jù),對(duì)原始事物進(jìn)行了一定程度的抽象,數(shù)據(jù)維度低,數(shù)據(jù)類型簡(jiǎn)單,多采用表格的形式來(lái)收集、存儲(chǔ)、整理,數(shù)據(jù)的單位、量綱和意義基本統(tǒng)一,存儲(chǔ)、處理的只是數(shù)值而已,因此數(shù)據(jù)量有限,增長(zhǎng)速度慢而隨著應(yīng)用的發(fā)展,數(shù)據(jù)維度越來(lái)越高,描述相同事物所需的數(shù)據(jù)量越來(lái)越大。以當(dāng)前最為普遍的網(wǎng)絡(luò)數(shù)據(jù)為例,早期網(wǎng)絡(luò)

39、上的數(shù)據(jù)以文本和一維的音頻為主,維度低,單位數(shù)據(jù)量小。近年來(lái),圖像、視頻等二維數(shù)據(jù)大規(guī)模涌現(xiàn),而隨著三維掃描設(shè)備以及Kinect等動(dòng)作捕捉設(shè)備的普及,數(shù)據(jù)越來(lái)越接近真實(shí)的世界,數(shù)據(jù)的描述能力不斷增強(qiáng),而數(shù)據(jù)量本身必將以幾何級(jí)數(shù)增長(zhǎng)。此外,數(shù)據(jù)量大還體現(xiàn)在人們處理數(shù)據(jù)的方法和理念發(fā)生了根本的改變。早期,人們對(duì)事物的認(rèn)知受限于獲取、分析數(shù)據(jù)的能力,一直利用采樣的方法,以少量的數(shù)據(jù)來(lái)近似的描述事物的全貌,樣本的數(shù)量可以根據(jù)數(shù)據(jù)獲取、處理能力來(lái)設(shè)定。不管事物多么復(fù)雜,通過(guò)采樣得到部分樣本,數(shù)據(jù)規(guī)模變小,就可以利用當(dāng)時(shí)的技術(shù)手段來(lái)進(jìn)行數(shù)據(jù)管理和分析,如何通過(guò)正確的采樣方法以最小的數(shù)據(jù)量盡可能分析整體屬性

40、成了當(dāng)時(shí)的重要問(wèn)題。隨著技術(shù)的發(fā)展,樣本數(shù)目逐漸逼近原始的總體數(shù)據(jù),且在某些特定的應(yīng)用領(lǐng)域,采樣數(shù)據(jù)可能遠(yuǎn)不能描述整個(gè)事物,可能丟掉大量重要細(xì)節(jié),甚至可能得到完全相反的結(jié)論,因此,當(dāng)今有直接處理所有數(shù)據(jù)而不是只考慮采樣數(shù)據(jù)的的趨勢(shì)。使用所有的數(shù)據(jù)可以帶來(lái)更高的精確性,從更多的細(xì)節(jié)來(lái)解釋事物屬性,同時(shí)必然使得要處理數(shù)據(jù)量顯著增多。2.2.2數(shù)據(jù)類型多樣數(shù)據(jù)類型繁多,復(fù)雜多變是大數(shù)據(jù)的重要特性。以往的數(shù)據(jù)盡管數(shù)量龐大,但通常是事先定義好的結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是將事物向便于人類和計(jì)算機(jī)存儲(chǔ)、處理、查詢的方向抽象的結(jié)果,結(jié)構(gòu)化在抽象的過(guò)程中,忽略一些在特定的應(yīng)用下可以不考慮的細(xì)節(jié),抽取了有用的信息。

41、處理此類結(jié)構(gòu)化數(shù)據(jù),只需事先分析好數(shù)據(jù)的意義以數(shù)據(jù)間的相關(guān)屬性,構(gòu)造表結(jié)構(gòu)來(lái)表示數(shù)據(jù)的屬性,數(shù)據(jù)都以表格的形式保存在數(shù)據(jù)庫(kù)中,數(shù)據(jù)格式統(tǒng)一,以后不管再產(chǎn)生多少數(shù)據(jù),只需根據(jù)其屬性,將數(shù)據(jù)存儲(chǔ)在合適的位置,就可以方便的處理、查詢,一般不需要為新增的數(shù)據(jù)顯著的更改數(shù)據(jù)聚集、處理、查詢方法,限制數(shù)據(jù)處理能力的只是運(yùn)算速度和存儲(chǔ)空間。這種關(guān)注結(jié)構(gòu)化信息,強(qiáng)調(diào)大眾化、標(biāo)準(zhǔn)化的屬性使得處理傳統(tǒng)數(shù)據(jù)的復(fù)雜程度一般呈線性增長(zhǎng),新增的數(shù)據(jù)可以通過(guò)常規(guī)的技術(shù)手段處理。而隨著互聯(lián)網(wǎng)絡(luò)與傳感器的飛速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)大量涌現(xiàn),非結(jié)構(gòu)化數(shù)據(jù)沒(méi)有統(tǒng)一的結(jié)構(gòu)屬性,難以用表結(jié)構(gòu)來(lái)表示,在記錄數(shù)據(jù)數(shù)值的同時(shí)還需要存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)

42、,增加了數(shù)據(jù)存儲(chǔ)、處理的難度。而時(shí)下在網(wǎng)絡(luò)上流動(dòng)著的數(shù)據(jù)大部分是非結(jié)構(gòu)化數(shù)據(jù),人們上網(wǎng)不只是看看新聞,發(fā)送文字郵件,還會(huì)上傳下載照片、視頻、發(fā)送微博等非結(jié)構(gòu)化數(shù)據(jù),同時(shí),遍及工作、生活中各個(gè)角落的傳感器也時(shí)刻不斷的產(chǎn)生各種半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),這些結(jié)構(gòu)復(fù)雜,種類多樣,同時(shí)規(guī)模又很大的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)逐漸成為主流數(shù)據(jù)。如上所述,非結(jié)構(gòu)化數(shù)據(jù)量已占到數(shù)據(jù)總量的75%以上,且非結(jié)構(gòu)化數(shù)據(jù)的增長(zhǎng)速度比結(jié)構(gòu)化數(shù)據(jù)快10倍到50倍。在數(shù)據(jù)激增的同時(shí),新的數(shù)據(jù)類型層出不窮,已經(jīng)很難用一種或幾種規(guī)定的模式來(lái)表征日趨復(fù)雜、多樣的數(shù)據(jù)形式,這樣的數(shù)據(jù)已經(jīng)不能用傳統(tǒng)的數(shù)據(jù)庫(kù)表格來(lái)整齊的排列、表示。大數(shù)據(jù)正是

43、在這樣的背景下產(chǎn)生的,大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)處理最大的不同就是重點(diǎn)關(guān)注非結(jié)構(gòu)化信息,大數(shù)據(jù)關(guān)注包含大量細(xì)節(jié)信息的非結(jié)構(gòu)化數(shù)據(jù),強(qiáng)調(diào)小眾化,體驗(yàn)化的特性使得傳統(tǒng)的數(shù)據(jù)處理方式面臨巨大的挑戰(zhàn)。數(shù)據(jù)處理速度快要求數(shù)據(jù)的快速處理,是大數(shù)據(jù)區(qū)別于傳統(tǒng)海量數(shù)據(jù)處理的重要特性之一。隨著各種傳感器和互聯(lián)網(wǎng)絡(luò)等信息獲取、傳播技術(shù)的飛速發(fā)展普及,數(shù)據(jù)的產(chǎn)生、發(fā)布越來(lái)越容易,產(chǎn)生數(shù)據(jù)的途徑增多,個(gè)人甚至成為了數(shù)據(jù)產(chǎn)生的主體之一,數(shù)據(jù)呈爆炸的形式快速增長(zhǎng),新數(shù)據(jù)不斷涌現(xiàn),快速增長(zhǎng)的數(shù)據(jù)量要求數(shù)據(jù)處理的速度也要相應(yīng)的提升,才能使得大量的數(shù)據(jù)得到有效的利用,否則不斷激增的數(shù)據(jù)不但不能為解決問(wèn)題帶來(lái)優(yōu)勢(shì),反而成了快速解決問(wèn)題的負(fù)

44、擔(dān)。同時(shí),數(shù)據(jù)不是靜止不動(dòng)的,而是在互聯(lián)網(wǎng)絡(luò)中不斷流動(dòng),且通常這樣的數(shù)據(jù)的價(jià)值是隨著時(shí)間的推移而迅速降低的,如果數(shù)據(jù)尚未得到有效的處理,就失去了價(jià)值,大量的數(shù)據(jù)就沒(méi)有意義。此外,在許多應(yīng)用中要求能夠?qū)崟r(shí)處理新增的大量數(shù)據(jù),比如有大量在線交互的電子商務(wù)應(yīng)用,就具有很強(qiáng)的時(shí)效性,大數(shù)據(jù)以數(shù)據(jù)流的形式產(chǎn)生、快速流動(dòng)、迅速消失,且數(shù)據(jù)流量通常不是平穩(wěn)的,會(huì)在某些特定的時(shí)段突然激增,數(shù)據(jù)的涌現(xiàn)特征明顯,而用戶對(duì)于數(shù)據(jù)的響應(yīng)時(shí)間通常非常敏感,心理學(xué)實(shí)驗(yàn)證實(shí),從用戶體驗(yàn)的角度,瞬間(moment,3秒鐘)是可以容忍的最大極限,對(duì)于大數(shù)據(jù)應(yīng)用而言,很多情況下都必須要在1秒鐘或者瞬間內(nèi)形成結(jié)果,否則處理結(jié)果就是

45、過(guò)時(shí)和無(wú)效的,這種情況下,大數(shù)據(jù)要求快速、持續(xù)的實(shí)時(shí)處理。對(duì)不斷激增的海量數(shù)據(jù)數(shù)據(jù)的實(shí)時(shí)處理要求,是大數(shù)據(jù)與傳統(tǒng)海量數(shù)據(jù)處理技術(shù)的關(guān)鍵差別之一。數(shù)據(jù)價(jià)值密度低數(shù)據(jù)價(jià)值密度低是大數(shù)據(jù)關(guān)注的非結(jié)構(gòu)化數(shù)據(jù)的重要屬性。傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),依據(jù)特定的應(yīng)用,對(duì)事物進(jìn)行了相應(yīng)的抽象,每一條數(shù)據(jù)都包含該應(yīng)用需要考量的信息,而大數(shù)據(jù)為了獲取事物的全部細(xì)節(jié),不對(duì)事物進(jìn)行抽象、歸納等處理,直接采用原始的數(shù)據(jù),保留了數(shù)據(jù)的原貌,且通常不對(duì)數(shù)據(jù)進(jìn)行采樣,直接采用全體數(shù)據(jù),由于減少了采樣和抽象,呈現(xiàn)所有數(shù)據(jù)和全部細(xì)節(jié)信息,可以分析更多的信息,但也引入了大量沒(méi)有意義的信息,甚至是錯(cuò)誤的信息,因此相對(duì)于特定的應(yīng)用,大數(shù)據(jù)關(guān)注的

46、非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值密度偏低,以當(dāng)前廣泛應(yīng)用的監(jiān)控視頻為例,在連續(xù)不間斷監(jiān)控過(guò)程中,大量的視頻數(shù)據(jù)被存儲(chǔ)下來(lái),許多數(shù)據(jù)可能是無(wú)用,對(duì)于某一特定的應(yīng)用,比如獲取犯罪嫌疑人的體貌特征,有效的視頻數(shù)據(jù)可能僅僅有一兩秒,大量不相關(guān)的視頻信息增加了獲取這有效的一兩秒數(shù)據(jù)的難度。但是大數(shù)據(jù)的數(shù)據(jù)密度低是指相對(duì)于特定的應(yīng)用,有效的信息相對(duì)于數(shù)據(jù)整體是偏少的,信息有效與否也是相對(duì)的,對(duì)于某些應(yīng)用是無(wú)效的信息對(duì)于另外一些應(yīng)用則成為最關(guān)鍵的信息,數(shù)據(jù)的價(jià)值也是相對(duì)的,有時(shí)一條微不足道的細(xì)節(jié)數(shù)據(jù)可能造成巨大的影響,比如網(wǎng)絡(luò)中的一條幾十個(gè)字符的微博,就可能通過(guò)轉(zhuǎn)發(fā)而快速擴(kuò)散,導(dǎo)致相關(guān)的信息大量涌現(xiàn),其價(jià)值不可估量。因此

47、為了保證對(duì)于新產(chǎn)生的應(yīng)用有足夠的有效信息,通常必須保存所有數(shù)據(jù),這樣就使得一方面是數(shù)據(jù)的絕對(duì)數(shù)量激增,一方面是數(shù)據(jù)包含有效信息量的比例不斷減少,數(shù)據(jù)價(jià)值密度偏低。電子商務(wù)大數(shù)據(jù)時(shí)代的SWOT分析優(yōu)勢(shì)分析1、資源優(yōu)勢(shì)對(duì)檔案館而言,其最大的優(yōu)勢(shì)在于所擁有的資源。首先,檔案館信息資源總量龐大且增長(zhǎng)迅速。2008年,全國(guó)各級(jí)國(guó)家檔案館共保存檔案1.93億卷,較上年增加1769萬(wàn)卷,增幅達(dá)10%,而到2011年各級(jí)國(guó)家檔案館館藏已達(dá)3.3億卷,到2020年各級(jí)國(guó)家檔案館館藏將達(dá)到6億多卷。其次,檔案館數(shù)據(jù)資源種類繁多。在檔案館的數(shù)據(jù)資源中,既有數(shù)字化的紙質(zhì)檔案、接收進(jìn)館的電子文件、音視頻檔案等,也有用戶

48、利用信息、服務(wù)數(shù)據(jù)等數(shù)據(jù)資源。再次,檔案館數(shù)據(jù)資源價(jià)值很高。與其它數(shù)據(jù)資源等相比,“檔案是一種最真實(shí)、最可靠、最具權(quán)威性與憑證性的原生信息資源”,這就使得數(shù)據(jù)洪流時(shí)代檔案的價(jià)值與作用更加凸顯。2、行業(yè)領(lǐng)先首先,各級(jí)國(guó)家檔案館是集中統(tǒng)一保管黨和國(guó)家檔案的科學(xué)文化事業(yè)機(jī)構(gòu),是永久保管檔案的基地,是社會(huì)各界利用檔案史料的中心。作為一種機(jī)構(gòu)性存在與制度性安排,檔案館的公共性、服務(wù)性、公平性、永久性等特征,使得檔案館成為人們心目中最系統(tǒng)、最值得信賴的數(shù)據(jù)資源庫(kù)。大數(shù)據(jù)時(shí)代,檔案館維護(hù)和傳承記憶的功能將更加重要,構(gòu)建一個(gè)“基于互聯(lián)網(wǎng)的,以檔案數(shù)字資源為主體,以文本、圖片、音頻、視頻等為形式,為中華民族集體

49、記憶的建構(gòu)和傳承提供文獻(xiàn)支撐的中國(guó)記憶數(shù)字將成為檔案人新的目標(biāo)與使命。其次,檔案館在數(shù)據(jù)處理上具有豐富的經(jīng)驗(yàn)??疾鞌?shù)據(jù)生命周期,涉及到數(shù)據(jù)生成、采集、傳輸、處理、分析、應(yīng)用等階段,而這也恰恰是檔案館熟悉的業(yè)務(wù)范疇。因此,檔案館可以通過(guò)模擬或借鑒傳統(tǒng)檔案處理的整套業(yè)務(wù)規(guī)范或流程來(lái)指導(dǎo)大數(shù)據(jù)的處理,“對(duì)知識(shí)規(guī)范性控制的思想和技術(shù)方法恰巧在大數(shù)據(jù)領(lǐng)域有了用武之地”。劣勢(shì)分析1、認(rèn)識(shí)問(wèn)題作為一個(gè)檔案大國(guó),幾千年檔案工作的歷史積淀在我國(guó)形成了豐富多彩的檔案文化,也形成了一套獨(dú)特的檔案思維模式。大數(shù)據(jù)時(shí)代,有可能出現(xiàn)兩種認(rèn)識(shí)問(wèn)題:一是沒(méi)有大數(shù)據(jù)意識(shí),即無(wú)視大數(shù)據(jù)時(shí)代的來(lái)臨,采取固守原狀的鴕鳥(niǎo)政策,這將使檔

50、案館失去未來(lái)的發(fā)展機(jī)會(huì),甚至?xí)ゴ嬖诘囊饬x。二是泛大數(shù)據(jù)化,即不加鑒別地收集保存數(shù)據(jù),從而使檔案館陷入數(shù)據(jù)沼澤,進(jìn)而喪失自己的特色,顯然這也是檔案館無(wú)法承受的。因此,大數(shù)據(jù)背景下,科學(xué)認(rèn)識(shí)大數(shù)據(jù)的內(nèi)涵,合理地選擇切入點(diǎn),將是檔案館在大數(shù)據(jù)時(shí)代立足的首要問(wèn)題,而這或許也是檔案館最難解決的一個(gè)問(wèn)題。2、人才瓶頸在檔案事業(yè)快速發(fā)展的今天,我國(guó)的檔案人才隊(duì)伍建設(shè)卻不盡如人意。一是專業(yè)人才不足。以2006年為例,全國(guó)各?。ǔ_(tái)灣外)、自治區(qū)、直轄市各級(jí)檔案館中具備博士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員為零,具備碩士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員只有26人,具備學(xué)士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員只有1

51、598人。二是信息技術(shù)人才的匱乏?!按髷?shù)據(jù)泡沫如果現(xiàn)在存在的話,恐怕并非數(shù)據(jù)的作用被過(guò)分夸大,而主要是由于真正具備資質(zhì)的數(shù)據(jù)科學(xué)家數(shù)量不足導(dǎo)致的?!睋?jù)統(tǒng)計(jì),到2018年美國(guó)將面臨150萬(wàn)個(gè)掌握大數(shù)據(jù)應(yīng)用分析方法的技術(shù)經(jīng)理和分析師缺口,另缺14萬(wàn)至19萬(wàn)具有“深度分析”經(jīng)驗(yàn)的工作者。從目前來(lái)看,大數(shù)據(jù)成功的案例無(wú)不是特定的項(xiàng)目,例如“啤酒與尿布”,因此,現(xiàn)階段檔案館人員最需要的是懂得用戶的需求,因?yàn)閿?shù)據(jù)越大,用戶的個(gè)性需求就越多樣,服務(wù)切口就越小。毫無(wú)疑問(wèn),這需要檔案人員擁有極強(qiáng)的洞察能力。機(jī)會(huì)分析1、需求旺盛隨著信息環(huán)境的變化和社會(huì)檔案意識(shí)的覺(jué)醒,用戶的檔案信息需求層面不斷加深,需求領(lǐng)域也不斷

52、拓展。首先,精品化的信息需求與專業(yè)化的知識(shí)服務(wù)要求。隨著社會(huì)檔案意識(shí)的增強(qiáng),“用戶關(guān)注的已不再是簡(jiǎn)單的獲取文獻(xiàn),而是如何從繁雜的信息環(huán)境中捕獲和析取解決所面臨問(wèn)題的信息內(nèi)容,并將這些信息融化或重組為相應(yīng)的知識(shí)或解決方案”。其次,個(gè)性化的信息需求與互動(dòng)式的信息服務(wù)要求。隨著用戶信息素養(yǎng)的不斷提高,檔案用戶已從信息服務(wù)的“被動(dòng)接受者”轉(zhuǎn)換為“主動(dòng)選擇者”,他們更希望獲得一種為自己量身定做的個(gè)性化信息服務(wù)。同時(shí),用戶在獲取信息的過(guò)程中,希望能與館員進(jìn)行人際交流與相互溝通,從而獲取文化的熏陶、思想的碰撞及心靈的浸潤(rùn)。2、政策導(dǎo)向2010年國(guó)家檔案局?jǐn)?shù)字檔案館建設(shè)指南頒布,提出運(yùn)用多種技術(shù)手段“采集具有

53、重要保存價(jià)值的各類數(shù)字信息,進(jìn)行資源整合”、“對(duì)數(shù)字檔案信息進(jìn)行深度挖掘,開(kāi)展增值服務(wù)”、“開(kāi)展檔案利用訪問(wèn)量統(tǒng)計(jì)、分布分析、輿情分析等工作”。2012年楊冬權(quán)在全國(guó)檔案局館長(zhǎng)會(huì)議上講話指出,要在新的起點(diǎn)上進(jìn)一步推進(jìn)檔案信息化,即從過(guò)去以技術(shù)為主導(dǎo)向以服務(wù)為主導(dǎo)轉(zhuǎn)變,從注重應(yīng)用信息技術(shù)向注重檔案內(nèi)容信息化轉(zhuǎn)變,樹(shù)立“內(nèi)容為王”的觀念,建設(shè)以服務(wù)為主導(dǎo)的檔案信息化體系。這些政策性文件及講話,將為大數(shù)據(jù)在檔案館中的應(yīng)用帶來(lái)更多的政策支持,也為大數(shù)據(jù)時(shí)代檔案館的發(fā)展帶來(lái)更多機(jī)遇。威脅分析1、信息安全大數(shù)據(jù)時(shí)代,數(shù)據(jù)量之大、數(shù)據(jù)種類之多、對(duì)數(shù)據(jù)處理速度與時(shí)間之快,都對(duì)傳統(tǒng)的檔案館安全體系造成極大沖擊。

54、從基礎(chǔ)技術(shù)角度而言,當(dāng)前檔案館廣泛應(yīng)用的關(guān)系型數(shù)據(jù)庫(kù)(SQL)技術(shù),經(jīng)過(guò)長(zhǎng)期實(shí)踐與完善,在維護(hù)數(shù)據(jù)安全方面已經(jīng)設(shè)置了嚴(yán)格的訪問(wèn)控制和隱私管理工具,而大數(shù)據(jù)依托的基礎(chǔ)技術(shù)是非關(guān)系型數(shù)據(jù)庫(kù)(No SQL),其在成熟度和可訪問(wèn)性方面都不如傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)。從核心價(jià)值角度而言,大數(shù)據(jù)的關(guān)鍵在于信息爆炸時(shí)代對(duì)數(shù)據(jù)價(jià)值的再挖掘。然而,數(shù)據(jù)分析技術(shù)的發(fā)展,對(duì)國(guó)家安全及用戶隱私產(chǎn)生了極大威脅,數(shù)據(jù)持有人可以從歷史數(shù)據(jù)中推測(cè)判斷出行為人的下一步動(dòng)作個(gè)人行動(dòng)軌跡、行為軌跡,甚至思維軌跡。2、用戶流失大數(shù)據(jù)時(shí)代,檔案館面臨著網(wǎng)絡(luò)、圖書館及信息服務(wù)公司等的競(jìng)爭(zhēng),用戶流失是不爭(zhēng)的事實(shí)。以網(wǎng)絡(luò)為例,網(wǎng)絡(luò)信息資源的豐富使用戶

55、足不出戶就可以獲取所需的信息,用戶對(duì)檔案館的穩(wěn)定性與忠誠(chéng)度下降。據(jù)統(tǒng)計(jì),“超過(guò)90%的用戶在查找信息時(shí),會(huì)首選搜索引擎,搜索已經(jīng)成為公眾獲取信息的代名詞”。因此,數(shù)字化時(shí)代,檔案館如何實(shí)現(xiàn)“數(shù)據(jù)化生存”,將是不得不慎重考慮的難題。2.4電子商務(wù)大數(shù)據(jù)時(shí)代的發(fā)展前景20年后互聯(lián)網(wǎng)發(fā)生的巨大的變化,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)大大拓展了互聯(lián)網(wǎng)的疆界和應(yīng)用領(lǐng)域。我們?cè)谙硎鼙憷耐瑫r(shí),也無(wú)償貢獻(xiàn)了自己的“行蹤”。現(xiàn)在互聯(lián)網(wǎng)不但知道對(duì)面是一只狗,還知道這只狗喜歡什么食物、幾點(diǎn)出去遛彎,幾點(diǎn)回窩睡覺(jué)。我們不得不接受這個(gè)現(xiàn)實(shí),每個(gè)人在互聯(lián)網(wǎng)進(jìn)入到大數(shù)據(jù)時(shí)代,都將是透明性存在。在物理世界中,許多行為是“人似秋

56、鴻有來(lái)信,事如春夢(mèng)了無(wú)痕”。但在互聯(lián)網(wǎng)上卻是“處處行跡處處痕”。任何行為,皆有前兆。要買商品,必先瀏覽,對(duì)比,詢價(jià);要搞活動(dòng),必先征集、討論、策劃;互聯(lián)網(wǎng)上恰恰保留了大量的前兆性的數(shù)據(jù),通過(guò)對(duì)這些數(shù)據(jù)的收集和分析,互聯(lián)網(wǎng)企業(yè)具備了預(yù)判物理世界中,人類未來(lái)行為的能力。收集分析海量的各種類型的數(shù)據(jù),并快速獲取影響未來(lái)的信息的能力,這就是大數(shù)據(jù)技術(shù)的魅力。事實(shí)上大數(shù)據(jù)的來(lái)源非常廣泛,天上的衛(wèi)星、地上汽車、埋在土壤里面的各類傳感器,無(wú)時(shí)無(wú)刻不在生成大量的數(shù)據(jù)。這些數(shù)據(jù)如果綜合利用,產(chǎn)生的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值將是難以估量的。第一篇報(bào)告大數(shù)據(jù)時(shí)代即將到來(lái),之所以用時(shí)代這個(gè)詞作為標(biāo)題,是因?yàn)榇髷?shù)據(jù)是歷史上首個(gè)

57、可以預(yù)測(cè)人類短期行為的技術(shù)。未來(lái)的不確定性,是人類產(chǎn)生恐懼的根源之一,也是各類組織最為頭痛的問(wèn)題。大數(shù)據(jù)技術(shù)技術(shù)讓我們看到解決未來(lái)預(yù)測(cè)問(wèn)題的一絲曙光。 “08年初,阿里巴巴平臺(tái)上整個(gè)買家詢盤數(shù)急劇下滑,歐美對(duì)中國(guó)采購(gòu)在下滑。海關(guān)是賣了貨,出去以后再獲得數(shù)據(jù);而我們提前半年時(shí)間從詢盤上推斷出世界貿(mào)易發(fā)生變化了?!蓖ǔ6?,買家在采購(gòu)商品前,會(huì)比較多家供應(yīng)商的產(chǎn)品,反映到阿里巴巴網(wǎng)站統(tǒng)計(jì)數(shù)據(jù)中,就是查詢點(diǎn)擊的數(shù)量和購(gòu)買點(diǎn)擊的數(shù)量會(huì)保持一個(gè)相對(duì)的數(shù)值。統(tǒng)計(jì)歷史上所有買家、賣家的詢價(jià)和成交的數(shù)據(jù),可以形成詢盤指數(shù)和成交指數(shù)。這兩個(gè)指數(shù)是強(qiáng)相關(guān)的。詢盤指數(shù)是前兆性的,前期詢盤指數(shù)活躍,就會(huì)保證后期一定的

58、成交量。所以當(dāng)馬云觀察到詢盤指數(shù)異乎尋常的下降,自然就可以推測(cè)未來(lái)成交量的萎縮。這種統(tǒng)計(jì)和分析,如果缺少大數(shù)據(jù)技術(shù)的支持,是難以完成的。這次事件,馬云提前呼吁、幫助成千上萬(wàn)的中小制造商準(zhǔn)備過(guò)冬糧,從而贏得了崇高的聲譽(yù)。 推動(dòng)大數(shù)據(jù)技術(shù)在各行業(yè)普及的原動(dòng)力,來(lái)自于企業(yè)改善自身經(jīng)營(yíng)水平、提升經(jīng)營(yíng)效率的需要。長(zhǎng)期以來(lái),困擾企業(yè)最大的難題就是“如何更加了解他的客戶”。索尼公司的創(chuàng)始人出井伸之解釋索尼衰落的根本原因時(shí),說(shuō)了一段發(fā)人深省的話:“新一代基于互聯(lián)網(wǎng)DNA企業(yè)的核心能力在于利用新模式和新技術(shù)更加貼近消費(fèi)者、深刻理解需求、高效分析信息并做出預(yù)判,所有傳統(tǒng)的產(chǎn)品公司都只能淪為這種新型用戶平臺(tái)級(jí)公司的

59、附庸,其衰落不是管理能扭轉(zhuǎn)的。互聯(lián)網(wǎng)的魅力就是the power of low end”。這句話有兩層含義。第一,傳統(tǒng)企業(yè)衰落的根本原因在于難以貼近消費(fèi)者,難以了解消費(fèi)者的真正的需求。第二,互聯(lián)網(wǎng)公司強(qiáng)項(xiàng)恰恰是天然的貼近消費(fèi)者,了解消費(fèi)者。傳統(tǒng)企業(yè)必然嫁接互聯(lián)網(wǎng)企業(yè)的DNA,否則必將淪為互聯(lián)網(wǎng)企業(yè)的附庸。 這一輪的變革,事關(guān)絕大多數(shù)企業(yè)的命運(yùn)??梢钥吹?,用大數(shù)據(jù)這個(gè)視角,可以察企業(yè)的興衰。第一,對(duì)大數(shù)據(jù)不關(guān)心,不了解。必步索尼的后塵;第二,擁有大量的數(shù)據(jù),并善加運(yùn)用的公司,必將贏得未來(lái)。時(shí)代變了,判斷企業(yè)價(jià)值的標(biāo)準(zhǔn)、判斷軟件價(jià)值的標(biāo)準(zhǔn)也變了。我們判斷軟件價(jià)值的標(biāo)準(zhǔn)是它所協(xié)助管理的數(shù)據(jù)的規(guī)模和活

60、性。我們判斷公司價(jià)值的標(biāo)準(zhǔn)是其擁有數(shù)據(jù)的規(guī)模、活性,以及收集、運(yùn)用數(shù)據(jù)的能力。圍繞數(shù)據(jù)和最終用戶,我們觀察到計(jì)算機(jī)行業(yè)的發(fā)展有三大趨勢(shì):第一應(yīng)用軟件一定會(huì)泛互聯(lián)網(wǎng)化。第二,行業(yè)會(huì)垂直整合。越靠近終端用戶的公司,在產(chǎn)業(yè)鏈上將擁有更大的發(fā)言權(quán)。第三,數(shù)據(jù)將成為資產(chǎn)。泛互聯(lián)網(wǎng)化是收集數(shù)據(jù)的重要渠道,沒(méi)有泛互聯(lián)網(wǎng)化的應(yīng)用軟件,公司就難以獲得用戶的行為數(shù)據(jù);行業(yè)垂直整合趨勢(shì)在數(shù)據(jù)運(yùn)用層面,通過(guò)搜集大量的用戶數(shù)據(jù),更貼近用戶,更理解用戶,為其提供更適當(dāng)?shù)姆?wù);數(shù)據(jù)成為資產(chǎn)更強(qiáng)調(diào)數(shù)據(jù)的戰(zhàn)略意義。 HYPERLINK l _Toc22365 第3章 電子商務(wù)大數(shù)據(jù)時(shí)代面對(duì)的問(wèn)題與挑戰(zhàn)大數(shù)據(jù)作為新興產(chǎn)業(yè)熱點(diǎn),在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論