大數(shù)據(jù)、小數(shù)據(jù)_第1頁(yè)
大數(shù)據(jù)、小數(shù)據(jù)_第2頁(yè)
大數(shù)據(jù)、小數(shù)據(jù)_第3頁(yè)
大數(shù)據(jù)、小數(shù)據(jù)_第4頁(yè)
大數(shù)據(jù)、小數(shù)據(jù)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)(bigdata)正酣,小數(shù)據(jù)(iData)又來(lái)!主題概述:

(一)小數(shù)據(jù)的介紹和定義

(二)小數(shù)據(jù)產(chǎn)生的原因

(1)大數(shù)據(jù)對(duì)隱私無(wú)止境的侵犯和個(gè)體對(duì)主動(dòng)保護(hù)隱私的需求。

(2)對(duì)統(tǒng)一全面管理分析個(gè)人數(shù)據(jù)的巨大需求.

(三)小數(shù)據(jù)的特性和大數(shù)據(jù)的對(duì)比

(四)小數(shù)據(jù)發(fā)展的廣闊前景。

(五)小數(shù)據(jù)的發(fā)展最需解決的三個(gè)大問(wèn)題.蔡凱龍:

大家好,我是蔡凱龍,很高興也很感謝秘書長(zhǎng)易歡歡,讓我有機(jī)會(huì)和大家一起在互聯(lián)網(wǎng)金融千人會(huì)舉辦的早餐會(huì)來(lái)交流體會(huì)和心得。我這次主題是:小數(shù)據(jù)(iData)的大時(shí)代:數(shù)據(jù)革命的下一個(gè)前沿陣地。每一小節(jié)我都會(huì)預(yù)留點(diǎn)時(shí)間,歡迎大家提問(wèn)題,讓我們的交流碰出思想的火花吧。剛才開車回來(lái),在路上bloomberg廣播,說(shuō)美國(guó)大IT行業(yè),Google.FacebookTwitter,Apple.Microsoft.AOL,Linkedlin,Yahoo聯(lián)名給國(guó)會(huì)和總統(tǒng)寫信。要求制定政府竊取個(gè)人隱私的詳細(xì)策略,并且要求有獨(dú)立第三方來(lái)監(jiān)督,這個(gè)呼吁是跟Snowden的泄露的棱鏡計(jì)劃有關(guān),因?yàn)樵谒孤兜挠?jì)劃里曾經(jīng)說(shuō)到美國(guó)政府公開或者非公共入侵所有美國(guó)大科技公司的數(shù)據(jù)庫(kù),監(jiān)控所有的信息。美國(guó)總統(tǒng)今天出來(lái)講話,說(shuō)政府不會(huì)偷看美國(guó)公民的個(gè)人信息,只是為了反恐和監(jiān)測(cè)海外活動(dòng),不會(huì)違反憲法,一定會(huì)盡力保護(hù)美國(guó)公民隱私。他提到的個(gè)人隱私,和我今天要和大家交流的小數(shù)據(jù)有關(guān)。(一)小數(shù)據(jù)的介紹和定義數(shù)據(jù)革命的最終目的,就是給每個(gè)人都配備類似于美國(guó)總統(tǒng)的白宮級(jí)別的服務(wù)。這不是科幻,這是數(shù)據(jù)革命即將開創(chuàng)的另一個(gè)前沿陣地,小數(shù)據(jù)的大時(shí)代。小數(shù)據(jù)(iData),指的是圍繞個(gè)人為中心全方位的數(shù)據(jù),及其配套的收集,處理,分析,和對(duì)外交互的綜合系統(tǒng)。人的一舉一動(dòng),一分一秒,產(chǎn)生的數(shù)據(jù),包括生活習(xí)慣,身體狀況,社交,財(cái)務(wù),喜好,情緒,行為的等等,全部被收集和利用和分析,并對(duì)外形成一個(gè)富有個(gè)人色彩的數(shù)據(jù)系統(tǒng),統(tǒng)一執(zhí)行交換數(shù)據(jù),保護(hù)隱私等多項(xiàng)對(duì)外功能。小數(shù)據(jù)跟大數(shù)據(jù)的根本區(qū)別在于,小數(shù)據(jù)以單個(gè)人為唯一的對(duì)象,重點(diǎn)在于深度,對(duì)個(gè)人數(shù)據(jù)全方位全天候深入精確的挖掘利用,大數(shù)據(jù)則側(cè)重在某個(gè)領(lǐng)域方面,大范圍大規(guī)模全面數(shù)據(jù)收集處理分析,側(cè)重在于廣度。小數(shù)據(jù)只有圍繞一個(gè)人,你就是小數(shù)據(jù)世界里的美國(guó)總統(tǒng),小數(shù)據(jù)就是你的白宮辦公室,它聽命于你,收集關(guān)于你全方位信息,提供給你最貼心最完整的數(shù)據(jù)服務(wù),同時(shí)擔(dān)任對(duì)外界大數(shù)據(jù)的唯一接口。小數(shù)據(jù)并不是大數(shù)據(jù)老酒裝新瓶,把大數(shù)據(jù)思維操作模式簡(jiǎn)單套在小數(shù)據(jù)上并不適用。接下來(lái)我具體從小數(shù)據(jù)的成因,特性,發(fā)展前景和問(wèn)題,這四個(gè)方面來(lái)談?wù)勑?shù)據(jù)是怎樣作為大數(shù)據(jù)的互補(bǔ)和延伸的。(二)小數(shù)據(jù)產(chǎn)生的原因1.大數(shù)據(jù)對(duì)隱私無(wú)止境的侵犯和個(gè)人對(duì)主動(dòng)保護(hù)隱私的需求。1993年《紐約客》刊登了一副漫畫:標(biāo)題是:“互聯(lián)網(wǎng)上,沒有人知道你是一條狗”。經(jīng)過(guò)20年互聯(lián)網(wǎng),移動(dòng)互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)以及大數(shù)據(jù)的快速發(fā)展,我們已經(jīng)毫無(wú)隱私成為透明人了?,F(xiàn)在這句話應(yīng)該改成:“不要說(shuō)互聯(lián)網(wǎng)另一端是一個(gè)人,即使是一條狗,我甚至能知道它身上有沒有跳蚤”。在數(shù)據(jù)為王的時(shí)代,個(gè)人隱私遭到肆意的踐踏和侵犯。你上網(wǎng)買個(gè)東西,或者在社交網(wǎng)上發(fā)個(gè)言,很簡(jiǎn)單一個(gè)動(dòng)作,瞬間同時(shí)的在政府網(wǎng)絡(luò)監(jiān)控,電話上網(wǎng)公司,買東西網(wǎng)站,社交網(wǎng),搜索網(wǎng)站,信用卡銀行,還有專門收集資料的爬蟲系統(tǒng)。。等等,留下你詳細(xì)的個(gè)人資料。更可怕的是,這些都是永久的,任何時(shí)候都不知道會(huì)被誰(shuí)調(diào)用,會(huì)被人肉搜索到。大數(shù)據(jù)的基因里有對(duì)數(shù)據(jù)無(wú)限的渴求。因此以企業(yè)為主的大數(shù)據(jù),在追求最大商業(yè)利益的同時(shí),是不可能主動(dòng)保護(hù)個(gè)人隱私的??梢哉f(shuō),大數(shù)據(jù)和個(gè)人隱私保護(hù)是天生不可調(diào)和的根本矛盾。隨著隱私被侵犯的弊端逐漸浮現(xiàn),各國(guó)都有不同程度的立法來(lái)保護(hù)個(gè)人隱私。但是至今為止,實(shí)際收效甚微,我們對(duì)隱私大規(guī)模被侵犯仍然束手無(wú)策。不過(guò)想想連德國(guó)總理默克爾,這么一個(gè)大國(guó)最高領(lǐng)導(dǎo)人的手機(jī)都會(huì)被竊聽,我們這些普通大眾的隱私在國(guó)家利益和商業(yè)利潤(rùn)面前,又怎么能夠被真正被保護(hù)呢?難怪StevenRambam,一個(gè)互聯(lián)網(wǎng)隱私專家曾經(jīng)說(shuō)過(guò)一句讓人很絕望的話:"Privacyisdead---getoverit."“隱私已死,愛怎么著怎么著吧”這時(shí)候,迫切需要從技術(shù)上,讓個(gè)人主動(dòng)而不是被動(dòng)的保護(hù)自己的隱私。小數(shù)據(jù)就能很好解決個(gè)人隱私和大數(shù)據(jù)的矛盾。小數(shù)據(jù)對(duì)內(nèi)是一切個(gè)人數(shù)據(jù)的集合,對(duì)外是個(gè)人數(shù)據(jù)的唯一接口。任何對(duì)外的數(shù)據(jù)輸出,都需通過(guò)預(yù)先設(shè)定授權(quán)程序。而外面大數(shù)據(jù)其實(shí)不是真的對(duì)你的隱私感興趣,就比如說(shuō)大數(shù)據(jù)要分析用戶對(duì)一個(gè)新車的市場(chǎng),他需要同時(shí)知道你年齡性別收入等等,但是大數(shù)據(jù)最終目的不是要拿這些隱私,而是拿這些作為大數(shù)據(jù)分析模型必須的素材,最后分析出你喜歡或者不喜歡這輛車。其實(shí)小數(shù)據(jù)在這方面更有優(yōu)勢(shì),甚至細(xì)微到主人喜歡什么顏色,買車主要目的是上班還是休閑等,只要把小數(shù)據(jù)分析結(jié)果而不是隱私內(nèi)容,通知給大數(shù)據(jù)。這樣既能保護(hù)個(gè)人隱私,又能提供大數(shù)據(jù)最準(zhǔn)確的信息。完美解決大數(shù)據(jù)和隱私之間的矛盾。同時(shí)小數(shù)據(jù)還能在保護(hù)隱私的監(jiān)控上掌握主動(dòng)。我們都知道,注冊(cè)登記任何社交網(wǎng),都要求你同意密密麻麻天書一般的法律條文。我相信沒有人會(huì)真正認(rèn)真去看這些條文,因?yàn)橛媚_后跟想都知道,里面法律術(shù)語(yǔ)晦澀難懂,看懂了你又能怎么樣,還不得乖乖"IAgree"我同意。這都是企業(yè)合法用你數(shù)據(jù)資料的同時(shí),用來(lái)規(guī)避法律責(zé)任的保護(hù)傘。這可是企業(yè)雇傭龐大律師團(tuán)隊(duì)花巨資寫出來(lái)的,我們個(gè)人在保護(hù)隱私上完全被動(dòng)而且勢(shì)單力薄。如果有了小數(shù)據(jù),這下我們從被動(dòng)變主動(dòng)。你企業(yè)要用我小數(shù)據(jù),好,沒問(wèn)題,數(shù)據(jù)是我的,我控制能給你什么,不能給你什么。比如你問(wèn)我喜不喜歡這輛新車,我告訴你我喜歡,但我不告訴你我年齡和家里存款。同時(shí)外部使用我的小數(shù)據(jù)是有前提的,如果醫(yī)療健康類企業(yè),要知道我身高體重,沒問(wèn)題,需要根據(jù)我制定的規(guī)則辦事,你要"IAgree"我的數(shù)據(jù)使用條款,不能到處傳播。同時(shí),還規(guī)定使用時(shí)間和使用范圍,比如給你3個(gè)月只能用于某個(gè)特定醫(yī)療設(shè)備研究,用完就得永久刪除,否則被我小數(shù)據(jù)監(jiān)測(cè)到,可以依照里面的法律條文,咱們法庭上見。小數(shù)據(jù)讓個(gè)人作為個(gè)體信息的真正擁有著,通過(guò)小數(shù)據(jù),制定個(gè)人信息的使用范圍和授權(quán),以及監(jiān)督機(jī)制。任何企業(yè)組織甚至政府,都要事先同意遵守我定的規(guī)則才能使用。設(shè)想有個(gè)名人想要美國(guó)總統(tǒng)奧巴馬約個(gè)吃飯時(shí)間,他該先和白宮辦公室聯(lián)系,同意白宮辦公室的條件:不能和外界事先透露總統(tǒng)行蹤后。同時(shí),白宮只能跟回答比如說(shuō)晚上7點(diǎn)總統(tǒng)有沒有空,喜不喜歡吃牛排,而不是把總統(tǒng)的全部的行程安排包括總統(tǒng)吃什么藥片都告訴對(duì)方,這個(gè)可是最高國(guó)家機(jī)密。小數(shù)據(jù)讓你享受總統(tǒng)待遇,你的個(gè)人信息就是你的小數(shù)據(jù)王國(guó)里的最高國(guó)家機(jī)密。小數(shù)據(jù)還能做到絕對(duì)隱私,比如那天你累了想徹底清凈一段時(shí)間,或者你要和情人老婆老公有私人空間,你跟小數(shù)據(jù)系統(tǒng)下指令,徹底停止所有個(gè)人數(shù)據(jù)監(jiān)測(cè),這下就清凈了,你在數(shù)據(jù)世界就真的有一段時(shí)間人間蒸發(fā)了。2.對(duì)統(tǒng)一全面管理分析個(gè)人數(shù)據(jù)的巨大需求。小數(shù)據(jù)的產(chǎn)生還有一個(gè)主要原因,對(duì)統(tǒng)一全面管理分析個(gè)人數(shù)據(jù)的巨大需求。信息時(shí)代,我們被鋪面而來(lái)的信息狂轟濫炸,我們面對(duì)的問(wèn)題是信息太多,不是太少。我們最大的挑戰(zhàn)是如何能快速,方便,一目了然的定位有用的信息,如何從紛繁復(fù)雜的數(shù)據(jù)中提煉出有價(jià)值的信息,從而真正解放個(gè)人,讓自己多點(diǎn)時(shí)間去思考,去創(chuàng)作,多陪小孩家人,多去體驗(yàn)生活。小數(shù)據(jù)通過(guò)對(duì)個(gè)人信息的全面收集,反饋,整理,分析,能提供最貼心的數(shù)據(jù)服務(wù),提供最有價(jià)值的決策支持,甚至比你還了解你自己。你問(wèn)問(wèn)奧巴馬誰(shuí)最了解他,答案不是他太太還是他父母,一定是白宮工作人員。我舉個(gè)親身體會(huì)的很小的例子來(lái)說(shuō)明未來(lái)小數(shù)據(jù)的價(jià)值。紐約這邊水表都實(shí)現(xiàn)電子自動(dòng)讀數(shù),隔幾個(gè)小時(shí)家里的水表自動(dòng)發(fā)送數(shù)據(jù)到自來(lái)水公司,可以上網(wǎng)查看。這個(gè)是個(gè)很原始很簡(jiǎn)單的數(shù)據(jù),看起來(lái)沒有任何價(jià)值。有天,我突發(fā)奇想,用大數(shù)據(jù)的思維,把這些數(shù)據(jù)下載下來(lái),結(jié)合我家的出行旅游時(shí)間記錄,發(fā)現(xiàn)了個(gè)問(wèn)題。這水表顯示沒人在家的時(shí)候繼續(xù)不斷地用水,3年來(lái)一直如此。我進(jìn)一步挖掘,把家里每天使用水的大概時(shí)間拿來(lái)對(duì)照,最后斷定,一定是某個(gè)地方悄悄的持續(xù)的漏水。經(jīng)過(guò)排查,終于在不經(jīng)常去的地下室洗手間里的抽水馬桶蓋子里,找到一個(gè)閥門沒旋緊,從這里漏水直接進(jìn)下水道。3年多來(lái)從來(lái)沒被發(fā)現(xiàn)。如果沒有數(shù)據(jù)分析,這么隱蔽的地方不可能被發(fā)現(xiàn)。我計(jì)算一下,這3年來(lái)這個(gè)閥門浪費(fèi)了600多美金的水費(fèi),如果我在這里住10年,這個(gè)簡(jiǎn)單的數(shù)據(jù)分析就能省下我2000美金的無(wú)端水浪費(fèi)。這個(gè)就是小數(shù)據(jù)的個(gè)一個(gè)很簡(jiǎn)單的案例。我進(jìn)一步把我可以找到的個(gè)人數(shù)據(jù):當(dāng)?shù)販囟葰v史,電氣水歷史用量,財(cái)務(wù)數(shù)據(jù),健康數(shù)據(jù),統(tǒng)統(tǒng)有機(jī)結(jié)合起來(lái)(當(dāng)然數(shù)據(jù)收集廢了好一番功夫)。這個(gè)很原始的小數(shù)據(jù)給我展現(xiàn)出我從來(lái)沒有看到過(guò)的一面,在我決策過(guò)程中提供非常多有價(jià)值的分析。而這只是一個(gè)雛形,一個(gè)開始,如果有成熟的小數(shù)據(jù)系統(tǒng),真正全面的把個(gè)人全部數(shù)據(jù)有機(jī)結(jié)合起來(lái),其能發(fā)揮潛在價(jià)值不可估量。(三)小數(shù)據(jù)的特性和大數(shù)據(jù)的對(duì)比小數(shù)據(jù)和大數(shù)據(jù)有者本質(zhì)的區(qū)別,雖然以創(chuàng)造數(shù)據(jù)價(jià)值為目的思維和大數(shù)據(jù)是相類似的,但是在具體方式上,還有以下幾點(diǎn)不同1.數(shù)據(jù)處理方式:大數(shù)據(jù)強(qiáng)調(diào)標(biāo)準(zhǔn)化,只有數(shù)據(jù)標(biāo)準(zhǔn)化,才能大規(guī)模采集,以后的數(shù)據(jù)處理概率統(tǒng)計(jì)才有了可能。可是數(shù)據(jù)一標(biāo)準(zhǔn)化,就失去了其數(shù)據(jù)產(chǎn)生時(shí)的特性和背景。而小數(shù)據(jù)的用戶數(shù)據(jù)的最大特點(diǎn),就是來(lái)源和使用者是同一個(gè)人,只不過(guò)存和取時(shí)間和背景不一樣而已,這就讓數(shù)據(jù)標(biāo)準(zhǔn)化失去存在的理由。為什么要用標(biāo)準(zhǔn)化來(lái)抹去我對(duì)數(shù)據(jù)的主觀色彩呢和背景呢。比如我說(shuō)“喜歡吃的這家店的臭豆腐”。這個(gè)信息,存在我小數(shù)據(jù)的數(shù)據(jù)庫(kù)里,不能單單只存標(biāo)準(zhǔn)數(shù)據(jù):比如時(shí)間,臭豆腐形狀臭豆腐店地址等。這些還不夠,還要把我喜歡的程度和重要性:是非吃不可否則活不下去呢,還是一般的喜歡過(guò)兩天就忘記了。還有當(dāng)時(shí)的語(yǔ)境:是我陪老婆去吃她喜歡我也跟著喜歡,還是我恭維臭豆腐店老板,因?yàn)樗俏乙粋€(gè)朋友呢。這些都是小數(shù)據(jù)需要處理的信息,而大數(shù)據(jù)的標(biāo)準(zhǔn)化方式是無(wú)法做到的。

國(guó)外這方面已經(jīng)有初步的研究,Dr.OferBergman在2003年最先提出“用戶主觀方式”(UserSubjectiveApproach)來(lái)存儲(chǔ)個(gè)人信息。2009年他在這方面開創(chuàng)性研究在美國(guó)信息技術(shù)學(xué)院(AmericanSocieityforInformationScienceandTechonology)一發(fā)表獲得極大轟動(dòng)。被美國(guó)圖書館協(xié)會(huì)(TheAmericanLibraryAssociation)評(píng)為當(dāng)代十大科技前沿的研究方向之一2.人的作用:在大數(shù)據(jù)模式下,數(shù)據(jù)從人身上產(chǎn)生被收集后,接下來(lái)的數(shù)據(jù)處理分析,就再也跟數(shù)據(jù)的主人無(wú)關(guān)了。而在小數(shù)據(jù)里,所有數(shù)據(jù)都是圍繞一個(gè)人,所以人在系統(tǒng)的發(fā)揮中心的作用。就比如說(shuō)白宮團(tuán)隊(duì)再怎么龐大,都要根據(jù)總統(tǒng)的旨意,很多重要決策,還得總統(tǒng)拍板定奪。雖然小數(shù)據(jù)里不可避免要使用人工智能來(lái)提供幫助,但是人工智能如今發(fā)展還沒有大的跨越,遠(yuǎn)遠(yuǎn)不能勝任代替人腦的作用。這個(gè)有利有弊,壞處就是人還要不時(shí)的參與決策。好處就是,使用者比較放心,因?yàn)檫@些數(shù)據(jù)就是你的全部信息,你放心讓一個(gè)人工智能代替你做重要決定嗎?要我選,我還真不放心,我選擇后者。

3.其他數(shù)據(jù)性質(zhì)的區(qū)別:比如是小數(shù)據(jù)數(shù)據(jù)量相對(duì)比大數(shù)據(jù)的數(shù)據(jù)量小。小數(shù)據(jù)對(duì)數(shù)據(jù)不全部需要快速反應(yīng),比如說(shuō)你的膽固醇,一個(gè)月收集分析一次就夠了,而大數(shù)據(jù)對(duì)數(shù)據(jù)的反應(yīng)要快。小數(shù)據(jù)更加注重非結(jié)構(gòu)化數(shù)據(jù)的之間的關(guān)聯(lián),重深度挖掘,而大數(shù)據(jù)重在包容所有個(gè)體的數(shù)據(jù)重在廣度。綜上所述,小數(shù)據(jù)不是簡(jiǎn)單大數(shù)據(jù)的小型化,而是大數(shù)據(jù)的補(bǔ)充和延伸(四)小數(shù)據(jù)發(fā)展的廣闊前景小數(shù)據(jù)解決大數(shù)據(jù)無(wú)法克服的保護(hù)個(gè)人隱私矛盾。在主動(dòng)保護(hù)個(gè)人隱私的同時(shí),小數(shù)據(jù)提供給大數(shù)據(jù)最直接數(shù)據(jù)傳輸,避免了大數(shù)據(jù)的重復(fù)收集和模糊預(yù)測(cè),提高數(shù)據(jù)使用效率和價(jià)值。同時(shí)小數(shù)據(jù)利用全面的個(gè)人數(shù)據(jù)優(yōu)勢(shì),結(jié)合外部大數(shù)據(jù),提供給個(gè)人最個(gè)性化,最獨(dú)特,最有價(jià)值的數(shù)據(jù)服務(wù)。Amazon的名言“最成功書籍推薦應(yīng)該只有一本書,就是用戶要買的下一本書”,即使大數(shù)據(jù)的先行者如Amazon,預(yù)測(cè)用戶要買的下一本書并不容易。它最多能根據(jù)你在amazon的交易記錄,和有限的片面的個(gè)人信息來(lái)模糊預(yù)測(cè)。如果有小數(shù)據(jù),身為最了解主人的個(gè)人數(shù)據(jù)系統(tǒng),amazon只要跟個(gè)人小數(shù)據(jù)接口查詢:”你的主人最有可能買下一本書是什么?”小數(shù)據(jù)先查查主人設(shè)定,是否同意和amazon交流,在不泄露個(gè)人重要隱私的前提下,做完個(gè)人分析,看看主人最近最關(guān)心什么,最需要什么類知識(shí),列出主人最有可能買的1本書,告訴amazon。第二天,主人一開門,發(fā)現(xiàn)門口擺了一本自己最需要的書,上面寫著:“Amazon通過(guò)和您的小數(shù)據(jù)系統(tǒng)交流,得知您最可能需要這本書,把書給您送來(lái)了,需要就拿去,我會(huì)跟你小數(shù)據(jù)系統(tǒng)結(jié)賬。"多方便,多和諧的一個(gè)過(guò)程啊。再拿一個(gè)大數(shù)據(jù)里被津津樂道的一個(gè)案例來(lái)說(shuō),Target超市用孕婦懷孕可能購(gòu)買的商品用戶購(gòu)買記錄,通過(guò)構(gòu)建模型分析購(gòu)買者行為的相關(guān)性,能推斷出孕婦的具體臨盆時(shí)間。這是在大數(shù)據(jù)模式下。如果大數(shù)據(jù)和小數(shù)據(jù)配合,小數(shù)據(jù)在主人授權(quán)下,直接把主人臨盆告訴Target的大數(shù)據(jù)不就得了,Target可以根據(jù)接受的小數(shù)據(jù)的臨盆時(shí)間,加上小數(shù)據(jù)愿意透露的主人年齡和對(duì)商品的個(gè)人偏好,能更加準(zhǔn)確無(wú)誤預(yù)測(cè)個(gè)體的購(gòu)買情況。這其實(shí)已經(jīng)超越預(yù)測(cè),應(yīng)該叫洞察了把。大數(shù)據(jù)很多時(shí)候被運(yùn)用在廣告投放的目標(biāo)客戶的分析上:到底這個(gè)廣告對(duì)這個(gè)人來(lái)說(shuō),是雪中送炭還是讓人討厭。大數(shù)據(jù)時(shí)代這只能從用戶以往的購(gòu)買歷史,旁敲側(cè)擊。然而在小數(shù)據(jù)時(shí)代,小數(shù)據(jù)直接告訴大數(shù)據(jù),主人喜歡這個(gè)品牌那個(gè)顏色,如果不是符合主人口味的廣告,就不要來(lái)騷擾。在這種精確無(wú)誤的洞察,就好比給決策者一個(gè)清晰透視未來(lái)的水晶球。用戶,企業(yè)和政府可以最大限度的的利用大小數(shù)據(jù)的配合,進(jìn)行所有的數(shù)據(jù)活動(dòng):個(gè)人財(cái)務(wù)投資分析,個(gè)人健康監(jiān)控,個(gè)人疾病治療,企業(yè)策劃營(yíng)銷,企業(yè)戰(zhàn)略分析,政府宏觀調(diào)控,公共衛(wèi)生安全防范,預(yù)防犯罪等等。小數(shù)據(jù)和大數(shù)據(jù)的完美結(jié)合,必將讓市場(chǎng)營(yíng)銷人員,理財(cái)投資分析師(對(duì)不起啊,我的同行們,:-)),房地產(chǎn)中介,醫(yī)生,律師等等專業(yè)服務(wù)人員全部失業(yè)??梢赃@么說(shuō),大小數(shù)據(jù),雙劍合璧,天下無(wú)敵。小數(shù)據(jù)還有一個(gè)意想不到,卻讓人想想就睡不著覺的用途:數(shù)字永生!小數(shù)據(jù)精確記錄從出生到死亡,無(wú)時(shí)不刻,細(xì)致入微的所有細(xì)節(jié),它就是數(shù)字化的你,是你在虛擬世界最真實(shí)的數(shù)字投影。你的世界被數(shù)據(jù)化了,因此復(fù)制你的世界成為可能。這就涉及到人類永恒的夢(mèng)想:永生。肉體的永生還有待科技水平的提高,但是數(shù)字化個(gè)人的永生,在小數(shù)據(jù)時(shí)代就變成可能。你的小數(shù)據(jù),就是你在數(shù)字世界里最真實(shí)的載體,即使肉體的消失,你的小數(shù)據(jù)還能依據(jù)一生的數(shù)據(jù)歷史分析,可以對(duì)外界信息做出反應(yīng)(當(dāng)然這個(gè)反應(yīng)只能是依照歷史,不能主動(dòng)創(chuàng)新,否則就可怕了)。對(duì)于別人來(lái)說(shuō),你的數(shù)據(jù)載體,將永恒的停止在肉體消失的一刻。如果思念一個(gè)逝去的親人,你可以和她留下來(lái)的小數(shù)據(jù)聊天,問(wèn)她問(wèn)題,向她傾訴,聽她講她的過(guò)去,小數(shù)據(jù)會(huì)根據(jù)歷史記錄,最完整的呈現(xiàn)出逝去的親人的一舉一動(dòng)一顰一笑,包括她所說(shuō)和所做的,甚至推斷出她所想的。如果未來(lái)機(jī)器人和人體仿生的的進(jìn)一步發(fā)展,制造出一個(gè)一模一樣的人作為小數(shù)據(jù)物理載體也不是不可能。這個(gè)是不是想想就讓人激動(dòng)不已?。ㄎ澹┬?shù)據(jù)的發(fā)展最需解決的三個(gè)大問(wèn)題:1.個(gè)人數(shù)據(jù)處理的進(jìn)一步研究和開發(fā)。雖然“用戶主觀方式”(UserSubjectiveApproach)來(lái)存儲(chǔ)個(gè)人信息是一個(gè)重大突破,但其研究也只是理論上的初步構(gòu)架,到真正實(shí)現(xiàn)還要有一段時(shí)間,需要科學(xué)家進(jìn)一步探索和完善,加快其現(xiàn)實(shí)的運(yùn)用。同時(shí),國(guó)家要把小數(shù)據(jù)和大數(shù)據(jù)一樣,作為國(guó)家的戰(zhàn)略核心資產(chǎn)來(lái)投入和研發(fā),并在法律法規(guī)上保駕護(hù)航。2.安全保護(hù),小數(shù)據(jù)如果安全不到位,這個(gè)問(wèn)題大了,這個(gè)好比在數(shù)據(jù)世界被人綁架了。所以小數(shù)據(jù)對(duì)安全級(jí)別要求很高,這不是一個(gè)企業(yè)組織有足夠的信譽(yù)和能力能做到的,需要提到國(guó)家層面,需要國(guó)家統(tǒng)一規(guī)劃。但是即使在很高級(jí)的安全保護(hù)算法里,只要是算法,都會(huì)有漏洞,所以,人的參與就成了擬補(bǔ)算法漏洞的法寶。3.人工智能在小數(shù)據(jù)系統(tǒng)里占有至關(guān)重要的作用,在白宮里的地位相當(dāng)于總統(tǒng)辦公室主任,整體處理白宮各個(gè)方面大小事務(wù)。人工智能的發(fā)展至今裹足不前,需要國(guó)家把它提升為戰(zhàn)略地位進(jìn)行科研開發(fā)和投入。人,是一切數(shù)據(jù)存在的根本。人的需求是所有科技變革發(fā)展的動(dòng)力??梢灶A(yù)見,不遠(yuǎn)的將來(lái),數(shù)據(jù)革命下一步將進(jìn)入以人為本的小數(shù)據(jù)的大時(shí)代。

==========現(xiàn)場(chǎng)討論集錦===============

@藍(lán)天:今天這個(gè)論題很好,有力度,有厚重,值得學(xué)習(xí)和研究。感謝蔡凱龍。也感謝歡歡引介。小數(shù)據(jù)的概念和小數(shù)據(jù)的原因與隱私保護(hù)和小數(shù)據(jù)運(yùn)用的分析,很好。謝謝。

@蔡凱龍:謝謝大家,插播一句話,大數(shù)據(jù)里國(guó)棟兄是權(quán)威,我只不過(guò)把一些想法,可能比較前衛(wèi)的想法寫出來(lái),歡迎大家探討。

-----------------

@老牛:這個(gè)視角非常獨(dú)特。之前我把這些通歸于大數(shù)據(jù)。

@鄒學(xué)勇(用友):大數(shù)據(jù)的核心:實(shí)時(shí)、在線、互動(dòng)、全貌8字

@蔡凱龍:大數(shù)據(jù)的方式?jīng)]法解決個(gè)人隱私。就像@鄒學(xué)勇(用友)所列出的,大數(shù)據(jù)核心,必將涉獵到很多個(gè)人隱私。而且大數(shù)據(jù)的標(biāo)準(zhǔn)化,讓數(shù)據(jù)的個(gè)人色彩和語(yǔ)境無(wú)法伴隨數(shù)據(jù),對(duì)于數(shù)據(jù)的所有者來(lái)說(shuō),在一定語(yǔ)境下主觀色彩才比枯燥單調(diào)的數(shù)據(jù)形象生動(dòng),價(jià)值高多了。

--------------------

@吳甘沙:現(xiàn)在的問(wèn)題是小數(shù)據(jù)與大數(shù)據(jù)混在一起,也沒有對(duì)小數(shù)據(jù)的全生命周期管理,我覺得后者還是很有做頭的。把個(gè)人分布在互聯(lián)網(wǎng)各個(gè)地方的數(shù)據(jù)管理起來(lái),明晰各數(shù)據(jù)使用方的許可權(quán),并審計(jì)他們的使用情況,可以撤銷或轉(zhuǎn)移數(shù)據(jù)。

@蔡凱龍:對(duì),這個(gè)和小數(shù)據(jù)對(duì)個(gè)人隱私的保護(hù)思維是一致的。把所有的個(gè)人信息收集起來(lái),誰(shuí)是擁有者呢,政府監(jiān)管部門嗎?我覺得最有動(dòng)力去保護(hù)的就是隱私的擁有者,即個(gè)人。

@吳甘沙:個(gè)人一定是小數(shù)據(jù)的擁有者,這需要法律上產(chǎn)權(quán)的明晰,在此之前,各互聯(lián)網(wǎng)服務(wù)提供者必須修改termofuse和privacy條款

@風(fēng)吹江南:我貌似在寫支付革命就提出不談大數(shù)據(jù)只談小數(shù)據(jù)的章節(jié)。硬生生被刪除了

@蔡凱龍:為什么被刪除?

@風(fēng)吹江南:說(shuō)實(shí)話你是我見過(guò)第一個(gè)談小數(shù)據(jù)概念的人。他們估計(jì)也是認(rèn)為不夠切合大數(shù)據(jù)熱點(diǎn)吧。我倒覺得小數(shù)據(jù)更現(xiàn)實(shí)和有意義。大數(shù)據(jù)構(gòu)建成本極高。小數(shù)據(jù)都挖掘處理不好焉談大數(shù)據(jù)。

-------------

@吳甘沙:蔡兄,有兩個(gè)問(wèn)題:1.JaronLanier一直在推動(dòng)大公司對(duì)小數(shù)據(jù)的使用必須付出micropayment,但應(yīng)者寥寥,您怎么看;2.加州議員推動(dòng)RighttoKnowAct,但被技術(shù)公司lobbyist擋回去了,下一步怎么發(fā)展?

@蔡凱龍:這兩個(gè)問(wèn)題問(wèn)的非常好。1.小數(shù)據(jù)讓個(gè)人成為主動(dòng),掐住大數(shù)據(jù)侵犯隱私的喉嚨,這明顯不會(huì)被企業(yè)所輕易接受。而且要付費(fèi),要接受監(jiān)管,要收限制,哪有現(xiàn)在這么自由。企業(yè)反對(duì)也是一大問(wèn)題,所以我在下面講小數(shù)據(jù)的問(wèn)題的時(shí)候,有提到需要政府在法律法規(guī)上保駕護(hù)航。2.議員推動(dòng)法案被科技公司擋回去,這個(gè)原因和1一樣,企業(yè)不愿放棄已有的對(duì)個(gè)人隱私的侵犯。接下來(lái)如何走,我的預(yù)見是,隨著大企業(yè)和政府對(duì)個(gè)人隱私的不斷侵犯,民眾的個(gè)人隱私保護(hù)意識(shí)越來(lái)越強(qiáng),到一個(gè)臨界點(diǎn),出個(gè)比如2009加拿大女孩因?yàn)閭€(gè)人照片隱私被侵犯而自殺的轟動(dòng)事件,就會(huì)成為導(dǎo)火索,如果民眾意識(shí)的崛起,選民的壓力達(dá)到了一定程度,科技公司再牛也無(wú)法lobby議員,畢竟選民的投票決定議員的位置。

@老牛:如何實(shí)現(xiàn)呢?這是整個(gè)數(shù)據(jù)機(jī)制的變化,是對(duì)大數(shù)據(jù)的正向抑制或抵消力量,符合《動(dòng)物精神》中的觀點(diǎn).

@蔡凱龍:實(shí)現(xiàn)還很遙遠(yuǎn),我在最后一節(jié)有提到小數(shù)據(jù)發(fā)展的3個(gè)必須解決的問(wèn)題,也許這些問(wèn)題解決了,離實(shí)現(xiàn)就更加接近了。

@吳甘沙:現(xiàn)在的問(wèn)題是個(gè)人的awareness不夠,看了現(xiàn)在可穿戴計(jì)算設(shè)備的termofuse,基本上都是要把數(shù)據(jù)給第三方,或不保證數(shù)據(jù)的保密性和安全性。用戶也無(wú)奈接受了

@蔡凱龍:個(gè)人穿戴設(shè)備的條款已經(jīng)是到達(dá)入侵個(gè)人隱私的極限,所以更加顯示出以后對(duì)隱私保護(hù)的重要性,相信不久隨著個(gè)人穿戴設(shè)備的普及,這個(gè)必將成為熱點(diǎn)。

----------

@吳甘沙:Target這個(gè)案子除了隱私之外,我認(rèn)為還有數(shù)據(jù)使用的倫理問(wèn)題。它的個(gè)人刻畫能夠發(fā)現(xiàn)懷孕的情況,也應(yīng)該能發(fā)現(xiàn)是未成年人,如此就不該向未成年人發(fā)關(guān)于懷孕的定向廣告.

@蔡凱龍:這點(diǎn)提的好.Target應(yīng)該無(wú)法從銷售數(shù)據(jù)查出年齡,至少在美國(guó)對(duì)年齡這種個(gè)人隱私還是很保護(hù),所有只能靠大數(shù)據(jù)和小數(shù)據(jù)的配合,才能避免給未成年人發(fā)放懷孕廣告。

----------

@曾光光:大數(shù)據(jù)是通往奴役之路.各種數(shù)據(jù)孤島會(huì)由點(diǎn)到線,最后自組織自演化成網(wǎng),每個(gè)人都在網(wǎng)中,享受數(shù)據(jù)便利的同時(shí),數(shù)據(jù)隱私無(wú)處可逃。就像matrix.脫離這張網(wǎng)就無(wú)法生存.

@蔡凱龍:對(duì),以后數(shù)據(jù)革命是越來(lái)越讓人像在matrix里,不過(guò)我們對(duì)隱私被侵害并不是無(wú)能為力,這點(diǎn)我沒有那么悲觀。呵呵。

@吳甘沙:擔(dān)心的是機(jī)器革命.[微笑]

@蔡凱龍:機(jī)器革命等人工智能產(chǎn)生大飛躍才有一丁點(diǎn)的可能,我并不擔(dān)心啊,如果那天機(jī)器人能畫出梵高的《星空》,那時(shí)候我一定嚇得半死。。。

------------

@吳甘沙:蔡兄,有個(gè)問(wèn)題請(qǐng)教,現(xiàn)在大小數(shù)據(jù)是不分家的,大數(shù)據(jù)由小數(shù)據(jù)聚合而成,只不過(guò)一個(gè)強(qiáng)調(diào)集合價(jià)值(知著),一個(gè)是強(qiáng)調(diào)個(gè)人價(jià)值(見微)。如果分家了,大數(shù)據(jù)又從何而來(lái)呢?

@蔡凱龍:大小集合的現(xiàn)狀有很多的弊端,比如隱私,比如強(qiáng)化個(gè)人數(shù)據(jù)服務(wù)。所以發(fā)開是一種進(jìn)化。即使分開了,大數(shù)據(jù)也有它廣闊的空間,大數(shù)據(jù)在廣度分析上小數(shù)據(jù)無(wú)法做到。幾比如說(shuō)你小數(shù)據(jù)有你從出生到現(xiàn)在所有的健康記錄,你去看醫(yī)生(如果醫(yī)生這個(gè)職業(yè)還存在的話)。那大數(shù)據(jù)就會(huì)把你的所有健康記錄,去和全世界病患案例對(duì)比,分析,參照所有醫(yī)療研究成果,幫你找出最合適的治療方案。

@謝濤令海博智能:我有個(gè)問(wèn)題,小數(shù)據(jù)能否作為大數(shù)據(jù)的不可分割的一部分來(lái)處理?就像宏數(shù)據(jù)(metadata)?這樣可以用大數(shù)據(jù)上花巨款劈開的市場(chǎng)之路,而不用再為小數(shù)據(jù)開另外的市場(chǎng)之路。我一直在思考研究大數(shù)據(jù)溯源問(wèn)題,覺得獨(dú)立地去用小數(shù)據(jù)這個(gè)詞兒有些困難,所以有此問(wèn)。覺得把小數(shù)據(jù)從大數(shù)據(jù)分隔出來(lái)也很困難。

@謝濤令海博智能:@吳甘沙交叉信息。我們說(shuō)得是一個(gè)意思。大小數(shù)據(jù)分開會(huì)造成很多概念問(wèn)題,我一直沒能想透徹。

@蔡凱龍:我同意,分離出來(lái)要面對(duì)很多難題,關(guān)鍵是,大數(shù)據(jù),或者說(shuō)Metadata是否能解決兩大小數(shù)據(jù)最核心的功能:主動(dòng)保護(hù)隱私,和個(gè)人全方位個(gè)性服務(wù)。如果Metadata在這兩方面有飛躍,那小數(shù)據(jù)沒有存在的必要了。不過(guò)目前我還看不出來(lái)。

------------

@趙國(guó)棟:看到最后,發(fā)現(xiàn)你不是在說(shuō)小數(shù)據(jù),而是在談個(gè)人的agent,這個(gè)agent是個(gè)人再網(wǎng)絡(luò)時(shí)空的存在。

@蔡凱龍:可以這么理解吧,個(gè)人的agent應(yīng)該屬于白宮總管,也需要對(duì)個(gè)人數(shù)據(jù)的融合,

@趙國(guó)棟:在有些場(chǎng)景中這個(gè)實(shí)現(xiàn)成本太高啦。輪詢所有agent才能得到隱私的回復(fù)

@蔡凱龍:這個(gè)實(shí)現(xiàn)可以更加簡(jiǎn)單,國(guó)家針對(duì)全部隱私制定各種級(jí)別,對(duì)大數(shù)據(jù)運(yùn)用也分類,而個(gè)人,在小數(shù)據(jù)中可以大體設(shè)定一個(gè)對(duì)應(yīng)類的級(jí)別。具體大數(shù)據(jù)和60億個(gè)小數(shù)據(jù)交換信息,這個(gè)現(xiàn)在應(yīng)該幾秒鐘的事情吧。

@趙國(guó)棟:agent思想的難處是采集到所有小數(shù)據(jù),要求和所有端的程序有接口。如果有個(gè)人爬蟲,或許可以解決小數(shù)據(jù)源的問(wèn)題

@蔡凱龍:個(gè)人爬蟲是個(gè)人隱私泄密的幫兇,趙兄如何讓個(gè)人爬蟲防止隱私泄密呢?

@趙國(guó)棟:也是。沒想到啥好辦法!-----------

@曾光光:@蔡凱龍“我總結(jié)下:人,是一切數(shù)據(jù)存在的根本。人的需求是所有科技變革發(fā)展的動(dòng)力

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論