分析:什么樣的大數(shù)據(jù)才是有意義的_第1頁(yè)
分析:什么樣的大數(shù)據(jù)才是有意義的_第2頁(yè)
分析:什么樣的大數(shù)據(jù)才是有意義的_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分析:什么樣的大數(shù)據(jù)才是有意義的?

在短短的幾十年里,“技術(shù)天才”與社會(huì)的關(guān)系已經(jīng)改變:他們從關(guān)在屋里的孤獨(dú)者變成救世主,從反社會(huì)者變成社會(huì)的最大希望。許多人現(xiàn)在似乎相信,理解我們這個(gè)世界的最佳方式,就是坐在電腦屏幕前分析我們稱之為“大數(shù)據(jù)”的海量信息。關(guān)于這一點(diǎn),我們只要看看“谷歌流感趨勢(shì)(GoogleFluTrends)”。2008年,當(dāng)谷歌推出這項(xiàng)服務(wù)時(shí),硅谷的許多人將它鼓吹為表明大數(shù)據(jù)將很快淘汰傳統(tǒng)分析方式的一個(gè)標(biāo)志性產(chǎn)品。但他們錯(cuò)了。“谷歌流感趨勢(shì)”不僅沒(méi)有提供流感傳播的精確描述,也無(wú)法實(shí)現(xiàn)大數(shù)據(jù)鼓吹者的美夢(mèng)。這是因?yàn)椋绻麤](méi)有“厚數(shù)據(jù)”(豐富的、具有前后關(guān)聯(lián)性的數(shù)據(jù),它們只能通過(guò)丟開(kāi)電腦、深入實(shí)際生活才能獲得),大數(shù)據(jù)就沒(méi)有意義。電腦極客們?cè)?jīng)因?yàn)椴荒苓m應(yīng)社會(huì)生活而被嘲笑,他們被告知應(yīng)該“多出去走走”。實(shí)際上,如果大數(shù)據(jù)的信徒們希望理解這個(gè)他們也在參與塑造的世界,他們真的需要多出去走走。谷歌的失敗與算法無(wú)關(guān)“谷歌流感趨勢(shì)”的目的是:找出人們?cè)诹鞲屑竟?jié)常用的搜索詞,然后實(shí)時(shí)跟蹤這些搜索詞的使用高峰期。這樣,谷歌就可以在新流感爆發(fā)之前發(fā)出警報(bào),而且預(yù)警時(shí)間要比官方疾病防治中心的預(yù)警時(shí)間早大約兩周。對(duì)很多人來(lái)說(shuō),“谷歌流感趨勢(shì)”已經(jīng)成為大數(shù)據(jù)的一個(gè)典型代表,它表現(xiàn)了大數(shù)據(jù)的巨大力量。在暢銷書(shū)《大數(shù)據(jù):一場(chǎng)改變生活、工作和思考方式的革命》(ARevolutionThatWillTransformHowWeLive,WorkandThink)中,作者維克托?邁爾?舍恩柏格(ViktorMayer-Sch?nberger)和肯尼斯?庫(kù)克耶(KennethCukier)宣稱,與政府滯后的數(shù)據(jù)相比,“谷歌流感趨勢(shì)”是更有用、更及時(shí)的流感指示器。然而,著名的《科學(xué)》雜志本月刊登一篇文章告訴我們,自2011年8月以來(lái),“谷歌流感趨勢(shì)”幾乎每周都會(huì)高估流感的盛行率。而在2009年,就在“谷歌流感趨勢(shì)”推出后不久,它竟然完全沒(méi)有察覺(jué)豬流感的爆發(fā)。事實(shí)上,人們?cè)诹鞲屑竟?jié)的許多常用搜索詞與流感無(wú)關(guān),而與流感的通常爆發(fā)季節(jié)——冬季——密切相關(guān)。許多人爭(zhēng)論道,“谷歌流感趨勢(shì)”的失敗緣于大數(shù)據(jù)的不成熟。這種觀點(diǎn)沒(méi)有切中要害。當(dāng)然,調(diào)整算法、提高數(shù)據(jù)收集技術(shù)將會(huì)讓下一代大數(shù)據(jù)工具變得更有效。然而,大數(shù)據(jù)鼓吹者真正的狂妄之處不在于對(duì)一套不成熟的算法過(guò)于自信,而在于盲目地相信坐在電腦屏幕前搗鼓一些數(shù)字就可以充分理解世界。為什么需要厚數(shù)據(jù)大數(shù)據(jù)僅僅是大量的“薄數(shù)據(jù)”,它們是通過(guò)對(duì)人們的活動(dòng)和行為進(jìn)行跟蹤而獲得的。我們最常去的地方,我們?cè)诰W(wǎng)上搜索的東西,我們每天睡了多久,我們有多少聯(lián)系人,我們所聽(tīng)的音樂(lè)類型等等。這些數(shù)據(jù)是通過(guò)你瀏覽器中的“cookies”、你戴在手上的FitBit腕帶或你手機(jī)上的GPS來(lái)收集的。這些信息無(wú)疑是重要的,但我們不能通過(guò)它們來(lái)獲得對(duì)人的完整理解。為了真正地了解人,我們不久需要大數(shù)據(jù),而且需要厚數(shù)據(jù)。厚數(shù)據(jù)不僅包括事實(shí),而且包括事實(shí)的前后聯(lián)系。比如說(shuō),美國(guó)有86%的家庭每周會(huì)喝掉6夸脫以上的牛奶,但是她們?yōu)槭裁春扰D蹋克麄兪窃趺春鹊??一塊包含三種顏色、繡著星星和條紋圖案的布,這是薄數(shù)據(jù);一面在風(fēng)中飄揚(yáng)的美國(guó)國(guó)旗,這是厚數(shù)據(jù)。基于“我們做了什么”,大數(shù)據(jù)對(duì)我們進(jìn)行簡(jiǎn)單化的理解;厚數(shù)據(jù)則試圖通過(guò)我們與周圍世界的聯(lián)系來(lái)理解我們。只有理解人與周圍世界的聯(lián)系,人們才能從整體上認(rèn)識(shí)這個(gè)世界,這恰恰也是谷歌、facebook等公司想要做的。理解我們這個(gè)世界想想硅谷的那些宏偉宣言。谷歌的宗旨是“組織全球信息,使人人皆可訪問(wèn)它們并從中獲益?!瘪R克·扎克伯格(MarkZuckerberg)最近對(duì)投資者表示,在全球化和知識(shí)經(jīng)濟(jì)日益受到重視的當(dāng)今世界,F(xiàn)acebook致力于一個(gè)新的使命:“理解這個(gè)世界”。他說(shuō):“人們每天在Facebook上發(fā)布數(shù)十億條內(nèi)容和鏈接。在他們的幫助下,我們通過(guò)專門的算法機(jī)制為世界上所有事物建立最清晰的模型?!鄙踔劣幸恍┬」疽矃⑴c了“理解這個(gè)世界”。去年,Jawbone公司的副總裁耶利米?羅賓遜(JeremiahRobison)說(shuō),他們的健康跟蹤設(shè)備JawboneUP的目標(biāo)是“理解(人的)行為變化的科學(xué)?!边@些目標(biāo)的確很大。企業(yè)渴望更好地理解社會(huì),這不足為怪。畢竟,了解與客戶行為及社會(huì)文化相關(guān)的信息,這對(duì)企業(yè)經(jīng)營(yíng)來(lái)說(shuō)是必不可少的。而且,在知識(shí)經(jīng)濟(jì)時(shí)代,這些信息本身已經(jīng)成為一種通貨,它們可以換來(lái)點(diǎn)擊率、瀏覽量和廣告收入?;蛘吒?jiǎn)單地說(shuō),它們可以換來(lái)權(quán)力。在這個(gè)過(guò)程中,如果谷歌、facebook等公司能不斷幫助我們?cè)鲞M(jìn)對(duì)自身的集體知識(shí),它們獲得更多權(quán)力也是正當(dāng)?shù)摹?wèn)題在于,如果它們聲稱計(jì)算機(jī)能夠組織我們的所有數(shù)據(jù),或能夠向我們提供關(guān)于流感、健康或社會(huì)關(guān)系等各方面的完整理解,那么,它們從根本上小看了“數(shù)據(jù)”和“理解”的意義。如果硅谷的大數(shù)據(jù)鼓吹者真想“了解世界”,那么他們不僅需要掌握大數(shù)據(jù),也需要掌握厚數(shù)據(jù)。不幸的是,要獲得后者,他們需要丟開(kāi)電腦去實(shí)地體驗(yàn)這個(gè)世界,而不是僅僅通過(guò)谷歌眼鏡(或通過(guò)facebook的虛擬現(xiàn)實(shí)設(shè)備)來(lái)觀察世界。人們的行為情境如果你對(duì)一個(gè)領(lǐng)域高度熟悉,有能力填補(bǔ)信息空白并想象人們的行為原因,那么“薄數(shù)據(jù)”將是有用的。換句話說(shuō),如果你能夠想象并重建人們的行為的發(fā)生情境,你所觀察到的行為才是有意義的。如果缺乏對(duì)行為情境的了解,就不可能推出任何因果關(guān)系,也不可能理解人們的行為原因。這就是為什么研究人員在科學(xué)實(shí)驗(yàn)中要竭盡全力控制實(shí)驗(yàn)室的環(huán)境,以創(chuàng)造一個(gè)各種影響因素都被考慮在內(nèi)、徹底的人工場(chǎng)所。不過(guò),真實(shí)世界并不是一個(gè)實(shí)驗(yàn)室。要確保你對(duì)陌生世界的情境有所了解,唯一的途徑是實(shí)地觀察并內(nèi)化和解釋正在發(fā)生的每一件事。人們的背景知識(shí)如果說(shuō)大數(shù)據(jù)擅長(zhǎng)觀察人們的行為,那么它不擅長(zhǎng)的就是理解人們對(duì)每樣事物的背景知識(shí)。我是怎么知道每次刷牙時(shí)該用多少牙膏的?我是怎么知道何時(shí)該進(jìn)入另一個(gè)交通通道的?眨眼是表示“真有趣”還是“我的眼睛進(jìn)了東西”?這些都涉及人們的內(nèi)在能力、無(wú)意識(shí)和背景知識(shí),它們控制著人們的大多數(shù)行為。跟周圍的事物一樣,這些不可見(jiàn)的背景知識(shí)只有在觀察者主動(dòng)去看的情況下才能被發(fā)現(xiàn)。不過(guò),它們卻對(duì)每個(gè)人的行為有著重要影響。它能夠解釋事物與人的聯(lián)系,以及事物對(duì)人的意義。人類學(xué)及社會(huì)科學(xué)中有大量觀察和解釋人類行為的方法。研究人員不但觀察人的行為,而且考查他們所處的情境和他們擁有的背景知識(shí)。這些方法有一個(gè)共同的特點(diǎn):它們要求研究者深入混亂而真實(shí)的人類生活。沒(méi)有哪

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論