




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大數(shù)據(jù)時(shí)代對(duì)社會(huì)生活的影響●改變我們生活的科學(xué)革命停留在了自然科學(xué)的邊界上,從沒(méi)有逾越而觸及人類?!袢绻覀兿裱芯孔匀滑F(xiàn)象一樣研究人類,我們就能夠預(yù)測(cè)人類行為?!褚坏┦占阶銐蚨嗟臄?shù)據(jù),就可以提出這個(gè)基本的問(wèn)題:我們的可預(yù)測(cè)性有多高?并且會(huì)得到一個(gè)令人震驚的答案。人類不愿被放在顯微鏡下觀察某種程度上來(lái)講,有關(guān)人類行為的統(tǒng)計(jì)確實(shí)有很重要的意義。大量有關(guān)人類行為的數(shù)據(jù)該怎樣為我們所用呢?我是一個(gè)物理學(xué)家,也可以說(shuō)是一個(gè)自然科學(xué)家,我認(rèn)為自然現(xiàn)象是可以被解析、描述,被量化的,并且是可以預(yù)測(cè)、可以控制的,這一點(diǎn)無(wú)可厚非。這是科學(xué)家應(yīng)該做的,也是推動(dòng)科學(xué)家研究的動(dòng)力。那么,如果我們用人類來(lái)代替之前提到的自然現(xiàn)象呢?剛才那句話將變成:人類是可以被解析、描述,被量化,并且是可以預(yù)測(cè)、可以控制的。這顯然是一個(gè)會(huì)令人感到非??只诺年愂?。然而,我們無(wú)須恐慌,這其實(shí)是一個(gè)好消息。在科學(xué)領(lǐng)域有一個(gè)我們從不去探討的小秘密,改變我們生活的科學(xué)革命停留在了自然科學(xué)的邊界上,從沒(méi)有逾越而觸及人類。我們不會(huì)阻止科學(xué)家去預(yù)測(cè)電子移動(dòng)軌跡,卻不愿預(yù)知電子危機(jī)、金融危機(jī)等;我們不介意科學(xué)家去研究基因,卻不愿預(yù)知戰(zhàn)爭(zhēng)、重大的危機(jī)等。原因非常簡(jiǎn)單。人類和細(xì)菌或其他有機(jī)體有一個(gè)根本的不同,即細(xì)菌不會(huì)因?yàn)楸环诺斤@微鏡下而惱怒,月亮也不會(huì)因?yàn)轱w船登陸到它的表面而提出控訴。預(yù)測(cè)需要數(shù)據(jù)想要預(yù)測(cè),必須要掌握大量數(shù)據(jù),那些說(shuō)自己不需要數(shù)據(jù)就可以作預(yù)測(cè)的人不是看手相的就是商業(yè)顧問(wèn)。在對(duì)人類行為的預(yù)測(cè)方面,我們現(xiàn)在擁有了大量數(shù)據(jù)的支持。我們發(fā)出的每封郵件都留下了一個(gè)人的社會(huì)關(guān)系、愛好等生活線索。銀行了解我們的支付能力、品味、購(gòu)買意愿以及購(gòu)物地點(diǎn)。雖然我們常常選擇不去想這些,但事實(shí)是我們已經(jīng)將自己放在了記錄事實(shí)的多倍顯微鏡下,這些數(shù)據(jù)細(xì)節(jié)讓他人可以迅速了解我們的生活。《爆發(fā)》講的就是數(shù)據(jù)統(tǒng)計(jì)給掌控人類行為的研究帶來(lái)的改變。這里面包括方方面面的數(shù)據(jù),其中之一是隱私方面的數(shù)據(jù)。《爆發(fā)》一書雖然提到了隱私,卻不是在講隱私。它講的是我們的社會(huì)正在變成一個(gè)大實(shí)驗(yàn)室,自動(dòng)收集的數(shù)據(jù)揭示了人類行為模式。說(shuō)到人類行為,我首先要解釋一個(gè)問(wèn)題:“為什么一個(gè)物理學(xué)家要關(guān)注人類行為?”事實(shí)是,物理學(xué)家關(guān)心人類行為,是想了解其背后復(fù)雜的系統(tǒng)。這里有很多復(fù)雜的體系值得研究。大腦是一方面,還有經(jīng)濟(jì)、細(xì)胞,以及計(jì)算機(jī)系統(tǒng)。去年我們發(fā)現(xiàn),要了解個(gè)人行為,社會(huì)是最好的平臺(tái)。這些數(shù)據(jù)幫助我們了解到每個(gè)人的日常行為,比如每一個(gè)神經(jīng)元每一刻都在做什么,或者說(shuō)每一個(gè)基因都有什么作用。因?yàn)檫@套個(gè)人統(tǒng)計(jì)數(shù)據(jù)統(tǒng)計(jì)了每個(gè)人的行為,包括他們的行為模式、運(yùn)動(dòng)模式,以及方方面面,所以如果你想實(shí)用一些,并且相信每一個(gè)復(fù)雜體系都是相似的,那么你就在朝著掌握更多數(shù)據(jù)、取得更大進(jìn)展的方向前進(jìn)。過(guò)去的五年、十年中,人類社會(huì)朝著逐步變成一個(gè)本源的復(fù)雜體系、一個(gè)便于我們掌控的體系的方向發(fā)展,但這是一個(gè)漫長(zhǎng)的過(guò)程。所謂“爆發(fā)”,是一個(gè)人人都在遵循的行為模式,如果你觀察現(xiàn)實(shí)生活中人們的行為模式:什么時(shí)候發(fā)郵件,什么時(shí)候打電話,什么時(shí)候?yàn)g覽網(wǎng)頁(yè),你一定會(huì)發(fā)現(xiàn)確實(shí)存在這樣的模式,我們?cè)谶@一方面掌握了大量數(shù)據(jù)。這些行為都不是隨機(jī)的,而是聚集,最終爆發(fā)。也就是說(shuō),你會(huì)在一段很短的時(shí)間里發(fā)出大量郵件,然后在接下來(lái)很長(zhǎng)一段時(shí)間里什么都不做,然后接下來(lái)又是一個(gè)爆發(fā),打電話也是一樣。所以,在過(guò)去十年我們關(guān)于人類行為一個(gè)很重要的發(fā)現(xiàn)就是,人類行為不是隨機(jī)的,而是聚集帶來(lái)的爆發(fā)。而最重要的是這些行為都遵循“冪律分布”。當(dāng)然沒(méi)有人認(rèn)為自己的行為模式是隨機(jī)的,這從來(lái)就不是問(wèn)題所在。問(wèn)題是,隨機(jī)行為的特點(diǎn)是什么?爆發(fā)是特點(diǎn)之一,而且爆發(fā)也會(huì)將我們引向下一個(gè)問(wèn)題,這個(gè)我在前面也提到了。如果我們像研究自然現(xiàn)象一樣研究人類,我們就能夠預(yù)測(cè)人類行為。預(yù)測(cè)本身其實(shí)就是一個(gè)令人感到恐懼的詞。我們要預(yù)測(cè)什么?我們要預(yù)測(cè)今晚會(huì)夢(mèng)到什么嗎?我們要預(yù)測(cè)下次升職是什么時(shí)候嗎?或者預(yù)測(cè)我們會(huì)偶遇誰(shuí)?所有這些預(yù)測(cè)都需要數(shù)據(jù)的支持,需要大量數(shù)據(jù)的支持。我們作預(yù)測(cè)的能力取決于我們掌握多少數(shù)據(jù),有了這些數(shù)據(jù)我們才能說(shuō)預(yù)測(cè)的可能性有多大。所以,幾年前我開始思考這個(gè)問(wèn)題時(shí),我決定從收集人類行為軌跡的相關(guān)數(shù)據(jù)開始,即我們?cè)谀睦?,接下?lái)又要去哪里。我當(dāng)時(shí)沒(méi)有收集他人數(shù)據(jù)的渠道,卻又非常好奇作預(yù)測(cè)的可能性,所以我決定從收集自己的數(shù)據(jù)開始。進(jìn)入大數(shù)據(jù)時(shí)代其實(shí),很多人行為軌跡的數(shù)據(jù)都被收集了?,F(xiàn)在還有人不用手機(jī)嗎?當(dāng)然,人們不會(huì)自欺欺人地去否認(rèn)這個(gè)事實(shí):即你的手機(jī)廠商知道你每一時(shí)刻都在哪里。他們不僅知道你的位置信息,還知道你打的每一通電話(為了統(tǒng)計(jì)話費(fèi))。他們不僅知道你在哪里,也知道其他成千上萬(wàn)的客戶在哪里。所以,相對(duì)于我所收集的關(guān)于自己的數(shù)據(jù),他們掌握的數(shù)據(jù)要豐富很多。有了這些數(shù)據(jù),人們就可以對(duì)不同的個(gè)體進(jìn)行比較。當(dāng)然,手機(jī)商很擔(dān)心這些數(shù)據(jù)會(huì)外泄,因?yàn)樗麄円3钟脩魧?duì)他們的信任,同時(shí)外泄信息還會(huì)受到法律的處罰。但是近幾年,他們逐步意識(shí)到這些數(shù)據(jù)的價(jià)值所在,于是開始將數(shù)據(jù)提供給研究者和其他公司。我的研究小組也得到了大量有關(guān)人類行為軌跡和通話模式的信息,信息的主人當(dāng)然是匿名的,我們不知道主人是誰(shuí),也不知道他們的電話號(hào)碼。我們只是將他們看做在宇宙中移動(dòng)的小個(gè)體,就像組成汽油的溴一樣。有了這些數(shù)據(jù),我們終于可以問(wèn):人類行為的可預(yù)測(cè)性是多少?人的行為可以預(yù)測(cè)嗎?我們之前提出的問(wèn)題之一是:人們每天會(huì)移動(dòng)多遠(yuǎn)?答案很簡(jiǎn)單。如果你想要查一查移動(dòng)這么遠(yuǎn)的人有多少,這是一個(gè)典型的行車距離,大部分人都會(huì)移動(dòng)這么遠(yuǎn)。你會(huì)發(fā)現(xiàn)大部分人傾向于在一個(gè)相對(duì)小的范圍內(nèi)移動(dòng)。當(dāng)然也有少數(shù)住在城郊的人會(huì)移動(dòng)一段相當(dāng)長(zhǎng)的距離,移動(dòng)范圍較小的人的數(shù)量對(duì)比移動(dòng)范圍較大的人的數(shù)量正好符合一個(gè)精確的“冪律分布”。所以,如果你掌握了大量數(shù)據(jù),就可以預(yù)測(cè)有多少人是旅行者,有多少人在很遠(yuǎn)的地方上班,有多少人大多數(shù)時(shí)間待在附近,或是在家中工作。這是我們研究的第一步。這已經(jīng)表明,在研究一個(gè)龐大的人群時(shí),我們會(huì)發(fā)現(xiàn)不同人的行為是迥異的。下一步,我們用得出的行為軌跡算出每個(gè)人的熵。什么是熵呢?整個(gè)體系的熵是零,就是說(shuō)這個(gè)系統(tǒng)的狀態(tài)很明朗,你知道每一個(gè)點(diǎn)在哪里,每一個(gè)點(diǎn)的位置都是完全確定的,這也就是我們所說(shuō)的:“熵為零。”熵是衡量隨機(jī)性的值。原則上,如果可以根據(jù)個(gè)人過(guò)去出現(xiàn)的地點(diǎn)寫出數(shù)據(jù)挖掘運(yùn)算法則,那么就可以百分之百地精確算出他將出現(xiàn)的地點(diǎn),他的可預(yù)測(cè)性是1,也就是說(shuō)這個(gè)人的運(yùn)動(dòng)完全沒(méi)有隨機(jī)性。他每天在同一時(shí)間往返于家和單位。我們認(rèn)為人與人之間的行為模式存在很大差異,很多人的行為很難被預(yù)測(cè),因?yàn)樗麄兊纳钬S富,并且行動(dòng)無(wú)計(jì)劃性。但是還有一些人可能更容易被預(yù)測(cè),這種人是我們一開始就提到的,他們的行為發(fā)生在一個(gè)確定范圍內(nèi)。于是我們分別計(jì)算出了這些人的平均值,并將他們的可預(yù)測(cè)性標(biāo)記在圖中。我們測(cè)量的是大批手機(jī)用戶的可預(yù)測(cè)性,首先應(yīng)該注意到的就是這個(gè)預(yù)測(cè)基數(shù)很大,峰值是93,也就是說(shuō),對(duì)于一個(gè)普通人來(lái)講,如果我們知道他過(guò)去去過(guò)的地方,原則上有93%的可能性
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商丘學(xué)院《建筑信息建模(BM)》2023-2024學(xué)年第二學(xué)期期末試卷
- 九江理工職業(yè)學(xué)院《動(dòng)物病毒與人類健康》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南工程學(xué)院《數(shù)據(jù)結(jié)構(gòu)與算法分析課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 《活動(dòng)二 安全網(wǎng)上行》(教學(xué)設(shè)計(jì))-2023-2024學(xué)年六年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)蒙滬版
- 遼寧現(xiàn)代服務(wù)職業(yè)技術(shù)學(xué)院《美術(shù)表現(xiàn)一中國(guó)畫》2023-2024學(xué)年第二學(xué)期期末試卷
- 海南外國(guó)語(yǔ)職業(yè)學(xué)院《自然地理基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 地震數(shù)據(jù)采集系統(tǒng)項(xiàng)目效益評(píng)估報(bào)告
- 山東商務(wù)職業(yè)學(xué)院《工程技術(shù)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州商貿(mào)旅游職業(yè)學(xué)院《跨境電商平臺(tái)操作》2023-2024學(xué)年第二學(xué)期期末試卷
- 武漢商學(xué)院《文獻(xiàn)檢索與學(xué)術(shù)訓(xùn)練》2023-2024學(xué)年第二學(xué)期期末試卷
- ISO22000體系文件清單
- 體育賽事招商方案
- 西師版三年級(jí)下冊(cè)第六單元第1課時(shí)旋轉(zhuǎn)與平移市公共課一等獎(jiǎng)市賽課金獎(jiǎng)?wù)n件
- 英語(yǔ)學(xué)術(shù)論文寫作引言
- 液化石油氣鋼瓶倒殘操作規(guī)程
- 新材料概論課件ppt 第8章 新能源材料
- 毛概課說(shuō)課課件
- 工藝管道安裝工程質(zhì)量檢驗(yàn)、試驗(yàn)計(jì)劃
- 《汽車電子技術(shù)》專業(yè)人才培養(yǎng)方案
- 中國(guó)重癥加強(qiáng)治療病房(ICU)建設(shè)與管理指南
- 《老年服務(wù)倫理與禮儀》課程標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論