版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第大數(shù)據(jù)時(shí)代讀書心得體會范文(17篇)
大數(shù)據(jù)時(shí)代讀書心得體會范文(通用17篇)
大數(shù)據(jù)時(shí)代讀書心得體會范文篇1
這么多年來,看了很多東西,如今回過頭來發(fā)現(xiàn),好像什么都忘了,真是悲劇,所謂讀書破萬卷,下筆如有神或許是不對的,還是需要下筆勤快,所以決定從這里開始。
這些年對于技術(shù)的發(fā)展,我是沒有跟上,如今發(fā)現(xiàn)即便是對于投資,技術(shù)對于我們生活的改變太大,而自己身在這個(gè)技術(shù)浪潮的前沿,還是需要跟上步伐?!把?/p>
大數(shù)據(jù)這個(gè)概念已經(jīng)提了很久,我也一直疏忽了對于它的理解。看完《大數(shù)據(jù)時(shí)代》,再結(jié)合如果工作上對于大數(shù)據(jù)的理解,頓時(shí)發(fā)現(xiàn)數(shù)據(jù)的重要性,以前在這方面的確沒有足夠的思想意識。
整本書來說,我覺得最關(guān)鍵的三個(gè)點(diǎn)是前面幾個(gè)章節(jié):
1、要總體,不要隨機(jī)樣本:從小對于統(tǒng)計(jì)學(xué)相關(guān)的學(xué)習(xí),基本都是從樣本出發(fā),理論的基礎(chǔ)在于如何隨機(jī)的足夠分散的選取樣本,這可是技術(shù)活加直覺。而對于大數(shù)據(jù)來說,要的就是總體,本質(zhì)上來說,總體樣本的確更能準(zhǔn)確找到結(jié)果。但是對于統(tǒng)計(jì)來說,總體的分析增加了數(shù)據(jù)分析的難度,不僅數(shù)據(jù)核對不好進(jìn)行,一旦出現(xiàn)數(shù)據(jù)污染,準(zhǔn)確度就會大打折扣,而且進(jìn)行數(shù)據(jù)回溯的時(shí)候,也無法準(zhǔn)確確認(rèn)問題,而這一點(diǎn)也是后面相關(guān)性上問題;
2、要混亂,而不是精確:這里主要想說明的是希望數(shù)據(jù)的多樣性,盡量將相關(guān)數(shù)據(jù)都收集起來,不管是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的。這樣就不可避免的最終結(jié)果的不準(zhǔn)確性。大數(shù)據(jù)更多的是從一個(gè)總體數(shù)據(jù)中說明以后概率事件,既然是概率,也就可以理解無法精確。這里有個(gè)點(diǎn)的說明,我覺得需要提一下,大數(shù)據(jù)算法更傾向于“簡單”,而不是復(fù)雜,這個(gè)倒是出乎我的意外。
3、要相關(guān)性,而不是因果:從我對于知識獲取的過程來說,我是不同意這個(gè)觀點(diǎn),從人體對于知識的理解,還是要從因果論出發(fā),沒有因果論,就會變成瞎子。而作者的觀點(diǎn)上來說,原因可能還是從大數(shù)據(jù)本身的非準(zhǔn)確性,一旦找到合適的算法,找到相關(guān)性,向上追述原因本身就很難。但是從舉的示例上看,相關(guān)性的確認(rèn)是一個(gè)非常大的工程,基本就是使用排舉法,一個(gè)一個(gè)試。
所以,對于大數(shù)據(jù)來說,最重要的三點(diǎn)是:
1、數(shù)據(jù)——得到更多數(shù)據(jù);
2、算法——建立更快的算法體系;
3、思維——尋找數(shù)據(jù)間更多的相關(guān)性。
對于數(shù)據(jù)最終的走向,我同意書中所提到的政府管理的觀點(diǎn),既然都是以“石油”的標(biāo)準(zhǔn)來看待數(shù)據(jù),政府統(tǒng)一管理也就是必然的了。而且對于政府來說,掌握更多數(shù)據(jù)也有利于其管理及維護(hù)社會的穩(wěn)定性。而對于社會道德方面的論述,我不想多說什么,時(shí)代發(fā)展是不會被道德綁架的。
所以最后,想要建立對于大數(shù)據(jù)的思維,《大數(shù)據(jù)時(shí)代》還是值得一讀,里面的很多示例也非常不錯(cuò)。如人際關(guān)系這一塊,也是出乎我的意料。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇2
知道"是什么"就夠了,沒必要知道"為什么"。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是讓數(shù)據(jù)自己"發(fā)聲"。這個(gè)命題是我讀這本書最大的感觸。
對于大多數(shù)人來說,這的確是一場思維變革。對于理科學(xué)生來說,會認(rèn)為這是一個(gè)錯(cuò)誤的觀點(diǎn),因?yàn)檫@無異于否定了他們對世界客觀物理化學(xué)規(guī)律探索的重要性;對于一名工科學(xué)生,其實(shí)這并不是一個(gè)多么新穎的觀點(diǎn),因?yàn)楣た剖侵v求時(shí)用性的,如何能更好地利用基本自然科學(xué)規(guī)律創(chuàng)造社會財(cái)富比探索自然科學(xué)知識顯得更重要。
這些天來,在讀大數(shù)據(jù)這本書的同時(shí),也稍微重溫了一下自動(dòng)控制原理,認(rèn)識到控制系統(tǒng)中存在明顯的大數(shù)據(jù)時(shí)代思維方式,借讀書交流會之際,與大家分享。
對系統(tǒng)的有效控制需要對系統(tǒng)理解與建模。以一個(gè)日常生活中的例子說明。開車的時(shí)候一腳油門下去車就飛出去了,但并不知道這一腳油門下去能給多大車速,這就需要駕駛?cè)藛T的熟練的駕駛技能了,不然超速被開罰單是很正常的。那么,問題就來了:如何能實(shí)現(xiàn)速度的自動(dòng)控制而不用駕駛?cè)藛T踩油門?這就是控制系統(tǒng)最關(guān)鍵的環(huán)節(jié)——建立系統(tǒng)數(shù)學(xué)模型。大白話就是知道車速與燃油量的數(shù)學(xué)關(guān)系式。若是以探索為什么的思維模式,不可避免的要列一大堆能量方程、動(dòng)量方程等物理化學(xué)式子,經(jīng)過繁雜的計(jì)算,還是能得到車速和燃油量的數(shù)學(xué)關(guān)系式的。很明顯這是一個(gè)繁瑣的過程,因?yàn)榈弥垃F(xiàn)象背后的原因。這僅是對于這種簡單的系統(tǒng),若是對于航空發(fā)動(dòng)機(jī)這種復(fù)雜的系統(tǒng),結(jié)構(gòu)工藝過于復(fù)雜,分析各部分的物理化學(xué)過程是十分困難的,這時(shí)候可以通過實(shí)驗(yàn)法得到數(shù)學(xué)模型。
實(shí)驗(yàn)法主要有時(shí)域測定法、頻域測定法和統(tǒng)計(jì)相關(guān)法。與大數(shù)據(jù)時(shí)代思維最接近的是統(tǒng)計(jì)相關(guān)法,主要過程是對被研究對象施加某種隨機(jī)信號,根據(jù)被測對象各參數(shù)的變化,采用統(tǒng)計(jì)相關(guān)法確定被測系統(tǒng)或?qū)ο蟮膭?dòng)態(tài)特性。這種方法可以在被測系統(tǒng)或生產(chǎn)過程正常運(yùn)行狀態(tài)下進(jìn)行在線辨識,測試結(jié)果精度較高,但要求采集大量測試數(shù)據(jù),并需要相關(guān)儀和計(jì)算機(jī)進(jìn)行數(shù)據(jù)計(jì)算和處理。
若用開車實(shí)例來解釋,此時(shí)的系統(tǒng)為汽車動(dòng)力系統(tǒng),施加的隨機(jī)信號為燃油量,被測對象指車轉(zhuǎn)速,得到的動(dòng)態(tài)特性就是指車速與燃油量函數(shù)關(guān)系式,從而不用探求背后的物理化學(xué)規(guī)律就得到了數(shù)學(xué)模型。
在沈陽黎明航空公司實(shí)習(xí)時(shí)去過試車間,除了發(fā)動(dòng)機(jī)點(diǎn)火后震撼的場景動(dòng)人心魄,控制室屏幕上海量的數(shù)據(jù)也同樣引人注目,我想這么多數(shù)據(jù)無非就是驗(yàn)證數(shù)學(xué)模型或直接實(shí)驗(yàn)法得到數(shù)學(xué)模型,結(jié)合航空發(fā)動(dòng)機(jī)這種復(fù)雜的系統(tǒng),對于搞控制的人來說,得到數(shù)學(xué)模型就夠了,現(xiàn)象背后的原因交給研發(fā)的人來探索更好。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇3
我主要讀了第一部分和第三部分。
第一部分是大數(shù)據(jù)的思維變革,作者舍恩伯格提出了三個(gè)觀點(diǎn),一是"不是隨機(jī)樣本,而是全體數(shù)據(jù)",二是"不是精確性,而是混雜性",三是"不是因果關(guān)系,而是相關(guān)關(guān)系",作者被譽(yù)為"大數(shù)據(jù)時(shí)代的預(yù)言家",拋出的觀點(diǎn)是擲地有聲的,下面我將談?wù)勎覍@三點(diǎn)的理解。
對于一,我們必須承認(rèn)我們以往做的處理抽樣數(shù)據(jù)得到結(jié)果的方法,是省時(shí)省力省錢的,而且判斷結(jié)果是相對高精準(zhǔn)的,如人口普查這一案例,如果采用全體數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的話,工作難度是相當(dāng)大的,最后的結(jié)果也不會很滿意,這是得不償失的。但是隨著數(shù)據(jù)處理技術(shù)的飛速發(fā)展,我們已經(jīng)具備了處理大量數(shù)據(jù)的能力,如果在數(shù)據(jù)分析過程中采用全體數(shù)據(jù),就能避免抽樣數(shù)據(jù)可能由于選取偏見帶來的非隨機(jī)性,處理全體數(shù)據(jù)也必將成為一種趨勢。用在國防生管理工作中,就是管理層要對每個(gè)個(gè)體都給予充分的關(guān)心與互動(dòng),對于優(yōu)秀的固然要偏愛,但是對于較差的也要保持"不拋棄不放棄"的態(tài)度,讓每一個(gè)個(gè)體都找到自己的定位與價(jià)值。
對于二,作者強(qiáng)調(diào)通過掌握更多的數(shù)據(jù),暫時(shí)犧牲精確性,關(guān)注更多容易被忽略的細(xì)節(jié),來做更多的事,得到更多的結(jié)果,也就是說我們要有一定的包容錯(cuò)誤的能力。我們在收集數(shù)據(jù)時(shí),要主動(dòng)獲取更多的數(shù)據(jù),少加一些限制性條件,然后應(yīng)用我們處理大數(shù)據(jù)的能力,或許會獲得意想不到的結(jié)果。作者舉了一個(gè)谷歌翻譯系統(tǒng)的例子,通過英語作為中轉(zhuǎn),進(jìn)行各語言之間的轉(zhuǎn)換。此處的啟發(fā)就是用我們最擅長的途徑,不拘泥于特定規(guī)則,來達(dá)到我們的目的,也就是說我們要先認(rèn)清自己,不去刻意的模仿,找出最適合自己的一套方法。
對于三,作者指出知道"是什么"就夠了,沒必要知道"為什么",乍一看這個(gè)觀點(diǎn)覺得有點(diǎn)無腦,但是結(jié)合第二點(diǎn)就合理了,降低對精確性及原因結(jié)果的要求,通過對相關(guān)數(shù)據(jù)的廣泛分析,進(jìn)而得到更豐富更多元的結(jié)果。如購物時(shí),系統(tǒng)的購物推薦,并不是肯定你會購買,僅僅是你感興趣進(jìn)而可能會買就足夠了。其實(shí)作者對"相關(guān)關(guān)系"的強(qiáng)調(diào),主要是大數(shù)據(jù)強(qiáng)大的預(yù)測能力,而且這種預(yù)測性能還是相當(dāng)精確的。以上只是我用作者的觀點(diǎn)佐證他自己的觀點(diǎn),證明其一定的合理性,但是我是不完全認(rèn)同的,在航天領(lǐng)域,我們對成功率的要求是極高的,尤其是載人航天領(lǐng)域,我們必須做到萬無一失,我們對每一個(gè)結(jié)果都會深究其根,找出原因。對于國防生體能成績的分析也是如此,結(jié)果只是我們的一個(gè)評價(jià)機(jī)制,而最重要的還是產(chǎn)生這一結(jié)果的原因及過程。
第三部分是大數(shù)據(jù)的管理變革,本來以為作者會講點(diǎn)如何通過大數(shù)據(jù)來改革管理機(jī)制和提高管理效率,沒想到作者只是講了大數(shù)據(jù)其實(shí)就是我們的隱私的暴露,提出了要讓數(shù)據(jù)采集管理公司對數(shù)據(jù)的使用負(fù)起責(zé)任的解決途徑。個(gè)人感覺,一是我們在平時(shí)要意識到個(gè)人隱私的保護(hù),而是相關(guān)法律政策的完善,真正的讓大數(shù)據(jù)服務(wù)我們的工作生活,而不是一種變相的威脅。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇4
信息時(shí)代的到來,我們感受到的是技術(shù)變化日新月異,隨之而來的是生活方式的轉(zhuǎn)變我們這樣評論著的信息時(shí)代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時(shí)代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時(shí)代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時(shí)代?大數(shù)據(jù)時(shí)代帶給了我們什么?
信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個(gè)高度概括抽象概念,是一個(gè)發(fā)展中的動(dòng)態(tài)范疇,是進(jìn)行互相交換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動(dòng)態(tài)、傳遞、共享、經(jīng)濟(jì)等特性卻是大家的共識。數(shù)據(jù):或稱資料,指描述事物的符號記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實(shí)描述,是構(gòu)成信息和知識的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)兩大類。數(shù)據(jù)指計(jì)算機(jī)加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號等。從定義看來,數(shù)據(jù)是原始的處女地,需要耕耘。信息則是已經(jīng)處理過的可以傳播的資訊。信息時(shí)代依賴于數(shù)據(jù)的爆發(fā),只是當(dāng)數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生。這是否是《大數(shù)據(jù)時(shí)代》一書所未曾闡述的背景材料?
在《大數(shù)據(jù)時(shí)代》一書中,大數(shù)據(jù)時(shí)代與小數(shù)據(jù)時(shí)代的區(qū)別:
1、思維慣例。大數(shù)據(jù)時(shí)代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉。
2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動(dòng)過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測未來。
3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。
4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時(shí)代也即是信息時(shí)代,是大數(shù)據(jù)時(shí)代的前提,大數(shù)據(jù)時(shí)代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)。客戶數(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時(shí)代,從數(shù)據(jù)中攫取價(jià)值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇5
現(xiàn)在已經(jīng)進(jìn)入到了二十一世紀(jì)了,當(dāng)今社會已經(jīng)擺脫了上個(gè)世紀(jì)的那種消息滯后的時(shí)代了,我們最應(yīng)該感謝的就是科學(xué)的進(jìn)步為我們帶來了這么多便利。與此同時(shí),科學(xué)的進(jìn)步還為我們帶來了“大數(shù)據(jù)”這個(gè)讓人類減少了很多工作量的東西。
在這個(gè)學(xué)期的名著導(dǎo)讀課上我們就被要求讀:《大數(shù)據(jù)時(shí)代》這本書?!洞髷?shù)據(jù)時(shí)代》是國外大數(shù)據(jù)系統(tǒng)研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽(yù)為“大數(shù)據(jù)時(shí)代的預(yù)言家”,他是一個(gè)特別厲害的人,他作為一個(gè)教師,他曾經(jīng)在哈佛大學(xué)、牛津大學(xué)、耶魯大學(xué)和新加坡國立大學(xué)等多所世界前列名校任教的經(jīng)歷。他作為一個(gè)科學(xué)家,早在20__年就在《經(jīng)濟(jì)學(xué)人》上發(fā)布了長達(dá)14頁對大數(shù)據(jù)應(yīng)用的前瞻性研究。他是十余年潛心研究數(shù)據(jù)科學(xué)的技術(shù)權(quán)威。他是最早洞見大數(shù)據(jù)時(shí)代發(fā)展趨勢的數(shù)據(jù)科學(xué)家之一,也是最受人尊敬的權(quán)威發(fā)言人之一?,F(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人,哈佛國家電子商務(wù)研究中網(wǎng)絡(luò)監(jiān)管項(xiàng)目負(fù)責(zé)人;曾任新加坡國立大學(xué)李光耀學(xué)院信息與創(chuàng)新策略研究中心主任。并擔(dān)任耶魯大學(xué)、芝加哥大學(xué)、弗吉尼亞大學(xué)、圣地亞哥大學(xué)、維也納大學(xué)的客座教授。他作為一個(gè)研究學(xué)者,他的學(xué)術(shù)成果斐然,有一百多篇論文公開發(fā)表在《科學(xué)》《自然》等著名學(xué)術(shù)期刊上,他同時(shí)也是哈佛大學(xué)出版社、麻省理工出版社、通信政策期刊、美國社會學(xué)期刊等多家出版機(jī)構(gòu)的特約評論員。他是備受眾多世界知名企業(yè)信賴的信息權(quán)威與顧問。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業(yè);"大數(shù)據(jù)"在百度上搜索到的解釋是:稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。特點(diǎn):數(shù)量、速度、品種、真實(shí)性。而舍恩伯格認(rèn)為,大數(shù)據(jù)并不能定義一個(gè)確切的概念。他提到"大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場、組織機(jī)構(gòu),以及政府和公民關(guān)系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
大數(shù)據(jù)不僅改變了公共衛(wèi)生領(lǐng)域,整個(gè)商業(yè)領(lǐng)域都因?yàn)榇髷?shù)據(jù)而重新洗牌。購買飛機(jī)票就是一個(gè)很好的例子。就像書中寫到20__年,奧倫·埃齊奧尼準(zhǔn)備乘坐從西雅圖到洛杉磯的飛機(jī)去參加弟弟的婚禮。他知道飛機(jī)票越早預(yù)訂越便宜,于是他在這個(gè)大喜日子來臨之前的幾個(gè)月,就在網(wǎng)上預(yù)訂了一張去洛杉磯的機(jī)票。在飛機(jī)上,埃齊奧尼好奇地問鄰座的乘客花了多少錢購買機(jī)票。當(dāng)?shù)弥m然那個(gè)人的機(jī)票比他買得更晚,但是票價(jià)卻比他便宜得多時(shí),他感到非常氣憤。于是,他又詢問了另外幾個(gè)乘客,結(jié)果發(fā)現(xiàn)大家買的票居然都比他的便宜。
飛機(jī)著陸之后,埃齊奧尼下定決心要幫助人們開發(fā)一個(gè)系統(tǒng),用來推測當(dāng)前網(wǎng)頁上的機(jī)票價(jià)格是否合理。作為一種商品,同一架飛機(jī)上每個(gè)座位的價(jià)格本來不應(yīng)該有差別。但實(shí)際上,價(jià)格卻千差萬別,其中緣由只有航空公司自己清楚。
埃齊奧尼表示,他不需要去解開機(jī)票價(jià)格差異的奧秘。他要做的僅僅是預(yù)測當(dāng)前的機(jī)票價(jià)格在未來一段時(shí)間內(nèi)會上漲還是下降。這個(gè)想法是可行的,但操作起來并不是那么簡單。這個(gè)系統(tǒng)需要分析所有特定航線機(jī)票的銷售價(jià)格并確定票價(jià)與提前購買天數(shù)的關(guān)系。
在信息時(shí)代,信息安全問題的日趨凸顯,數(shù)據(jù)獨(dú)裁與隱私保護(hù)之間的矛盾更是立于風(fēng)口浪尖,成為眾矢之的,舍恩伯格在本書的最后章節(jié)曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數(shù)據(jù)并不是一個(gè)充斥著算法的和機(jī)器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數(shù)據(jù)時(shí)代同樣的重要,數(shù)據(jù)是為人類服務(wù)的,也就該人類驅(qū)使下完成相應(yīng)的目的。在這樣的大環(huán)境下,常引起我更多的思考和擔(dān)憂。
大數(shù)據(jù)時(shí)代對于我們同是機(jī)遇與挑戰(zhàn),一些國家已開始步入大數(shù)據(jù)時(shí)代的行列,并在各個(gè)領(lǐng)域開始研究和使用。而對于我國龐大的人口,以及較大的領(lǐng)土面積,都可以在大數(shù)據(jù)時(shí)代為我們提供數(shù)據(jù)的保障,而能否面臨挑戰(zhàn),在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術(shù)等方面的問題,更應(yīng)在政策上逐步開放各領(lǐng)域的數(shù)據(jù),保證數(shù)據(jù)來源、權(quán)限等問題得到解決,不斷學(xué)習(xí)先進(jìn)的計(jì)算機(jī)技術(shù),縮小與其他國家的差距。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇6
4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時(shí)代》的讀書交流活動(dòng)。通過相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時(shí)代的利與弊,機(jī)遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實(shí)意義。
首先,最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來?!薄按髷?shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙砘ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后又IT行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個(gè)人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級方向。
其次,進(jìn)入20__年,大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時(shí)報(bào)》《華爾街日報(bào)》的專欄封面,進(jìn)入美國白宮的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進(jìn)了投資推薦報(bào)告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時(shí)間的推移,人們將越來越多的意識到數(shù)據(jù)對企業(yè)的重要性。正如《紐約時(shí)報(bào)》20__年2月的一篇專欄中所稱,“大數(shù)據(jù)”時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺。哈佛大學(xué)社會學(xué)教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!?/p>
最后,隨著云時(shí)代的來臨,大數(shù)據(jù)(Bigdata)也吸引了越來越多的關(guān)注。著云臺的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Bigdata)通常用來形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時(shí)會花費(fèi)過多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作?!按髷?shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到__年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,__年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,__年的數(shù)據(jù)量為0.8ZB,__年增長為1.2ZB,__年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到__年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB.IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了__年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢,可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實(shí)現(xiàn)利益最大化。而我們很多人對大數(shù)據(jù)還很陌生,只是被動(dòng)的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時(shí)代是以云計(jì)算為基礎(chǔ)的,所以,要實(shí)現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時(shí),可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時(shí)代的到來會解放更多的勞動(dòng)生產(chǎn)力,勢必將會更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時(shí)代的到來會使人們的生活節(jié)奏急速加快,信息的時(shí)效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時(shí),就像現(xiàn)在的日本,可能想找個(gè)人聽你說說話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動(dòng)泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運(yùn)用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時(shí)查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當(dāng)及時(shí)刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時(shí)代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲存和展示個(gè)人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機(jī)碼來保護(hù)自己真實(shí)IP地址,提高網(wǎng)絡(luò)安全的可靠性,加強(qiáng)對聯(lián)網(wǎng)信息的管理和保護(hù)。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇7
我們生活在一個(gè)“概念”紛飛的年代,先前只有IBM熟諳的招數(shù),如今已經(jīng)“飛入平常百姓家”?!耙苿?dòng)互聯(lián)網(wǎng)”、“云計(jì)算”的概念剛剛消停,業(yè)界的專家又送來了“大數(shù)據(jù)”的概念,一時(shí)間似乎人人都變成了“大數(shù)據(jù)”專家,見面要是不提“大數(shù)據(jù)”都不好意思跟人打招呼!
玩笑歸玩笑,當(dāng)我們的存儲能力、計(jì)算能力和網(wǎng)絡(luò)帶寬變得充裕之后,我們先前對待數(shù)據(jù),尤其是原始數(shù)據(jù)的態(tài)度和思維方式,將面臨著很大的改變!
其實(shí),作者的主要觀點(diǎn),已經(jīng)在翻譯者的譯者序中進(jìn)行了總結(jié):“大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果”。
如作者所言,“采樣分析是信息缺乏時(shí)代和信息流通受限制的模擬數(shù)據(jù)時(shí)代的產(chǎn)物”。如果可以,我們當(dāng)然會使用“全體數(shù)據(jù)”而不是“抽樣數(shù)據(jù)”。讀到這里,我估計(jì)大學(xué)里正在絞盡腦汁設(shè)計(jì)樣本抽樣方法的學(xué)生、教授們,連哭的心都有!
數(shù)據(jù)分析的及時(shí)性,在很多情況下比精確性更加重要,尤其是在商業(yè)領(lǐng)域。想想看,如果需要兩周時(shí)間才能計(jì)算出明天某個(gè)航班的滿座率,那還有什么意義?大數(shù)據(jù)計(jì)算技術(shù),適用的不是像衛(wèi)星發(fā)射、開具銀行賬戶這樣的工作,而是不要求極端精確的情況,其核心是“預(yù)測趨勢”,況且原始數(shù)據(jù)也可能出現(xiàn)差錯(cuò)。
過往千年,探究因果關(guān)系幾乎是所有科學(xué)研究的原動(dòng)力。甚至,這已經(jīng)通過語言,融入我們的思維方式和哲學(xué)思想:“因?yàn)椤浴?,凡事都要問“為什么”。但是,在大?shù)據(jù)的范疇里,關(guān)注的卻是相關(guān)性,而不是因果關(guān)系,或者其次才是因果關(guān)系。超市只用關(guān)心把啤酒和尿不濕放在一起,會幫助提高銷售額,而不用關(guān)心其中的奧秘。如果說原因,可能很多都是人們的習(xí)慣、方便,甚至是人性,例如奶爸們習(xí)慣買尿不濕的時(shí)候給自己捎上幾罐啤酒。
在此,也有一些自己的思考:如果說搜索引擎所解決的問題表面上是幫助用戶找到需要的信息,而實(shí)質(zhì)是幫助企業(yè)找到擁有某項(xiàng)需求的客戶,深層次講是解決了《第三次浪潮》中提出的消費(fèi)者和生產(chǎn)者分離的根本矛盾,如果再加上3D打印技術(shù),就可以完成由消費(fèi)者主導(dǎo)的“個(gè)性化”生產(chǎn)過程;而大數(shù)據(jù)所解決的是,通過對所有用戶的數(shù)據(jù)進(jìn)行分析,可以預(yù)測用戶群整體的需求變化趨勢,從而完成批量產(chǎn)品生產(chǎn)、銷售的調(diào)整問題,其奇妙之處就在于無需用戶“開口”說出她想要什么?一個(gè)解決的`“個(gè)體需求”,一個(gè)解決的是“群體需求”。
本書除了提出上述三項(xiàng)基本觀點(diǎn),其它的內(nèi)容大多是舉例說明,多少有些空泛。但是,其實(shí)大數(shù)據(jù)時(shí)代才剛剛開始,對大數(shù)據(jù)的應(yīng)用也只是停留在比較淺的層面上,作者能提出這三項(xiàng)基本觀點(diǎn)已屬難能可貴!
大數(shù)據(jù)時(shí)代讀書心得體會范文篇8
通過讀ViktorMayer-Schonberger的《大數(shù)據(jù)時(shí)代》重新認(rèn)真思考了大數(shù)據(jù),全書以數(shù)據(jù)為核心,引導(dǎo)人們用數(shù)據(jù)的思維去理解世界,用數(shù)據(jù)的思維去解決問題,是推薦讀物。但個(gè)人認(rèn)為本書叫《數(shù)據(jù)時(shí)代》更為合適,因其講了不少統(tǒng)計(jì)學(xué)、數(shù)據(jù)收集的故事,“大數(shù)據(jù)”的故事只占一小部分。
維基百科說大數(shù)據(jù)由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集大小常超出常用軟件在可接受時(shí)間下的收集、庋用、管理和處理能力,或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,大數(shù)據(jù)的常見特點(diǎn)是3V:Volume、Velocity、Variety。
規(guī)模巨大的數(shù)據(jù)未必是大數(shù)據(jù),需滿足她的三個(gè)特點(diǎn)。以研究擲硬幣概率的實(shí)驗(yàn)為例,當(dāng)傳統(tǒng)實(shí)驗(yàn)次數(shù)達(dá)到一定規(guī)模后就能幫助實(shí)驗(yàn)者分析正反面出現(xiàn)的概率,隨著實(shí)驗(yàn)次數(shù)的增加,數(shù)據(jù)大量積累可能越來越支持這一結(jié)論,數(shù)據(jù)達(dá)到一定量,它的邊際效應(yīng)就出現(xiàn)了,數(shù)據(jù)繼續(xù)增加對分析概率還有多少意義呢?按照現(xiàn)代概率學(xué)伯努利試驗(yàn)去帶入函數(shù)計(jì)算就好了,這僅算是概率學(xué)或者是統(tǒng)計(jì)學(xué)吧。故大數(shù)據(jù)不是因?yàn)閱渭凅w積大而大,是因?yàn)殡s而大,研究硬幣正反面的概率如引入天文學(xué)、心理學(xué)、材料學(xué)、物理學(xué)等領(lǐng)域的數(shù)據(jù)而使之變大,進(jìn)而研究關(guān)聯(lián)關(guān)系(或因果關(guān)系,注:本書不認(rèn)同因果關(guān)系的重要性),從而得出概率的分布,然而大量相關(guān)數(shù)據(jù)的引入,按照傳統(tǒng)分析過程的時(shí)間是不可接受的,需利用高效計(jì)算資源,迅速把雜而大的處理結(jié)果呈現(xiàn)出來,并且實(shí)驗(yàn)者對結(jié)果的預(yù)期不能要求100%的精確。大數(shù)據(jù)并不是數(shù)據(jù)本身,而是一種思維方式。
大數(shù)據(jù)令人著迷的地方在于用“科學(xué)”的辦法挑戰(zhàn)了“預(yù)測學(xué)”,幫助人們發(fā)現(xiàn)未知,幫忙人們進(jìn)行決策。然而本書作者ViktorMayer-Schonberger強(qiáng)調(diào)“大數(shù)據(jù)不是因果關(guān)系,而是相關(guān)關(guān)系,相關(guān)關(guān)系比因果關(guān)系更重要”,此觀點(diǎn)不能認(rèn)同,因果關(guān)系是宇宙的基本定律,且不說種瓜得瓜、善有善報(bào)之類哲學(xué)命題,若商家在發(fā)現(xiàn)電容器、釘子、高壓鍋有關(guān)聯(lián)購買關(guān)系而去做大量營銷的話豈不是有可能發(fā)生更多的波士頓爆炸案①。關(guān)聯(lián)關(guān)系在大數(shù)據(jù)中被提取出來使用,而不去關(guān)心因果關(guān)系是一種粗暴的、倒退的處理方式,是作者理解的現(xiàn)代社會浮躁的心里體現(xiàn)。我認(rèn)為的大數(shù)據(jù)應(yīng)該是把看起來不相干的數(shù)據(jù)放到一起分析,找到某些跨領(lǐng)域的關(guān)聯(lián)關(guān)系,進(jìn)而推論因果關(guān)系,發(fā)現(xiàn)其中價(jià)值。作者引用了安德森的觀點(diǎn)“現(xiàn)在已經(jīng)是一個(gè)有海量數(shù)據(jù)的時(shí)代,應(yīng)用數(shù)學(xué)已經(jīng)取代了其他的所有學(xué)科工具,而且只要數(shù)據(jù)足夠,就能說明問題”,數(shù)據(jù)和所有科學(xué)的關(guān)系,我覺得有點(diǎn)像現(xiàn)在互聯(lián)網(wǎng)和其他所有行業(yè)的關(guān)系一樣,互聯(lián)網(wǎng)終究還是一個(gè)工具。作者舉了沃爾瑪“尿布與啤酒”③的故事,這也是大家熟知的一個(gè)數(shù)據(jù)分析的故事,但是沃爾瑪真的是這么做的嗎?大家可以去沃爾瑪?shù)臅r(shí)候留意一下。一家大型的超市,如果為了這種所謂相關(guān)關(guān)系,所有商品用這種關(guān)聯(lián)關(guān)系去擺放,天哪,這將是一家多么混亂的超市,顧客進(jìn)去將難以區(qū)分食品在哪、生活用品在哪!有人可能說這種關(guān)聯(lián)關(guān)系更適合電子商務(wù),是的,但是我還是比較看好已知原因的關(guān)聯(lián)關(guān)系,比如嬰幼兒智力玩具和孕婦減肥放到一起,比如在線播放器旁邊放衛(wèi)生紙的廣告(哈哈哈,你懂的)。本書用美國折扣零售店塔吉特與懷孕預(yù)測②來佐證他的觀點(diǎn),但恰恰是知道因果關(guān)系后商業(yè)價(jià)值才能更多的體現(xiàn)出來,未知因果關(guān)系前顧客的父親生氣并要求賠償,知道因果關(guān)系后才使得這種廣告理所應(yīng)當(dāng)并讓客戶接受。
互聯(lián)網(wǎng)信息時(shí)代數(shù)據(jù)的積累以及BI、數(shù)據(jù)倉庫、人工智能、HADOOP、NOSQL等技術(shù)的流行,使得人們考慮問題的方式已經(jīng)發(fā)生變化,接下來我們要做的只有接受擁抱數(shù)據(jù)時(shí)代、大數(shù)據(jù)時(shí)代。軟件行業(yè)程序上線的變更差錯(cuò)率是一個(gè)考核IT水平的指標(biāo),為此很多公司引進(jìn)了CMMI體系,以求他保障軟件的質(zhì)量,為此也收集了大量的過程數(shù)據(jù)。若用數(shù)據(jù)的思維,是否可能根據(jù)之前的各種相關(guān)數(shù)據(jù)預(yù)測下次投產(chǎn)變更的成功率?若用大數(shù)據(jù)的思維,是否可以根據(jù)CMMI數(shù)據(jù)以及程序員開發(fā)期間上下班考勤數(shù)據(jù)、工資發(fā)放時(shí)間、上線當(dāng)天天氣情況來綜合預(yù)測投產(chǎn)變更的成功率?用大數(shù)據(jù)的思維,訂餐網(wǎng)站不僅根據(jù)之前你定的是咸的還是辣的來給你推薦菜單,可能因?yàn)槟阄⒉┥习l(fā)了一句“每個(gè)月總有那么幾天”修改了訂餐的推薦菜單(哈哈)!故在數(shù)據(jù)時(shí)代,提議童鞋們檢查公司的信息系統(tǒng),是否有定期刪除“垃圾”日志、數(shù)據(jù)的機(jī)制(Viktor說,即使最平凡的信息業(yè)可以具有特殊的價(jià)值),為了日益廉價(jià)的存儲而刪除日益昂貴的數(shù)據(jù),請三思后行吧。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇9
《大數(shù)據(jù)時(shí)代》是英國維克托·邁爾—舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點(diǎn)就在于作者利用上百個(gè)例子來對大數(shù)據(jù)的方方面面做了詳細(xì)解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時(shí)代的思維變革、商業(yè)變革和管理變革三個(gè)角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計(jì)算機(jī)運(yùn)算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計(jì)時(shí)只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機(jī)樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計(jì)結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。"小數(shù)據(jù)"時(shí)代,一個(gè)樣本的錯(cuò)誤就可以造成對總體估計(jì)的失敗,幸運(yùn)的是,"大數(shù)據(jù)"時(shí)代對精確性不再那么要求苛刻——也無法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補(bǔ)這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點(diǎn)就是大數(shù)據(jù)時(shí)代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。
在我看來,這實(shí)際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"
大數(shù)據(jù)時(shí)代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價(jià)值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無限使用,時(shí)效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個(gè)公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時(shí)代的價(jià)值鏈由三部分構(gòu)成,我把它們簡化為"生產(chǎn)—分析—使用"三個(gè)環(huán)節(jié),這對應(yīng)書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價(jià)值,但作者認(rèn)為,最終,大部分的價(jià)值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個(gè)成熟的市場,人人都了解了大數(shù)據(jù)的用途。
對于普通人來說,大數(shù)據(jù)時(shí)代最關(guān)心的`還是隱私問題。不知不覺中,個(gè)人的一舉一動(dòng)都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險(xiǎn)。對此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測一個(gè)人的犯罪動(dòng)機(jī),這給監(jiān)管者帶來的難題是,預(yù)測一個(gè)人要犯罪,懲罰還是不懲罰?在這點(diǎn)上,社會達(dá)成"個(gè)人僅需對行為而非動(dòng)機(jī)負(fù)責(zé)"的共識非常重要。
大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)控制靠的是"算法師",類似會計(jì)師一樣的職業(yè),對大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨(dú)裁。當(dāng)今的法律亦需對大數(shù)據(jù)監(jiān)管進(jìn)行修訂補(bǔ)充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動(dòng),相信在不久的將來更多的傳統(tǒng)領(lǐng)域會意識到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實(shí)用的'選擇;但對某些領(lǐng)域,盲目使用大數(shù)據(jù)只會適得其反。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇10
“除了上帝,任何人都必須用數(shù)據(jù)來說話?!薄@是《大數(shù)據(jù)》中出現(xiàn)的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數(shù)字信息時(shí)代,數(shù)據(jù)和空氣一樣遍布生活,對于有些人來說,數(shù)據(jù)無意義,而對于有些人來說,數(shù)據(jù),即真相。
美國是《大數(shù)據(jù)》的主角,全書通過講述美國半個(gè)多世紀(jì)信息開放、技術(shù)創(chuàng)新的歷史,以別開生面的經(jīng)典案例——設(shè)“前所未有的開放政府”的雄心、公共財(cái)政透明的曲折、《數(shù)據(jù)質(zhì)量法》背后的隱情、全民醫(yī)改法案的波瀾、統(tǒng)一身份證的百年糾結(jié)、街頭警察的創(chuàng)新傳奇、美國礦難的悲情歷史、商務(wù)智能的前世今生、數(shù)據(jù)開放運(yùn)動(dòng)的全球興起,以及云計(jì)算、Facebook和推特等社交媒體、Web3·0與下一代互聯(lián)網(wǎng)的未來圖景等等,為讀者一一細(xì)解數(shù)據(jù)創(chuàng)新給公民、政府、社會帶來的種種挑戰(zhàn)和變革。
透過全書,一個(gè)立體的美國及美國人民的思想呈現(xiàn)在我們面前——美國人民執(zhí)著于個(gè)人隱私的保護(hù),卻又不遺余力地推動(dòng)著政府信息的透明與公開。
讀完此書,對生活中的數(shù)據(jù)及數(shù)據(jù)處理突然有了很大的興趣。如果有一天,處處以數(shù)據(jù)說話,那么,政治、制度、生活將更加清明,事故將降到最低點(diǎn)。
作為信息技術(shù)教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術(shù)特有的文化以及能用于教學(xué)的鮮活案例。
每天能用來閱讀的時(shí)間很少,總是要等到夜深疲倦時(shí)才有空打開書本,總是在眼睛極不舒服的情況下堅(jiān)持閱讀,《大數(shù)據(jù)》就這樣在堅(jiān)持中溶入我的思想……
大數(shù)據(jù)時(shí)代讀書心得體會范文篇11
大數(shù)據(jù)這個(gè)詞一直存在但我們很少在這個(gè)時(shí)代前能有所耳聞,在我讀了維克托寫的大數(shù)據(jù)之后,我明白了在更早的年代之所以不流行這個(gè)詞是因?yàn)槿藗兿矚g感性的思考而不是拿數(shù)據(jù)理性的分析。究其原因,一方面是數(shù)據(jù)量小,另一方面是人們的思想落后。然而隨著信息時(shí)代的到來和云技術(shù)的發(fā)展,大數(shù)據(jù)逐漸成為一個(gè)可靠的參考標(biāo)準(zhǔn),以及大數(shù)據(jù)在諸多領(lǐng)域做出的貢獻(xiàn)足以證明他在這個(gè)時(shí)代的重要地位。
維克托在書中例舉了大量有關(guān)美國在這半個(gè)世紀(jì)信息開發(fā)技術(shù)創(chuàng)新的典型案例,從側(cè)面向我們闡述了大數(shù)據(jù)在諸多領(lǐng)域的不同作用,例舉其在醫(yī)學(xué)方面的作用,在不久之前,你也許可能還會聽到兩個(gè)醫(yī)生對于一個(gè)醫(yī)學(xué)問題爭論的喋喋不休,……公說公有理婆說婆有理……,但怎么說都是建立在“我認(rèn)為”的主觀臆斷之上,幸運(yùn)地是,大數(shù)據(jù)的出現(xiàn)給幫助醫(yī)生在問題上給予一個(gè)正確的指向,通過云端和千千萬萬的數(shù)據(jù),可以更清楚還原問題的直觀事實(shí)。
這樣的例子在生活中也數(shù)不勝數(shù),其力量存在于人們無形的生活中,卻有形的幫助人們解決了在經(jīng)濟(jì),科學(xué),人文方面的各種問題,通過整合混沌的信息,分析加工我們就能很好的了解自己所處的世界并駕馭在時(shí)代的前沿。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇12
去年的“云計(jì)算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來了。于是乎,各企業(yè)的CIO也將熱度紛紛轉(zhuǎn)向關(guān)注“大數(shù)據(jù)”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實(shí)地反映了現(xiàn)實(shí)中小企業(yè)云計(jì)算,大數(shù)據(jù)的現(xiàn)狀。
不過話又還得說回來,《大數(shù)據(jù)時(shí)代》是本好書。
當(dāng)然,很多IT知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關(guān)注過現(xiàn)在也比較火熱的BI,覺得也差不多,可能就是更多的數(shù)據(jù),更細(xì)致的數(shù)據(jù)分析與數(shù)據(jù)挖掘。看過此書后,感覺到之前的想法,只能算是中了一小半吧—。巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關(guān)聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時(shí)BI的不同,不僅僅是方法,更多的時(shí)思想方法。不過坦白講,到底是數(shù)據(jù)的關(guān)聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時(shí)間來檢驗(yàn)一下,至少從現(xiàn)在的數(shù)據(jù)分析方法來論,更多的傾向于數(shù)據(jù)的精確性。
看完此書,我心中的一些問題:
1、什么是大數(shù)據(jù)?
查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity、Variety、Veracity這個(gè)好像是IBM的定義吧。
以個(gè)人的觀點(diǎn)來看:數(shù)據(jù)海量,存儲海量都是大數(shù)據(jù)的基本原型吧。
2、大數(shù)據(jù)適合什么樣的企業(yè)?
誠然,大數(shù)據(jù)的前提是海量的數(shù)據(jù),只有擁有巨量的數(shù)據(jù)資源,方能從中查找出數(shù)據(jù)的關(guān)聯(lián)性,才可以讓通過專業(yè)化的處理,讓其為企業(yè)產(chǎn)生價(jià)值。針對電信運(yùn)營,互聯(lián)網(wǎng)應(yīng)用這樣海量用戶的數(shù)據(jù)的大企業(yè),也是在應(yīng)用大數(shù)據(jù)的道路上擁有得天獨(dú)厚的條件,但是針對中小企業(yè)呢?銷售訂單數(shù)據(jù)?若非百年老店,估計(jì)數(shù)據(jù)也是少得可憐,能用的可能只有消費(fèi)者數(shù)據(jù)了吧。貌似大多數(shù)廠商,用來舉例的也就是消費(fèi)都購買行為分析為最多。
同樣,在公共事業(yè)類的政府機(jī)構(gòu),大數(shù)據(jù)的作用也許也能很好的發(fā)揮。反而感覺在大多數(shù)中小型企業(yè)應(yīng)用大數(shù)據(jù),似乎有點(diǎn)大題小作。書中說:大數(shù)據(jù)是企業(yè)競爭力。誠然,數(shù)據(jù)是一個(gè)企業(yè)的核心無形資源(利用得好的話),但是否所有的數(shù)據(jù),或都換則方式說:所有的企業(yè)都以大數(shù)據(jù)為競爭力,是否真的合適么?是否在中小企業(yè)中,會顯示得小題大做呢?
3、大數(shù)據(jù)帶來的影響
當(dāng)一波又一波的IT技術(shù)熱潮源源不斷地向我們鋪面而來的時(shí)候,你甚至都沒有做好準(zhǔn)備,你都要開始迎接它所給你帶來的影響了。經(jīng)過物聯(lián)網(wǎng),云計(jì)算的推波助瀾下,大數(shù)據(jù)開始登場了。但它到底給我們帶來了什么呢?
1)預(yù)測未來書中以Google成功預(yù)測了未來可能發(fā)生流感的案例來開篇,表明通過大數(shù)據(jù)的應(yīng)用,可以為我們的生活起一個(gè)保駕護(hù)航的指向標(biāo)。實(shí)質(zhì)很簡單,技術(shù)改變世界。
2)變革商業(yè)大數(shù)據(jù)所帶來的商機(jī),同時(shí)會衍生出一系列與大數(shù)據(jù)相關(guān)的商業(yè)機(jī)遇與商業(yè)模式,數(shù)據(jù)的潛在價(jià)值會源源不斷地發(fā)揮作用可以容易想到的是未來有專門的數(shù)據(jù)收集,數(shù)據(jù)分析,數(shù)據(jù)生成的一條數(shù)據(jù)產(chǎn)業(yè)鏈產(chǎn)生。影響的,當(dāng)然是IT公司
3)變革思維書中所說:因?yàn)橛泻A康臄?shù)據(jù)作基礎(chǔ),未來,我們可能更關(guān)注數(shù)據(jù)的相關(guān),而非精細(xì)度。對這條,本人還是持保留意見的。
如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時(shí)代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時(shí)代的。預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進(jìn)行一場思想上的對話。
舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。
在第一部分”大數(shù)據(jù)時(shí)代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個(gè)觀點(diǎn):
一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對于第一個(gè)觀點(diǎn),我不敢茍同。
一方面是對全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對于簡單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?
我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計(jì)方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個(gè)觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對他第一個(gè)觀點(diǎn)很好的補(bǔ)充,這也是對精準(zhǔn)傳播和精準(zhǔn)營銷的一種反思。”大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法更有效。“更具有宏觀視野和東方哲學(xué)思維。對于舍恩伯格的第三個(gè)觀點(diǎn),我也不能完全贊同。”不是因果關(guān)系,而是相關(guān)關(guān)系。“不需要知道”為什么“,只需要知道”是什么“。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時(shí)代人們只關(guān)心因果關(guān)系,對相關(guān)關(guān)系認(rèn)識不足,大數(shù)據(jù)時(shí)代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價(jià)值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語出驚人,對舊有觀念進(jìn)行徹底的否定。
世間萬物的復(fù)雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時(shí)一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關(guān)系,而是相關(guān)關(guān)系?!斑@一論斷時(shí),他在書中還說道:”在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!癧i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。
大數(shù)據(jù)研究的一大驅(qū)動(dòng)力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時(shí)代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可”量化“,大數(shù)據(jù)的定量分析有力地回答”是什么“這一問題,但仍然無法完全回答”為什么“。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價(jià)值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時(shí)仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個(gè)社會系統(tǒng)里,但他在第二部分大數(shù)據(jù)時(shí)代的管理變革中討論了這個(gè)問題。
在風(fēng)險(xiǎn)社會中信息安全問題日趨凸顯。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個(gè)問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:”大數(shù)據(jù)并不是一個(gè)充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考的答案,幫助是暫時(shí)的,而更好的方法和答案還在不久的未來?!爸x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時(shí)代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考的答案。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇13
未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時(shí)代。不管你是否意識到它的存在,大數(shù)據(jù)都將越來越快地改變我們這個(gè)時(shí)代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數(shù)據(jù)時(shí)代發(fā)展趨勢的數(shù)據(jù)科學(xué)家之一。他通過一個(gè)大家熟知的事例,來幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個(gè)世紀(jì)之前望遠(yuǎn)鏡和顯微鏡的發(fā)明。望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數(shù)據(jù)的新工具,因?yàn)檫@種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進(jìn)了人們對世界更好的理解。如果說望遠(yuǎn)鏡和顯微鏡是測量領(lǐng)域中的一場革命,那么今天的數(shù)據(jù)測量就相當(dāng)于是現(xiàn)代版的望遠(yuǎn)鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動(dòng)帶寬迅速提升,云計(jì)算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動(dòng)終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長速度比歷史上的任何時(shí)期都要多、都要快。一個(gè)大數(shù)據(jù)的時(shí)代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當(dāng)前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對過去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進(jìn)行分析和工作時(shí),所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過,他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣。例如一項(xiàng)針對相撲比賽中非法操縱比賽結(jié)果的研究對64000場比賽進(jìn)行了分析,這算不上一個(gè)很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對于一個(gè)事物只有50個(gè)數(shù)據(jù)點(diǎn),那么每一個(gè)數(shù)據(jù)點(diǎn)都必須非常精確,因?yàn)槊總€(gè)數(shù)據(jù)點(diǎn)都是有用的;但是如果我們有5000萬個(gè),去掉10個(gè),甚至去掉1000個(gè)都沒有太大的問題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預(yù)測未來“是什么”,而不是“為什么”。因?yàn)楹芏鄷r(shí)候我們以為我們找到了事情背后的原因,實(shí)際上卻沒有找到。更多時(shí)候知道了“是什么”就足夠了。例如知道流感將會擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時(shí)候在網(wǎng)上購買機(jī)票能夠獲得最優(yōu)惠的價(jià)格就足夠了,我不需要知道為什么此時(shí)價(jià)格最低。
二、大數(shù)據(jù)帶來的變化
大數(shù)據(jù)從根本上改變我們認(rèn)識世界和改變世界的方式。很多傳統(tǒng)的習(xí)慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來說:
第一,科學(xué)探究的思路和方式受到挑戰(zhàn)
探究是新課程改革中的一個(gè)熱詞,是促進(jìn)學(xué)校教學(xué)與科學(xué)研究相融合的實(shí)踐舉措??茖W(xué)探究的基本路徑是:發(fā)現(xiàn)問題,提出假設(shè),制定方案,實(shí)踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會梳理出這樣一個(gè)探究的路徑,與我們對問題知曉的信息過少有關(guān)。換句話說,對所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過猜想和假設(shè),進(jìn)行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測量所獲得的點(diǎn)滴數(shù)據(jù),從一個(gè)局部來推測世界是怎樣的,這是科學(xué)探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認(rèn)識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設(shè)。如果決策者自身對所研究的事情存在著偏見,所提出的假設(shè)就很難得到實(shí)證的支持,這往往會導(dǎo)致探究花費(fèi)了很長的時(shí)間、很大的物力和財(cái)力,也常常勞而無功。但科學(xué)研究者還是堅(jiān)定不移地沿著這條道路前行,學(xué)校在教學(xué)中也將其作為科學(xué)研究的基本規(guī)范來傳授。
在大數(shù)據(jù)時(shí)代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個(gè)事例來說吧。手機(jī)輻射是否能夠致癌?關(guān)于這個(gè)問題,無論我們的假設(shè)如何,實(shí)驗(yàn)的設(shè)計(jì)都很難進(jìn)行。首先,樣本選擇過少,沒有統(tǒng)計(jì)學(xué)上的意義;其次,不能拿人做研究對象;第三,短時(shí)間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時(shí)間,丹麥就進(jìn)行了這樣的研究。丹麥擁有1985年手機(jī)推出以來所有手機(jī)用戶的數(shù)據(jù)庫。他們從這個(gè)數(shù)據(jù)庫中分析了1990年至20__年擁有手機(jī)的所用用戶的數(shù)據(jù),同時(shí),他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機(jī)用戶是否比非手機(jī)用戶有更高的癌癥發(fā)病率。這兩個(gè)數(shù)據(jù)庫本身是完全獨(dú)立的,在作分析之前從來沒有想過可以做這樣的研究。結(jié)果表明,使用移動(dòng)用戶和癌癥風(fēng)險(xiǎn)增加之間不存在任何關(guān)系。20__年10月,這一研究的結(jié)果發(fā)表在《英國醫(yī)學(xué)雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進(jìn)行全面的認(rèn)識之后,假想就沒有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
第二,傳統(tǒng)的思維習(xí)慣受到挑戰(zhàn)
因果關(guān)系思維,是人們生活中最為普遍的一種思維方式。既是看上去沒有關(guān)系的事情,人們也總是從因果的角度去理解他。比如說,1885年7月6日,巴斯德接診了一個(gè)被帶有狂犬病毒的狗咬傷的孩子,他把自己剛研制出來的狂犬疫苗給孩子注射,結(jié)果孩子活下來了。巴斯德的這一舉措,使得狂犬疫苗和孩子的生存之間建立起了一個(gè)因果關(guān)系。但事實(shí)上,人被狂犬病狗咬傷后換上狂犬病的概率是只有七分之一,就算沒有狂犬疫苗,這個(gè)孩子活下來的幾率還是有85%。
在哲學(xué)界,關(guān)于因果關(guān)系的爭論已經(jīng)持續(xù)了幾個(gè)世紀(jì)。爭論的焦點(diǎn)在于:如果因果關(guān)系是普遍存在的,每一個(gè)果都有一個(gè)因和他相對應(yīng),世界上的所有事情都有因果的話,我們就沒有決定任何事情的自由了。盡管哲學(xué)領(lǐng)域的爭論很熱烈,但并不耽誤人們在日常生活中通過因果關(guān)系來思考問題。不僅如此,由于掌握的數(shù)據(jù)過少,人們還容易從線性關(guān)系的角度找尋事物之間的因果關(guān)系。在物理學(xué)中,有一種處理數(shù)據(jù)的方式之一就是“化曲為直”,設(shè)法找到兩個(gè)變量之間的線性因果關(guān)系,從而進(jìn)行定量的描述。事實(shí)上,由于很多事情之間的關(guān)系是很復(fù)雜的,簡單的線性處理容易導(dǎo)致人們對事物本質(zhì)屬性的誤解。
在大數(shù)據(jù)時(shí)代,相關(guān)關(guān)系比因果關(guān)系重要。20__年甲型H1N1流感發(fā)生之后,美國的衛(wèi)生系統(tǒng)極力想從因果關(guān)系上來找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無策。谷歌公司做出了快速反應(yīng),把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在20__年至20__年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,研究特定檢索詞條的頻繁使用與流感在時(shí)間和空間上的傳播之間的聯(lián)系,很快就確定了流感是從哪個(gè)地方傳播出來的。谷歌采取的就是相關(guān)關(guān)系分析的方法,而不是因果關(guān)系分析的方法。這是大數(shù)據(jù)時(shí)代,對數(shù)據(jù)進(jìn)行處理的一種典型方法。
第三,數(shù)據(jù)化比數(shù)字化更加重要
數(shù)字化是將模擬數(shù)據(jù)轉(zhuǎn)化成0和1的二進(jìn)制碼,以便電腦進(jìn)行數(shù)據(jù)處理的過程。過去的很長時(shí)間,我們所做的事情,就是對文本進(jìn)行數(shù)字化。很多書籍包括教材,通過PDF等格式,變成了數(shù)字形態(tài)的資料,存入了電腦或者網(wǎng)路之中。
但是,這些數(shù)字化的資料要查詢起來并不方便。首先你要知道所需的資料在那本書中,其次你還要仔細(xì)地去翻閱這些數(shù)字化的資源,以便找到你所需要的信息。這和到書本里去找沒有本質(zhì)的區(qū)別。
如果這些數(shù)字文本能夠被數(shù)據(jù)化,文本中的字、詞和段落能夠一一被識別,利用搜索殷勤加以檢索就會方便很多。所謂數(shù)據(jù)化就是將一種現(xiàn)象轉(zhuǎn)化為可以制表分析的可量化的過程,量化,是數(shù)據(jù)化的核心。信息只能被數(shù)據(jù)化,其巨大的潛在價(jià)值才有可能被釋放出來。
數(shù)字化帶來了數(shù)據(jù)化,但數(shù)字化不能替代數(shù)據(jù)化。今天,很多學(xué)校都在進(jìn)行“電子書包”的課程教學(xué)實(shí)踐,但有不少實(shí)踐者認(rèn)為,所為電子書包,就是將紙質(zhì)的課本和教輔資料數(shù)字化,裝入電腦中讓學(xué)生上課中使用,這其實(shí)是對電子書包最大的誤解。電子書包的核心在于數(shù)據(jù)化,要通過對學(xué)生學(xué)習(xí)過程所記錄的大數(shù)據(jù)分析,把握學(xué)生的個(gè)性化學(xué)習(xí)特征,以便給予更有針對性的指導(dǎo)。
三、需要關(guān)注的一些問題
從教育的角度看,大數(shù)據(jù)時(shí)代的來臨,對教育的變革將帶來巨大的影響。
首先是教育內(nèi)容要進(jìn)行革新。大數(shù)據(jù)使得傳統(tǒng)的因果思維方式、科學(xué)研究方式不再是生活、工作起主導(dǎo)地位的方式,這必然要求我們在教學(xué)中要將這些變化和學(xué)生講清楚,以便他們能夠在今后走上社會的時(shí)候有足夠的能力迎接挑戰(zhàn)。
其次是教學(xué)方式要進(jìn)行革新。過去的教學(xué),因?yàn)闆]有大量數(shù)據(jù)的支撐,該教什么全憑教師自己跟著感覺走。今天,我們可以將教師的教學(xué)視頻掛在晚上,通過深度分析學(xué)生在觀看視頻的過程中在哪些地方停頓或者重放的頻次比較高,來找出學(xué)生不明確或者課程吸引人的地方,幫助教師改進(jìn)教學(xué)、確定教學(xué)重點(diǎn)。這必然導(dǎo)致教師教學(xué)方式的變革。
第三是學(xué)習(xí)路徑會發(fā)生變化。在過去,如果你想成為一個(gè)優(yōu)秀的生物學(xué)家,一定要認(rèn)識很多生物學(xué)家。今天,要解決一個(gè)生物難題,可能與天體物理學(xué)家或者數(shù)據(jù)視圖設(shè)計(jì)師聯(lián)系就可以實(shí)現(xiàn)。
第四是要防止對數(shù)據(jù)的癡迷。一方面,我們要研究學(xué)校長期以來儲存下來的大量數(shù)據(jù),同時(shí)積累學(xué)校每天的教育數(shù)據(jù),為進(jìn)入大數(shù)據(jù)時(shí)代做好充分的思想準(zhǔn)備;另一方面,要喚醒學(xué)校里沉睡的數(shù)據(jù),讓其在學(xué)校管理和教師教學(xué)中發(fā)揮更大的作用;再一方面,也要防止出現(xiàn)另一個(gè)極端,那就是對數(shù)據(jù)的癡迷。能僅僅為了收集數(shù)據(jù)而收集數(shù)據(jù),要讓數(shù)據(jù)在如何全面反映一個(gè)學(xué)生的能力、全面反映教師的教育質(zhì)量等方面做出實(shí)踐和探索。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇14
讀了《大數(shù)據(jù)時(shí)代》后,感覺到一個(gè)大變革的時(shí)代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時(shí)代,我們會假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想?!薄半S著由假想時(shí)代到數(shù)據(jù)時(shí)代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計(jì)學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對此我很高興,因?yàn)榻y(tǒng)計(jì)學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時(shí)學(xué)到抽筋都不能及格的課目。但這兩個(gè)理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個(gè)讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的.傳統(tǒng),跟上時(shí)代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計(jì)學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計(jì)學(xué)了。但是由統(tǒng)計(jì)學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個(gè)共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時(shí)代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時(shí)空信息“類”與“類”之間長時(shí)間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個(gè)結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個(gè)“脫穎而出”,因?yàn)槲疑硖幤渲?。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個(gè)更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個(gè)量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時(shí)空彎曲成允許時(shí)間旅行的樣子,恨不得馬上造成那可怕的時(shí)間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時(shí)間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有。《大數(shù)據(jù)時(shí)代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計(jì)學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
所以想向《大數(shù)據(jù)時(shí)代》的作者提一個(gè)合理化建議:把這本書繼續(xù)寫下去,至少加一個(gè)第四部分——大數(shù)據(jù)時(shí)代的邏輯思維。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇15
書名中的時(shí)代二字讓我陷入了深深的誤區(qū),bigdata就只是大數(shù)據(jù)而已。讀完全書,也沒有發(fā)現(xiàn)作者有說大數(shù)據(jù)會引領(lǐng)一個(gè)時(shí)代的觀點(diǎn),我們知道當(dāng)今是一個(gè)數(shù)字化、信息化的時(shí)代,但絕不還是大數(shù)據(jù)的時(shí)代。但大數(shù)據(jù)的重要性不嚴(yán)而喻,生活、工作、學(xué)習(xí)中許多有關(guān)大數(shù)據(jù)的例子的確離我們很近,我們甚至就是眾多大數(shù)據(jù)的一部分。那大數(shù)據(jù)對我這樣一名工科大學(xué)生有什么用,對于我這一名國防生又什么用呢,這樣的一本書是否能夠更好的幫助我在未來的工作崗位上博得頭籌,取得一番成績!還有為了接觸、利用大數(shù)據(jù)并防范大數(shù)據(jù)所帶來的弊病,我又該怎么做呢?書中有這樣一句話:大數(shù)據(jù)是一種資源,也是一種工具。大數(shù)據(jù)為我們提供暫時(shí)的幫助,以便等待更好的方法和答案出現(xiàn)。這也提醒我們在使用這個(gè)工具的時(shí)候,應(yīng)當(dāng)懷有謙恭之心,銘記人性之本。
所說的謙恭之心和人性之本都強(qiáng)調(diào)了人在大數(shù)據(jù)時(shí)代的重要性。我們才是數(shù)據(jù)之源,我們才應(yīng)是數(shù)據(jù)的受益者。當(dāng)我還沒讀完思維變革這一部分的時(shí)候,我就在思考這樣的思維變革對我會有著怎樣的影響?參加過兩次數(shù)學(xué)建模競賽的我,在兩次的參賽過程中,學(xué)會了許多數(shù)據(jù)處理和數(shù)學(xué)建模方法。數(shù)學(xué)模型所具有的對事件或數(shù)據(jù)的描述性、預(yù)測性、說明性是與大數(shù)據(jù)完全不同的。大數(shù)據(jù)下的思維變革不再追求數(shù)據(jù)的準(zhǔn)確性和因果關(guān)系。如果我在數(shù)學(xué)建模提出一種產(chǎn)生某個(gè)結(jié)果的原因,我是需要明明白白地把其他因素的影響一一剔除。我記得在參加比賽最后關(guān)頭寫論文的時(shí)候,對于所研究的問題,我們必須在前面把各種變量給寫進(jìn)去,然后再有選擇性的在可接受的條件下忽略掉很多變量的影響,但我們在很多時(shí)候卻給不出一個(gè)剔除這個(gè)因素的理由。可如果你不能排除掉其它的因素的影響,整個(gè)的數(shù)學(xué)模型建立及計(jì)算過程就會太復(fù)雜甚至是不能得出一個(gè)結(jié)果。但是在大數(shù)據(jù)時(shí)代,一個(gè)結(jié)論是可以通過足夠多的數(shù)據(jù)得出來的,不需要明白其中的為什么。如果真是這樣,我只覺得我需要思維上的變革,可我做不到,我接受不了事物與事物之間的黑盒子。這離我太遙遠(yuǎn)。
可我又不敢在此時(shí)否認(rèn)自己將來的工作與大數(shù)據(jù)的相關(guān)性,書中第三部分——大數(shù)據(jù)時(shí)代的管理變革中就舉到一個(gè)羅伯特。麥克納馬拉的例子,他是五角大樓"統(tǒng)計(jì)控制隊(duì)"中一名精英,這個(gè)隊(duì)伍讓之前不知道飛機(jī)備用零件種類、數(shù)量和放置位置的軍方在制定了綜合清單之后,為部隊(duì)節(jié)省下了36億美元。而我的專業(yè)就是飛行器動(dòng)力,我很清楚我國航空發(fā)動(dòng)機(jī)的研究制造水平是深深限制了空軍力量的發(fā)展。在夏季學(xué)期去黎明航空發(fā)動(dòng)機(jī)廠實(shí)習(xí)的時(shí)候,許多講解的師傅都會強(qiáng)調(diào)一點(diǎn),發(fā)動(dòng)機(jī)的每一個(gè)零件上都是有標(biāo)號的。零件的工藝卡片上會記錄其每一個(gè)工序的加工時(shí)間、地點(diǎn),加工、組裝、調(diào)試人員等的資料,這些卡片將會一直保存下去。這不僅能夠方便維修和更換,在出現(xiàn)事故之后,還可以追根溯源,查出事故的原因。我當(dāng)時(shí)就在想還好這東西產(chǎn)量不是很高,一臺渦扇發(fā)動(dòng)機(jī)僅僅葉片數(shù)量就是數(shù)千了。這樣的大數(shù)據(jù)肯定還可以好好利用,幫助我們?nèi)グl(fā)現(xiàn)科技研發(fā)和制造生產(chǎn)中矛盾與不足,并做出改進(jìn)。但航空發(fā)動(dòng)機(jī)的發(fā)展需要的更多的是技術(shù)的積累,特別是關(guān)鍵技術(shù)的實(shí)驗(yàn)數(shù)據(jù)我們還有著很大的缺失。我們不能像BAT這些互聯(lián)網(wǎng)巨頭可以輕松收集數(shù)據(jù),航空發(fā)動(dòng)機(jī)的技術(shù)積累需要一代代人在理論、實(shí)驗(yàn)上的積累,才有可能在這種大數(shù)據(jù)的支撐下做出真正屬于自己的航空發(fā)動(dòng)機(jī)。
這種積累利用方法可能與書中作者所說的利用大數(shù)據(jù)進(jìn)行預(yù)測、創(chuàng)新相比起來不是足夠高端,但是新的方法需要人去摸索,我也愿意成為這樣的第一人,我也堅(jiān)信大數(shù)據(jù)能夠給這樣一個(gè)領(lǐng)域帶來另一片天空。只是在航空發(fā)動(dòng)機(jī)的領(lǐng)域我們是不能只停留在"是什么"這一步的!精心策劃數(shù)據(jù)的因果關(guān)系研究和控制實(shí)驗(yàn)很有必要。
最后,我提出一個(gè)疑問,那就是大數(shù)據(jù)能不能創(chuàng)造出另一個(gè)畢加索呢?
大數(shù)據(jù)時(shí)代讀書心得體會范文篇16
無處不在的大數(shù)據(jù):各種云計(jì)算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬能等等,我們掌握了新的工具,也獲取了以前從未有過的各種信息。大數(shù)據(jù)拉近了我們與現(xiàn)實(shí)的距離,“地球村”變成了“地球屋”,仿佛所有人所有事物都觸手可及,而這些牛逼哄哄的互聯(lián)網(wǎng)巨頭就在客廳展示著世界的每一寸光景。
作者站在理論的至高點(diǎn)上,闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時(shí)代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時(shí)代對于個(gè)人隱私保護(hù)、公共安全提出的挑戰(zhàn)。作者認(rèn)為大數(shù)據(jù)時(shí)代具有三個(gè)顯著特點(diǎn)。
一、人們研究與分析某個(gè)現(xiàn)象時(shí),將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。
二、在大數(shù)據(jù)時(shí)代,不能一味地追求數(shù)據(jù)的精確性,而要適應(yīng)數(shù)據(jù)的多樣性、豐富性、甚至要接受錯(cuò)誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關(guān)性,勝于對因果關(guān)系的探索?!笆鞘裁础北取盀槭裁础敝匾W髡咧赋?,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時(shí)代,三類公司將成為時(shí)代的寵兒。一是擁有大數(shù)據(jù)的公司與組織,如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術(shù),但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。面對即將來臨的大數(shù)據(jù)時(shí)代,個(gè)人將如何應(yīng)對自如?這是個(gè)嚴(yán)肅的問題。大數(shù)據(jù)時(shí)代的社會倫理重點(diǎn)都在討論如何保護(hù)個(gè)人隱私。因?yàn)槭謾C(jī)越來越智能,網(wǎng)絡(luò)越來越快,個(gè)人的信息也越來越透明——隱形幾乎完全不可能。我想說的是,作為硬幣的另外一面,我們無法舍棄:互聯(lián)網(wǎng)只不過是讓人與人之間碎片的關(guān)系得以統(tǒng)一,其實(shí)各種人肉和信息只不過是坊間傳聞的升級罷了。當(dāng)我們住在擁擠的小區(qū),三公里走完一圈的縣城,半小時(shí)散步完的村落,人和人之間有隱私嗎?現(xiàn)在只不過是把這個(gè)范圍放大到了一個(gè)地球而已。硬幣的一面是人和人之間有溝通的需要,去團(tuán)結(jié)對抗世界的未知,那么另外一面就是隱私的缺乏。與其說是要在大數(shù)據(jù)時(shí)代保護(hù)自己的信息不被泄露,不如站起來維護(hù)自己和他人的隱私,從法律和道德的角度來尊重人與人之間的權(quán)利。
大數(shù)據(jù)時(shí)代是信息社會運(yùn)作的必然結(jié)果,而借由它,人類的信息社會更上一個(gè)臺階。農(nóng)業(yè)社會人們以土地為核心資源,工業(yè)時(shí)代轉(zhuǎn)為能源,信息社會則將變更為數(shù)據(jù)。誰掌握數(shù)據(jù),以及數(shù)據(jù)分析方法,誰就將在這個(gè)大數(shù)據(jù)時(shí)代勝出,無論是商業(yè)組織,還是國家文明。
大數(shù)據(jù)時(shí)代讀書心得體會范文篇17
《大數(shù)據(jù)時(shí)代》這本書主要描述的是大數(shù)據(jù)時(shí)代到臨人們生活、工作與思維各方面所遇到的重大變革。
文中清晰的闡述了大數(shù)據(jù)的基本概念和特點(diǎn),并列出明確的觀點(diǎn)。不管對于產(chǎn)業(yè)實(shí)踐者,還是對于政府和公眾機(jī)構(gòu),都非常具有價(jià)值。作者將本書分為3個(gè)部分。第一部分提出了大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對精確;要相關(guān)不要因果;第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價(jià)值兩個(gè)方面,講述驅(qū)動(dòng)大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動(dòng)的最根本動(dòng)力;最后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。
本書觀點(diǎn)擲地有聲,作者觀念高屋建瓴,從很多實(shí)例和經(jīng)驗(yàn)中萃取普適性觀念。例子詳實(shí)豐富,囊括了進(jìn)百個(gè)學(xué)術(shù)和商業(yè)實(shí)例。
引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變革。一個(gè)例子是20__年H1N1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個(gè)不同的數(shù)據(jù)模型,通過預(yù)測并與20__年、20__年美國疾控中心記錄的實(shí)際流感病例進(jìn)行對比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運(yùn)用大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測流感提供了一種更快捷的預(yù)測工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù)分析得出20__年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危機(jī)提供了時(shí)間緩沖。(補(bǔ)充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用,F(xiàn)arecast公司是一個(gè)成功的典型范例。該公司由奧倫&埃齊奧尼創(chuàng)辦,利用機(jī)票的銷售數(shù)據(jù)來預(yù)測未來的機(jī)票價(jià)格,旨在幫助用戶在購買機(jī)票方面做出預(yù)測,并對機(jī)票價(jià)格走勢預(yù)測的可信度標(biāo)示出來供消費(fèi)者查考。Farecast系統(tǒng)利用近十萬億條價(jià)格記錄預(yù)測的準(zhǔn)確度達(dá)75%,使得使用Farecast票價(jià)預(yù)測工具購買機(jī)票的旅客,平均每張機(jī)票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開了大數(shù)據(jù)技術(shù)將無法進(jìn)行。
也正是由于我們進(jìn)入了一個(gè)前所未有的信息化時(shí)代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價(jià)值。也許有人以為我們大數(shù)據(jù)時(shí)代的還未來臨。其實(shí)大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過濾,新浪微博技術(shù)平臺,谷歌翻譯以及輸入文字的自動(dòng)糾錯(cuò)等。
文中提出的一個(gè)觀點(diǎn)是,預(yù)測是大數(shù)據(jù)的核心。其實(shí)從過去的時(shí)代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對經(jīng)濟(jì)等各方面進(jìn)行預(yù)測、矯正。只是進(jìn)入了大數(shù)據(jù)時(shí)代人們掌握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
關(guān)于不是隨機(jī)樣本而是整體數(shù)據(jù)中。作者指出了隨機(jī)取樣是小數(shù)據(jù)時(shí)代用最少的數(shù)據(jù)獲取最大價(jià)值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個(gè)對自身所有DNA和腫瘤DNA進(jìn)行排序的人。喬布斯曾開玩笑說我要么是第一個(gè)通過這種方式戰(zhàn)勝癌癥
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年飼用原料作物合作協(xié)議書
- 租賃地下停車位合同書
- 上海市小區(qū)地下車位租賃合同
- 權(quán)許可合同音樂著作權(quán)使用許可協(xié)議
- 企業(yè)間年度服務(wù)貿(mào)易框架協(xié)議
- 環(huán)保產(chǎn)業(yè)綠色制造工藝技術(shù)推廣應(yīng)用方案
- 教育行業(yè)在線教育課程定制開發(fā)方案
- 水處理行業(yè)智慧水務(wù)系統(tǒng)建設(shè)與運(yùn)營管理方案
- 智能教育市場調(diào)研合同
- 企業(yè)內(nèi)外部通信系統(tǒng)建設(shè)與服務(wù)合同
- 北京市海淀區(qū)2021-2022學(xué)年第一學(xué)期四年級期末考試語文試卷(含答案)
- 超星爾雅學(xué)習(xí)通【中國近現(xiàn)代史綱要(首都師范大學(xué))】章節(jié)測試含答案
- 《鼻負(fù)壓置換術(shù)在兒童呼吸道感染中的應(yīng)用及護(hù)理對策研究【論文】3600字》
- 發(fā)動(dòng)機(jī)機(jī)械系統(tǒng)2.0升ltg-9.66維修指南車下
- 哈爾濱市商品房買賣合同書(最終定稿)
- 信號與系統(tǒng) 西安郵電 習(xí)題答案
- 新疆維吾爾自治區(qū)和田地區(qū)各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細(xì)及行政區(qū)劃代碼
- 用人單位終止(解除)勞動(dòng)合同證明書參考
- 天津工業(yè)大學(xué)《工程力學(xué)》2017-2018-1期末試卷及答案
- 能力素質(zhì),勝任力模型
- app界面設(shè)計(jì)(課堂PPT)
評論
0/150
提交評論