版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、-. z.大數(shù)據(jù)對科學哲學的新挑戰(zhàn)2016-05-11 09:30:44作者:7天論文網(wǎng)【大中小】瀏覽:8次評論:0條所謂大數(shù)據(jù)Big Data,從字面意思而言就是指規(guī)模特別巨大的數(shù)據(jù)集,以至于用常規(guī)手段難于處理,必須使用專門的數(shù)據(jù)挖掘技術。由此看來,大數(shù)據(jù)最根本的構(gòu)成是數(shù)據(jù),其本質(zhì)的問題仍是數(shù)據(jù)的問題。所謂數(shù)據(jù),從狹義來說就是有根據(jù)的數(shù)字,也就是表示計量的數(shù)字以及為數(shù)字提供的語境;而大數(shù)據(jù)時代所說的數(shù)據(jù)是廣義的數(shù)據(jù),它包括一切能被計算機處理的二進制編碼信息。大數(shù)據(jù)是一場新的數(shù)據(jù)技術革命,它對工作、生活、學習以及思維方式等諸多方面都將產(chǎn)生全方位的影響1。就像歷史上的每一次重大技術革命都會給科學
2、研究式帶來重大變革甚至導致科學革命一樣,大數(shù)據(jù)技術革命也可能給未來的科學研究帶來革命性的技術手段,并對傳統(tǒng)科學哲學諸多根本問題帶來新挑戰(zhàn)2。一、大數(shù)據(jù)與科學研究的新對象大數(shù)據(jù)給科學研究帶來的最大變化是科學研究對象的變化,從直接的自然世界或精神世界變成了間接的數(shù)據(jù)世界。在前科學時期,人們主要是在勞動、生活實踐中直接觀察星空、以及自然界的萬事萬物,因此其對象是直接的自然現(xiàn)象。古代科學和近代科學雖然已經(jīng)有了科學觀測與實驗工具,而且由亞里士多德開展出演繹法以及培根開展出歸納法兩種科學研究的方法工具,可以實現(xiàn)從現(xiàn)象到理論的經(jīng)歷提煉,以及從舊理論到新理論的邏輯推演。但是,從科學對象來說,無論是古代科學還是
3、近現(xiàn)代科學,其研究對象都仍然是直接面對自然現(xiàn)象。從直接觀察自然現(xiàn)象到實驗室的受控實驗,科學觀測的手段雖有進步,人與自然對象的距離有所變化,但科學研究的對象沒有變化,都是直接面對自然現(xiàn)象,都停留在波普爾所說的世界1 里。而我們的人文社會科學則采取對人類及其社會現(xiàn)象進展觀察、分析,研究對象是波普爾所說的世界2,即精神世界3。20 世紀中后期,隨著計算機科學技術的開展,科學對象發(fā)生過一次重大變化,即虛擬世界的出現(xiàn)。以往的科學在面對復雜對象之時,往往都從構(gòu)造的視角將復雜對象簡化、復原為簡單要素,但在此過程中容易造成信息失真,因此難以反映對象的真實與客觀。于是,利用計算機的強大功能,我們從功能模擬的路徑
4、,用仿真模型來模擬現(xiàn)實的研究對象。由此,我們在現(xiàn)實世界之上,人為地建構(gòu)了一個虛擬世界。通過虛擬世界的模擬、仿真以到達認識真實世界的目的。虛擬世界的出現(xiàn)是科學研究對象第一次從直接面對到間接模擬。隨著大數(shù)據(jù)的興起,科學研究對象再一次發(fā)生變化,從現(xiàn)實世界走向了數(shù)據(jù)世界。天文學家開普勒是幸運兒,他根本上沒有直接觀測星空,而是繼承了其前輩第谷布拉赫數(shù)十年的大量天文觀測數(shù)據(jù),并通過對這些數(shù)據(jù)的挖掘,發(fā)現(xiàn)了天體運行規(guī)律,即開普勒三大定律。后來的科學家再也沒有開普勒的幸運,不得不自己觀測與實驗,自己的數(shù)據(jù)自己采集、自己使用,屬于作坊模式。智能技術、網(wǎng)絡技術和云技術的迅速普及帶來了一場數(shù)據(jù)的革命。第一,數(shù)據(jù)采集
5、方法發(fā)生了質(zhì)變:傳統(tǒng)的數(shù)據(jù)都是人類使用測量手段人工采集而來的,例如土地測量數(shù)據(jù)、科學實驗數(shù)據(jù)、抽樣調(diào)查數(shù)據(jù)等,而現(xiàn)在的大數(shù)據(jù)是利用先進的智能技術自動生成的數(shù)據(jù),因此數(shù)據(jù)量急劇增加,帶來了數(shù)據(jù)爆炸。第二,數(shù)據(jù)的存儲方式發(fā)生了質(zhì)變:以往的數(shù)據(jù)都被記錄在紙草、竹簡、紙等可見媒體中,隨著數(shù)據(jù)量的增加,大量的數(shù)據(jù)難以存儲和保存,而在大數(shù)據(jù)時代,存儲技術發(fā)生革命,特別是云存儲技術讓我們可以便捷地存儲海量數(shù)據(jù),存儲本錢特別低廉。第三,數(shù)據(jù)傳輸方式發(fā)生了質(zhì)變:以往的數(shù)據(jù)傳輸不便,最快無非是通過紙質(zhì)媒體在不同的地方傳輸。正因如此,許多數(shù)據(jù)往往被使用一次后就沉淀下來,成為死數(shù)據(jù)。隨著網(wǎng)絡技術特別是移動網(wǎng)絡技術的開
6、展,數(shù)據(jù)的傳輸根本上以光速傳遞,因此完全做到了即時、在線。第四,數(shù)據(jù)的處理方式發(fā)生了質(zhì)變:以往對數(shù)字的計算最快速的方式無非是中國的算盤,對非數(shù)字型信息只能人工閱讀、瀏覽。隨著計算機技術的開展,特別是最新的云計算等數(shù)據(jù)挖掘技術的興起,無論是構(gòu)造化數(shù)據(jù)還是非構(gòu)造化數(shù)據(jù),都可以通過云計算等技術進展快速處理,因此可以從海量數(shù)據(jù)中便捷地挖掘出有價值的信息4。數(shù)據(jù)在科學研究中一直具有舉足輕重的作用,但小數(shù)據(jù)時代與大數(shù)據(jù)時代的數(shù)據(jù)在數(shù)據(jù)性質(zhì)上卻有重大區(qū)別。以往,在數(shù)據(jù)采集之前就有了各種方案和安排,先有了理論預設再設法采集數(shù)據(jù)。根據(jù)觀察滲透理論,人工觀測或受控實驗得來的數(shù)據(jù)不但數(shù)量少,而且最關鍵的是缺乏客觀性
7、,主、客體之間缺乏必要的觀測距離。而大數(shù)據(jù)時代,由于人工不再參與其中,由智能系統(tǒng)自動生成的數(shù)據(jù)沒有了理論預設的影響。也就是說,這些數(shù)據(jù)最初采集的時候并沒有使用目的,僅僅作為數(shù)據(jù)垃圾或者叫作數(shù)據(jù)塵埃保存了下來,后來由于*種需要從數(shù)據(jù)垃圾中發(fā)現(xiàn)了其新用途,于是數(shù)據(jù)垃圾變廢為寶。這樣,大數(shù)據(jù)時代的數(shù)據(jù)與主體拉開了觀測距離,因此更具有客觀性。由各種數(shù)據(jù)會聚而成的大數(shù)據(jù)構(gòu)成了一個客觀世界,這個世界是客觀物質(zhì)世界和主觀精神世界之外的數(shù)據(jù)世界。按照波普爾三個世界的劃分標準,這個客觀數(shù)據(jù)世界應該屬于世界33。作為世界3 的數(shù)據(jù)世界是物自體的映射世界,它將物質(zhì)世界和精神世界統(tǒng)一為一個客觀的數(shù)據(jù)世界,全面反映了事
8、物或精神的本質(zhì)屬性。大數(shù)據(jù)時代的數(shù)據(jù)是自動生成的數(shù)據(jù)世界,科學研究者可以不再直接與自然或社會研究對象打交道,直接通過挖掘數(shù)據(jù)就可以從事科學研究活動。例如,高能物理研究者不一定需要自己從事粒子實驗工作,只要挖掘由對撞機生成的大數(shù)據(jù)就可以開展高能物理研究工作,由此,傳統(tǒng)的高能物理研究變成了數(shù)據(jù)挖掘工作。天文學研究也發(fā)生了類似的變革,射電望遠鏡被智能化之后能夠自動采集、生成數(shù)據(jù),天文學家只要挖掘數(shù)據(jù)就可以發(fā)現(xiàn)天文現(xiàn)象、尋找天文規(guī)律,天文學研究不再是與天打交道的辛苦工作了。人們事實上并不用望遠鏡來看東西了,取而代之的是通過把數(shù)據(jù)傳輸?shù)綌?shù)據(jù)中心的大規(guī)模復雜儀器來看,直到那時他們才開場研究在他們電腦上的信
9、息5。社會學家不一定必須從事田野調(diào)查和社會觀察,也可以從已有的社會大數(shù)據(jù)中挖掘出人類行為規(guī)律。心理學研究者不一定要自己做心理實驗,可以通過已有社交數(shù)據(jù)的挖掘來掌握人的心理活動規(guī)律。經(jīng)濟學、管理學則不再需要做市場調(diào)查、抽樣分析等就可以通過淘寶、京東、亞馬遜等線上商業(yè)的交易數(shù)據(jù)挖掘來從事經(jīng)濟、管理研究工作。在大數(shù)據(jù)時代,一切自然科學、社會科學甚至人文科學的研究工作都可以擺脫對自然、社會等直接對象的依賴,可以拉開人與自然、人與社會的距離,間接地挖掘早已自動生成出來的相關大數(shù)據(jù),從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律、預測未來。由此,我們可以看出,科學研究的對象最早是自然、社會、精神等自在世界,然后增加了虛擬世界,而隨著大
10、數(shù)據(jù)時代的到來,數(shù)據(jù)成為科學研究的新源泉,由此又增加了一個新對象:數(shù)據(jù)世界。大數(shù)據(jù)成了科學研究的新對象,這是大數(shù)據(jù)技術對當代科學哲學最根本的影響。二、大數(shù)據(jù)與科學劃界的新標準科學劃界問題是科學哲學的核心問題,科學哲學的各個派別對該問題都有所涉及和回應。所謂科學劃界,就是將科學與其他學科門類特別是偽科學、形而上學等非科學之間畫出一條分界限,以此將科學與非科學區(qū)分開來,并且通過劃界來凸顯科學的形象與特征6。20 世紀初,邏輯實證主義第一次明確提出了科學劃界問題,并用意義與證實來區(qū)分科學與偽科學、非科學。波普爾繼承了邏輯實證主義的科學劃界問題,但他認為劃界的標準應該是能否被證偽。隨后,拉卡托斯用科學
11、研究綱領,庫恩用科學式來劃分科學與非科學。雖然費耶阿本德徹底放棄劃界問題,但大局部科學哲學家還是認為科學劃界具有重要的意義。雖然歷史上的科學哲學家們大局部都成認科學與非科學之間有著明確的分界,但為什么經(jīng)過許許多多的努力,仍然沒有找到適宜的科學劃界標準呢?這主要可能是沒有找準分界限和分界標準。隨著大數(shù)據(jù)的興起,數(shù)據(jù)越來越被人們重視。我們認為,在大數(shù)據(jù)時代,仍然存在著科學劃界問題,不過我們難免會猜測,能否用數(shù)據(jù)來作為科學與非科學的分界限呢?先來看看科學史的案例。古埃及、巴比倫的人們在丈量土地、記錄財產(chǎn)的過程中,創(chuàng)造了數(shù)字這一抽象符號。在泰勒斯、阿那克西曼德等古希臘哲學家紛紛提出世界的本原是水、氣、
12、火、土之類的具體物質(zhì)時,畢達哥拉斯提出了更加抽象、更加本質(zhì)的命題,即數(shù)是萬物的本原。他將萬事萬物的本質(zhì)抽象為數(shù),數(shù)作為萬物的表征就與其描述的對象聯(lián)系起來,通過認識、分析數(shù)來認識抽象的事物,并將哲學推向了形而上學的層次。因此數(shù)學成了最古老的科學門類。隨著第谷布拉赫使用望遠鏡觀測天象,獲得了大量的天文數(shù)據(jù),在開普勒的數(shù)據(jù)處理下,天文學成為最早的科學門類之一。在伽利略、牛頓等大師的努力下,利用觀察、實驗方法獲得事物運動的各種關鍵數(shù)據(jù),因此力學成了物理學中最早進入科學大門的學科。通過觀察和實驗,物理學中的光學、熱力學、電磁學和聲學都獲得了關鍵數(shù)據(jù),并通過數(shù)據(jù)分析找到了變量之間的因果關系,由此紛紛取得科
13、學的入場券。隨后,化學、生物學、地質(zhì)學、醫(yī)學等以自然為對象的學科,均以牛頓力學為典范,通過數(shù)據(jù)化、公式化而成為科學大家庭的重要成員。20 世紀之后,由于測量技術與實驗設備的開展,自然科學的所有分支都加快了數(shù)據(jù)化的腳步,科學的大家庭成員也越增越多。特別要強調(diào)的是,過去的數(shù)據(jù)化主要是針對自然界,因為自然界與人類拉開了主體、客體之間的觀測距離,作為主體的人類可以利用技術手段來觀測自然界并取得相關的數(shù)據(jù),并通過數(shù)據(jù)發(fā)現(xiàn)規(guī)律。雖然說觀察滲透著理論,因此沒有純客觀的觀察和數(shù)據(jù),但作為觀察對象的客體畢竟具有被動性和客觀性。但是,當我們觀察、研究人與人類社會之時,由于人類既是主體,又是客體,而任何正常的人都具
14、有主觀能動性,其思想、行為隨時都有可能改變,因此總體上社會科學還是不能與自然科學同日而語。不過,社會學、心理學、經(jīng)濟學、管理學通過借助自然科學的方法在數(shù)據(jù)化的道路上也取得了不俗的成績,社會科學的不少學科陸續(xù)取得了進入科學大家庭的入場券。人文學科由于主要研究人類自身的思想、情感、意志和行為,主觀性更強,一般的科學方法不再適用。使用傳統(tǒng)的技術手段,我們無法取得人類自身知、情、意方面的數(shù)據(jù),因此人文學科都停留在定性研究階段,很難被數(shù)據(jù)化和科學化,當然也就被排斥在科學大門之外。由此可見,科學化的過程與數(shù)據(jù)化的步伐根本上是一致的,數(shù)據(jù)化的過程也就是科學化的過程。自然界由于可以全面數(shù)據(jù)化,其科學化的程度也
15、就最高,因此根本上實現(xiàn)了定量研究。人類社會借助自然科學的手段也取得了巨大進步,但仍有些領域沒有被數(shù)據(jù)化,導致其科學化的程度要更低,因此其研究方法主要是定性定量相結(jié)合的方法。人文學科則根本上沒有被數(shù)據(jù)化,導致其科學化程度最低,因此它根本上只用定性研究方法。通過自然科學、社會科學與人文科學的數(shù)據(jù)化程度分析,我們可以發(fā)現(xiàn),用數(shù)據(jù)化來衡量學科的科學化程度是適宜的。我們可以用數(shù)據(jù)化來劃分科學與非科學,也就是說,我們可以用數(shù)據(jù)化作為科學劃界的新標準。但凡能夠用數(shù)據(jù)化表述的學科就有資格進入科學殿堂,反之,但凡不能夠用數(shù)據(jù)化表述的學科就沒有資格進入科學殿堂。能否被數(shù)據(jù)化是科學與非科學的分水嶺。其實,早就有哲學
16、家用數(shù)學化描述科學的特征,比方伽利略就認為,自然界這本大書是由數(shù)學語言寫成的。馬克思也認為,一門學科只有能夠被數(shù)學化之時才能被稱為科學。他們雖然說的是數(shù)學化,但數(shù)據(jù)化與數(shù)學化具有很強的關聯(lián)性,數(shù)學化是數(shù)據(jù)化根底上的規(guī)律性總結(jié)和提升。隨著智能技術、網(wǎng)絡技術特別是移動互聯(lián)網(wǎng)絡、物聯(lián)網(wǎng)、云計算等技術的開展,數(shù)據(jù)的采集逐漸實現(xiàn)了自動化,因此數(shù)據(jù)量迅速進入爆炸性增長,隨之是大數(shù)據(jù)時代的迅速降臨。大數(shù)據(jù)認為,世界萬物都可以被數(shù)據(jù)化,世界最終可以表述為一個數(shù)據(jù)化的世界。以往通過觀察、實驗得來的數(shù)據(jù)是十分有限的小數(shù)據(jù),而大數(shù)據(jù)時代通過智能技術的自動采集而生成的大數(shù)據(jù),各類大數(shù)據(jù)全面刻畫了世界的數(shù)字特征。小數(shù)據(jù)
17、時代,我們只能對自然界進展比擬全面的數(shù)據(jù)化。而在大數(shù)據(jù)時代,人類精神世界和人類社會都可以被數(shù)據(jù)化,因此數(shù)據(jù)化的圍在不斷地向以往未被數(shù)據(jù)化的領域推進。如果以能否被數(shù)據(jù)化來劃分科學界限,則隨著數(shù)據(jù)化的腳步不斷向前推進,科學的領域也在不斷擴大,原來被排斥在科學大門之外的人文社會科學,甚至包括形而上學都有資格進入科學的殿堂。隨著數(shù)據(jù)化腳步的加快,整個世界都可能被數(shù)據(jù)化,由此整個世界也就成了科學化的世界,到時候任何學科都可以納入科學體系之中,科學的大門之外幾乎找不到停留者。也許,完全被數(shù)據(jù)化的世界就是一個科學的世界,也就不再需要區(qū)分科學與非科學,科學劃界也就成了一個偽命題。三、大數(shù)據(jù)與科學研究的新式科學
18、發(fā)現(xiàn)的模式問題一直是科學哲學研究的核心問題。從古至今,科學取得了重大進展,大量的科學門類從無到有,逐漸形成了系統(tǒng)化的科學知識體系。但是,這些科學知識從何而來?科學家們是如何發(fā)現(xiàn)這些規(guī)律、獲取這些知識的?科學哲學必須對此作出答復。由于人們所掌握的技術工具的不同,在不同的歷史階段,科學發(fā)現(xiàn)的模式或科學研究式也不盡一樣。計算機圖靈獎得主、美國學者吉姆格雷將從古至今的科學研究式歸納總結(jié)為四類:經(jīng)歷科學式、理論科學式、計算科學式和數(shù)據(jù)科學式5。第一種式,即經(jīng)歷式,我們并不陌生,近代西方哲學的經(jīng)歷論和現(xiàn)代科學哲學中的邏輯實證主義對該式都進展了詳細的哲學論證。波普爾認為觀察滲透理論,沒有純客觀的科學觀察,他
19、強調(diào)理論在科學發(fā)現(xiàn)中的重要性,提出了科學始于問題的科學發(fā)現(xiàn)觀,這其實就是對科學研究的第二種式,即理論科學式的哲學論證。第三種科學研究式,即計算科學式,目前來說,哲學對其論證得比擬少,但復雜性科學與哲學對模擬、計算進展了充分的討論和論證,并開展為計算主義學派。計算主義認為,科學始于計算,即通過計算機的模擬仿真,能夠發(fā)現(xiàn)新知識,找到新規(guī)律。隨著數(shù)據(jù)采集、存儲和處理的智能化與自動化,各類數(shù)據(jù)急劇爆發(fā),人們利用數(shù)據(jù)挖掘工具從數(shù)里淘金,發(fā)現(xiàn)規(guī)律,提煉知識,這就是格雷所說的基于數(shù)據(jù)密集型的科學研究式,也被稱為數(shù)據(jù)科學式或第四式。第四式的出現(xiàn)依賴于人類能夠獲取到大量的數(shù)據(jù),它的根本特征是以數(shù)據(jù)為中心和驅(qū)動,
20、基于對海量數(shù)據(jù)的處理和分析去發(fā)現(xiàn)新的知識7。我們能夠通過大數(shù)據(jù)來發(fā)現(xiàn)知識、提煉規(guī)律嗎?也就是說數(shù)據(jù)密集型科學研究式能夠成立嗎?我們先來看看各種科學研究式的本質(zhì)。最早的經(jīng)歷科學式主要依賴于人類經(jīng)歷,這里的經(jīng)歷包括主觀經(jīng)歷和客觀實驗,人們根據(jù)有限的觀察或?qū)嶒灇w納出具有普遍性的結(jié)論。經(jīng)歷科學式本質(zhì)上來說是屬于人類直覺或視覺、體驗的主觀表達。理論科學式通過理論的證明和推導將經(jīng)歷科學式的經(jīng)歷推向了更加本質(zhì)、更加深入的事物在關系,因此從一定程度上反映了事物之間的因果性和規(guī)律性。計算科學式主要是針對復雜系統(tǒng),在無法深入分析部構(gòu)造的情況下,我們可以通過功能模擬、計算來認識復雜系統(tǒng)的運作規(guī)律。由此可見,上述三種
21、科學研究式各有千秋,都有自己的優(yōu)勢和弱點。數(shù)據(jù)科學式則將上述的觀察實驗、理論、計算均轉(zhuǎn)化為數(shù)據(jù),通過數(shù)據(jù)來表征萬事萬物間的準確關系,也就是說,通過數(shù)量化、精細化、客觀化,數(shù)據(jù)能夠?qū)F(xiàn)象刻畫得更加精細??档略诩兇饫硇耘兄芯统浞挚隙藬?shù)據(jù)在科學認識中的重要地位,例如,在先驗感性論中,他主要通過時間、空間的先驗性來論證感性認識的可靠性,而時空關系正是描述萬物最重要的數(shù)據(jù)。在先驗邏輯中,康德建構(gòu)了四組疇來描述人類的知性認識,而這四組疇量、質(zhì)、關系、模態(tài)正是刻畫客觀事實和人類行為的最根本的數(shù)據(jù)坐標。因此,數(shù)據(jù)是構(gòu)成感性、知性的根底,是科學認識的根本要素。通過數(shù)據(jù)科學研究式,更能夠反映現(xiàn)象背后的本質(zhì)關系
22、,因此它比前三種科學研究式更深入了一步。這也說明了為什么通過大數(shù)據(jù)來尋找規(guī)律的原因。數(shù)據(jù)密集型科學研究式強調(diào)了數(shù)據(jù)作為科學方法的特征,這種新方法與經(jīng)歷式、理論式和模擬式平起平坐,共同構(gòu)成了現(xiàn)代科學研究方法的統(tǒng)一體7。我們?nèi)绾螐拇髷?shù)據(jù)中挖掘知識、發(fā)現(xiàn)規(guī)律呢?簡單地說,就是數(shù)據(jù)密集型科學研究式從數(shù)據(jù)入手,通過對龐大的數(shù)據(jù)庫進展挖掘,尋找出其中數(shù)據(jù)之間的相關關系和規(guī)律性。面對海量數(shù)據(jù),傳統(tǒng)的歸納法或者抽樣方法都難以奏效,必須有新的數(shù)據(jù)處理方法才能高效、及時地從海量數(shù)據(jù)中發(fā)現(xiàn)新知識,找出新規(guī)律。近年來的數(shù)據(jù)挖掘理論與技術就是研究和處理海量數(shù)據(jù)的理論和技術,而且現(xiàn)在已經(jīng)研制出比擬成熟的數(shù)據(jù)挖掘軟件,例如
23、MapReduce 和Hadoop 并行數(shù)據(jù)處理軟件,讓我們可以比擬輕松地實現(xiàn)數(shù)據(jù)挖掘的智能化、自動化8。從廣義來說,數(shù)據(jù)挖掘也是一種歸納法的應用,但傳統(tǒng)的歸納法處理的是小數(shù)據(jù),并從小數(shù)據(jù)的樣本中歸納提煉,突然跳躍到適用無限樣本的普適性結(jié)論。在大數(shù)據(jù)時代,我們的樣本量到達海量,雖然還不是真正的無限,但已經(jīng)包括了能夠收集的所有樣本,也就是說,大數(shù)據(jù)的歸納已經(jīng)接近完全歸納法,因此其真理性應該比從小數(shù)據(jù)中歸納出來的結(jié)論要大得多。數(shù)據(jù)挖掘的本質(zhì)其實就是尋找數(shù)據(jù)之間的相關性,也就是尋找數(shù)據(jù)之間的依隨變化。通過相關性找到數(shù)據(jù)之間的統(tǒng)計規(guī)律,并據(jù)此建立適宜的變量模型。概而言之,數(shù)據(jù)密集型科研式的根底是掌握海
24、量的數(shù)據(jù),特別是多個學科和領域的數(shù)據(jù)融合,通過讓數(shù)據(jù)自己發(fā)聲,即通過對大數(shù)據(jù)進展關聯(lián)分析,尋找事物之間的相關關系,這樣既可以不易受偏見的影響,對被研究對象有新的理解視角和更好的了解,又能為研究因果關系奠定根底7。四、大數(shù)據(jù)與科學說明的新模式科學最根本的任務是為經(jīng)歷現(xiàn)象找到其原因,因此在科學哲學理論中,科學說明問題是一個十分重要的問題。所謂科學說明Scientific E*planation也叫科學解釋,就是為科學理論的成立尋找既充分又必要的條件,也就是為科學結(jié)論找到使其能夠成立的充分必要條件??茖W說明有不同的進路或模式,其中最著名的是亨普爾的演繹- 律則DN模型或覆蓋律模型。亨普爾提出DN 模
25、型后,又提出了IS 模型來修正,以便處理概率說明9。隨著大數(shù)據(jù)的興起,科學說明可能添加新模式,并在說明方法以及說明目標上發(fā)生變化。一在科學說明的模式上,大數(shù)據(jù)帶來了相關性科學說明新模式在亨普爾的經(jīng)典說明模式中,定律具有核心的地位,說明項之所以能夠演繹出被說明項,就是因為定律包括了因果關系,或者表達了自然界中的*種必然性。更廣泛地說,不管哪一種說明模型,傳統(tǒng)的科學說明都是通過因果關系鏈來尋找一種具有必然性的因果性。這就導致了傳統(tǒng)科學中過分追求因果關系的傾向:任何時候,任何事情都一定要找到因果關系,要多問為什么,并要找到最終的答案,否則就不是科學研究。在小數(shù)據(jù)時代,因為面對的數(shù)據(jù)量有限,因此有可能
26、找到各個數(shù)據(jù)之間的因果關系。在大數(shù)據(jù)時代,我們要面對的往往是海量數(shù)據(jù),因此根本不可能跟蹤每一個數(shù)據(jù)的前因后果,也就是說,我們幾乎不可能找到每個數(shù)據(jù)的微觀因果鏈10。因此,如果堅持從因果路徑來為現(xiàn)象進展科學說明,我們將陷入無窮無盡的因果關系之中,根本就無法找到一條有限的因果鏈。因此,在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己發(fā)聲11。知道是什么就夠了,沒必要知道為什么11。通過相關性怎樣作科學說明呢?所謂相關性就是兩個變量之間的依隨變化,其中一個變量的變化會引起另一個變量的變化,但只知道作為外表現(xiàn)象的依隨變化,而對為什么會發(fā)生變化,即變化的在機制,我們并不清楚。相關關系的核心
27、是量化兩個數(shù)據(jù)值之間的數(shù)理關系11。面對大數(shù)據(jù),我們可以使用數(shù)據(jù)挖掘的手段,通過計算機自動分析數(shù)據(jù)之間的依隨關系,但計算機不能深入現(xiàn)象背后,提醒出現(xiàn)象背后的本質(zhì)關系。相關關系通過識別有用的關聯(lián)物來幫助我們分析一個現(xiàn)象,而不是通過提醒其部的運作機制11。大數(shù)據(jù)的相關關系所提醒的是一種數(shù)據(jù)規(guī)律,是從海量數(shù)據(jù)中歸納提煉出來的具有相當似真性的規(guī)律。因為大數(shù)據(jù)挖掘是一種接近完全歸納法的數(shù)據(jù)密集型歸納法,所以其結(jié)論雖然不是普遍規(guī)律,但已具有相當大的可靠性12。因此,面對大數(shù)據(jù),我們可以通過相關關系來說明現(xiàn)象,不再局限于因果說明。這就是說,在大數(shù)據(jù)時代,在科學說明模式中應該增加一種相關性科學說明模式,以便彌
28、補傳統(tǒng)因果性科學說明的局限。二在科學說明的方法上,大數(shù)據(jù)帶來了融貫論科學說明新方法科學說明需要適當?shù)恼f明方法,只有適宜的說明方法才能到達科學說明的目的。傳統(tǒng)的科學說明,無論哪種模式,其實從說明方法上來說,都是使用復原論方法,即用一個更根本的根底來作為前因,以說明推導出來的后果。傳統(tǒng)科學處于小數(shù)據(jù)時代,數(shù)據(jù)的采集、存儲和處理都特別困難,一個數(shù)據(jù)缺乏的年代,科學研究中要盡量減少數(shù)據(jù)的使用量。復原論的說明方法就是試圖用最少的數(shù)據(jù)解釋、說明最多的現(xiàn)象,到達以少御多的效果,因此將斑雜世界的復雜現(xiàn)象復原為最根本的幾個甚至一個始基。因為傳統(tǒng)科學研究根本上都屬于線性關系,因此只要少量數(shù)據(jù)就可以刻畫全部。當面對
29、非線性的復雜關系時,要么簡化為線性,要么就用抽樣、插值的方法粗略刻畫非線性關系,因此還是用少量數(shù)據(jù)來說明、解釋非線性現(xiàn)象。隨著辯證思維、系統(tǒng)科學和復雜性科學的興起,古老的整體論也隨之復興。整體論試圖從整體、全局來解釋世界,例如中醫(yī)一直堅持從整體的觀點看人體,系統(tǒng)論提出要整體、全面地看問題,然而由于缺乏可操作的技術手段,這些整體論解釋路徑都無法最終實現(xiàn),只停留在抽象的觀念層面。要說明復雜的非線性現(xiàn)象,就必須使用大量的數(shù)據(jù),只有使用密集型的海量數(shù)據(jù)才能精細刻畫、說明人類及其精神世界等復雜非線性現(xiàn)象。隨著大數(shù)據(jù)技術的興起,各種數(shù)據(jù)都實現(xiàn)了采集、存儲和處理的智能化、自動化,數(shù)據(jù)的采集、存儲、傳輸、處理
30、的技術問題迎刃而解,因此我們可以用海量數(shù)據(jù)來實現(xiàn)復雜現(xiàn)象的數(shù)據(jù)刻畫和說明13。在大數(shù)據(jù)時代,幾乎所有問題都具備海量數(shù)據(jù),當我們解決一個問題時,不再需要復原、抽樣等節(jié)省數(shù)據(jù)的傳統(tǒng)方法,而是可以使用與該問題相關的全部數(shù)據(jù),這就是所謂的全數(shù)據(jù)模式。因為全數(shù)據(jù)模式將與問題相關的數(shù)據(jù)一網(wǎng)打盡,因此可以將問題刻畫得更精細,更全面,不會再以點帶面,以局部代全部,而是系統(tǒng)、全面、整體地刻畫和解決問題,因此這是一種真正的整體論,是一種數(shù)據(jù)化的整體論,這種整體論是可操作、可計算、可建模的,符合現(xiàn)代科學式,我們可以將這種整體論稱為大數(shù)據(jù)整體論。大數(shù)據(jù)整體論方法是融合了復原和整體雙方優(yōu)點的融貫方法,它既將整體復原為數(shù)
31、據(jù)細節(jié),又因為囊括了所有數(shù)據(jù)因而具有完整性,因此用大數(shù)據(jù)來進展科學說明是一種更加精細、完整的科學說明,是融貫復原說明與整體說明的科學說明新方法。三在科學說明的目標上,大數(shù)據(jù)帶來了混雜性科學說明新目標科學說明終究要到達什么目標?傳統(tǒng)的科學說明由于是在小數(shù)據(jù)的背景下,所以一般都以準確性為目標。在小數(shù)據(jù)時代,因為數(shù)據(jù)規(guī)模小,要做到準確比擬容易,而且本來數(shù)據(jù)就少,如果數(shù)據(jù)還不準確,則我們就根本無法真正刻畫現(xiàn)象、解決問題。此外,由于數(shù)據(jù)規(guī)模少,我們在測量和采集數(shù)據(jù)時,也比擬容易做到準確。例如,古代的土地測量、人口統(tǒng)計以及稅收計算,都比擬容易做到準確。近現(xiàn)代科學的可控實驗和觀測,也要求做到準確無誤,并采取適當措施消除實驗和觀測誤差。因此,傳統(tǒng)科學說明要求到達準確性的說明目標,屬于準確性科學說明。在大數(shù)據(jù)時代,科學允許不準確,允許混雜、模糊、多樣。正如維克托所說:執(zhí)迷于準確性是信息缺乏時代和模擬時代的產(chǎn)物。只有5%的數(shù)據(jù)是構(gòu)造化且能適用于傳統(tǒng)數(shù)據(jù)庫。如果不承受混雜,剩余95%的非構(gòu)造化數(shù)據(jù)都無法被利用,只有承受不準確性,我們才能翻開一扇從未涉足的世界之窗11。因此,在大數(shù)據(jù)時代,科學說明的目標必須改變,必須從追求準確到承受混雜,從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 油壓計相關項目實施方案
- 普洱市重點中學2024屆中考數(shù)學猜題卷含解析
- 山東省曹縣市級名校2024屆初中數(shù)學畢業(yè)考試模擬沖刺卷含解析
- 個性化定制服裝的市場機會與挑戰(zhàn)
- 化學品供應鏈管理
- 機器學習在職業(yè)培訓中的應用
- 2024版銷售合同意向書
- 2024版專業(yè)合同種植技術服務案例
- 2024版中國訂購合同范本
- 2024版石家莊市商品代銷合同
- 空氣源熱泵安裝方案
- (南通專版)江蘇省南通市2023-2024學年四年級數(shù)學上冊期中綜合素養(yǎng)測評調(diào)研試卷(蘇教版)
- 學前教育專業(yè) 學前兒童使用電子產(chǎn)品的現(xiàn)狀及應對策略的調(diào)查研究
- 小學音樂-冬雪教學設計學情分析教材分析課后反思
- 造紙企業(yè)安全生產(chǎn)隱患排查治理體系方案(2022-2023完整版)
- 2024屆綿陽市2021級高三一診(第一次診斷性考試)英語試卷(含答案+聽力音頻)
- 部編版語文三年級上冊第五單元【集體備課】
- 認定事實錯誤的上訴狀范本
- Unit+6+Understanding+ideas 教學設計 高中英語外研版(2019)+必修第一冊
- 第七講-信息技術與大數(shù)據(jù)倫理問題-副本
- 四上科學2.8《食物在身體里的旅行》教學設計(新課標)
評論
0/150
提交評論