版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
PAGE6關(guān)于大數(shù)據(jù)時代統(tǒng)計學(xué)的應(yīng)用分析目錄TOC\o"1-2"\h\u2934關(guān)于大數(shù)據(jù)時代統(tǒng)計學(xué)的應(yīng)用分析 152921引言 1195302大數(shù)據(jù)時代對統(tǒng)計學(xué)的機遇 251533大數(shù)據(jù)時代對統(tǒng)計學(xué)的挑戰(zhàn) 2305184當(dāng)前統(tǒng)計學(xué)發(fā)展存在的問題 3189685統(tǒng)計學(xué)未來發(fā)展趨勢 364625.1總體、個體及樣本含義的新界定 3245355.2不確定性的新認(rèn)識 434825.3抽樣調(diào)查功能的新拓展 4262665.4數(shù)據(jù)分析中推理方法的新擴充 416367參考文獻(xiàn) 6摘要:隨著信息化時代的發(fā)展,數(shù)據(jù)的形式多樣化,數(shù)據(jù)結(jié)構(gòu)具有復(fù)雜性特征。這標(biāo)志著大數(shù)據(jù)時代的到來。在大數(shù)據(jù)時代,數(shù)據(jù)量呈現(xiàn)幾何式增長,這大大增加了數(shù)據(jù)整理、收集和分析等難度。統(tǒng)計學(xué)作為一門與數(shù)據(jù)息息相關(guān)的學(xué)科,在大數(shù)據(jù)時代發(fā)揮著重要的作用,同時也遇到了各種機遇與挑戰(zhàn)。本文以大數(shù)據(jù)時代為背景,將統(tǒng)計學(xué)與大數(shù)據(jù)有機結(jié)合,剖析了大數(shù)據(jù)時代給統(tǒng)計學(xué)帶來的機遇和挑戰(zhàn),分析并闡述了統(tǒng)計學(xué)在大數(shù)據(jù)時代的發(fā)展趨勢。關(guān)鍵詞:大數(shù)據(jù)時代,統(tǒng)計學(xué),機遇,挑戰(zhàn),發(fā)展趨勢1引言在我國,統(tǒng)計學(xué)作為一個新興學(xué)科,在起步方面是比較晚的。這也導(dǎo)致了統(tǒng)計學(xué)在各種方面的應(yīng)用比較滯后,同時也使得統(tǒng)計學(xué)的發(fā)展比較滯后。因此統(tǒng)計學(xué)在我國不管是在理論方面還是實際操作方面也就是統(tǒng)計軟件的開發(fā)方面都與歐美國家存在著一定的差距。而將統(tǒng)計學(xué)傳到中國則是在一九零三年(清光緒廿九年)由鈕永建、林卓南等編譯了四本橫山雅南所著的《統(tǒng)計學(xué)講義錄》一書,將“統(tǒng)計學(xué)”這一詞由日語傳入了中國。雖然統(tǒng)計學(xué)傳入我國較晚,但是自從統(tǒng)計學(xué)傳入中國后,對其他行業(yè)與領(lǐng)域的發(fā)展也產(chǎn)生了巨大的影響。從二十一世紀(jì)開始,伴隨著云計算、物聯(lián)網(wǎng)等新型信息技術(shù)的不斷發(fā)展,信息數(shù)據(jù)顯示出了巨大的態(tài)勢,而海量豐富的信息出現(xiàn)也代表著大信息時代的到來。在大數(shù)據(jù)世界里,統(tǒng)計和大數(shù)據(jù)分析緊密結(jié)合必然是一個趨勢,也就意味著大數(shù)據(jù)分析時代將為統(tǒng)計的研究提供機會和挑戰(zhàn)。2大數(shù)據(jù)時代對統(tǒng)計學(xué)的機遇首先,隨著數(shù)據(jù)收集的渠道的增多,數(shù)據(jù)收集效率和質(zhì)量越來越高,極大地便利了數(shù)據(jù)的收集,進(jìn)一步提高了數(shù)據(jù)處理的效率以及數(shù)據(jù)的真實性。中國人民大學(xué)謝文飛(2021)教授在《淺談統(tǒng)計學(xué)的大數(shù)據(jù)時代的發(fā)展方向及趨勢》中指出:大數(shù)據(jù)時代降低了統(tǒng)計的成本同時還提高了統(tǒng)計的質(zhì)量、使統(tǒng)計學(xué)的體系得到了延伸、使統(tǒng)計學(xué)可發(fā)揮作用的范圍擴大[1]。符一平(2016)其次,隨著大數(shù)據(jù)技術(shù)的發(fā)展與進(jìn)步,以往的數(shù)據(jù)分析和存儲模式已然被打破,數(shù)據(jù)存儲變得更加方便,存儲的數(shù)據(jù)量有了大幅度的增長[2]。數(shù)據(jù)分析可以通過云存儲技術(shù)和大數(shù)據(jù)技術(shù)等先進(jìn)的技術(shù)處理和分析紛繁復(fù)雜的數(shù)據(jù)。廈門大學(xué)朱建平(2016)教授在《大數(shù)據(jù)時代對傳統(tǒng)統(tǒng)計學(xué)變革的思考》中提到:傳統(tǒng)統(tǒng)計學(xué)可以借助現(xiàn)代的技術(shù)[3],如:大數(shù)據(jù)技術(shù)、云存儲技術(shù)等來對數(shù)據(jù)進(jìn)行分析。因為傳統(tǒng)統(tǒng)計由于成本、觀念等的影響,主要用于行業(yè)和部門統(tǒng)計,為行業(yè)和部門制定與完善政策服務(wù)。而在大數(shù)據(jù)時代,統(tǒng)計學(xué)不僅可以在統(tǒng)計領(lǐng)域得到更為快速的發(fā)展,更可以將統(tǒng)計原理與方法應(yīng)用到其他學(xué)科,如金融、醫(yī)學(xué)、計算機等,使統(tǒng)計學(xué)發(fā)揮更大的價值。而這二者的相同之處都是認(rèn)為大數(shù)據(jù)時代的到來可以使統(tǒng)計學(xué)的體系得以延伸、可以提高統(tǒng)計的質(zhì)量和效率[4]。3大數(shù)據(jù)時代對統(tǒng)計學(xué)的挑戰(zhàn)首先,目前統(tǒng)計學(xué)對大數(shù)據(jù)的處理能力還不足,這導(dǎo)致了許多許多數(shù)據(jù)系統(tǒng)處于崩潰狀態(tài),而且建立一個新的統(tǒng)計模型需要花費大量的時間并且需要大量的數(shù)據(jù)作為支持。湖南科技大學(xué)的李賓和周俊教授(2019)在《大數(shù)據(jù)時代經(jīng)管類統(tǒng)計學(xué)面臨的挑戰(zhàn)與變革》中講到:大數(shù)據(jù)時代下,數(shù)據(jù)的搜集方式、數(shù)據(jù)的類型、數(shù)據(jù)的處理和分析方法均會發(fā)生改變。其次,傳統(tǒng)的統(tǒng)計學(xué)以統(tǒng)計模型和統(tǒng)計軟件作為工具來對數(shù)據(jù)進(jìn)行處理和分析,常用的統(tǒng)計軟件有Rstudio、SPSS、MATLAB、STATA等。大數(shù)據(jù)所依賴的數(shù)據(jù)分析技術(shù)為非關(guān)系型的,以數(shù)據(jù)中心為基礎(chǔ)。若將統(tǒng)計軟件與大數(shù)據(jù)結(jié)合起來,則統(tǒng)計分析的過程可以在很大程度上簡化[5]。中國人民大學(xué)的王舒在《大數(shù)據(jù)時代下統(tǒng)計研究工作的機遇與挑戰(zhàn)》中指出:①抽樣調(diào)查工作思想的轉(zhuǎn)變;②對數(shù)據(jù)精確性要求的轉(zhuǎn)變;③數(shù)據(jù)對接與處理方式的轉(zhuǎn)變;④數(shù)據(jù)關(guān)系分析重點的轉(zhuǎn)變;⑤統(tǒng)計研究工作的重心的轉(zhuǎn)變;⑥統(tǒng)計研究中分析思維的轉(zhuǎn)變;⑦統(tǒng)計研究中應(yīng)用技術(shù)的轉(zhuǎn)變。均提到了在大數(shù)據(jù)時代下數(shù)據(jù)的搜集需要轉(zhuǎn)變。所不同的是后面兩篇文獻(xiàn)還提到了數(shù)據(jù)處理和分析方法的轉(zhuǎn)變以及研究技術(shù)的轉(zhuǎn)變[6]。4當(dāng)前統(tǒng)計學(xué)發(fā)展存在的問題在現(xiàn)如今這個信息高速發(fā)展的時代中,大數(shù)據(jù)互聯(lián)網(wǎng)以及云計算都已經(jīng)成為了社會發(fā)展的基本特點。也正是由于計算機和互聯(lián)網(wǎng)的不斷發(fā)展,使得人們獲得的信息量達(dá)到了前所未有的程度,各種各樣的信息被保存下來并廣泛傳播,這也就迎來了現(xiàn)如今的大數(shù)據(jù)時代。由于大數(shù)據(jù)具有規(guī)模性、多樣性以及高速性的特點,這也就使得統(tǒng)計學(xué)的發(fā)展出現(xiàn)了一定的問題。廈門大學(xué)馬雙鴿(2017)的“大數(shù)據(jù)中的統(tǒng)計方法”課題組在《大數(shù)據(jù)時代統(tǒng)計學(xué)發(fā)展的若干問題》中指出了在統(tǒng)計學(xué)發(fā)展方面一些亟待解決的問題:①如何在大數(shù)據(jù)時代發(fā)展經(jīng)典統(tǒng)計;②多源異構(gòu)大數(shù)據(jù)的整合分析[7];③大數(shù)據(jù)的邊際效應(yīng)問題。大數(shù)據(jù)的出現(xiàn)對統(tǒng)計學(xué)是一種補充而并非是替代,并且傳統(tǒng)的統(tǒng)計學(xué)雖然在現(xiàn)代社會發(fā)展過程中存在著一些不足,但在經(jīng)濟分析以及社會統(tǒng)計方面依然有著至關(guān)重要的作用。因此,要正確認(rèn)識到在大數(shù)據(jù)發(fā)展背景下,統(tǒng)計學(xué)發(fā)展過程中存在的問題,并且要及時的制定出相對應(yīng)的措施加以改進(jìn),讓統(tǒng)計學(xué)在大數(shù)據(jù)時代蓬勃發(fā)展。5統(tǒng)計學(xué)未來發(fā)展趨勢由于社會主義市場經(jīng)濟體制的完善、國內(nèi)市場發(fā)展與國外的接軌,以往統(tǒng)計學(xué)思想和技術(shù)早已無法適應(yīng)當(dāng)下經(jīng)濟技術(shù)發(fā)展的需求。同時現(xiàn)代計算機應(yīng)用也要求統(tǒng)計思想可以越來越適應(yīng)社會經(jīng)濟發(fā)展的需求、適應(yīng)計算機的需求。根據(jù)中國市場特征,中國統(tǒng)計研究和開發(fā)正向著適應(yīng)中國社會主義市場經(jīng)濟建設(shè)的目標(biāo)進(jìn)行。在這一過程中,統(tǒng)計研究確定了這一建設(shè)時期的任務(wù)、決定著中國統(tǒng)計的開發(fā)和運用。所以,現(xiàn)代統(tǒng)計學(xué)從業(yè)人員以及統(tǒng)計學(xué)專業(yè)的學(xué)生不僅要注重專業(yè)知識的學(xué)習(xí),同時還要注意自身創(chuàng)新能力以及創(chuàng)新思維的提升。5.1總體、個體及樣本含義的新界定傳統(tǒng)統(tǒng)計活動中,先有總體與總體單位,后有數(shù)據(jù),總體單位是可識別的,數(shù)據(jù)也可以事后核實。王麗君(2018)總體被界定為研究對象的全體或隨機變量,個體是組成研究對象的單位或?qū)ρ芯繉ο蟮囊淮斡^察,而樣本是對研究對象(隨機變量)的有限次觀察結(jié)果。大數(shù)據(jù)分析下,前有目標(biāo)數(shù)據(jù),后有總體[8],在無預(yù)先確定的目標(biāo)總體的前提下形成的大數(shù)據(jù)分析,往往只能發(fā)現(xiàn)數(shù)據(jù)的外部特征而很難進(jìn)行個體識別與數(shù)據(jù)核實。但仍需確定研究對象,即確定總體口徑與識別個體身份(是否包括在總體中)。從大數(shù)據(jù)集中,根據(jù)分析目的與需要提取數(shù)據(jù),構(gòu)成有用數(shù)據(jù)集,是否為樣本,這需要對大數(shù)據(jù)下的總體、個體與樣本含義和樣本的獲得方式重新界定。5.2不確定性的新認(rèn)識不確定性是統(tǒng)計學(xué)產(chǎn)生的基礎(chǔ),其表現(xiàn)形式為個體的差異性。統(tǒng)計學(xué)目的是利用分析總體的不確定性現(xiàn)象來發(fā)現(xiàn)事物本質(zhì)、找到規(guī)律,從而認(rèn)識事物不確定性背后的必然性。一般的數(shù)據(jù)分析,采用抽樣獲取數(shù)據(jù),抽樣獲取有風(fēng)險,利用抽樣信息建立模型、推斷總體數(shù)據(jù)均必須充分考慮這種抽樣風(fēng)險的作用。而大數(shù)據(jù)下的數(shù)據(jù)是在一定條件下所有個體的觀測結(jié)果,這時的不確定性來源是什么,表現(xiàn)形式是什么,對數(shù)據(jù)分析結(jié)果有什么影響,都需要重新梳理與界定。5.3抽樣調(diào)查功能的新拓展抽樣調(diào)查作為傳統(tǒng)統(tǒng)計中最重要的數(shù)據(jù)收集與分析方式,其理論與應(yīng)用已趨于成熟。在許多情形下,使用抽樣理論所設(shè)計的方法可以保證數(shù)據(jù)采集和推斷過程的真實性和準(zhǔn)確度。但抽樣研究又有難以克服的不足之處:隨機數(shù)列很難實現(xiàn),調(diào)查結(jié)果缺少延展性,忽視了細(xì)節(jié)觀察,無法進(jìn)行奇異值分析等,即隨機數(shù)列難以穩(wěn)定、信息量有限、結(jié)果難以持續(xù)增加、對前期準(zhǔn)備工作要求大高。在大數(shù)據(jù)時代,可使用的是所有能夠使用的、海量的、接近總體的數(shù)據(jù),而不限于有限的樣本數(shù)據(jù)。但樣本數(shù)據(jù)卻能夠成為大數(shù)據(jù)分析的對照基礎(chǔ)和調(diào)查結(jié)果檢驗基礎(chǔ),從而成為數(shù)據(jù)挖掘、快速探索性數(shù)據(jù)分析的重要工具和線索。這些新功能怎樣使用仍需進(jìn)一步研究。5.4數(shù)據(jù)分析中推理方法的新擴充在傳統(tǒng)的統(tǒng)計分析中,不管描述性統(tǒng)計分析或者推理性統(tǒng)計分析,歸納法都是最基礎(chǔ)的統(tǒng)計學(xué)研究方式。在大數(shù)據(jù)時代,樣本的概念也發(fā)生了變化。與傳統(tǒng)樣本相比,以大數(shù)據(jù)為基礎(chǔ)的樣本集蘊含信息更豐富、更全面,不僅可以用來歸納總體的一般特征,而且還可以及時找出可分析的子總體乃至個體以及一些特殊的異常的信息。在傳統(tǒng)統(tǒng)計分析中,這種分析盡管有需要,但因為信息量有限而不可能實現(xiàn)?,F(xiàn)在還可通過已知的總體分布特征等知識與經(jīng)驗,運用演繹推理方法,去探索更具體、更深層次的規(guī)律與關(guān)聯(lián)關(guān)系,去認(rèn)識研究對象更細(xì)小的特征。如將歸納法與演繹法綜合應(yīng)用,為統(tǒng)計思維方法與理念發(fā)展提供新方向,使人們利用大數(shù)據(jù)獲得總體數(shù)據(jù),對必然性和偶然性關(guān)系進(jìn)行更全面、更深入的認(rèn)識。參考文獻(xiàn)[1]謝文飛.淺談統(tǒng)計學(xué)的大數(shù)據(jù)時代的發(fā)展方向及趨勢[J].商,2015(20):206+185.[2]符一平.淺談統(tǒng)計學(xué)在大數(shù)據(jù)時代面臨的機遇、挑戰(zhàn)及其發(fā)展趨勢[J].中國管理信息化,2016,19(14):245-246.[3]朱建平,張悅涵.大數(shù)據(jù)時代對傳統(tǒng)統(tǒng)計學(xué)變革的思考[J].統(tǒng)計研究,2016,33(02):3-9.DOI:10.19343/ki.11-1302/c.2016.02.001.[4]李智明.淺談大數(shù)據(jù)時代統(tǒng)計學(xué)的挑戰(zhàn)與機遇[J].教育教學(xué)論壇,2020(13):95-96.[5]李賓,周俊.大數(shù)據(jù)時代經(jīng)管類統(tǒng)計學(xué)面臨的挑戰(zhàn)與變革[J].教育教學(xué)論壇,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 七年級學(xué)有余力學(xué)生的教學(xué)方法研究
- 《土壤地理學(xué)》筆記
- 2025年湖北省高考數(shù)學(xué)模擬試卷(附答案解析)
- 數(shù)據(jù)遷移與轉(zhuǎn)換
- 閱讀理解記敘文(練習(xí))(學(xué)生版)-2025年高考英語一輪復(fù)習(xí)(新教材新高考)
- 湖北省襄陽市襄州區(qū)2024-2025學(xué)年九年級上學(xué)期9月月考英語試題(含答案)
- 2024年18-萘二甲酰亞胺項目投資申請報告代可行性研究報告
- 有理數(shù)的乘方(六大題型)-2024-2025學(xué)年滬教版六年級數(shù)學(xué)上冊同步練習(xí)
- 3.2 二次函數(shù) 同步練習(xí)
- 讀書交流會主持詞
- 當(dāng)代社會政策分析 課件 第八章 兒童社會政策
- 2023年徽商銀行市區(qū)支行招聘綜合柜員信息筆試上岸歷年典型考題與考點剖析附帶答案詳解
- 2024年湖南化工職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫帶答案解析
- JGT 472-2015 鋼纖維混凝土
- TD/T 1061-2021 自然資源價格評估通則(正式版)
- 24春國家開放大學(xué)《建筑力學(xué)#》形考任務(wù)1-4參考答案
- 推拿手法完整版本
- 五育并舉-同心筑夢家長會課件
- 物業(yè)工程能耗管控方案
- 2024年北京京能清潔能源電力股份有限公司招聘筆試參考題庫含答案解析
- 帕金森病機制
評論
0/150
提交評論