大數據背景下對統(tǒng)計學發(fā)展的思考_第1頁
大數據背景下對統(tǒng)計學發(fā)展的思考_第2頁
大數據背景下對統(tǒng)計學發(fā)展的思考_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、大數據背景下對統(tǒng)計學發(fā)展的思考摘要:從學科層面來看,大數據作為一種新的數據分 析方案,其基于數據關系的內在本質直接決定了大數據與統(tǒng) 計學之間所存在必然聯(lián)系,對統(tǒng)計學來說,大數據不僅是一 種挑戰(zhàn),同時也是良好的機遇,深入探討大數據背景下統(tǒng)計 學的發(fā)展趨勢就成為社會各界共同關注的焦點。關鍵詞:大數據;統(tǒng)計學;發(fā)展大數據背景下,信息化技術、定位系統(tǒng)以及傳感器等各 類技術不斷發(fā)展,使得許多曾經難以收集的數據能夠進行大 規(guī)模收集,云計算則使得大規(guī)模數據處理得以實現?;诖?規(guī)模數據分析能夠讓我們獲取傳統(tǒng)只使用樣本時不能達成 的全新視野,其為統(tǒng)計學未來發(fā)展提供了良好的機遇。與此 同時,基于樣本的傳統(tǒng)統(tǒng)計理

2、論及方法顯然已經無法適應大 數據背景下相關需求,這就需要我們充分結合大數據需求與 特征針對統(tǒng)計學進行改進,從大數據當中挖掘更多信息,促 進統(tǒng)計學更好的發(fā)展。1 健全總體、個體以及樣本的定義傳統(tǒng)統(tǒng)計分析需要從總體當中進行抽樣,再針對抽樣樣 本性質來決定總體特點。由于其需要從總體當中獲取數據, 即應當明確整體范圍來當作研究目標,然后利用抽樣樣本分 析來針對總體進行分析。大數據環(huán)境則是完全相反,其需要 先有數據,然后后總體,并不需要定義目標,只包含某一段 時間點的所有數據對應的整體概念。由于個體所具有的不確 定性,數據本身是一個動態(tài)的進程,不能事前依靠數據庫當 中的單位實施編制,這個時間段與下一個時

3、間段的數據是存 在差異性的,所以也難以在事后進行個體識別。互聯(lián)網中, 相同個體可以存在多個符號與稱謂,相同符號或者稱謂則能 夠代表多個個體,并且個體以為的現象也非常多,所以大數 據通常能夠看到整體數據的外形,難以針對個體進行考究。 然而對于大數據分析而言,針對個體實施身份識別仍舊是至 關重要的,這就需要我們針對傳統(tǒng)意義層面中個體與總體的 定義方式進行改革,而傳統(tǒng)意義層面上的樣本定義方式無法 從大數據當中提取樣本數據。當然,因為大數據動態(tài)性,在 任意時間段的整體,其都能夠作為界面樣本。2 積極拓展統(tǒng)計學體系大數據背景下需要我們采用辯證、發(fā)展眼光來對待統(tǒng)計 學的發(fā)展,統(tǒng)計學要想有效適應大數據的相關

4、需求,應當積 極構建基于大數據框架的學科體系。統(tǒng)計學必須要把大數據 整體統(tǒng)計的方法與思想歸納到學科體系當中,統(tǒng)計學相關的 內容則應當從傳統(tǒng)樣本統(tǒng)計逐步過渡到樣本統(tǒng)計與總體統(tǒng) 計的整合。樣本統(tǒng)計主要是利用帶有隨即性質的觀測數據來 針對整體進行推斷,樣本的生成存在隨機性,采用樣本去進 行整體推斷會出現代表性誤差,而基于大數據的整體統(tǒng)計則 能夠有效彌補上述不足。通過大數據的引入,統(tǒng)計學科能夠 劃分為總體統(tǒng)計與樣本統(tǒng)計,樣本統(tǒng)計的作用在于“以小見 大”,而總體統(tǒng)計則在于“由繁入簡” ,兩者的有效整合能夠 更好的適應大數據的相關需求。3 研發(fā)新的分類與梳理方法 傳統(tǒng)統(tǒng)計學主要是根據預先設置的方案實施數據

5、分類 與梳理,所參考的指標與最終獲得的分類都屬于結構化的, 針對數據實施分類與梳理屬于數據預處理的必要步驟,屬于 統(tǒng)計分析的重要部分。 但針對大數據來說, 因為數據的來源、 形式以及表現方式等都是多元化的,如果還根據傳統(tǒng)統(tǒng)計學 方式在研究以前針對信息的類型、分類依據標識、標示之間 的關系以及類與類之間區(qū)別度等實施更為嚴格的設定,顯然 是不現實的,只可以在針對數據實施預處理以后,依照數據 自身的特征來實施完善與補充。顯然,傳統(tǒng)的數據分類與梳 理已經不適用于大數據要求,應當積極研發(fā)適用于大數據環(huán) 境下的數據分類與梳理方法,并在此基礎上研發(fā)新的數據分 析方法。4 整合多種統(tǒng)計學方法 傳統(tǒng)統(tǒng)計分析中,

6、歸納推斷法屬于最為主要的研究方法, 通過分析樣本數據的主要特征,然后在這個基礎上進行總體 特征的推斷。針對大數據,歸納法依據能夠作為大數據分析 的主要方法,依據需要利用具體個體的特征來進行總體特征 的推斷,依然需要從個體信息當中去不斷發(fā)現新的知識。然 而針對大數據而言,如果僅僅只是注重一般或者總體特征的 歸納,則會造成嚴重的浪費。部分類別甚至是個體,或者某 些異常值,都能夠據此推斷出全新的預測或者結論。所以, 還必須要針對個體的信息實施更為深入的挖掘,同時需要根 據現有的相關經驗知識與分布特征去針對其他更為具體的 規(guī)律實施推理分析,能夠更為深入的挖掘事物之間存在的聯(lián) 系,并據此來針對新事物實施判斷,即演繹推理法。演繹法 能夠幫助我們基于現有知識經驗基礎,實施進一步的研究挖 掘,避免研究進程中忽略一些細小、關鍵的特點。通過歸納 法與演繹法的有效整合,能夠從大數據當中的偶然性中發(fā)現 必然性,并通過全面數據當中的必然性去觀察偶然性、認知 偶然性、利用偶然性,以此來全面提升偶然性的駕馭水平。綜上所述,大數據在為傳統(tǒng)統(tǒng)計學帶來嚴峻挑戰(zhàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論