數(shù)據(jù)分析方法01-緒論_第1頁
數(shù)據(jù)分析方法01-緒論_第2頁
數(shù)據(jù)分析方法01-緒論_第3頁
數(shù)據(jù)分析方法01-緒論_第4頁
數(shù)據(jù)分析方法01-緒論_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析方法及軟件應(yīng)用授課教師:楊小寶副教授北京交通大學(xué)2015.09第1頁,共38頁。第一章緒論1.1課程安排與要求(重點(diǎn))1.2數(shù)據(jù)相關(guān)的實際問題舉例1.3常用統(tǒng)計軟件簡介1.4統(tǒng)計數(shù)據(jù)及其類型(重點(diǎn))統(tǒng)計學(xué)第2頁,共38頁。1.1課程安排與要求第3頁,共38頁。課程名:<數(shù)據(jù)分析方法及軟件應(yīng)用>授課老師:楊小寶地點(diǎn):8號教學(xué)樓8610室第4頁,共38頁。本人的教學(xué)課程:本科-<數(shù)據(jù)分析方法與應(yīng)用>本科-<統(tǒng)計軟件及其應(yīng)用>碩士-<數(shù)據(jù)分析方法及其軟件應(yīng)用>碩士-<預(yù)測理論與方法>碩士-<大系統(tǒng)理論>第5頁,共38頁。參考書目1、薛薇.《SPSS統(tǒng)計分析方法及應(yīng)用》,電子工業(yè)出版社,第3版2、杜強(qiáng)、賈麗艷.《SPSS統(tǒng)計分析從入門到精通》,人民郵電出版社,20113、朱星宇、陳勇強(qiáng).

《SPSS多元統(tǒng)計分析方法及應(yīng)用》,清華大學(xué)出版社,20114、陳勝可,《SPSS統(tǒng)計分析從入門到精通》,清華大學(xué)出版社,2010年第6頁,共38頁。第7頁,共38頁。課堂的特點(diǎn)人多--安靜基礎(chǔ)不同(概率論、統(tǒng)計學(xué))要求不同課堂信息量大聽著容易,學(xué)好學(xué)精難課堂拋磚引玉,重在課后多學(xué)多練第8頁,共38頁。學(xué)習(xí)方法1.課堂認(rèn)真聽講;2.理論方法--課后多自學(xué)教材;3.軟件應(yīng)用--結(jié)合PPT多練習(xí);4.結(jié)合自己的研究方向或項目解決實際問題。課件公共郵箱:密碼:bjtu102第9頁,共38頁。緒論SPSS軟件的入門基本統(tǒng)計分析及其SPSS實現(xiàn)回歸分析及其SPSS實現(xiàn)方差分析及其SPSS實現(xiàn)聚類與因子分析及其SPSS實現(xiàn)時間序列分析及其SPSS實現(xiàn)課程安排:第10頁,共38頁。成績考核:

由三部分組成:大作業(yè):40分期末考試(閉卷):60分平時出勤和回答問題:扣分和獎分制,第1-2次缺勤,每次扣2分,回答問題準(zhǔn)確的加分,缺勤≥3次后果很嚴(yán)重??荚囌f明第11頁,共38頁。121.2數(shù)據(jù)相關(guān)的實際問題舉例第12頁,共38頁。1.北京市機(jī)動車保有量優(yōu)訊-中國網(wǎng)

隨著城市的發(fā)展,北京機(jī)動車數(shù)量也不斷增多。記者從交管部門獲悉,截至2010年12月19日,全市機(jī)動車保有量已達(dá)476萬余輛。交管部門表示,北京機(jī)動車增長太快了,保有量從2300輛到100萬輛,用了48年(1997年114.5萬輛);2003年8月突破200萬輛,用時6年6個月;2007年5月突破300萬輛,用時3年9個月;2009年12月突破400萬輛,僅僅用時兩年零7個月。2012年2月突破500萬輛;2014年9月550萬輛.北京市機(jī)動車牌照申請網(wǎng)2011年1月1日開通每月8號前申請26號搖號。第13頁,共38頁。對一些企業(yè)而言,市場信息數(shù)據(jù)是企業(yè)生存所必需的,絕不是可有可無的。調(diào)查其產(chǎn)品及競爭者在市場中的狀況、各種類型消費(fèi)者對其產(chǎn)品的態(tài)度、收集各地方的經(jīng)濟(jì)交通等信息等等。某方便面企業(yè)每年至少花三四千萬元來收集和分析數(shù)據(jù)洗發(fā)水交通事故數(shù)據(jù)2.數(shù)據(jù)對企業(yè)的重要性第14頁,共38頁。選舉人票--贏者通吃3.總統(tǒng)選舉第15頁,共38頁。一次失敗的統(tǒng)計調(diào)查在1936年的美國總統(tǒng)選舉前,一份名為LiteraryDigest

雜志進(jìn)行了一次民意調(diào)查。調(diào)查的焦點(diǎn)是誰將成為下一屆總統(tǒng)—LandonorRoosevelt。為了解選民意向,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表(電話和汽車在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,AlfLandon非常受歡迎。于是該雜志預(yù)測Landon將贏得選舉。但事實上是FranklinRoosevelt贏得了這次選舉第16頁,共38頁。蓋洛普成功預(yù)測

1936年總統(tǒng)大選1936年蓋洛普利用配額抽樣成功地預(yù)測了羅斯福當(dāng)選總統(tǒng)。樣本中男性、女性的比例;黑人、白人的比例;窮人、富人的比例是與美國人口的分布一致。第17頁,共38頁。

計算機(jī)的誕生與發(fā)展,為數(shù)據(jù)處理提供了強(qiáng)有力的技術(shù)支持,統(tǒng)計學(xué)與計算機(jī)的結(jié)合是必然的發(fā)展趨勢.20世紀(jì)末至今,

開發(fā)出了一些非常實用的統(tǒng)計軟件包:SAS,SPSS,Eviews,Matlab等,這些軟件都可以讓你快速、簡便地進(jìn)行數(shù)據(jù)處理和分析.181.3常用統(tǒng)計軟件簡介第18頁,共38頁。Excel:它嚴(yán)格說來并不是統(tǒng)計軟件,但作為數(shù)據(jù)表格軟件,必然有一定統(tǒng)計計算功能。而且凡是有MicrosoftOffice的計算機(jī),基本上都裝有Excel。但要注意,有時在裝Office時沒有裝數(shù)據(jù)分析的功能,那就必須裝了才行。當(dāng)然,畫圖功能是都具備的。對于簡單分析,Excel還算方便,但隨著問題的深入,Excel就不那么“傻瓜”,需要使用函數(shù),甚至根本沒有相應(yīng)的方法了。多數(shù)專門一些的統(tǒng)計推斷問題還需要其他專門的統(tǒng)計軟件來處理。第19頁,共38頁。20第20頁,共38頁。上一頁圖形制作方法提示:先把兩個圖形都做好,再點(diǎn)中其中一個鼠標(biāo)右鍵設(shè)置數(shù)據(jù)系列格式次坐標(biāo)軸第21頁,共38頁。第22頁,共38頁。Minitab:這個軟件是很方便的功能強(qiáng)大而又齊全的軟件,也已經(jīng)“傻瓜化”,在我國用的不如SPSS與SAS那么普遍。MATLAB:這也是應(yīng)用于各個領(lǐng)域的以編程為主的軟件,在工程上應(yīng)用廣泛。編程類似于S和R。但是統(tǒng)計方法不多。第23頁,共38頁。統(tǒng)計軟件的種類很多。只要學(xué)會使用一種“傻瓜式”軟件或編程軟件,使用其他類似的軟件也不會困難,最多看看幫助和說明即可.學(xué)習(xí)軟件的最好方式是多練多用.用統(tǒng)計軟件容易得到漂亮的數(shù)據(jù)結(jié)果,但其中充滿了危險的陷阱.第24頁,共38頁。計算機(jī)無法識別你的統(tǒng)計方面的錯誤.錯誤的方法、錯誤的數(shù)據(jù)形式都必然輸出錯誤的結(jié)果.結(jié)果雖然看上去很漂亮,但有時得到的卻是大量垃圾.因此,使用統(tǒng)計軟件時,要了解相關(guān)的統(tǒng)計理論方法,及其使用的前提條件和適用性,根據(jù)實際研究問題選用準(zhǔn)確的方法.第25頁,共38頁。1.4統(tǒng)計數(shù)據(jù)及其類型一、分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)二、觀測數(shù)據(jù)和實驗數(shù)據(jù)三、截面數(shù)據(jù)和時間序列數(shù)據(jù)第26頁,共38頁。什么是統(tǒng)計數(shù)據(jù)?

(data)1.對現(xiàn)象進(jìn)行計量的結(jié)果,是統(tǒng)計工作的成果2.不是指單個的數(shù)字,而是由多個數(shù)據(jù)構(gòu)成的數(shù)據(jù)集3.不僅僅是指數(shù)字,它可以是數(shù)字的,也可以是文字的第27頁,共38頁。統(tǒng)計數(shù)據(jù)的分類

統(tǒng)計數(shù)據(jù)的分類按計量層次分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值型數(shù)據(jù)按時間狀況截面數(shù)據(jù)時序數(shù)據(jù)按收集方法觀察數(shù)據(jù)實驗數(shù)據(jù)第28頁,共38頁。統(tǒng)計數(shù)據(jù)的分類

(按計量尺度分)1.分類數(shù)據(jù)(categoricaldata)-也叫定類數(shù)據(jù)對事物進(jìn)行分類的結(jié)果數(shù)據(jù)表現(xiàn)為類別,用文字來表述,對事物應(yīng)進(jìn)行平行的分類例如,人口按性別分為男、女兩類;企業(yè)分國有、集體、私營、外資等等第29頁,共38頁。統(tǒng)計數(shù)據(jù)的分類

(按計量尺度分)2.順序數(shù)據(jù)(rankdata)-也叫定序數(shù)據(jù)對事物類別順序的測度數(shù)據(jù)表現(xiàn)為類別,用文字來表述,但類別有順序比分類尺度精確,未測量出類別之間的準(zhǔn)確差值例如,產(chǎn)品分為一等品、二等品、三等品、次品等;成績分優(yōu)、良、中、差3.數(shù)值型數(shù)據(jù)(metricdata)

對事物的精確測度結(jié)果表現(xiàn)為具體的數(shù)值,是最常見的數(shù)據(jù)類型例如:身高為175cm、168cm、183cm;還有體重、收入等等第30頁,共38頁。三種類型數(shù)據(jù)的比較分類數(shù)據(jù)和順序數(shù)據(jù):說明的是事物的品質(zhì)特征,用文字表示-定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)數(shù)值型數(shù)據(jù):說明的是現(xiàn)象的數(shù)量特征,用數(shù)值表示-定量數(shù)據(jù)或數(shù)量數(shù)據(jù)定性數(shù)據(jù)和定量數(shù)據(jù)也可以相互轉(zhuǎn)化.如年齡:老年、中年、青年、少年、兒童學(xué)歷:大學(xué)-1、高中-2、初中-3、小學(xué)-4第31頁,共38頁。統(tǒng)計數(shù)據(jù)的分類

(按收集方法分)1.觀測數(shù)據(jù)(observationaldata)

通過調(diào)查或觀測而收集到的數(shù)據(jù)在沒有對事物人為控制的條件下而得到的有關(guān)社會經(jīng)濟(jì)現(xiàn)象的統(tǒng)計數(shù)據(jù)幾乎都是觀測數(shù)據(jù)2.實驗數(shù)據(jù)(experimentaldata)

在實驗中控制試驗對象而收集到的數(shù)據(jù)比如,對一種新藥療效的試驗,對一種新的農(nóng)作物品種的試驗等自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為實驗數(shù)據(jù)第32頁,共38頁。統(tǒng)計數(shù)據(jù)的分類

(按時間狀況分)1.截面數(shù)據(jù)(cross-sectionaldata)

在相同或近似相同的時間點(diǎn)上收集的數(shù)據(jù)描述現(xiàn)象在某一時刻的變化情況比如,2002年我國各地區(qū)的國內(nèi)生產(chǎn)總值數(shù)據(jù)2.時間序列數(shù)據(jù)(timeseriesdata)

在不同時間上收集到的數(shù)據(jù)描述現(xiàn)象隨時間變化的情況比如,1996年至2002年國內(nèi)生產(chǎn)總值數(shù)據(jù)第33頁,共38頁。問題分類與解決方法統(tǒng)計或數(shù)據(jù)分析中的問題大多是研究不同變量之間的關(guān)系。最常見的一類問題是分析解釋變量(自變量X1,

X2,X3,…)對被解釋變量(因變量Y)是否存在影響,有多大影響等。如何選擇適當(dāng)?shù)慕y(tǒng)計理論方法?需要根據(jù)變量X和Y的數(shù)據(jù)類型不同,選用不同的統(tǒng)計理論方法。第34頁,共38頁。品質(zhì)變量X數(shù)值型變量X品質(zhì)變量Y交叉列聯(lián)表、對應(yīng)分析、對數(shù)線性模型Logistic回歸數(shù)值型變量Y方差分析相關(guān)與回歸分析第35頁,共38頁。作業(yè)買教材練習(xí)EXCEL圖形制作安裝SPSS軟件預(yù)習(xí)SPSS的基本操作第36頁,共38頁。下載:cgbt(32位和64位的區(qū)別)安裝(序列號見安裝說明):SPSSforWindows安裝的基本步驟與其他常用軟件是基本相同的。啟動:開始程序SPSSforWindowsSPSS22軟件的安裝第37頁,共38頁。內(nèi)容梗概數(shù)據(jù)分析方法及軟件應(yīng)用。1、薛薇.《SPSS統(tǒng)計分析方法及應(yīng)用》,電子工業(yè)出版社,第3版。記者從交管部門獲悉,截至2010年12月19日,全市機(jī)動車保有量已達(dá)476萬余輛。2003年8月突破200萬輛,用時6年6個月。2007年5月突破300萬輛,用時3年9個月。2009年12月突破400萬輛,僅僅用時兩年零7個月。北京市機(jī)動車牌照申請網(wǎng)2011年1月1日開通每月8號前申請26號搖號。調(diào)查的焦點(diǎn)是誰將成為下一屆總統(tǒng)—LandonorRoosevelt。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。窮人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論