SPSS統(tǒng)計分析基礎(chǔ)入門含多重線性回歸分析_第1頁
SPSS統(tǒng)計分析基礎(chǔ)入門含多重線性回歸分析_第2頁
SPSS統(tǒng)計分析基礎(chǔ)入門含多重線性回歸分析_第3頁
SPSS統(tǒng)計分析基礎(chǔ)入門含多重線性回歸分析_第4頁
SPSS統(tǒng)計分析基礎(chǔ)入門含多重線性回歸分析_第5頁
已閱讀5頁,還剩82頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

SPSS統(tǒng)計分析基礎(chǔ)入門SPSS數(shù)據(jù)無處不在-----將數(shù)據(jù)轉(zhuǎn)化為信息

現(xiàn)象、問題在演繹------經(jīng)過調(diào)查,求真數(shù)據(jù)準(zhǔn)備+統(tǒng)計學(xué)+統(tǒng)計工具=信息Solution:為何學(xué)SPSSStatistics?SPSSSAS難易SPSSSPSS

Statistics是什么?StatisticalPackagefortheSocialSciences“社會科學(xué)統(tǒng)計軟件包”:原名StatisticalProductandServiceSolutions“統(tǒng)計產(chǎn)品與服務(wù)處理方案”:2023年更改世界上最早的統(tǒng)計分析軟件:1968年,由美國斯坦福大學(xué)的3位碩士于研制,廣泛應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件:目前世界上流行的三大統(tǒng)計分析軟件之一(SAS、SPSS及SYSTAT)。全球約有28萬家產(chǎn)品顧客,世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的進(jìn)一步分析、使用以便、功能齊全等方面予以了高度的評價與夸獎影響和信譽極高:在國際學(xué)術(shù)界有條不成文的要求,即在國際學(xué)術(shù)交流中,但凡用SPSS軟件完畢的計算和統(tǒng)計分析,能夠不必闡明算法目前最新版本:IBMSPSSStatistics20.0多國語言版SPSSSPSSStatistics的基本特點易用性強:“易學(xué)易用易普及”操作界面極為友好,操作簡樸,大多數(shù)操作可經(jīng)過鼠標(biāo)拖曳、點擊“菜單”、“按鈕”和“對話框”來完畢良好的幫助系統(tǒng)和自學(xué)功能合用于非專業(yè)統(tǒng)計分析人員也為高級顧客提供編程功能兼容性好數(shù)據(jù)輸入:Excel、Lotus、Oracle、SQLServer、Access、dBASE、文本,以及各類統(tǒng)計軟件的數(shù)據(jù)形式SAS,Stata文件數(shù)據(jù)輸出:Word、HTML、XML、Excel、PowerPoint、PDF功能強大全方面、成熟的統(tǒng)計過程:非常全方面地涵蓋了數(shù)據(jù)分析的整個流程,提供了數(shù)據(jù)獲取、數(shù)據(jù)管理與準(zhǔn)備、數(shù)據(jù)分析、成果報告這么一種數(shù)據(jù)分析的完整過程。全方面的統(tǒng)計技術(shù):自帶11種類型136個函數(shù),提供了如數(shù)據(jù)匯總、計數(shù)、交叉分析、分類、描述性統(tǒng)計分析、因子分析、回歸及聚類分析等廣泛的基本統(tǒng)計分析功能。全新的演示圖形系統(tǒng),能夠產(chǎn)生愈加專業(yè)的圖片:高辨別率、色彩豐富的餅圖、條形圖、直方圖、散點圖、三維圖形以及更多圖表都是SPSSStatistics中的原則功能。SPSS怎么學(xué)習(xí)SPSSStatistics?理論是研究的基石:SPSS只是一種統(tǒng)計工具,需掌握統(tǒng)計學(xué)理論基礎(chǔ)模仿是最佳的學(xué)習(xí)選一種適合自己的學(xué)習(xí)途徑:網(wǎng)絡(luò)資源+教程+上課+培訓(xùn)班自習(xí)參照書1.SPSS統(tǒng)計分析基礎(chǔ)、應(yīng)用與實戰(zhàn)精粹.王璐、王沁.化學(xué)工業(yè)出版社.2023-3(非常適合初學(xué)者)2.SPSS統(tǒng)計分析基礎(chǔ)教程(第2版).張文彤,鄺春偉.高等教育出版社;第2版(2023年11月1日,20.0)3.問卷統(tǒng)計分析實務(wù)--SPSS操作與應(yīng)用.吳明隆.重慶大學(xué)出版社.2023-5-1.(讀秀有全文,14.0)4.SPSS統(tǒng)計分析與數(shù)據(jù)挖掘.謝龍漢,尚濤.電子工業(yè)出版社.2023-1-1.(19.0,有光盤)5.統(tǒng)計分析與SPSS的應(yīng)用(第三版).薛薇.中國人民大學(xué)出版社.2023-1-1(教材,入門)6.SPSS在生物統(tǒng)計中的應(yīng)用(第二版).張力。廈門大學(xué)出版社。2023.8內(nèi)容情況:一般SPSS教程12-25章,200-600頁SPSS軟件自帶教程:不小于1000頁人大經(jīng)濟論壇:SPSS初中級視頻課程—張文彤主講;15講12hSPSS高級視頻課程—張文彤主講;17講15hSPSS官方初中級培訓(xùn)班:3天SPSS圖書館電子參照資料圖書館主頁>>數(shù)據(jù)導(dǎo)航>>中文資源>>非書資料管理系統(tǒng)>>安裝虛擬光驅(qū)>>下載圖書館主頁>>書目查詢>>光盤下載SPSS進(jìn)行統(tǒng)計分析前不對數(shù)據(jù)進(jìn)行整頓和歸納。得到數(shù)據(jù)文件后,直接進(jìn)行統(tǒng)計分析或繪制圖表,根本沒有對數(shù)據(jù)屬性進(jìn)行定義,也沒有對數(shù)據(jù)文件進(jìn)行科學(xué)必要的預(yù)處理。亂用各類統(tǒng)計措施。沒有從實際問題的要求出發(fā),不注意措施的使用條件,覺得只要能輸出成果即可。例如,定性數(shù)據(jù)采用連續(xù)性數(shù)據(jù)的統(tǒng)計措施,沒有對數(shù)據(jù)原則化等。對分析成果輸出的圖表不懂得其統(tǒng)計意義,更不知輸出量的實際意義,所以無法對數(shù)據(jù)處理成果進(jìn)行深層次的分析研究。SPSS軟件使用時常犯的錯誤SPSS基礎(chǔ)知識簡介SPSS界面與菜單簡介數(shù)據(jù)準(zhǔn)備描述性統(tǒng)計分析簡樸統(tǒng)計推斷有關(guān)分析回歸分析圖形的實現(xiàn)SPSSStatistics圖書館購置:IBMSPSSStatistics20.0(簡稱SPSS20.0)下載途徑:圖書館主頁-幫助與指南-常用軟件SPSS1.SPSS界面與菜單簡介4個主要窗口:數(shù)據(jù)編輯窗口、成果輸出窗口、語法編輯窗口、腳本編輯窗口變量視圖:定義數(shù)據(jù)的格式(變量名、類型、寬度等),每一行代表對一種變量的定義,每一列則代表定義該變量時用到的某種屬性數(shù)據(jù)編輯窗口:建立新數(shù)據(jù)、編輯和顯示已經(jīng)有數(shù)據(jù)文件;兩個視圖區(qū)SPSS成果查看窗口:隨執(zhí)行統(tǒng)計分析命令打開,顯示分析成果、統(tǒng)計報告、圖表等假如在運營時產(chǎn)生錯誤,也會輸出提醒信息允許對輸出成果進(jìn)行常規(guī)編輯整頓,窗口內(nèi)容能夠直接保存,“*.spv”SPSS菜單簡介數(shù)據(jù)準(zhǔn)備二要利用SPSS進(jìn)行數(shù)據(jù)統(tǒng)計分析,首要的工作就是建立SPSS數(shù)據(jù)文件;實際中搜集、調(diào)查得到的數(shù)據(jù)資料往往是零亂的,不能直接進(jìn)行統(tǒng)計分析;主要由菜單欄中的【數(shù)據(jù)】和【轉(zhuǎn)換】命令來實現(xiàn)規(guī)范化操作中不可忽視的一步。SPSS2.1數(shù)據(jù)文件的建立四種創(chuàng)建數(shù)據(jù)文件的措施:●新建數(shù)據(jù)文件●直接打開已經(jīng)有數(shù)據(jù)文件:*.sav、*.sys,*.xls,*.sas7bdat,*.txt等●使用數(shù)據(jù)庫查詢:與大型數(shù)據(jù)庫進(jìn)行數(shù)據(jù)互換,如SQL、Oracle,也合用于Excel●從文本向?qū)?dǎo)入數(shù)據(jù)文件SPSS實例2-1:Excel數(shù)據(jù)的導(dǎo)入1.整頓excel文檔,第一行設(shè)置為變量,與spss格式相同2.打開SPSS軟件,菜單欄中選擇【文件】→【打開】→【數(shù)據(jù)】命令,彈出【打開數(shù)據(jù)】對話框3.選擇2-1.xls文件4.點選【從第一行數(shù)據(jù)讀取變量名】5.【擬定】文件2-1.xls是上證指數(shù)從2023年1月4日至2023年10月16日的數(shù)據(jù)資料,涉及了開盤價、當(dāng)日最高價、當(dāng)日最低價和收盤價等選項,請將該數(shù)據(jù)導(dǎo)入至SPSS中。SPSSSPSS2.2SPSS數(shù)據(jù)文件的屬性SPSS數(shù)據(jù)文件是一種有構(gòu)造的數(shù)據(jù)文件,涉及文件構(gòu)造和數(shù)據(jù),在軟件中創(chuàng)建好數(shù)據(jù)后,首先應(yīng)該進(jìn)行數(shù)據(jù)文件的屬性定義或者構(gòu)造定義。變量屬性:變量名、變量類型、變量名標(biāo)簽、變量值、缺失值的定義、度量的尺度、及數(shù)據(jù)的顯示屬性(顯示寬度、列寬度、對齊方式)例:新建數(shù)據(jù)錄入“變量視圖”定義變量;“數(shù)據(jù)視圖”在定義好的變量列填入相應(yīng)數(shù)據(jù)SPSS實例2-2:左邊是對人們信息獲取情況的一種調(diào)研表,請定義問卷調(diào)查表的變量信息。打開新數(shù)據(jù)表:文件-新建-數(shù)據(jù)變量視圖變量名數(shù)據(jù)類型描述性的變量標(biāo)簽描述性的值標(biāo)簽顧客定義的缺失值SPSS

◆缺失值:假如直接進(jìn)行數(shù)據(jù)分析,SPSS將把缺失數(shù)據(jù)作為正常數(shù)據(jù),造成非常大的誤差數(shù)據(jù)中存在漏填數(shù)據(jù)數(shù)據(jù)中存在明顯錯誤或明顯不合理的數(shù)據(jù)(如年齡130)◆缺失數(shù)據(jù)處理環(huán)節(jié):1、指定缺失數(shù)據(jù),指明哪些數(shù)據(jù)屬于缺失數(shù)據(jù)(空缺數(shù)據(jù),首先填一種特定標(biāo)識數(shù)據(jù))2、統(tǒng)計分析時對缺失數(shù)據(jù)進(jìn)行一定處理(選擇缺失數(shù)據(jù)處理措施)

SPSS數(shù)據(jù)視圖變量名稱個案或觀查值SPSS數(shù)據(jù)文件中的一列數(shù)據(jù)稱為一種變量,每個變量都應(yīng)有一種變量名。SPSS數(shù)據(jù)文件中的一行數(shù)據(jù)稱為一條個案或觀察量。SPSS2.3數(shù)據(jù)管理和轉(zhuǎn)換一般情況下,剛剛建立的數(shù)據(jù)文件并不能立即進(jìn)行統(tǒng)計分析,這是因為搜集到的數(shù)據(jù)還是原始數(shù)據(jù),還不能直接利用分析,需要對原始數(shù)據(jù)進(jìn)行進(jìn)一步的加工、整頓。數(shù)據(jù)變換是正式分析前的主要一步,經(jīng)過數(shù)據(jù)變換,一種優(yōu)異的統(tǒng)計分析員能夠?qū)⒃冀y(tǒng)計整頓成所需的任何格式,從而為背面的精確分析打下堅實的基礎(chǔ)?!獜埼耐兞考墑e的數(shù)據(jù)管理主要集中了某些對變量進(jìn)行變換的過程,如對原始數(shù)據(jù)進(jìn)行排序、轉(zhuǎn)置、四則運算、對數(shù)據(jù)重新編碼、求出變量的秩次等,這些功能往往在統(tǒng)計分析的預(yù)處理中起著非常主要的作用。文件級別的數(shù)據(jù)管理對數(shù)據(jù)進(jìn)行加工整頓,例如根據(jù)統(tǒng)計分析的要求對數(shù)據(jù)文件進(jìn)行分組、合并、加權(quán)、篩選等操作觀察值的名次:如3、5、-2、0、7數(shù)列各觀察量的秩為:3、4、1、2、5SPSS案例2-3:文件合并

問題:已知2-3-1.sav和2-3-2.sav中的數(shù)據(jù)是北京、天津、河北等省市在2023年部分行業(yè)的固定投資額(億元)數(shù)據(jù),請將2-3-1.sav和2-3-2.sav的數(shù)據(jù)文件縱向合并。SPSS例:我國城市和農(nóng)村居民消費價格分類指數(shù)數(shù)據(jù)見右表。因為不同產(chǎn)品的價格漲跌不同,請找出城市和農(nóng)村居民消費價格指數(shù)都較去年上漲超出1%(指數(shù)=101)的項目數(shù)。案例2-4:變量值計數(shù)(消費價格指數(shù)的上漲項目)變量值計數(shù):計算某些變量在同一種觀察量中滿足要求的特定變量值出現(xiàn)的次數(shù)。Step1:轉(zhuǎn)換>>對個案內(nèi)的值計數(shù);Step2:輸入目的計數(shù)變量(x,增長率)Step3:選擇計數(shù)變量Step4:設(shè)置計數(shù)規(guī)則;Step5:完畢操作成果輸出描述性統(tǒng)計分析三統(tǒng)計分析的目的:研究總體的數(shù)量特征。研究者一般經(jīng)過樣原來研究總體。首先了解數(shù)據(jù)的整體情況,隨即才干考慮做進(jìn)一步的推斷兩種方式實現(xiàn):第一,數(shù)值計算,計算常用的基本統(tǒng)計量的值,精確反應(yīng)數(shù)據(jù)的基本統(tǒng)計特征;第二,圖形繪制,即繪制常見的基本統(tǒng)計圖形,直觀呈現(xiàn)數(shù)據(jù)的分布特點。SPSS描述性統(tǒng)計分析是統(tǒng)計分析的第一步和先決條件在進(jìn)行統(tǒng)計分析和建模前,常需對數(shù)據(jù)做某些描述性統(tǒng)計,了解數(shù)據(jù)的基本統(tǒng)計指標(biāo)定量數(shù)據(jù):均數(shù)、原則差、原則誤等計數(shù)或分類數(shù)據(jù):頻率、比率等SPSS的許多模塊均可完畢描述性分析,但專門為該目的而設(shè)計的幾種模塊則集中在描述菜單中:【分析】-【描述統(tǒng)計】1.基本統(tǒng)計量頻率(F):該過程產(chǎn)生頻數(shù)表;描述(D):進(jìn)行一般性統(tǒng)計描述;探索(E):用于對數(shù)據(jù)概況不清時的探索性分析3描述性統(tǒng)計分析3.1頻數(shù)分析使用目的:了解變量取值的情況,對把握數(shù)據(jù)分布特征非常有用,是描述性統(tǒng)計中最常用的措施之一。例如,了解某班學(xué)生考試的學(xué)習(xí)成績、了解某地域居民的收入水平等都能夠借助于頻數(shù)分析。作用:(1)編制頻數(shù)表,按要求給出某百分位點的數(shù)值?頻率:各類別的統(tǒng)計數(shù)?有效百分比:即各統(tǒng)計數(shù)占有效樣本數(shù)的百分比,有效樣本數(shù)=總樣本-缺失樣本數(shù)?合計百分比:即各百分比逐層累加起來的成果。最終取值為100(2)繪制常用的條圖、餅圖等統(tǒng)計圖(3)還能夠進(jìn)行分位數(shù)、描述集中趨勢的基本統(tǒng)計量等計算功能

案例3-1:利用頻數(shù)分析產(chǎn)品銷售信息假設(shè)某企業(yè)每七天大約賣出2023萬件產(chǎn)品,但市場的需求不穩(wěn)定,該企業(yè)的生產(chǎn)經(jīng)理想愈加好的掌握近期該產(chǎn)品的分布情況。利用頻數(shù)分析你能得到什么有利于生產(chǎn)及銷售的的信息?近期企業(yè)該產(chǎn)品每七天的銷售數(shù)據(jù)(單位:百萬):2418182624231618212021241919142221262715191720201922231623211519212022152419

Step1:打開“3-1”(sav、xls)-【分析】-【描述統(tǒng)計】-【頻率】Step2:設(shè)置“統(tǒng)計量”、“圖表”內(nèi)容Step3:成果輸出描述分析目的:獲取數(shù)據(jù)的均值、原則差、峰度等數(shù)據(jù),進(jìn)一步把握數(shù)據(jù)的集中趨勢、離散程度和分布形狀。3.2描述分析基本描述統(tǒng)計量:(1)表達(dá)數(shù)據(jù)的中心位置(集中趨勢):均值、中位數(shù)、眾數(shù)等(2)表達(dá)數(shù)據(jù)的離散程度(離散趨勢):全距、方差、原則差、極差、變異系數(shù)等(3)刻畫分布形態(tài)的描述統(tǒng)計量(與正態(tài)分布比較):數(shù)據(jù)分布是否對稱,偏度、峰度等眾數(shù):就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值中位數(shù):即一組數(shù)據(jù)按升序排序后,處于中間位置上的數(shù)據(jù)值全距:也稱極差,是數(shù)據(jù)的最大值與最小值之間的絕對離差偏度:描述變量取值分布形態(tài)對稱性的統(tǒng)計量,0:對稱;>0:右偏;<0:左偏峰度:描述變量取值分布形態(tài)陡峭程度的統(tǒng)計量,0:同正態(tài)分布;>0:尖峰分布;<0:平峰分布。

Step:打開數(shù)據(jù)文件(3-2.sav)-【分析】-【描述統(tǒng)計】-【描述】3.2描述分析例3-2:請你分析不同性別演員獲奧斯卡金獎的年齡差別性。男:323736325153336135455539763742403260385648484043624342444156394631474560女:5044358026284121613849337430334131354142372634343526616034243037312739343.2描述分析輸出成果:成果:男演員的獲獎年齡波動幅度不不小于女演員,且都不服從正態(tài)分布。3.3探索分析基本思想從數(shù)據(jù)本身出發(fā),不拘泥于模型的假設(shè)而采用非常靈活的措施來探討數(shù)據(jù)分布的大致情況,從復(fù)雜的數(shù)據(jù)中分離出數(shù)據(jù)的基本模式和特點,讓分析者發(fā)覺其中的規(guī)律,為老式的統(tǒng)計推斷提供良好的基礎(chǔ)和降低盲目性主要內(nèi)容(1)檢驗數(shù)據(jù)是否有錯。過大或過小的數(shù)據(jù)均可能是異常值、影響點或錯誤值。要檢驗這么的數(shù)據(jù),并分析原因,然后決定是否從分析中剔除這些數(shù)據(jù)(2)取得數(shù)據(jù)分布特征。諸多統(tǒng)計措施模型對數(shù)據(jù)的分布有要求,如方差分析就需要數(shù)據(jù)服從正態(tài)分布(3)對數(shù)據(jù)的初步觀察,發(fā)覺某些內(nèi)在規(guī)律用途:用于計算指定變量的探索性統(tǒng)計量和有關(guān)的圖形。既能夠?qū)τ^察量整體分析,也能夠進(jìn)行分組分析。從這個過程能夠取得箱線圖、莖葉圖、直方圖、多種正態(tài)檢驗圖、頻數(shù)表、方差齊性檢驗等成果,以及對非正態(tài)或正態(tài)非齊性數(shù)據(jù)進(jìn)行變換,并表白和檢驗連續(xù)變量的數(shù)值分布情況。3.3探索分析例3-3:對中國南北城市的溫度差別性作探索性分析

數(shù)據(jù)準(zhǔn)備1:“變量視圖”定義變量數(shù)據(jù)準(zhǔn)備2:“數(shù)據(jù)視圖”輸入數(shù)據(jù)3.3探索分析

Step1:打開數(shù)據(jù)(3-3.sav)-【分析】-【描述統(tǒng)計】-【探索】Step2:選擇標(biāo)簽值Step3:選擇輸出的描述性統(tǒng)計量Step4:成果輸出3.3探索分析分析樣本數(shù)據(jù)的穩(wěn)健性,求出中心趨勢的最大似然比的穩(wěn)健估計值4種穩(wěn)健估計量:Huber(穩(wěn)健估計量)、Hampel(非降穩(wěn)健估計量),Andrew(波估計量),Tukey(復(fù)權(quán)估計量)成果:1.北方城市的原則差不小于南方城市,闡明北方年平均溫度變化較南方更大。2.從分布形態(tài)看,南方城市年均氣溫呈尖峰、右偏特征;北方城市則為平峰、左偏。3.3探索分析Step4:成果輸出成果:由M值差別能夠得出,南北方數(shù)據(jù)差別明顯。莖葉圖:第一列:頻數(shù),表達(dá)所在行觀察值頻數(shù);第二列:莖,實際觀察值除以圖下方莖寬后的整數(shù)部分第三列:葉,實際觀察值除以圖下方莖寬后的小數(shù)部分它在反應(yīng)數(shù)據(jù)整體趨勢的同步,還能精確反應(yīng)數(shù)值的大小,分析小樣本時優(yōu)勢明顯,在國外非常流行。SPSS箱圖箱圖:中間粗線為中位數(shù);方框的兩端分別表達(dá)四分位數(shù)(75%)和下四分位數(shù)(25%),兩者間的距離為四分位數(shù)間距;方框外上、下兩個細(xì)線分別表達(dá)除去異常值外的最大、最小值;但凡與四分位數(shù)值的距離超出1.5倍的都定義為異常值。中位數(shù)75%百分位數(shù)25%百分位數(shù)最小值最大值異常值簡樸統(tǒng)計推斷四

均值比較-T檢驗方差分析非參數(shù)檢驗-卡方檢驗假設(shè)的簡樸分類假設(shè)檢驗參數(shù)檢驗(一般為定量數(shù)據(jù))雙樣本單樣本T檢驗(小樣本)Z檢驗(大樣本)配對樣本獨立樣本配對樣本獨立樣本非參數(shù)檢驗(可為非定量數(shù)據(jù))單樣本:卡方檢驗;K-S檢驗;二項式檢驗雙樣本SPSS4.1均值比較-T檢驗總體中的每個個體之間存在差別,雖然嚴(yán)格遵守隨機抽樣原則,也會因為抽到某些數(shù)值較大或較小的個體致使樣本統(tǒng)計量與總體參數(shù)之間有所不同:兩個變量均值不同的樣本是否來自同一總體?其差別是否有統(tǒng)計學(xué)意義?4.1均值比較-T檢驗類型:均值分析:用于分組計算、比較制定變量的描述性統(tǒng)計量,如總和、均值、方差、原則差、觀察數(shù)等,還能夠給出方差分析表和線性檢驗成果。區(qū)別與“描述”,必須分組求均值,目的在于比較單樣本T檢驗:某個變量的樣本均數(shù)與給定總體的已知均數(shù)相比,其差別是否有明顯(例:周歲小朋友的平均身高是否為75厘米)非配對或獨立T檢驗:檢驗由兩個獨立樣本估計的總體均數(shù)之間的差別是否明顯(如兩種不同餌料養(yǎng)殖羅非魚)配對T檢驗:兩組樣本彼此不獨立,又稱為成對樣本(如家兔接種某疫苗前后體溫)T檢驗的先決條件是:樣本的抽樣呈正態(tài)分布,方差齊性(F檢驗)T檢驗是0假設(shè),即總體均值與指定檢驗值之間不存在明顯差別T檢驗的成果:假如在置信度為95%下,明顯性水平>0.05,則接受假設(shè);假如<0.05,拒絕假設(shè)案例4-1:10只家兔接種某疫苗后體溫是否有明顯變化?組別12345678910接種前體溫38.038.238.238.438.438.138.138.238.538.3接種后體溫38.438.538.538.838.938.538.738.538.539.0擬定樣本情況:本身配正確成對樣本SPSS數(shù)據(jù)準(zhǔn)備-【分析】-【比較均值】-【配對樣本T檢驗】成果輸出不存在線性有關(guān)關(guān)系P<0.01,闡明接種前后兔子體溫有極明顯差別,接種疫苗可使體溫極明顯升高幾種主要概念(1)原因:是指所要研究的變量(銷售方式),它可能對因變量產(chǎn)生影響。(2)水平:水平指原因的詳細(xì)體現(xiàn),如銷售的四種方式就是原因的不同取值等級。(3)單原因方差分析:只針對一種原因進(jìn)行方差分析(4)多原因方差分析:同步針對多種原因進(jìn)行方差分析4.2方差分析案例:某企業(yè)產(chǎn)品銷售方式所相應(yīng)的銷售量序號銷售方式12345水平均值方式一778681888383方式二959278968990方式三717668817474方式四808479708279總均值81.54種銷售方式,就是多種總體均值是否相等的假設(shè)檢驗問題,需要采用的措施是方差分析4.2方差分析基本假設(shè)(1)獨立性:各組觀察數(shù)據(jù),是從相互獨立的總體中抽取的(2)正態(tài)性:因變量在影響原因的各個水平上的分布必須服從正態(tài)分布(3)方差齊性:各個水平下的總體具有相同的方差組間方差:水平之間的方差,既涉及系統(tǒng)性差別,也涉及隨機性差別;組內(nèi)方差:水平內(nèi)部的方差,僅涉及隨機性差別單原因方差分析SST(總的離差平方和)=SSA(組間離差平方和)+SSE(組內(nèi)離差平方和)SPSS將自動計算檢驗統(tǒng)計量和相伴概率P值,若P值不不小于等于明顯性水平α,則拒絕原假設(shè),覺得原因的不同水平對觀察變量產(chǎn)生明顯影響;反之,接受零假設(shè),覺得原因的不同水平?jīng)]有對觀察變量產(chǎn)生明顯影響。

多原因方差分析基本原理對一種獨立變量(因變量)是否受多種原因或變量影響而進(jìn)行的方差分析受到多種控制變量獨立作用、控制變量交互作用及隨機原因等三方面的影響例如,對稻谷產(chǎn)量進(jìn)行分析時,不但單純考慮耕地深度和施肥量都會影響產(chǎn)量,但同步深耕和合適的施肥可能使產(chǎn)量成倍增長,這時,耕地深度和施肥量就可能存在交互作用Q表達(dá)各部分相應(yīng)的離差平方和采用F檢驗,其零假設(shè)是H0:各原因不同水平下觀察變量的均值無明顯差別。SPSS將自動計算F值,并根據(jù)F分布表給出相應(yīng)的概率P值。我們能夠根據(jù)相伴概率P值和明顯性水平α的大小關(guān)系來判斷各原因的不同水平對觀察變量是否產(chǎn)生了明顯性影響。

案例:單原因方差分析案例4-2:某機構(gòu)的各個級別的管理人員需要足夠的信息來完畢各自的任務(wù)。近來,一項研究調(diào)查了信息起源對信息傳播的影響。在這項特定的研究中,信息起源是上級、同級和下級。在每種情況下,對信息傳播進(jìn)行測度:數(shù)值越高,闡明信息傳播越廣。檢驗信息起源是否對信息傳播有明顯影響?你的結(jié)論是什么?分析:信息起源是原因,“上級、同級和下級”是原因的三種不同水平,信息傳播測度是因變量(觀察變量)。因為這里有三個水平,所以不能采用兩樣本的均值檢驗過程,故考慮采用單原因方差分析法。進(jìn)行如下假設(shè)檢驗:H0:三種不同信息起源對信息傳播測度平均值沒有明顯性影響;H1:三種不同信息起源對信息傳播測度平均值存在明顯性影響。LSD:最小明顯差數(shù)法。用t檢驗完畢各組均數(shù)間的比較;S-N-K:StudentNewmanKeulsTest法,利用比較廣泛的一種兩兩比較法選擇不同的均值多重比較措施:“兩兩比較”“選項”成果輸出組間明顯性不小于0.05,滿足方差分析的前提條件2.多重比較表白,多種途徑信息起源對信息傳播的影響均無明顯影響多原因方差分析-案例4-3數(shù)據(jù)準(zhǔn)備:GMAT成績.sav

分析->一般線性模型->單變量

分?jǐn)?shù)->因變量;

學(xué)校、課程->固定因子輸出成果4.3非參數(shù)檢驗-卡方檢驗SPSS4.3非參數(shù)檢驗-卡方檢驗在實踐中,常遇到某些樣本的總體分布不明確,或者總體參數(shù)的假設(shè)條件不成立,或不服從正態(tài)分布時,采用非參數(shù)檢驗非參數(shù)檢驗:不假定總體分布情況下,來實現(xiàn)對總體參數(shù)的推斷涉及:卡方、二項式分布、游程、單樣本K-S檢驗,以及兩個獨立樣本、多種獨立樣本、兩個有關(guān)樣本、多種有關(guān)樣本非參數(shù)檢驗與參數(shù)檢驗相比,優(yōu)勢如下:穩(wěn)健性??傮w分布的約束條件大大放寬,對個別偏離較大的數(shù)據(jù)不至于太敏感。對數(shù)據(jù)的測量尺度無約束,對數(shù)據(jù)的要求也不嚴(yán)格,什么數(shù)據(jù)都能夠做。合用于小樣本、無分布樣本、數(shù)據(jù)污染樣本、混雜樣本等。但是,假如參數(shù)檢驗?zāi)P偷娜考僭O(shè)在數(shù)據(jù)中都能滿足,且達(dá)成所要求的水平,那么用非參數(shù)檢驗可能造成低效率,最終揮霍數(shù)據(jù)。4.3非參數(shù)檢驗-卡方檢驗1.使用目的卡方檢驗(Chi-SquarTest)也稱為卡方擬合優(yōu)度檢驗,是K.Pearson給出的一種最常用的非參數(shù)檢驗措施。它用于檢驗觀察數(shù)據(jù)是否與某種概率分布的理論數(shù)值相符合,進(jìn)而推斷觀察數(shù)據(jù)是否是來自于該分布的樣本的問題。如:根據(jù)投擲骰子試驗中出現(xiàn)的點數(shù)檢驗骰子是否均勻,即各點出現(xiàn)的概率是否均為1/6。2.基本原理進(jìn)行卡方檢驗時,首先提出零假設(shè):樣本X來自的總體分布服從期望分布或某一理論分布。接著,利用實際觀察值的頻數(shù)與理論的期望頻數(shù)之間的差別來構(gòu)造檢驗統(tǒng)計量,它描述了觀察值和理論值之間的偏離程度。3.軟件使用措施【分析】→【非參數(shù)檢驗】→【舊對話框】→【卡方】案例4-4某企業(yè)經(jīng)營數(shù)年,形成了一套成熟的企業(yè)文化和管理體系,例如根據(jù)數(shù)年的運營經(jīng)驗,經(jīng)理層、監(jiān)察員、辦事員三種職務(wù)類別人員百分比大約在15:5:80為宜,這么運營效率最高。目前企業(yè)進(jìn)行人事調(diào)整,企業(yè)人員構(gòu)造發(fā)生變動,有員工緊張是否人事調(diào)整已經(jīng)造成職務(wù)類型百分比的失調(diào)。三種職務(wù)的期望構(gòu)成比為15%、5%和80%。而目前樣本中觀察到的三種職務(wù)的人數(shù)比為84:27:363,構(gòu)成比分別是17.7%、5.7%和76.6%,和理論值有差別。那么這種差別是由隨機誤差造成的,還是真的構(gòu)成比和此前有所變化?該問題就能夠用χ2檢驗來實現(xiàn)。相應(yīng)的假設(shè)檢驗如下。H0:目前三個職業(yè)的總體構(gòu)成比依然是15%、5%和80%。H1:目前三個職業(yè)的總體構(gòu)成比不再是15%、5%和80%。4.3非參數(shù)檢驗-卡方檢驗Step1:打開數(shù)據(jù)(4-4.sav)-【分析】-【非參數(shù)檢驗】-【舊對話框】-【卡方】職務(wù)類別:“1”表達(dá)辦事員,“2”表達(dá)監(jiān)察員,“3”表達(dá)經(jīng)理。Step2:選擇檢驗變量在左側(cè)的候選變量列表框中選擇“EmploymentCategory(職務(wù))”變量作為檢驗變量,將其添加至【檢驗變量列表】列表框中。Step3:選擇期望值在【期望值】選項組中點選【值】單項選擇鈕,以指定時望概率值。接著在【值】的文本框中分別輸入0.8、0.05和0.15這三個數(shù)值,而且單擊【添加】按鈕加以擬定。Step4:完畢操作4.3非參數(shù)檢驗-卡方檢驗成果輸出:P值0.174不小于明顯性水平0.05。所以接受零假設(shè),覺得目前三個職業(yè)的總體構(gòu)成比依然是15%、5%和80%,人數(shù)的調(diào)動只是隨機誤差造成的,企業(yè)人員構(gòu)造沒有明顯性變化。5.有關(guān)分析有關(guān)分析:研究變量相互關(guān)系的親密程度和變化趨勢,并用合適的統(tǒng)計指標(biāo)描述。最常見的是兩兩有關(guān)分析,例如:魚的體長與體重、作物的產(chǎn)量與施肥量等問題統(tǒng)計關(guān)系常見類型:線性有關(guān):兩變量呈線性共同增大;呈線性一增一減非線性有關(guān):曲線有關(guān);兩變量存在有關(guān)趨勢不有關(guān)常用措施:l散點圖l計算有關(guān)系數(shù):區(qū)間是[-1,1],是兩個變量之間的線性關(guān)聯(lián)的一種度量有關(guān)分析-案例某科技人員喂養(yǎng)了35尾團(tuán)頭魴,共重7.2kg,在水溫29℃的條件下,測量攝食量與耗氧率之間的關(guān)系,請對攝食量與耗氧率作有關(guān)行分析。攝食量203040506070耗氧率536.3573.5595.9628.9669.6725.7SPSS操作環(huán)節(jié):數(shù)據(jù)準(zhǔn)備-【分析】-【有關(guān)】-【雙變量】成果輸出:P=0.000<0.01,差別極明顯,表白攝食量和耗氧量之間存在極明顯的正有關(guān)關(guān)系,耗氧量伴隨攝食量的增長而增長Pearson簡樸有關(guān)系數(shù):合用于雙變量正態(tài)分布資料(一般用字母r表達(dá))Spearman等級有關(guān)系數(shù):合用于有序數(shù)據(jù)和不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù),非參數(shù)統(tǒng)計Kendall等級有關(guān)系數(shù):對有序變量或兩個秩變量間有關(guān)程度的度量統(tǒng)計量,非參數(shù)統(tǒng)計6.回歸分析探察變量之間的數(shù)量變化規(guī)律,并經(jīng)過一定的數(shù)學(xué)體現(xiàn)式來描述這種關(guān)系,進(jìn)而擬定一種或幾種變量的變化對另一種變量的影響程度只要系數(shù)之間是線性組合的,并可經(jīng)過變換可轉(zhuǎn)換為線性方程的,都可嘗試用線性模型進(jìn)行擬合回歸分析與有關(guān)分析的關(guān)系兩者均為研究兩個或兩個以上變量之間關(guān)系的措施。從廣義上說,有關(guān)分析涉及了回歸分析。兩者有區(qū)別:1、有關(guān)分析的兩個變量平行,不一定存在因果關(guān)系;回歸分析變量之間存在因果關(guān)系,自變量是因,因變量是果,一種回歸方程內(nèi)因變量只有一種,自變量能夠有多種。2、有關(guān)分析僅僅研究變量之間的相互關(guān)系的親密程度和變化趨勢,并用合適的統(tǒng)計指標(biāo)描述。假如用一種或多種變量的取值來估計另一種變量的取值,這就是回歸分析?;貧w分類一元線性回歸分析一元線性回歸(簡樸線性回歸):研究兩個變量間的統(tǒng)計關(guān)系。一元線性回歸方程前提假設(shè)線性趨勢:自變量和因變量的關(guān)系是線性的,假如不是,則不能采用線性回歸來分析。能夠經(jīng)過散點圖來加以判斷;獨立性:因變量y的取值相互獨立,之間沒有聯(lián)絡(luò)。反應(yīng)到模型中要求殘差間相互獨立,不存在自有關(guān),不然應(yīng)采用自回歸模型來分析正態(tài)性:自變量的任何一種線性組合,因變量y均服從正態(tài)分布。反應(yīng)到模型中要求殘差服從正態(tài)分布方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論