




已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
如何選擇數(shù)據(jù)分析方法?,吳喜之,2,數(shù)據(jù)和目的相結(jié)合的出發(fā)點,1.相關(guān)分析及回歸類模型(相關(guān)、簡單的回歸、Logistic回歸、對數(shù)線性模型、方差分析和一般線性模型)2.經(jīng)典多元分析內(nèi)容(主成分分析、因子分析、聚類分析、判別分析、對應(yīng)分析),3,主要涉及的相關(guān)問題,什么是相關(guān)?列聯(lián)表中定性變量的相關(guān)(Fisher但列聯(lián)表也會帶有定量變量作為協(xié)變量。,14,二維列聯(lián)表的檢驗,研究列聯(lián)表的一個主要目的是看這些變量是否相關(guān)。比如前面例子中的收入和觀點是否相關(guān)。這需要形式上的檢驗,15,二維列聯(lián)表的檢驗,對于上面那樣的二維表。我們檢驗的零假設(shè)和備選假設(shè)為H0:觀點和收入這兩個變量不相關(guān);H1:這兩個變量相關(guān)。這里的檢驗統(tǒng)計量在零假設(shè)下有(大樣本時)近似的c2分布。當該統(tǒng)計量很大時或p-值很小時,就可以拒絕零假設(shè),認為兩個變量相關(guān)。實際上有不止一個c2檢驗統(tǒng)計量。包括Pearsonc2統(tǒng)計量和似然比(likelihoodratio)c2統(tǒng)計量;它們都有漸近的c2分布。根據(jù)計算可以得到(對于這兩個統(tǒng)計量均有)p-值小于0.001。因此可以說,收入高低的確影響觀點。,16,Pearsonc2統(tǒng)計量,似然比c2統(tǒng)計量,Oi代表第i個格子的計數(shù),Ei代表按照零假設(shè)(行列無關(guān))對第i格子的計數(shù)的期望值,17,二維列聯(lián)表的檢驗,剛才說,這些c2統(tǒng)計量是近似的,那么有沒有精確的統(tǒng)計量呢?當然有。這個檢驗稱為Fisher精確檢驗;它不是c2分布,而是超幾何分布。對本問題,計算Fisher統(tǒng)計量得到的p-值也小于0.001。既然有精確檢驗為什么還用近似的c2檢驗?這是因為當數(shù)目很大時,超幾何分布計算相當緩慢(比近似計算會差很多倍的時間);而且在計算機速度不快時,根本無法計算。因此人們多用大樣本近似的c2統(tǒng)計量。而列聯(lián)表的有關(guān)檢驗也和c2檢驗聯(lián)系起來了。,18,Fisher精確檢驗,19,SPSS:Weight-Describ-crosstab-exact,20,下面為SPSS對于table7.savs數(shù)據(jù)產(chǎn)生的下面二維列聯(lián)表相關(guān)分析的輸出,21,兩個定量變量的相關(guān),如果兩個定量變量沒有關(guān)系,就談不上建立模型或進行回歸。但怎樣才能確定兩個變量有沒有關(guān)系呢?最簡單的辦法就是畫出它們的散點圖。,22,例1有50個從初中升到高中的學(xué)生.為了比較初三的成績是否和高中的成績相關(guān),得到了他們在初三和高一的各科平均成績(數(shù)據(jù):highschool.sav),從這張圖可以看出什么呢?,23,問題是,怎么判斷這兩個變量是否相關(guān)?如何相關(guān)?相關(guān)的度量是什么?進一步的問題是能否以初三成績?yōu)樽宰兞?,高一成績?yōu)橐蜃兞縼斫⒁粋€回歸模型以描述這樣的關(guān)系,或用于預(yù)測。,四組數(shù)據(jù)(每個有兩個變量的樣本)的散點圖,25,幾種相關(guān)的度量,Pearson相關(guān)系數(shù),又叫相關(guān)系數(shù)或線性相關(guān)系數(shù)。它一般用字母r表示.Kendallt相關(guān)系數(shù)(Kendallst)這里的度量原理是把所有的樣本點配對,看每一對中的x和y是否都增加來判斷總體模式.Spearman秩相關(guān)系數(shù),它和Pearson相關(guān)系數(shù)定義有些類似,只不過在定義中把點的坐標換成各自樣本的秩.它們各自都有以不相關(guān)為零假設(shè)的檢驗,即p-值小則相關(guān).但各自的相關(guān)含義不盡相同.現(xiàn)在再來看例1的數(shù)據(jù)(highschool.sav).關(guān)于初三和高一成績的相關(guān)系數(shù)的結(jié)果是Pearson相關(guān)系數(shù),Kendallt和Spearman秩相關(guān)系數(shù)分別為0.795,0.595和0.758。,26,SPSS的相關(guān)分析,相關(guān)分析(hischool.sav)利用SPSS選項:AnalizeCorrelateBivariate再把兩個有關(guān)的變量(這里為j3和s1)選入,選擇Pearson,Spearman和Kendall就可以得出這三個相關(guān)系數(shù)和有關(guān)的檢驗結(jié)果了(零假設(shè)均為不相關(guān))。,27,例子,x=-20:20y=x2,28,例子,x=-20:20y=x2,29,例子,x=1:41y=x5,30,例子,x=1:41y=x5,31,多個(定性或定量)變量間的關(guān)系,比如關(guān)于高等學(xué)校的數(shù)據(jù)的一些指標包括:定量變量(在校生人數(shù)、研究生比例,教師人數(shù)、教師占雇員的比例、教師學(xué)生比例、SCI和SSCI文章數(shù)目和引用數(shù)目、科研項目數(shù)和科研總經(jīng)費)和定性變量(所屬于分類、所在地區(qū)分類)等,32,在許多變量之中,比如,可得任何一個變量和其余變量(無論定量還是定性)之間的定量關(guān)系(回歸或線性模型)或者多個(定量)變量之間的定量關(guān)系(因而可以建立模型,進行預(yù)測和各種推斷)(典型相關(guān)分析、對應(yīng)分析)也可以利用其中一些(定量)變量把各個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二年級下語文數(shù)學(xué)試卷
- 高難度劇本殺數(shù)學(xué)試卷
- 肛腸科中醫(yī)課件
- 光山縣招教試題數(shù)學(xué)試卷
- 肉雞生物安全課件
- 飛線充電培訓(xùn)課件
- 2024年10月遼寧2024撫順縣農(nóng)村信用合作聯(lián)社校園招考筆試歷年參考題庫附帶答案詳解
- 超聲骨密度培訓(xùn)課件
- 四川南充臨江建設(shè)發(fā)展集團有限責(zé)任公司員工招聘考試真題2024
- 2024年眉山職業(yè)技術(shù)學(xué)院招聘筆試真題
- 變壓器監(jiān)造內(nèi)容
- DB44-T 1948-2016 移動通信固定終端天線
- 2023廣西公需科目真題(關(guān)于人才工作的重要論述)
- 管道非開挖修復(fù)方案
- 四升五數(shù)學(xué)入學(xué)摸底考試
- 外研版(三起)英語三年級上冊全冊課件
- 江蘇省射陽中等專業(yè)學(xué)校教師招聘考試真題2022
- 熔鑄作業(yè)指導(dǎo)書
- 2022年全球及射頻微波儀器行業(yè)發(fā)展現(xiàn)狀分析
- 經(jīng)皮胃鏡下胃造瘺空腸管置入術(shù)
- 暑期托管服務(wù)考核表
評論
0/150
提交評論