spss統(tǒng)計分析及應(yīng)用教程 6.ppt_第1頁
spss統(tǒng)計分析及應(yīng)用教程 6.ppt_第2頁
spss統(tǒng)計分析及應(yīng)用教程 6.ppt_第3頁
spss統(tǒng)計分析及應(yīng)用教程 6.ppt_第4頁
spss統(tǒng)計分析及應(yīng)用教程 6.ppt_第5頁
已閱讀5頁,還剩137頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第6章相關(guān)和回歸分析 第6章相關(guān)和回歸分析 本章學(xué)習(xí)目標(biāo)理解相關(guān)和回歸分析的基本思想 原理與兩者之間關(guān)系 明確相關(guān)和回歸分析的實驗?zāi)康?實驗步驟和實驗內(nèi)容 掌握實驗結(jié)果的統(tǒng)計分析 熟練使用散點圖 相關(guān)和回歸分析應(yīng)用在經(jīng)濟管理數(shù)據(jù)分析中的應(yīng)用 第6章相關(guān)和回歸分析 相關(guān)和回歸分析是分析客觀事物之間相關(guān)性的數(shù)量分析方法 客觀事物之間的關(guān)系可分為函數(shù)關(guān)系和統(tǒng)計關(guān)系 函數(shù)關(guān)系指客觀事物之間的一一對應(yīng)關(guān)系 即當(dāng)一組變量取一定值時 另一變量y可以依確定的函數(shù)取唯一確定的值 統(tǒng)計關(guān)系指客觀事物之間的一種非一一對應(yīng)關(guān)系 即當(dāng)一組變量取一定值時 另一變量y無法依確定的函數(shù)取唯一確定的值 事物之間的函數(shù)關(guān)系比較容易分析 而事物之間的統(tǒng)計關(guān)系不像函數(shù)關(guān)系那樣直接 相關(guān)和回歸分析正是以不同的方式處理事物間的統(tǒng)計關(guān)系 實驗一相關(guān)分析 實驗?zāi)康牧私庀嚓P(guān)分析的方法原理 熟練掌握相關(guān)分析的SPSS操作命令 熟練應(yīng)用三個常用相關(guān)系數(shù)的計算方法及其數(shù)據(jù)測度要求 運用相關(guān)分析解決管理學(xué)實際問題的能力 實驗一單一樣本t檢驗 準(zhǔn)備知識簡單相關(guān)分析的概念 統(tǒng)計學(xué)中 相關(guān)分析是以分析變量間的線性關(guān)系為主 是研究它們之間線性相關(guān)密切程度一種統(tǒng)計方法 它是通過幾個描述相關(guān)關(guān)系的統(tǒng)計量來確定相關(guān)的密切程度和線性相關(guān)的方向 這些統(tǒng)計量包括皮爾遜 Pearson 相關(guān)系數(shù) 斯皮爾曼 Spearman 和肯德爾 Kendall 秩相關(guān)系數(shù) 一般用符號r來表示 準(zhǔn)備知識簡單相關(guān)分析的概念 相關(guān)系數(shù)具有一些特性 1 它的取值極限在 1和 1之間 即 1 r 1 2 它具有對稱性 即X與Y之間的相關(guān)系數(shù)和Y與X之間的相關(guān)系數(shù)相同 3 它與原點和測度都無關(guān) 即如果定義和 其中 且c和d都是常數(shù) 則和之間的r無異于原始變量X與Y之間的r 4 如果X和Y統(tǒng)計上獨立的 則它們之間的相關(guān)系數(shù)r 0 但反過來 r 0不等于說X和Y是獨立的 5 它僅是線性關(guān)聯(lián)的一個度量 不能用于描述非線性關(guān)系 相關(guān)系數(shù)的計算方法皮爾遜 Pearson 相關(guān)系數(shù) 通常 僅對刻度級 Scale 變量計算皮爾遜 Pearson 相關(guān)系數(shù) 公式為 其中 分別為 i 1 2 n 的算術(shù)平均值 相關(guān)系數(shù)的計算方法斯皮爾曼和肯德爾秩相關(guān)關(guān)系 用于反映兩個序次或等級變量的相關(guān)程度 計算Spearman相關(guān)數(shù)據(jù)時 要求先對原始變量的數(shù)據(jù)排序 根據(jù)秩使用Spearman相關(guān)系數(shù)公式進行計算 公式可為 式中 分別是 的秩 分別是變量 的平均值 至于肯德爾秩相關(guān)系數(shù)的計算公式 此處不再列出 關(guān)于相關(guān)系數(shù)統(tǒng)計意義的檢驗 我們通常利用樣本來研究總體的特性 由于抽樣誤差的存在 樣本中兩個變量之間的相關(guān)系數(shù)不為0 不能直接就斷定總體中兩個變量間的相關(guān)系數(shù)不是0 而必須進行檢驗 給出顯著性水平 做出判斷 對給定的顯著性水平 與檢驗統(tǒng)計量相對應(yīng)的p值進行比較 當(dāng)p值 SPSS中常用Sig值來表示 小于顯著性水平 則拒絕原假設(shè) 認為相關(guān)系數(shù)不為零 如 0 05 P 0 01 則P 拒絕零假設(shè) 即兩個變量相關(guān)系數(shù)r 0 計算得到的相關(guān)系數(shù)是有意義 可以對它進行說明兩個變量之間的相關(guān)程度 反之 當(dāng)p值大于顯著性水平 則不能拒絕原假設(shè) 認為相關(guān)系數(shù)為零 不能根據(jù)計算得到的相關(guān)系數(shù)來說明兩者之間相關(guān)程度 實驗一相關(guān)分析 實驗內(nèi)容某大學(xué)一年級12名女生的胸圍 cm 肺活量 L 身高 m 數(shù)據(jù)見表6 1 1 試分析胸圍與肺活量兩個變量之間相關(guān)關(guān)系 表6 1 1胸圍 肺活量與身高相關(guān)數(shù)據(jù)表 實驗步驟 1 繪制散點圖 以判斷兩個變量之間有無線性相關(guān)趨勢 見圖 2 從菜單上依次選擇 分析 相關(guān) 雙變量 二元相關(guān) 命令 打開對話框 如圖6 1 2所示 選擇 胸圍 肺活量 到變量框 選擇 相關(guān)系數(shù) pearson 顯著性檢驗 雙側(cè)檢驗 標(biāo)記顯著性相關(guān) 單擊 確定 按鈕 實驗結(jié)果 胸圍與肺活量相關(guān)性 實驗分析 胸圍與肺活量相關(guān)性 由結(jié)果表可以看出 變量間相關(guān)系數(shù)是用2 2方陣形式出現(xiàn)的 每一行和每一列的兩個變量對應(yīng)的單元格就是這兩個變量相關(guān)分析結(jié)果 有三個數(shù)字 分別為Pearson相關(guān)性 顯著性 雙側(cè) N 樣本量 如表格中黑色單元格所示 胸圍與肺活量的Pearson相關(guān)系數(shù)為0 549 顯著性檢驗為0 064 樣本量為12 如果單從相關(guān)系數(shù)可以看出兩者是正相關(guān)的而且具有中等相關(guān)性 但是 顯著性檢驗0 064 0 05 接受原假設(shè) 所以Pearson相關(guān)系數(shù)為0 549的值沒有通過顯著檢驗 根據(jù)這12個小樣本來推斷該大學(xué)一年級女生胸圍與肺活量之間的沒有線性相關(guān)性 實驗二偏相關(guān)分析 實驗?zāi)康臏?zhǔn)確理解偏相關(guān)分析的方法原理和使用前提 熟練掌握偏相關(guān)分析的SPSS操作 了解偏相關(guān)分析在中介變量運用方法 實驗二偏相關(guān)分析 準(zhǔn)備知識偏相關(guān)分析的概念 在多元相關(guān)分析中 由于其他變量的影響 Pearson相關(guān)系數(shù)只是從表面上反映兩個變量相關(guān)性 相關(guān)系數(shù)不能真正反映兩個變量間的線性相關(guān)程度 甚至?xí)o出相關(guān)的假想 因此 在有些場合中 簡單的Pearson相關(guān)系數(shù)并不是測量相關(guān)關(guān)系的本質(zhì)性統(tǒng)計量 當(dāng)其他變量控制后 給定的任意兩個變量之間的相關(guān)系數(shù)叫做偏相關(guān)系數(shù) 偏相關(guān)系數(shù)才是真正反映兩個變量相關(guān)關(guān)系的統(tǒng)計量 偏相關(guān)系數(shù)的計算公式 設(shè)有n個變量 每兩個變量間的簡單相關(guān)關(guān)系 即皮爾遜 Pearson 相關(guān)系數(shù)所構(gòu)成的相關(guān)系數(shù)對稱矩陣為 其中 i j 1 2 n 偏相關(guān)系數(shù)的計算公式 如設(shè)為此矩陣的行列式 既 則變量與之間的偏相關(guān)關(guān)系為 其中分別為中元素的代數(shù)余子式 實驗二偏相關(guān)分析 實驗內(nèi)容研究人員收集了26個旅游景點某年的商店投資數(shù)據(jù) 游客增長率和風(fēng)景區(qū)的經(jīng)濟增長率 問景區(qū)商業(yè)投資是否確實導(dǎo)致了風(fēng)景區(qū)的經(jīng)濟增長率 實驗二偏相關(guān)分析 實驗步驟 1 在SPSSl7 0中打開數(shù)據(jù)文件6 2 sav 通過選擇 文件 打開 命令將數(shù)據(jù)調(diào)入SPSSl7 0的工作文件窗口 旅游投資數(shù)據(jù)文件 2 從菜單上依次選擇 分析 相關(guān) 偏相關(guān) 命令 打開其對話框 如圖所示 選擇 商業(yè)投資 與 經(jīng)濟增長 作為相關(guān)分析變量 送入變量框中 選擇 游客增長率 作為控制變量 用箭頭送入右邊的控制框中 3 點擊 選項 按鈕 見圖 選擇零階相關(guān)系數(shù) 也就是兩兩簡單相關(guān)系數(shù) 可以用與偏相關(guān)系數(shù)比較 點擊 繼續(xù) 按鈕回到主分析框 點擊 確定 按鈕 實驗結(jié)果 描述性統(tǒng)計分析 偏相關(guān)分析 實驗三簡單線性回歸分析 實驗?zāi)康臏?zhǔn)確理解簡單線性回歸分析的方法原理 熟練掌握簡單線性回歸分析的SPSS操作與分析 了解相關(guān)性與回歸分析之間關(guān)系 培養(yǎng)運用簡單線性回歸分析解決實際問題的能力 知識準(zhǔn)備線性回歸分析問題 線性回歸分析一般解決以下問題 第一 確定因變量與若干自變量之間的定量表達式 通常稱為回歸方程式 并確定它們聯(lián)系的密切程度 第二 通過控制可控變量的數(shù)值 利用求出的回歸方程式來預(yù)測或控制因變量的取值和精度 第三 進行自變量分析 找出影響因素最為顯著的 以區(qū)別重要因素和次要因素 回歸分析主要研究變量之間的線性相關(guān)關(guān)系時 稱為線性回歸分析 否則稱為非線性回歸分析 又按照自變量多少分為一元線性回歸和多元線性回歸 知識準(zhǔn)備簡單線性回歸分析的理論模型 其理論假設(shè)為 簡單線性回歸的主要任務(wù)是根據(jù)樣本數(shù)據(jù)求出未知參數(shù)和的估計值和 從而得到估計的回歸方程 知識準(zhǔn)備SPSS線性回歸分析的數(shù)據(jù)要求 線性回歸過程中包括一元 多元線性回歸 多元逐步回歸 可以給出所求回歸方程的回歸系數(shù)估計值 即回歸系數(shù)參數(shù)估計和區(qū)間估計 協(xié)方差矩陣 復(fù)相關(guān)系數(shù)R 方差分析表 因變量的最佳預(yù)測值等 還可以輸出變量值的散點圖等圖形 線性回歸過程對數(shù)據(jù)的要求是 自變量和因變量必須是具有刻度級測度的數(shù)值型變量 標(biāo)志或分類變量 必須記錄為二元的啞變量 虛擬變量 或者其他類型的對立變量 對于因變量的所有觀察值 樣本 應(yīng)該認為是來自于相互獨立的等方差的正態(tài)總體 i i d 并且因變量與各個自變量之間應(yīng)具有一定的線性關(guān)系 簡單線性回歸分析中的統(tǒng)計檢驗和殘差分析擬合優(yōu)度檢驗 定線性回歸直線擬合優(yōu)度的檢驗統(tǒng)計為 式中 SST 稱為總平方和 SSR 稱為回歸平方和 SSE SST SSR 稱為殘差平方和 稱為判定系數(shù)或擬合效度等 簡單線性回歸分析中的統(tǒng)計檢驗和殘差分析F檢驗 回歸方程顯著性檢驗的統(tǒng)計量為F統(tǒng)計量 式中 p為自變量個數(shù) n為樣本觀測個數(shù) 對于一元線性回歸方程 p 1 同時注意到 即擬合優(yōu)度越好 F值越大 越有可能是顯著的 方程成立可能性越大 說明R方是直觀地體現(xiàn)出擬合效果 而F是統(tǒng)計量定量說明這個效果是否顯著 一般兩者配套使用 簡單線性回歸分析中的統(tǒng)計檢驗和殘差分析DW檢驗 在回歸模型的診斷中 有一個非常重要的回歸模型假設(shè)需要診斷 那就是回歸模型中的誤差項的獨立性 如果誤差項不獨立 那么對回歸模型的任何估計與假設(shè)所作出的結(jié)論都是不可靠的 其參數(shù)稱為DW 取值范圍是0 DW 4 統(tǒng)計學(xué)意義如下 當(dāng)殘差與自變量互為獨立時 DW 2 當(dāng)相鄰兩點的殘差為正相關(guān)時 DW 2 當(dāng)相鄰兩點的殘差為負相關(guān)時 DW 2 簡單線性回歸分析中的統(tǒng)計檢驗和殘差分析殘差分析 所謂殘差就是指回歸方程計算得到的預(yù)測值與實際值之間的誤差 它是回歸模型中的估計值 有多個形成的序列稱為殘差序列 可通過殘差序列分析來證實模型假設(shè) 常以預(yù)測值為橫軸 以誤差為縱軸 或?qū)W生化殘差 繪制殘差的散點圖 如果散點圖呈現(xiàn)明顯的規(guī)律性 則認為存在自相關(guān)性 或者存在非線性 非常數(shù)方差的問題 利用殘差圖還可以判斷模型的擬合效果 在殘差圖中 如果各點呈隨機狀 并絕大部分落在范圍 68 的點落在內(nèi) 96 的點落在之中 說明模型對于數(shù)據(jù)的擬合效果較好 知識準(zhǔn)備簡單線性回歸分析的基本步驟 回歸分析之前 需要對樣本資料是否滿足要求進行判斷 可以先使用相關(guān)分析法確定自變量與因變量之間的相關(guān)系數(shù) 或者運用散點圖 Scatter 功能 產(chǎn)生直觀的散點圖 觀察自變量與因變量之間關(guān)系 以及奇異值等情況 如果圖中發(fā)現(xiàn)有明顯遠離主體的觀測值 則稱之為異常點 Outlier 這些點很可能對正確評價兩變量之間關(guān)系有較大影響 知識準(zhǔn)備簡單線性回歸分析的基本步驟 分析因變量的正態(tài)性 方差齊性 確定是否可以進行線性回歸分析 模型擬合完畢 通過殘差分析結(jié)果來考察模型是否可靠 如果變量進行了變換 則應(yīng)重新繪制散點圖并觀察數(shù)據(jù)分布 知識準(zhǔn)備簡單線性回歸分析的基本步驟 利用檢驗統(tǒng)計量對回歸預(yù)測模型進行顯著性檢驗 得到擬合回歸直線 知識準(zhǔn)備簡單線性回歸分析的基本步驟 考察數(shù)據(jù)是否符合模型假設(shè)條件 主要包括以下兩個方面 首先殘差是否獨立 實際上就是考察因變量取值是否相互獨立 采用Durbin Watson DW殘差序列相關(guān)性進行分析 其取值范圍為 0 DW 4 統(tǒng)計意義為 若DW 2 表明相鄰兩點的殘差項相互獨立 若0 DW 2 表明相鄰兩點的殘差項正相關(guān) 若2 DW 4 表明相鄰兩點的殘差項負相關(guān) 其次 考察殘差分布是否為正態(tài) 實際上就是考察因變量趨勢是否服從正太分布 可以采用殘差列表及相關(guān)指標(biāo)法進行分析 直方圖是圖示法觀察用的 知識準(zhǔn)備簡單線性回歸分析的基本步驟 線性回歸用于預(yù)測時 其適用范圍一般不應(yīng)超出樣本中自變量的取值范圍 此時求得的預(yù)測值成為內(nèi)插 Interpolation 而超出自變量取值范圍所得到的預(yù)測值成為外延 Extrapolation 若無充分理由說明現(xiàn)有自變量范圍以外的兩變量間仍然是線性關(guān)系 則應(yīng)盡量避免不合理的外延 同時線性模型的預(yù)測效果不及非線性模型 所以一般不用線性模型來開展預(yù)測功能 相關(guān)分析與回歸分析關(guān)系概念關(guān)系 相關(guān)分析與回歸分析有密切的關(guān)系 它們都是研究變量之間線性關(guān)系的統(tǒng)計分析方法 但是兩者又有區(qū)別 相關(guān)分析中的變量視為隨機變量 僅研究變量之間是否存在線性關(guān)系 而回歸分析中研究的變量分為因變量和自變量 因變量是隨機變量 又成為被解釋變量 自變量又稱為解釋變量 是可以加以控制的變量 相關(guān)分析與回歸分析關(guān)系 雖然因果分析研究一個變量對另一個 些 變量的依賴關(guān)系 但它并不一定意味著因果關(guān)系 用Kendall和Stuart的話說 一個統(tǒng)計關(guān)系式 不管多強也不管多么有啟發(fā)性 卻永遠不能確定因果方面的聯(lián)系 對因果關(guān)系的理念 必須來自統(tǒng)計學(xué)以外 最終來自這種或那種理論 實驗三簡單線性回歸分析 實驗內(nèi)容下表給出1960 1972年之間的美國制造業(yè)的每百名雇員的辭退率與失業(yè)率 試分析辭退率Y和失業(yè)率X的線性關(guān)系 實驗三協(xié)方差分析 實驗步驟 1 進入線性回歸分析的對話框 選擇 分析 回歸 線性 命令 彈出回歸分析對話框 回歸分析對話框 2 選擇分析變量 將 辭退率 送入因變量分析框 將 失業(yè)率 送入自變量分析框 3 在方法 M 框中回歸分析方法 進入法 Enter 所選擇的自變量全部進入回歸模型 該選項是默認方式 逐步回歸法 Stepwise 它是向前選擇法與向后剔除法的結(jié)合 根據(jù)在選項 O 對話框中設(shè)定 首先根據(jù)方差結(jié)果選擇符合要求的自變量且對因變量貢獻最大的進入方程 然后根據(jù)向后剔除法 將模型中F值最小的且符合剔除要求的變量剔除出模型 重復(fù)進行 直到回歸方程中的自變量均符合進入模型 模型外的自變量都不符合進入模型要求為止 消去法 Remove 建立回歸方程時 根據(jù)設(shè)定的要求剔除部分自變量 后向剔除法 Backward 先建立全模型 根據(jù)在選項 O 對話框中設(shè)定 每次剔除一個最不符合要求的變量 直到回歸模型中不再含有不符合要求的自變量為止 向前選擇法 Forward 從模型中無自變量開始 根據(jù)在選項 O 對話框中設(shè)定 每次將一個最符合的變量進入模型 直止所有符合要求的變量都進入模型為止 第一個進入模型的變量應(yīng)該與因變量間的相關(guān)系數(shù)絕對值最大 如果指定的依據(jù)是F值 每次將方差分析的F值最大的進入模型 4 選擇分析統(tǒng)計量 單擊統(tǒng)計量 S 按鈕 彈出對話框 如圖所示 回歸系數(shù) 估計 E 選項 輸出回歸系數(shù) 的標(biāo)準(zhǔn)誤 標(biāo)準(zhǔn)化回歸系數(shù)beta 對回歸系數(shù)進行檢驗的t值 t值的雙側(cè)檢驗的顯著性水平sig 置信區(qū)間 Confidenceintervals 選項 顯示每個回歸系數(shù)或協(xié)方差矩陣指定置信度的置信區(qū)間 協(xié)方差矩陣 Convariancematrix 選項 輸出非標(biāo)準(zhǔn)化回歸系數(shù)的協(xié)方差矩陣 各變量的相關(guān)系數(shù)矩陣 與模型擬合及其擬合效果有關(guān)的選擇項模型擬合度 Modelfit 選項 輸出復(fù)相關(guān)系數(shù)R 復(fù)相關(guān)系數(shù)R2及其修正值 估計值的標(biāo)準(zhǔn)誤 ANOVA方差分析表 引入模型和從模型中剔除的變量 這是系統(tǒng)默認選擇項 R方變化 Rsquaredchang 選項 由于添加或刪除自變量而產(chǎn)生的R2統(tǒng)計量的變化 如果較大 說明進入和從方程中剔除的變量有可能是一個較好的回歸變量 與模型擬合及其擬合效果有關(guān)的選擇項部分相關(guān)和偏相關(guān)性 Partandpartialcorrelation 選項 輸出部分相關(guān)系數(shù) 表明當(dāng)一個自變量進入回歸方程后 R2增加了多少 偏相關(guān)系數(shù) 表示排除了其他自變量對因變量的影響后 與因變量的相關(guān)程度 零階相關(guān)系數(shù) 變量之間的簡單相關(guān)系數(shù) 共線性診斷 Collinearitydiagnostics 選項 共線性 或多重共線性 指一個自變量是其他自變量的線性函數(shù) 輸出用來診斷各變量共線性問題的各種統(tǒng)計量和容限值 有關(guān)殘差 Residuals 分析的選擇項Durbin Watson選項 輸出Durbin Watson統(tǒng)計量以及可能是奇異值的觀察量診斷表 個案診斷 Casediagnostics 選項 輸出觀測量診斷表 離群值 Outliersandstandarddeviation 選項 設(shè)置奇異值的判據(jù) 默認值為 3 所有觀測量選項 輸出所有觀察量的殘差值 離群值 Outliersandstandarddeviation 選項 設(shè)置奇異值的判據(jù) 默認值為 3 所有觀測量選項 輸出所有觀察量的殘差值 5 選擇分析 O 選項 如圖所示 步進方法標(biāo)準(zhǔn) 設(shè)置變量進入模型或從模型中剔除的判據(jù) 使用F的概率選項 以F檢驗的概率作為變量進入模型或從模型中剔除的判據(jù) 系統(tǒng)默認值為0 05 當(dāng)一個變量的sig值 0 05時 該變量進入回歸方程 當(dāng)一個變量的sig值 0 10時 該變量從回歸方程中刪除 可以在其后的編輯框中輸入自定義值 但是進入值要小于刪除值 使用F值選項 以F值作為變量進入模型或從模型中剔除的判據(jù) 系統(tǒng)默認進入F值 3 84 F值 2 71時從模型中刪除該變量 步進方法標(biāo)準(zhǔn) 設(shè)置變量進入模型或從模型中剔除的判據(jù) 使用F的概率選項 以F檢驗的概率作為變量進入模型或從模型中剔除的判據(jù) 系統(tǒng)默認值為0 05 當(dāng)一個變量的sig值 0 05時 該變量進入回歸方程 當(dāng)一個變量的sig值 0 10時 該變量從回歸方程中刪除 可以在其后的編輯框中輸入自定義值 但是進入值要小于刪除值 使用F值選項 以F值作為變量進入模型或從模型中剔除的判據(jù) 系統(tǒng)默認進入F值 3 84 F值 2 71時從模型中刪除該變量 在等式中包含常量 Includeconstantinequation 選項 在回歸方程中包含常數(shù)項 這是默認選擇項 本例選擇SPSS系統(tǒng)默認 單擊 繼續(xù) 按鈕 6 選擇繪制 T 選項 彈出繪制對話框 圖可以幫助檢驗數(shù)據(jù)的正態(tài)性 線性和方差相等的假設(shè) 還可以幫助識別離群值 異常觀察值和有影響的觀測量等非常正數(shù)據(jù) 散點圖 可以繪制以下各項中的任意兩種 DEPENDNT 因變量 ZPRED 標(biāo)準(zhǔn)化預(yù)測值 ZRESID 標(biāo)準(zhǔn)化殘差 DRESID 剔除殘差 ADJPRED 調(diào)整的預(yù)測值 SRESID 學(xué)生化的殘差 SDRESID 學(xué)生化的已刪除殘差 針對標(biāo)準(zhǔn)化預(yù)測值繪制標(biāo)準(zhǔn)化殘差 以檢查線性關(guān)系和等方差性 產(chǎn)生所有部分圖 P 選項 輸出每一個自變量的殘差相對于因變量殘差的散點圖 要生成部分圖 方程中必須至少有兩個自變量 標(biāo)準(zhǔn)化殘差圖選項 可以獲取直方圖 輸出帶有正態(tài)曲線的標(biāo)準(zhǔn)化殘差的直方圖 標(biāo)準(zhǔn)化殘差的正態(tài)概率圖 R 即P P圖 檢查殘差的正態(tài)性 7 單擊保存 S 選項彈出保存變量對話框 見圖所示 預(yù)測值 PredictedValues 選項回歸模型對每個個案預(yù)測值 未標(biāo)準(zhǔn)化 U 非標(biāo)準(zhǔn)化 模型為因變量預(yù)測的值 標(biāo)準(zhǔn)化 R 每個預(yù)測值轉(zhuǎn)換為其標(biāo)準(zhǔn)化形式 調(diào)節(jié) J 當(dāng)某觀測量從回歸系數(shù)的計算中排除時 觀測量的預(yù)測值 均值預(yù)測值的S E 預(yù)測值的標(biāo)準(zhǔn)誤 對于自變量具有相同值的觀測量所對應(yīng)的因變量的均值的標(biāo)準(zhǔn)差的估計 殘差未標(biāo)準(zhǔn)化 N 未標(biāo)準(zhǔn)化殘差 因變量的實際值與模型預(yù)測值之間的差 標(biāo)準(zhǔn)化 A 標(biāo)準(zhǔn)化殘差 殘差除以其標(biāo)注差的估計 標(biāo)準(zhǔn)化殘差也稱為Pearson殘差 它的均值為0 標(biāo)準(zhǔn)差為1 學(xué)生化 S 學(xué)生化殘差 殘差除以其隨觀測量變化的標(biāo)準(zhǔn)差的估計 這取決于每個觀測量的自變量值與自變量均值之間的距離 刪除 L 剔除殘差 當(dāng)某個觀測量從回歸系數(shù)的計算中排除時 該觀測量的殘差 是因變量的值和經(jīng)調(diào)整的預(yù)測值之差 學(xué)生化已刪除 E 學(xué)生化剔除差 一個觀測量的剔除殘差除以其標(biāo)準(zhǔn)誤 距離Mahalanobis距離 H 馬哈拉諾比斯距離 簡稱為馬氏距離 是一個測量自變量觀測值中有多少觀測值與所有觀測值均值不同的測度 把馬氏距離數(shù)值大的觀測值視為極端值 Cook距離 K 庫克距離 如果一個特殊的觀察值被排除在回歸系數(shù)的計算之外時 庫克距離用于測量所有觀測量的殘差將會有多大的變化 當(dāng)將庫克距離數(shù)值大的觀測量排除在回歸分析的計算時 會導(dǎo)致回歸系數(shù)發(fā)生根本變化 杠桿值 G 用于度量某個點對回歸擬合的影響 集中的杠桿值范圍為從0 對擬合無影響 到 N 1 N 預(yù)測區(qū)間 PredictionIntervals 均值 M 均值預(yù)測區(qū)間的上下限 單值 I 因變量的單個觀測量的預(yù)測區(qū)間 置信區(qū)間 C 預(yù)測區(qū)間的置信概率 在小框中輸入1 99 99之間的值 預(yù)測區(qū)間 PredictionIntervals 標(biāo)準(zhǔn)化DiFit T 標(biāo)準(zhǔn)化的DiFit值 如果此值大于其臨界值的絕對值 則可以認定此觀測量為影響點 協(xié)方差比率 V 剔除一個影響點的協(xié)方差矩陣與全部觀測量的協(xié)方差矩陣的比率 如果比率接近于1 則說明被排除的觀測量不能顯著改變協(xié)方差矩陣 系數(shù)統(tǒng)計將回歸系數(shù)保存到數(shù)據(jù)集或數(shù)據(jù)文件 可以在同一會話中繼續(xù)使用數(shù)據(jù)集 但不會將其另存為文件 除非在會話結(jié)束前 將其保存為文件 數(shù)據(jù)集名稱必須符合變量名命名規(guī)則 將模型信息輸出到XML文件將參數(shù)估計值及其協(xié)方差導(dǎo)出到指定的XML格式的文件 這里不保存任何值 然后單擊 繼續(xù) 命令返回 實驗結(jié)果 模型匯總 方差分析表 模型系數(shù)表 實驗四多元線性回歸分析 實驗?zāi)康臏?zhǔn)確理解簡單線性回歸分析的方法原理 熟練掌握簡單線性回歸分析的SPSS操作與分析 了解相關(guān)性與回歸分析之間關(guān)系 培養(yǎng)運用簡單線性回歸分析解決實際問題的能力 知識準(zhǔn)備多元線性回歸分析基本原理 1 多元線性回歸模型是指含有多個自變量的線性回歸模型 用于解釋因變量與其它多個自變量之間的線性關(guān)系 線性回歸的一般數(shù)學(xué)模式是 式中因變量Y的變化由兩個部分來解釋 一是由P個自變量x的變化引起的Y變化部分 二是由其他隨機因素引起的Y的變化部分 知識準(zhǔn)備多元線性回歸分析基本原理 2 SPSS線性回歸分析過程作了n次觀測 得到觀測值為 其中 分別為第i次觀測時自變量的取值 為因變量Y的觀測值 知識準(zhǔn)備多元線性回歸分析基本原理 3 回歸分析需要對模型中的未知參數(shù)作出估計 分別稱為回歸常數(shù)和偏回歸系數(shù) 偏回歸系數(shù)表示假設(shè)在其他所有自變量不變的情況下 某一個自變量變化引起的因變量變化的比率 對建立的回歸方程進行回歸系數(shù)顯著性檢驗 即檢驗假設(shè) 即第i個偏回歸系數(shù)與0無顯著差異 檢驗的顯著性統(tǒng)計量為t統(tǒng)計量 知識準(zhǔn)備多元線性回歸分析基本原理 4 多元線性回歸方程顯著性檢驗的零假設(shè)為 檢驗的統(tǒng)計量為F統(tǒng)計量 如果檢驗拒絕H 則認為回歸方程有效 與一元回歸方程相同 在多元回歸中也使用判定系數(shù)來解釋回歸模型中自變量的變異在因變量變異中所占的比率 此時反映的是Y的變異由自變量聯(lián)合解釋的比例 因此 稱為復(fù)判定系數(shù) Multiplecoefficientofdetermination 知識準(zhǔn)備多元線性回歸分析基本原理 4 多元線性回歸方程顯著性檢驗的零假設(shè)為 同時 復(fù)判定系數(shù)的值隨著進入回歸方程的自變量個數(shù)P 或樣本容量的大小 的增加而增大 因此 為了消除自變量個數(shù)以及樣本量的大小對判定系數(shù)的影響 引入了經(jīng)調(diào)整的判定系數(shù) AdjustedRSquare 調(diào)整的判定系數(shù)的公式是 Adjusted其中p為自變量的個數(shù) n為觀測量的數(shù)目 可以看出 自變量個數(shù)大于1時 其值小于判定系數(shù) 自變量個數(shù)越多 與判定系數(shù)的差值越大 多元線性回歸分析基本步驟 實驗三簡單線性回歸分析 實驗內(nèi)容本例使用6 4數(shù)據(jù)文件 建立一個以 初始工資 工作經(jīng)驗 受教育年限 等為自變量 當(dāng)前工資 為因變量的回歸模型 員工工資與工作經(jīng)驗 實驗步驟 1 散點圖直觀地觀察自變量與因變量之間關(guān)系是否有線性特點 1 按 圖形 散點 簡單分布 順序展開 如圖所示的對話框 單擊 定義 出現(xiàn)圖6 4 2簡單散點圖對話框 1 散點圖單擊 定義 出現(xiàn)圖簡單散點圖對話框 2 將變量 初始工資 當(dāng)前工資 依次放入Y軸與X軸 單擊 確定 按鈕 結(jié)果如下圖 生成圖形見圖6 4 3 根據(jù)同樣操作方法 以 當(dāng)前工資 為Y軸 分別以其他幾個自變量為X的散點圖 回歸模型操作 1 按 分析 回歸 線性 順序展開 選擇 當(dāng)前工資 作為因變量進入因變量 D 框中 選擇 初始工資 工作經(jīng)驗 工作時間 受教育年限 變量作為自變量進入自變量 I 框中 在方法 M 框中選擇逐步回歸法作為分析方式 見圖線性回歸主對話框 回歸模型操作 2 單擊統(tǒng)計量 S 按鈕 打開如圖6 4 5對話框 在回歸系數(shù)一欄中選擇估計 E 模型擬合度 M 共線性診斷 L 在殘差一欄中選擇Durbin Watson U 個案診斷中的離群值 O 參數(shù)框中鍵入3 表示設(shè)置觀察量標(biāo)準(zhǔn)差大于等于3 為奇異值 單擊 繼續(xù) 按鈕 返回主對話框 回歸模型操作 3 單擊保存按鈕 打開圖對話框 選擇距離一欄中的Mahalanobis距離 H Cook距離 K 杠桿值 G 選擇影響統(tǒng)計量一欄中的標(biāo)準(zhǔn)化DfBeta Z 標(biāo)準(zhǔn)化DfFit T 協(xié)方差比率 V 用來確定影響點 單擊繼續(xù)按鈕 返回主對話框 回歸模型操作 4 為了從圖形上檢查模型的線性和方差齊性等 做散點圖 單擊繪制 T 按鈕 打開繪圖對話框 將變量ZPRED與ZRESID分別放入X Y框中 標(biāo)準(zhǔn)化殘差圖中選擇直方圖 H 正態(tài)概率圖 R 單擊 繼續(xù) 按鈕 返回主對話框 回歸模型操作 5 在主對話框中 單擊選項 O 按鈕 選擇在等式中包含常量 I 單擊繼續(xù)按鈕 返回主對話框 6 提交系統(tǒng)執(zhí)行結(jié)果 實驗結(jié)果 回歸方程 擬合過程模型匯總 方差分析 回歸系數(shù)分析 已排除的變量 共線性診斷 案例奇異值診斷 殘差統(tǒng)計量 殘差分布直方圖 觀測量累計概率圖 當(dāng)前工資的預(yù)測值與其學(xué)生化殘差散點圖 實驗五曲線估計 實驗?zāi)康臏?zhǔn)確理解曲線回歸的方法原理 熟練掌握曲線估計的SPSS操作與分析 掌握根據(jù)11種曲線模型 選擇建立簡單又適合的模型 掌握利用曲線回歸方程進行預(yù)測 知識準(zhǔn)備非線性模型的基本內(nèi)容 曲線估計問題 即曲線擬合問題 現(xiàn)實中 變量之間的關(guān)系往往不是簡單的線性關(guān)系 而是呈現(xiàn)某種曲線或非線性關(guān)系 此時 選擇適當(dāng)?shù)那€擬合可以更加準(zhǔn)確地反映實際情況 變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系 所謂本質(zhì)線性關(guān)系是指變量形式上雖表現(xiàn)為非線性關(guān)系 但可以通過變量轉(zhuǎn)化方式變換為線性關(guān)系 并可最終進行線性回歸分析 建立線性模型 本質(zhì)非線性關(guān)系是指變量之間不僅形式上為非線性關(guān)系 而且也無法通過轉(zhuǎn)化為線性關(guān)系 PSS的曲線估計 CurveEstimation 就是用來解決這類問題的 它提供了包括線性回歸在內(nèi)的11種不同的曲線估計回歸模型 擬合模型 曲線估計的基本步驟 實驗五曲線估計 實驗內(nèi)容某公司有一種新產(chǎn)品上市 選擇8個地區(qū)做試銷活動 收集了試銷廣告投入與銷量的數(shù)據(jù) 數(shù)據(jù)文件6 5 結(jié)果見表 問廣告投入與銷量之間的關(guān)系 實驗步驟 1 繪制散點圖 選擇 圖形 散點 簡單分布 定義 命令 銷售 變量放入Y軸 廣告投入 放入X軸 按 確定 按鈕得到散點圖 見圖所示 從圖中看出二者的斜率有逐漸減緩的曲線趨勢 因此 選用二次曲線模型 三次曲線模型和對數(shù)曲線模型 2 選擇 分析 回歸 曲線估計 命令 顯示曲線估計對話框 如圖所示 將 銷售 放入因變量框 D 將 廣告投入 放入變量框 如果自變量是時間變量或觀測量序號ID 可以選擇時間 這時曲線估計產(chǎn)生一個時間變量 觀測量之間的時間長度視為均勻的 3 選擇分析變量 在等式中包含常量 D 估計回歸方程式中的常數(shù)項根據(jù)模型繪圖 O 對照自變量繪制因變量的值 每個模型產(chǎn)生一個單獨的曲線 模型 11種常用曲線 此處選中二次項 對數(shù) 立方等選項 線性選項是默認的 顯示ANOVA表格 Y 為每個選定的模式輸出方差分析表 4 保存 A 如圖所示 保存變量 對于每個選定的模型 可以保存預(yù)測值 殘差和預(yù)測區(qū)間 此處三個都選中 預(yù)測個案 在數(shù)據(jù)集中 如果選擇時間而不是變量作為自變量 則可以指定超出時間序列結(jié)尾的預(yù)測期 可以選擇以下選項之一 從估計期到最后一個個案的預(yù)測 L 在估計期內(nèi)的觀測量的基礎(chǔ)上預(yù)測文件中所有觀測量的值 預(yù)測范圍 T 根據(jù)估計期的觀測量 預(yù)測指定日期 時間或觀測號范圍內(nèi)的值 此功能用于預(yù)測超出時間序列中最后一個觀測量的值 實驗結(jié)果 線性模型 對數(shù)模型 二次曲線模型 三次曲線 不同圖形的擬合結(jié)果 數(shù)據(jù)文件中的新變量保存情況 實驗六二項logistic回歸分析 實驗?zāi)康臏?zhǔn)確理解二項logistic回歸分析的方法原理 熟練掌握二項logistic回歸分析的SPSS操作 明確了解二項logistic回歸方程參數(shù)的意義及其解釋 能運用二項logistic回歸分析解決實際問題 知識準(zhǔn)備logistic回歸介紹 一般的回歸模型中 應(yīng)變量為刻度變量 并且理論上要求其服從正態(tài)分布等LINE 線性 獨立 正態(tài) 等方差 假定條件 logistic回歸與它們的主要區(qū)別在于 因變量的類型不同 通過一組解釋變量或自變量 采用logistic回歸 可以預(yù)測一個分類變量每一分類發(fā)生的概率 解釋變量可以使刻度變量或分類變量或兩者的混合 如果解釋變量均為刻度數(shù)據(jù) 則可以采用判別分析等方法進行分析 通常情況下 logistic回歸對預(yù)測變量的假定條件較少 所以logistic回歸更為常用 知識準(zhǔn)備logistic回歸介紹 分類變量可以分為有序變量 序次級 和無序變量 名義級 后者分為二項分類變量和無序多項分類變量兩種情況 如候選人是否會當(dāng)選 二項分類 消費者對某個產(chǎn)品使用滿意程度分為很滿意 一般 不滿意 結(jié)果變量滿意程度為有序分類變量 不同人群將會選擇不同品牌 聯(lián)想 蘋果 戴爾等 的電腦 這里的結(jié)果變量電腦品牌為無序多項分類變量 知識準(zhǔn)備二項logistic回歸模型 令因變量Y服從二項分布 其二項分類的取值分別為0 1 Y 1的總體概率為 Y 1 則K個自變量分別為X1 X2 XK所對應(yīng)的logistic回歸模型為 6 6 1 或 6 6 2 知識準(zhǔn)備二項logistic回歸模型 公式 6 6 1 與公式 6 6 2 可以互相推導(dǎo) 公式 6 6 1 通常被稱為logistic回歸預(yù)測模型 將某一個個體的自變量Xj值 x1 x2 xk 代入公式 6 6 1 在求得回歸系數(shù)估計值的情況下 可以得到該個體概率 Y 1 的預(yù)測值 或稱估計值 即 6 6 3 logistic回歸模型實際上是對概率 Y 1 進行了logit變換后的線性回歸模型 所以通常也稱logistic回歸模型為logit模型 通過logit變換 使0 1范圍取值的 Y 1 變成了 范圍取值的logit值 知識準(zhǔn)備二項logistic回歸方程參數(shù)的意義及其解釋 在一般線性回歸模型中 通過普通最小二乘法求解回歸系數(shù) 在二項分類logistic回歸模型中 通過最大似然估計法求解回歸參數(shù) 為了理解二項分類logistic回歸模型參數(shù)的意義 需要先理解優(yōu)勢 Odds 與優(yōu)勢比 OddsRations 的概念 一個事件的優(yōu)勢被定義為它發(fā)生的可能性與不發(fā)生的可能性之比 例如 拋一枚硬幣后 其正面向上的優(yōu)勢為0 5 0 5 1 從52張橋牌中抽出一張A的優(yōu)勢為 4 52 48 52 1 12 這里不要把優(yōu)勢的含義與概率混淆 其概率值為4 52 1 13 兩者的關(guān)系可以用簡單的公式來表示 如果事件概率為 二項分類變量的非事件概率為1 表示 優(yōu)勢用表示 則有優(yōu)勢 6 6 4 知識準(zhǔn)備二項logistic回歸方程參數(shù)的意義及其解釋 由公式 5 6 2 和公式 5 6 4 可得 6 6 5 根據(jù)公式 6 6 5 回歸系數(shù)bj j 1 2 K 表示在其他自變量固定不變的情況下 某一個自變量Xj改變一個單位 或?qū)?shù)優(yōu)勢的平均改變量 在實際應(yīng)用中 logistic回歸不是直接用回歸系數(shù)來解釋 而是解釋優(yōu)勢比 優(yōu)勢比被用來作為衡量效應(yīng)大小的指標(biāo) 度量某自變量對因變量優(yōu)勢影響程度的大小 某一個自變量Xj對應(yīng)的優(yōu)勢比為 6 6 6 知識準(zhǔn)備二項logistic回歸方程參數(shù)的意義及其解釋 將公式 5 6 5 等號兩邊同時取以自然對數(shù)e為底的指數(shù) 有 6 6 7 優(yōu)勢比的含義是在其他自變量固定不變的情況下 某一自變量Xj改變一個單位 因變量對應(yīng)的優(yōu)勢比平均改變exp bj 個單位 如X1從一個任意實數(shù) 變?yōu)?1 則 6 6 8 所以 當(dāng)一個自變量的系數(shù)為正值 它意味著優(yōu)勢比將會增加 此值會大于1 當(dāng)系數(shù)為0時 此值等于1 如果系數(shù)為負值 它意味著優(yōu)勢比將會減少 此值將會小于1 單因素方差分析基本步驟 對于較大樣本的系數(shù)的檢驗 使用基于卡方分布的Wald統(tǒng)計量 Wald統(tǒng)計量也有弱點 當(dāng)回歸系數(shù)的絕對值開始變大時 其標(biāo)準(zhǔn)誤的值將發(fā)生更大的改變 這樣Wald統(tǒng)計量的值開始變得很小 將導(dǎo)致拒絕回歸系數(shù)的零假設(shè) 即認為變量的回歸系數(shù)為零 因此 當(dāng)變量的系數(shù)很大時 就不要依據(jù)Wald統(tǒng)計量 應(yīng)建立兩個包含與不包含藥檢測的變量的模型 利用對數(shù)似然比的變化值進行建設(shè)檢驗 可以選擇BackwardLR方式作為變量的選擇方法 單一樣本t檢驗基本原理和步驟 判別模型與樣本之間的 想象度 是判別模型好壞的方法之一 在SPSS的 Modelsummary 輸出結(jié)果中 給出了Coxan

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論