元線性回歸模型.ppt_第1頁
元線性回歸模型.ppt_第2頁
元線性回歸模型.ppt_第3頁
元線性回歸模型.ppt_第4頁
元線性回歸模型.ppt_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

變量的測度等級 科學研究中 用變量來量化概念 但不同概念能夠被量化的程度有所不同 這種量化程度在統(tǒng)計學中稱為變量的測度等級 MeasurementLevel 變量的測度等級通常劃分為四種 名義 Norminal 測度次序 Ordinal 測度間距 Interval 測度比率 Ratio 測度 1 名義測度 最低等級的測度 也稱定名測度它只代表類型的編碼 而這些編碼的數(shù)值只是一個符號 數(shù)值之間不存在有意義的量的關系性別 女 1 1 A F男 0 2 B M企業(yè)類型 國企v s私企 2 次序測度 其量化水平高于名義測度 即其包含的信息量大于名義測度等級的變量變量編碼不僅具有分類功能 也存在量的關系溫度 低 中 高123雖然可以用2 4 6分別表示溫度的低 中和高 但不可以隨意調(diào)換各類在序列中的位置 即類別之間是有次序和方向的 3 間距測度 是采用一定單位的實際測量值兩個間距測度變量的差與和都具有數(shù)量意義 而前面兩類測度等級不具有這一性質(zhì)兩個間距測度變量不能進行乘除運算 因為這一測度等級的變量所取的0值不是物理意義上的絕對0值不能說10攝氏度是5攝氏度的2倍 4 比率測度 最高等級的測度其0值是非人為制定的K溫度中的0度 絕對0度兩個比率測度等級的變量的比值是有意義的 5 小結(jié) 前兩種 分類變量后兩種 連續(xù) 測量型 變量測度等級越高 變量所包含的信息越多較高測度等級的變量可以降級使用 在統(tǒng)計分析中經(jīng)常采用降級使用常見的降級使用方式 1 次序測度變量作為名義測度變量使用2 比率測度變量作為間距測度變量使用3 間距測度變量作為名義測度變量使用 6 現(xiàn)代社會科學研究三要素 理論 管理學的各種理論觀察 為研究取得客觀實際材料的過程 包括應用試驗方法 調(diào)查方法等統(tǒng)計 1 對觀測數(shù)據(jù)進行統(tǒng)計描述 統(tǒng)計描述 2 對多個變量之間的關系進行定量分析 統(tǒng)計推斷 3 對理論進行實踐檢驗的一個工具 7 統(tǒng)計在社會科學中的定位 對于社會科學 包括管理學 而言 統(tǒng)計僅僅是分析問題和研究問題的一個工具 它不僅需要專業(yè)理論的指導 也需要研究方法論的指導 因此 你們的目標是要在管理學的理論上有所創(chuàng)新 然后用統(tǒng)計方法驗證你們的理論但是 對現(xiàn)代社會科學而言 統(tǒng)計是越來越重要的 不可缺少的語言和工具 8 統(tǒng)計研究中的常見謬誤 混淆統(tǒng)計聯(lián)系與因果關系事后解釋謬誤生態(tài)學謬誤還原論謬誤混淆統(tǒng)計檢驗顯著與實際意義顯著 9 幾個問題 學了幾個學期的數(shù)學和概率統(tǒng)計 一元正態(tài)分布 多元正態(tài)分布 向量和矩陣 線性回歸 一元方差分析 10 關于回歸http en wikipedia org wiki Regression analysis 起源于19世紀生物學家F 高爾頓進行的遺傳學研究發(fā)現(xiàn)下一代人身高有回歸同時代人類平均身高的趨勢K 皮爾遜又用觀察數(shù)據(jù)證實了這一現(xiàn)象回歸分析的核心方法 最小二乘法 早在18世紀就已經(jīng)被高斯應用于行星軌道的測定在應用統(tǒng)計中 90 的問題都可以用回歸 包括各種回歸模型 來解決 11 多元回歸分析是分析一個隨機變量和多個變量之間線性關系的最常用的統(tǒng)計方法 如銷售量與價格和廣告費的關系變量分為兩類 因變量和自變量因變量必須為連續(xù)變量 自變量可以是連續(xù)的也可以是分類變量 或者是兩者的混合只有一個自變量時 稱為一元線性回歸模型 12 變量的關系和回歸的任務 變量的關系可以分為兩類 1 確定的函數(shù)關系 如2 統(tǒng)計相關關系 我們可以把握這種關系的一個總體趨勢 但是不能得到一個確定的關系表達式 因為這個關系受到一些我們無法得知的隨機因素的影響 如體重和身高的關系 回歸分析就是要尋找在給定自變量的條件下因變量的概率分布 從而用一種確定的函數(shù)關系近似描述因變量和自變量的不確定關系 13 一元線性回歸模型 只有一個自變量的回歸稱為一元 簡單 回歸一般地 我們用大寫字母表示總體參數(shù) 用小寫字母表示樣本統(tǒng)計量一元線性回歸的數(shù)學表達式 其中為因變量 為自變量 為未知參數(shù) 是隨機誤差項 線性 是指模型關于參數(shù)是線性的 14 例1 表2 1列出了我國分地區(qū)家庭年人均食品支出與人均收入的數(shù)據(jù) 我們感興趣的是人均食品支出與他們的人均收入的關系 因此設食品支出為因變量 人均收入為自變量 由圖2 1可知與有較好的線性關系 因此我們假設在總體中他們滿足線性關系式 1 15 圖2 1我國分地區(qū)城鎮(zhèn)居民年人均食品支出和人均收入散點圖 16 將表2 1數(shù)據(jù)帶入方程 1 中 則有上式中為樣本隨機誤差回歸的任務 希望得到能夠?qū)τ^測數(shù)據(jù)擬合最優(yōu)的回歸方程估計上式稱為對的回歸方程 17 最小二乘法 OLS 稱為的擬合值 它是在給定條件下的條件均值的估計誤差平方和最小二乘法 求未知參數(shù)使得上面的誤差平方和最小 求得的即為未知總體參數(shù)的最小二乘估計 18 對誤差平方和關于求導數(shù) 并令其等于0 求關于的聯(lián)立方程組 得到其中表示因變量的均值 的定義類似由表2 1的數(shù)據(jù)算得于是得到擬合2 1散點圖的回歸直線 19 SPSS操作 20 圖7 2 LinearRegression 對話框 一 圖7 3 LinearRegression Statistics 對話框 圖7 4 LinearRegression Plots 對話框 圖7 5 LinearRegression Save 對話框 圖7 6 LinearRegression Options 對話框 一元回歸系數(shù)的意義 在回歸模型 2 式中 稱為回歸直線的系數(shù)是直線在軸上的截距 代表的基礎水平 即自變量取0時因變量的水平是直線的斜率 表示變化一個單位時 的平均變化在例1中 斜率為0 42 即人均收入每上升1元 人均食品支出平均上升0 42元 26 變量變換 當因變量與自變量的關系是非線性時 可以通過變量變換使經(jīng)過變換的新變量對于參數(shù)是線性的 然后基于變換后的變量建立線性回歸模型 基于變換后的數(shù)據(jù)用最小二乘法求得未知參數(shù)的估計對于呈非線性相關的變量 通常根據(jù)觀察數(shù)據(jù)的分布形狀 采用不同的曲線擬合散點 最后選擇擬合精度最高的曲線作為擬合曲線常用的擬合曲線和變量變換如表2 3所示 27 模型的假設條件 高斯假設條件 對總體中各次觀察的隨機誤差滿足如下4個條件 a 零均值性 即在自變量取一定值的條件下 總體誤差項的條件均值為0 b 等方差性 即在自變量取一定值的條件下 總體誤差項的條件方差為一正常數(shù) c 誤差項之間的相互獨立性 即在自變量取任意不同值時 相應的誤差項之間相互獨立 d 誤差項與變量之間相互獨立性 即自變量的變化與誤差項無關 28 符合上述假設條件的回歸模型稱為一般線性回歸模型對于一般線性回歸模型 最小二乘估計分別是總體參數(shù)的無偏估計如果我們的目的只是求未知參數(shù)的點估計 符合上述假設的一般線性回歸模型也就足夠了如果還需估計總體參數(shù)的置信區(qū)間 或者需要做假設檢驗 則需考慮總體誤差項的概率分布 29 正態(tài)誤差假定 在高斯假設條件的基礎上 假設隨機誤差項服從正態(tài)分布 則 定義的線性模型稱為正態(tài)誤差模型基于高斯假設 可知 個隨機變量相互獨立且服從同一正態(tài)分布樣本統(tǒng)計量也都是服從正態(tài)分布的隨機變量 30 假設誤差項服從正態(tài)分布的合理性 a 中心極限定理 b 由于模型參數(shù)的檢驗以分布為基礎 誤差項如果稍微偏離正態(tài)分布 對參數(shù)檢驗的影響也不會很大 統(tǒng)計上稱為 穩(wěn)健性 線性回歸大都采用正態(tài)分布的標準假定 但并不是所有的數(shù)據(jù)都符合這個假定 31 總體方差的估計 在高斯假設和正態(tài)誤差假設成立的條件下 我們用樣本擬合誤差均方和作為的估計 即是誤差方差的無偏估計稱為誤差標準誤 可以用它作為的估計 32 未知參數(shù)和的標準誤及區(qū)間估計 用代替 即能根據(jù)相應公式得到總體參數(shù)和的標準差和的估計 他們分別稱為的標準誤 通過它們可以完成對總體參數(shù)的區(qū)間估計總體參數(shù)及其對應的樣本估計參見表2 4如果實際情況不符合高斯假設條件或正態(tài)分布假設條件 便

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論