第八講 相關(guān)分析和回歸分析_第1頁
第八講 相關(guān)分析和回歸分析_第2頁
第八講 相關(guān)分析和回歸分析_第3頁
第八講 相關(guān)分析和回歸分析_第4頁
第八講 相關(guān)分析和回歸分析_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八講

相關(guān)與回歸分析

10/24/20231一種強(qiáng)有力的基于數(shù)據(jù)的預(yù)測(cè)模型工具建立反映一個(gè)變量的變化與其他相關(guān)變量變化的具體公式線性回歸

LinearProgramming10/24/20232問題的引出10/24/20233案例1:研究考試成績(jī)與復(fù)習(xí)時(shí)間的關(guān)系

你希望自己的應(yīng)用統(tǒng)計(jì)考多少分?

需要花多少時(shí)間復(fù)習(xí)?10/24/20234案例2:為了確定周末版報(bào)紙的日發(fā)行量某大型報(bào)業(yè)公司想發(fā)行周末版,但在作出決定之前,必須確定周末版的日發(fā)行量,這個(gè)報(bào)紙當(dāng)前在三個(gè)城市的日?qǐng)?bào)日發(fā)行量分別為:200,000、400,000和600,000份,為了預(yù)測(cè)該報(bào)紙周末版的日發(fā)行量,該公司的市場(chǎng)部收集了本國35個(gè)報(bào)紙的日?qǐng)?bào)日發(fā)行量與其周末版的日發(fā)行量的數(shù)據(jù)

10/24/20235案例3:分析影響信用卡支付傾向因素CONSUMERRESEARCH是一家專門從事社會(huì)調(diào)查和咨詢服務(wù)的研究機(jī)構(gòu),能夠?yàn)楦鱾€(gè)用戶提供消費(fèi)者態(tài)度和行為方面的資料。在該機(jī)構(gòu)最近組織的有關(guān)消費(fèi)者使用信用卡支付傾向的調(diào)查資料中,希望分析年收入、家庭成員和年信用卡支付金額的關(guān)系。

10/24/20236教學(xué)目的和要求■通過本講學(xué)習(xí),學(xué)生應(yīng)該熟練掌握簡(jiǎn)單相關(guān)和回歸分析方法的基本概念,基本步驟和應(yīng)用,對(duì)多元相關(guān)和回歸分析方法有一個(gè)初步的了解。

10/24/20237本講內(nèi)容★相關(guān)和回歸分析的基本概念★兩變量間線性關(guān)系的測(cè)度★簡(jiǎn)單線性回歸分析模型及其估計(jì)步驟系數(shù)的檢驗(yàn)?zāi)P托Ч脑u(píng)價(jià)模型的應(yīng)用★多元相關(guān)和回歸分析★應(yīng)注意的幾個(gè)問題

10/24/20238相關(guān)和回歸分析的基本概念?函數(shù)關(guān)系和相關(guān)關(guān)系?線性關(guān)系和非線性關(guān)系?相關(guān)分析的目的?回歸分析的目的

10/24/20239函數(shù)關(guān)系和相關(guān)關(guān)系●函數(shù)關(guān)系:兩變量的數(shù)量表現(xiàn)在一定條件下是完全確定的?!裣嚓P(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):兩變量的數(shù)量表現(xiàn)盡管存在著密切關(guān)系,但卻不是完全確定的。

10/24/202310相關(guān)關(guān)系的種類按涉及變量的多少可分簡(jiǎn)單相關(guān)關(guān)系(一個(gè)自變量和一個(gè)因變量)多元相關(guān)關(guān)系(多元相關(guān)關(guān)系:一個(gè)因變量和多個(gè)自變量)按兩變量關(guān)系在圖形上的形態(tài)可分線性相關(guān)非線性相關(guān)按兩變量變動(dòng)的方向可分正相關(guān)負(fù)相關(guān)10/24/202311分析相關(guān)關(guān)系的定量方法10/24/202312相關(guān)分析和回歸分析的目的

相關(guān)分析的目的描述變量間相關(guān)分析的密切程度回歸分析的目的在因變量和自變量之間建立一個(gè)數(shù)學(xué)模型,根據(jù)這個(gè)模型描述因變量如何隨自變量的變化而變化。是因果關(guān)系嗎?請(qǐng)思考10/24/202313相關(guān)分析(相關(guān)關(guān)系的測(cè)度)散點(diǎn)圖協(xié)方差相關(guān)系數(shù)10/24/202314散點(diǎn)圖10/24/20231535家報(bào)紙的日?qǐng)?bào)日發(fā)行量與其周末版的日發(fā)行量的散點(diǎn)圖10/24/202316協(xié)方差定義(教材243頁)描述兩變量間協(xié)變關(guān)系密切程度的一個(gè)量數(shù)公式作用缺點(diǎn)10/24/202317相關(guān)系數(shù)(教材248頁)定義公式取值范圍10/24/202318相關(guān)系數(shù)絕對(duì)值的含義r10/24/202319相關(guān)系數(shù)的顯著性檢驗(yàn)BySPSS10/24/202320回歸(Regression)的由來回歸(Regression)一詞始于英國統(tǒng)計(jì)學(xué)家S.F.Galton。他和他的學(xué)生,英國著名統(tǒng)計(jì)學(xué)家K.Pearson研究了兒子身高Y與父母平均身高X之間的關(guān)系。他們收集了1078對(duì)夫婦和兒子(每對(duì)夫婦只取一個(gè)兒子)的身高,并用一條直線描述Y與X之間的關(guān)系。常識(shí)告訴我們,若父母平均身高較高,其子身高也應(yīng)該較高。反過來若父母平均身高較矮,其子身高也應(yīng)該矮。但是Galton的研究發(fā)現(xiàn),如果雙親屬于高個(gè)類(高于這1078對(duì)夫婦的平均身高),其子比他們?cè)俑叩母怕示捅容^小,即兒子有較大概率比雙親個(gè)子矮。反過來,如果雙親個(gè)子矮,其子以較大概率比雙親個(gè)子高。所以,平均身高偏高或偏矮的夫婦,其子的身高都有“向中心回歸”的現(xiàn)象。基于這個(gè)事實(shí),Galton把他們所求出的描述兒子與雙親身高關(guān)系的直線叫做回歸直線。雖然“回歸”這種現(xiàn)象并無普遍性,但歷史上就一直沿用了這個(gè)術(shù)語。10/24/202321簡(jiǎn)單線性回歸分析模型及其估計(jì)步驟系數(shù)的檢驗(yàn)?zāi)P托Ч脑u(píng)價(jià)模型的應(yīng)用10/24/202322簡(jiǎn)單線性回歸模型及估計(jì)簡(jiǎn)單線性回歸模型及方程簡(jiǎn)單線性回歸方程參數(shù)的估計(jì)步驟

簡(jiǎn)單線性回歸方程參數(shù)的估計(jì)方法普通最小二乘法10/24/202323簡(jiǎn)單線性回歸模型(總體)因變量自變量參數(shù)隨機(jī)誤差10/24/202324總體線性回歸模型的圖示YX實(shí)際觀察值實(shí)際觀察值10/24/202325總體線性回歸模型總體線性回歸方程10/24/202326樣本線性回歸方程10/24/202327建立線性回歸模型的步驟確定研究的問題定性和定量分析相結(jié)合,正確選擇變量搜取樣本資料(數(shù)據(jù)資料)設(shè)樣本回歸方程(如:)估計(jì)未知參數(shù)(計(jì)算統(tǒng)計(jì)量)得到樣本回歸方程檢驗(yàn)回歸方程用模型預(yù)測(cè)因變量10/24/202328擬合樣本線性回歸方程的方法(P250)----最小二乘法實(shí)際觀察值與樣本回歸線上的點(diǎn)的距離的平方和最小XYe1e2e3e4最小10/24/202329樣本回歸系數(shù)的計(jì)算公式回歸系數(shù)的含義10/24/202330回歸系數(shù)計(jì)算公式(教材251頁)首先計(jì)算兩個(gè)數(shù)值:再計(jì)算兩個(gè)回歸系數(shù)10/24/202331LinearRegressionModelTodemonstratethis,wewillexaminetherelationshipbetween:hoursofstudyforanexamthescoreonthatexamThequestionis:isthenumberofhoursofstudyagoodpredictoroftheexamscore?exampleone:10/24/202332LinearRegressionModelThescoresfor20randomlyselectedstudentsare:10/24/202333ScatterplotNoticethattheY-axishasbeenadjustedtoshowjustscoresbetween50and10010/24/202334ScatterplotItappearsthatastraightlinecanreasonably“fit”thesedata10/24/202335案例2:10/24/202336散點(diǎn)圖10/24/202337判斷回歸模型擬合優(yōu)良的指標(biāo)可決系數(shù)10/24/202338總變差,已解釋變差,未解釋變差的關(guān)系YiYXi總變差未解釋變差已解釋變差=+SSTSSESSR=+10/24/202339可決系數(shù)定義:已解釋變差與總變差的比值,在估計(jì)Yi時(shí),在總變差中可被X解釋的比率,它越大,說名Y與X的關(guān)系越密切,回歸模型效果好公式:10/24/202340案例1的可決系數(shù)和相關(guān)系數(shù)10/24/202341案例2的可決系數(shù)和相關(guān)系數(shù)10/24/202342相關(guān)系數(shù):

可決系數(shù)的平方根10/24/202343相關(guān)系數(shù)和可決系數(shù)的關(guān)系共同點(diǎn)不同點(diǎn)10/24/202344案例1的可決系數(shù)和相關(guān)系數(shù)10/24/202345案例2的可決系數(shù)和相關(guān)系數(shù)10/24/202346估計(jì)標(biāo)準(zhǔn)誤(度量模型效果的指標(biāo)之一)

(衡量y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論