




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第7章相關(guān)與回歸分析1第7章相關(guān)與回歸分析12第一節(jié)
數(shù)據(jù)的相關(guān)分析2第一節(jié)數(shù)據(jù)的相關(guān)分析(一)雙變量相關(guān)關(guān)系的含義3一、雙變量相關(guān)關(guān)系的含義和種類函數(shù)關(guān)系相關(guān)關(guān)系現(xiàn)象之間確定性的數(shù)量依存關(guān)系現(xiàn)象之間非確定性的數(shù)量依存關(guān)系(一)雙變量相關(guān)關(guān)系的含義3一、雙變量相關(guān)關(guān)系的含義和種類函(二)雙變量相關(guān)關(guān)系的種類4一、雙變量相關(guān)關(guān)系的含義和種類相關(guān)關(guān)系的種類相關(guān)方向正相關(guān)和負相關(guān)相關(guān)形式線性相關(guān)和非線性相關(guān)相關(guān)程度完全相關(guān)、不完全相關(guān)和不相關(guān)(二)雙變量相關(guān)關(guān)系的種類4一、雙變量相關(guān)關(guān)系的含義和種類相【例7-1】歌樂音響設(shè)備商店于2014年7~9三個月份中,連續(xù)10周使用了周末電視廣告來提高商店的銷售額。商店經(jīng)理想調(diào)查這段時間內(nèi)播出的廣告次數(shù)和店內(nèi)銷售額之間是否存在某種關(guān)系。
問題:如果該經(jīng)理將這項工作交給你,你該怎樣做呢?5二、雙變量相關(guān)關(guān)系的測度方法【例7-1】歌樂音響設(shè)備商店于2014年7~9三(一)相關(guān)表法1.編制原始數(shù)據(jù)表如下表
7-1立體聲音響設(shè)備商店的原始數(shù)據(jù)
6二、雙變量相關(guān)關(guān)系的測度方法周次廣告次數(shù)下一周銷售額(百元)1234567891011251341534250574154543863485946(一)相關(guān)表法6二、雙變量相關(guān)關(guān)系的測度方法周次廣告次數(shù)下一2.將原始數(shù)據(jù)表編制成相關(guān)表
表7-2立體聲音響設(shè)備商店的廣告次數(shù)與銷售額相關(guān)表7二、雙變量相關(guān)關(guān)系的測度方法廣告次數(shù)銷售額(百元)11223344553841465048545459632.將原始數(shù)據(jù)表編制成相關(guān)表7二、雙變量相關(guān)關(guān)(二)相關(guān)圖法8二、雙變量相關(guān)關(guān)系的測度方法圖7-1立體聲音響設(shè)備商店數(shù)據(jù)散點圖(二)相關(guān)圖法8二、雙變量相關(guān)關(guān)系的測度方法圖7-1(三)相關(guān)系數(shù)法相關(guān)系數(shù)是用以衡量兩變量間線性相關(guān)關(guān)系情況下,相關(guān)方向和密切程度的相對數(shù)。9二、雙變量相關(guān)關(guān)系的測度方法(三)相關(guān)系數(shù)法9二、雙變量相關(guān)關(guān)系的測度方法1.相關(guān)系數(shù)的計算
樣本相關(guān)系數(shù)的定義公式10二、雙變量相關(guān)關(guān)系的測度方法(7.1)1.相關(guān)系數(shù)的計算10二、雙變量相關(guān)關(guān)系的測度方法(7.1)1111樣本數(shù)據(jù)的簡捷公式12總體數(shù)據(jù)的相關(guān)系數(shù)樣本數(shù)據(jù)的簡捷公式12總體數(shù)據(jù)的相關(guān)系數(shù)[7-2]
根據(jù)表7-2相關(guān)數(shù)據(jù),利用樣本數(shù)據(jù)計算相關(guān)系數(shù)。13[7-2]根據(jù)表7-2相關(guān)數(shù)據(jù),利用樣本數(shù)據(jù)計算相關(guān)系數(shù)。2.相關(guān)系數(shù)的應用a.相關(guān)系數(shù)的取值范圍的取值在-1和1之間,即b.正負相關(guān)的判斷
當>0時為正相關(guān);當<0時為負相關(guān)。142.相關(guān)系數(shù)的應用14c.相關(guān)密切程度的判斷
當時,相關(guān)關(guān)系越密切,當
說明X與Y之間完全相關(guān),即函數(shù)關(guān)系;當時,相關(guān)關(guān)系越不密切,當=0,說明X與Y之間不存在直線相關(guān)關(guān)系,但也許存在非線性相關(guān)關(guān)系。
15c.相關(guān)密切程度的判斷15在做具體判斷時,有幾個數(shù)量標準:
,稱為微弱相關(guān)。一般情況下,將其視為沒有線性相關(guān)關(guān)系;
0.3≤
,稱為低度相關(guān);0.5≤
,稱為顯著相關(guān);
0.8≤
,稱為高度相關(guān)。
16在做具體判斷時,有幾個數(shù)量標準:16
計算結(jié)果表明,歌樂立體音響設(shè)備商店在過去10周內(nèi),周末所做的廣告次數(shù)與下一周的銷售額之間存在著高度線性正相關(guān)關(guān)系。17對上面計算結(jié)果的統(tǒng)計分析計算結(jié)果表明,歌樂立體音響設(shè)備商店在過去10周內(nèi)18第二節(jié)簡單線性回歸模型
18第二節(jié)簡單線性回歸模型
只涉及兩個變量(一個自變量和一個因變量)之間關(guān)系的回歸分析稱為簡單回歸分析。兩個變量之間的關(guān)系大約呈一條直線的簡單回歸分析稱為簡單線性回歸分析。19只涉及兩個變量(一個自變量和一個因變量)之間用回歸分析可以預測運行一條商業(yè)航空線的成本嗎?如果可以,那么哪些變量與這一成本有關(guān)呢?20一、從一個實際問題入手用回歸分析可以預測運行一條商業(yè)航空線的成本嗎21飛機運行成本飛機型號飛行距離乘客數(shù)量行李或貨物重量天氣狀況……21飛機運行成本飛機型號飛行距離乘客數(shù)量行李或貨物重量天氣狀為了減少自變量個數(shù),我們做如下假定:飛機類別——波音737飛機飛行距離——500公里航線——可比,而且在每年的相同季節(jié)在這種條件下,可以用乘客數(shù)來預測飛行的成本嗎?22為了減少自變量個數(shù),我們做如下假定:22
表7-3是每年相同季節(jié)波音737飛機在12條500公里的不同航線不同乘客數(shù)時的飛行成本。我們用這些數(shù)據(jù)以乘客數(shù)作為自變量構(gòu)造模型來預測成本。
23表7-3是每年相同季節(jié)波音737飛機在12條2424(7.4)
25二、回歸模型和回歸方程:因變量(隨機變量)
:自變量(給定變量)
:參數(shù)
:誤差項(隨機變量),含義為說明在中不能被和之間線性關(guān)系解釋的變異性。
(7.4)25二、回歸模型和回歸方程:因變量(隨機變量)
在有關(guān)假設(shè)中,有一個假設(shè)就是的期望值或均值等于0,即
26(7.5)
如果簡單線性回歸模型滿足了這個條件,那么就意味著的均值或期望值就是一個線性函數(shù)。
描述的均值與的關(guān)系如何的方程稱為回歸方程。
在有關(guān)假設(shè)中,有一個假設(shè)就是的期望值或均值等于0在簡單線性回歸中
1.回歸方程的圖形是一條直線(如圖7.3所示);
27(7.6)
在簡單線性回歸中27(7.6)28283.:斜率(回歸系數(shù));
292.:的截距;
的含義:當自變量給定一個具體變動值時,因變量平均變化的量。3.:斜率(回歸系數(shù));292.:30303131
估計回歸方程
就是用樣本統(tǒng)計量作為參數(shù)的估計值所建立的回歸方程。
32三、估計回歸方程
(7.7)
:的估計值:的估計值
:的估計值
估計回歸方程就是用樣本統(tǒng)計量作為參數(shù)的估計值所3333
最小平方法,也稱最小二乘法,是將回歸模型的方差之和最小化,以得到一系列方程,從這些方程中解出模型中需要的參數(shù)的一種方法。
34四、最小平方法
最小平方法,也稱最小二乘法,是將回歸模型的方差之和最(一)畫散點圖,以初步觀察成本與乘客數(shù)量之間是否呈回歸直線。
35(一)畫散點圖,以初步觀察成本與乘客數(shù)量之間是否呈回歸直線。(二)建立估計回歸方程36(7.8)
最小平方法運用樣本數(shù)據(jù)求出和的值,使得因變量的實際觀察值與其估計值之差的平方和最小,即(7.9)
(二)建立估計回歸方程36(7.8)最小(三)估計回歸方程斜率和截距的計算公式37(7.11)(三)估計回歸方程斜率和截距的計算公式37(7.11)38383939404041
(四)將和的計算結(jié)果代入式(7.8)有:
計算結(jié)果表明,在其他條件相同情況下,12條航線上波音737飛機各條航線每次飛行時每增加1名乘客,將會使飛行成本平均增加40.70元。
結(jié)論:41(四)將和的計算結(jié)果代入式(7.8)有:42**Y=4.48千元二者差0.061千元或61元。42**Y=4.48千元二者差0.061千元或61元。測定系數(shù)估計標準誤差43五、一元線性回歸方程的評價測定系數(shù)43五、一元線性回歸方程的評價(一)測定系數(shù)
回歸直線與各觀測數(shù)據(jù)的接近程度稱為回歸直線的擬合優(yōu)度。
度量回歸直線的擬合優(yōu)度最常用的指標是測定系數(shù),(又稱可決系數(shù)、判定系數(shù))。該指標是建立在對總離差平方和進行分解的基礎(chǔ)之上的。
44(一)測定系數(shù)4445離差分解圖xyy{}}
離差分解圖45離差分解圖xyy{}}離差分解圖兩端平方后求和有46離差平方和的分解總離差平方和(SST){回歸平方和(SSR){殘差平方和(SSE){(7.12)(7.13)(7.14)兩端平方后求和有46離差平方和的分解總離差平方和{回歸平方和R2的取值范圍是[0,1]。R2越接近于1,表明回歸平方和占總離差平方和的比例越大,回歸直線與各觀測點越接近,回歸直線的擬合程度就越好。在一元線性回歸中,相關(guān)系數(shù)r的平方等于判定系數(shù),符號與自變量x的系數(shù)一致。因此可以根據(jù)回歸結(jié)果求出相關(guān)系數(shù)。
47決定系數(shù)的取值R2的取值范圍是[0,1]。47決定系數(shù)的1.殘差
殘差是因變量的觀察值y和因變量的估計值之間的偏差。48
例如,上面的例子,
(7.15)1.殘差48例如,上面的例子,(7.15)49表7-5殘差計算表
49表7-5殘差計算表
殘差平方的總和稱為誤差平方和(SSE)。
502.誤差平方和
(7.16)
SSE的值是用估計回歸方程估計樣本中因變量的值時所產(chǎn)生誤差的一種測度。
殘差平方的總和稱為誤差平方和(SSE)。502.誤差
因變量的值與其均值之間離差的平方和稱為總離差平方和(SST)。513.總離差平方和
(7.17)
因變量的值與其均值之間離差的平方和稱為總離差平方
因變量的值與其估計值之間離差的平方和稱為回歸平方和(SSR)。
524.回歸平方和
(7.18)
因變量的值與其估計值之間離差的平方和稱為回歸平方和表7-6
計算表
53例如;飛行成本案例中各種有關(guān)數(shù)據(jù)計算如下表7-6計算表53由表7-6計算結(jié)果可知,SSE=0.31434,SSR=2.79775,SST=3.11209,則
54由表7-6計算結(jié)果可知,54
這就是說,在一條商業(yè)航線上一架波音737飛機飛行成本的方差中有89.9%可以被乘客數(shù)目說明或預測,換句話說,飛行成本Y的方差中不能由X或回歸方程解釋的有10.1%。
55這就是說,在一條商業(yè)航線上一架波音737飛機飛行成
估計標準誤:是對各觀測數(shù)據(jù)在回歸直線周圍分散程度的一個度量值,它是對誤差項ε的標準差σ的估計。估計標準誤反映了用估計的回歸方程擬合因變量Y時平均誤差的大小。各觀測數(shù)據(jù)越靠近回歸直線,sy就越小,回歸直線對各觀測數(shù)據(jù)的代表性就越好。與R2不同的是,估計標準誤是一個有單位的平均數(shù)。56(二)估計標準誤(7.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中考英語模刷題擬試卷(含答案)
- 電力電纜敷設(shè)施工方案
- 別墅裝修保潔合同范例
- 代理酒類合同范本
- 個人租房合同范例乙方版本
- 物流行業(yè)安全運輸監(jiān)管方案計劃
- 師生互動提升計劃
- 親子溝通與情感交流計劃
- 中學教育教學創(chuàng)新計劃
- 《貴州新仁新能源科技有限公司貴州省六枝特區(qū)大壩螢石礦(新建)礦產(chǎn)資源綠色開發(fā)利用方案(三合一)》評審意見
- 【杜邦分析法下鹽津鋪子公司(2018-2022)盈利能力分析10000字(論文)】
- 《飯店服務與管理》認識飯店的“神經(jīng)中樞”
- GB/T 15856.5-2023六角凸緣自鉆自攻螺釘
- 電子產(chǎn)品質(zhì)量工程技術(shù)與管理高職PPT全套完整教學課件
- 【橡膠工藝】-橡膠履帶規(guī)格
- 小學勞動技術(shù)云教三年級下冊植物栽培種植小蔥(省一等獎)
- 2020年環(huán)境法律法規(guī)及其它要求清單
- 綜采工作面主要設(shè)備選型設(shè)計方案
- 籍貫對照表完整版
- GB/T 7251.3-2017低壓成套開關(guān)設(shè)備和控制設(shè)備第3部分:由一般人員操作的配電板(DBO)
- GB/T 22576.7-2021醫(yī)學實驗室質(zhì)量和能力的要求第7部分:輸血醫(yī)學領(lǐng)域的要求
評論
0/150
提交評論