藍(lán)色簡約統(tǒng)計學(xué)回歸分析課件_第1頁
藍(lán)色簡約統(tǒng)計學(xué)回歸分析課件_第2頁
藍(lán)色簡約統(tǒng)計學(xué)回歸分析課件_第3頁
藍(lán)色簡約統(tǒng)計學(xué)回歸分析課件_第4頁
藍(lán)色簡約統(tǒng)計學(xué)回歸分析課件_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、STATISTICS,Regression Analysis,統(tǒng)計學(xué)之回歸分析,匯報人:XXX,Regression,CONTENTS,01,02,04,03,01,什么是回歸分析,Regression Analysis,回歸是由英國的高爾頓(生物學(xué)家達(dá)爾文的表弟)在研究人類遺傳問題時提出來的概念,弗朗西斯高爾頓 Francis Galton 1822年2月16日1911年1月17日,回歸:即自變量與因變量之間關(guān)系的分析方法,Regression,回歸的由來,高爾頓致力研究父母身高與兒女身高之間關(guān)系,發(fā)現(xiàn)雖然有一個趨勢,父母高,兒女也高;父母矮,兒女也矮,但從平均意義上說,給定父母的身高,兒女

2、的身高卻趨同于或者說回歸于總?cè)丝诘钠骄砀?兒輩身高的“回歸”到中等身高,這就是回歸一詞的最初由來,回歸分析研究問題,Regression,02,回歸分析方法,Regression Analysis,Linear Regression,回歸分析方法 線性回歸,Linear Regression,0 + 1,因變量Y,誤差隨機(jī)變量 期望值為0,、 模型參數(shù),0 是回歸直線在Y上的截距, 1 是直線的斜率:表示每變動一個單位x時,y的平均變動值,x自變量,線性回歸使用最佳的擬合直線(也就是回歸線)建立因變量 (Y) 和一個或多個自變量 (X) 之間的聯(lián)系,回歸線函數(shù),Logistic Regres

3、sion,Logistic Regression,邏輯回歸(Logistic Regression)是一種用于解決二分類(0 or 1)問題的機(jī)器學(xué)習(xí)方法,用于估計某種事物的可能性。實際上他是一種分類算法,=1 = 1 1+ (,Sigmoid函數(shù),邏輯回歸重點是判定邊界,用以對不同類別的數(shù)據(jù)分割的邊界,邊界的兩旁應(yīng)該是不同類別的數(shù)據(jù),回歸分析方法 邏輯回歸,回歸分析方法,多項式回歸,逐步回歸,嶺回歸,套索回歸,Ridge Regression,Lasso Regression,Polynomial Regression,Stepwise Regression,Logistic Regress

4、ion,對于一個回歸方程,如果自變量的指數(shù)大于1,那么它就是多項式回歸方程,當(dāng)數(shù)據(jù)之間存在多重共線性(自變量高度相關(guān))時,就需要使用嶺回歸分析,類似于嶺回歸,Lasso 也會就回歸系數(shù)向量給出懲罰值項,在處理多個自變量時,可以使用這種形式的回歸,03,如何選擇回歸模型,Regression Analysis,Logistic Regression,選擇模型考量因素,掌握多種回歸模型時,基于自變量和因變量的類型、數(shù)據(jù)的維數(shù)以及數(shù)據(jù)的其它基本特征去選擇最合適的技術(shù)非常重要。選擇正確的回歸模型時需要考慮的主要因素如下,診斷回歸分析結(jié)果,自變量與因變量是否具有預(yù)期的關(guān)系,自變量對模型是否有幫助,殘差是

5、否有空間聚類,模型是否出現(xiàn)了傾向性,自變量中是否存在冗余,評估模型的性能,Logistic Regression,預(yù)測步驟,Logistic Regression,正確應(yīng)用回歸分析預(yù)測時應(yīng)注意,04,回歸設(shè)計常用軟件,Regression Analysis,統(tǒng)計軟件是對回歸方案設(shè)計、試驗數(shù)據(jù)處理、回歸設(shè)計成果的應(yīng)用分析的支撐,Logistic Regression,01,02,03,04,05,統(tǒng)計軟件的選用原則,統(tǒng)計軟件是對回歸方案設(shè)計、試驗數(shù)據(jù)處理、回歸設(shè)計成果的應(yīng)用分析的支撐,回歸設(shè)計常用軟件,Logistic Regression,實用回歸分析,應(yīng)用多元統(tǒng)計分析,該書從數(shù)據(jù)出發(fā),不是從假設(shè)、定理出發(fā);從歸納出發(fā),不是從演繹出法;強(qiáng)調(diào)案例分析;重統(tǒng)計思想的闡述,弱化數(shù)學(xué)證明的推導(dǎo),編著:何曉群,編著:高惠璇,該書將多元統(tǒng)計方法的介紹與在計算機(jī)上實現(xiàn)這些方法的統(tǒng)計軟件(SAS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論