數(shù)據(jù)分析技術(shù)簡單線性相關(guān)_第1頁
數(shù)據(jù)分析技術(shù)簡單線性相關(guān)_第2頁
數(shù)據(jù)分析技術(shù)簡單線性相關(guān)_第3頁
數(shù)據(jù)分析技術(shù)簡單線性相關(guān)_第4頁
數(shù)據(jù)分析技術(shù)簡單線性相關(guān)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

主講教師:陳悅北京信息職業(yè)技術(shù)學(xué)院數(shù)據(jù)分析技術(shù)簡單線性相關(guān)01相關(guān)分析基本概念相關(guān)分析是分析客觀事物之間關(guān)系的數(shù)量分析方法??陀^事物之間的關(guān)系大致可歸納為兩大類關(guān)系,分別是函數(shù)關(guān)系和統(tǒng)計(jì)關(guān)系。相關(guān)分析是用來分析事物之間統(tǒng)計(jì)關(guān)系的方法。01線性相關(guān)基本概念(1)線性相關(guān):最簡單的一種關(guān)聯(lián)。(2)曲線相關(guān):兩變量之間存在相關(guān)趨勢,但并非呈線性,而是一曲線。(3)非線性相關(guān):X、Y之間沒有明顯的線性關(guān)系,卻存在著某種非線性關(guān)系,說明X仍是影響Y的因素。(4)秩相關(guān):也稱等級相關(guān),對原變量的分布不作要求,屬于非參數(shù)統(tǒng)計(jì)方法。(5)正相關(guān)與負(fù)相關(guān):兩變量X、Y同增或同減,變化趨勢同向,稱為正相關(guān),兩變量一增一減,變化趨勢反向,稱為負(fù)相關(guān)。(6)完全相關(guān):相關(guān)系數(shù)的絕對值為1,分為完全正相關(guān)和完全負(fù)相關(guān)。01線性相關(guān)基本概念1.相關(guān)系數(shù)基本思想相關(guān)分析往往考察的是兩個(gè)連續(xù)變量的相關(guān)關(guān)系,對任何類型的變量,都可以使用相應(yīng)的指標(biāo)進(jìn)行相關(guān)關(guān)系的考察。統(tǒng)計(jì)學(xué)中,一般用樣本相關(guān)系數(shù)來推斷總體相關(guān)系數(shù)。對于反映有序變量或連續(xù)變量間關(guān)聯(lián)程度的參數(shù),取值范圍r為-1~1,r>0為正相關(guān),r<0為負(fù)相關(guān),r=0為零相關(guān)。01線性相關(guān)基本概念2.線性相關(guān)系數(shù)線性相關(guān),又稱簡單相關(guān),用來定量描述兩個(gè)變量間線性關(guān)系密切程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo),適用于二元正態(tài)分布資料。

01線性相關(guān)基本概念3.Spearman等級相關(guān)系數(shù)

Spearman等級相關(guān)系數(shù)相當(dāng)于Pearson相關(guān)系數(shù)的非參數(shù)形式,它是根據(jù)各數(shù)據(jù)的排序名次進(jìn)行計(jì)算,取值范圍也在―1~1之間。適用于那些不滿足正態(tài)分布的資料、總體分布未知的資料和等級資料。01線性相關(guān)基本概念4.Kendall等級相關(guān)系數(shù)

Kendall等級相關(guān)系數(shù)是對兩個(gè)有序變量或兩個(gè)秩變量之間相關(guān)程度的度量統(tǒng)計(jì)量,屬于非參數(shù)統(tǒng)計(jì)范疇,它在計(jì)算時(shí)考慮了結(jié)點(diǎn)(秩相同的點(diǎn))的影響。發(fā)現(xiàn)變量之間的統(tǒng)計(jì)關(guān)系,并且用此規(guī)律來幫助人們進(jìn)行決策才是統(tǒng)計(jì)實(shí)踐的最終目的。一般來說,統(tǒng)計(jì)可以根據(jù)目前所擁有的信息(數(shù)據(jù))來建立人們所關(guān)心的變量和其他有關(guān)變量的關(guān)系。這種關(guān)系一般稱為模型。假如用Y表示感興趣的變量,用X表示其他可能與Y有關(guān)的變量(X也可能是若干變量組成的向量),則所需要的是建立一個(gè)函數(shù)關(guān)系Y=f(X)。這里Y稱為因變量或響應(yīng)變量,而X稱為自變量,也稱為解釋變量或協(xié)變量。建立這種關(guān)系的過程就叫做回歸。02問題的提出02問題的提出例:有美國60個(gè)著名商學(xué)院的數(shù)據(jù),包括的變量有GMAT分?jǐn)?shù)、學(xué)費(fèi)、進(jìn)入MBA前后的工資等。進(jìn)入MBA前后工資的散點(diǎn)圖??梢钥闯?,進(jìn)入MBA前工資高的,畢業(yè)后工資也高。希望能夠建立一個(gè)模型描述這個(gè)關(guān)系。02問題的提出如果兩個(gè)定量變量沒有關(guān)系,就談不上建立模型或進(jìn)行回歸。但怎樣才能發(fā)現(xiàn)兩個(gè)定量變量有沒有關(guān)系呢?最簡單的直觀辦法就是畫出它們的散點(diǎn)圖。散點(diǎn)圖很直觀,但如何在數(shù)量上描述相關(guān)呢?這里介紹一種對相關(guān)程度的度量:Pearson相關(guān)系數(shù)。Pearson相關(guān)系數(shù)又稱相關(guān)系數(shù)或線性相關(guān)系數(shù)。它是由兩個(gè)變量的樣本取值得到,是一個(gè)描述線性相關(guān)強(qiáng)度的量,一般用字母r表示。取值在-1和+1之間。當(dāng)兩個(gè)變量有很強(qiáng)的線性相關(guān)時(shí),相關(guān)系數(shù)接近于+1(正相關(guān))或-1(負(fù)相關(guān)),而當(dāng)兩個(gè)變量線性相關(guān)程度較弱時(shí),相關(guān)系數(shù)就接近0。02模塊講解依次單擊菜單“分析”|“相關(guān)”|“雙變量…”命令。02模塊講解2.結(jié)果解釋(1)描述性輸出?!懊枋鲂越y(tǒng)計(jì)量”表格給出了兩個(gè)變量的基本統(tǒng)計(jì)信息,包括均值和標(biāo)準(zhǔn)差。02模塊講解(2)相關(guān)性輸出?!跋嚓P(guān)性”表格給出了Pearson相關(guān)系數(shù)及其檢驗(yàn)結(jié)果??梢酝茢喑龅夂颗c甲狀腺腫之間存在著明顯的正相關(guān)。對某省9個(gè)地區(qū)水質(zhì)的碘含量及

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論