week15相關(guān)分析分析_第1頁
week15相關(guān)分析分析_第2頁
week15相關(guān)分析分析_第3頁
week15相關(guān)分析分析_第4頁
week15相關(guān)分析分析_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)分析平均數(shù)、標(biāo)準(zhǔn)差是對(duì)單變量進(jìn)行描述的特征量。若對(duì)兩個(gè)變量之間變化關(guān)系進(jìn)行描述,需要用相關(guān)量。如,描述同一組學(xué)生兩門學(xué)科成績(jī)的關(guān)系;智力與學(xué)習(xí)成績(jī)的關(guān)系等等,都要用相關(guān)量來描述。一、引言7.1相關(guān)分析的基本原理變量間的關(guān)系函數(shù)關(guān)系:變量間有完全確定的關(guān)系,可用函數(shù)表示。相關(guān)關(guān)系:變量之間存在的一種不確定的數(shù)量關(guān)系,此關(guān)系無法用確定的函數(shù)形式表示。函數(shù)關(guān)系是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測(cè)點(diǎn)落在一條線上xy函數(shù)關(guān)系(幾個(gè)例子)函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=px(p為單價(jià))圓的面積(S)與半徑之間的關(guān)系可表示為S=R2企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)、單位產(chǎn)量消耗(x2)、原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3相關(guān)關(guān)系變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周圍xy相關(guān)關(guān)系(幾個(gè)例子)

相關(guān)關(guān)系的例子父親身高(y)與子女身高(x)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系相關(guān)關(guān)系的描述與測(cè)度-散點(diǎn)圖不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)什么是相關(guān)分析用統(tǒng)計(jì)方法揭示變量之間是否存在相互關(guān)系及如何將相關(guān)的密切程度及相關(guān)的方向描述出來相關(guān)分析常用的方法:散點(diǎn)圖統(tǒng)計(jì)指標(biāo)(相關(guān)系數(shù))相似性或距離怎樣分析變量間的相關(guān)關(guān)系?分析變量之間的關(guān)系需要解決下面的問題(4大問題)變量之間是否存在關(guān)系?相關(guān)程度的強(qiáng)弱如何?相關(guān)的趨勢(shì)及方向?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?Pearson相關(guān)系數(shù)(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加Pearson相關(guān)系數(shù)(取值及其意義)

r

的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)

r=0,不存在線性相關(guān)關(guān)系

-1r<0,為負(fù)相關(guān)

0<r1,為正相關(guān)

|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切Pearson相關(guān)系數(shù)的檢驗(yàn)假設(shè)形式

H0:ρ=0,H1:ρ≠0檢驗(yàn)的統(tǒng)計(jì)量在兩隨機(jī)變量X和Y服從正態(tài)分布及原假設(shè)為真時(shí),統(tǒng)計(jì)量t~t(n-2)決策規(guī)則當(dāng)p<α?xí)r拒絕原假設(shè),表明樣本相關(guān)系數(shù)r是顯著的;否則表明r在統(tǒng)計(jì)上是不顯著的,兩總體不存在顯著的相關(guān)關(guān)系。申請(qǐng)打字人員的口試與實(shí)際操作的相關(guān)關(guān)系

有一家公司招聘打字員,采用口試與實(shí)際操作兩種考核方式?,F(xiàn)有6個(gè)申請(qǐng)人的口試與實(shí)際操作的評(píng)分如下表?,F(xiàn)要求測(cè)定這些申請(qǐng)人實(shí)際操作成績(jī)與口試成績(jī)之間是否存在關(guān)系及關(guān)系的密切程度。申請(qǐng)人123456口試成績(jī)B-A-B+ACB操作成績(jī)283847562932Kendall‘stau-b相關(guān)系數(shù)計(jì)算申請(qǐng)人口試成績(jī)操作成績(jī)轉(zhuǎn)換成等級(jí)口試操作異序?qū)?A561102A-382313B+473206B324401B-285615C29650SPSS中Kendall‘stau-b相關(guān)系數(shù)的輸出結(jié)果SPSSANALYZECorrelateKendall‘stau-b啤酒品牌的相似度分析

受某啤酒公司的委托,尼爾森咨詢公司就啤酒市場(chǎng)進(jìn)行了詳細(xì)的品牌調(diào)查。數(shù)據(jù)如下,現(xiàn)對(duì)啤酒品牌的相似度進(jìn)行分析。編號(hào)啤酒品牌熱量(卡)鈉含量(%)酒精含量(%)價(jià)格($)1Budweiser144.0019.004.700.432Schlitz181.0019.004.900.433Ionenbrau157.0015.004.900.484Kronensourc170.007.005.200.735Heineken152.0011.005.000.776Old-milnaukee145.0023.004.600.267Aucsberger175.0024.005.500.408Strchs-bohemi149.0027.004.700.42距離相關(guān)分析

距離相關(guān)(DistanceCorrelation)分析是對(duì)樣品或變量之間相似或不相似程度的一種度量,計(jì)算的是一種廣義距離。距離相關(guān)分析根據(jù)統(tǒng)計(jì)量的不同,分為不相似性測(cè)度(Dissimilarities):通過計(jì)算距離來表示的,其數(shù)值越大,表示相似程度越弱.相似性測(cè)度(Similarities):通過計(jì)算Peason相關(guān)系數(shù)或Cosine相似系數(shù)來表示的,其數(shù)值越大,表示相似程度越強(qiáng).SPSS中距離相關(guān)分析的輸出結(jié)果(不相似性測(cè)度)SPSSANALYZECorrelateDistanceSPSS中距離相關(guān)分析的輸出結(jié)果(相似性測(cè)度)SPSSANALYZECorrelateDistance案例某公司員工的基本情況,數(shù)據(jù)集含3列,分別為:性別、年齡、工資,現(xiàn)在希望了解員工年齡和工資水平之間的關(guān)系再提高一下在探索性數(shù)據(jù)分析階段,分組對(duì)比分析非常重要,在分組變量的細(xì)分之下,往往能夠發(fā)現(xiàn)意想不到的結(jié)論。我們討論一下不同性別的員工,其年齡和工資的關(guān)系,男女在這方面有區(qū)別嗎?(1)首先用性別變量將數(shù)據(jù)集拆分為男女兩部分二、相關(guān)的概念兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。相關(guān)分析是研究變量間密切程度的一種統(tǒng)計(jì)方法。兩個(gè)變量之間的變化關(guān)系,既表現(xiàn)在變化方向,又表現(xiàn)在密切程度上。從變化方向來看,兩個(gè)變量之間有以下幾種關(guān)系:三、相關(guān)的類別1、正相關(guān)

兩個(gè)變量的變化方向一致如智商與學(xué)習(xí)成績(jī)(非智力因素基本相同)2、負(fù)相關(guān)

兩個(gè)變量的變化方向相反如解題能力與解題所用時(shí)間的長(zhǎng)短3、零相關(guān)

兩個(gè)變量的變化方向無一定規(guī)律

四、相關(guān)系數(shù)(一)定義:用來描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)學(xué)特征量稱為相關(guān)系數(shù)。用r表示。(二)數(shù)值變化范圍:0≤|r|≤1-1≤r≤1r的正、負(fù)號(hào)表明兩個(gè)變量之間變化的方向絕對(duì)值的大小表明兩個(gè)變量之間變化密切程度1、概念及適用范圍積差相關(guān):當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線形關(guān)系時(shí),表示這兩個(gè)變量之間的相關(guān),又叫皮爾遜(Pearson)相關(guān)。如,初中升高中入學(xué)考試生物與化學(xué)成績(jī)均以百比制表示,若二者分別呈正態(tài)分布,它們之間呈線性關(guān)系,這時(shí)可用積差相關(guān)來表示它們的變化關(guān)系。五、積差相關(guān)使用條件兩個(gè)變量都是由測(cè)量獲得的連續(xù)性數(shù)據(jù)兩個(gè)變量的總體都呈正態(tài)分布,或接近于正態(tài)分布。判斷總體是否呈正態(tài)分布可進(jìn)行卡方檢驗(yàn),以后會(huì)介紹。必須是成對(duì)數(shù)據(jù),而且每對(duì)數(shù)據(jù)之間相互獨(dú)立兩個(gè)變量之間呈線性關(guān)系。這可由相關(guān)散點(diǎn)圖的形狀來決定。散點(diǎn)圖在隨后也進(jìn)行介紹。樣本容量n≥30散點(diǎn)圖:判斷散點(diǎn)圖,主要看其分布形狀是否呈斜向橢圓形,散點(diǎn)在橢圓中心處分布密集,橢圓長(zhǎng)軸兩端稀疏,這反映兩變量之間是直線關(guān)系。若四個(gè)象限的散點(diǎn)相等,且分布均勻,為零相關(guān)。若散點(diǎn)分布呈曲線形,為曲線相關(guān)。散點(diǎn)圖的趨勢(shì)若表明兩個(gè)變量是線性關(guān)系,才可以計(jì)算積差相關(guān)系數(shù)。2、積差相關(guān)系數(shù)的計(jì)算方法原始數(shù)據(jù)計(jì)算法:3、相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的抽樣分布從兩個(gè)正態(tài)連續(xù)變量的總體中,隨機(jī)抽取n對(duì)數(shù)據(jù),算得一個(gè)樣本相關(guān)系數(shù)r值,隨后將這些數(shù)據(jù)還回兩個(gè)總體中去,再?gòu)闹须S機(jī)抽取n對(duì)數(shù)據(jù),又可以計(jì)算出一個(gè)樣本的r值,這一切可能個(gè)樣本r值的頻數(shù)分布,就構(gòu)成一個(gè)實(shí)驗(yàn)性的相關(guān)系數(shù)r的抽樣分布。相關(guān)系數(shù)顯著性檢驗(yàn)的原理上面求出的相關(guān)系數(shù)r,是根據(jù)樣本數(shù)據(jù)計(jì)算出來的,它存在著抽樣誤差。也就是說,即使從總體相關(guān)系數(shù)ρ=0的總體中隨機(jī)抽取的樣本,由于抽樣的偶然性,計(jì)算出的r值有可能不等于0。所以,不能僅僅根據(jù)?r?的大小,對(duì)兩個(gè)變量之間關(guān)系的密切程度作出判斷,還要看r在以ρ=0為中心的抽樣分布上出現(xiàn)的概率如何。如果從ρ=0的總體中,隨機(jī)抽取的r在抽樣分布上出現(xiàn)的概率較大,則r和ρ=0的差異無顯著意義。反之,如果從ρ=0的總體中,隨機(jī)抽取的r在抽樣分布上出現(xiàn)的概率較小,則r和ρ=0有顯著性差異,即不是來自兩個(gè)變量相關(guān)系數(shù)為0的總體。六、等級(jí)相關(guān)

等級(jí)相關(guān):以等級(jí)次序排列或以等級(jí)次序表示的變量之間的相關(guān)。斯皮爾曼二列等級(jí)相關(guān)斯皮爾曼等級(jí)相關(guān)(一)概念及其適用范圍當(dāng)兩個(gè)變量以等級(jí)次序排列或以等級(jí)次序表示時(shí),兩個(gè)相應(yīng)總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩個(gè)變量之間的相關(guān),稱為等級(jí)相關(guān)。根據(jù)某種標(biāo)準(zhǔn)對(duì)某項(xiàng)成績(jī)所評(píng)定的等級(jí),或按某種指標(biāo)的優(yōu)劣程度所排列的名次等,均屬于等級(jí)秩序性分?jǐn)?shù)。計(jì)算等級(jí)相關(guān)系數(shù)的公式為D表示兩個(gè)變量每對(duì)數(shù)據(jù)等級(jí)之差7.2連續(xù)變量的相關(guān)分析

像年齡變量、收入變量、成績(jī)變量都是典型的連續(xù)變量。這就是我們前面介紹的Pearson相關(guān)。例從某系隨機(jī)選取了40名大學(xué)生進(jìn)行追蹤研究,分別在入學(xué)后一周、第一學(xué)年末、第二學(xué)年末和第三學(xué)年末共4次英語詞匯測(cè)驗(yàn)推算得到的被試的英語詞匯量(單位:千)。表中的變量如下:性別(0表示女生,1表示男生),test1(入學(xué)后一周詞匯量),test2(第一學(xué)年末詞匯量),test3(第二學(xué)年末詞匯量),test4(第三學(xué)年末詞匯量)。想計(jì)算并檢驗(yàn)學(xué)生英語詞匯量四次測(cè)驗(yàn)之間的相關(guān)系數(shù)。在進(jìn)行相關(guān)分析之前,可以使用Graphs菜單中的Scatter命令作散點(diǎn)圖。散點(diǎn)圖是以點(diǎn)的分布反映變量之間相關(guān)情況的統(tǒng)計(jì)圖形,根據(jù)圖中的各點(diǎn)分布走向和密集程度,大致可以判斷變量之間的關(guān)系。按順序Graphs——Scatter單擊,打開Scatterplot散點(diǎn)圖主對(duì)話框。1、Simple簡(jiǎn)單散點(diǎn)圖,只顯示一對(duì)相關(guān)變量的散點(diǎn)圖4、3-D三維散點(diǎn)圖,顯示三個(gè)相關(guān)變量之間的散點(diǎn)圖3、Matrix矩陣散點(diǎn),在矩陣中顯示多個(gè)相關(guān)變量之間的散點(diǎn)圖2、Overlay重疊散點(diǎn)圖,可顯示多對(duì)相關(guān)變量的散點(diǎn)圖把test1選擇作為Y軸變量,把test2選擇作為X軸變量。結(jié)果:矩陣散點(diǎn)圖在矩陣變量框內(nèi)要選擇兩個(gè)或兩個(gè)以上的變量編輯散點(diǎn)圖選中圖中的點(diǎn),打開Properties圖形屬性對(duì)話框,選擇Marker點(diǎn)選項(xiàng)卡。在選項(xiàng)卡中,選擇點(diǎn)的類型(Type)、點(diǎn)的大小(Size)、點(diǎn)的外周線(BorderWidth)以及點(diǎn)的顏色(Color)。選擇分析菜單下的相關(guān)分析下兩個(gè)變量間的相關(guān)分析選項(xiàng)菜單2單擊按鈕3單擊OK1選擇變量皮爾遜相關(guān)系數(shù)如果兩變量相關(guān)顯著,需要標(biāo)注顯著性檢驗(yàn)選項(xiàng)將<test1>、<test2>、<test3>、<test4>指定為<Variables>。結(jié)果和討論每個(gè)變量有三行數(shù)據(jù),第一行是該變量與其他變量之間的相關(guān)系數(shù),右上角標(biāo)有“**”的表示在0.01水平上是顯著的。Sig.(2-tailed)雙尾t檢驗(yàn)結(jié)果,對(duì)于相關(guān)系數(shù)為0的假設(shè)成立的概率。N為參與相關(guān)系數(shù)計(jì)算的有效觀測(cè)量數(shù)。結(jié)論:r=0.886,P=0.000<0.01,拒絕H0??梢哉J(rèn)為test1和test2之間有正的直線相關(guān)關(guān)系。H0:ρ=0,即test1和test2無直線相關(guān)關(guān)系。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論