第十二章 雙變量關(guān)聯(lián)性分析_第1頁
第十二章 雙變量關(guān)聯(lián)性分析_第2頁
第十二章 雙變量關(guān)聯(lián)性分析_第3頁
第十二章 雙變量關(guān)聯(lián)性分析_第4頁
第十二章 雙變量關(guān)聯(lián)性分析_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十二章雙變量關(guān)聯(lián)性分析《市場調(diào)查理論與方法》主編:徐映梅

學(xué)習(xí)目的了解與掌握列聯(lián)表的編制12《市場調(diào)查理論與方法》主編:徐映梅掌握列聯(lián)表中

檢驗的作用和方法掌握兩個變量間線性相關(guān)關(guān)系的測度掌握一元線性(包括可線性化的非線性關(guān)系)回歸分析的步驟234第三節(jié)雙變量回歸分析第二節(jié)雙變量相關(guān)分析第一節(jié)雙變量列聯(lián)分析目錄CONTENTS3《市場調(diào)查理論與方法》主編:徐映梅

引例4CH12雙變量關(guān)聯(lián)性分析在第十一章的嬰幼兒奶粉市場研究項目中,研究團隊計劃通過調(diào)研分析為某嬰幼兒奶粉品牌提供精準(zhǔn)的營銷溝通支持,在研究中設(shè)計了與消費基本情況和購買模式相關(guān)的調(diào)研問題,收集了嬰幼兒奶粉消費者用于寶寶奶粉的支出數(shù)據(jù)和購買頻率數(shù)據(jù)。不同的消費者群體特征與購買頻率是否存在某種聯(lián)系

家庭的基本收入狀況是否會影響寶寶的奶粉支出收入狀況具體如何影響奶粉支出為了解決上述問題,需要掌握并選擇適合的雙變量分析方法。???…列聯(lián)分析注意事項列聯(lián)表中相關(guān)系數(shù)兩變量的一致性檢驗兩變量的獨立性檢驗第一節(jié)雙變量列聯(lián)分析列聯(lián)表一二5《市場調(diào)查理論與方法》主編:徐映梅二五四三

列聯(lián)表6列聯(lián)分析的必要數(shù)據(jù)基礎(chǔ),是對兩個或兩個以上的分類變量進行交叉分類所形成的復(fù)合頻數(shù)分布表。CH12-1列聯(lián)表

一、列聯(lián)表行百分比:指單元格的頻數(shù)占所在行總觀測頻數(shù)的比重列百分比:指單元格的頻數(shù)占所在列總觀測頻數(shù)的比重總百分比:指單元格的頻數(shù)占全部觀測總頻數(shù)的比重

獨立性檢驗7利用樣本資料檢驗兩個變量的獨立性,即樣本資料顯示的兩個分類變量的相關(guān)性在總體中是否存在,如果不存在就稱為獨立。CH12-1列聯(lián)表

二、兩變量的獨立性檢驗

三、兩變量的一致性檢驗一致性檢驗8對多項總體,即單個總體劃分為三個或更多類別后,為了判斷樣本資料的不同類別的比例差異在總體中是否也存在而進行的檢驗。CH12-1列聯(lián)表

四、列聯(lián)表中的相關(guān)系數(shù)相關(guān)系數(shù)9用以測量兩個變量是否相關(guān)以及相關(guān)程度的高低。CH12-1列聯(lián)表X與Y相關(guān)的列聯(lián)表

X1X2合計Y1aba+bY2cdc+d合計a+cb+dn

統(tǒng)計量的計算公式為:

應(yīng)用實例12-110在引例中提到的嬰幼兒奶粉市場研究項目中,研究者計劃探究不同的嬰幼兒奶粉消費群體特征與購買頻率存在何種聯(lián)系?;谝龜?shù)據(jù)集,以年齡特征為例,分析消費者年齡與嬰幼兒奶粉購買頻率之間的交叉頻數(shù)分布情況,在此基礎(chǔ)上,進一步分析不同年齡階段的消費者群體在購買頻率上是否存在差異。問題描述:CH12-1列聯(lián)表

應(yīng)用實例12-111由于年齡為連續(xù)變量,且數(shù)據(jù)的不同取值個數(shù)較多,經(jīng)常會出現(xiàn)稀疏單元(單元格頻數(shù)小于5),為構(gòu)建能反映年齡和購買頻率之間交叉頻數(shù)分布情況的列聯(lián)表,首先需要對年齡進行分組整理,劃分為“20-24歲”、“25-29歲”、“30-34歲”以及“35-45歲”四組;然后,再對分組后的年齡變量和購買頻率變量進行交叉分組形成列聯(lián)表;最后,利用

統(tǒng)計量對變量的獨立性進行檢驗。具體實現(xiàn)過程利用SPSS16.0(英文版)軟件中的“Crosstabs(交叉表)”菜單實現(xiàn)。分析過程:CH12-1列聯(lián)表

應(yīng)用實例12-112操作步驟:打開數(shù)據(jù)集,依次選擇“Transform(轉(zhuǎn)換)→RecodeintoDifferentVariables(轉(zhuǎn)換到不同的變量)”,展開變量轉(zhuǎn)換的對話框,然后,將變量“age(年齡)”選入“InputVariable->OutputVariable(輸入變量->輸出變量)”框中,在“Name(名稱)”和“Label(標(biāo)簽)”框中輸入衍生變量的名稱和標(biāo)簽,并單擊“Change(改變)”按鈕。進一步單擊“OldandNewValues(新舊值)”按鈕設(shè)置轉(zhuǎn)換規(guī)則,然后,單擊“Continue(繼續(xù))”按鈕,返回到主對話框。依次選擇“Analyze(分析)→DescriptiveStatistics(描述統(tǒng)計)→Crosstabs(交叉表)”,展開編制列聯(lián)表對話框,然后,將變量“frequency(購買頻率)”作為行變量選入“Row(s)(行)”框中,將變量“G_age(分組后的年齡)”作為列變量選入“Column(s)(列)”框中。單擊“Cells(單元格)”項,打開“Crosstabs:CellDisplay(交叉表:單元格顯示)”對話框,在“Percentages(百分比)”框中選擇“Row(行)”、“Column(列)”、“Total(總)”復(fù)選框,用于指定輸出三種形式的百分比;然后,單擊“Continue(繼續(xù))”按鈕,返回到主對話框。單擊“Statistics(統(tǒng)計量)”項,打開“Crosstabs:Statistics(交叉表:統(tǒng)計量)”對話框,選擇“Chi-Square(卡方)”復(fù)選框,用于指定進行

檢驗;在“Nominal(名義)”框中選擇“Contingencycoefficient(相依系數(shù))”和“PhiandCramer’sV(Phi和Cramer變量)”復(fù)選框,用于指定輸出三種相關(guān)系數(shù)的計算結(jié)果;再單擊“Continue(繼續(xù))”按鈕,返回到主對話框。CH12-1列聯(lián)表

應(yīng)用實例12-113輸出結(jié)果:CH12-1列聯(lián)表五、列聯(lián)表分析注意事項14編制列聯(lián)表時,如果兩個變量之間不存在因果關(guān)系,行變量和列變量可以隨意指定。如果兩個變量之間存在因果關(guān)系,一般需要把表示影響原因的自變量作為行變量,列入表的橫行;把表示變動結(jié)果的因變量作為列變量,列入表的縱列。列聯(lián)表只是檢驗變量之間是否有關(guān)聯(lián),而并非檢驗變量之間是否具有因果關(guān)系。進行列聯(lián)分析的變量必須是取值個數(shù)有限的離散變量,如果是連續(xù)變量,則要先對變量進行分組整理,將其轉(zhuǎn)換成有限多個取值的離散變量后,再進行列聯(lián)分析。使用分布進行獨立性檢驗和一致性檢驗時,一般要求樣本量必須足夠大(n>50),每個單元格中的期望頻次也不能過少,通常要求每個單元格中的期望頻數(shù)大于等于5,若小于5,則需要將相鄰單元格進行合并。CH12-1列聯(lián)表相關(guān)分析注意事項相關(guān)系數(shù)散點圖第二節(jié)雙變量相關(guān)分析相關(guān)關(guān)系一二15《市場調(diào)查理論與方法》主編:徐映梅二五四三

一、相關(guān)關(guān)系相關(guān)關(guān)系分類表現(xiàn)形式不同

如果一個變量的取值整體上是沿著一條直線,隨著另一個變量取值的變化而變化,則稱兩者之間具有線性相關(guān)關(guān)系;如果是沿著一條曲線變化,則稱兩者之間是非線性相關(guān)關(guān)系。2.相關(guān)方向不同

在線性相關(guān)關(guān)系中,如果兩個變量的變動方向相同,則稱之為正線性相關(guān);如果兩個變量的變動方向相反,則稱之為負線性相關(guān)。16在相關(guān)關(guān)系中,當(dāng)一個變量的取值發(fā)生變化時,另一個變量的取值是不確定的,但是總會遵循某種規(guī)律在一定范圍內(nèi)發(fā)生變化。CH12-2雙變量相關(guān)分析

二、散點圖散點圖

利用散點圖可以直觀地看出兩變量之間相關(guān)關(guān)系的形式、方向及密切程度。散點圖是從樣本數(shù)據(jù)上直觀判斷兩個數(shù)值型變量之間是否具有相關(guān)關(guān)系的重要工具。17以直角坐標(biāo)系的橫軸和縱軸分別代表兩個變量,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪在坐標(biāo)平面上所形成的圖形。CH12-2雙變量相關(guān)分析三、相關(guān)系數(shù)相關(guān)系數(shù)

18度量兩個變量之間相關(guān)關(guān)系的類型及其密切程度的統(tǒng)計指標(biāo)。CH12-2雙變量相關(guān)分析計算公式:

三、相關(guān)系數(shù)相關(guān)系數(shù)的顯著性檢驗在顯著性水平ɑ下,臨界值為,若,表明在1-ɑ的把握程度下,可以認為總體上兩個變量之間是線性相關(guān)的;否則,不能說兩個變量之間線性相關(guān)。19CH12-2雙變量相關(guān)分析采用自由度為n-2的t統(tǒng)計量

應(yīng)用實例12-220在嬰幼兒奶粉市場研究項目中,研究者考慮到支出往往隨著收入的增加而增加,同時通過觀察樣本數(shù)據(jù),認為寶寶平均每月的奶粉支出會隨著家庭平均每月總收入的增加而增加,即二者之間存在正線性相關(guān)關(guān)系。但是這種關(guān)聯(lián)的具體狀態(tài)和密切程度卻無法通過觀察數(shù)據(jù)直接得到答案,可以通過計算相關(guān)系數(shù)來確定。(數(shù)據(jù)集見引例)問題描述:CH12-2雙變量相關(guān)分析

應(yīng)用實例12-221由于寶寶平均每月奶粉支出變量和平均每月的家庭總收入變量均為定距變量,應(yīng)該選擇皮爾遜相關(guān)系數(shù)來測度二者之間的相關(guān)程度。具體實現(xiàn)過程利用SPSS16.0(英文版)軟件中的“Correlate(相關(guān))”菜單實現(xiàn)。分析過程:CH12-2雙變量相關(guān)分析

應(yīng)用實例12-222CH12-2雙變量相關(guān)分析操作步驟:打開數(shù)據(jù)集;依次選擇“Analyze(分析)→Correlate(相關(guān))→Bivariate(雙變量)”,展開雙變量相關(guān)分析對話框,首先,將變量“m_expand(平均每個月寶寶的奶粉支出)”和“income(平均每個月的家庭總收入)”同時選入“Variables(變量)”框中。然后,依次勾選“CorrelationCoefficients(相關(guān)系數(shù))”復(fù)選框中的“Pearson”、“TestofSignificance(顯著性檢驗)”復(fù)選框中的“Two-tailed(雙側(cè))”和“Flagsignificantcorrelations(標(biāo)記相關(guān)的顯著性)”。

應(yīng)用實例12-223輸出結(jié)果:CH12-2雙變量相關(guān)分析五、相關(guān)分析注意事項24相關(guān)分析的目的是測定變量之間相關(guān)關(guān)系的方向和程度,進行相關(guān)分析時,可以不必事先確定哪個是自變量,哪個是因變量,所涉及的變量可以都是隨機變量。進行相關(guān)分析時,不能僅憑相關(guān)系數(shù)r的大小來解釋變量之間的相關(guān)程度,否則有可能會得出不切實際的結(jié)論。例如,r=0只表示x和y之間不存在線性相關(guān)關(guān)系,并不能說明x和y之間也不存在其他形式的相關(guān)關(guān)系;用樣本數(shù)據(jù)計算的r值具有一定的隨機性,在實際應(yīng)用時,需要對其進行顯著性檢驗。CH12-2雙變量相關(guān)分析第三節(jié)雙變量回歸分析一雙變量回歸分析步驟二雙變量回歸分析注意事項25《市場調(diào)查理論與方法》主編:徐映梅

一、雙變量回歸分析步驟一元線性回歸步驟26以線性相關(guān)為基礎(chǔ),模型中只有一個因變量與一個自變量的回歸分析。CH12-3雙變量回歸分析一元線性回歸模型:

建立回歸方程估計方程參數(shù)檢驗回歸方程的擬合優(yōu)度檢驗回歸模型和參數(shù)的顯著性回歸預(yù)測殘差分析

一、雙變量回歸分析步驟(一)建立回歸方程27CH12-3雙變量回歸分析

一、雙變量回歸分析步驟28CH12-3雙變量回歸分析(二)估計方程參數(shù)

一、雙變量回歸分析步驟(三)檢驗回歸方程的擬合優(yōu)度29CH12-3雙變量回歸分析

一、雙變量回歸分析步驟(四)檢驗回歸模型的顯著性30CH12-3雙變量回歸分析

一、雙變量回歸分析步驟(五)回歸預(yù)測31CH12-3雙變量回歸分析

一、雙變量回歸分析步驟(六)殘差分析32CH12-3雙變量回歸分析

殘差分析是證實模型假定的基本方法,主要包括殘差圖、標(biāo)準(zhǔn)化殘差圖和正態(tài)概率圖三種方法。

若殘差圖中的樣本點分布在一條水平帶中間,或標(biāo)準(zhǔn)化殘差圖中大約有95%的標(biāo)準(zhǔn)化殘差介于-2和+2之間,標(biāo)準(zhǔn)化殘差分布直方圖呈現(xiàn)一個大體上以0為中心的對稱的鐘形分布,或正態(tài)概率圖中有較多的樣本點密集地分布在45°線附近,則說明該模型滿足關(guān)于殘差的基本假定。

一、雙變量回歸分析步驟可線性化的非線性模型的常用形式33CH12-3雙變量回歸分析

應(yīng)用實例12-334在嬰幼兒奶粉市場研究項目中,建立回歸方程,探究平均每月家庭總收入對寶寶平均每月奶粉支出的影響。問題描述:CH12-3雙變量回歸分析

應(yīng)用實例12-335探究平均每月家庭總收入對寶寶平均每月奶粉支出的影響,以寶寶平均每月奶粉支出為因變量,平均每月家庭總收入為自變量,建立一元線性回歸方程。具體實現(xiàn)過程利用SPSS16.0(英文版)軟件中的“Regression(回歸)”菜單實現(xiàn)。分析過程:CH12-3雙變量回歸分析

應(yīng)用實例12-336操作步驟:打開數(shù)據(jù)集進入回歸過程,選擇回歸方法依次選擇“Analyze(分析)→Regression(回歸)→Linear(線性)”,展開回歸過程對話框,然后,將變量“income(平均每個月的家庭總收入)”作為自變量,選入“Independent(s)”框中,將變量“m_expand(平均每個月寶寶的奶粉支出)”作為因變量,選入“Dependent(s)”框中,由于是只有一個自變量的簡單線性回歸分析,在“Method(方法)”復(fù)選框中,選擇默認項“Enter(進入)”選項即可。設(shè)置相關(guān)統(tǒng)計量點擊“Statistics(統(tǒng)計量)”按鈕,在“LinearRegression:Statistics(線性回歸統(tǒng)計量)”對話框中,分別勾選“Estimate(估計)”和“Modelfit(模型契合度)”選項,用于計算回歸模型并對其進行顯著性檢驗,為進行樣本異常值檢驗,可以在該對話框中選擇“Casewisediagnostics(個案診斷)”,并在“Outliersoutside(離群值)”的參數(shù)框中鍵入2,設(shè)置標(biāo)準(zhǔn)化殘差的絕對值大于等于2時識別為異常值(也可根據(jù)研究需要設(shè)置為1或3)。CH12-3雙變量回歸分析

應(yīng)用實例12-337操作步驟:繪制殘差圖繼續(xù)點擊“Plots(繪制)”按鈕,在的“LinearRegression:Plots(線性回歸:圖)”對話框,取變量“*ZRESID”進入y框內(nèi),選取變量“DEPENDNT”進入x框內(nèi),用于輸出關(guān)于因變量的標(biāo)準(zhǔn)化殘差圖,選擇“Histogram(直方圖)”選項,用于輸出標(biāo)準(zhǔn)化殘差的直方圖。進行點估計和區(qū)間估計的預(yù)測可以在“LinearRegression(線性回歸)”主對話框中點擊“SAVE(保存)”按鈕,打開“LinearRegression:Save(線性回歸:保存)”對話框,然后在“PredictedValues(預(yù)測值)”選項框中,選擇“Unstandardized(未標(biāo)準(zhǔn)化)”,用于輸出未標(biāo)準(zhǔn)化的預(yù)測值;在“PredictionIntervals(預(yù)測區(qū)間)”選項框中,選擇“Mean(均值)”或“Individual(單值)”選項,并設(shè)定置信度,比如95%,實現(xiàn)對總體均值或個別值的區(qū)間估計;在Residuals(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論