多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作(共10頁)_第1頁
多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作(共10頁)_第2頁
多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作(共10頁)_第3頁
多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作(共10頁)_第4頁
多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作(共10頁)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多重應(yīng)答(yngd)數(shù)據(jù)深度分析方法及其SPSS操作 HYPERLINK /member/index.php?uid=databigger t _blank data發(fā)表(fbio)于 2015-05-25 21:37 來源: HYPERLINK /html/html/wenjuan/diaochalilun/2009/0714/2488.html t _blank 統(tǒng)計(jì)(tngj)資源門戶多重應(yīng)答(Multiple Response),又稱多選題,是市場調(diào)查研究中十分常見的數(shù)據(jù)形式。多重應(yīng)答數(shù)據(jù)本質(zhì)上屬于分類數(shù)據(jù),但由于各選項(xiàng)均是對同一個(gè)問題的回答,之間存在一定的相關(guān),將各選項(xiàng)單獨(dú)進(jìn)行分析并

2、不恰當(dāng)。對多重應(yīng)答數(shù)據(jù)最常見的分析是使用 HYPERLINK /analysis/spss/ t _blank SPSS中的“Multiple Response”命令,通過定義變量集的方式,對選項(xiàng)進(jìn)行簡單的頻數(shù)分析和交叉分析。筆者認(rèn)為,該分析方法對調(diào)查數(shù)據(jù)的開發(fā)利用往往是不夠的,我們還可以使用其他分析方法對數(shù)據(jù)信息進(jìn)行深度挖掘。一、兩種數(shù)據(jù)錄入方式比如說在某次民意調(diào)查中,我們希望了解公眾評價(jià)宜居城市時(shí),到底是城市的哪一些特征決定人們對該城市宜居性的評估。為此,我們在研究中設(shè)計(jì)了14項(xiàng)標(biāo)準(zhǔn)請被訪者從中選出他們在進(jìn)行宜居評價(jià)時(shí)最看重的5項(xiàng)標(biāo)準(zhǔn)(關(guān)于宜居標(biāo)準(zhǔn)的具體探討,參見本刊2006年第8期)。選

3、項(xiàng)包括:這是一道典型的多重應(yīng)答題。 HYPERLINK /analysis/statistics/ t _blank 統(tǒng)計(jì)軟件中對多重應(yīng)答的標(biāo)準(zhǔn)紀(jì)錄方式有兩種:(1)多重二分法(Multiple dichotomy method)。對于多項(xiàng)選擇題的每一個(gè)選項(xiàng)看作一個(gè)變量來定義。0代表沒有被選中,1代表被選中。這樣,多項(xiàng)選擇題中有幾個(gè)選項(xiàng),就會變成有幾個(gè)單選變量。這些單選變量的選項(xiàng)都只有兩個(gè),即0或1。比如在上述例子中,我們就可以設(shè)置14個(gè)單選變量,來標(biāo)示某選項(xiàng)是否被選中;(2)多重分類法(Multiple category method)。多項(xiàng)選擇題中有幾個(gè)選項(xiàng),就定義幾個(gè)單選變量。每個(gè)變量的

4、選項(xiàng)都一樣,都和多項(xiàng)選擇題的選項(xiàng)相同。每個(gè)變量代表被調(diào)查者的一次選擇,即紀(jì)錄的是被選中的選項(xiàng)的代碼。如上述例子中,我們可以設(shè)置X1X5共5個(gè)變量,每個(gè)變量的選項(xiàng)兼為從1到14的14項(xiàng)宜居標(biāo)準(zhǔn)。很多情況下,當(dāng)問卷中不限定被訪者可選擇的選項(xiàng)數(shù)量時(shí),被調(diào)查者可能不會全部選項(xiàng)都選,因此在數(shù)據(jù)錄入時(shí),一般從這些變量的最前面幾個(gè)變量開始錄入,這樣最后面幾個(gè)變量自然就是缺失值。當(dāng)被調(diào)查者對多項(xiàng)選擇題中的選項(xiàng)全部選擇時(shí),這些變量中都有一個(gè)選項(xiàng)代碼,此時(shí)沒有缺失值。事實(shí)上,假如被訪者所選擇的各項(xiàng)選之間不涉及順序問題(如上述例子中,不需要受訪者給出哪種因素最重要,哪種次重要),那么這兩種輸入方法所表達(dá)的數(shù)據(jù)信息是

5、一樣的。但在實(shí)際操作中,如果選擇項(xiàng)較多,而被調(diào)查者最多只選擇其中少數(shù)幾項(xiàng)時(shí),采用多重二分法錄入就顯得繁瑣,輸入數(shù)據(jù)時(shí)容易出錯(cuò)。尤其是當(dāng)樣本量增大時(shí),采用多重二分法錄入就大大增加了錄入的工作量,不利于提高工作效率。為此,一般的市場調(diào)查公司大都采用多重分類法的錄入方式。二、兩種數(shù)據(jù)錄入格式的轉(zhuǎn)換實(shí)際上,只有多重二分法的錄入方式才是符合統(tǒng)計(jì)分析原則的數(shù)據(jù)排列格式,能夠直接進(jìn)行后續(xù)的統(tǒng)計(jì)推斷。多重分類法只是一種簡化紀(jì)錄方式,需要轉(zhuǎn)化為前者后方可進(jìn)行統(tǒng)計(jì)推斷。采用多重分類法錄入的數(shù)據(jù)如果要轉(zhuǎn)化成虛擬變量(選項(xiàng)為0或1)的形式,以上述公眾宜居標(biāo)準(zhǔn)的選擇為例,可以采用如下操作命令:COUNTNew_x1=X

6、1 X2 X3 X4 X5 (1).EXECUTE.其中New_x1代表受訪者是否選擇“社會安全”該選項(xiàng)。顯然,如果在X1X5中受訪者選擇了“1”(社會安全)選項(xiàng),那么New_x1的取值為1,如果在X1X5中受訪者沒有選擇“1”,那么New_x1的取值為0。以同樣的思路,我們就可以設(shè)置變量New_x2New_x14了。這樣,通過上述數(shù)據(jù)轉(zhuǎn)換,我們就把X1X5共5個(gè)變量轉(zhuǎn)化成了New_x1New_x14共14個(gè)虛擬變量了。三、多重應(yīng)答數(shù)據(jù)交叉分析(一)多重應(yīng)答卡方檢驗(yàn)在SPSS操作中,多重應(yīng)答變量通過定義變量集之后就可以直接與其他變量進(jìn)行交叉分析了。這種操作方法使用方便,但是其缺陷是在SPSS操

7、作界面上無法直接實(shí)現(xiàn)卡方檢驗(yàn)。為此,本文介紹一種進(jìn)行卡方檢驗(yàn)的間接方法。解決方法與操作:第一步:根據(jù)需要做出一個(gè)有多重應(yīng)答問題的交叉表,如表1表 1 多重應(yīng)答交叉表第二步:構(gòu)成一個(gè)(y )與第一步中結(jié)構(gòu)相同的頻數(shù)全部為“1”的交叉表。可以通過如下操作實(shí)現(xiàn)。在SPSS中,新增加(zngji)兩個(gè)變量。變量I的構(gòu)成(guchng)方式:從1到6,重復(fù)3次;變量II的構(gòu)成方式:1重復(fù)6次,2重復(fù)6次,3重復(fù)6次。第三步:按照第一步產(chǎn)生的交叉表內(nèi)的頻數(shù),構(gòu)造變量III。以變量III為權(quán)重,對應(yīng)交叉表中每個(gè)組成元素的位置進(jìn)行加權(quán)。最后的結(jié)果如下圖:圖 1 生成三個(gè)變量第四步:最后就可以利用加權(quán)后的數(shù)據(jù),

8、直接(zhji)選擇SPSS中的“Deive Statistics”中的“Crosstabs”命令直接進(jìn)行交叉(jioch)分析和卡方檢驗(yàn)了。(二)多重應(yīng)答數(shù)據(jù)多元(du yun)交叉比較法使用上述檢驗(yàn)方法操作相對比較復(fù)雜,且不能比較具體的每一個(gè)選項(xiàng)與其他變量的檢驗(yàn)情況。為此,我們也可以將轉(zhuǎn)化后的每一個(gè)“虛擬變量”與其他變量(如性別)直接進(jìn)行卡方檢驗(yàn)。比如在上述“宜居標(biāo)準(zhǔn)”這個(gè)例子中,我們把代表不同宜居標(biāo)準(zhǔn)的New_x1New_x14共14個(gè)虛擬變量與“性別”、“戶口”、“收入”和“年齡”進(jìn)行交叉列聯(lián)分析和卡方顯著性檢驗(yàn),為了使檢驗(yàn)結(jié)果具有可比較性,我們把這4個(gè)背景變量都設(shè)置為只有兩項(xiàng)取值(如

9、收入分為低收入和高收入,年齡分為1835歲和35歲以上,戶口情況分為本地戶口和外地戶口),這樣做出的交叉分析就具有共同的自由度(df=1),可以對各自的卡方值的大小進(jìn)行比較。檢驗(yàn)結(jié)果顯示,城市不同性別、不同收入、不同戶口的市民存在顯著差異的宜居因素兼為2個(gè);但是城市不同年齡段人群認(rèn)為的宜居因素卻有5個(gè)存在顯著性差異。由此可見,不同年齡段的人群在對宜居的標(biāo)準(zhǔn)判斷上存在更大的多元化傾向。在建設(shè)宜居城市時(shí),為了盡量滿足各類群體的需求,可以從先滿足不同年齡段市民的宜居需求著手。表 2 不同類別群體的宜居因素差異比較注:表示(biosh)該宜居因素(yn s)在對應(yīng)的類別(libi)群體中存在顯著性差異

10、P0.05因子分析是利用降維的思想,由研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。因子分析的思想始于1904年查爾斯斯皮爾曼(Charles Spearman)對學(xué)生成績的研究,近年來,隨著電子計(jì)算機(jī)的發(fā)展,人們將因子分析的理論成功地應(yīng)用于 HYPERLINK /analysis/market_research/ t _blank 市場研究領(lǐng)域。例如,某年我們對982名跨國企業(yè)經(jīng)理人和普通員工進(jìn)行了一項(xiàng)調(diào)查,其中有一題我們讓受訪者選出他們認(rèn)為的中資跨國企業(yè)與外資跨國企業(yè)相比,在發(fā)展中最急需解決的三項(xiàng)問題是什么,并按重要性排

11、序。1資金2.人才3.新制度4.信息5.相關(guān)政策6.知識與技術(shù)請排序:第一重要問題_;第二重要問題_;第三重要問題_。面對上述問題,簡單的頻數(shù)分析顯然不能綜合地反映問題。而因子分析法不僅可以進(jìn)行綜合分析,發(fā)現(xiàn)公因子,而且還可以得到更多的信息。對上述的選項(xiàng)按三級李克特量表進(jìn)行處理:凡是選為第一重要因素的賦予10分,選為第二重要因素的賦予7分,選為第三重要因素的賦予4分,沒有被選中的因素都設(shè)為0分,新設(shè)置6個(gè)變量(問題的選項(xiàng)有6項(xiàng)),將每個(gè)人的回答情況由原來3個(gè)變量轉(zhuǎn)換為資金、人才、新制度、信息、相關(guān)政策、知識與技術(shù)6個(gè)變量。具體轉(zhuǎn)換方法如表3。表 3 變量的轉(zhuǎn)換然后對新生成的6個(gè)變量(binli

12、ng)進(jìn)行因子分析,分析結(jié)果顯示,前4個(gè)因子的方差貢獻(xiàn)率達(dá)到了87.6%。具體結(jié)果顯示如下:表 4 旋轉(zhuǎn)(xunzhun)后各選項(xiàng)在所提取公因子中的負(fù)荷系數(shù)從表中可以看出第一個(gè)公因子是資金與新制度;第二個(gè)公因子是人才和知識與技術(shù);第三個(gè)公因子是相關(guān)政策;第四個(gè)公因子是信息。這說明中國的跨國企業(yè)在發(fā)展中最急需解決的問題是資金與新制度,其次是人才和知識與技術(shù),再次是相關(guān)政策、信息。該分析結(jié)果與頻數(shù)分析基本一致。并且從因子分析中我們還可得到更多的相關(guān)信息。如第一公因子為資金與新制度,但是兩個(gè)變量的因子載荷符合是相反的,這說明越是關(guān)心“資金”的人,越不重視制度創(chuàng)新;其次,信息這一選項(xiàng)被排在最后,從一個(gè)

13、側(cè)面說明中資跨國企業(yè)與外資跨國企業(yè)相比還處于粗放發(fā)展階段,更需要資金、人才和技術(shù)支持,信息的功能尚未有效發(fā)揮。五、多重應(yīng)答數(shù)據(jù)(shj)Logistic回歸分析為了了解不同人群的應(yīng)答特征,可以將多重應(yīng)答情況作為因變量,相應(yīng)(xingyng)的人群特征變量作為影響因素。由于所有選項(xiàng)均為選中或不選中兩種取值,因此(ync)所有的因變量均為二分類,即建立多元Logistic模型。Logistic回歸方程的基本形式為:其中,p為事件發(fā)生率,xi為影響因素,bi為影響系數(shù),a為常數(shù)項(xiàng)。下面我們以一個(gè)具體的例子來說明。問題【針對企業(yè)家提問】:下面我將讀出一些對企業(yè)家的形象描述,請告訴我其中哪些是您個(gè)人期望

14、塑造的企業(yè)家形象?【可多選】選項(xiàng):因篇幅所限,這里僅對“關(guān)心公益事業(yè)的”這一選項(xiàng)的影響因素加以分解。在該Logistic模型中,因變量為在多項(xiàng)選擇中是否選擇了“關(guān)心公益事業(yè)”這一選項(xiàng),選了的賦值為1,沒有選的賦值為0。自變量中的離散變量經(jīng)過虛擬變量處理。性別以女性為參照類,戶口類型以農(nóng)村戶口為參照類,婚姻狀況以未婚為參照類,文化程度以本科及以上為參照類。另外,從分布來看,個(gè)人年收入嚴(yán)重偏態(tài)分布,故取自然對數(shù),使之整體服從正態(tài)分布。自變量中,我們還設(shè)計(jì)了“后物質(zhì)主義傾向”這一變量。物質(zhì)主義和后物質(zhì)主義是關(guān)于價(jià)值觀的一對概念,傳統(tǒng)的強(qiáng)調(diào)經(jīng)濟(jì)增長和物質(zhì)安全的價(jià)值觀為物質(zhì)主義,而新流行的強(qiáng)調(diào)自由、精神生活和生活質(zhì)量的價(jià)值觀為后物質(zhì)主義。我們以“您是否關(guān)注當(dāng)前的環(huán)境保護(hù)問題”來測量企業(yè)家的后物質(zhì)主義傾向。因?yàn)榄h(huán)保問題是目前的熱門話題,與企業(yè)家的利他主義、社會責(zé)任等后現(xiàn)代意識密切相關(guān)。該變量以“不太關(guān)注”為參照組。表 5 Logistic 回歸結(jié)果:是否選擇“關(guān)心公益事業(yè)的”Logistic回歸(hugu)統(tǒng)計(jì)結(jié)果表明,假設(shè)模型整體檢驗(yàn)十分顯著(卡方值為239.016,p=0.0001)。除婚姻狀況、后物質(zhì)主義中的“比較關(guān)注”以及部分受教育程度對因變量的影響不顯著(xinzh)外,其他因素均顯著??偟膩碚f,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論