




已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章多元數(shù)據(jù)圖表示法 3 1輪廓圖3 2雷達(dá)圖3 3調(diào)和曲線圖3 4星座圖3 5臉譜圖 本章學(xué)習(xí)目標(biāo) 領(lǐng)會(huì)作多元數(shù)據(jù)圖的思想 會(huì)作簡(jiǎn)單的多元數(shù)據(jù)圖形并且會(huì)分析圖形 第三章多元數(shù)據(jù)圖表示法 圖形有助于我們對(duì)所研究數(shù)據(jù)的直觀了解 如果能把一些多元數(shù)據(jù)直接顯示在平面圖上 便可以從圖形一目了然地看出多元數(shù)據(jù)之間的關(guān)系 當(dāng)只有一 二維數(shù)據(jù)時(shí) 可以使用通常的直角坐標(biāo)系在平面上點(diǎn)圖 當(dāng)有三維數(shù)據(jù)時(shí) 也可以使用空間直角坐標(biāo)系點(diǎn)圖 但是已經(jīng)不方便 當(dāng)維數(shù)大于3時(shí) 用通常的方法已不能點(diǎn)圖 但是在許多實(shí)際問題中 多元數(shù)據(jù)的維數(shù)都大于3 例考察北京 上海 陜西 甘肅四個(gè)省市人均生活消費(fèi)支出情況 選取以下五項(xiàng)指標(biāo) 具體數(shù)據(jù)如下表 多元數(shù)據(jù)圖表示法的分類 一類是使高維空間的點(diǎn)與平面上的某種圖形應(yīng) 這種圖形能反映高維數(shù)據(jù)的某些特點(diǎn)或數(shù)據(jù)間的某些關(guān)系 另一類是在盡可能多地保留原數(shù)據(jù)信息的原則下進(jìn)行降維 若能使數(shù)據(jù)維數(shù)降至2或1維 則可在平面上點(diǎn)圖 第二類分類方法可用后面介紹的主成分分析 因子分析等去解決 這一章只對(duì)第一類方法介紹四種圖表示法 更多的方法可在有關(guān)專著中找到 3 1輪廓圖 作圖步驟為 1 作平面坐標(biāo)系 橫坐標(biāo)取個(gè)點(diǎn)表示個(gè)變量 2 對(duì)給定的一次觀測(cè)值 在個(gè)點(diǎn)上的縱坐標(biāo) 即高度 和它對(duì)應(yīng)的變量取值成正比 3 連接個(gè)高度的頂點(diǎn)得一折線 則一次觀測(cè)值的輪廓為一條多角折線形 次觀測(cè)值可畫出條折線 構(gòu)成輪廓圖 下圖畫出四條折線為北京 上海 陜西 甘肅五項(xiàng)指標(biāo)的數(shù)據(jù)即四個(gè)省市五項(xiàng)指標(biāo)的輪廓 輪廓圖 由輪廓圖可以看出 北京 上海的居民生活消費(fèi)較高且相似 陜西 甘肅生活消費(fèi)較低且相似 如果考察的樣品較多 畫折線時(shí)圖形中可能出現(xiàn)重復(fù)點(diǎn)多 不便于區(qū)分哪個(gè)樣品對(duì)應(yīng)哪條折線 這時(shí)最好多用幾種顏色或長(zhǎng)短虛實(shí)等標(biāo)志畫出折線 下表是我國(guó)華北地區(qū)5個(gè)省市2003年城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出的六項(xiàng)指標(biāo)數(shù)據(jù)考慮微機(jī)的普及應(yīng)用 圖形的制作則通過電腦實(shí)現(xiàn) 輪廓圖 矩陣散點(diǎn)圖在SPSS中制作 雷達(dá)圖則在EXCEL中實(shí)現(xiàn) 表華北5省市城鎮(zhèn)居民家庭消費(fèi)性支出 在SPSS中作輪廓圖的方法如下 1 將原始數(shù)據(jù)輸入SPSS中 把不同地區(qū)當(dāng)成變量 而把支出指標(biāo)當(dāng)成觀測(cè) 作輪廓圖時(shí)的數(shù)據(jù)組織形式 2 選擇菜單項(xiàng)Graphs Line 打開LineCharts對(duì)話框 如圖 在對(duì)話框上方的三個(gè)選項(xiàng)用于選擇輪廓圖的形式 由于是這里是多變量作圖 所以選擇Multiple 在對(duì)話框下面的三個(gè)選項(xiàng)中選擇Valueofindividualcases 單擊Define按鈕 打開DefineMultipleLine對(duì)話框 LineCharts對(duì)話框 3 在DefineMultipleLine對(duì)話框中 將代表不同地區(qū)的5個(gè)變量移入LinesRepresent列表框中 將代表支出指標(biāo)的變量 variable 移入Variable框中 單擊OK按鈕 即可作出如圖所示的輪廓圖 從圖中可以清楚地看出北京市幾乎各項(xiàng)支出都排在第一 而山西省則幾乎每項(xiàng)支出都是最低的 DefineMultipleLine對(duì)話框 輪廓圖 散點(diǎn)圖又稱散布圖 它是以點(diǎn)的分布反映變量之間相關(guān)關(guān)系的可視化方法 矩陣散點(diǎn)圖則是一種反映多個(gè)變量之間相關(guān)關(guān)系的二維散點(diǎn)圖 利用SPSS制作矩陣散點(diǎn)圖的步驟如下 1 在SPSS中按圖11 6的形式組織數(shù)據(jù) 即把支出指標(biāo)當(dāng)成變量 而把不同地區(qū)當(dāng)成觀測(cè) 圖11 6作散點(diǎn)圖時(shí)的數(shù)據(jù)組織形式 2 選擇菜單項(xiàng)Graphs Scatter 打開Scatterplot對(duì)話框 如圖11 7 該對(duì)話框用于選擇散點(diǎn)圖的形式 選定Matrix 即矩陣散點(diǎn)圖 單擊Define按鈕 打開ScatterplotMatrix對(duì)話框 如圖11 8 圖11 7Scatterplot對(duì)話框 圖11 8ScatterplotMatrix對(duì)話框 3 在打開的ScatterplotMatrix對(duì)話框中 將食品 衣著 居住三個(gè)變量移入MatrixVariables列表框中 將標(biāo)志變量region移入LabelCasesby列表框中 4 點(diǎn)擊OK按鈕 得到如圖11 9所示的矩陣散點(diǎn)圖 從圖11 9可以看出 河北 山西 內(nèi)蒙古在居住和食品消費(fèi)支出方面與北京 天津相比較低 食品與居住支出變量之間存在一定的線性關(guān)系 天津在衣著支出方面較低 與最低的河北接近 與最高居住支出形成鮮明對(duì)比 北京則除在居住支出方面低于天津外 其他方面支出均高于華北其他省市 內(nèi)蒙古則在衣著支出方面僅次于北京 顯示出某種特殊消費(fèi)特征 矩陣散點(diǎn)圖 3 2雷達(dá)圖 作圖步驟 1 作一圓 并把圓周分為等分 2 連接圓心和各分點(diǎn) 把這條半徑依次定義為各變量的坐標(biāo)軸 并標(biāo)以適當(dāng)?shù)目潭?3 對(duì)給定的一次觀測(cè)值 把它的個(gè)分量值分別點(diǎn)在相應(yīng)的坐標(biāo)軸上 然后連接成一個(gè)邊形 這個(gè)邊形就是元觀測(cè)值的圖示 次觀測(cè)值可畫出個(gè)邊形 例如 根據(jù)前表中的數(shù)據(jù) 調(diào)用EXCEL圖表向?qū)?即可制作出如圖1 7所示的雷達(dá)圖 圖1畫出了北京 天津和河北的雷達(dá)圖 從圖可以看出 三省市消費(fèi)支出結(jié)構(gòu)有較大差異 北京人均消費(fèi)支出的各項(xiàng)指標(biāo)都高 對(duì)應(yīng)面積最大的六邊形 其次是天津 在三個(gè)省市中面積最小的是河北 天津在居住支出方面與北京較為接近 而在衣著和交通 通訊支出方面則與河北接近 其他支出方面三地存在較大差異 利用雷達(dá)圖的形狀 面積大小 可以對(duì)樣品進(jìn)行初始分類分析 為了加強(qiáng)雷達(dá)圖的效果 在雷達(dá)圖中適當(dāng)?shù)姆峙渥鴺?biāo)軸是很重要的 具體的分配辦法要結(jié)合分析的問題而定 例如可將要對(duì)比的指標(biāo)分布在左 右或上 下方 以便于對(duì)比分析 當(dāng)觀測(cè)次數(shù)n較大和指標(biāo)較多時(shí) 畫出的雷達(dá)圖線段太多 圖形的效果會(huì)很差 為了獲得較好的可視化效果 在一張雷達(dá)圖上可以畫幾個(gè)樣品觀測(cè)數(shù)據(jù) 甚至一張雷達(dá)圖只畫一個(gè)樣品觀測(cè)數(shù)據(jù) 如圖1 7所示 對(duì)這些圖進(jìn)行比較分析 也可了解其特點(diǎn) 圖1 圖2 圖3 圖4 圖5 圖6 圖7 當(dāng)觀測(cè)次數(shù)較大時(shí) 為使圖形清晰 每張圖可以只畫少數(shù)幾次觀測(cè)數(shù)據(jù) 甚至每張圖只畫一次觀測(cè)值 為了獲得較好的效果 在雷達(dá)圖中適當(dāng)分配變量的坐標(biāo)軸 并選取合適的尺度是十分重要的 注意 這里坐標(biāo)軸只有正半軸 因而只能表示非負(fù)數(shù)據(jù) 若有負(fù)數(shù)據(jù) 只能通過合理變換使之非負(fù)才行 3 3調(diào)和曲線圖 調(diào)和曲線圖的思想 把高維空間中的一個(gè)樣品點(diǎn)對(duì)應(yīng)于二維平面上的一條曲線 調(diào)和曲線圖是D F Andrews在1972年提出的三角多項(xiàng)式作圖法 所以又稱為三角多項(xiàng)式圖 上例數(shù)據(jù)北京 上海 陜西 甘肅分別對(duì)應(yīng)的曲線為 調(diào)和曲線圖 在多項(xiàng)式的圖表示中 當(dāng)各變量的數(shù)值太懸殊時(shí) 最好先標(biāo)準(zhǔn)化后再作圖 調(diào)和曲線圖對(duì)聚類分析很有幫助 如果選擇聚類統(tǒng)計(jì)量為距離的話 同類的曲線非常靠近擰在一起 不同類的曲線擰成不同的束 非常直觀 調(diào)和曲線的性質(zhì) 1 保線性關(guān)系 2 保歐式距離 3 4星座圖 思想 將高維空間中的樣品點(diǎn)投影到平面上的一個(gè)半圓內(nèi) 用投影點(diǎn)表示樣品點(diǎn) 作圖步驟 3 畫出一個(gè)半徑為1的上半圓及半圓底邊的直徑 下面對(duì)本章開頭所給出的數(shù)據(jù) 使用相同的權(quán)數(shù)作星座圖 由數(shù)據(jù)表易知 各指標(biāo)的最高分 最低分以及它們的級(jí)差分別為 它們的星座圖如下 在人工畫星座圖時(shí) 可按下面步驟去作 有時(shí)為了突出星星的位置 也可以不畫路徑 只畫星星 容易想象 如果這次觀測(cè)數(shù)據(jù)來自不同的類 且不同類的觀測(cè)數(shù)據(jù)所對(duì)應(yīng)的星星分別相對(duì)集中地散步在星座圖的不同區(qū)域 那么星座圖可能用于多變量數(shù)據(jù)的分類 從作圖過程可以看出 星星的位置和路徑與權(quán)數(shù)的選取有關(guān) 取不同的權(quán)數(shù) 畫出的星座圖也不同 一般權(quán)數(shù)選取的原則以實(shí)際問題的需要而定 通常情況對(duì)較重要指標(biāo)取權(quán)數(shù)大些 次要指標(biāo)取權(quán)數(shù)小些 如果指標(biāo)的重要程度相差不大或難以區(qū)分 則選取等權(quán) 多元數(shù)據(jù)的圖表示法還有很多 如臉譜圖 樹形圖 塑像圖等等 2020 4 25 41 目錄上頁下頁返回結(jié)束 3 5臉譜圖 臉譜圖是用臉譜來表達(dá)多變量的樣品 由美國(guó)統(tǒng)計(jì)學(xué)家H Chernoff于1970年首先提出 該方法是將觀測(cè)的個(gè)變量 指針 分別用臉的某一部位的形狀或大小來表示 一個(gè)樣品 觀測(cè) 可以畫成一張臉譜 他首先將該方法用于聚類分析 引起了各國(guó)統(tǒng)計(jì)學(xué)家的極大興趣 并對(duì)他的畫法作出了改進(jìn) 一些統(tǒng)計(jì)軟件也收入了臉譜圖分析法 國(guó)內(nèi)也有很多研究工作者將該方法應(yīng)用于多元統(tǒng)計(jì)分析中 2020 4 25 42 目錄上頁下頁返回結(jié)束 臉譜圖分析法的基本思想是由15 18個(gè)指針決定臉部特征 若實(shí)際資料變量更多將被忽略 有新的畫圖方法取消了臉的對(duì)稱性并引入更多臉部特征從而最多可以用36個(gè)變量來畫臉譜 若實(shí)際資料變量較少則臉部有些特征將被自動(dòng)固定 統(tǒng)計(jì)學(xué)曾給出了幾種不同的臉譜圖的畫法 而對(duì)于同一種臉譜圖的畫法 將變量次序重新排列 得到的臉譜的形狀也會(huì)有很大不同 此處我們不對(duì)臉譜的各個(gè)部位與原始變量的數(shù)學(xué)關(guān)系作過多探討 而只說明其作圖的思想及軟件實(shí)現(xiàn)方法 2020 4 25 43 目錄上頁下頁返回結(jié)束 按照切爾諾夫于1973年提出的畫法 采用15個(gè)指標(biāo) 各指標(biāo)代表的面部特征為 1表示臉的范圍 2表示臉的形狀 3表示鼻子的長(zhǎng)度 4表示嘴的位置 5表示笑容曲線 6表示嘴的寬度 7 11分別表示眼睛的位置 分開程度 角度 形狀和寬度 12表示瞳孔的位置 13 15分別表示眼眉的位置 角度及寬度 這樣 按照各變量的取值 根據(jù)一定的數(shù)學(xué)函數(shù)關(guān)系 就可以確定臉的輪廓 形狀及五官的部位 形狀 每一個(gè)樣本點(diǎn)都用一張臉譜來表示 而臉譜容易給人們留下較為深刻的印象 通過對(duì)臉譜的分析 就可以直觀地對(duì)原始資料進(jìn)行歸類或比較研究 2020 4 25 44 目錄上頁下頁返回結(jié)束 S Plus軟件收入了臉譜圖的作圖方法 下面我們舉例說明如何用S Plus軟件畫臉譜圖 例13 2 仍以我國(guó)35個(gè)上市公司的八大評(píng)價(jià)指標(biāo)為例說明 S Plus畫臉譜圖的方法非常簡(jiǎn)單 只要調(diào)用faces函數(shù)就可以實(shí)現(xiàn)了 將前面的資料的數(shù)字部分輸入S Plus 并令文件名為gongsi sdd 在命令窗口調(diào)用下面的函數(shù) faces data matrix gongsi fill T which 1 8 head Facesof35Companies ncol 5 scale T byrow T 回車運(yùn)行就可以生成35個(gè)公司的臉譜圖 每一個(gè)公司用一張臉譜表示出來 但是 此時(shí)生成的臉譜圖不好與公司名對(duì)應(yīng) 可將35個(gè)公司名放入一個(gè)向量a中 然后在上面的命令中加入選項(xiàng)labels a 即可生成如下臉譜圖 2020 4 25 45 目錄上頁下頁返回結(jié)束 2020 4 25 46 目錄上頁下頁返回結(jié)束 臉譜圖給人的感覺形象直觀 容易留下較深刻的印象 可以根據(jù)臉譜圖來對(duì)各公司的運(yùn)營(yíng)能力進(jìn)行比較 比如根據(jù)臉的范圍 凈資產(chǎn)收益率 來看 方正科技 清華同方 粵電力 深南電 金豐投資等公司處于較高水平 而象渝開發(fā) 粵宏遠(yuǎn) 寰島實(shí)業(yè)等公司明顯處于較低水平 類似可以對(duì)其他指標(biāo)進(jìn)行分析 利用臉譜圖 還可以直觀地對(duì)各個(gè)公司進(jìn)行歸類 由上圖看來 方正科技 深南電 深能源 中興通訊 粵電力 清華同方 金豐等公司大致可以歸為一類 穗恒運(yùn) 長(zhǎng)城計(jì)算機(jī) 永鼎光纜 宏圖高科大致可以歸為一類 富龍熱力 韶能股分 惠天熱電 大連熱電 華銀電力 長(zhǎng)春經(jīng)開 新黃浦 遼房天 三木集團(tuán) 青鳥華光 海星科技 龍電股分等公司可以歸為一類 剩余的公司大體可以歸為一類 此處不再詳述 2020 4 25 47 目錄上頁下頁返回結(jié)束 在利用臉譜圖工具對(duì)觀測(cè)進(jìn)行比較分析時(shí) 值得注意的一點(diǎn)是臉譜的形狀受各變量次序的影響很大 在本例中如果把八個(gè)指標(biāo)的次序換一下 得到的臉譜圖就會(huì)有很大不同 而且 根據(jù)臉譜圖對(duì)各公司的歸類有很大的主觀性 因?yàn)椴煌娜怂P(guān)注的臉的部位有很大不同 如有些人對(duì)臉的胖瘦比較在意 而有的人對(duì)五官的印象特別深
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇省南通市南通中學(xué)2024-2025學(xué)年高一上學(xué)期第二次月考英語試題(解析版)
- 老年褥瘡護(hù)理課件
- 老年病中醫(yī)課件
- 海洋文化旅游線路設(shè)計(jì)
- 老年護(hù)理輪椅課件
- 老師管課件的職業(yè)
- 綠色倉(cāng)儲(chǔ)企業(yè)倉(cāng)庫保管員環(huán)保責(zé)任合同
- 車展展會(huì)現(xiàn)場(chǎng)安全保衛(wèi)與服務(wù)合同
- 離婚財(cái)產(chǎn)分割及債務(wù)承擔(dān)補(bǔ)充協(xié)議
- 高鐵站停車場(chǎng)車位代理銷售及客運(yùn)服務(wù)合同
- 醫(yī)患之間暴力行為預(yù)防與處理管理制度
- 2022年版初中物理課程標(biāo)準(zhǔn)解讀-課件
- MOOC 大學(xué)物理實(shí)驗(yàn)-鄭州大學(xué) 中國(guó)大學(xué)慕課答案
- 眼科臨床路徑培訓(xùn)記錄課件
- 術(shù)后病人燙傷不良事件PDCA循環(huán)分析課件
- 學(xué)校作業(yè)檢查總結(jié)匯報(bào)
- 骨科手術(shù)后的康復(fù)輔助器具和輔助裝置
- 學(xué)校課程體系建設(shè)與調(diào)整情況匯報(bào)
- 鐵路路基施工與維護(hù)習(xí)題集
- 音樂考試真題
- 彩鋼屋面自粘卷材施工方案
評(píng)論
0/150
提交評(píng)論