SPSS數(shù)據(jù)的判別分析

上傳人：1*** IP屬地：廣西上傳時(shí)間：2024-03-15 格式：PPT 頁數(shù)：81 大小：6.65MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩76頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

判別分析(DiscriminateAnalysis)知識要點(diǎn)：1、什么是判別分析？2、理解距離判別、Bayes判別以及Fisher判別的根本思想3、結(jié)合SPSS軟件進(jìn)行案例分析4、判別分析的應(yīng)用〔※※〕zf醫(yī)學(xué)：例1：在醫(yī)學(xué)診斷中，一個(gè)病人肺部有陰影，醫(yī)生要判斷他患的是肺結(jié)核、肺部良性腫瘤還是肺癌？肺結(jié)核病人、肺部良性腫瘤病人、肺癌病人組成三個(gè)總體，病人來自其中一個(gè)總體，可通過病人的指標(biāo)〔陰影大小、邊緣是否光滑等〕用判別分析判斷他來自哪個(gè)總體〔即判斷他患的什么??？〕判別分析的應(yīng)用zf經(jīng)濟(jì)學(xué)：例2：股票持有者根據(jù)股票近期的變化情況判斷此種股票價(jià)格下一周是上升還是下跌？例3：依據(jù)一個(gè)企業(yè)稅務(wù)報(bào)表的數(shù)據(jù)，判斷該企業(yè)是否逃稅；zf例4：為了研究中小企業(yè)的破產(chǎn)模型，選定4個(gè)經(jīng)濟(jì)指標(biāo)：X1總負(fù)債率〔現(xiàn)金收益/總負(fù)債〕X2收益性指標(biāo)〔純收入/總財(cái)產(chǎn)〕X3短期支付能力〔流動資產(chǎn)/流動負(fù)債〕X4生產(chǎn)效率性指標(biāo)〔流動資產(chǎn)/純銷售額〕對17個(gè)破產(chǎn)企業(yè)〔1類〕和21個(gè)正常運(yùn)行企業(yè)〔2類〕進(jìn)行了調(diào)查，得如下資料：zf總負(fù)債率收益性指標(biāo)短期支付能力生產(chǎn)效率指標(biāo)類別-.45-.411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532zf.38.113.27.552.19.052.25.332.32.074.24.632.31.054.45.692.12.052.52.692-.02.022.05.352.22.082.35.402.17.071.80.522.15.052.17.552-.10-1.012.50.582.14-.03.46.262.14.072.61.522-.33-.093.01.472.48.091.24.182.56.114.29.452.20.081.99.302.47.142.92.452.17.042.45.142.58.045.06.132.04.011.50.71待判-.06-.061.37.40待判zf.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判zf企業(yè)序號判別類型判別函數(shù)得分判別為1的概率判別的為2概率11-.56509.69479.3052121-.89817.80234.1976631-.59642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.6799572.27925.34442.65558821.24010.09012.90988zf如何進(jìn)行判類？

---判別分析的根本思想一、什么是判別分析？判別分析：根據(jù)對象的某些觀測指標(biāo)和所屬類別來判斷未知對象所屬類別的一種統(tǒng)計(jì)學(xué)方法。判別分析的特點(diǎn)〔根本思想〕：〔1〕根據(jù)已掌握的、歷史上假設(shè)干樣本的p個(gè)指標(biāo)數(shù)據(jù)及所屬類別的信息，總結(jié)出該事物分類的規(guī)律性，建立判別公式和判別準(zhǔn)那么?！?〕根據(jù)總結(jié)出來的判別公式和判別準(zhǔn)那么，判別未知類別的樣本點(diǎn)所屬的類別。zf二、判別分析的要求和假設(shè)條件變量屬性：被解釋變量是屬性變量(nonmetricvariables)；解釋變量是度量變量(metricvariables)判別分析最根本的要求：〔1〕分組類型在兩組以上；〔2〕分類的樣本中，每組案例的規(guī)模必須至少在一個(gè)以上；〔3〕解釋變量必須是可測量的，才能計(jì)算其平均值和方差，使其合理地應(yīng)用于統(tǒng)計(jì)函數(shù)。zf假設(shè)條件：〔1〕每一個(gè)判別變量〔解釋變量〕不能是其他判別變量的線性組合〔防止多重共線性問題〕。否那么，參數(shù)估計(jì)的標(biāo)準(zhǔn)誤將很大，以至于參數(shù)估計(jì)統(tǒng)計(jì)上不顯著?！?〕各組變量的協(xié)方差矩陣相等。在此假設(shè)下，可以使用很簡單的公式計(jì)算判別函數(shù)和進(jìn)行顯著性檢驗(yàn)?！?〕各判別變量之間具有多元正態(tài)分布，即每個(gè)變量對于所有其他變量的固定值有正態(tài)分布。在此條件下，可精確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。zf三、判別分析方法zf首先根據(jù)分類的數(shù)據(jù)，分別計(jì)算各類的重心即各組〔類〕的均值，判別的準(zhǔn)那么是對任給樣品，計(jì)算它到各類平均數(shù)的距離，哪個(gè)距離最小就將它判歸哪個(gè)類?！惨弧硟蓚€(gè)總體的距離判別法設(shè)有兩個(gè)p維正態(tài)總體G1、G2，對給定的樣本Y，可用如下規(guī)那么判別：假設(shè)樣本Y到總體G1的距離小于到總體G2的距離，那么認(rèn)為樣本Y屬于總體G1；反之，那么認(rèn)為樣本Y屬于總體G2；假設(shè)樣本Y到總體G1和G2的距離相等，那么讓它待判。距離判別zf判別函數(shù)，令判別法那么：W是關(guān)于y的線性函數(shù)，是的p維向量，是W的判別系數(shù)1、方差相等：zf2、總體協(xié)方差，且不相等：判別函數(shù)：判別法那么：zf設(shè)有個(gè)K總體，分別有均值向量(i=1,2,…,k)和協(xié)方差陣∑i=∑，又設(shè)Y是一個(gè)待判樣品。那么Y與各總體的距離為〔即判別函數(shù)〕：〔二〕多總體的距離判別法判別函數(shù)：判別法那么：注：這與距離判別是等價(jià)的.協(xié)方差陣相等：距離判別缺點(diǎn)：沒有考慮到每個(gè)總體出現(xiàn)的時(shí)機(jī)大小，即先驗(yàn)概率，沒有考慮到錯(cuò)判的損失判別函數(shù)：判別法那么：判別函數(shù)：注：這與距離判別是等價(jià)的.判別法那么：判別函數(shù)：注：這與距離判別是等價(jià)的.判別法那么：判別函數(shù)：zf〔三〕距離判別法的優(yōu)缺點(diǎn)：該方法簡單實(shí)用，但沒有考慮到每個(gè)總體出現(xiàn)的時(shí)機(jī)大小，即先驗(yàn)概率，沒有考慮到錯(cuò)判的損失。貝葉斯判別法正是為了解決這兩個(gè)問題提出的判別分析方法。zf通過計(jì)算被判樣本x屬于k個(gè)總體的條件概率P(n/x),n=1,2…..k.比較k個(gè)概率的大小，將樣本判歸為來自出現(xiàn)概率最大的總體〔或歸屬于錯(cuò)判概率最小的總體〕的判別方法?？紤]誤判損失，比較各類錯(cuò)判損失大小，選取其中最小的，那么判定樣品屬于該總體。貝葉斯(Bayes)判別zf例：下表是某金融機(jī)構(gòu)客戶的個(gè)人資料，這些資料對一個(gè)金融機(jī)構(gòu)來說，對于客戶信用度的了解至關(guān)重要，因?yàn)槔眠@些資料，可以挖掘出許多的信息，建立客戶的信用度評價(jià)體系。所選變量為：

x1:月收入

x2：月生活費(fèi)支出

x3：虛擬變量，住房的所有權(quán)，自己的為“1”，租用的“0”

x4：目前工作的年限

x5：前一個(gè)工作的年限

x6：目前住所的年限

x7：前一個(gè)住所的年限X8:家庭贍養(yǎng)的人口數(shù)X9：信用程度，“5”的信用度最高，“1”的信用度最低。zfzfzf用投影的方法將k個(gè)不同總體的p維數(shù)據(jù)投影到某一個(gè)方向，使不同總體之間的p維數(shù)據(jù)投影盡可能分開，同一總體內(nèi)的各樣本點(diǎn)盡可能的集中。用方差分析的思想那么可構(gòu)建一個(gè)較好區(qū)分各個(gè)總體的線性判別法。Fisher判別zf變量選擇和逐步判別法向后剔除開始時(shí)，所有變量都在模型中。每一步，在Wilks的統(tǒng)計(jì)量的準(zhǔn)那么下對模型中判別能力奉獻(xiàn)最小的變量剔除。當(dāng)所有余下的變量都到達(dá)留在模型中的標(biāo)準(zhǔn)時(shí)，向后剔除過程停止。向前選入開始時(shí)模型中沒有變量。每一步，Wilks的統(tǒng)計(jì)量最小者，進(jìn)入模型。當(dāng)不再有未被選入的變量小于選入的臨界值時(shí)，向前選入過程停止。zf逐步選擇開始時(shí)如同向前選擇一樣，模型中沒有變量，每一步都被檢查。如果在Wilks的準(zhǔn)那么下統(tǒng)計(jì)量對模型的判別能力奉獻(xiàn)最小的變量達(dá)不到留在模型中的標(biāo)準(zhǔn)，它就被剔除。否那么，不在模型中對模型的判別能力奉獻(xiàn)最大的變量被選入模型。當(dāng)模型中的所有變量都到達(dá)留在模型中的標(biāo)準(zhǔn)而沒有其他變量能到達(dá)進(jìn)入模型的標(biāo)準(zhǔn)，逐步選擇過程停止。逐步判別法采用有進(jìn)有出的算法，即每一步都進(jìn)行檢驗(yàn)。首先，將判別能力最強(qiáng)的變量引進(jìn)判別函數(shù)，而對較早進(jìn)入判別函數(shù)的變量，隨著其他變量的進(jìn)入，其顯著性可能發(fā)生變化，如果其判別能力不強(qiáng)了，那么刪除。zf判別分析方法步驟及框圖

zf判別分析的案例分析與SPSS操作步驟執(zhí)行菜單命令，單擊[分析Analyze]、[分類Classify]、[判別Discriminant]zf⑴指定分組變量及其取值范圍。

將分組變量從源變量窗口通過選擇箭頭選到分組變量窗口“Groupingvariable”。并從“DefineRange”按鈕定義分組變量的取值范圍，給定最小值Minimum和最大值Maximum。⑵指定判別函數(shù)中的自變量。

將自變量從源變量窗口通過選擇箭頭選到自變量窗口。⑶選擇使用自變量的方法。

對于選定的自變量可以全部應(yīng)用到判別函數(shù)中去，這是系統(tǒng)默認(rèn)的使用全部自變量法“Enterindependenttogether”。如果要對變量進(jìn)行篩選檢驗(yàn)，將使用選項(xiàng)逐步進(jìn)入法“Usestepwisemethod”。使用該方法后，按鈕“Method”將被激活zfλ=組內(nèi)平方和/總平方和zfzf計(jì)算各類別及總體各變量均值、標(biāo)準(zhǔn)差⑷統(tǒng)計(jì)量、矩陣和函數(shù)系數(shù)的計(jì)算按鈕“Statistics”將翻開統(tǒng)計(jì)計(jì)算窗口。輸出單變量方差分析結(jié)果各類協(xié)方差矩陣相等的檢驗(yàn)選擇判別函數(shù)系數(shù)輸出形式Fisher判別系數(shù)非標(biāo)準(zhǔn)化判別系數(shù)組內(nèi)相關(guān)矩陣合并組內(nèi)協(xié)方差矩陣組間協(xié)方差矩陣總協(xié)方差矩陣指定自變量的相關(guān)矩陣zfzf⑸分類方式和判別結(jié)果單擊按鈕“Classify”將設(shè)置分類所依據(jù)的判別先驗(yàn)概率和協(xié)方差矩陣，以及輸出圖形和顯示結(jié)果先驗(yàn)概率的設(shè)定各類取相等先驗(yàn)概率根據(jù)各類樣本個(gè)數(shù)計(jì)算先驗(yàn)概率輸出分析結(jié)果輸出各樣本的分類結(jié)果如判別得分、判別類等交叉檢驗(yàn)結(jié)果將缺失值用均值替代選擇分類使用的協(xié)方差陣組內(nèi)協(xié)方差陣分組協(xié)方差陣作圖生成一張包括各類的散點(diǎn)圖分類顯示各個(gè)類的散點(diǎn)圖分界圖，將坐標(biāo)平面劃分為不同的區(qū)域，每個(gè)區(qū)域?qū)⒋硪粋€(gè)類zfzfzf⑹在SPSS數(shù)據(jù)文件中生成新變量單擊“SAVE”按鈕，保存預(yù)測的組別，判別得分和各組成員的事后概率建立一個(gè)標(biāo)明每個(gè)樣本所屬的類別的變量生成一個(gè)判別得分變量樣本屬于某類的概率zf案例解析：人類開展?fàn)顩r判類1990聯(lián)合國開發(fā)方案署公布的《人類開展報(bào)告》，用出生時(shí)的預(yù)期壽命〔x1〕、成人識字率〔x2〕、調(diào)整后的人均GDP〔x3)等三個(gè)變量衡量人類開展?fàn)顩r，現(xiàn)從高開展水平國家和中等開展水平國家中各選了5個(gè)樣本，另選中國、希臘等作為待判樣本。要求：構(gòu)建判別函數(shù)進(jìn)行判別分析?！惨姅?shù)據(jù)1995人類開展報(bào)告局部數(shù)據(jù).SAV)zfzf該案例的SPSS操作步驟：1、Analyze－Classify－Discriminant2、在判別分析窗口將分組變量‘經(jīng)濟(jì)開展程度〔region〕’選入“Groupingvariable”框。并從“DefineRange”按鈕定義分組變量的取值范圍，給定最小值Minimum設(shè)定為1和最大值Maximum設(shè)定為2。zfzf3、將判別依據(jù)變量出生時(shí)的預(yù)期壽命、成人識字率、調(diào)整后的人均GDP從源變量窗口通過選擇箭頭選到自變量窗口點(diǎn)擊Statistics按鈕4、在Statistics對話框選擇方差分析〔UnivariateANOVAs〕和方差相等檢驗(yàn)〔Box’sM〕以及判別函數(shù)系數(shù)中的Fisher’s和Unstandardized.點(diǎn)擊Statistics按鈕zf點(diǎn)擊Classify按鈕5、在Classify對話框在display中選擇‘Summarytable’和‘Leaf-one-outclassification’;在plots中選擇分界圖‘Territorialmap’點(diǎn)擊Classify按鈕zf點(diǎn)擊Save按鈕5、在Save對話框在中選擇預(yù)測分組變量‘Predictedgroupmembership’和判別函數(shù)得分變量‘Discriminantscores’以及各組的條件概率變量‘Probabilitiesofgroupmembership’

6、點(diǎn)擊Save對話框中的‘Continue’；再點(diǎn)擊Discriminant

Anlysis對話框中‘Ok’zf輸出結(jié)果及分析樣本描述：該例中有效樣本有10個(gè)，有效率為71.4%;缺失樣本為4，缺失率為28.8%判別依據(jù)變量在各組及總體中有效樣本量情況zf方差分析表：判別依據(jù)變量在各組中的均值相等檢驗(yàn)。從該表中可看出各組之間的調(diào)整后的人均GDP存在顯著差異，該變量對分組起著重要作用各組協(xié)方差矩陣的行列式值各組協(xié)方差矩陣相等的檢驗(yàn)。零假設(shè)認(rèn)為各組方差相等，該例中零假設(shè)出現(xiàn)的可能性為0.02，說明各組方差不等，嚴(yán)格意義上應(yīng)構(gòu)建非線性判別函數(shù)zfSummaryofCanonicalDiscriminantFunctions〔典型判別函數(shù)的相關(guān)描述〕構(gòu)建的典型判別函數(shù)的奉獻(xiàn)率：對原始信息的包含量。從表中可看出，本例構(gòu)建了1個(gè)典型判別函數(shù)，其奉獻(xiàn)率為100％。構(gòu)建的典型判別函數(shù)模型顯著性檢驗(yàn)。零假設(shè)為：典型判別函數(shù)模型不顯著；從表中可看出，本例構(gòu)建的典型判別函數(shù)是顯著的〔Sig值為0.008〕。zf標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)表。從該表可寫出標(biāo)準(zhǔn)化的典型判別函數(shù)模型：f1=0.625*標(biāo)準(zhǔn)化的出生時(shí)的預(yù)期壽命-0.025*標(biāo)準(zhǔn)化的成人識字率*+0.975*標(biāo)準(zhǔn)化的調(diào)整后的人均GDP從該表中各函數(shù)系數(shù)的絕對值大小進(jìn)行比較，還可看出哪些變量對構(gòu)建判別函數(shù)起著重要作用：本例中調(diào)整后的人均GDP對構(gòu)建的判別函數(shù)起著重要作用；出生時(shí)的預(yù)期壽命那么次之。該表反映的是判別依據(jù)變量與判別函數(shù)之間的相關(guān)關(guān)系；系數(shù)值越大，說明相應(yīng)變量對判類起著重要作用〔與上表功用類似〕zf非標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)表。從該表可寫出非標(biāo)準(zhǔn)化的典型判別函數(shù)模型：f1=0.159*出生時(shí)的預(yù)期壽命-0.003*成人識字率*+0.002*調(diào)整后的人均GDP-19.334每組重心代入非標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)后的取值。由該重心的函數(shù)取值可計(jì)算分類的臨界值：本例為臨界值Z＝(2.046-2.046)/2=0；將14個(gè)樣本數(shù)據(jù)代入非標(biāo)準(zhǔn)化的典型判別函數(shù)模型，得到各樣本的函數(shù)取值；取值大于0的樣本，判到‘高開展水平國家’；反之，判到‘中等開展水平國家’。zf以下3個(gè)表為在Statistics對話框中的判別函數(shù)系數(shù)中選擇Fisher’s出現(xiàn)的結(jié)果?！餐ǔ？刹贿x擇該選項(xiàng)，不列示以下結(jié)果〕以下結(jié)果是依據(jù)Bayes判別法，設(shè)定先驗(yàn)概率〔Priorprobabilities〕,將后驗(yàn)概率判別轉(zhuǎn)化為距離判別，得到分組的線性判別函數(shù)。進(jìn)入分析的樣本數(shù)每組先驗(yàn)概率設(shè)定情況，本例中兩組的先驗(yàn)概率為相等，為0.5。分組的線性判別函數(shù)系數(shù)表。該例中，快樂旺國家的函數(shù)模型：f=5.742*出生時(shí)的預(yù)期壽命+0.221*成人識字率*+0.081*調(diào)整后的人均GDP-311.823；中等開展國家的函數(shù)模型：f=5.093*出生時(shí)的預(yù)期壽命+0.234*成人識字率*+0.024*調(diào)整后的人均GDP-232.705；依據(jù)兩模型每個(gè)樣本有兩個(gè)函數(shù)取值，哪個(gè)大判到哪一類。zf分類預(yù)測效果表依據(jù)函數(shù)的分類預(yù)測情況交叉檢驗(yàn)：分類預(yù)測效果檢驗(yàn)從該表的Original局部，可看出：高開展水平國家原始樣本有5個(gè)，正確判類個(gè)數(shù)為5個(gè)，正判率為100%；中等開展國家原始樣本有5個(gè)，正確判類個(gè)數(shù)為5個(gè)，正判率為100%；待判樣本有5個(gè)，其中2個(gè)判到高開展國家，有2個(gè)判到中等開展國家。總體正判率為100%;從該表的Cross-validated(交叉檢驗(yàn))局部，可看出：高開展水平國家原始樣本有5個(gè)，正確判類個(gè)數(shù)為4個(gè)，正判率為80%，誤判率為20％；中等開展國家原始樣本有5個(gè)，正確判類個(gè)數(shù)為5個(gè)，正判率為100%；總體正判率為90%。zf最終的數(shù)據(jù)文件，增加了4個(gè)新變量。這是點(diǎn)擊Save按鈕中選擇預(yù)測分組變量‘Predictedgroupmembership’和判別函數(shù)得分變量‘Discriminantscores’以及各組的條件概率變量‘Probabilitiesofgroupmembership’等后，系統(tǒng)將這些變量信息保存到數(shù)據(jù)文件的結(jié)果。zf例1：企圖用一套打分體系來描繪企業(yè)的狀況。該體系對每個(gè)企業(yè)的一些指標(biāo)〔變量〕進(jìn)行評分。這些指標(biāo)包括：企業(yè)規(guī)模(is)、效勞(se)、雇員工資比例(sa)、利潤增長(prr)、市場份額(ms)、市場份額增長(msr)、流動資金比例(cp)、資金周轉(zhuǎn)速度(cs)等等。另外，有一些企業(yè)已經(jīng)被某雜志劃分為上升企業(yè)、穩(wěn)定企業(yè)和下降企業(yè)。我們希望根據(jù)這些企業(yè)的上述變量的打分和它們的類別找出一個(gè)分類標(biāo)準(zhǔn)，以對沒有被該刊物分類的企業(yè)進(jìn)行分類。zf利用SPSS軟件的逐步判別法淘汰了不顯著的流動資金比例(cp)，還剩下七個(gè)變量is，se，sa，prr，ms，msr，cs，得到兩個(gè)典那么判別函數(shù)〔CanonicalDiscriminantFunctionCoefficients〕：這兩個(gè)函數(shù)實(shí)際上是由Fisher判別法得到的向兩個(gè)方向的投影。這兩個(gè)典那么判別函數(shù)的系數(shù)是下面的SPSS輸出得到的：zfSPSS分析結(jié)果之一：典型判別函數(shù)系數(shù)矩陣?yán)弥鸩脚袆e法淘汰了不顯著的流動資金比例(cp)兩個(gè)典型判別函數(shù)：這兩個(gè)函數(shù)實(shí)際上是由Fisher判別法得到的向兩個(gè)方向的投影。zfSPSS分析結(jié)果之一：樣本分組散點(diǎn)圖根據(jù)兩個(gè)典型判別函數(shù)算出的樣本觀測值繪制處二維平面圖從上圖可以看出，第一個(gè)投影〔相應(yīng)于來自于第一個(gè)典那么判別函數(shù)橫坐標(biāo)值〕已經(jīng)能夠很好地分辨出三個(gè)企業(yè)類型了。這兩個(gè)典那么判別函數(shù)并不是平等的。其實(shí)一個(gè)函數(shù)就已經(jīng)能夠把這三類分清楚了。zfSPSS分析結(jié)果之一：特征根表〔反映構(gòu)建的判別函數(shù)〔投影〕的重要程度〕該表說明第一個(gè)函數(shù)的奉獻(xiàn)率已經(jīng)是99%了，而第二個(gè)只有1%。zfSPSS分析結(jié)果之一：分類線性函數(shù)系數(shù)矩陣該表給出了三個(gè)線性分類函數(shù)的系數(shù)。把每個(gè)觀測點(diǎn)帶入三個(gè)函數(shù)，就可以得到分別代表三類的三個(gè)值，哪個(gè)值最大，該點(diǎn)就屬于相應(yīng)的那一類。見下頁幻燈zf樣本Y到Gi的距離：注：這與距離判別是等價(jià)的.判別法那么：判別函數(shù)：備注：zfSPSS分析結(jié)果之一：利用構(gòu)建的判別函數(shù)分類情況及交叉檢驗(yàn)結(jié)果該表反映構(gòu)建的判別函數(shù)進(jìn)行預(yù)測判類的效果狀況。從該表可看出該例對所有樣本進(jìn)行預(yù)測的準(zhǔn)確率為100%；進(jìn)行交叉檢驗(yàn)也可看到判別函數(shù)的判類準(zhǔn)確率也為100%。說明構(gòu)建的函數(shù)模型進(jìn)行預(yù)測非常有效。zf例2：鳶尾花數(shù)據(jù)(花瓣,花萼的長寬)5個(gè)變量:花瓣長(slen),花瓣寬(swid),花萼長(plen),花萼寬(pwid),分類號(1:Setosa,2:Versicolor,3:Virginica)(data14-04)zf鳶尾花數(shù)據(jù)(數(shù)據(jù)分析過程簡明表)zf鳶尾花數(shù)據(jù)(原始數(shù)據(jù)的描述)zf鳶尾花數(shù)據(jù)(合并類內(nèi)相關(guān)陣和協(xié)方差陣)zf鳶尾花數(shù)據(jù)(總協(xié)方差陣)zf鳶尾花數(shù)據(jù)(特征值表)Eigenvalue:用于分析的前兩個(gè)典型判別函數(shù)的特征值,是組間平方和與組內(nèi)平方和之比值.最大特征值與組均值最大的向量對應(yīng),第二大特征值對應(yīng)著次大的組均值向量

典型相關(guān)系數(shù)(canonicalcorrelation):是組間平方和與總平方和之比的平方根.zf鳶尾花數(shù)據(jù)(Wilks’Lambda統(tǒng)計(jì)量)檢驗(yàn)判別函數(shù)1和2是否顯著.zf鳶尾花數(shù)據(jù)(有關(guān)判別函數(shù)的輸出)標(biāo)準(zhǔn)化的典型判別函數(shù)系數(shù)(使用時(shí)必須用標(biāo)準(zhǔn)化的自變量)zf典型判別函數(shù)系數(shù)zf類均值(重心)處的典那么判別函數(shù)值zf鳶尾花數(shù)據(jù)(用判別函數(shù)對觀測量分類結(jié)果)先驗(yàn)概率費(fèi)歇判別函數(shù)系數(shù)把自變量代入三個(gè)式子,哪個(gè)大歸誰.zfTerritoryMap(區(qū)域圖)CanonicalDiscriminateFunction1VersusCanonicalDiscriminateFunction2三種鳶尾花的典型變量值把一個(gè)典型變量組成的坐標(biāo)平面分成三個(gè)區(qū)域.*為中心坐標(biāo).

TerritorialMapCanonicalDiscriminantFunction2-12.0-8.0-4.0.04.08.012.0

趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌趄蝌蝌蝌蝌12.01223122312231223122312238.01223122312231223122312234.0122312231223122312231223*.0*122312*231223122312231223-4.0122312231223122312231223-8.01223122312231223122312

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

SPSS數(shù)據(jù)的判別分析

文檔簡介

溫馨提示

最新文檔

評論

SPSS數(shù)據(jù)的判別分析

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔