2016年北大暑期社科軟件使用教程spss190經(jīng)典

上傳人：湯*** IP屬地：北京上傳時間：2023-04-20 格式：DOCX 頁數(shù)：1216 大?。?.56MB 積分：35 舉報 版權(quán)申訴

已閱讀5頁，還剩1211頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

)】命令，彈出【OpenData(打開數(shù)Database(打開數(shù)據(jù)庫)】→【NewQuery(新建查詢)】命令，彈出【DatabaseWizard菜單欄中的【File(文件)】→【ReadTextData(打開文本數(shù)據(jù))】命令，彈出【OpenData(打開數(shù)據(jù))】對話框。這里 →【Open( 【OpenData在【Filesoftype(文件類型)】下拉列表框中指彈出的對框中的【Readvariablenamesfromthefirstrowofdate(從第一行數(shù)據(jù)讀取變量名)】復(fù)選框表【VariableView構(gòu)定義窗口。戶可以在該窗口中設(shè)定或修改文件【DecimalsPlaces】文本框可以設(shè)置變量的小變量值標(biāo)簽alues)是量的可能的取值的含義進(jìn)行進(jìn)一步說明。量值標(biāo)簽特于數(shù)值型變量表示非數(shù)值型變量時尤其有。定義和修改變量值標(biāo)，可以雙擊要修改值的單元格，在彈出的對話框的alu值)】文本框中輸入變量值，在【Label 2.2.11實例分析：員工滿意度管理制度，并達(dá)到有的放矢目的，某公司決定對本公司員工進(jìn)行不記名調(diào)希望了解員工對公司的滿意情況。請根據(jù)該公司計的員工滿意度調(diào)查數(shù)據(jù)在SS的數(shù)據(jù)屬性。 Step01：打開SPSS中的DataView窗口，錄入或?qū)隨tep03：單SPSS中的【VariableView(變量視圖)】【Data(數(shù)據(jù))】→【SortCases【SortCases擊右向箭頭按鈕，將其移動至【Sortby(排序依在【SortOrder(排列順序)】選項組中可以選擇變→【Sort 序個案)】命令，彈出【SortCases(序個案)】對單擊右向箭頭按鈕，將變量選擇進(jìn)入【Sortby(排序打開SPSS軟件，選擇菜單欄中的【FileData(【NameVariable擇變量命名，則系統(tǒng)將自動給轉(zhuǎn)置后的新變量賦予Var001（2-4【data(數(shù)據(jù))】→【MergeFiles(合并文件)】菜單中有兩個命令選項：【AddCases(添加個案)】和【AddVariables(添加變量)】。【MergeFiles(合并文件)】→【AddCases(添加個案)】命令，彈出【AddCases(添加個案)】對話框點選【AnexternalSPSSStatisticsdatafile(外部SPSSSta變量（KeyVariable），而且這兩個文件中的關(guān)鍵變數(shù)據(jù)分類匯總的范疇分類變量（BreakVariable）：它是對樣本數(shù)據(jù)進(jìn)行匯總變量（AggregateVariable）：利用源數(shù)據(jù)文件據(jù))】→【Aggregate(分類匯總)】命令，彈出【AggregateD作為分類變量，將其移入【BreakVariable(s)(分組變作為匯總變量，將其移入【SummariesofVariable(s)(變在【SummariesofVariable(s)(變量摘要)】列表框中可以在【SummariesofVariable(s)(變量摘要)】列表框中可以選擇相應(yīng)匯總變量，此時可以單擊下方的【Nameand勾選【OptionsforVeryLargeDatasets(適用于大型數(shù)據(jù)從話框左側(cè)候選變量列表框中選擇“省份”變量作分類變量其移入【BreakVariable(s)(分組sofVariable(s)(在【Save(保存)】選項組中點選【W(wǎng)riteanewdatafilecontainingonlytheaggregatedvariables】單選【Data(數(shù)據(jù))】→【SplitFile(拆分文件)】命令，彈 Step03：按上述操作，點選【Analyzeallcases，donotcreateStep01據(jù))】→【SelectCases(選擇個案)】命令，彈出【SelectCases(選單擊【If在【SelectCases(選擇個案)】對話框的【條件二：隨機(jī)選取10點選【Ifconditionissatisfied(如果條件滿足)】選 samplesofcases(隨機(jī)個案樣本)】單選鈕，同時在彈出的【SelectCases：RandomSample(選擇個案：隨機(jī)樣本)】對話框的“Exactlycasesformthefiirstcases”文本念。權(quán)重大小描述了該指標(biāo)在整體評價中的相對重要程度。在據(jù)處理中，常需要對數(shù)據(jù)進(jìn)行加權(quán)處理。量出現(xiàn)的次數(shù)，這樣后續(xù)的統(tǒng)計析工作就會極大的簡打開SPSS軟件，菜單欄中的【File(文件)】→【Data(數(shù)據(jù))】→【W(wǎng)eigcases(加權(quán)個案)】命令，彈出【W(wǎng)eight【FrequenciesVariableStep02Donotweightcases：不對觀測量加權(quán)，系統(tǒng) sesby：對觀測量加權(quán)，同時從左側(cè) 按鈕，操作結(jié)束在【TargetVariable(目標(biāo)變量)】文本框中用戶需要mericExpression(數(shù)值表達(dá)式)】文本中。如果用戶Step04單擊【IfStep02在argetVariable(目標(biāo)變量)】文本框中定義在【NumericExpression(數(shù)值表達(dá)式)】文本框中輸入計算表達(dá)a=第一產(chǎn)業(yè)/國內(nèi)生產(chǎn)總值”。SPSS的【Transform(轉(zhuǎn)換)】菜單中有【RecodeintoSameVariable(重新編碼為相同變量)】和【RecodeintoDifferentVariable(重新編碼為不同變量)】兩個命令下面以【RecodeintoDifferentVariable(重新編碼為不同換)】→【RecodeintoDifferentVariable(重新編碼為不同變量列表框中選擇要重新賦值的變量，將其移 putVariable->OutputVariable(輸入變量->輸出變量)】列表框中，同時在【OutputVariable(輸出變鈕賦值轉(zhuǎn)換【OldandNewValue】按鈕被激活，單擊此按鈕，putVariable->OutputVariable(輸入變量->輸出變量)】列表框，同時在【OutputVariable(輸出變上述操作后，單擊【OldandNewValue】按鈕。行產(chǎn)品市查時，要了解在所有的調(diào)查客戶中有多少人使該產(chǎn)品，這就可以采用變量值計數(shù)功→【Transform(轉(zhuǎn)換)】→【CountValueswithinCasOccurrencesofValueswithinCases(計算個案內(nèi)值的在【TargetVariable(目標(biāo)變量)】文本框中輸入需要計數(shù)的變量名稱，同時在【TargetLabel(目標(biāo)標(biāo)簽)】文本框Step03：在左側(cè)的選變量列表框中選擇計數(shù)變量，將其移入型變量時，該欄標(biāo)題改為“NumberVariables”；當(dāng)移入變量為字符型變量時，標(biāo)題改為“StringVariables”。進(jìn)行上述操作后，【DefineValues】按鈕被激活，單Step02在【TargetVariable(目標(biāo)變量)】文本框中輸入需要計數(shù)的變量名稱“x”，同時在【TargetLabel(目標(biāo)標(biāo)Step03【Transform(轉(zhuǎn)換)】→【RankCases(個案排秩)】命令，彈出【RankCases(個案排秩)】對話框?！続ssignRank1to(將秩1指定給)】選項組用于指定求秩勾選【Displaysu arytables(顯示摘要表)】復(fù)選框，單擊【RankTypes】按鈕，在彈出的對話框中可以選擇2005年我國對主要國家（地區(qū)）Step02Step03 SPSS【DescriptiveStatisticsFrequenciescriptiveStatistics(描述性統(tǒng)計)】→勾選【Displayfrequencytables（顯示頻率量）】和【Chars表）】等按鈕。這些選項提供了豐富的統(tǒng)輸出結(jié)果。Step07：量24191521N0表3-2

ValidCumulative1321364533421Descriptives過程是連續(xù)資料統(tǒng)計描述應(yīng)用性統(tǒng)計量。這統(tǒng)計量的含義是：均數(shù)(Mea 方差(Variance)、全距(Range)、最小值(Miea、偏度系（Skewness）和峰度系數(shù)(Ku 勾選【Savestandardizedvaluesas 單擊【Bootstra按鈕，彈出【Bootstrap】對話框，可以行均值、標(biāo)準(zhǔn)差、方差、偏Step06：齡男演員：323736325153616044213560探索性數(shù)據(jù)分析（ExplorataryDataAnalysis，簡稱EDA）的基本思想是從數(shù)據(jù)本身出發(fā)，不拘泥于模型的假設(shè)而采用非常靈活的方法來探討數(shù)據(jù)分布的大致情況，也可以為進(jìn)一步結(jié)合模型的研究提供線索，為傳統(tǒng)Step01(探索)】話框，該對話框是探索性分析的主操作窗。Step02將它們移入右的【DependentList（因變量列表）】列框中，表示要進(jìn)行探索性分Step03們移入右側(cè)的【FactorList（因子列Step04量，并將其移入【LabelCasesby（標(biāo)注個Step05Step06cs】對話框該對話框中提供了各類基本描Step07lots】按彈出【Explore：Plots】對話框。該對話框中供了圖形輸出的類型。Step08支持均值、5切尾均值、標(biāo)準(zhǔn)差、方p估計。M估計量表支持Huber的M估計量、TukeyHampelMAndrew的Wave的Bootstrap估計。百分位數(shù)表支持百分位數(shù)的BootstrapStep10表示所市的區(qū)域位置，“1”表示南方城市，“2”示北方城市。選擇菜單欄中的至【DependentList(因變量列表)】列表框?qū)⒆兞俊暗赜颉碧砑又痢綟actorList(因子列選擇變量“城市”移入【LabelCasesby(標(biāo)注3NNN%0%%0%表3-6Huber'sM-權(quán)數(shù)取值分別為1.7003.400andStem-and-LeafPlotfor地域 Stem& 1. 1. 2.1.00 Stemwidth:10.0Eachleaf: 1case(s)

Stem-and-LeafPlotfor地域 Stem& 0. 1 1.Stemwidth:Each 1收集到的樣本數(shù)據(jù)產(chǎn)生二維或多維交叉列聯(lián) 2

f0fe2fe2Step01scriptiveStatistics(描述性統(tǒng)計)】→Step02Step03 usteredbarcharts：顯示各Suppresstables：只輸出統(tǒng)計量，而不輸在【osstabs(Cell按鈕，在彈出的對話框中可以選擇顯示Step07在【Crosstabs(Format】按鈕，在彈出的對話框中可以選擇Step09進(jìn)行“教育背”和“身高級別”雙因素交叉作用下的列聯(lián)分析，并研究“教育背景”打開數(shù)據(jù)文件3-4.sav。選擇菜單欄中的【Analyze(分析)】→【DescriptiveStatisti單擊【Statiscs】按鈕，彈出【Crosstabs：Statistics(表：統(tǒng)計量)】對話框，勾選【C驗“性別”和“體重級別”Cont由于要進(jìn)行“性別和“體重級別”的頻數(shù)分析，因此單擊【Cell】按鈕，彈出【Crosstabs：CellDisplay】對話框勾選【Percentages】選項組中的【Row(行)】【 umn(列)】和【Total勾選【Displayclusteredbarcharts(顯示NNN*體重%0%表性別體重級別列男withinwithin%of女63withinwithin%ofwithinwithin%ofAsymp.Sig.(2-PearsonChi-2Likelihood2Linear-by-LinearAssocia1NofValid基本描述性統(tǒng)計量（如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等），進(jìn)而刻畫出比率變量的集中趨勢和離散程度。除此之外，SPSS19.0還提供了其他對比描述指標(biāo)，大致也屬于集中趨勢描scriiveStatistics(描述性統(tǒng)計)】→【Rao(比率)】命令，彈出【Ratio(比在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框分組變量，將它移入右側(cè)的【GroupVariab在【RatioStatistics(比率統(tǒng)計量)】對話Displayresult：系統(tǒng)默認(rèn)選項，選擇是Saveresultstoexternalfile：選擇是單擊【Statistics】按鈕，彈出的【RatioStStep071析)】→【DescriptiveStatistics(描述性tioStatistics(比率統(tǒng)計量)】對話框。在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框作為分組變量，將它移入右側(cè)的【GroupVa返回【RatioStatistics(比率統(tǒng)計量)】對5353550AverageAbsoluteDeviatiPriceRelatedCoefficientofDispersionCoefficientofVariationMedianCentOne-SampleTTesttIndependent-SampleTTest：兩個獨立t檢驗。Paired-SampleTTest：兩個配對樣本均t檢。4.1SPSS在單樣本tD （2）如果相伴概率P值小于或等于給定的顯著性水平，則拒絕H0，認(rèn)為總體均值與檢驗值之間存在顯著差異。Means（比較均值）】→【One-SampleTTest（單樣本T檢驗）】命令，彈出【One-SampleT 樣本T檢驗】對話框。【TestVariable(s)（檢驗變在【TestValue（檢驗值）】文本框中輸入檢驗單擊【Options】按鈕，彈出【One-SampleTTes Excludecasesanalysisbyanalysis：點選 Excludecaseslistwise：點選該單選鈕，表支持平均值差值的Bootstrap檢Step06OK】按鈕結(jié)束操作，SPSS軟1.191620232324427172318182082現(xiàn)在該名研究者要驗他所在城市的平均通勤時間和 H0:t

1（分析）CompareMeans（比較均值）【One-SampleTTest（單樣本T檢驗）】命令，彈出【One-SampleTTest（單樣本T檢驗）】對話estVariables（檢驗變量）】列表框中。在【TestValue（檢驗值）】文本框中輸入檢驗值“19”。單擊【Options】按鈕，在彈出的對話框的【ConfidenceIntervalPercentage（置信區(qū)間百分比）】文本框中將系統(tǒng) Step05：NStd.DevStd.ErrorMeaTestValue=tSig.MeanDif99%ConfidenceIntervaloftheDifferen1（《今日美國》，日）。隨機(jī)抽取了在3月份中15個往返機(jī)的折扣費(fèi)作為一個簡單隨機(jī)樣本，結(jié)果得到下面的：3102602652553003102502652802902402852502H0H1

驗證。這里建如下假設(shè)檢驗：0:

Sampl NNormalStd.MostExtreme-Asymp.Sig.(2- （分析）CompareMeans（比較均值）【One-SampleTTest（單樣本T檢驗）】命令，彈出【One-SampleTTest（單樣本T檢驗）】對話在【TestValue（檢驗值）】文本框中輸入檢驗值“253.TestValue=tSig.MeanDi95%ConfidenceIntervaloftheDiff5-Means（比較均值）】→【Independent-SamplesTTest（獨立樣本T檢驗）】命令，彈出【Independent-SamplesTTest（獨立樣本T檢驗）將其移入【TestVariable(s)（檢驗變其移入【GroupingVariable(分組變量)】Step04單擊【DefineGroups】按鈕，彈出【DefineGroups（定義）】對話框，此時需要定義進(jìn)行t檢驗的比較組稱。Usespecifiedvalues：分別輸入兩個對應(yīng)不同總Cutpoint：用定義分割點值。在該文本框中輸入一個數(shù)字，大于該數(shù)值的對應(yīng)一個總體，小返回【IndependentamplesTTest（獨立樣本T檢支持平均值差值的Bootstrap顯1.國際航空運(yùn)輸協(xié)（TheInternationalAirTransportAssociat 分?jǐn)?shù)是10分，分越高說明其等級也越高。假設(shè)有務(wù)旅行人員組成樣本，要求這些人給洛杉磯機(jī)場表4-52H0：邁阿密機(jī)場和洛杉磯機(jī)場的等級得分相同。H1 的【Analyze（分析）】→【Compare ）】→【Independent-SampleTTest（獨立樣本T檢驗）】命令，彈出【Independent-SampleTTes其添加至右側(cè)的【TestVariable(s)（檢驗變【GroupingVariable(s)（組變量）】文本框中。接著單擊【DefineGroups】按鈕，彈出【DefineGroup（定點選【Usespecifiedvalues（使用指定值）】單選鈕，3.斷。如果方差相等，觀察分析結(jié)果中Equalvariancesassvariancesnotassumed列的t檢驗相伴概率值。本案例的一列（Equalvarianceassumed）的t檢驗結(jié)果。具體來1.2SS選擇菜單欄中的【Analyze（分析）CompareMeans（比較均值）】→【Independent-SampleTTest【Independent-SampleTTest（獨立樣本T檢驗）】對anxiety，將其添加至【TestVariable(s) 單擊【DefineGroups】按鈕，彈出【Define roup（定義組）】對話框。點選【Usespecifiedv3.NStd.DeviStd.ErrorMean是接著觀察“Equalvarianceassumed”列所對應(yīng)同一實驗對象理前后的數(shù)據(jù)。例如對患肝病的病選擇菜單欄中的【Analyze（分析）】→【CompareMeans（比較均值）】→【Paired-SamplesTTest（配對樣本T檢驗）】命令，彈出【Paired-SamplesTTest 在【Paired-SampleTTest（配對樣本T檢驗）】對話將其移入【PairedVariables（成對變量）】列表單擊【Options】按鈕，彈出【Paired-SamplesTTest:OptiExcecasesanalysisbyanalysis：點選該單選鈕，表示分析計算涉及到含有缺失值的變量時，刪除該變量上Excludecaseslistwise：點選該單選鈕，表示刪除所有含支持均值和標(biāo)準(zhǔn)差的Bootstrap支持相關(guān)性的Bootstrap檢驗表支持均值的Bootstrap1“讀書俱樂部”的成員進(jìn)行了一項調(diào)查，以確信其員看電視的時間是否比讀書的時間多。假定抽取了5個人組成的樣本，得到了下列有關(guān)他們每周觀看電視的時數(shù)和每周讀書時間的小時數(shù)的數(shù)據(jù)，見表4-11示。你能夠得到結(jié)論：“每月讀書俱樂部”的成員每觀看電視的時間比讀書的時間更多？H0：俱樂部成員看電視和讀書所消耗的時間相H1：俱樂部成員看電視和讀書所消耗的時間不析）CompareMeans（比較均值）】→【PairedSampleTTest（配對樣本T檢驗）】命令，彈出【PairedSampleTTest（配對樣本T檢驗）】對話框。這里變量“tv”表示成和變量“book”，將其添加至【PairedVariable(s)（成對變量）】列表框中。這表示進(jìn)行“tv”“booNStd.DeviatStd.ErrorPairPairedtrMean95%ConfidenceIntervaloftheDifferencePair3使許多國家濟(jì)發(fā)展停滯不前。投資商預(yù)言：亞洲經(jīng)濟(jì)的低迷對17年第四季度美國公司的收益造成負(fù)面影報》，日）。你能根據(jù)數(shù)據(jù)判斷投資商的預(yù) H0年和年第四季度的收益沒有H1年和年第四季度的收益存在年美國公司的益；變量“y”表示1997年美【CompareMeans（比較均值）】→【Paired-SampleTTest（配對樣本T檢驗）】命令，彈出【Paired-SampleT 和變量“y”，將其添加至【PairedVariable(s)（成對變量）】列表框中，進(jìn)行“x”“y”變量的配對t單擊【PairedSampleTTest（配對樣本T3.表4-是第5在第4章中我們討論了如何對一個總體及兩個總體的H01234表5-112345在表5-1中，要研究不同推銷方式的效果，其實就歸結(jié)為一個檢驗問題，設(shè)為第i（i=1,2,3,4）式的平均銷售量，即檢驗原假設(shè)H01

觀察，四個均值都不相等，方式二的銷售量明顯較 F1

2是將其轉(zhuǎn)1為研究這的均值是否存在顯著差2選擇菜單欄中的【Analyze（分析）】→【CompareMeans(比較均值)】→【One-WayANOVA(單因素ANOVA)】命令，彈出【One-WayANOVA(單因素ANOVA)】對在【One-WayANOVA(單因素ANOVA)】對話框的候選變ndentList(因變量列表)】列表框中，選擇的變量就Step03：在【One-WayANOVA(單因素ANOStep04：單擊【PostHoc】按鈕，彈出如下圖所示的【PostHoc ultipleComparisons(兩兩比較)】對話框，該對話框用于設(shè)置均方差齊性（EqualVariancesAssumed）時，有如下方LSD（Least-significantdifference）：最小顯著差數(shù)法，Bonferroni（LSDMOD）：用t檢驗完成各組間均值的配Sidak：計算t統(tǒng)計量進(jìn)行多重配對比較。可以調(diào)整顯著性R-E-G-WF：基于F檢驗的Ryan-Einot-Gabriel-Welsch多R-E-G-WQ：基于StudentRange分布的Ryan-Einot-Gabriel-Welschrangetest多重配對比較。Tukey's-b：stndentRange分布進(jìn)行組間均值的配對Waller-Dunca：用t統(tǒng)計量進(jìn)行多重比較檢驗，使用貝葉斯方差不具有齊性（EqualVarancenotassumed）時，有Significance：確定各種檢驗的顯著性水平，系統(tǒng)默認(rèn)值為Fixedandrandomeffects：顯示固定和隨機(jī)描Meanslot：均值折線圖。根據(jù)各組均值變化描繪出因變量【MissingValues(缺失值)】選項組中提供了缺失值處理方某機(jī)構(gòu)的各級別的管理人員需要足夠的信息來完成各任務(wù)。最近，一項研究調(diào)查了信息來源對信息傳影響。在這項特定的研究中，信息來源是【CompareMeans(比較均值)】【One-WayANOVA(單因素ANOVA)】命令，彈出【One-WayANOVA( ependentList(因變量列表)】列表框中。單擊【Options】按鈕，在彈出的對話框中勾選【Homogeneityof-e】按鈕返回主對話框 3.0.055。由于概率P值0.946明顯大于顯著性水平，故認(rèn)為這三組數(shù)據(jù)1Money雜志報告了股票和券基金的收益和費(fèi)用比率。10種中等規(guī)模的資本股基金、10 請檢驗這4種類型股票基混合型股票金的費(fèi)用率是其他三種類型基金費(fèi)用比率的平Step01：打開或建立數(shù)據(jù)文件5-2.sav，選擇菜單欄中的【Analyze（分析）】→【CompareMeansOne-WayANOVAANOVA)】命令，彈出【One-WayANOVA(單因素ANOVA)】對話量表示基金的類型，其中，“1”表示中等規(guī)模的資本為因變量，將其添加至【DependentList(因變量列Step04：單擊【Contrasts】按鈕，彈出【One-WayANOVA：Contrasts(單因素ANOVA：對比)】對話框。勾選【Polynomial(多項式)】復(fù)選框，激活【Degree(度)】下拉菜單，默認(rèn)選擇【Linear(線性)】選項，表示要進(jìn)行均值的精細(xì)比較。接著在【Coefficients(系數(shù))】文本框中依次輸入線性多項式的系數(shù)“1”、“1”、“－3”和“1”，并單擊【Add(添加)】按鈕確認(rèn)Step05：單擊【PostHoc】按鈕，彈出【PostHoc(兩兩比較)】對 neity-of-variance(方差同質(zhì)性)】復(fù)選框表示輸出方差齊性檢驗（1）描述性統(tǒng)計量表SPS的結(jié)果報告中首先輸出了描述性統(tǒng)計量，如表6所示。首先，中等規(guī)模的資本股票基金的平均費(fèi)用比率（140）最低，而專項股票基金的平均費(fèi)用比率（200）最高，但各類型基金的平均值差距不大。其次，從標(biāo)準(zhǔn)差大小來看，中等規(guī)模的資本股票基金（086）最低，而混合型股票基金（039）最高。最后，表56還列出了各種類型基金的最大值、

選擇菜單欄中的【Analyze（分析）】→【GeneralLinearModelate(單變量)】對話框，是多因方差分析的主操作窗口。在【Univarte(單變量)】對話框的候選變量列表框中，選擇相應(yīng)變量進(jìn)行右的列表框中，其目的是設(shè)置分析變量。選擇觀測變量（因變量）：添加至【DependentVariable（因變選擇因素變量：添加至【FixedVariable(s)(固定因子)】列表 domVariable(s)(隨機(jī)因子)】列表（1）FullFactorial 后，【Factors&Covarias(因子與協(xié)變量)】、【Model(模型)】和【BuildTerm(s)(構(gòu)建項)】選項被激活。在【Factors&Covari在【BuildTerm(s)(構(gòu)建 MaineffectsAll2-way：2All3-way：3All4-way：4All5-way：5TypeII項：一般適用于平衡的ANOVA模型、主因子效應(yīng)模型、回TypeIII項：系統(tǒng)默認(rèn)的平方和分解法。適用于平衡的ANOVA模型和非平衡的ANOVA模型。凡適用TypeI和TypeII的模型均可以用TypeIV頂：一般適用于TypeI和TypelI方法的模型、有缺失值【Includeinterceptinmodel(在模型中包含截距)】復(fù)選量：對比)】對話框。在【ctors(因子)】列表框中顯示出所有在 lAxis(水平軸)】列表框（水平軸）定義輪廓圖的橫坐標(biāo)。選擇另一個因素變量移入【SeparateLines(單圖)】列表框定義輪廓圖的素變量移入【SeparatePlots(多圖)】列表框定義輪廓圖的區(qū)分圖單擊【PostHoc】按鈕，彈出【PostHocMultipleComparisonsforObservedMeans(單變量：觀測均值的兩兩比較)】對話框。該對話框用于對均值作PostHoc多重比較檢驗。從 (因子)】框選擇相關(guān)變量使被選變量進(jìn)入【PostHoctestfor(兩PostHoc多重比檢驗對話框大致相同，各選項意義也一致。PredictedValuesDiagnosticsCook’sdistance：CookLeveragevaluesLeverageResiduals：最后可以勾選【Coefficientstatistics(系數(shù)統(tǒng)計)】復(fù)選框，將EstimatedMarginalMeans在【Factor(sandFactorInteractions(因子和因子交互)】列表素變量的各種效應(yīng)項?？梢詫⑵湟迫氲健綝isplayMeansfor(顯示在【DisplayMeansfor(顯示均值)】列表框中有主效應(yīng)時，點選激活此框下面的【Comparemaineffects(比較主效應(yīng))】復(fù)選框，對Estimatesofeffectsize： Observedpower：Parameterestimates：各因素變量的模型參數(shù)估計、標(biāo)準(zhǔn)誤、t檢Contrastcoefficientmatrix：Homogeneitytest：Spreadvs.levelplotResidualplot：繪制因變量的觀察值對于預(yù)測值和標(biāo)準(zhǔn)化殘差的散點Lackoffit：擬合度不足檢驗。檢查獨立變量和非獨立變量間的關(guān)系Generalestimablefunction：可以根據(jù)一般估計函數(shù)自定義假設(shè)檢③【Significancelevel(顯著性水平)】文本框：改變Confidence參數(shù)估計值表支持系數(shù)、BBootstrap估計值表支持均值的Bootstrap多重比較表支持平均值差值的Bootstrap估計。假設(shè)某一雜志記者要考察職業(yè)為財務(wù)管理、計算機(jī)程序員和藥劑師的男女雇員每周的薪金之間是否有顯著性差異。從每種職業(yè)中分別選取了5名男性和5名性組成樣本，并且記錄下來樣本中析職業(yè)和性別對薪金有著響?！綠eneralLinearModel(一般線性模型)】→【Univariate(單變在候選變量列表框中選擇“wage”DependentVariable(因變量)】列表框中。選擇“job”和“sex”變量作為因素變量，將它們添加至【FixedFacto單擊【PostHoc】按鈕，彈出【PostHoc【Factors(因子)】列表框中選擇“job”變量至【PostHocTest3在表5-15中，第一行的CorrectedModel是對所用方差分析模型的檢以分解為：Q＝Q 控控控1控

由于協(xié)方差分析也是采用【GeneralLinearModel選擇菜單欄中的【Graphs(LegacyDialogs(【Scatter/Dot（散點圖/點圖）】→【Simple/Scatter(簡單分布)】命令，彈出【SimpleScatterplot(簡單分布圖)】對話框。在候選變量列表框中選擇“chol”變量移入【YAxis(Y軸)】列表框中，選擇“age”【XAxis(X軸)】列表框中，選擇“group”變量移入【SetMarkersby(選擇菜單欄中的【Analyze（分析）】→【GeneralLinearModelendentVariable(因變量)】列表框中。選擇“group”作為因素變量，將其添加至【FixedVariable(s)(固定Y軸，體重組別作為分組標(biāo)記，作出的散點圖如下示。從中看到，實驗對象的年齡和體內(nèi)血清膽對比表5-2和表5-22兩種方差分析結(jié)果中，因變量的總變量（CorrectedT 變差降低為2047，這是由于扣除了年齡的影響造成的。這進(jìn)一步綜合起來，因素對人體內(nèi)膽固醇含量有顯著的影響；同時，在 7.1.2相關(guān)系數(shù)的數(shù)值范圍是介于–1+1之間（即–1≤r≤1），常用7.1.2r≥﹣1。在使用相關(guān)系數(shù)時應(yīng)該注意下面的幾個問題。（2）相關(guān)系數(shù)r皮爾遜 on）相關(guān)系利用相關(guān)系數(shù)r7.2SPSS7.2SPSS 式中：D是兩個變量每對數(shù)據(jù)等級之差，n 7.2SPSS7.2SPSS→【Bivariate(雙變量)】命令，彈出【BivariateCorrelati7.2SPSSStep02：在【BivariateCorrelations(雙變量相關(guān))】對話框左側(cè)的候選變量列表框Step03：圖中的【CorrelationCoefficients(相關(guān)系數(shù))】選項組中可以選擇計算以使用Pearson表示時，宜用Spearman或Kendall相關(guān)。Step04：在圖中的【TestofSignificance(顯著性檢驗)】選項組中可以Twotailed：系統(tǒng)默認(rèn)項。雙尾檢驗，當(dāng)事先不知道相關(guān)方向（正Onetailed：同時，可以勾選【FlagsignificantCorrelations(標(biāo)記顯著性相關(guān))】 Step05：單擊【Options①Statistics：Meansandstandarddeviations：將輸出選中的各變量的觀測值數(shù)Cross-productdeviationsandcovariances：輸出反映選中的每②MissingValues：Excludecasespairwise：系統(tǒng)默認(rèn)項。剔除當(dāng)前分析的兩個變量Excludecaseslistwise：表示剔除所有含缺失值的個案后再進(jìn)行道瓊斯工平均指數(shù)（DJIA）和標(biāo)準(zhǔn)普爾指數(shù)500（S&P50格動態(tài)；S&P500是由500種股票組成的指數(shù)。有人說S&P500 表7-2顯示了DJ和S&P 年周內(nèi)的收盤價。請計算DJIA和S&P500之間的關(guān)系是怎樣的？（1）指數(shù)具有高度正相關(guān)，一個指數(shù)的上漲或上跌時，另一個指數(shù)也會伴隨著上漲或跌。系，如果使用Pearson1r21r2選擇欄中的【Analyze(分析)】→【Correlate(相關(guān))】【Partial(偏相關(guān))】命令，彈出【PartialCorrelations(偏相在【BivariateCorrelations(偏相關(guān))】對話框左側(cè)的候選變量列表框中在【BivariateCorrelations(偏相關(guān))】對話框左側(cè)的候選變量列表框中至少選擇一個變量，將其添加至【Controllingfor(控制)】列表框中，表示在【TestofSignificance(顯著性檢驗)】選項組中可以選擇輸出的假設(shè)檢Twotailed：系統(tǒng)默認(rèn)項。雙尾檢驗，當(dāng)事先不知道相關(guān)方向（正相關(guān)還是負(fù)Onetailed：同時，可以勾選【FlagsignificantCorrelations】復(fù)選框。它表示選擇此①Statistics：Meansandstandarddeviations：將輸出選中的各變量的觀測值數(shù)Zero-ordercorrelation：顯示零階相關(guān)矩陣，即Pearson②MissingValues：Excludecasespairwise：系統(tǒng)默認(rèn)項。剔除當(dāng)前分析的兩個變量值Excludecaseslistwise：表示剔除所有含缺失值的個案后再進(jìn)行分描述統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap相關(guān)性表支持相關(guān)性的Bootstrap1 23（1）（2）于本只是一個預(yù)分析過程，因此距離分析并不會給出常用的P值，能給出各變量/記錄間的距離大小，以供用戶自行判斷相似【LabelCases(標(biāo)注個案)】列表框中，在輸出中將用這個標(biāo)示變量在【ComputeDistances(計算距離)】選項組中可以選擇計算何種Betweencases：系 Betweenvariables：單擊【OK】按鈕，結(jié)束操作，SPSS在【Distances(距離)】對話框中，選擇【Dissimilarities(性)】距離類型后，單擊【MeasureInterval：●Pearsoncorrelation：以PearsonBinary:●RussellandRao：●Simplematching：●RogersandTanimoto：RogersandTanimoto配對系數(shù)，分母為配對數(shù)，分子●SokalandSneath1：SokalandSneath●SokalandSneath2：SokalandSneath●SokalandSneath3：SokalandSneath●Kulczynski1：Kulczynski●Kulczynski2：Kulczynski●SokalandSneath4：SokalandSneath●Anderberg‘sD：●Yule‘sY：Yule綜合系數(shù)，屬于2×2●Yule'sQ：Goodman-Kruskalγ值，屬于2×2●SokalandSneath5：SokalandSneath●Phi4pointcorrelation：Pearson ●None：●Z-Scores：作標(biāo)準(zhǔn)Z分值轉(zhuǎn)換，此時均值等于0，標(biāo)準(zhǔn)差等于1●Range-1to1：作-1至+1●Range0to1：作0至1●Maximummagnitudeof1：作最大值等于1●Meanof1：●Standarddeviationof1：【TransformValues(轉(zhuǎn)換值)】復(fù)選項：選擇測度轉(zhuǎn)換方法。在距離測度計算完成后，才進(jìn)行對測度的轉(zhuǎn)換。共有3每種轉(zhuǎn)換方法給出一種轉(zhuǎn)換結(jié)果。3種轉(zhuǎn)換方法可以同時選擇。Abosolutevalues：對距離取絕對值。當(dāng)符號表明的是相關(guān)的方向，●Changesign：改變符號。把相似性測度值轉(zhuǎn)換成不相似性測度值或相●Rescaleto0~1range：重新調(diào)整測度值到范圍0～1轉(zhuǎn)換法。對已經(jīng)數(shù)、原等購進(jìn)價格指數(shù)和固定資產(chǎn)投資價格指數(shù)。請研究這些價格指數(shù)之的關(guān)系。7.4SPSS SPSS③建立回歸方程， ④對回歸方程進(jìn) 種統(tǒng)計檢驗SPSSxx?

11SPSS

在求解出于實際問題的分和預(yù)測，通常要進(jìn)行各種統(tǒng)計檢驗，例如擬合優(yōu)選擇菜單欄中的【Analyze(分析)】→【Regression（回歸）【Linear（線性）】命令，彈出【LinearRegression（線性回在【LinearRegression（在【LinearRegression（線性回歸）】對話框左側(cè)的候選變【Previous】按鈕和【NextVariable（選擇變量）列表框中，這表示要按照這個變量的標(biāo)準(zhǔn)來篩選樣本進(jìn)行回歸分析。操作可以在Rule窗口中實現(xiàn)。Step06從變量列表框中選擇一個變量進(jìn)入【CaseLabels（個案標(biāo)簽）】列表中，它的值將作為每條記錄的標(biāo)簽。這表示在指定作圖時，以哪個變量作為各本數(shù)據(jù)點的標(biāo)志變量。從候選變量列表框中選擇一個變量進(jìn)入【W(wǎng)LSWeigh（WLS權(quán)重）】列其中，【RegressionCoeffi Confidenceintervals：每個回歸系數(shù)的95%Covariancematrix： Modelfit：模型擬合過程中進(jìn)入、退出的變量的列表；以及一些有 Rsquaredchange：顯示每個自變量進(jìn)入方程后R2、F值和p值的改變 Partandpartialcorrelations：顯示自變量間的相關(guān)、部分相關(guān)Collinearitydiagnostics：多重共線性分析，輸出各個自變量的特Durbin-Watson：Casewisediagnostic：對標(biāo)準(zhǔn)化殘差進(jìn)行診斷，判斷有無奇異值(OutDEPENDENT：*ZPRED：*ZRESID：*DRESID：ADJPRED：SRESID：SDRESID：選擇【StandardizedResidualPlots（標(biāo)準(zhǔn)化殘差圖）】選項，可以選擇輸出標(biāo)Normalprobalityplot：標(biāo)準(zhǔn)化殘差的正態(tài)概率圖(P-PProduceallpartialplots：SEofmeanpredictions：【Residuals（殘差）Unstandardized：Standardized：Studentized： d： izedDeleted：【Distances（距離）Mahalanobis：Cook’s：Leveragevalues：【InfluenceStatistics（影響統(tǒng)計量）】反映剔除了某個自變量后回DfBeta(s)：StandardizedDfbeta(s)：標(biāo)準(zhǔn)化的DfBetaStandardizedDfFit：標(biāo)準(zhǔn)化的DfFitCovarianceratio：帶有一個特定的剔除觀測值的協(xié)方差（）陣與帶【Predictionintervals（預(yù)測區(qū)間）Mean：Individual：Confidenceinterval（置信區(qū)間）：默認(rèn)值為95％，所鍵入的值必【SteppingMethodCriteria（步進(jìn)方法標(biāo)準(zhǔn)）UseprobabilityofF：如果一個變量的F（Entryvalue），那么這個變量將會被選入方程式中；如果它的F顯著性水平值大于所設(shè)定的剔除值（Removalvalue），那么這個變量將會被剔除。UseFvalue：如果一個變量的F值大于所設(shè)定的進(jìn)入值（Entryvalue），那 Includeconstantinequation：選擇此項表示在回歸方程式中包含常數(shù)【Missingvaluetreatments（缺失值） Excludecaseslistwise：系統(tǒng)默認(rèn)項，表示剔除所有含缺失值的個案ExcludecasespariwiseReplacewithmean：描述統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap相關(guān)性表支持相關(guān)性的Bootstrap模型概要表支持Durbin-Watson的Bootstrap系數(shù)表支持系數(shù)、B的Bootstrap相關(guān)系數(shù)表支持相關(guān)性的Bootstrap殘差統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap8.1.3表8-1中的數(shù)據(jù)是7大名牌飲料的廣告支出（百萬美元）箱銷售量=f（廣告（1）（RSquare），校正后的系數(shù)(adjustedRSquare)和回歸系數(shù)的標(biāo)準(zhǔn)誤(Std.Erroroft 和前面相關(guān)分析中計算出的結(jié)果完全相同。可決系數(shù)RSquare的取值可決系數(shù)R2等于0957，模型擬合效果較好。SPSS是

xx x1,,x

,k?上式中，假設(shè)該線性方程有k個自變 ?是回歸方程的偏回歸系數(shù)。表示在其他自變量保持不變的情下，自變量變動一個單位所引起的因變量的平均變動單位【LinearRegression（線性回歸）】對話框。這既是一元線性回歸中要在【LinearRegression（線性回歸）】對話框左側(cè)的候選變量娛樂時光影劇院的老板希望了解公司投放的電視廣告費(fèi)用和報紙廣告費(fèi)用對公收入的影響。以往8周的樣本數(shù)據(jù)如表8-6所示（單位：千美元）。建立模型分析這兩種廣告形式對公司營業(yè)收入的影每周營業(yè)總收入=f（電視廣告費(fèi)用，報紙廣告費(fèi)用 d.ErroroftheEstimate），它是殘差的標(biāo)準(zhǔn)差，其大小反映了建（4）這兩投入時電影院的營業(yè)收入。同時比較電視廣告和報紙廣告的系 rdizedCoefficients）。SPSS的【CurveEstimation（曲線估計）】選項就是用來解rveEstimation（曲線估計命令，彈出【CurveEstimation（曲線估在【CurveEstimation（曲線估計）】對話框左側(cè)的候選變量列表在【CurveEstimation（曲線估計）】對話框左側(cè)的候選變量列表的自變量。如果自變量是時間變量或序列ID，可以選擇它移入【（時間）從候選變量列表框中選擇一個變量進(jìn)入【CaseLabels（Step06：選擇預(yù)測值和殘差單擊【Save】按鈕，彈出對【SaveVariables（保存變量）】選項組中的選項是將預(yù)測值、殘差或PredictedValues：Residuals：PredictedIntervals：ConfidenceInterval：【PredictCase（預(yù)測個案）】選項組是以時間序列為自變量時的預(yù)測Predictfromestimationperiodthroughlastcase：計算樣本中Predictthrough：預(yù)測時間序列中最后一個觀測值之后的值。選擇DisplayANOVA Includeconstantinequation：系統(tǒng)默認(rèn)值，曲線方程中包含常數(shù)Plotmodels：對于13個的銷售地區(qū)，表8-13是這些地區(qū)的中心商業(yè)區(qū)的綜合空置率（%）平均租金率（元/平方米）的統(tǒng)計數(shù)據(jù)。請嘗試分析空置8.3SPSS（1）8.3SPSS（2）8.3SPSS8.3SPSS（3）SPSS8.4SPSSyi

?ei

f(x,)其中

(x,

系式f,)程中參數(shù)的估計是通過迭代方法獲得的。8.4SPSS選擇菜單欄中的【Analyze（分析）】→【Regression（回歸）【Nonlinear（非線性）】命令，彈出【NonlinearRegression（非 8.4SPSS在【NonlinearRegression（非線性回歸）】對話框左側(cè)的候選變量列表框8.4SPSS【StartingValue（初始值）】文本框：用于輸入?yún)?shù)的初始值。其選中，然后在【Name（名稱）】和【StartingValue（初始值）】除。如果勾選【Usestartingvaluesfrompreviousanalysis（使【Continue8.4SPSS在【ModelExpression（模表達(dá)式）】文本框中輸入需要擬合的方程式，該方8.4SPSSSumofsquaredresiduals：系統(tǒng)默認(rèn)項，基于殘差平方和最小化的User-definedlossfunction：自定義選項，設(shè)置其他統(tǒng)計量為迭代8.4SPSSStep06： Defineparameterconstraint：可對選定的參數(shù)變量設(shè)置取值范圍。參數(shù)的取值范圍用8.4SPSSPredictedValues：Residuals：Derivatives：Lossfunction 8.4SPSS8.4SPSSBootstrapestimatesofstandarderror：采用樣本重復(fù)法計算標(biāo)準(zhǔn)誤。樣本重tialquadraticProgramming（序列二次編程）】項?！綞stimationMethodSequentialQuadraticProgramming：順序二次規(guī)劃算法。該方法要求輸入的“StepIimit”：“Functionprecision”：“Infinitestepsize”：當(dāng)一次迭代中參數(shù)值的變化大于設(shè)置值，則迭代?！癕aximumiterations”：“Sum-of-squaresconvergence”：在一步迭代中目標(biāo)函數(shù)殘差平方和的變化“Parameterconvergence”：在一步迭代中參數(shù)的變化比例小于設(shè)置值時，SPSS8.4SPSS其中，y、x1和x2分別表示股票A、股票B和股票C8.4SPSS 關(guān)系，這是否表只需要建立一個二元線性模型即可呢？觀察自變量股票B和股票C之散點圖看到，這兩只股票的價格也存在顯著的影響8.4SPSS8.4SPSS3代就達(dá)到了精度要求。觀察殘差平方和“ResidualSumofSquare8.4SPSS8.4SPSS8.4SPSS表8-198.4SPSS表8-20是非線性回歸分析的方差分析表。UncorrectedTotal為未修CorrectedTotal是經(jīng)修正的總誤差平方和，其值等于474.933，自由結(jié)果說這個非線性回歸模型的擬合效果，總體來看還是不錯的8.4SPSS8.4SPSS較。其中，“股票A”是實際曲線，“PredictedValues”是本案例建立的非線性回歸方程的預(yù)測曲線，“UnstandardizedPredictedV 8.4SPSS 望對問題有比較全面、完整的把握和認(rèn)識。設(shè)原有p個變量x1,...,xp

f1,f2,,

xaf f f 21

ap1f1ap2f2apk

aij(i1,2,,p;j1,2,,k稱為因子載荷。

fi(i1,2,,k

A (1)確認(rèn)待的原變量是否適合作因子分 (2)(3)(4)⑤確定因子：設(shè)F1，F(xiàn)2，…，F(xiàn)p為p個因子，其中前m因子分析SPSSStep01：選擇菜單欄中的【Analyze（分析）】→【DataReduction（降維）【Factor（因子）】命令，彈出【FactorAnalysis（因子分析）】在【FactorAnalysis（因子分析）】對話框左側(cè)的候選變量列表框【SelectionVariable（選擇變量）】列表框中，并單擊【Value】性統(tǒng)計量及相關(guān)矩陣等內(nèi)容。Statistics（統(tǒng)計量）Univariatedescriptives：單變量描述統(tǒng)計量，即輸出參與分析的各原始變Initialsolution：初始分析結(jié)果，系統(tǒng)默認(rèn)項。輸出各個分析變量的初始共CorrelationMatrix（相關(guān)矩陣）Significancelevels：顯著性水平。輸出每個相關(guān)系數(shù)相對于相關(guān)系數(shù)為0KMOandBartlett'stestofsphericity：KMO和Bartlett檢驗。前者輸出抽樣充足度的Kaisex-Meyer-Olkin測度，用于檢驗變量間的偏相關(guān)是否很小。后者Bartlett球度方法檢驗相關(guān)系數(shù)陣是Step0Extract（抽取）】按鈕，在彈出的對話框中可以選擇提取因子方法及相關(guān)選項。①在【Method（方法）Principalcomponents：主成份分析法。該方法假設(shè)變量是因子的純UnweightedleastsquareGeneralizedleastsquaresMaximumlikelihoodPrincipalaxisfactoringAlphafactoring：α oring：②【Analyze（分析）Correlationmatrix：數(shù)矩陣，系統(tǒng)默認(rèn)項Covariance ：協(xié) 矩陣③【Display（輸出）Unrotatedfactorsolution：輸出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。此項Screeplot：輸出因子的碎石圖。它顯示了按特征值大小排列的因子④【Extract（抽?。窟x項組：輸出與提取結(jié)果有關(guān)的選擇項。由于理論上因子數(shù)目與原始量數(shù)目相等，但因子分析的目的是用少量因子代替多個原始變量，選擇提取少個因子是由本欄來決定。Eigenvaluesoer：指定提取的因子的特征值數(shù)目。在此項后面的矩形框中給出輸入數(shù)值（系統(tǒng)默認(rèn)值為1），即要求提取那些特征值大于1的因子。Numberoffors：指定提取公因子的數(shù)目。用鼠標(biāo)單擊選擇此項后，將指⑤MaximumiterationsforConvergence：在對應(yīng)的文本框中指定因子分析收DirectOblimin：直接斜交旋轉(zhuǎn)法。指定此項可以在下面的“Delta”矩形框中鍵入δ值，該值應(yīng)該在0~1之間。系統(tǒng)默認(rèn)的δ值為0。Rotatedsolution：旋轉(zhuǎn)解。在MethodLodingplot(s)：因子載荷散點圖。指定此項將給出以前兩因子為坐標(biāo)軸的各MaximumiterationsforConvergence：可以指定旋轉(zhuǎn)收斂的最大迭代次數(shù)。①【Saveasvariables（保存為變量）】選項組：將因子得分作為新變Saveasvariables：將因子得分作為新變量保存在工作數(shù)據(jù)文件。②【Method（方法）本例選中“Regression”Displayfactorscorecoefficientmatrix：輸出因子得分系數(shù)矩①【MissingValues（缺失值）Excludecaseslistwise：分析變量中帶有缺失值的觀測量都不參與Excludecasespairwise：Replacewithmean：②【CoefficientDisplayFormat（系數(shù)顯示格式）】選項組：選擇載Sortedbysize：將載荷系數(shù)按其大小排列構(gòu)成矩陣，使在同一因子Suppressabsolutevalueslessthan：不顯示那些絕對值小于指定（1） Std.Analysis88888888同時，ExtractionSumsofSquaredLoadings和RotationSumsofSquaredLoadings部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情樣品聚類在統(tǒng)計學(xué)中又稱為QSPSS變量聚類在統(tǒng)計學(xué)又稱為R型聚類。反映同一事物特點的變量有很 1dij(q)xiaxjaqa

（1）如果把n個樣品（X中的n個行）看成p維空間中n個點，

度可用p維空間中兩點的距離來度量。令dij表示樣品Xi與Xj

q1明氏（Minkowski）dij(q)

x a 當(dāng)q=1

( a i 1a

i j)x21)x2

當(dāng)q=2

dij(2)

(xia jaja

當(dāng)q

xjpap

馬氏（Mahalanobis）d2(M)(XX)1(XX 其中 (

n x

x n nnn

n nxi

xai

xa蘭氏（Canberra）它是由Lance和Williams1

綱的影響，但沒有考慮指ij

將任何兩個樣品cosij

與X

1cosijx2 cos

1，說明兩個樣

cos

與說明與 j相似密切與

cosij

與X

i樣；cosij接近0，說明i

jpp(xiaxi)(xjaxjr

-1r(xp(xpxi)2(xpxj1 1pxip

xjpp據(jù)數(shù)據(jù)本身結(jié)構(gòu)的中步確定每個類別的原始中心點3、根據(jù)距離最近原則進(jìn)分類。逐一計算每一記錄到各個中心點的距5、重復(fù)步驟4，選擇菜單欄中 nalyze（分析）】→【Classify（分類）】【K-MeansCluster（K均值聚類）】命令，彈出【K-MeansCluster在【K-MeansClusterAnalysis（K均值聚類分析）】對話框左側(cè)的候選變量框中。同時可以選擇一個標(biāo)識變量移入【LabelCasesby（個案標(biāo)記依據(jù)）】Step03：在【NumberofClusters（聚類數(shù)）】列表框中，可以輸入確定的聚類分析【Iterativeandclassify（迭代與分類）Iterateandclassify：選擇初始類中心，在迭代過程中不斷更新聚類中心。Classifyonly：在主對話框中，【ClusterCenters（聚類中心）】選項組表示輸 Readinitial：要求使用指定數(shù)據(jù)文件中的觀測量或建立數(shù)據(jù)集作為WritefinalasFile：要求把聚類結(jié)果中的各類中心數(shù)據(jù)保存到指MaximumIterations：輸入K-MeansConvergenceCriterion：指定K-Means算法中的收斂標(biāo)準(zhǔn)，輸入一個不Userunningmeans：使用移動平均。選中該復(fù)選框，限定在每個觀測量在主對話框中單擊【存）】按鈕，彈出【SaveNew（保存新變量）Clustermembership：在當(dāng)前數(shù)據(jù)文件中建立一個名為“qcl_1”新Distancefromclustercenter：在當(dāng)前數(shù)據(jù)文件中建立一個名為要計算的統(tǒng)計量和對帶有缺失值的觀測量的處理方式。具體見圖：①【Statistics（統(tǒng)計量）Initialclustercenters：ANOVAtable：●Clusterinformationforeachcase：②【MissingValues（缺失值）Excludecaseslistwise：分析變量中帶有缺失值的觀測量都不參與Excludecasespairwise：9.2.3年數(shù)據(jù)對全國個省、自治區(qū)、直轄市進(jìn)行聚類分析。這個問屬于典型的多元分析問題，需要利用多個指標(biāo) 打隨書光盤的數(shù)據(jù)文件9-2.sav，選擇菜單欄中的【Analyze（分析】→【Classify（分類）】→【K-MeansCluster（K均值聚類）】命令，彈出【K-MeansCluster 中；同時選擇Y作為標(biāo)識變量，將其移入【LabelCases 在【NumberofClusters（聚類數(shù)）】文本框中輸入數(shù) 單擊【Save（保存】按鈕，彈出【K-MeansCluster 選【Clustermembership（聚類新成員）】和【Distancefromclustercenter（與聚類中心的距離）】復(fù)選框，示輸出樣品的聚類類別及距離，其他選項保持系統(tǒng)默設(shè)置，如下圖所示，單擊【Continue（繼續(xù)）】項）】按鈕，彈出【K-MeansClusterAnalysis：O 第一類：北京、津、山西、內(nèi)蒙古等20個地區(qū)。這些地區(qū)工業(yè)廢水、廢氣及氧化硫的排放總量相對最低。第二類：河北、建、河南、湖北、湖南、廣西和四川。它們的污染程度在所省份中位居中等水平。氣及二氧硫排放總量是最高的，因此環(huán)境污染也最為嚴(yán)重。后列分別作為新變量保存于當(dāng)前的工作文件中。Between-groupslinkage：Within-groupslinkage：Nearestneighbor：Furthestneighbor：Centroidclustering：Medianclustering：Ward'smethod：選擇菜單欄中的【Analyze（分析）】→【Classify（分類）【HierarchicalCluster（系統(tǒng)聚類）】命令，彈出【HierarchicalClusterClusterAnais（系統(tǒng)聚類分析）】對話框，這是系統(tǒng)聚在【HierarchicalClusterClusterAnalysis（系統(tǒng)聚類分析）】對話框左側(cè)的（變量）】列表框中。同時可以選擇一個標(biāo)識變量移入【LabelCasesby（標(biāo)①【Agglomerationsched ②【Proximitymatrix（相似性矩陣）】：輸出各類之間的距離矩陣。③【ClusterMembership（聚類成員）】欄可以選擇聚類數(shù)目相關(guān)的輸【None（無）【Singlesolution（單一方案）】：選擇此項并在對應(yīng)的【Numberofclusters（聚類數(shù)）【Rangeofsolutions（方案范圍）】：選擇此選項并在下邊的【Minimumnumberofclusters（最小聚類數(shù)）】和【Maxmumnumberof類聚類表。輸入的兩個數(shù)值必須是不等于l①【Dendrogram（樹狀圖）Allclusters：顯示全部聚類結(jié)果的冰柱圖?？捎么朔N圖查看聚類的Specifiedrangeclusters：限定顯示的聚類范圍。當(dāng)選擇此項時，在下面的【Startcluster（開始聚類）】、【Stopcluster（停止None：同時，冰柱圖顯示可以在【Orientation（方向）】選項組中確定Vertical：縱向的冰柱圖Horizontal：ClusterMethod（聚類方法）】下拉列表框：可以選擇聚類方法，Between-groupslinkage：組間平均距離法。系統(tǒng)默認(rèn)選項。合并兩Within-groupslinkage：組內(nèi)平均距離法。當(dāng)兩類合并為一類后，Nearestneighbor：最近距離法。采用兩類間最近點間的距離代表兩FurthestNeighbor：最遠(yuǎn)距離法。用兩類之間最遠(yuǎn)點的距離代表兩Centroidclustering：重心法。定義類與類之間的距離為兩類中各Medianclustering：中位數(shù)法。定義類與類之間的距離為兩類中各Ward’smethod：最小離差平方和法。聚類中使類內(nèi)各樣品的離差平Euclideandistance：SquaredEuclideandistance：歐氏距離平方。兩項之間的距離是每個變量值Pearsonconelation：皮爾遜相關(guān)系數(shù)。它是線性關(guān)系的測度，范圍是-1～+Chi-squaremeasure：Phi-squaremeasure：兩組頻數(shù)之間的Ф2表示某特性出現(xiàn)(或發(fā)生)，用0SquaredEuclideandistance：Sizedifference：不對稱指數(shù)。其值范圍在0～1Patterndifference：不相似性測度，范圍為0～1Dispersion：離散測度，其范圍為-1～1Phi4-pointcorrelation：皮爾遜相關(guān)系數(shù)二元變量模擬，其值范圍為-1～lLambda：其值是GoodmanandKruskalλKulczynski1：Kulczynski2：LanceandWilliams：Ochiai：該指數(shù)是余弦相似性測度的二元形式。范圍為0～lRogersandTanimotoRusselandRao：它是內(nèi)積(點積)的二元形式。對匹配與不匹配都給予相等的SokalandSneathl～5：第一種~Yule’sY：尤利YYule’sQ：尤利Q代表某事件發(fā)生“Present”，0代表某事件不發(fā)生“Absent”。 rmValues（轉(zhuǎn)換數(shù)）】選項組：可以選擇數(shù)據(jù)標(biāo)準(zhǔn)化的方 None：Zscores：數(shù)據(jù)標(biāo)準(zhǔn)化到Z0，標(biāo)準(zhǔn)差為Range-1to1：把數(shù)據(jù)標(biāo)準(zhǔn)化到-1到+1Range0to1：把數(shù)據(jù)標(biāo)準(zhǔn)化到0到+1Maximummagnitudeof1：把數(shù)據(jù)標(biāo)淮化到最大值為1。表示各變量Meanof1：把數(shù)據(jù)標(biāo)準(zhǔn)化到均值為1Standarddeviationof1：把數(shù)據(jù)標(biāo)準(zhǔn)化到標(biāo)準(zhǔn)差為1。表示各變量在選擇了上述標(biāo)準(zhǔn)化方法后，要在選項組中點選【Byvariable（對變量）】或【Bycase（對樣品）】單選鈕實施標(biāo)準(zhǔn)化。④【TransformMeasure】選項組：可以選擇測度的轉(zhuǎn)換方法，具體如AbsoluteValues：Changesign：Rescalebo0~1range：重新調(diào)整測度值到范圍0～lNone：Singlesolution：單個結(jié)果輸出。生成一個新變量，表明每個樣品在聚類之后所屬的類。在【Numberofclusters（聚類數(shù)）】的矩形Rangeofsolutions：選擇此選項并在下邊的【Minimumnumberofclusters（最小聚類數(shù)）】和【Maxmumnumberofclusters（最大加了3456類結(jié)果。即聚為4、5、6類時各樣品分別屬于哪一類。（1）Call（2）movecall（3）fee（4）Computer（5）mips—每千人中計算機(jī)功率（每秒百萬指令）（6）net 數(shù)”、“每千房居民蜂窩移動電話數(shù)”等六 3列“Stage”列出了聚類過程的步驟號，第二列“Cluster1”和第三列“Cluster2”列出了某一步驟中哪些國家參與了合并。例如從結(jié)列“Cluster1”和第六列“Cluster2”表示參與合并的國家（類程中。第七列“NextStage”表示在這一步驟中合并的類別，下一次（2）聚類分第Ⅲ類：巴西、墨西哥、波蘭、匈牙利、智利、俄羅斯、泰國、印度今任取一個樣品，實測指標(biāo)值為

(x1,

,xp)

和DX,G2

XG1,當(dāng)DXG1DXG2XG,當(dāng)DXG)DXG 待判當(dāng)D(X,G)D(X,G

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2016年北大暑期社科軟件使用教程spss190經(jīng)典

文檔簡介

溫馨提示

最新文檔

評論

2016年北大暑期社科軟件使用教程spss190經(jīng)典

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔