2016年北大暑期社科軟件使用教程spss190經(jīng)典_第1頁
2016年北大暑期社科軟件使用教程spss190經(jīng)典_第2頁
2016年北大暑期社科軟件使用教程spss190經(jīng)典_第3頁
2016年北大暑期社科軟件使用教程spss190經(jīng)典_第4頁
2016年北大暑期社科軟件使用教程spss190經(jīng)典_第5頁
已閱讀5頁,還剩1211頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

)】命令,彈出【OpenData(打開數(shù)Database(打開數(shù)據(jù)庫)】→【NewQuery(新建查詢)】命令,彈出【DatabaseWizard菜單欄中的【File(文件)】→【ReadTextData(打開文本數(shù)據(jù))】命令,彈出【OpenData(打開數(shù)據(jù))】對話框。這里 →【Open( 【OpenData在【Filesoftype(文件類型)】下拉列表框中指彈出的對框中的【Readvariablenamesfromthefirstrowofdate(從第一行數(shù)據(jù)讀取變量名)】復(fù)選框表【VariableView構(gòu)定義窗口。戶可以在該窗口中設(shè)定或修改文件【DecimalsPlaces】文本框可以設(shè)置變量的小 變量值標(biāo)簽alues)是量的可能的取值的含義進(jìn)行進(jìn)一步說明。量值標(biāo)簽特于數(shù)值型變量表示非數(shù)值型變量時尤其有。定義和修改變量值標(biāo),可以雙擊要修改值的單元格,在彈出的對話框的alu值)】文本框中輸入變量值,在【Label 2.2.11實例分析:員工滿意度管理制度,并達(dá)到有的放矢目的,某公司決定對本公司員工進(jìn)行不記名調(diào)希望了解員工對公司的滿意情況。請根據(jù)該公司計的員工滿意度調(diào)查數(shù)據(jù)在SS的數(shù)據(jù)屬性。 Step01:打開SPSS中的DataView窗口,錄入或?qū)隨tep03:單SPSS中的【VariableView(變量視圖)】 【Data(數(shù)據(jù))】→【SortCases【SortCases擊右向箭頭按鈕,將其移動至【Sortby(排序依在【SortOrder(排列順序)】選項組中可以選擇變→【Sort 序個案)】命令,彈出【SortCases(序個案)】對 單擊右向箭頭按鈕,將變量選擇進(jìn)入【Sortby(排序打開SPSS軟件,選擇菜單欄中的【FileData(【NameVariable擇變量命名,則系統(tǒng)將自動給轉(zhuǎn)置后的新變量賦予Var001(2-4【data(數(shù)據(jù))】→【MergeFiles(合并文件)】菜單中有兩個命令選項:【AddCases(添加個案)】和【AddVariables(添加變量)】。【MergeFiles(合并文件)】→【AddCases(添加個案)】命令,彈出【AddCases(添加個案)】對話框點選【AnexternalSPSSStatisticsdatafile(外部SPSSSta變量(KeyVariable),而且這兩個文件中的關(guān)鍵變 數(shù)據(jù)分類匯總的范疇分類變量(BreakVariable):它是對樣本數(shù)據(jù)進(jìn)行匯總變量(AggregateVariable):利用源數(shù)據(jù)文件據(jù))】→【Aggregate(分類匯總)】命令,彈出【AggregateD作為分類變量,將其移入【BreakVariable(s)(分組變作為匯總變量,將其移入【SummariesofVariable(s)(變在【SummariesofVariable(s)(變量摘要)】列表框中可以在【SummariesofVariable(s)(變量摘要)】列表框中可以選擇相應(yīng)匯總變量,此時可以單擊下方的【Nameand勾選【OptionsforVeryLargeDatasets(適用于大型數(shù)據(jù)從話框左側(cè)候選變量列表框中選擇“省份”變量作分類變量其移入【BreakVariable(s)(分組sofVariable(s)(在【Save(保存)】選項組中點選【W(wǎng)riteanewdatafilecontainingonlytheaggregatedvariables】單選【Data(數(shù)據(jù))】→【SplitFile(拆分文件)】命令,彈 Step03:按上述操作,點選【Analyzeallcases,donotcreateStep01據(jù))】→【SelectCases(選擇個案)】命令,彈出【SelectCases(選單擊【If在【SelectCases(選擇個案)】對話框的【 條件二:隨機(jī)選取10點選【Ifconditionissatisfied(如果條件滿足)】選 samplesofcases(隨機(jī)個案樣本)】單選鈕,同時在彈出的【SelectCases:RandomSample(選擇個案:隨機(jī)樣本)】對話框的“Exactlycasesformthefiirstcases”文本 念。權(quán)重大小描述了該指標(biāo)在整體評價中的相對重要程度。在據(jù)處理中,常需要對數(shù)據(jù)進(jìn)行加權(quán)處理。量出現(xiàn)的次數(shù),這樣后續(xù)的統(tǒng)計析工作就會極大的簡打開SPSS軟件,菜單欄中的【File(文件)】→【Data(數(shù)據(jù))】→【W(wǎng)eigcases(加權(quán)個案)】命令,彈出【W(wǎng)eight【FrequenciesVariableStep02Donotweightcases:不對觀測量加權(quán),系統(tǒng) sesby:對觀測量加權(quán),同時從左側(cè) 按鈕,操作結(jié)束 在【TargetVariable(目標(biāo)變量)】文本框中用戶需要mericExpression(數(shù)值表達(dá)式)】文本中。如果用戶Step04單擊【IfStep02在argetVariable(目標(biāo)變量)】文本框中定義在【NumericExpression(數(shù)值表達(dá)式)】文本框中輸入計算表達(dá)a=第一產(chǎn)業(yè)/國內(nèi)生產(chǎn)總值”。SPSS的【Transform(轉(zhuǎn)換)】菜單中有【RecodeintoSameVariable(重新編碼為相同變量)】和【RecodeintoDifferentVariable(重新編碼為不同變量)】兩個命令下面以【RecodeintoDifferentVariable(重新編碼為不同換)】→【RecodeintoDifferentVariable(重新編碼為不同變 量列表框中選擇要重新賦值的變量,將其移 putVariable->OutputVariable(輸入變量->輸出變量)】列表框中,同時在【OutputVariable(輸出變鈕 賦值轉(zhuǎn)換【OldandNewValue】按鈕被激活,單擊此按鈕,putVariable->OutputVariable(輸入變量->輸出變量)】列表框,同時在【OutputVariable(輸出變上述操作后,單擊【OldandNewValue】按鈕。行產(chǎn)品市查時,要了解在所有的調(diào)查客戶中有多少人使該產(chǎn)品,這就可以采用變量值計數(shù)功→【Transform(轉(zhuǎn)換)】→【CountValueswithinCasOccurrencesofValueswithinCases(計算個案內(nèi)值的在【TargetVariable(目標(biāo)變量)】文本框中輸入需要計數(shù)的變量名稱,同時在【TargetLabel(目標(biāo)標(biāo)簽)】文本框Step03:在左側(cè)的選變量列表框中選擇計數(shù)變量,將其移入型變量時,該欄標(biāo)題改為“NumberVariables”;當(dāng)移入變量為字符型變量時,標(biāo)題改為“StringVariables”。進(jìn)行上述操作后,【DefineValues】按鈕被激活,單Step02在【TargetVariable(目標(biāo)變量)】文本框中輸入需要計數(shù)的變量名稱“x”,同時在【TargetLabel(目標(biāo)標(biāo)Step03【Transform(轉(zhuǎn)換)】→【RankCases(個案排秩)】命令,彈出【RankCases(個案排秩)】對話框?!続ssignRank1to(將秩1指定給)】選項組用于指定求秩勾選【Displaysu arytables(顯示摘要表)】復(fù)選框,單擊【RankTypes】按鈕,在彈出的對話框中可以選擇2005年我國對主要國家(地區(qū))Step02Step03 SPSS【DescriptiveStatisticsFrequenciescriptiveStatistics(描述性統(tǒng)計)】→勾選【Displayfrequencytables(顯示頻率量)】和【Chars表)】等按鈕。這些選項提供了豐富的統(tǒng)輸出結(jié)果。Step07:量24191521N0表3-2

ValidCumulative1321364533421Descriptives過程是連續(xù)資料統(tǒng)計描述應(yīng)用性統(tǒng)計量。這統(tǒng)計量的含義是:均數(shù)(Mea 方差(Variance)、全距(Range)、最小值(Miea、偏度系(Skewness)和峰度系數(shù)(Ku 勾選【Savestandardizedvaluesas 單擊【Bootstra按鈕,彈出【Bootstrap】對話框,可以行均值、標(biāo)準(zhǔn)差、方差、偏Step06:齡男演員:323736325153616044213560探索性數(shù)據(jù)分析(ExplorataryDataAnalysis,簡稱EDA)的基本思想是從數(shù)據(jù)本身出發(fā),不拘泥于模型的假設(shè)而采用非常靈活的方法來探討數(shù)據(jù)分布的大致情況,也可以為進(jìn)一步結(jié)合模型的研究提供線索,為傳統(tǒng)Step01(探索)】話框,該對話框是探索性分析的主操作窗。Step02將它們移入右的【DependentList(因變量列表)】列框中,表示要進(jìn)行探索性分Step03們移入右側(cè)的【FactorList(因子列Step04量,并將其移入【LabelCasesby(標(biāo)注個Step05Step06cs】對話框該對話框中提供了各類基本描Step07lots】按彈出【Explore:Plots】對話框。該對話框中供了圖形輸出的類型。Step08支持均值、5切尾均值、標(biāo)準(zhǔn)差、方p估計。M估計量表支持Huber的M估計量、TukeyHampelMAndrew的Wave的Bootstrap估計。百分位數(shù)表支持百分位數(shù)的BootstrapStep10表示所市的區(qū)域位置,“1”表示南方城市,“2”示北方城市。選擇菜單欄中的至【DependentList(因變量列表)】列表框?qū)⒆兞俊暗赜颉碧砑又痢綟actorList(因子列選擇變量“城市”移入【LabelCasesby(標(biāo)注3NNN%0%%0%表3-6Huber'sM-權(quán)數(shù)取值分別為1.7003.400andStem-and-LeafPlotfor地域 Stem& 1. 1. 2.1.00 Stemwidth:10.0Eachleaf: 1case(s)

Stem-and-LeafPlotfor地域 Stem& 0. 1 1.Stemwidth:Each 1收集到的樣本數(shù)據(jù)產(chǎn)生二維或多維交叉列聯(lián) 2

f0fe2fe2Step01scriptiveStatistics(描述性統(tǒng)計)】→Step02Step03 usteredbarcharts:顯示各Suppresstables:只輸出統(tǒng)計量,而不輸 在【osstabs(Cell按鈕,在彈出的對話框中可以選擇顯示Step07在【Crosstabs(Format】按鈕,在彈出的對話框中可以選擇Step09進(jìn)行“教育背”和“身高級別”雙因素交叉作用下的列聯(lián)分析,并研究“教育背景”打開數(shù)據(jù)文件3-4.sav。選擇菜單欄中的【Analyze(分析)】→【DescriptiveStatisti單擊【Statiscs】按鈕,彈出【Crosstabs:Statistics(表:統(tǒng)計量)】對話框,勾選【C驗“性別”和“體重級別”Cont由于要進(jìn)行“性別和“體重級別”的頻數(shù)分析,因此單擊【Cell】按鈕,彈出【Crosstabs:CellDisplay】對話框勾選【Percentages】選項組中的【Row(行)】【 umn(列)】和【Total勾選【Displayclusteredbarcharts(顯示NNN*體重%0%表 性別體重級別列男withinwithin%of女63withinwithin%ofwithinwithin%ofAsymp.Sig.(2-PearsonChi-2Likelihood2Linear-by-LinearAssocia1NofValid基本描述性統(tǒng)計量(如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等),進(jìn)而刻畫出比率變量的集中趨勢和離散程度。除此之外,SPSS19.0還提供了其他對比描述指標(biāo),大致也屬于集中趨勢描scriiveStatistics(描述性統(tǒng)計)】→【Rao(比率)】命令,彈出【Ratio(比在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框分組變量,將它移入右側(cè)的【GroupVariab在【RatioStatistics(比率統(tǒng)計量)】對話Displayresult:系統(tǒng)默認(rèn)選項,選擇是Saveresultstoexternalfile:選擇是單擊【Statistics】按鈕,彈出的【RatioStStep071析)】→【DescriptiveStatistics(描述性tioStatistics(比率統(tǒng)計量)】對話框。在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框在【RatioStatistics(比率統(tǒng)計量)】對話框作為分組變量,將它移入右側(cè)的【GroupVa返回【RatioStatistics(比率統(tǒng)計量)】對5353550AverageAbsoluteDeviatiPriceRelatedCoefficientofDispersionCoefficientofVariationMedianCentOne-SampleTTesttIndependent-SampleTTest:兩個獨立t檢驗。Paired-SampleTTest:兩個配對樣本均t檢。4.1SPSS在單樣本tD (2)如果相伴概率P值小于或等于給定的顯著性水平,則拒絕H0,認(rèn)為總體均值與檢驗值之間存在顯著差異。Means(比較均值)】→【One-SampleTTest(單樣本T檢驗)】命令,彈出【One-SampleT 樣本T檢驗】對話框。 【TestVariable(s)(檢驗變在【TestValue(檢驗值)】文本框中輸入檢驗單擊【Options】按鈕,彈出【One-SampleTTes Excludecasesanalysisbyanalysis:點選 Excludecaseslistwise:點選該單選鈕,表 支持平均值差值的Bootstrap檢Step06OK】按鈕結(jié)束操作,SPSS軟1.191620232324427172318182082現(xiàn)在該名研究者要驗他所在城市的平均通勤時間和 H0:t

1(分析)CompareMeans(比較均值)【One-SampleTTest(單樣本T檢驗)】命令,彈出【One-SampleTTest(單樣本T檢驗)】對話estVariables(檢驗變量)】列表框中。在【TestValue(檢驗值)】文本框中輸入檢驗值“19”。單擊【Options】按鈕,在彈出的對話框的【ConfidenceIntervalPercentage(置信區(qū)間百分比)】文本框中將系統(tǒng) Step05:NStd.DevStd.ErrorMeaTestValue=tSig.MeanDif99%ConfidenceIntervaloftheDifferen1(《今日美國》,日)。隨機(jī)抽取了在3月份中15個往返機(jī)的折扣費(fèi)作為一個簡單隨機(jī)樣本,結(jié)果得到下面的:3102602652553003102502652802902402852502H0H1

驗證。這里建如下假設(shè)檢驗:0:

Sampl NNormalStd.MostExtreme-Asymp.Sig.(2- (分析)CompareMeans(比較均值)【One-SampleTTest(單樣本T檢驗)】命令,彈出【One-SampleTTest(單樣本T檢驗)】對話在【TestValue(檢驗值)】文本框中輸入檢驗值“253.TestValue=tSig.MeanDi95%ConfidenceIntervaloftheDiff5-Means(比較均值)】→【Independent-SamplesTTest(獨立樣本T檢驗)】命令,彈出【Independent-SamplesTTest(獨立樣本T檢驗)將其移入【TestVariable(s)(檢驗變其移入【GroupingVariable(分組變量)】Step04單擊【DefineGroups】按鈕,彈出【DefineGroups(定義)】對話框,此時需要定義進(jìn)行t檢驗的比較組稱。Usespecifiedvalues:分別輸入兩個對應(yīng)不同總Cutpoint:用定義分割點值。在該文本框中輸入一個數(shù)字,大于該數(shù)值的對應(yīng)一個總體,小返回【IndependentamplesTTest(獨立樣本T檢 支持平均值差值的Bootstrap顯1.國際航空運(yùn)輸協(xié)(TheInternationalAirTransportAssociat 分?jǐn)?shù)是10分,分越高說明其等級也越高。假設(shè)有 務(wù)旅行人員組成樣本,要求這些人給洛杉磯機(jī)場表4-52H0:邁阿密機(jī)場和洛杉磯機(jī)場的等級得分相同。H1 的【Analyze(分析)】→【Compare )】→【Independent-SampleTTest(獨立樣本T檢驗)】命令,彈出【Independent-SampleTTes其添加至右側(cè)的【TestVariable(s)(檢驗變【GroupingVariable(s)(組變量)】文本框中。接著單擊【DefineGroups】按鈕,彈出【DefineGroup(定 點選【Usespecifiedvalues(使用指定值)】單選鈕,3.斷。如果方差相等,觀察分析結(jié)果中Equalvariancesassvariancesnotassumed列的t檢驗相伴概率值。本案例的一列(Equalvarianceassumed)的t檢驗結(jié)果。具體來1.2SS選擇菜單欄中的【Analyze(分析)CompareMeans(比較均值)】→【Independent-SampleTTest【Independent-SampleTTest(獨立樣本T檢驗)】對anxiety,將其添加至【TestVariable(s) 單擊【DefineGroups】按鈕,彈出【Define roup(定義組)】對話框。點選【Usespecifiedv3.NStd.DeviStd.ErrorMean是接著觀察“Equalvarianceassumed”列所對應(yīng)同一實驗對象理前后的數(shù)據(jù)。例如對患肝病的病 選擇菜單欄中的【Analyze(分析)】→【CompareMeans(比較均值)】→【Paired-SamplesTTest(配對樣本T檢驗)】命令,彈出【Paired-SamplesTTest 在【Paired-SampleTTest(配對樣本T檢驗)】對話將其移入【PairedVariables(成對變量)】列表單擊【Options】按鈕,彈出【Paired-SamplesTTest:OptiExcecasesanalysisbyanalysis:點選該單選鈕,表示分析計算涉及到含有缺失值的變量時,刪除該變量上Excludecaseslistwise:點選該單選鈕,表示刪除所有含支持均值和標(biāo)準(zhǔn)差的Bootstrap支持相關(guān)性的Bootstrap檢驗表支持均值的Bootstrap1“讀書俱樂部”的成員進(jìn)行了一項調(diào)查,以確信其員看電視的時間是否比讀書的時間多。假定抽取了5個人組成的樣本,得到了下列有關(guān)他們每周觀看電視的時數(shù)和每周讀書時間的小時數(shù)的數(shù)據(jù),見表4-11示。你能夠得到結(jié)論:“每月讀書俱樂部”的成員每觀看電視的時間比讀書的時間更多?H0:俱樂部成員看電視和讀書所消耗的時間相H1:俱樂部成員看電視和讀書所消耗的時間不析)CompareMeans(比較均值)】→【PairedSampleTTest(配對樣本T檢驗)】命令,彈出【PairedSampleTTest(配對樣本T檢驗)】對話框。這里變量“tv”表示成和變量“book”,將其添加至【PairedVariable(s)(成對變量)】列表框中。這表示進(jìn)行“tv”“booNStd.DeviatStd.ErrorPairPairedtrMean95%ConfidenceIntervaloftheDifferencePair3使許多國家濟(jì)發(fā)展停滯不前。投資商預(yù)言:亞洲經(jīng)濟(jì)的低迷對17年第四季度美國公司的收益造成負(fù)面影報》,日)。你能根據(jù)數(shù)據(jù)判斷投資商的預(yù) H0年和年第四季度的收益沒有H1年和年第四季度的收益存在年美國公司的益;變量“y”表示1997年美【CompareMeans(比較均值)】→【Paired-SampleTTest(配對樣本T檢驗)】命令,彈出【Paired-SampleT 和變量“y”,將其添加至【PairedVariable(s)(成對變量)】列表框中,進(jìn)行“x”“y”變量的配對t單擊【PairedSampleTTest(配對樣本T3.表4-是 第5在第4章中我們討論了如何對一個總體及兩個總體的H01234表5-112345在表5-1中,要研究不同推銷方式的效果,其實就歸結(jié)為一個檢驗問題,設(shè)為第i(i=1,2,3,4)式的平均銷售量,即檢驗原假設(shè)H01

觀察,四個均值都不相等,方式二的銷售量明顯較 F1

1

2是將其轉(zhuǎn)1為研究這 的均值是否存在顯著差2選擇菜單欄中的【Analyze(分析)】→【CompareMeans(比較均值)】→【One-WayANOVA(單因素ANOVA)】命令,彈出【One-WayANOVA(單因素ANOVA)】對在【One-WayANOVA(單因素ANOVA)】對話框的候選變ndentList(因變量列表)】列表框中,選擇的變量就Step03:在【One-WayANOVA(單因素ANOStep04:單擊【PostHoc】按鈕,彈出如下圖所示的【PostHoc ultipleComparisons(兩兩比較)】對話框,該對話框用于設(shè)置均方差齊性(EqualVariancesAssumed)時,有如下方LSD(Least-significantdifference):最小顯著差數(shù)法,Bonferroni(LSDMOD):用t檢驗完成各組間均值的配Sidak:計算t統(tǒng)計量進(jìn)行多重配對比較。可以調(diào)整顯著性R-E-G-WF:基于F檢驗的Ryan-Einot-Gabriel-Welsch多R-E-G-WQ:基于StudentRange分布的Ryan-Einot-Gabriel-Welschrangetest多重配對比較。Tukey's-b:stndentRange分布進(jìn)行組間均值的配對Waller-Dunca:用t統(tǒng)計量進(jìn)行多重比較檢驗,使用貝葉斯方差不具有齊性(EqualVarancenotassumed)時,有Significance:確定各種檢驗的顯著性水平,系統(tǒng)默認(rèn)值為Fixedandrandomeffects:顯示固定和隨機(jī)描Meanslot:均值折線圖。根據(jù)各組均值變化描繪出因變量【MissingValues(缺失值)】選項組中提供了缺失值處理方某機(jī)構(gòu)的各級別的管理人員需要足夠的信息來完成各任務(wù)。最近,一項研究調(diào)查了信息來源對信息傳影響。在這項特定的研究中,信息來源是【CompareMeans(比較均值)】【One-WayANOVA(單因素ANOVA)】命令,彈出【One-WayANOVA( ependentList(因變量列表)】列表框中。單擊【Options】按鈕,在彈出的對話框中勾選【Homogeneityof-e】按鈕返回主對話框 3.0.055。由于概率P值0.946明顯大于顯著性水平,故認(rèn)為這三組數(shù)據(jù)1Money雜志報告了股票和券基金的收益和費(fèi)用比率。10種中等規(guī)模的資本股基金、10 請檢驗這4種類型股票基混合型股票金的費(fèi)用率是其他三種類型基金費(fèi)用比率的平Step01:打開或建立數(shù)據(jù)文件5-2.sav,選擇菜單欄中的【Analyze(分析)】→【CompareMeansOne-WayANOVAANOVA)】命令,彈出【One-WayANOVA(單因素ANOVA)】對話量表示基金的類型,其中,“1”表示中等規(guī)模的資本為因變量,將其添加至【DependentList(因變量列Step04:單擊【Contrasts】按鈕,彈出【One-WayANOVA:Contrasts(單因素ANOVA:對比)】對話框。勾選【Polynomial(多項式)】復(fù)選框,激活【Degree(度)】下拉菜單,默認(rèn)選擇【Linear(線性)】選項,表示要進(jìn)行均值的精細(xì)比較。接著在【Coefficients(系數(shù))】文本框中依次輸入線性多項式的系數(shù)“1”、“1”、“-3”和“1”,并單擊【Add(添加)】按鈕確認(rèn)Step05:單擊【PostHoc】按鈕,彈出【PostHoc(兩兩比較)】對 neity-of-variance(方差同質(zhì)性)】復(fù)選框表示輸出方差齊性檢驗(1)描述性統(tǒng)計量表SPS的結(jié)果報告中首先輸出了描述性統(tǒng)計量,如表6所示。首先,中等規(guī)模的資本股票基金的平均費(fèi)用比率(140)最低,而專項股票基金的平均費(fèi)用比率(200)最高,但各類型基金的平均值差距不大。其次,從標(biāo)準(zhǔn)差大小來看,中等規(guī)模的資本股票基金(086)最低,而混合型股票基金(039)最高。最后,表56還列出了各種類型基金的最大值、

選擇菜單欄中的【Analyze(分析)】→【GeneralLinearModelate(單變量)】對話框,是多因方差分析的主操作窗口。在【Univarte(單變量)】對話框的候選變量列表框中,選擇相應(yīng)變量進(jìn)行右的列表框中,其目的是設(shè)置分析變量。選擇觀測變量(因變量):添加至【DependentVariable(因變選擇因素變量:添加至【FixedVariable(s)(固定因子)】列表 domVariable(s)(隨機(jī)因子)】列表 (1)FullFactorial 后,【Factors&Covarias(因子與協(xié)變量)】、【Model(模型)】和【BuildTerm(s)(構(gòu)建項)】選項被激活。在【Factors&Covari在【BuildTerm(s)(構(gòu)建 MaineffectsAll2-way:2All3-way:3All4-way:4All5-way:5TypeII項:一般適用于平衡的ANOVA模型、主因子效應(yīng)模型、回TypeIII項:系統(tǒng)默認(rèn)的平方和分解法。適用于平衡的ANOVA模型和非平衡的ANOVA模型。凡適用TypeI和TypeII的模型均可以用TypeIV頂:一般適用于TypeI和TypelI方法的模型、有缺失值【Includeinterceptinmodel(在模型中包含截距)】復(fù)選量:對比)】對話框。在【ctors(因子)】列表框中顯示出所有在 lAxis(水平軸)】列表框(水平軸)定義輪廓圖的橫坐標(biāo)。選擇另一個因素變量移入【SeparateLines(單圖)】列表框定義輪廓圖的素變量移入【SeparatePlots(多圖)】列表框定義輪廓圖的區(qū)分圖單擊【PostHoc】按鈕,彈出【PostHocMultipleComparisonsforObservedMeans(單變量:觀測均值的兩兩比較)】對話框。該對話框用于對均值作PostHoc多重比較檢驗。從 (因子)】框選擇相關(guān)變量使被選變量進(jìn)入【PostHoctestfor(兩PostHoc多重比檢驗對話框大致相同,各選項意義也一致。PredictedValuesDiagnosticsCook’sdistance:CookLeveragevaluesLeverageResiduals:最后可以勾選【Coefficientstatistics(系數(shù)統(tǒng)計)】復(fù)選框,將EstimatedMarginalMeans在【Factor(sandFactorInteractions(因子和因子交互)】列表素變量的各種效應(yīng)項??梢詫⑵湟迫氲健綝isplayMeansfor(顯示在【DisplayMeansfor(顯示均值)】列表框中有主效應(yīng)時,點選激活此框下面的【Comparemaineffects(比較主效應(yīng))】復(fù)選框,對Estimatesofeffectsize: Observedpower:Parameterestimates:各因素變量的模型參數(shù)估計、標(biāo)準(zhǔn)誤、t檢Contrastcoefficientmatrix:Homogeneitytest:Spreadvs.levelplotResidualplot:繪制因變量的觀察值對于預(yù)測值和標(biāo)準(zhǔn)化殘差的散點Lackoffit:擬合度不足檢驗。檢查獨立變量和非獨立變量間的關(guān)系Generalestimablefunction:可以根據(jù)一般估計函數(shù)自定義假設(shè)檢③【Significancelevel(顯著性水平)】文本框:改變Confidence參數(shù)估計值表支持系數(shù)、BBootstrap估計值表支持均值的Bootstrap多重比較表支持平均值差值的Bootstrap估計。假設(shè)某一雜志記者要考察職業(yè)為財務(wù)管理、計算機(jī)程序員和藥劑師的男女雇員每周的薪金之間是否有顯著性差異。從每種職業(yè)中分別選取了5名男性和5名性組成樣本,并且記錄下來樣本中析職業(yè)和性別對薪金有著響?!綠eneralLinearModel(一般線性模型)】→【Univariate(單變在候選變量列表框中選擇“wage”DependentVariable(因變量)】列表框中。選擇“job”和“sex”變量作為因素變量,將它們添加至【FixedFacto單擊【PostHoc】按鈕,彈出【PostHoc【Factors(因子)】列表框中選擇“job”變量至【PostHocTest3在表5-15中,第一行的CorrectedModel是對所用方差分析模型的檢以分解為:Q=Q 控 控 控1控

由于協(xié)方差分析也是采用【GeneralLinearModel選擇菜單欄中的【Graphs(LegacyDialogs(【Scatter/Dot(散點圖/點圖)】→【Simple/Scatter(簡單分布)】命令,彈出【SimpleScatterplot(簡單分布圖)】對話框。在候選變量列表框中選擇“chol”變量移入【YAxis(Y軸)】列表框中,選擇“age”【XAxis(X軸)】列表框中,選擇“group”變量移入【SetMarkersby(選擇菜單欄中的【Analyze(分析)】→【GeneralLinearModelendentVariable(因變量)】列表框中。選擇“group”作為因素變量,將其添加至【FixedVariable(s)(固定Y軸,體重組別作為分組標(biāo)記,作出的散點圖如下示。從中看到,實驗對象的年齡和體內(nèi)血清膽對比表5-2和表5-22兩種方差分析結(jié)果中,因變量的總變量(CorrectedT 變差降低為2047,這是由于扣除了年齡的影響造成的。這進(jìn)一步綜合起來,因素對人體內(nèi)膽固醇含量有顯著的影響;同時,在 7.1.2相關(guān)系數(shù)的數(shù)值范圍是介于–1+1之間(即–1≤r≤1),常用7.1.2r≥﹣1。在使用相關(guān)系數(shù)時應(yīng)該注意下面的幾個問題。(2)相關(guān)系數(shù)r皮爾遜 on)相關(guān)系利用相關(guān)系數(shù)r7.2SPSS7.2SPSS 式中:D是兩個變量每對數(shù)據(jù)等級之差,n 7.2SPSS7.2SPSS→【Bivariate(雙變量)】命令,彈出【BivariateCorrelati7.2SPSSStep02:在【BivariateCorrelations(雙變量相關(guān))】對話框左側(cè)的候選變量列表框Step03:圖中的【CorrelationCoefficients(相關(guān)系數(shù))】選項組中可以選擇計算以使用Pearson表示時,宜用Spearman或Kendall相關(guān)。Step04:在圖中的【TestofSignificance(顯著性檢驗)】選項組中可以Twotailed:系統(tǒng)默認(rèn)項。雙尾檢驗,當(dāng)事先不知道相關(guān)方向(正Onetailed:同時,可以勾選【FlagsignificantCorrelations(標(biāo)記顯著性相關(guān))】 Step05:單擊【Options①Statistics:Meansandstandarddeviations:將輸出選中的各變量的觀測值數(shù)Cross-productdeviationsandcovariances:輸出反映選中的每②MissingValues:Excludecasespairwise:系統(tǒng)默認(rèn)項。剔除當(dāng)前分析的兩個變量Excludecaseslistwise:表示剔除所有含缺失值的個案后再進(jìn)行道瓊斯工平均指數(shù)(DJIA)和標(biāo)準(zhǔn)普爾指數(shù)500(S&P50格動態(tài);S&P500是由500種股票組成的指數(shù)。有人說S&P500 表7-2顯示了DJ和S&P 年周內(nèi)的收盤價。請計算DJIA和S&P500之間的關(guān)系是怎樣的?(1)指數(shù)具有高度正相關(guān),一個指數(shù)的上漲或上跌時,另一個指數(shù)也會伴隨著上漲或跌。系,如果使用Pearson1r21r2選擇 欄中的【Analyze(分析)】→【Correlate(相關(guān))】【Partial(偏相關(guān))】命令,彈出【PartialCorrelations(偏相在【BivariateCorrelations(偏相關(guān))】對話框左側(cè)的候選變量列表框中在【BivariateCorrelations(偏相關(guān))】對話框左側(cè)的候選變量列表框中至少選擇一個變量,將其添加至【Controllingfor(控制)】列表框中,表示在【TestofSignificance(顯著性檢驗)】選項組中可以選擇輸出的假設(shè)檢Twotailed:系統(tǒng)默認(rèn)項。雙尾檢驗,當(dāng)事先不知道相關(guān)方向(正相關(guān)還是負(fù)Onetailed:同時,可以勾選【FlagsignificantCorrelations】復(fù)選框。它表示選擇此①Statistics:Meansandstandarddeviations:將輸出選中的各變量的觀測值數(shù)Zero-ordercorrelation:顯示零階相關(guān)矩陣,即Pearson②MissingValues:Excludecasespairwise:系統(tǒng)默認(rèn)項。剔除當(dāng)前分析的兩個變量值Excludecaseslistwise:表示剔除所有含缺失值的個案后再進(jìn)行分描述統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap相關(guān)性表支持相關(guān)性的Bootstrap1 23(1)(2) 于本只是一個預(yù)分析過程,因此距離分析并不會給出常用的P值,能給出各變量/記錄間的距離大小,以供用戶自行判斷相似【LabelCases(標(biāo)注個案)】列表框中,在輸出中將用這個標(biāo)示變量在【ComputeDistances(計算距離)】選項組中可以選擇計算何種Betweencases:系 Betweenvariables:單擊【OK】按鈕,結(jié)束操作,SPSS在【Distances(距離)】對話框中,選擇【Dissimilarities(性)】距離類型后,單擊【MeasureInterval:●Pearsoncorrelation:以PearsonBinary:●RussellandRao:●Simplematching:●RogersandTanimoto:RogersandTanimoto配對系數(shù),分母為配對數(shù),分子●SokalandSneath1:SokalandSneath●SokalandSneath2:SokalandSneath●SokalandSneath3:SokalandSneath●Kulczynski1:Kulczynski●Kulczynski2:Kulczynski●SokalandSneath4:SokalandSneath●Anderberg‘sD:●Yule‘sY:Yule綜合系數(shù),屬于2×2●Yule'sQ:Goodman-Kruskalγ值,屬于2×2●SokalandSneath5:SokalandSneath●Phi4pointcorrelation:Pearson ●None:●Z-Scores:作標(biāo)準(zhǔn)Z分值轉(zhuǎn)換,此時均值等于0,標(biāo)準(zhǔn)差等于1●Range-1to1:作-1至+1●Range0to1:作0至1●Maximummagnitudeof1:作最大值等于1●Meanof1:●Standarddeviationof1:【TransformValues(轉(zhuǎn)換值)】復(fù)選項:選擇測度轉(zhuǎn)換方法。在距離測度計算完成后,才進(jìn)行對測度的轉(zhuǎn)換。共有3每種轉(zhuǎn)換方法給出一種轉(zhuǎn)換結(jié)果。3種轉(zhuǎn)換方法可以同時選擇。Abosolutevalues:對距離取絕對值。當(dāng)符號表明的是相關(guān)的方向,●Changesign:改變符號。把相似性測度值轉(zhuǎn)換成不相似性測度值或相●Rescaleto0~1range:重新調(diào)整測度值到范圍0~1轉(zhuǎn)換法。對已經(jīng)數(shù)、原等購進(jìn)價格指數(shù)和固定資產(chǎn)投資價格指數(shù)。請研究這些價格指數(shù)之的關(guān)系。7.4SPSS SPSS③建立回歸方程, ④對回歸方程進(jìn) 種統(tǒng)計檢驗SPSSxx?

11SPSS

在求解出于實際問題的分和預(yù)測,通常要進(jìn)行各種統(tǒng)計檢驗,例如擬合優(yōu)選擇菜單欄中的【Analyze(分析)】→【Regression(回歸)【Linear(線性)】命令,彈出【LinearRegression(線性回 在【LinearRegression( 在【LinearRegression(線性回歸)】對話框左側(cè)的候選變【Previous】按鈕和【NextVariable(選擇變量)列表框中,這表示要按照這個變量的標(biāo)準(zhǔn)來篩選樣本進(jìn)行回歸分析。操作可以在Rule窗口中實現(xiàn)。Step06從變量列表框中選擇一個變量進(jìn)入【CaseLabels(個案標(biāo)簽)】列表中,它的值將作為每條記錄的標(biāo)簽。這表示在指定作圖時,以哪個變量作為各本數(shù)據(jù)點的標(biāo)志變量。從候選變量列表框中選擇一個變量進(jìn)入【W(wǎng)LSWeigh(WLS權(quán)重)】列其中,【RegressionCoeffi Confidenceintervals:每個回歸系數(shù)的95%Covariancematrix: Modelfit:模型擬合過程中進(jìn)入、退出的變量的列表;以及一些有 Rsquaredchange:顯示每個自變量進(jìn)入方程后R2、F值和p值的改變 Partandpartialcorrelations:顯示自變量間的相關(guān)、部分相關(guān)Collinearitydiagnostics:多重共線性分析,輸出各個自變量的特Durbin-Watson:Casewisediagnostic:對標(biāo)準(zhǔn)化殘差進(jìn)行診斷,判斷有無奇異值(OutDEPENDENT:*ZPRED:*ZRESID:*DRESID:ADJPRED:SRESID:SDRESID:選擇【StandardizedResidualPlots(標(biāo)準(zhǔn)化殘差圖)】選項,可以選擇輸出標(biāo)Normalprobalityplot:標(biāo)準(zhǔn)化殘差的正態(tài)概率圖(P-PProduceallpartialplots:SEofmeanpredictions:【Residuals(殘差)Unstandardized:Standardized:Studentized: d: izedDeleted:【Distances(距離)Mahalanobis:Cook’s:Leveragevalues:【InfluenceStatistics(影響統(tǒng)計量)】反映剔除了某個自變量后回DfBeta(s):StandardizedDfbeta(s):標(biāo)準(zhǔn)化的DfBetaStandardizedDfFit:標(biāo)準(zhǔn)化的DfFitCovarianceratio:帶有一個特定的剔除觀測值的協(xié)方差()陣與帶【Predictionintervals(預(yù)測區(qū)間)Mean:Individual:Confidenceinterval(置信區(qū)間):默認(rèn)值為95%,所鍵入的值必【SteppingMethodCriteria(步進(jìn)方法標(biāo)準(zhǔn))UseprobabilityofF:如果一個變量的F(Entryvalue),那么這個變量將會被選入方程式中;如果它的F顯著性水平值大于所設(shè)定的剔除值(Removalvalue),那么這個變量將會被剔除。UseFvalue:如果一個變量的F值大于所設(shè)定的進(jìn)入值(Entryvalue),那 Includeconstantinequation:選擇此項表示在回歸方程式中包含常數(shù)【Missingvaluetreatments(缺失值) Excludecaseslistwise:系統(tǒng)默認(rèn)項,表示剔除所有含缺失值的個案ExcludecasespariwiseReplacewithmean:描述統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap相關(guān)性表支持相關(guān)性的Bootstrap模型概要表支持Durbin-Watson的Bootstrap系數(shù)表支持系數(shù)、B的Bootstrap相關(guān)系數(shù)表支持相關(guān)性的Bootstrap殘差統(tǒng)計表支持均值和標(biāo)準(zhǔn)差的Bootstrap8.1.3表8-1中的數(shù)據(jù)是7大名牌飲料的廣告支出(百萬美元)箱銷售量=f(廣告 (1) (RSquare),校正后的 系數(shù)(adjustedRSquare)和回歸系數(shù)的標(biāo)準(zhǔn)誤(Std.Erroroft 和前面相關(guān)分析中計算出的結(jié)果完全相同。可決系數(shù)RSquare的取值可決系數(shù)R2等于0957,模型擬合效果較好。SPSS是

xx x1,,x

1,

,k?上式中,假設(shè)該線性方程有k個自變 ?是回歸方程的偏回歸系數(shù)。 表示在其他自變量保持不變的情下,自變量 變動一個單位所引起的因變量的平均變動單位【LinearRegression(線性回歸)】對話框。這既是一元線性回歸中要在【LinearRegression(線性回歸)】對話框左側(cè)的候選變量娛樂時光影劇院的老板希望了解公司投放的電視廣告費(fèi)用和報紙廣告費(fèi)用對公收入的影響。以往8周的樣本數(shù)據(jù)如表8-6所示(單位:千美元)。建立模型分析這兩種廣告形式對公司營業(yè)收入的影每周營業(yè)總收入=f(電視廣告費(fèi)用,報紙廣告費(fèi)用 d.ErroroftheEstimate),它是殘差的標(biāo)準(zhǔn)差,其大小反映了建(4) 這兩投入時電影院的營業(yè)收入。同時比較電視廣告和報紙廣告的系 rdizedCoefficients)。SPSS的【CurveEstimation(曲線估計)】選項就是用來解rveEstimation(曲線估計 命令,彈出【CurveEstimation(曲線估 在【CurveEstimation(曲線估計)】對話框左側(cè)的候選變量列表在【CurveEstimation(曲線估計)】對話框左側(cè)的候選變量列表的自變量。如果自變量是時間變量或序列ID,可以選擇它移入【(時間)從候選變量列表框中選擇一個變量進(jìn)入【CaseLabels(Step06:選擇預(yù)測值和殘差單擊【Save】按鈕,彈出對 【SaveVariables(保存變量)】選項組中的選項是將預(yù)測值、殘差或PredictedValues:Residuals:PredictedIntervals:ConfidenceInterval:【PredictCase(預(yù)測個案)】選項組是以時間序列為自變量時的預(yù)測Predictfromestimationperiodthroughlastcase:計算樣本中Predictthrough:預(yù)測時間序列中最后一個觀測值之后的值。選擇DisplayANOVA Includeconstantinequation:系統(tǒng)默認(rèn)值,曲線方程中包含常數(shù)Plotmodels:對于13個的銷售地區(qū),表8-13是這些地區(qū)的中心商業(yè)區(qū)的綜合空置率(%)平均租金率(元/平方米)的統(tǒng)計數(shù)據(jù)。請嘗試分析空置8.3SPSS(1)8.3SPSS(2)8.3SPSS8.3SPSS(3)SPSS8.4SPSSyi

?ei

f(x,)其中

(x,

系式f,)程中參數(shù)的估計是通過迭代方法獲得的。8.4SPSS選擇菜單欄中的【Analyze(分析)】→【Regression(回歸)【Nonlinear(非線性)】命令,彈出【NonlinearRegression(非 8.4SPSS在【NonlinearRegression(非線性回歸)】對話框左側(cè)的候選變量列表框8.4SPSS【StartingValue(初始值)】文本框:用于輸入?yún)?shù)的初始值。其選中,然后在【Name(名稱)】和【StartingValue(初始值)】除。如果勾選【Usestartingvaluesfrompreviousanalysis(使【Continue8.4SPSS在【ModelExpression(模表達(dá)式)】文本框中輸入需要擬合的方程式,該方8.4SPSSSumofsquaredresiduals:系統(tǒng)默認(rèn)項,基于殘差平方和最小化的User-definedlossfunction:自定義選項,設(shè)置其他統(tǒng)計量為迭代8.4SPSSStep06: Defineparameterconstraint:可對選定的參數(shù)變量設(shè)置取值范圍。參數(shù)的取值范圍用8.4SPSSPredictedValues:Residuals:Derivatives:Lossfunction 8.4SPSS8.4SPSSBootstrapestimatesofstandarderror:采用樣本重復(fù)法計算標(biāo)準(zhǔn)誤。樣本重tialquadraticProgramming(序列二次編程)】項?!綞stimationMethodSequentialQuadraticProgramming:順序二次規(guī)劃算法。該方法要求輸入的“StepIimit”:“Functionprecision”:“Infinitestepsize”:當(dāng)一次迭代中參數(shù)值的變化大于設(shè)置值,則迭代?!癕aximumiterations”:“Sum-of-squaresconvergence”:在一步迭代中目標(biāo)函數(shù)殘差平方和的變化“Parameterconvergence”:在一步迭代中參數(shù)的變化比例小于設(shè)置值時,SPSS8.4SPSS其中,y、x1和x2分別表示股票A、股票B和股票C8.4SPSS 關(guān)系,這是否表只需要建立一個二元線性模型即可呢?觀察自變量股票B和股票C之散點圖看到,這兩只股票的價格也存在顯著的影響8.4SPSS8.4SPSS3代就達(dá)到了精度要求。觀察殘差平方和“ResidualSumofSquare8.4SPSS8.4SPSS8.4SPSS表8-198.4SPSS表8-20是非線性回歸分析的方差分析表。UncorrectedTotal為未修CorrectedTotal是經(jīng)修正的總誤差平方和,其值等于474.933,自由 結(jié)果說 這個非線性回歸模型的擬合效果,總體來看還是不錯的8.4SPSS8.4SPSS較。其中,“股票A”是實際曲線,“PredictedValues”是本案例建立的非線性回歸方程的預(yù)測曲線,“UnstandardizedPredictedV 8.4SPSS 望對問題有比較全面、完整的把握和認(rèn)識。 設(shè)原有p個變量x1,...,xp

k

f1,f2,,

xaf f f 21

ap1f1ap2f2apk

p

AF

aij(i1,2,,p;j1,2,,k稱為因子載荷。

fi(i1,2,,k

A (1)確認(rèn)待 的原變量是否適合作因子分 (2)(3)(4)⑤確定因子:設(shè)F1,F(xiàn)2,…,F(xiàn)p為p個因子,其中前m因子分析SPSSStep01:選擇菜單欄中的【Analyze(分析)】→【DataReduction(降維)【Factor(因子)】命令,彈出【FactorAnalysis(因子分析)】 在【FactorAnalysis(因子分析)】對話框左側(cè)的候選變量列表框【SelectionVariable(選擇變量)】列表框中,并單擊【Value】 性統(tǒng)計量及相關(guān)矩陣等內(nèi)容。Statistics(統(tǒng)計量)Univariatedescriptives:單變量描述統(tǒng)計量,即輸出參與分析的各原始變Initialsolution:初始分析結(jié)果,系統(tǒng)默認(rèn)項。輸出各個分析變量的初始共CorrelationMatrix(相關(guān)矩陣)Significancelevels:顯著性水平。輸出每個相關(guān)系數(shù)相對于相關(guān)系數(shù)為0KMOandBartlett'stestofsphericity:KMO和Bartlett檢驗。前者輸出抽樣充足度的Kaisex-Meyer-Olkin測度,用于檢驗變量間的偏相關(guān)是否很小。后者Bartlett球度方法檢驗相關(guān)系數(shù)陣是Step0Extract(抽取)】按鈕,在彈出的對話框中可以選擇提取因子方法及相關(guān)選項。①在【Method(方法)Principalcomponents:主成份分析法。該方法假設(shè)變量是因子的純UnweightedleastsquareGeneralizedleastsquaresMaximumlikelihoodPrincipalaxisfactoringAlphafactoring:α oring:②【Analyze(分析)Correlationmatrix: 數(shù)矩陣,系統(tǒng)默認(rèn)項Covariance :協(xié) 矩陣③【Display(輸出)Unrotatedfactorsolution:輸出未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果。此項Screeplot:輸出因子的碎石圖。它顯示了按特征值大小排列的因子④【Extract(抽?。窟x項組:輸出與提取結(jié)果有關(guān)的選擇項。由于理論上因子數(shù)目與原始量數(shù)目相等,但因子分析的目的是用少量因子代替多個原始變量,選擇提取少個因子是由本欄來決定。Eigenvaluesoer:指定提取的因子的特征值數(shù)目。在此項后面的矩形框中給出輸入數(shù)值(系統(tǒng)默認(rèn)值為1),即要求提取那些特征值大于1的因子。Numberoffors:指定提取公因子的數(shù)目。用鼠標(biāo)單擊選擇此項后,將指⑤MaximumiterationsforConvergence:在對應(yīng)的文本框中指定因子分析收DirectOblimin:直接斜交旋轉(zhuǎn)法。指定此項可以在下面的“Delta”矩形框中鍵入δ值,該值應(yīng)該在0~1之間。系統(tǒng)默認(rèn)的δ值為0。Rotatedsolution:旋轉(zhuǎn)解。在MethodLodingplot(s):因子載荷散點圖。指定此項將給出以前兩因子為坐標(biāo)軸的各MaximumiterationsforConvergence:可以指定旋轉(zhuǎn)收斂的最大迭代次數(shù)。①【Saveasvariables(保存為變量)】選項組:將因子得分作為新變Saveasvariables:將因子得分作為新變量保存在工作數(shù)據(jù)文件。②【Method(方法)本例選中“Regression”Displayfactorscorecoefficientmatrix:輸出因子得分系數(shù)矩①【MissingValues(缺失值)Excludecaseslistwise:分析變量中帶有缺失值的觀測量都不參與Excludecasespairwise:Replacewithmean:②【CoefficientDisplayFormat(系數(shù)顯示格式)】選項組:選擇載Sortedbysize:將載荷系數(shù)按其大小排列構(gòu)成矩陣,使在同一因子Suppressabsolutevalueslessthan:不顯示那些絕對值小于指定(1) Std.Analysis88888888同時,ExtractionSumsofSquaredLoadings和RotationSumsofSquaredLoadings部分列出了因子提取后和旋轉(zhuǎn)后的因子方差解釋情樣品聚類在統(tǒng)計學(xué)中又稱為QSPSS變量聚類在統(tǒng)計學(xué)又稱為R型聚類。反映同一事物特點的變量有很 1dij(q)xiaxjaqa

(1)如果把n個樣品(X中的n個行)看成p維空間中n個點,

度可用p維空間中兩點的距離來度量。令dij表示樣品Xi與Xj

q1明氏(Minkowski)dij(q)

x a 當(dāng)q=1

( a i 1a

i j)x21)x2

當(dāng)q=2

dij(2)

a

(xia jaja

當(dāng)q

di

(1

xi

xjpap

馬氏(Mahalanobis)d2(M)(XX)1(XX 其中 (

i

n x

x n nnn

n nxi

a

xai

x

a

xa蘭氏(Canberra)它是由Lance和Williams1

綱的影響,但沒有考慮指ij

將任何兩個樣品cosij

與X

pp

1cosijx2 cos

1,說明兩個樣

X

cos

與說明 與 j相似密切與

cosij

與X

i樣;cosij接近0,說明i

jpp(xiaxi)(xjaxjr

-1r(xp(xpxi)2(xpxj1 1pxip

xjpp據(jù)數(shù)據(jù)本身結(jié)構(gòu)的中 步確定每個類別的原始中心點3、根據(jù)距離最近原則進(jìn)分類。逐一計算每一記錄到各個中心點的距5、重復(fù)步驟4,選擇菜單欄中 nalyze(分析)】→【Classify(分類)】【K-MeansCluster(K均值聚類)】命令,彈出【K-MeansCluster在【K-MeansClusterAnalysis(K均值聚類分析)】對話框左側(cè)的候選變量框中。同時可以選擇一個標(biāo)識變量移入【LabelCasesby(個案標(biāo)記依據(jù))】Step03:在【NumberofClusters(聚類數(shù))】列表框中,可以輸入確定的聚類分析【Iterativeandclassify(迭代與分類)Iterateandclassify:選擇初始類中心,在迭代過程中不斷更新聚類中心。Classifyonly:在主對話框中,【ClusterCenters(聚類中心)】選項組表示輸 Readinitial:要求使用指定數(shù)據(jù)文件中的觀測量或建立數(shù)據(jù)集作為WritefinalasFile:要求把聚類結(jié)果中的各類中心數(shù)據(jù)保存到指MaximumIterations:輸入K-MeansConvergenceCriterion:指定K-Means算法中的收斂標(biāo)準(zhǔn),輸入一個不Userunningmeans:使用移動平均。選中該復(fù)選框,限定在每個觀測量在主對話框中單擊【 存)】按鈕,彈出【SaveNew(保存新變量)Clustermembership:在當(dāng)前數(shù)據(jù)文件中建立一個名為“qcl_1”新Distancefromclustercenter:在當(dāng)前數(shù)據(jù)文件中建立一個名為 要計算的統(tǒng)計量和對帶有缺失值的觀測量的處理方式。具體見圖:①【Statistics(統(tǒng)計量)Initialclustercenters:ANOVAtable:●Clusterinformationforeachcase:②【MissingValues(缺失值)Excludecaseslistwise:分析變量中帶有缺失值的觀測量都不參與Excludecasespairwise:9.2.3年數(shù)據(jù)對全國個省、自治區(qū)、直轄市進(jìn)行聚類分析。 這個問屬于典型的多元分析問題,需要利用多個指標(biāo) 打隨書光盤的數(shù)據(jù)文件9-2.sav,選擇菜單欄中的【Analyze(分析】→【Classify(分類)】→【K-MeansCluster(K均值聚類)】命令,彈出【K-MeansCluster 中;同時選擇Y作為標(biāo)識變量,將其移入【LabelCases 在【NumberofClusters(聚類數(shù))】文本框中輸入數(shù) 單擊【Save(保存】按鈕,彈出【K-MeansCluster 選【Clustermembership(聚類新成員)】和【Distancefromclustercenter(與聚類中心的距離)】復(fù)選框,示輸出樣品的聚類類別及距離,其他選項保持系統(tǒng)默設(shè)置,如下圖所示,單擊【Continue(繼續(xù))】 項)】按鈕,彈出【K-MeansClusterAnalysis:O 第一類:北京、津、山西、內(nèi)蒙古等20個地區(qū)。這些地區(qū)工業(yè)廢水、廢氣及氧化硫的排放總量相對最低。第二類:河北、建、河南、湖北、湖南、廣西和四川。它們的污染程度在所省份中位居中等水平。氣及二氧硫排放總量是最高的,因此環(huán)境污染也最為嚴(yán)重。 后列分別作為新變量保存于當(dāng)前的工作文件中。Between-groupslinkage:Within-groupslinkage:Nearestneighbor:Furthestneighbor:Centroidclustering:Medianclustering:Ward'smethod:選擇菜單欄中的【Analyze(分析)】→【Classify(分類)【HierarchicalCluster(系統(tǒng)聚類)】命令,彈出【HierarchicalClusterClusterAnais(系統(tǒng)聚類分析)】對話框,這是系統(tǒng)聚在【HierarchicalClusterClusterAnalysis(系統(tǒng)聚類分析)】對話框左側(cè)的(變量)】列表框中。同時可以選擇一個標(biāo)識變量移入【LabelCasesby(標(biāo)①【Agglomerationsched ②【Proximitymatrix(相似性矩陣)】:輸出各類之間的距離矩陣。③【ClusterMembership(聚類成員)】欄可以選擇聚類數(shù)目相關(guān)的輸【None(無)【Singlesolution(單一方案)】:選擇此項并在對應(yīng)的【Numberofclusters(聚類數(shù)) 【Rangeofsolutions(方案范圍)】:選擇此選項并在下邊的【Minimumnumberofclusters(最小聚類數(shù))】和【Maxmumnumberof類聚類表。輸入的兩個數(shù)值必須是不等于l①【Dendrogram(樹狀圖)Allclusters:顯示全部聚類結(jié)果的冰柱圖??捎么朔N圖查看聚類的Specifiedrangeclusters:限定顯示的聚類范圍。當(dāng)選擇此項時,在下面的【Startcluster(開始聚類)】、【Stopcluster(停止None:同時,冰柱圖顯示 可以在【Orientation(方向)】選項組中確定Vertical:縱向 的冰柱圖Horizontal:ClusterMethod(聚類方法)】下拉列表框:可以選擇聚類方法,Between-groupslinkage:組間平均距離法。系統(tǒng)默認(rèn)選項。合并兩Within-groupslinkage:組內(nèi)平均距離法。當(dāng)兩類合并為一類后,Nearestneighbor:最近距離法。采用兩類間最近點間的距離代表兩FurthestNeighbor:最遠(yuǎn)距離法。用兩類之間最遠(yuǎn)點的距離代表兩Centroidclustering:重心法。定義類與類之間的距離為兩類中各Medianclustering:中位數(shù)法。定義類與類之間的距離為兩類中各Ward’smethod:最小離差平方和法。聚類中使類內(nèi)各樣品的離差平Euclideandistance:SquaredEuclideandistance:歐氏距離平方。兩項之間的距離是每個變量值Pearsonconelation:皮爾遜相關(guān)系數(shù)。它是線性關(guān)系的測度,范圍是-1~+Chi-squaremeasure:Phi-squaremeasure:兩組頻數(shù)之間的Ф2表示某特性出現(xiàn)(或發(fā)生),用0SquaredEuclideandistance:Sizedifference:不對稱指數(shù)。其值范圍在0~1Patterndifference:不相似性測度,范圍為0~1Dispersion:離散測度,其范圍為-1~1Phi4-pointcorrelation:皮爾遜相關(guān)系數(shù)二元變量模擬,其值范圍為-1~lLambda:其值是GoodmanandKruskalλKulczynski1:Kulczynski2:LanceandWilliams:Ochiai:該指數(shù)是余弦相似性測度的二元形式。范圍為0~lRogersandTanimotoRusselandRao:它是內(nèi)積(點積)的二元形式。對匹配與不匹配都給予相等的SokalandSneathl~5:第一種~Yule’sY:尤利YYule’sQ:尤利Q代表某事件發(fā)生“Present”,0代表某事件不發(fā)生“Absent”。 rmValues(轉(zhuǎn)換數(shù))】選項組:可以選擇數(shù)據(jù)標(biāo)準(zhǔn)化的方 None:Zscores:數(shù)據(jù)標(biāo)準(zhǔn)化到Z0,標(biāo)準(zhǔn)差為Range-1to1:把數(shù)據(jù)標(biāo)準(zhǔn)化到-1到+1Range0to1:把數(shù)據(jù)標(biāo)準(zhǔn)化到0到+1Maximummagnitudeof1:把數(shù)據(jù)標(biāo)淮化到最大值為1。表示各變量Meanof1:把數(shù)據(jù)標(biāo)準(zhǔn)化到均值為1Standarddeviationof1:把數(shù)據(jù)標(biāo)準(zhǔn)化到標(biāo)準(zhǔn)差為1。表示各變量在選擇了上述標(biāo)準(zhǔn)化方法后,要在選項組中點選【Byvariable(對變量)】或【Bycase(對樣品)】單選鈕實施標(biāo)準(zhǔn)化。④【TransformMeasure】選項組:可以選擇測度的轉(zhuǎn)換方法,具體如AbsoluteValues:Changesign:Rescalebo0~1range:重新調(diào)整測度值到范圍0~lNone:Singlesolution:單個結(jié)果輸出。生成一個新變量,表明每個樣品在聚類之后所屬的類。在【Numberofclusters(聚類數(shù))】的矩形Rangeofsolutions:選擇此選項并在下邊的【Minimumnumberofclusters(最小聚類數(shù))】和【Maxmumnumberofclusters(最大加了3456類結(jié)果。即聚為4、5、6類時各樣品分別屬于哪一類。(1)Call(2)movecall(3)fee(4)Computer(5)mips—每千人中計算機(jī)功率(每秒百萬指令)(6)net 數(shù)”、“每千房居民蜂窩移動電話數(shù)”等六 3列“Stage”列出了聚類過程的步驟號,第二列“Cluster1”和第三列“Cluster2”列出了某一步驟中哪些國家參與了合并。例如從結(jié)列“Cluster1”和第六列“Cluster2”表示參與合并的國家(類程中。第七列“NextStage”表示在這一步驟中合并的類別,下一次(2)聚類分 第Ⅲ類:巴西、墨西哥、波蘭、匈牙利、智利、俄羅斯、泰國、印度今任取一個樣品,實測指標(biāo)值為

(x1,

,xp)

和DX,G2

XG1,當(dāng)DXG1DXG2XG,當(dāng)DXG)DXG 待判 當(dāng)D(X,G)D(X,G

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論