版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
SPSS分析技術(shù)簡(jiǎn)介SPSS高級(jí)分析技術(shù)講座講師:鄒艷輝課程目標(biāo)了解一些統(tǒng)計(jì)思想和思維方式了解SPSS軟件的特點(diǎn)掌握SPSS的基本操作能夠應(yīng)用SPSS進(jìn)行基本的統(tǒng)計(jì)分析可以有效的對(duì)SPSS進(jìn)行進(jìn)一步的自學(xué)課程安排第一講數(shù)據(jù)、統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)軟件之間的關(guān)系統(tǒng)計(jì)學(xué),用一句話說(shuō)是什么?第二講SPSS的特點(diǎn)SPSS作為一種統(tǒng)計(jì)分析軟件的優(yōu)勢(shì)第三講應(yīng)用案例簡(jiǎn)介第四、五兩講SPSS幾種分析技術(shù)的應(yīng)用背景:擁有一定量的數(shù)據(jù)產(chǎn)生需求:從數(shù)據(jù)中提取信息數(shù)據(jù)分析統(tǒng)計(jì)學(xué)數(shù)據(jù)分析的依據(jù)統(tǒng)計(jì)學(xué):隨機(jī)性與規(guī)律性統(tǒng)計(jì)工具利用統(tǒng)計(jì)學(xué)原理服務(wù)于數(shù)據(jù)分析第一講數(shù)據(jù)分析概述數(shù)據(jù)分析過(guò)程原始數(shù)據(jù)、二手?jǐn)?shù)據(jù)確定研究目標(biāo)、范圍選擇研究方案選擇數(shù)據(jù)收集方式和分析技術(shù)分析評(píng)估所需樣本量建立項(xiàng)目預(yù)算描述性統(tǒng)計(jì)分析推斷性統(tǒng)計(jì)分析人工智能等數(shù)據(jù)挖掘特有的算法計(jì)分析清理數(shù)據(jù)使之適合于分析應(yīng)用對(duì)數(shù)據(jù)進(jìn)行變換評(píng)估數(shù)據(jù)質(zhì)量,填充缺失數(shù)據(jù)對(duì)表格、圖形進(jìn)行編輯用word、excel、text、html展示數(shù)據(jù)什么時(shí)候用數(shù)據(jù)分析?商業(yè)問(wèn)題數(shù)據(jù)問(wèn)題!商業(yè)問(wèn)題解決方案把商業(yè)問(wèn)題轉(zhuǎn)化為數(shù)據(jù)問(wèn)題數(shù)據(jù)分析及分析結(jié)果把數(shù)據(jù)結(jié)果轉(zhuǎn)化為商業(yè)解決方案數(shù)據(jù)的價(jià)值和利用數(shù)據(jù)無(wú)處不在數(shù)據(jù)包含的信息很多,但是數(shù)據(jù)中的信息往往是分散的,單個(gè)數(shù)據(jù)很難直接被應(yīng)用起來(lái)統(tǒng)計(jì)學(xué)就是把數(shù)據(jù)轉(zhuǎn)化為信息的科學(xué)統(tǒng)計(jì)學(xué)statistics:
thescienceofcollecting,analyzing,presenting,andinterpretingdata.
Copyright1994-2000EncyclopediaBritannica,Inc.
(不列顛百科全書(shū))理念統(tǒng)計(jì)模型的嚴(yán)格數(shù)學(xué)表達(dá)很復(fù)雜、繁瑣,但是其背后的思想往往很簡(jiǎn)單做為統(tǒng)計(jì)學(xué)的使用者,重要的是掌握統(tǒng)計(jì)學(xué)的思想、解決問(wèn)題的步驟和結(jié)果的解讀,至于那些研究方法本身的事情,交給統(tǒng)計(jì)學(xué)家去做吧復(fù)雜的方法未必是可行的方法,越是簡(jiǎn)單的方法,越容易得到廣泛采用,也往往給使用者帶來(lái)更多的價(jià)值統(tǒng)計(jì)學(xué)只是一個(gè)工具,SPSS更是工具的工具,不要指望它能夠“自動(dòng)”解決你面臨的商業(yè)問(wèn)題要注意統(tǒng)計(jì)學(xué)方法的適用條件,濫用統(tǒng)計(jì)學(xué)會(huì)造成“嚴(yán)重”的負(fù)效果第二講SPSS概述SPSS軟件的特點(diǎn)易用性企業(yè)級(jí)統(tǒng)計(jì)分析解決方案結(jié)果的權(quán)威性SPSS軟件基本介紹1、SPSS的基本構(gòu)成:11個(gè)模塊2、SPSS五個(gè)窗口的基本功能3、應(yīng)用SPSS執(zhí)行統(tǒng)計(jì)分析的幾種方法4、SPSS的四種結(jié)果5、SPSS無(wú)處不在的Help6、SPSS五種結(jié)果保存方式SPSSClient/ServerSPSSBase----基礎(chǔ)模塊SPSSAdvanced----多元方差分析、生存分析SPSSRegression----回歸SPSSTrends----時(shí)間序列SPSSCategories----分類(lèi)數(shù)據(jù)分析SPSSConjoint----正交設(shè)計(jì)和分析SPSSTables----表格展示數(shù)據(jù)SPSSMaps----地圖展示數(shù)據(jù)SPSSMissingValueAnalysis----缺失值分析SPSSExactTestAnalysis----精確檢驗(yàn)SPSSComplexSamples----復(fù)雜抽樣SPSS模塊與過(guò)程讀/錄入數(shù)據(jù)數(shù)據(jù)整理描述統(tǒng)計(jì)數(shù)據(jù)分析圖表展示結(jié)果編輯結(jié)果報(bào)告AdvancedCategoriesConjointRegressionTrendsExactTestComplexSampleMissingValueBaseTableMapSPSS操作界面----五個(gè)窗口DataEditor----數(shù)據(jù)編輯窗口DataViewVariableViewSyntaxEditor----程序編輯窗口Viewer----結(jié)果管理窗口DraftViewer----草稿結(jié)果窗口Script----腳本編輯窗口應(yīng)用SPSS進(jìn)行統(tǒng)計(jì)分析的四種方法菜單操作——簡(jiǎn)單易用,操作方便編程運(yùn)行——靈活豐富,最大程度的發(fā)揮SPSS效能Include命令——保證程序的可重復(fù)使用和嵌入ProductionFacility——程序運(yùn)行的批處理、自動(dòng)化,后臺(tái)執(zhí)行SPSS的結(jié)果SPSS的四種結(jié)果文本格式的結(jié)果表格結(jié)果標(biāo)準(zhǔn)圖結(jié)果交互圖結(jié)果SPSS五種結(jié)果保存方式SPSS結(jié)果文件格式Html格式Word格式Text格式Excel格式圖形:jpg、pct…SPSS的幫助系統(tǒng)幫助菜單TopicsTutorialCaseStudiesStatisticsCoachCommandSyntaxGuide對(duì)話框幫助無(wú)處不在的What’sthis?第三講SPSS應(yīng)用案例選介利用SPSS錄入市場(chǎng)調(diào)查數(shù)據(jù)利用SPSS整理調(diào)查數(shù)據(jù)利用SPSS分析數(shù)據(jù)利用SPSS展現(xiàn)數(shù)據(jù):專(zhuān)業(yè)的報(bào)表和圖形SPSS應(yīng)用于市場(chǎng)調(diào)查利用SPSS錄入市場(chǎng)調(diào)查數(shù)據(jù)對(duì)市場(chǎng)調(diào)查問(wèn)卷進(jìn)行變量定義和編碼在SPSS變量編輯窗口逐個(gè)定義變量屬性變量名、變量類(lèi)型、寬度、小數(shù)點(diǎn)位數(shù)、變量標(biāo)簽、缺失值、列寬、對(duì)齊方式、測(cè)度水平在數(shù)據(jù)編輯窗口逐行錄入問(wèn)卷記錄錄入完畢后,對(duì)數(shù)據(jù)進(jìn)行整理、保存舉例:創(chuàng)建變量利用SPSS錄入市場(chǎng)調(diào)查數(shù)據(jù)舉例:錄入數(shù)據(jù)利用SPSS錄入市場(chǎng)調(diào)查數(shù)據(jù)舉例:保存數(shù)據(jù)利用SPSS錄入市場(chǎng)調(diào)查數(shù)據(jù)利用SPSS整理市場(chǎng)調(diào)查數(shù)據(jù)數(shù)據(jù)清理:檢查錄入錯(cuò)誤、清除不合理數(shù)據(jù)、定義或彌補(bǔ)缺失值變量重新編碼(Recode)生成新變量(Compute)按關(guān)鍵變量對(duì)記錄排序(Sort)按關(guān)鍵變量對(duì)記錄分組(Aggregate)變量和記錄之間轉(zhuǎn)置(Transpose)數(shù)據(jù)合并與拆分(Merge/Split)對(duì)記錄加權(quán)(Weight)利用SPSS整理市場(chǎng)調(diào)查數(shù)據(jù)利用SPSS分析市場(chǎng)調(diào)查數(shù)據(jù)單變量分析--描述統(tǒng)計(jì)分析:變量分布集中趨勢(shì):均值、中位數(shù)、眾數(shù)變量分布離散趨勢(shì):極差、四分位數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤雙變量分析--相關(guān)分析、列聯(lián)分析、一元回歸分析多變量分析--偏相關(guān)分析、多元回歸分析、聚類(lèi)分析、因子分析、對(duì)應(yīng)分析等利用SPSS分析市場(chǎng)調(diào)查數(shù)據(jù)相依模型分析:因子分析、聚類(lèi)分析、對(duì)應(yīng)分析因果模型分析單因變量--多元回歸、Logistic回歸、判別分析、Logit模型多因變量--典型相關(guān)分析、多元方差分析多重因果關(guān)系--通徑分析、結(jié)構(gòu)方程模型市場(chǎng)細(xì)分--交叉表分析、聚類(lèi)分析、因子分析等消費(fèi)者偏好分析--相關(guān)分析、主成分分析、結(jié)合分析、多元回歸等顧客滿意度分析--Logistic回歸、對(duì)應(yīng)分析等價(jià)格敏感度分析--交叉分析、多元回歸、結(jié)合分析等市場(chǎng)預(yù)測(cè)分析--多元回歸、時(shí)間序列分析等利用SPSS分析市場(chǎng)調(diào)查數(shù)據(jù)一個(gè)例子——羅斯文商貿(mào)公司背景介紹:羅斯文商貿(mào)公司是Microsoft數(shù)據(jù)庫(kù)產(chǎn)品(Access,SQLServer等)中的一個(gè)示例數(shù)據(jù)庫(kù);它虛擬了一家經(jīng)銷(xiāo)日用品的商貿(mào)公司的情況;目前該公司保存的歷史數(shù)據(jù)資料,見(jiàn)下頁(yè);如何對(duì)客戶價(jià)值進(jìn)行評(píng)估。商業(yè)問(wèn)題:微軟公司提供的案例數(shù)據(jù)庫(kù)——羅斯文商貿(mào)公司,我們需要對(duì)客戶的價(jià)值進(jìn)行評(píng)估,以便采取有效的市場(chǎng)銷(xiāo)售策略。羅斯文商貿(mào)公司數(shù)據(jù)羅斯文商貿(mào)公司統(tǒng)計(jì)問(wèn)題統(tǒng)計(jì)問(wèn)題:(1)如何描述客戶價(jià)值?——購(gòu)買(mǎi)總金額?購(gòu)買(mǎi)頻次?平均每次購(gòu)買(mǎi)金額?最近購(gòu)買(mǎi)金額?它們的線性組合?——使用最簡(jiǎn)單的購(gòu)買(mǎi)總金額(2)需要什么樣的數(shù)據(jù)挖掘方法?——描述匯總?分類(lèi)?預(yù)測(cè)?概念描述?細(xì)分?相關(guān)分析?——使用最簡(jiǎn)單的描述匯總(3)需要的數(shù)據(jù)從哪里來(lái)?——從以下幾個(gè)來(lái)源:客戶訂單訂單明細(xì)羅斯文商貿(mào)公司商業(yè)問(wèn)題解決方案商業(yè)問(wèn)題解決方案從所有客戶中找出最有價(jià)值的10個(gè)客戶,將名單發(fā)給市場(chǎng)部門(mén),讓其對(duì)這些客戶進(jìn)行更多的關(guān)注小結(jié)1、模型不必永遠(yuǎn)是對(duì)的,然而只要它是有用的,那么建立模型就是必要的?!狦eogeBox2、統(tǒng)計(jì)可以在企業(yè)中得到廣泛的應(yīng)用,能夠自己做出色的統(tǒng)計(jì)分析是高度專(zhuān)業(yè)化職業(yè)的一部分。3、統(tǒng)計(jì)方法未必越“高深”越”好”,往往簡(jiǎn)單的方法可以解決“大問(wèn)題”。第四講聚類(lèi)分析方法原理按照個(gè)體(記錄)的特征將它們分類(lèi),使同一類(lèi)別內(nèi)的個(gè)體具有盡可能高的同質(zhì)性,而類(lèi)別之間則具有盡可能高的異質(zhì)性。為了得到比較合理的分類(lèi),首先要采用適當(dāng)?shù)闹笜?biāo)來(lái)定量地描述研究對(duì)象之間的聯(lián)系的緊密程度。直觀的理解為按空間距離的遠(yuǎn)近來(lái)劃分類(lèi)別方法原理假定研究對(duì)象均用所謂的“點(diǎn)”來(lái)表示。在聚類(lèi)分析中,一般的規(guī)則是將“距離”較小的點(diǎn)歸為同一類(lèi),將“距離”較大的點(diǎn)歸為不同的類(lèi)。常見(jiàn)的是對(duì)個(gè)體分類(lèi),也可以對(duì)變量分類(lèi)此時(shí)一般使用相似系數(shù)作為“距離”測(cè)量指標(biāo)方法原理在右圖中可以看到五個(gè)樣品應(yīng)當(dāng)可能被分為兩組或者三組,C/D組x和y的取值均偏低,而另三個(gè)所在組x和y的取值均偏高分為兩類(lèi)或三類(lèi)都是可接受的從圖中可以直觀的理解“距離”的含義方法原理當(dāng)用于聚類(lèi)的變量逐漸增多時(shí),分析思路完全相同,只是這樣簡(jiǎn)單、清晰的圖示展現(xiàn)類(lèi)別情況變得逐漸不大可能多維空間中的觀察可能的解決方法放棄圖示化觀察,改用復(fù)雜的統(tǒng)計(jì)指標(biāo)縮減維度,使得可以在低維度空間進(jìn)行呈現(xiàn)特點(diǎn)聚類(lèi)分析前所有個(gè)體所屬的類(lèi)別是未知的,類(lèi)別個(gè)數(shù)一般也是未知的,分析的依據(jù)就是原始數(shù)據(jù),可能事先沒(méi)有任何有關(guān)類(lèi)別的信息可參考。嚴(yán)格說(shuō)來(lái)聚類(lèi)分析并不是純粹的統(tǒng)計(jì)技術(shù),它不像其它多元分析法那樣,需要從樣本去推斷總體。一般都涉及不到有關(guān)統(tǒng)計(jì)量的分布,也不需要進(jìn)行顯著性檢驗(yàn)。聚類(lèi)分析更像是一種建立假設(shè)的方法,而對(duì)相關(guān)假設(shè)的檢驗(yàn)還需要借助其它統(tǒng)計(jì)方法。用途設(shè)計(jì)抽樣方案分層抽樣預(yù)分析過(guò)程先通過(guò)聚類(lèi)分析達(dá)到簡(jiǎn)化數(shù)據(jù)的目的,將眾多的個(gè)體先聚集成比較好處理的幾個(gè)類(lèi)別或子集,然后再進(jìn)行后續(xù)的多元分析。細(xì)分市場(chǎng)、個(gè)體消費(fèi)行為劃分先聚類(lèi),然后再利用判別分析進(jìn)一步研究各個(gè)群體之間的差異。聚類(lèi)分析與SPSS軟件TwoStepCluster過(guò)程特點(diǎn):處理對(duì)象:分類(lèi)變量和連續(xù)變量自動(dòng)決定最佳分類(lèi)數(shù)快速處理大數(shù)據(jù)集前提假設(shè):變量間彼此獨(dú)立分類(lèi)變量服從多項(xiàng)分布,連續(xù)變量服從正態(tài)分布模型穩(wěn)健TwoStepCluster過(guò)程步驟:建立ClusterFeatures(CF)Tree確定最佳聚類(lèi)數(shù)分析實(shí)例:某數(shù)碼相機(jī)制造商為了了解整個(gè)相機(jī)市場(chǎng)的形勢(shì),希望根據(jù)相機(jī)的基本特性和價(jià)格對(duì)其進(jìn)行分類(lèi),以有效地提高競(jìng)爭(zhēng)力。K-meansCluster過(guò)程屬于非系統(tǒng)聚類(lèi)法的一種方法原理選擇(或人為指定)某些記錄作為凝聚點(diǎn)按就近原則將其余記錄向凝聚點(diǎn)凝集計(jì)算出各個(gè)初始分類(lèi)的中心位置(均值)用計(jì)算出的中心位置重新進(jìn)行聚類(lèi)如此反復(fù)循環(huán),直到凝聚點(diǎn)位置收斂為止K-meansCluster過(guò)程方法特點(diǎn)要求已知類(lèi)別數(shù)可人為指定初始位置節(jié)省運(yùn)算時(shí)間樣本量大于100時(shí)有必要考慮只能使用連續(xù)性變量K-meansCluster原理K-meansCluster過(guò)程分析實(shí)例一個(gè)電信服務(wù)提供商希望基于客戶使用的服務(wù)種類(lèi)對(duì)客戶進(jìn)行細(xì)分。如果客戶能夠按照使用的服務(wù)種類(lèi)進(jìn)行細(xì)分,提供商就可以針對(duì)客戶的偏好,向其提供不同的服務(wù)內(nèi)容,吸引客戶使用更多的服務(wù)。HierarchicalCluster過(guò)程屬于系統(tǒng)聚類(lèi)法的一種其聚類(lèi)過(guò)程可以用樹(shù)形結(jié)構(gòu)(treelikestructure)來(lái)描繪的方法方法原理先將所有n個(gè)變量/觀測(cè)看成不同的n類(lèi)然后將性質(zhì)最接近(距離最近)的兩類(lèi)合并為一類(lèi)再?gòu)倪@n-1類(lèi)中找到最接近的兩類(lèi)加以合并依此類(lèi)推,直到所有的變量/觀測(cè)被合為一類(lèi)使用者再根據(jù)具體的問(wèn)題和聚類(lèi)結(jié)果來(lái)決定應(yīng)當(dāng)分為幾類(lèi)HierarchicalCluster過(guò)程特點(diǎn)一旦記錄/變量被劃定類(lèi)別,其分類(lèi)結(jié)果就不會(huì)再進(jìn)行更改可以對(duì)變量或記錄進(jìn)行聚類(lèi)變量可以為連續(xù)或分類(lèi)變量提供的距離測(cè)量方法非常豐富運(yùn)算速度較慢HierarchicalCluster過(guò)程judges.sav,中,美,法等7個(gè)國(guó)家裁判和未經(jīng)嚴(yán)格訓(xùn)練的體育愛(ài)好者對(duì)體育比賽選手的打分情況,請(qǐng)根據(jù)打分的差異將這些打分者進(jìn)行聚類(lèi)??偨Y(jié)內(nèi)容\方法TwoStepK-MeansHierarchical聚類(lèi)對(duì)象記錄記錄記錄、變量變量類(lèi)型連續(xù)變量、分類(lèi)變量連續(xù)變量連續(xù)變量、分類(lèi)變量樣本量大樣本(>1000)大樣本(>1000)小樣本(<100)特點(diǎn)自動(dòng)確定最佳分類(lèi)數(shù)保存每個(gè)樣本到類(lèi)中心的距離提供豐富的聚類(lèi)方法和圖形第五講因子分析概述解決變量間多重共線性(datareduction)有太多的變量,希望能夠消減變量,用一個(gè)新的、更小的由原始變量集組合成的新變量集作進(jìn)一步分析。新的變量集能夠更好的說(shuō)明問(wèn)題,利于簡(jiǎn)化和解釋問(wèn)題。探討變量?jī)?nèi)在聯(lián)系
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家禽飼料批發(fā)合同范例
- 書(shū)采購(gòu)合同模板模板
- 寧波家裝合同范例
- 實(shí)木家具退貨合同范例
- 委托審計(jì)承攬合同范例
- 加工機(jī)械產(chǎn)品合同范例
- 居間人合作合同范例
- 制作宣傳冊(cè)合同模板
- 室外綠化維護(hù)合同范例
- 國(guó)開(kāi)2024年秋《機(jī)電控制工程基礎(chǔ)》形考任務(wù)4答案
- 25題退役軍人事務(wù)員崗位常見(jiàn)面試問(wèn)題含HR問(wèn)題考察點(diǎn)及參考回答
- 抗震支架力學(xué)計(jì)算書(shū)
- 小學(xué)作文訓(xùn)練中如何培養(yǎng)學(xué)生的觀察能力
- xx鎮(zhèn)發(fā)展鮮食玉米“一鎮(zhèn)一業(yè)”產(chǎn)業(yè)項(xiàng)目建設(shè)方案
- IEEE1588學(xué)習(xí)筆記
- 物業(yè)合資公司組建方案
- 風(fēng)光攝影教程
- 鋼管落地卸料平臺(tái)
- 耐熱鋼的選用
- 民間借貸(欠款)糾紛人民調(diào)解協(xié)議書(shū)范本
評(píng)論
0/150
提交評(píng)論