版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2021/8/21統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)培訓(xùn)統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)培訓(xùn)2007年5月2021/8/22根據(jù)測(cè)量尺度數(shù)據(jù)的分類(lèi)姓名性別級(jí)別年齡績(jī)效分?jǐn)?shù)月均收入甲乙丙丁戊戌1101100001122125262725318.67.89.27.98.98.4247923452547268927763124注:1.本表純屬虛構(gòu),如有雷同實(shí)屬巧合;2.性別欄0代表男,1代表女;級(jí)別欄0代表員工,1代表領(lǐng)班,2代表主管;3.績(jī)效欄10分為滿分。1999年某公司員工情況明細(xì)表2021/8/23數(shù)據(jù)的分類(lèi)根據(jù)數(shù)據(jù)測(cè)量的尺度:分為定類(lèi)數(shù)據(jù)、定序數(shù)據(jù)、定距數(shù)據(jù)、定比數(shù)據(jù)根據(jù)描述對(duì)象與時(shí)間的關(guān)系:分為截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)根據(jù)統(tǒng)計(jì)
2、數(shù)據(jù)的收集方法:分為觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)2021/8/24你想要干什么?一.歸納、描述或者顯示數(shù)據(jù)二.觀察變量和數(shù)據(jù)的分布三.比較組間數(shù)據(jù)的不同四.變量之間顯著性關(guān)系的測(cè)度五.相似數(shù)據(jù)分組的測(cè)度六.相似變量的壓縮測(cè)度結(jié)束2021/8/25你要?dú)w納整理的是什么類(lèi)型的數(shù)據(jù)?1.已分類(lèi)數(shù)據(jù)(定類(lèi)、定序)2.連續(xù)、數(shù)值型數(shù)據(jù)(定距、定比)返回2021/8/26你想如何歸納整理數(shù)據(jù)?1.分類(lèi)計(jì)算頻數(shù)和百分比2.計(jì)算兩分類(lèi)變量下的頻數(shù)和百分比3.計(jì)算比率值:比率是各不同類(lèi)別數(shù)值之間的比值返回2021/8/27分類(lèi)變量的圖形及圖表顯示員工級(jí)別頻數(shù)百分(%)累積百分比(%)員工領(lǐng)班主管經(jīng)理助理75 15 8 2
3、75%15% 8% 2%75.00%90.00%98.00% 100%合計(jì)100100%AnalyzeDescriptive StatisticsFrequencies各級(jí)別員工人數(shù)表01020304050607080員工領(lǐng)班主管經(jīng)理助理頻數(shù)頻數(shù)返回2021/8/28兩分類(lèi)變量數(shù)據(jù)的圖表及圖形顯示員工級(jí)別30歲30-39歲40-49歲49-50歲合計(jì)員工領(lǐng)班主管經(jīng)理助理 47 7 2 20 5 2 1 6 2 3 1 2 1 1 75 15 8 2合計(jì) 56 28 12 4100AnalyzeDescriptive StatisticsCrosstabs員工領(lǐng)班主管經(jīng)理助理30歲30-39歲4
4、0-49歲50-6001020304050頻數(shù)員工級(jí)別年齡段各級(jí)別各年齡段頻數(shù)返回2021/8/29比率值的計(jì)算及顯示AnalyzeReportsCase summaries員工級(jí)別30歲30-39歲40-49歲49-50歲0時(shí)為尖峰分布;當(dāng)K0時(shí)為扁平分布 2021/8/219與數(shù)據(jù)分布相關(guān)的測(cè)度量總結(jié)定類(lèi)定序定距和定比集中趨勢(shì)適用的統(tǒng)計(jì)量眾數(shù)中位數(shù)分位數(shù)眾數(shù) 均值 加權(quán)平均 幾何平均 中位數(shù) 分位數(shù) 眾數(shù)離散趨勢(shì)使用的統(tǒng)計(jì)量異眾比率四分位差異眾比率 全距 方差 標(biāo)準(zhǔn)差 四分位差 異眾比率用于比較不同組數(shù)據(jù)的相對(duì)位置 標(biāo)準(zhǔn)分?jǐn)?shù):zi=(xi-x平均)/標(biāo)準(zhǔn)差用于比較不同組數(shù)據(jù)相對(duì)離散程度 離
5、散系數(shù):V=標(biāo)準(zhǔn)差/x平均值2021/8/220常見(jiàn)的數(shù)據(jù)分布正態(tài)分布 在社會(huì)經(jīng)濟(jì)問(wèn)題中,有許多隨機(jī)變量的概率分布服從正態(tài)分布,如身高、體重等。正態(tài)分布記作XN(,), 為隨機(jī)變量X的均值, 為隨機(jī)變量X的標(biāo)準(zhǔn)差。 決定了正態(tài)分布圖形的中心位置, 決定了圖形中峰的陡峭程度, 當(dāng) 較大,圖形較緩,當(dāng) 較小,圖形趨于陡峭。 所有的正態(tài)分布均能通過(guò)Z=(X- )/ 化成標(biāo)準(zhǔn)正態(tài)分布XN(0,1)(均數(shù)為0,方差為1)。 隨機(jī)變量X處在一個(gè)正負(fù)一個(gè)之內(nèi)的概率為68.26%;2個(gè)之內(nèi)的概率為95.45%; 3個(gè)之內(nèi)的概率為99.73%。返回2021/8/221你要比較什么類(lèi)型的數(shù)據(jù)?1.分類(lèi)數(shù)據(jù)(定比、
6、定序)2.已分組的連續(xù)數(shù)值型數(shù)據(jù)(定距、定比)返回2021/8/222應(yīng)用列聯(lián)分析解決分類(lèi)數(shù)據(jù)的組間比較 頻數(shù)分布表每次只能描述一個(gè)變量的情況,而列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類(lèi)的頻數(shù)分布表,是反映兩個(gè)或多個(gè)變量聯(lián)合分布的表格??捎糜诟鹘M比例值是否一在列聯(lián)表中,可以計(jì)算以列合計(jì)為基數(shù)的列百分比或以行合計(jì)為基數(shù)的行百分比??ǚ浇y(tǒng)計(jì)量提供對(duì)列聯(lián)表中觀察到的聯(lián)系的統(tǒng)計(jì)顯著性檢驗(yàn)(擬合優(yōu)度和變量聯(lián)系),通過(guò)系數(shù)、列聯(lián)系數(shù)、Cramers V和系數(shù)測(cè)量變量關(guān)系強(qiáng)度的指標(biāo)。 Analyze-Descritives-Crosstabs2021/8/223舉例說(shuō)明 某公司為了提高市場(chǎng)占有率,某行業(yè)有兩個(gè)主
7、要的競(jìng)爭(zhēng)對(duì)手,A和B公司同時(shí)開(kāi)展了廣告宣傳。在廣告宣傳之前,A公司的市場(chǎng)占有率為45%,B公司市場(chǎng)占有率為40%,其它公司為15%。廣告戰(zhàn)后,隨機(jī)抽取了200名消費(fèi)者,其中102人準(zhǔn)備買(mǎi)A公司產(chǎn)品,82人買(mǎi)B公司產(chǎn)品,另外有16人準(zhǔn)備買(mǎi)其它公司產(chǎn)品。問(wèn)以廣告戰(zhàn)前后各公司市場(chǎng)占有率是否發(fā)生了變化。公司觀察頻率期望頻率AB其它1028216908030合計(jì)200200 檢驗(yàn)觀察值和期望值的擬合優(yōu)度:計(jì)算卡方值為8.18,而顯著性0.05、自由度為2時(shí)的卡方值5.99,因此說(shuō)明占有率發(fā)生了顯著的變化。2021/8/224舉例說(shuō)明 列聯(lián)表格的卡方檢驗(yàn)還用于判斷兩個(gè)分類(lèi)變量之間是否存在聯(lián)系的問(wèn)題中。 一
8、種原料來(lái)自不同的地區(qū),原材料質(zhì)量被分為三個(gè)不同的等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)行檢驗(yàn),結(jié)果如下表:地區(qū)一級(jí)二級(jí)三級(jí)合計(jì)甲乙丙526050645965245274140171189合計(jì)162188150500 計(jì)算卡方值為19.82大于顯著性為0.05、自由度為4的的卡方值為9.488,所以地區(qū)和原材料等級(jí)之間存在依賴(lài)關(guān)系,原材料的質(zhì)量受地區(qū)影響。存在關(guān)系的假設(shè)成立,可以計(jì)算系數(shù)、列聯(lián)系數(shù)Cramers V和系數(shù)測(cè)量變量關(guān)系強(qiáng)度的指標(biāo)。返回2021/8/225你想要比較多少組數(shù)據(jù)或多少個(gè)變量?1.一組數(shù)據(jù)或變量與一個(gè)已知數(shù)值進(jìn)行比較2.兩組數(shù)據(jù)或變量3.三組或者三個(gè)以上變量返回2021/8
9、/226應(yīng)用單樣本T檢驗(yàn)檢驗(yàn)一組數(shù)據(jù)或變量與一已知數(shù)值是否相等 工作中經(jīng)常碰到根據(jù)已有的知識(shí)或者給定的標(biāo)準(zhǔn)對(duì)單個(gè)變量做出結(jié)論,比如新產(chǎn)品的份額是否超過(guò)了15%等。這樣的問(wèn)題就可以轉(zhuǎn)化為通過(guò)單樣本T檢驗(yàn)進(jìn)行檢驗(yàn)的零假設(shè)。單樣本T檢驗(yàn)檢驗(yàn)的是抽樣總體均值是否與給定假設(shè)一致。根據(jù)樣本計(jì)算得出的T統(tǒng)計(jì)量值與給定的0.05顯著性水平下的臨界值進(jìn)行比較,從而得出結(jié)論。 SPSS實(shí)現(xiàn):Analyze-Compare Means-One Sample T Test返回2021/8/227你的數(shù)據(jù)是如何組織起來(lái)的?1.分成兩不相關(guān)組的一個(gè)連續(xù)數(shù)值型變量2.具有相關(guān)關(guān)系的兩連續(xù)數(shù)值型變量返回2021/8/228你
10、想要進(jìn)行何種獨(dú)立的樣本檢驗(yàn)?步驟:1.首先檢測(cè)變量是否服從正態(tài)分布,方法為通過(guò)Graphs-Interactive-Histogram(直方圖)進(jìn)行觀察2.如果變量服從正態(tài)分布,那么應(yīng)用獨(dú)立樣本T檢驗(yàn)進(jìn)行兩樣本均數(shù)的比較:Analyze-Compare Means-Independent Samples T Test3.如果變量不服從正態(tài)分布,那么應(yīng)用非參數(shù)雙獨(dú)立樣本檢驗(yàn)進(jìn)行兩獨(dú)立樣本所在總體分布是否相同的檢驗(yàn):Analyze-Nonparametric Tests-2 Independent Samples返回2021/8/229你想要何種配對(duì)樣本的檢驗(yàn)步驟:1.同樣通過(guò)直方圖觀察變量是否服
11、從正態(tài)分布;2.如果服從正態(tài)分布,那么應(yīng)用配對(duì)樣本的T檢驗(yàn)進(jìn)行配對(duì)設(shè)計(jì)的差值均數(shù)與總體均數(shù)0進(jìn)行比較:Analyze-Compare Means-Paired Samples T Test.3.如果不服從正態(tài)分布,那么應(yīng)用雙相關(guān)樣本檢驗(yàn):Analyze-Nonparametric Tests-2 Related Samples.返回2021/8/230方差分析(ANOVA) 前面介紹的方法均為一個(gè)因素水平下,兩組數(shù)據(jù)的比較方法,當(dāng)一個(gè)因素水平下,有三個(gè)或者三個(gè)以上的組別時(shí),就需要用到方差分析。方差分析適用于兩組或者兩組以上均值差異的檢驗(yàn)。方差分析必須有一個(gè)定量(定距或定比尺度)的因變量,以及一
12、個(gè)或者多個(gè)自變量(定類(lèi)),定類(lèi)自變量稱(chēng)為因子,一個(gè)因子成為單因子方差分析,若有n個(gè)自變量,成為n因子方差分析。其原理為通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析來(lái)判斷不同總體的均值是否相同。 方差分析的3個(gè)基本假定:1.每個(gè)總體都應(yīng)該服從正態(tài)分布;2.各個(gè)總體的方差2 ;3.觀測(cè)值是相互獨(dú)立的。 SPSS實(shí)現(xiàn):AnalyzeCompare MeansOne-Way ANOVA2021/8/231舉例說(shuō)明觀測(cè)值行業(yè)零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758 下表為一年內(nèi),四個(gè)行業(yè)抽取的樣本企業(yè)投訴次數(shù)表,問(wèn)這幾個(gè)行業(yè)之間
13、的服務(wù)質(zhì)量是否有顯著性差異。 下表為方差分析的結(jié)果表,從F統(tǒng)計(jì)量值為3.4066大于給定0.05水平下的F分布的臨界值3.1273,應(yīng)該拒絕原假設(shè),說(shuō)明各個(gè)行業(yè)的投訴之間的差異是顯著的。差異源平方和(SS)自由度(df)均方(MS)F統(tǒng)計(jì)量P值給定0.05水平下F分布的臨界值組間組內(nèi)1456.6082708319485.536142.5263.40660.0387653.1273總計(jì)4164.608722返回2021/8/232你有什么樣的數(shù)據(jù)?1.分類(lèi)數(shù)據(jù)(定類(lèi)、定序)2.定序、等級(jí)順序、或者非參數(shù)連續(xù)性數(shù)據(jù)3.連續(xù)數(shù)值型數(shù)據(jù)(定距、定比)返回2021/8/233分類(lèi)數(shù)據(jù)(定類(lèi)、定序) 應(yīng)用
14、前面講過(guò)的列聯(lián)分析,卡方對(duì)獨(dú)立性進(jìn)行檢驗(yàn),進(jìn)而計(jì)算通過(guò)系數(shù)、列聯(lián)系數(shù)、Cramers V和系數(shù)測(cè)量變量關(guān)系強(qiáng)度的指標(biāo)。返回2021/8/234定序、等級(jí)順序、或者非參數(shù)連續(xù)性數(shù)據(jù) 計(jì)算Spearman相關(guān)系數(shù)和Kendalls tau-b相關(guān)系數(shù),看兩變量的關(guān)系的密切程度。計(jì)算排序的相關(guān)系數(shù)又稱(chēng)秩相關(guān)或者等級(jí)相關(guān),記作r。當(dāng)|r|0.3,視為不相關(guān);當(dāng)0.3|r|0.5,視為低度相關(guān);0.5|r|0.8,視為中度相關(guān);|r|0.8,視為高度相關(guān)。 SPSS實(shí)現(xiàn):Analyze-Correlate-Bivariate選Spearman相關(guān)系數(shù)和Kendalls tau-b相關(guān)系數(shù)返回2021/8
15、/235連續(xù)數(shù)值型數(shù)據(jù)(定距、定比)1.兩變量:計(jì)算Pearson相關(guān)系數(shù)來(lái)度量?jī)勺兞筷P(guān)系的密切程度,記作r。當(dāng)|r|0.3,視為不相關(guān);當(dāng)0.3|r|0.5,視為低度相關(guān);0.5|r|0.8,視為中度相關(guān);|r|0.8,視為高度相關(guān)。 SPSS實(shí)現(xiàn)Analyze-Correlate-Bivariate選擇Pearson項(xiàng)。2.控制了一個(gè)或者兩個(gè)的其他其變量的影響之后兩變量的相關(guān),為偏相關(guān),也記作r。 Spss實(shí)現(xiàn)Analyze- Correlate-Partial選擇要分析的兩變量進(jìn)入要分析的變量框;選擇要控制的變量進(jìn)入要控制的變量框2021/8/236測(cè)度變量的因果關(guān)系回歸分析 前面介紹的
16、數(shù)值型變量的相關(guān)系數(shù)或者偏相關(guān)系數(shù)主要了解兩變量關(guān)系的密切程度,而回歸分析主要度量一個(gè)因變量,與一個(gè)、兩個(gè)或兩個(gè)以上的自變量的數(shù)量伴隨關(guān)系,是測(cè)度因變量和自變量的因果關(guān)系的方法?;貧w分為線性回歸和曲線回歸。以一元線性回歸為例:其回歸方程形式為y=ax+b?;貧w直線的擬和優(yōu)度的測(cè)度應(yīng)用的是判定系數(shù),判定系數(shù)說(shuō)明了因變量的數(shù)據(jù)變動(dòng)中,有多少是由自變量的的變動(dòng)所決定的。而估計(jì)標(biāo)準(zhǔn)誤用于測(cè)度各實(shí)際觀測(cè)點(diǎn)在直線周?chē)姆稚⒊潭?,其越小,說(shuō)明回歸直線對(duì)各觀測(cè)點(diǎn)代表性好,反之則代表性差。另外還用F檢驗(yàn)檢驗(yàn)線性關(guān)系的顯著性。應(yīng)用T檢驗(yàn)檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn),檢驗(yàn)自變量對(duì)因變量的影響是否顯著。 SPSS實(shí)現(xiàn):A
17、nalyze-Regression-Linear返回2021/8/237你有什么類(lèi)型的數(shù)據(jù)?1.連續(xù)數(shù)值型數(shù)據(jù)(定距、定比)2.分類(lèi)數(shù)據(jù)(定類(lèi)、定序)返回2021/8/238你想要判別分組還是判別已知組的特征?1.判別分組,應(yīng)用聚類(lèi)分析。聚類(lèi)分析是一組將研究對(duì)象分成相對(duì)同質(zhì)的群組的統(tǒng)計(jì)分析技術(shù),不區(qū)分自變量和因變量。聚類(lèi)分析的主要目的是根據(jù)聚類(lèi)變量將對(duì)象分成相對(duì)同質(zhì)的群組。某一組的內(nèi)部成員更加相似,與其它組的成員不同。 當(dāng)數(shù)據(jù)量小于200時(shí),應(yīng)用系統(tǒng)聚類(lèi)分析將數(shù)據(jù)分組,Analyze-Classify-Hierarchical Cluster; 當(dāng)大于200個(gè)數(shù)據(jù)時(shí)應(yīng)用K均數(shù)聚類(lèi)法,又稱(chēng)快速聚
18、類(lèi)法,Analyze-Classify-K-means Cluster。2021/8/239已知分組的判別 2.判別已知組的特征應(yīng)用判別分析。 判別分析是一種數(shù)據(jù)分析技術(shù),適用于標(biāo)準(zhǔn)變量或因變量為定類(lèi)數(shù)據(jù),預(yù)測(cè)變量或者自變量為定距(或者定比數(shù)據(jù))的情況。就像醫(yī)生看病的判斷過(guò)程一樣,有各種各樣的病癥的癥狀、檢測(cè)結(jié)果值分類(lèi)儲(chǔ)存在腦子里,醫(yī)生根據(jù)現(xiàn)在來(lái)的病人的癥狀、檢測(cè)結(jié)果等判斷病人得的是什么病。判別分析就是構(gòu)造判別函數(shù),然后判別新調(diào)查對(duì)象的組別。 SPSS實(shí)現(xiàn):Analyzeclassify-Discriminant返回2021/8/240分類(lèi)數(shù)據(jù)的數(shù)據(jù)分組 分類(lèi)數(shù)據(jù)不可進(jìn)行數(shù)據(jù)聚類(lèi)分析!SPSS也未提供此項(xiàng)功能。返回2021/8/241你有什么類(lèi)型的數(shù)據(jù)?1.連續(xù)數(shù)值型數(shù)據(jù)(定距、定比)2.分類(lèi)數(shù)據(jù)(定類(lèi)、定序)返回2021/8/242應(yīng)用因子分析對(duì)變量進(jìn)行壓縮 因子分析是一組主要用于數(shù)據(jù)提煉與概括地分析方法的總稱(chēng)。在各種數(shù)據(jù)分析中,可能涉及大量的變量,其中大部分變量是相關(guān)的,需要將變量的數(shù)目縮減到合適的水平,以便進(jìn)一步分析。大量相互關(guān)聯(lián)的變量之間的關(guān)系可以用幾個(gè)潛在的因子表示。比如,在測(cè)量店面形象時(shí),可以讓調(diào)查對(duì)象對(duì)商店的一系列指標(biāo)打分,然后用因子分析確定構(gòu)成商店形象的主要因子。方差分析、回歸分析和判別分析中需要確定一個(gè)因變量或者標(biāo)準(zhǔn)變量,而將
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單位管理制度呈現(xiàn)大全【職員管理】十篇
- 《客房清掃程序》課件
- 《番茄晚疫病》課件
- 《四年級(jí)下語(yǔ)文總結(jié)》與《四年級(jí)本學(xué)期的總結(jié)》與《四年級(jí)本學(xué)期的總結(jié)反思》范文匯編
- 復(fù)習(xí)培優(yōu)卷03 第5單元(解析版)
- 第5單元+國(guó)防建設(shè)與外交成就
- 軟件開(kāi)發(fā)委托合同三篇
- 農(nóng)業(yè)投資盈利之路
- 設(shè)計(jì)裝修銷(xiāo)售工作總結(jié)
- 游戲行業(yè)前臺(tái)工作總結(jié)
- 新版出口報(bào)關(guān)單模板
- 北京市西城區(qū)師范學(xué)校附屬小學(xué)北師大版數(shù)學(xué)六年級(jí)上冊(cè)期末試題測(cè)試題及答案
- 杭州工地?cái)?shù)字化施工方案
- 騰訊云大數(shù)據(jù)云平臺(tái)TBDS 產(chǎn)品白皮書(shū)
- 網(wǎng)球國(guó)家二級(jí)裁判培訓(xùn)講座
- 中南大學(xué)軍事理論學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫(kù)2023年
- 員工工資條模板
- 缺點(diǎn)列舉法課件
- 籃球?qū)m?xiàng)體育課教學(xué)大綱、教學(xué)計(jì)劃
- 創(chuàng)新與創(chuàng)業(yè)管理-四川大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 執(zhí)行依據(jù)主文范文(通用4篇)
評(píng)論
0/150
提交評(píng)論