




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)與SPSS數(shù)據(jù)處理演示文稿現(xiàn)在是1頁\一共有193頁\編輯于星期五優(yōu)選數(shù)據(jù)與SPSS數(shù)據(jù)處理現(xiàn)在是2頁\一共有193頁\編輯于星期五第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第1節(jié)數(shù)據(jù)現(xiàn)在是3頁\一共有193頁\編輯于星期五小時數(shù)燈泡數(shù)43-48248-53153-58258-632163-682868-732873-783378-832683-882188-931993-981098-1036103-1082108-1130113-1181200只燈泡使用壽命頻數(shù)分布表使用壽命二百只燈泡的可使用壽命直方圖頻數(shù)現(xiàn)在是4頁\一共有193頁\編輯于星期五公司1公司2公司3公司4合計贊成68755779279反對32453331141合計10012090110420關(guān)于改革方案調(diào)查結(jié)果可口可樂新騎士可口可樂雪碧雪碧杏仁露可口可樂可口可樂醒目可口可樂新騎士可口可樂可口可樂雪碧可口可樂醒目可口可樂雪碧杏仁露杏仁露雪碧雪碧可口可樂可口可樂雪碧新騎士雪碧可口可樂雪碧醒目雪碧雪碧杏仁露可口可樂可口可樂杏仁露可口可樂杏仁露新騎士杏仁露可口可樂新騎士雪碧可口可樂杏仁露可口可樂醒目可口可樂醒目雪碧5種軟飲料購買頻數(shù)現(xiàn)在是5頁\一共有193頁\編輯于星期五現(xiàn)在是6頁\一共有193頁\編輯于星期五數(shù)據(jù)的定義現(xiàn)代漢語詞典:數(shù)據(jù)(data)是進行各種統(tǒng)計、計算、科學研究和技術(shù)設(shè)計等所依據(jù)的數(shù)值。數(shù)理統(tǒng)計學:通過對樣本進行觀察或測定的方法,得到的觀察值或變量(variable)就是數(shù)據(jù)。數(shù)據(jù)是原始事實,如員工的姓名、每周的工作小時數(shù)、商店存貨數(shù)量或銷售訂單等。傳統(tǒng)的數(shù)據(jù):狹義的數(shù)據(jù),指用數(shù)值表示的字據(jù),僅能用數(shù)字表示現(xiàn)代的數(shù)據(jù):廣義的數(shù)據(jù),指代表真實世界的客觀事物,可以是數(shù)字、文字、圖像、聲音等。數(shù)據(jù)是簡單的客觀事實,除它本身以外沒有什么價值。但如果在各個數(shù)據(jù)之間定義了相互的關(guān)系,它們就具有了價值。現(xiàn)在是7頁\一共有193頁\編輯于星期五數(shù)據(jù)的類型按照數(shù)據(jù)的表現(xiàn)形式,廣義的數(shù)據(jù)常分為4種基本數(shù)據(jù),包括數(shù)字、文字、字母、符號和字符圖形數(shù)據(jù),包括圖形、圖片聲音數(shù)據(jù),包括聲音、噪聲和音調(diào)視覺數(shù)據(jù),包括動作、脈沖、電磁波、信號和動畫當這些事實按照一定意義的方式組織和安排在一起,就成為信息現(xiàn)在是8頁\一共有193頁\編輯于星期五數(shù)據(jù)的類型正確理解所研究變量的類型對選擇適當?shù)慕y(tǒng)計分析方法至關(guān)重要對變量分類可以根據(jù)不同標準進行獲得方式觀測水平取值性質(zhì)現(xiàn)在是9頁\一共有193頁\編輯于星期五(1)根據(jù)數(shù)據(jù)的獲得方式觀測數(shù)據(jù)(observeddata):取值直接來自研究者的觀察、測量或調(diào)查表現(xiàn)物質(zhì)特征的數(shù)據(jù)為客觀數(shù)據(jù)。如空氣污染物、某商品的物價表現(xiàn)精神屬性的數(shù)據(jù)為主觀數(shù)據(jù)(是客觀數(shù)據(jù)的能動反映和抽象),如人們對某事物的反映按照數(shù)據(jù)來源,有對離散數(shù)的觀測數(shù)據(jù)——計數(shù)數(shù)據(jù),人數(shù)、桌椅數(shù);有對連續(xù)數(shù)的觀測數(shù)據(jù)——計量數(shù)據(jù),如溫度、長度。衍生數(shù)據(jù)(deriveddata):又稱之為二手數(shù)據(jù),其來源于他人直接觀察和調(diào)查,或者是觀測(初級)數(shù)據(jù)的再處理,經(jīng)過高度抽象,是高級的客觀數(shù)據(jù)??陀^數(shù)據(jù)經(jīng)人為的加工,即轉(zhuǎn)化為衍生數(shù)據(jù)衍生數(shù)據(jù)取值往往是通過某種數(shù)學方法根據(jù)觀測量計算出來的,如平均氣溫、平均物價等?,F(xiàn)在是10頁\一共有193頁\編輯于星期五(2)根據(jù)數(shù)據(jù)的觀測水平定量數(shù)據(jù)(quantitativedata)連續(xù)數(shù)據(jù)(continuousdata)(氣溫、氣壓)離散數(shù)據(jù)(discretedata)(上課人數(shù)、上班人數(shù))順序數(shù)據(jù)(ordinaldata)(比賽名次、考試成績名次等)連續(xù)數(shù)據(jù)可轉(zhuǎn)化為離散數(shù)據(jù),也可轉(zhuǎn)化為順序數(shù)據(jù);但順序數(shù)據(jù)不能轉(zhuǎn)化為離散數(shù)據(jù)或連續(xù)數(shù)據(jù)。為方便起見,年齡數(shù)據(jù)、時間(天、年)、貨幣(價格、工資)等數(shù)據(jù)雖然是連續(xù)數(shù)據(jù),也常常作為離散數(shù)據(jù)來處理。定性數(shù)據(jù)(qualitativedata)又叫做類型數(shù)據(jù)(categoricaldata)定量數(shù)據(jù)與定性數(shù)據(jù)的根本區(qū)別在于前者取值有明確的順序意義,而后者取值僅具有屬性特征(今天是否下雨、有無球賽、班里是否開會)現(xiàn)在是11頁\一共有193頁\編輯于星期五在使用有關(guān)統(tǒng)計方法時要注意具體方法的要求,與所研究數(shù)據(jù)之間的一致性根據(jù)測量水平劃分的各類數(shù)據(jù)之間的最重要差別在于它們的信息量不同。測量水平最高的數(shù)據(jù)是連續(xù)量,它包含的信息量在所有數(shù)據(jù)中為最高,其次是離散量和順序量,最后才是類型量。不同數(shù)理統(tǒng)計方法適用于不同類型的數(shù)據(jù)用針對高測量水平數(shù)據(jù)的方法去分析低測量水平的數(shù)據(jù),導致錯誤的結(jié)論使用為低測量水平數(shù)據(jù)設(shè)計的方法去檢驗高測量水平數(shù)據(jù),會造成數(shù)據(jù)信息的浪費現(xiàn)在是12頁\一共有193頁\編輯于星期五不同類型數(shù)據(jù)之間的轉(zhuǎn)換不同類型數(shù)據(jù)之間的轉(zhuǎn)換是允許的,但此類轉(zhuǎn)換必然是單向的。由于不同數(shù)據(jù)中包含的信息量不同,只可能將觀測水平較高的數(shù)據(jù)轉(zhuǎn)換為觀測水平較低的類型在進行統(tǒng)計分析時最常用的數(shù)據(jù)類型轉(zhuǎn)換是將連續(xù)量或離散量變換為順序量,即所謂求秩運算。鑒于此類轉(zhuǎn)換將導致數(shù)據(jù)信息的損失,非必要時盡量不要使用?,F(xiàn)在是13頁\一共有193頁\編輯于星期五(3)按照數(shù)據(jù)的取值(性質(zhì))能否由觀察者加以控制,可將其分成隨機數(shù)據(jù)(randomdata)和確定性數(shù)據(jù)(fixeddata)兩大類數(shù)理統(tǒng)計方法的研究對象是隨機數(shù)據(jù)。隨機數(shù)據(jù)的主要特點在于它們的每一次取值都是不確定的,因此研究者不可能控制也無法預知每個取值的確切數(shù)值。另一方面,隨機數(shù)據(jù)在大量觀察中的取值又有其特定的規(guī)律性,而數(shù)理統(tǒng)計方法就是要揭示這種規(guī)律性。確定性數(shù)據(jù)本身不能成為數(shù)理統(tǒng)計方法研究的直接對象,但當研究涉及兩個或兩個以上數(shù)據(jù)之間的關(guān)系時,確定性數(shù)據(jù)仍有其特定的地位(方差分析中的因素或回歸分析中的自變量)?,F(xiàn)在是14頁\一共有193頁\編輯于星期五數(shù)據(jù)的計量--尺度在現(xiàn)代科學研究中,對研究對象一般都要采取測量的方法進行觀察。測量的尺度,就是用于觀察研究對象和處理資料的測量方法。資料的統(tǒng)計分析處理,就是要運用這些尺度測量被研究對象。有的事物、現(xiàn)象只能或只需對其屬性進行分類(稱之為定性分析),有些則可以或要求必須用比較精確的數(shù)字加以計量(稱之為定量分析)。由粗略到精確可分為4個層次,定類尺度(nominalscale)、定序尺度(Ordinalscale)、定距尺度(intervalscale)和定比尺度(ratioscale)共4級。每一級都代表了測量的一個層次。現(xiàn)在是15頁\一共有193頁\編輯于星期五數(shù)據(jù)的計量的四種尺度定類尺度
nominalscale定序尺度
ordinalscale定距尺度
intervalscale定比尺度
ratioscale按照某屬性對事物進行平行的分類。(=、≠)對事物類別間等級或順序差別的測度。(<、>)對事物類別或次序之間差距的測度。
(+、-)對事物類別或次序之間差距及差別程度的測度。
(×、÷)現(xiàn)在是16頁\一共有193頁\編輯于星期五1.定類尺度定類尺度也稱作名義尺度,是測量尺度中層次最低的計量尺度,是僅能區(qū)分出不同類別的測量尺度。按照某種屬性把事物進行分類,是判斷“屬于/不屬于”的基準。常用于測量定類數(shù)據(jù),如性別分為男和女兩類。定類尺度在統(tǒng)計處理時也可用數(shù)字表示,但這些數(shù)字只是由研究者任意規(guī)定的某一類別的代號,不具任何數(shù)學意義。如對性別可以規(guī)定女是0、男是1。這里的數(shù)據(jù)不能區(qū)分大小或進行加減乘除數(shù)學運算,只能計算各類別的頻數(shù)與頻率。在市場調(diào)查中,定類尺度常被用來度量被調(diào)查的品牌、屬性、商店等對象。現(xiàn)在是17頁\一共有193頁\編輯于星期五變量變量值編碼性別男女12人種白黃棕黑1234現(xiàn)在是18頁\一共有193頁\編輯于星期五定類尺度的兩個特點:它僅僅只是區(qū)別不同事物的性質(zhì)而沒有任何數(shù)量比較關(guān)系,在代號上也沒有任何量的關(guān)系,因而不能進行數(shù)的比較和運算;這種代號具有隨意性,其符號既可用數(shù)字也可用英文、拼音字母等。在對它們進行排列時,可以按研究者認定的形式進行。
定類尺度的設(shè)計必須遵循兩個原則:
第一,規(guī)定的類別必須具有窮盡性,即所有被測量的現(xiàn)象都可分別納入這些類別;
第二,各類別必須是相互排斥的,一種現(xiàn)象只能歸入一類,而不能出現(xiàn)同時歸入兩類的情況?,F(xiàn)在是19頁\一共有193頁\編輯于星期五2.定序尺度定序尺度又叫順序尺度,是指能將社會指標排列出大小或高低秩序的測量尺度。它比定類尺度高級一些,不僅能將事物分成不同的類別,還可以確定這些類別的優(yōu)劣或順序,是判斷“A比B···”的基準。用于測量定序數(shù)據(jù)如文化程度可分成文盲、小學、初中、高中、大專、大學、研究生等7級,每一級都較前一級更高,所給編號分別為1、2,3,4、5,6、7。定序數(shù)據(jù)可以計算各類別的頻數(shù)與頻率可以比較大小,但不能進行加減乘除數(shù)學運算。如根據(jù)文化程度排序,可以判斷初中文化程度讀書時間多于小學而低于高中,并用數(shù)字符號表示為小學<初中<高中,但無法判斷初中與小學受教育年限的差別是否同高中與初中受教育年限的差別一樣大。定序尺度常被用來度量相對態(tài)度、意見、感覺和偏好。現(xiàn)在是20頁\一共有193頁\編輯于星期五定序尺度的特點定序數(shù)據(jù)在統(tǒng)計處理上,其代號也是由研究者任意確定的,使用符號既可是數(shù)字,也可是別的字符。和定類數(shù)據(jù)不同的是,它的排列順序不能有任意性,只能從小到大或由大到小。定序尺度仍然不能進行數(shù)學運算,因為這類運算不僅無法進行,而且也不具有任何的實際意義。定序尺度是行為學研究中最常用的測量尺度。如在態(tài)度測量中要問及調(diào)查對象是否喜歡跳舞時就可以列出非常喜歡、喜歡、一般、不喜歡、厭惡等5個等級,并可用代號來表示。使用定序尺度時需要注意:當定序尺度之外的因素引入實際測量之后,原測量的對象會導致由定序數(shù)據(jù)變成定類數(shù)據(jù),從而降低測量的層次?,F(xiàn)在是21頁\一共有193頁\編輯于星期五變量編碼產(chǎn)品等級一等品二等品三等品123對事物的態(tài)度很滿意滿意中立不滿意反對12345變量值現(xiàn)在是22頁\一共有193頁\編輯于星期五3.定距尺度定距尺度也稱間隔尺度,是指能用某種計量單位去測定研究現(xiàn)象的測量尺度。它用于測量定距數(shù)據(jù),度量層次高于定序尺度,它不僅能將事物分成不同類別并進行排序,而且可以準確地計量它們間的差距。用定距尺度測量的樣本數(shù)據(jù)間的距離是可以確定的,因而不僅可以比較樣本數(shù)據(jù)的大小,而且可以比較各數(shù)據(jù)間差別的大小。如溫度,90度比80度高10度。其中的數(shù)據(jù)除可以分類與比較大小以外,還可以進行加減運算?,F(xiàn)在是23頁\一共有193頁\編輯于星期五定距尺度特征由于沒有絕對零點,因此乘除運算是沒有意義的,攝氏溫度是個很好的例子。如當三個地點的氣溫分別為20度、25度、40度時,不僅知道他們的氣溫定序排列是25度大于20度而小于40度,而且也知道25度與20度的差別小于25度與40度的差別。由于定距數(shù)據(jù)有統(tǒng)一計算單位,故可以進行加減運算,但不能做乘除運算,因為做乘除運算要一個表示真正是“無”的絕對零,如氣溫為0度(嚴格地講,溫度有絕對零度),就不能說其沒有溫度,也不能說溫度數(shù)為30度的氣溫,是溫度數(shù)為15度的氣溫2倍。現(xiàn)在是24頁\一共有193頁\編輯于星期五4.定比尺度定比尺度也稱比率尺度,是最高層次的度量尺度,除具有以上3種尺度的所有特性以外,還有絕對零點。因此,除了可以分類、比較大小以及加減運算以外,還可做乘除運算,可以計量測度值間的比值。如以“元”作為計量單位來測定人們的收入,對于收入,0表示無收入,在此是有實際意義的,不僅可以計算500元比300元也是多200元,還可以計算1000元是500元的2倍。在市場調(diào)查中,銷售額、成本、市場份額、消費者數(shù)等變量都是定比數(shù)據(jù)。定比尺度一般都是連續(xù)性數(shù)據(jù)。例如收入,不僅可有從40、41、42、43直到100元之別,而且每1元之間,還可有精確到分的100個點相連接,正因為如此,定比尺度一般是用計算單位的量度值作為數(shù)據(jù)值,具有客觀的確定性,而沒有隨意性。現(xiàn)在是25頁\一共有193頁\編輯于星期五6枚3枚現(xiàn)在是26頁\一共有193頁\編輯于星期五小結(jié)變量類型計量尺度品質(zhì)型變量數(shù)值型變量定類變量定序變量數(shù)值型變量定類變量定序變量定距變量定比變量定類(=、≠)定序(<、>)定距(+、-)定比(×、÷)∨∨∨∨∨∨
∨∨
∨
∨變量類型的劃分現(xiàn)在是27頁\一共有193頁\編輯于星期五品質(zhì)型變量數(shù)量型變量編號性別年齡身高體重1113156.047.52113155.037.83114157.949.24115166.057.05114164.544.06214164.744.17213158.057.38213162.047.09214160.553.010215169.051.110青少年身高體重表品質(zhì)型變量品質(zhì)型變量數(shù)量型變量人員年齡性別投票態(tài)度120女張三中立227女張三反對319男李四反對438男張三贊成538男李四贊成653女張三贊成724男李四贊成841女李四反對935女張三中立1030男李四贊成關(guān)于投票選舉一次抽樣調(diào)查的數(shù)據(jù)陣列現(xiàn)在是28頁\一共有193頁\編輯于星期五以上4種尺度對事物的度量層次是由低級到高級,由粗略到精確逐步遞進的,定類尺度是最低層次的測量尺度,定序尺度較定類尺度則高一層次,它包括了定類尺度的特性。定距尺度較定類尺度又高一層次,而且也包括了前兩者的特性。由于它們測量的層次、特性的不同,在統(tǒng)計處理中便針對有不同類型變量的統(tǒng)計方法。高層次計量尺度的數(shù)據(jù)可以轉(zhuǎn)化成低層次計量尺度的數(shù)據(jù),但反過來,低層次計量尺度的數(shù)據(jù)不能轉(zhuǎn)化成高層次計量尺度的數(shù)據(jù)。不同的轉(zhuǎn)換方法,高層次計量尺度可產(chǎn)生不同形式、不同數(shù)量的低層次計量數(shù)值,尺度轉(zhuǎn)換就會有信息損失,所以除了高層次計量尺度數(shù)據(jù)質(zhì)量比較差,或者研究一致性的需要,一般不要隨意轉(zhuǎn)換尺度。現(xiàn)在是29頁\一共有193頁\編輯于星期五第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第2節(jié)SPSS數(shù)據(jù)文件的建立和管理現(xiàn)在是30頁\一共有193頁\編輯于星期五對數(shù)據(jù)類型數(shù)據(jù)文件的建立原始資料數(shù)據(jù)錄入:文本格式電子表格用SPSS進行數(shù)據(jù)錄入大樣本---數(shù)據(jù)庫二手資料數(shù)據(jù)讀取:用SPSS讀取各種格式的數(shù)據(jù)現(xiàn)在是31頁\一共有193頁\編輯于星期五數(shù)據(jù)錄入三步曲確定變量,定義各變量屬性錄入數(shù)據(jù)檢查錄入錯誤現(xiàn)在是32頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)文件的特點SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件數(shù)據(jù)結(jié)構(gòu):記錄數(shù)據(jù)變量的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和度量尺度等必要信息數(shù)據(jù)內(nèi)容:待分析的具體數(shù)據(jù)建立SPSS數(shù)據(jù)文件描述數(shù)據(jù)的結(jié)構(gòu)--VariableView錄入編輯數(shù)據(jù)--DataView現(xiàn)在是33頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的組織方式原始數(shù)據(jù)的組織方式計數(shù)數(shù)據(jù)(頻數(shù)數(shù)據(jù))的組織方式現(xiàn)在是34頁\一共有193頁\編輯于星期五原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯窗口中的一行稱為一個個案或記錄(Case),所有個案組成SPSS數(shù)據(jù)文件的內(nèi)容數(shù)據(jù)編輯窗口的一列稱為一個變量(Variable),每個變量都有一個名字,稱為變量名,它是訪問和分析SPSS每個變量的唯一標志現(xiàn)在是35頁\一共有193頁\編輯于星期五原始數(shù)據(jù)的組織方式現(xiàn)在是36頁\一共有193頁\編輯于星期五頻數(shù)數(shù)據(jù)的組織方式職稱年齡段35歲以下(1)36-49歲(2)50歲以上(3)教授(1)0158副教授(2)10202講師(3)20101助教(4)3520在頻數(shù)數(shù)據(jù)的組織方式中,數(shù)據(jù)編輯窗口中的一行為變量的一個分組(或多個變量交叉分組下的一個分組)所有行囊括了該變量的分組情況(或多個變量交叉下的所有分組情況)。數(shù)據(jù)編輯窗口中的一列仍為一個變量,代表某個問題(或某個方面及頻數(shù))現(xiàn)在是37頁\一共有193頁\編輯于星期五頻數(shù)數(shù)據(jù)的組織方式職稱年齡段人數(shù)110121513821102220232312032103314135422430現(xiàn)在是38頁\一共有193頁\編輯于星期五例題2.1關(guān)于計算機課程教學意見的樣本數(shù)據(jù)
C
fo
r意見合計不能滿足基本滿足能夠滿足系別金融系統(tǒng)計系7070160602010250140合在是39頁\一共有193頁\編輯于星期五組織數(shù)據(jù)系別意見人數(shù)1170121601320217022602310現(xiàn)在是40頁\一共有193頁\編輯于星期五練習2.1頻數(shù)數(shù)據(jù)(計數(shù)數(shù)據(jù))設(shè)置三個變量:專業(yè)方向、性別、人數(shù)男女統(tǒng)計1023精算1220現(xiàn)在是41頁\一共有193頁\編輯于星期五組織數(shù)據(jù)專業(yè)方向性別人數(shù)1110122321122220現(xiàn)在是42頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的結(jié)構(gòu)和定義方法SPSS數(shù)據(jù)的結(jié)構(gòu)是對SPSS每列變量及其相關(guān)屬性的描述變量名數(shù)值類型寬度小數(shù)位數(shù)變量標簽數(shù)值標簽缺失值列寬對齊方式數(shù)據(jù)量度現(xiàn)在是43頁\一共有193頁\編輯于星期五變量名(Variablename)變量名是變量存取的唯一標志起名規(guī)則:不多于8個字符組成首字符應以英文字母開頭,后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點不能為變量名的最后一個字符不區(qū)分大小寫允許漢字作為變量名默認變量名為VARn,如:var00001變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等現(xiàn)在是44頁\一共有193頁\編輯于星期五數(shù)據(jù)類型(TYPE)數(shù)據(jù)類型是指每個變量取值的類型三種基本數(shù)據(jù)類型數(shù)值型(1)標準型(Numeric)(2)科學記數(shù)法型(ScientificNotation)(3)逗號型(Comma)(4)圓點型(Dot)(5)美元符號型(Dollar)(6)用戶自定義型(CustomCurrency)字符型(String)日期型(Date)現(xiàn)在是45頁\一共有193頁\編輯于星期五列寬(Width),小數(shù)位寬(Decimals)
顯示寬度(Columns)每種類型的變量都有自己的列寬、小數(shù)位和顯示寬度列寬是變量允許的最大字符位數(shù)顯示寬度是數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)通常這兩個寬度是一致的數(shù)據(jù)的顯示并不影響數(shù)據(jù)的存儲,也不影響數(shù)據(jù)的計算現(xiàn)在是46頁\一共有193頁\編輯于星期五數(shù)值型--標準型(Numeric)SPSS默認的數(shù)據(jù)類型默認的顯示寬度為8位,包括正負符號位、小數(shù)點和小數(shù)位在內(nèi)小數(shù)位默認為2位如果數(shù)據(jù)的實際寬度大于8位,spss將自動按照科學計數(shù)法顯示12345678-1234.56現(xiàn)在是47頁\一共有193頁\編輯于星期五數(shù)值型--科學記數(shù)法型(ScientificNotation)表示很大或很小的數(shù)據(jù)120表示為1.2E2,0.0012表示為1.2E-3默認的顯示寬度為8位,包括正負符號位、字母E和跟在其后的正負符號及冪次數(shù)字在內(nèi)輸入時可按標準方式輸入,SPSS會自動進行轉(zhuǎn)換1.2E+002現(xiàn)在是48頁\一共有193頁\編輯于星期五數(shù)值型--逗號型(Comma)從個位開始三位一個逗號默認的顯示寬度為8位,逗號包括在內(nèi)小數(shù)位默認為2位輸入時可按標準方式輸入,SPSS會自動進行轉(zhuǎn)換1234.5671,234.57現(xiàn)在是49頁\一共有193頁\編輯于星期五數(shù)值型--圓點型(Dot)從個位開始三位一個圓點分隔以逗號作為整數(shù)和小數(shù)部分的分隔符默認列寬8,小數(shù)位寬2輸入時可按標準方式輸入,SPSS會自動進行轉(zhuǎn)換1.234,56現(xiàn)在是50頁\一共有193頁\編輯于星期五數(shù)值型--美元符號型(Dollar)表示貨幣數(shù)據(jù)前附加美元符號顯示格式很多現(xiàn)在是51頁\一共有193頁\編輯于星期五數(shù)值型--用戶自定義型(CustomCurrency)現(xiàn)在是52頁\一共有193頁\編輯于星期五字符型(String)由一個字符串組成,默認顯示寬度為8個字符區(qū)分大小寫字母不能夠進行算術(shù)運算在SPSS命令處理過程中應用一對雙引號括起來在輸入數(shù)據(jù)時不應輸入雙引號現(xiàn)在是53頁\一共有193頁\編輯于星期五日期型(Date)用來表示日期或者時間現(xiàn)在是54頁\一共有193頁\編輯于星期五變量名標簽(Variablelabel)對變量名含義的進一步解釋說明,它可以增強變量名的可視性和統(tǒng)計分析結(jié)果的可讀性變量名標簽可用中文總長度可達120個字符,但在統(tǒng)計分析結(jié)果的顯示中一般不能顯示如此長的變量名標簽信息可省略現(xiàn)在是55頁\一共有193頁\編輯于星期五變量值標簽(Value)對變量取值含義的解釋說明信息,對于定類型數(shù)據(jù)和定序性數(shù)據(jù)尤為重要可以用中文可省略變量值輸入框變量值標簽輸入框現(xiàn)在是56頁\一共有193頁\編輯于星期五缺失值(Missing)缺失值:漏填數(shù)據(jù)明顯錯誤的數(shù)據(jù)對缺失值的一般處理事先指定:指定某個特定值為缺失值(用戶缺失值)其他處理方法,如:以均值、眾數(shù)替代等SPSS缺失值用戶缺失值系統(tǒng)缺失值:用圓點表示;字符型變量中空格不是系統(tǒng)缺失值現(xiàn)在是57頁\一共有193頁\編輯于星期五SPSS用戶缺失值對字符型或數(shù)值型變量,用戶缺失值可以是1至3個特定的離散值(Discretemissingvalues)對一個數(shù)值型變量,用戶缺失值可以在一個連續(xù)的閉區(qū)間內(nèi)并同時再附加一個區(qū)間以外的離散值(Rangeplusoneoptionaldiscrete)現(xiàn)在是58頁\一共有193頁\編輯于星期五變量對齊格式(Align)定義顯示對齊方式右對齊、左對齊和中間對齊數(shù)值型變量默認為右對齊字符型變量默認為左對齊現(xiàn)在是59頁\一共有193頁\編輯于星期五計量尺度(Measure)定距型數(shù)據(jù)(scale):一般為數(shù)值型數(shù)據(jù) 如:收入、人數(shù)、身高定序型數(shù)據(jù)(ordinal):有固有大小或高低順序,數(shù)值型或字符型數(shù)據(jù)。 如:職稱、年齡段定類型數(shù)據(jù)(nominal):沒有有固有大小或高低順序,一般為數(shù)值或字符表示的分類數(shù)據(jù) 如:性別、民族現(xiàn)在是60頁\一共有193頁\編輯于星期五定義SPSS數(shù)據(jù)文件結(jié)構(gòu)操作方法:利用變量視圖如何查看變量定義的情況菜單選項: Utilities->Variables現(xiàn)在是61頁\一共有193頁\編輯于星期五單擊VariableView進入;定義變量名定義變量類型定義變量名標簽變量值標簽定義度量尺度定義顯示寬度定義對齊方式
定義變量類型對話框
定義變量值標簽對話框定義變量缺省值對話框現(xiàn)在是62頁\一共有193頁\編輯于星期五例題2.2問卷示例問題的類型:單選題----3,5數(shù)值型開放題----1,7文字型開放題----2日期型開放題----4多選題----6現(xiàn)在是63頁\一共有193頁\編輯于星期五開放題的錄入1序號
2姓名
4出生年月日(mm/dd/yyyy)現(xiàn)在是64頁\一共有193頁\編輯于星期五單選題1----選項沒有順序之分:不含其它:字符型錄入:字符加值標簽數(shù)值型錄入:數(shù)值加值標簽含其它:兩個變量來錄入(“其它”選項中如需填寫需單獨變量)單選題2----選項有順序之分數(shù)值型錄入:數(shù)值加值標簽是否喜歡足球
1非常喜歡
2喜歡
3無所謂
4不喜歡
5非常不喜歡單選題的錄入現(xiàn)在是65頁\一共有193頁\編輯于星期五現(xiàn)在是66頁\一共有193頁\編輯于星期五一份簡單的調(diào)查問卷單項選擇題提供幾個備選擇答案,從其中選擇一個答案變量類型:分類數(shù)據(jù)、定序數(shù)據(jù)數(shù)據(jù)類型:字符型填空題變量類型:定距數(shù)值型數(shù)據(jù)類型:數(shù)值型現(xiàn)在是67頁\一共有193頁\編輯于星期五一份簡單的調(diào)查問卷多項選擇題提供幾個備選擇答案,從其中選擇多個答案在下列品牌中您信任哪些品牌?伊利、蒙牛、光明、銀橋、歐德寶、德運被診斷為高血壓后你采取了以下哪些輔助治療手段?高考時報考學校(1)北京大學(2)清華大學(3)人民大學(4)北京理工大學(5)北京師范大學(6)北京外國語大學現(xiàn)在是68頁\一共有193頁\編輯于星期五多項選擇題的處理方法多項選擇題不能在SPSS中直接存儲,因為SPSS的一個變量只能有一個取值思路將一個問題定義成幾個變量,用這幾個變量來描述該問題的幾個可能被選擇的答案編碼方式多選項二分法(multipledichotomizemethod)多選項分類法(multiplecategorymethod)現(xiàn)在是69頁\一共有193頁\編輯于星期五將每個答案作為一個變量,每個變量只有兩個取值(0或1)。多選項二分法現(xiàn)在是70頁\一共有193頁\編輯于星期五預先估計多選項問題可能被選擇的最多答案數(shù).為每個答案建立一個變量,取值為多選項問題的可選答案多選項分類法現(xiàn)在是71頁\一共有193頁\編輯于星期五多選二分法則有6個選項,故應設(shè)6個變量,運用0-1編碼方法編碼,即:1,0,1,0,1,1。多選分類法,則編碼為1,3,5,6,0,0。1356現(xiàn)在是72頁\一共有193頁\編輯于星期五問題2:擇業(yè)中考慮的主要因素(多選)1經(jīng)濟收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風險大小7勞動強度8社會福利9其他編碼應為:1,0,1,1,1,0,1,1,0?;?,3,4,5,7,8,0,0,0?,F(xiàn)在是73頁\一共有193頁\編輯于星期五136問題3:您擇業(yè)中考慮的主要因素有(限選三項)1經(jīng)濟收入2專業(yè)對口3發(fā)展前途4地理區(qū)位5個人愛好6風險大小7勞動強度8社會福利9社會地位
10其他
因為限選三項,故應設(shè)三個變量,編碼依次為1,3,6。現(xiàn)在是74頁\一共有193頁\編輯于星期五練習2.2根據(jù)居民儲蓄調(diào)查問卷,建立SPSS格式的數(shù)據(jù)文件現(xiàn)在是75頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的錄入與保存錄入時應注意:黑框確定當前數(shù)據(jù)單元錄入帶有變量值標簽(Value)的數(shù)據(jù):手工輸入代碼屏幕顯示變量值標簽,在下拉菜單中選擇在View-->ValueLabels中切換現(xiàn)在是76頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的編輯定位插入刪除修改復制在數(shù)據(jù)視圖中進行現(xiàn)在是77頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的定位目的:將當前數(shù)據(jù)單元定位到某個特定的單元中兩種定位方式:按個案號碼定位菜單:Data->Gotocase->輸入樣本號->確認輸入要尋找觀測量序號現(xiàn)在是78頁\一共有193頁\編輯于星期五2.按變量值定位:將當前單元定位在某變量列的任何一個個案上選擇菜單Edit->Find,出現(xiàn)如下對話框輸入定位變量值并確認SPSS自動對指定的變量進行搜索,并將當前單元定位到與定位變量值相等的第一個個案上。SPSS數(shù)據(jù)的定位現(xiàn)在是79頁\一共有193頁\編輯于星期五插入和刪除一個個案插入一個個案:在數(shù)據(jù)編輯窗口的某個個案前插入一個新個案將當前數(shù)據(jù)單元確定在一個個案上選擇菜單Data--InsertCase(或工具欄插入個案圖標按鈕)刪除一個個案:在欲刪除的個案號碼上單擊鼠標左鍵,于是待刪除的個案數(shù)據(jù)全部呈藍色顯示單擊鼠標右鍵,從彈出菜單中選擇clear選項現(xiàn)在是80頁\一共有193頁\編輯于星期五插入和刪除一個變量插入一個變量:在數(shù)據(jù)編輯窗口的某個變量前插入一個新變量將當前數(shù)據(jù)單元確定在一個變量上選擇菜單Data--InsertVarible(或工具欄插入變量圖標按鈕)刪除一個變量:在欲刪除的變量名上單擊鼠標左鍵,于是待刪除的個案數(shù)據(jù)全部呈藍色顯示單擊鼠標右鍵,從彈出菜單中選擇clear選項現(xiàn)在是81頁\一共有193頁\編輯于星期五數(shù)據(jù)的移動、復制和刪除與一般的應用程序相同選擇操作對象(變量、個案、若干連續(xù)單元等)剪切:Edit+Cut(Ctrl+X)復制:Edit+Copy(Ctrl+C)粘貼:Edit+Paste(Ctrl+V)恢復刪除或修改前數(shù)據(jù)Edit+Undo(或工具欄Undo圖標按鈕)現(xiàn)在是82頁\一共有193頁\編輯于星期五插入變量與刪除變量插入與刪除觀測量數(shù)據(jù)的剪切、粘貼與復制1.插入變量在添加處單擊Var,單擊右鼠標鍵出現(xiàn)右側(cè)對話框,單擊InsertVariables2.刪除變量1.插入觀測量在添加處單擊觀測量,單擊右鼠標鍵出現(xiàn)右側(cè)對話框,單擊InsertCase2.刪除觀測量剪切復制粘貼若想恢復,打開Edit---Undo現(xiàn)在是83頁\一共有193頁\編輯于星期五SPSS支持的數(shù)據(jù)格式
1、SPSS文件格式,擴展名為.sav2、Excel格式文件,擴展名為.xls3、dbf格式文件,擴展名為.dbf4、文本格式文件,擴展名為.dat注意:有些信息會丟失SPSS數(shù)據(jù)的保存現(xiàn)在是84頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的保存基本操作File--Save,對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問File+SaveAs,另存一個數(shù)據(jù)文件,也有格式(類型)問題Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中現(xiàn)在是85頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)的保存基本操作將數(shù)據(jù)保存為Excel文件格式時,Writevariablesnamestospreadsheet選項呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上Savevaluelabelswheredefinedinstedofdatavalve選項呈可用狀態(tài),它的作用是指定是否在Excel工作表中用變量值標簽來替代變量值現(xiàn)在是86頁\一共有193頁\編輯于星期五讀取其他格式的數(shù)據(jù)文件SPSS能夠直接讀取其他格式的數(shù)據(jù)文件,并將其保存為SPSS格式的數(shù)據(jù)直接讀取其他格式的數(shù)據(jù)文件:(1)選擇菜單File+Open+Data;(2)選擇數(shù)據(jù)文件的類型,并輸入數(shù)據(jù)文件名使用數(shù)據(jù)庫查詢打開利用通用數(shù)據(jù)庫ODBC接口讀取數(shù)據(jù)文件在9.0及以前版本中非常重要使用文本向?qū)ёx入文本文件:選擇菜單File+ReadTextData現(xiàn)在是87頁\一共有193頁\編輯于星期五直接打開選擇菜單File==>Open==>Data或直接單擊快捷工具欄上的OpenFile按鈕文件類型現(xiàn)在是88頁\一共有193頁\編輯于星期五讀取EXCEL文件SPSS默認將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口可以指定僅讀取工作表中某個區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10)工作表上的一行數(shù)據(jù)為SPSS中的一個個案如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行存儲了變量名信息,則應選擇Readvariablenames項,即以第一行的文字信息作為SPSS的變量名,否則不選現(xiàn)在是89頁\一共有193頁\編輯于星期五讀取dbase文件字段名、字段類型自動轉(zhuǎn)成SPSS數(shù)據(jù)文件中的變量名和類型一條記錄為一個個案現(xiàn)在是90頁\一共有193頁\編輯于星期五使用文本導入向?qū)ёx入文本文件File==>ReadTextData該功能在SPSS中已被整合到了OpenFile對話框中,之所以在菜單上保留該條目的原因是讀入純文本的情況非常普遍,放在這里更加醒目例:現(xiàn)有一數(shù)據(jù)文件以純文本的形式保存,且第一行為變量名,請將其讀入SPSS。在File==>ReadTextData對話框選中相應的文件名并單擊“確定”,系統(tǒng)會自動啟動文本導入向?qū)υ捒颥F(xiàn)在是91頁\一共有193頁\編輯于星期五Spss是否已經(jīng)正確的識別和分割了數(shù)據(jù)項現(xiàn)在是92頁\一共有193頁\編輯于星期五數(shù)據(jù)間如何分割數(shù)據(jù)文件的第一行上是否有變量名現(xiàn)在是93頁\一共有193頁\編輯于星期五數(shù)據(jù)部分從文本文件的第幾行開始個案數(shù)據(jù)在文本文件中是如何安排的現(xiàn)在是94頁\一共有193頁\編輯于星期五指定文本文件的分割符號字符型數(shù)據(jù)表示方法現(xiàn)在是95頁\一共有193頁\編輯于星期五對隨后出現(xiàn)的兩個窗口中的問題,通常不必回答?,F(xiàn)在是96頁\一共有193頁\編輯于星期五對隨后出現(xiàn)的兩個窗口中的問題,通常不必回答?,F(xiàn)在是97頁\一共有193頁\編輯于星期五使用數(shù)據(jù)庫查詢打開SPSS可以直接打開許多類型的數(shù)據(jù)文件,但這并不是說它可以打開所有類型的數(shù)據(jù)文件SPSS還提供了另一個適用范圍更廣、但使用上較為專業(yè)的數(shù)據(jù)接口--數(shù)據(jù)庫查詢SPSS在這里使用的是一種叫ODBC(OpenDataBaseCapture)的數(shù)據(jù)接口,該接口被大多數(shù)數(shù)據(jù)庫軟件和辦公軟件(如MSOffice)支持,通過它,應用程序可以直接訪問以結(jié)構(gòu)化查詢語言(SQL)做為數(shù)據(jù)訪問標準的數(shù)據(jù)庫管理系統(tǒng)由于SPSS10.0可以直接打開EXCEL所有系列的數(shù)據(jù)文件,因此數(shù)據(jù)庫查詢接口的用處不是很大。但是,在9.0及以前的版本中,該查詢?nèi)允侵苯哟蜷_EXCEL95、97及2000數(shù)據(jù)文件的唯一辦法現(xiàn)在是98頁\一共有193頁\編輯于星期五使用數(shù)據(jù)庫查詢打開ODBC數(shù)據(jù)引擎是獨立于各種應用軟件,直接安裝到Windows系統(tǒng)中的,因此你所用的系統(tǒng)中ODBC所支持的數(shù)據(jù)類型取決于所安裝的ODBC引擎的情況。大多數(shù)支持該接口的軟件都會在安裝光盤上附送該引擎的安裝文件(如MSOffice)選擇菜單File==>OpenDatabase==>NewQuery,系統(tǒng)會彈出數(shù)據(jù)庫向?qū)У牡谝粋€窗口,其中會列出你使用的機器上已安裝的所有數(shù)據(jù)庫驅(qū)動程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)徊揭徊降奶崾灸闳绾巫觯敝翆?shù)據(jù)讀入SPSS?,F(xiàn)在是99頁\一共有193頁\編輯于星期五SPSS數(shù)據(jù)文件合并當數(shù)據(jù)量較多時經(jīng)常會把一份大的數(shù)據(jù)分成幾個小的部分,由幾個錄入員分別錄入合并:首先將其中的某個數(shù)據(jù)文件讀入數(shù)據(jù)編輯窗口中然后依次與其他數(shù)據(jù)文件合并合并方式縱向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件中增加個案到當前數(shù)據(jù)文件中(AddCases)橫向合并數(shù)據(jù)文件:從外部數(shù)據(jù)文件增加變量到當前數(shù)據(jù)文件(AddVariables)現(xiàn)在是100頁\一共有193頁\編輯于星期五縱向合并數(shù)據(jù)文件(AddCases)將數(shù)據(jù)編輯窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行首尾對接,即將一個SPSS數(shù)據(jù)文件的內(nèi)容追加到數(shù)據(jù)編輯窗口中的數(shù)據(jù)后面--依據(jù)變量名進行數(shù)據(jù)對接相互合并的數(shù)據(jù)文件應該有相同的變量注意兩個待合并的spss數(shù)據(jù)文件的內(nèi)容合并起來應有實際意義在不同數(shù)據(jù)文件中數(shù)據(jù)含義相同的數(shù)據(jù)項最好起相同的變量名,且數(shù)據(jù)類型也最好相同,利于spss對變量的自動匹配現(xiàn)在是101頁\一共有193頁\編輯于星期五縱向合并數(shù)據(jù)文件(AddCases)步驟打開一個數(shù)據(jù)文件菜單:Data+MergeFiles+AddCases同名變量不同名變量顯示數(shù)據(jù)來源現(xiàn)在是102頁\一共有193頁\編輯于星期五縱向合并數(shù)據(jù)文件(AddCases)注意VariablesInnewworkingdatafile框中顯示的變量名是兩個數(shù)據(jù)文件中都有的變量名UnpairedVariables框中的變量名是兩個文件中的不同變量名。*表示該變量是當前數(shù)據(jù)編輯窗口中的變量,+表示該變量是待合并文件中的變量Indicatecasesourceasvariable:是否希望在合并后的數(shù)據(jù)文件中看出個案的來源自動生成一個變量名為source01,取值0或1的變量現(xiàn)在是103頁\一共有193頁\編輯于星期五縱向合并數(shù)據(jù)文件(AddCases)不同變量名但含義相同的變量名的處理配對(Pair)選擇其中的兩個變量名并按“Pair”按鈕指定配對。默認原數(shù)據(jù)中的變量名對某變量按“Rename”按鈕改名后在指定配對不經(jīng)匹配,強行合并兩個(多個)變量現(xiàn)在是104頁\一共有193頁\編輯于星期五橫向合并數(shù)據(jù)文件(AddVariables)將數(shù)據(jù)編輯文件窗口中的數(shù)據(jù)與另一個SPSS數(shù)據(jù)文件中的數(shù)據(jù)進行左右對接。即兩個數(shù)據(jù)文件依據(jù)個案進行數(shù)據(jù)對接注意:相互合并的數(shù)據(jù)文件必須至少有一個名稱相同的變量,該變量是兩文件橫向合作的依據(jù),稱為關(guān)鍵變量兩個數(shù)據(jù)文件都必須先按關(guān)鍵變量進行升序排列不同數(shù)據(jù)文件中數(shù)據(jù)含義不相同的數(shù)據(jù)項變量名不應相同現(xiàn)在是105頁\一共有193頁\編輯于星期五橫向合并數(shù)據(jù)文件(AddVariables)步驟:打開一個數(shù)據(jù)文件菜單:Data+MergeFiles+AddVariables現(xiàn)在是106頁\一共有193頁\編輯于星期五當個案數(shù)據(jù)不是一一對應待合并數(shù)據(jù)的共有變量名待合并數(shù)據(jù)文件中的所有變量名現(xiàn)在是107頁\一共有193頁\編輯于星期五橫向合并數(shù)據(jù)文件(AddVariables)合并數(shù)據(jù)的方式Bothfilesprovidecases:合并后的數(shù)據(jù)由原來兩個數(shù)據(jù)文件共同提供Externalfileiskeyedtable:在數(shù)據(jù)編輯窗口中的數(shù)據(jù)基礎(chǔ)上,將第二個數(shù)據(jù)文件中的其他變量合并進來WorkingDataFileisKeyedTable:在第二個數(shù)據(jù)文件數(shù)據(jù)的基礎(chǔ)之上,將數(shù)據(jù)編輯窗口中的其他變量合并進來現(xiàn)在是108頁\一共有193頁\編輯于星期五練習2.3數(shù)據(jù)錄入現(xiàn)在是109頁\一共有193頁\編輯于星期五練習2.4多選題錄入在一項關(guān)于汽車品牌的研究中,我們希望了解人們在購買汽車的時候關(guān)注的是哪些因素,問題如下您在購買汽車的時候,關(guān)注以下哪些因素:品牌、車型、價位、油耗、其他我們希望了解目標人群對手機的哪些品牌的信任度較高,在問卷中列出了10個品牌,讓被訪者從中選擇他認為最可信的幾個。問題如下請在下面10個品牌中選出您認為最信得過的幾個(最多選三個)
諾基亞、蘋果、三星、波導、西門子、康佳、華為中興、聯(lián)想、海爾現(xiàn)在是110頁\一共有193頁\編輯于星期五練習2.5Excel數(shù)據(jù)的讀取將文件名為“居民儲蓄調(diào)查數(shù)據(jù).xls”的Excel數(shù)據(jù)文件轉(zhuǎn)換為SPSS數(shù)據(jù)文件,并在SPSS中指定其變量名標簽和變量值標簽現(xiàn)在是111頁\一共有193頁\編輯于星期五練習2.6數(shù)據(jù)文件合并將名為“學生成績一.sav”和“學生成績二.sav”兩個數(shù)據(jù)文件以學號為關(guān)鍵變量進行橫向合并,形成一個完整的數(shù)據(jù)文件現(xiàn)在是112頁\一共有193頁\編輯于星期五第二章數(shù)據(jù)與SPSS數(shù)據(jù)處理第3節(jié)SPSS數(shù)據(jù)的預處理現(xiàn)在是113頁\一共有193頁\編輯于星期五為什么要進行數(shù)據(jù)的預處理缺失值?異常值?使用所有個案還是部分個案?使用所有變量還是部分變量?數(shù)據(jù)是否可以直接用于數(shù)據(jù)分析和建模?在數(shù)據(jù)文件建立好后,通常還需要對待分析的數(shù)據(jù)進行必要的預加工處理,這是數(shù)據(jù)分析過程中不可缺少的一個關(guān)鍵環(huán)節(jié)隨著數(shù)據(jù)分析的不斷深入,對數(shù)據(jù)的加工處理還會多次反復,實現(xiàn)數(shù)據(jù)加工和數(shù)據(jù)分析的螺旋上升現(xiàn)在是114頁\一共有193頁\編輯于星期五數(shù)據(jù)的預處理SPSS提供了一些專門的功能輔助用戶實現(xiàn)數(shù)據(jù)的預加工處理工作。通過預處理還可以使用戶對數(shù)據(jù)的總體分布有所了解數(shù)據(jù)的預加工處理服務(wù)于數(shù)據(jù)分析和建模,包括:數(shù)據(jù)的排序變量計算數(shù)據(jù)選取計數(shù)分類匯總數(shù)據(jù)分組數(shù)據(jù)預處理的其他功能:轉(zhuǎn)置、加權(quán)、數(shù)據(jù)拆分、缺失值處理、數(shù)據(jù)排秩、定義變量集現(xiàn)在是115頁\一共有193頁\編輯于星期五數(shù)據(jù)的排序數(shù)據(jù)排序的目的通常數(shù)據(jù)編輯窗口中個案的前后次序是由數(shù)據(jù)錄入的先后順序決定的。數(shù)據(jù)預處理中,有時需要將數(shù)據(jù)按照一定的順序重新排列作用數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等通過數(shù)據(jù)排序能夠快捷地找到數(shù)據(jù)的最大值和最小值,進而可以計算出數(shù)據(jù)的全距,初步把握和比較數(shù)據(jù)的離散程度通過數(shù)據(jù)排序能夠快捷地發(fā)現(xiàn)數(shù)據(jù)的異常值,為進一步明確它們是否對分析產(chǎn)生重要影響等提供幫助現(xiàn)在是116頁\一共有193頁\編輯于星期五數(shù)據(jù)排序的方法SPSS的數(shù)據(jù)排序是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)按照某個或多個指定變量的變量值升序或降序重新排列。這里的變量也稱為排序變量排序變量只有一個時,排序稱為單值排序。排序變量有多個時,排序稱為多重排序多重排序中,第一個指定的排序變量稱為主排序變量,其他依次指定的變量分別稱為第二排序變量、第三排序變量等多重排序時,數(shù)據(jù)首先按主排序變量值的大小次序排序,然后對那些具有相同主排序變量值的數(shù)據(jù),再按照第二排序變量值的次序依次排序下去現(xiàn)在是117頁\一共有193頁\編輯于星期五數(shù)據(jù)排序的操作步驟選擇菜單:
【Data】→【SortCases】指定主排序變量到【Sortby】框中,并選擇【SortOrder】框中的選項指出該變量按升序排還是降序排序。[Ascending]表示升序,[Descending]表示降序。如果是多重排序,還要依次指定第二、第三排序變量及相應的排序規(guī)則。否則,本步可略現(xiàn)在是118頁\一共有193頁\編輯于星期五在左邊的源變量框中選擇排序變量進入Sortby框。如果選擇2個以上的變量,觀測量的排序結(jié)果與排序變量在Sortby框中的順序有關(guān)。列于首位的為第一排序變量。在SortOrder欄內(nèi)選擇排序方式——升序與降序現(xiàn)在是119頁\一共有193頁\編輯于星期五說明 數(shù)據(jù)排序是整行數(shù)據(jù)(個案)排序,而不是只對某列變量排序多重排序中指定排序變量的次序很關(guān)鍵。先指定的變量優(yōu)先于后指定的變量。多重排序可以在按某個變量值升序(或降序)排序的同時再按其他變量值降序(或升序)排序數(shù)據(jù)排序后,原有數(shù)據(jù)的排序次序必然被打亂,應保存原始數(shù)據(jù)現(xiàn)在是120頁\一共有193頁\編輯于星期五例題2.3利用住房狀況調(diào)查數(shù)據(jù),通過數(shù)據(jù)排序功能分別找到本市戶口和外地戶口家庭住房面積的最大值和最小值多重排序主排序變量--戶口狀況第二排序變量--現(xiàn)住面積現(xiàn)在是121頁\一共有193頁\編輯于星期五變量計算變量計算的目的數(shù)據(jù)的轉(zhuǎn)換處理
數(shù)據(jù)的轉(zhuǎn)換處理是在原有數(shù)據(jù)的基礎(chǔ)上,計算產(chǎn)生一些含有更豐富信息的新數(shù)據(jù)。例如,根據(jù)職工的基本工資、失業(yè)保險、獎金等數(shù)據(jù)項,計算實際月收入;這些新產(chǎn)生的變量具有更直觀和更有效的特點。
對數(shù)據(jù)的原有分布狀態(tài)進行轉(zhuǎn)換
由于數(shù)據(jù)分析和建模中某些模型對數(shù)據(jù)的分布有一定的要求,因此可以利用變量計算對原有數(shù)據(jù)的分布進行轉(zhuǎn)換。例如,利用對數(shù)或多項式轉(zhuǎn)換對非正態(tài)或非線性數(shù)據(jù)進行處理;對時間序列進行平穩(wěn)化處理;利用區(qū)間變換壓縮數(shù)據(jù)取值范圍和標準化處理等。現(xiàn)在是122頁\一共有193頁\編輯于星期五變量計算的方法SPSS變量計算是在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶給出的SPSS算術(shù)表達式以及函數(shù),對所有個案或滿足條件的部分個案,計算產(chǎn)生一系列新變量注意:
(1)變量計算是針對所有個案(或指定的部分個案)的,每條個案(或指定的部分個案)都有自己的計算結(jié)果。
(2)變量計算的結(jié)果應保存到一個指定變量中,該變量的數(shù)據(jù)類型應與計算結(jié)果的數(shù)據(jù)類型相一致。現(xiàn)在是123頁\一共有193頁\編輯于星期五變量計算的幾個概念SPSS算術(shù)表達式SPSS條件表達式SPSS函數(shù)現(xiàn)在是124頁\一共有193頁\編輯于星期五SPSS算術(shù)表達式(numericexpression)在變量計算過程中,應根據(jù)實際需要指出按照什么方法計算變量。這里的方法一般以SPSS算術(shù)表達式的形式給出。由常量、變量、算術(shù)運算符、圓括號、函數(shù)等組成的式子。字符型常量應用引號引起來變量是指那些已存在于數(shù)據(jù)編輯窗口中的現(xiàn)有變量算術(shù)運算符主要包括:+(加)、-(減)、*(乘)、/(除)、**(乘方)。操作對象的數(shù)據(jù)類型為數(shù)值型。運算次序:先乘方,再乘除,最后加減。在同級運算中,按從左到右的順序進行運算.通過圓括號改變原有的計算順序在同一算術(shù)表達式中的常量及變量,數(shù)據(jù)類型應該一致,否則無法計算現(xiàn)在是125頁\一共有193頁\編輯于星期五SPSS條件表達式在變量計算中通常要求對不同組(類)的個案分別按不同的方法進行計算,于是就需要通過一定的方式來指定個案。條件表達式能夠幫助實現(xiàn)這一目標條件表達式是一個對條件進行判斷的式子。其結(jié)果有兩種取值:如果判斷條件成立,則結(jié)果為真;如果判斷條件不成立,則結(jié)果為假條件表達式包括簡單條件表達式和復合條件表達式現(xiàn)在是126頁\一共有193頁\編輯于星期五1.簡單條件表達式簡單條件表達式是由關(guān)系運算符、常量、變量以及算術(shù)表達式等組成的式子。關(guān)系運算符包括>(大于)、<(小于)、=(等于)、~=(不等于)、>=(大于等于)、<=(小于等于)例如,對職工基本情況數(shù)據(jù)可以寫成這樣的簡單條件表達式:nl>35,表示年齡大于35歲。在數(shù)據(jù)編輯窗口中,對于年齡大于35歲的個案,該條件判斷的結(jié)果為真,而對于年齡小于或等于35歲的個案,該條件判斷的結(jié)果為假?,F(xiàn)在是127頁\一共有193頁\編輯于星期五2.復合條件表達式復合條件表達式又稱邏輯表達式,是由邏輯運算符、圓括號和簡單條件表達式等組成的式子。其中,邏輯運算符包括&或AND(并且)、|或OR(或者)、~或NOT(非).NOT的運算最優(yōu)先,其次是AND,最低是OR。可以通過圓括號改變這種運算次序例如,職工基本情況數(shù)據(jù)可以寫成這樣的復合條件表達式:(nl<=35)andnot(zc<3)表示年齡小于等于35歲并且職稱不低于3。對于年齡小于等于35歲并且職稱不低于3的個案,該條件判斷的結(jié)果為真,其余個案的條件判斷結(jié)果為假。在變量計算時,如果根據(jù)實際需要給出了條件表達式,SPSS將只對數(shù)據(jù)編輯窗口中條件判斷結(jié)果為真的那些個案進行計算。因此,構(gòu)造條件表達式是很關(guān)鍵的?,F(xiàn)在是128頁\一共有193頁\編輯于星期五SPSS函數(shù)函數(shù)是事先編好并存儲在SPSS軟件中,能夠?qū)崿F(xiàn)某些特定計算任務(wù)的一段計算機程序。這些程序段都有各自的名字稱為函數(shù)名。執(zhí)行這些程序段得到的計算結(jié)果稱為函數(shù)值用戶在使用這些函數(shù)時,只需通過書寫相應的函數(shù)名,并給出必要的計算參數(shù),SPSS便會自動計算函數(shù)值函數(shù)書寫的具體形式為:函數(shù)名(參數(shù))函數(shù)名是SPSS已經(jīng)規(guī)定好的圓括號中的參數(shù)可以是常量(字符型常量應用引號引起來),也可以是變量或算術(shù)表達式參數(shù)可能是一個,也可能有多個,各參數(shù)之間用逗號分隔現(xiàn)在是129頁\一共有193頁\編輯于星期五SPSS函數(shù)分類算術(shù)函數(shù)統(tǒng)計函數(shù)分布函數(shù)查找函數(shù)(邏輯)字符函數(shù)缺失值函數(shù)日期函數(shù)其他函數(shù):雜項函數(shù)、轉(zhuǎn)換函數(shù)等課本P54~P58現(xiàn)在是130頁\一共有193頁\編輯于星期五SPSS變量計算的基本操作步驟(1)選擇菜單:【Transform】→【Compute】(2)在[NumericExpression]框給出SPSS算術(shù)表達式和函數(shù)??梢允止ぽ斎?,也可以按窗口的按鈕以及函數(shù)下拉菜單來完成算術(shù)表達式和函數(shù)的輸人工作。(3)在Target框中輸入存放計算結(jié)果的變量名。該變量可以是一個新變量,也可以是已經(jīng)存在的變量。新變量的變量類型默認為數(shù)值型,用戶可以根據(jù)需要按Type&Label按鈕修改,還可對新變量加變量名標簽。(4)如果用戶僅希望對符合一定條件的個案計算產(chǎn)生變量,則按if按鈕,選擇[Incudeifcasesatisfescondition]選項,然后輸入條件表達式。否則,本步驟略去?,F(xiàn)在是131頁\一共有193頁\編輯于星期五輸入算術(shù)表達式和函數(shù)存放計算結(jié)果的變量名所有函數(shù)的分類各類函數(shù)包含的函數(shù)名現(xiàn)在是132頁\一共有193頁\編輯于星期五例題2.4利用職工基本情況數(shù)據(jù),依據(jù)職稱級別計算實發(fā)工資。假設(shè)職稱1至4職工的工資分別上調(diào)5%,3%,2%,1%現(xiàn)在是133頁\一共有193頁\編輯于星期五數(shù)據(jù)選取數(shù)據(jù)選取就是根據(jù)分析的需要,從已收集到的大批量數(shù)據(jù)(總體)中按照一定的規(guī)則抽取部分數(shù)據(jù)(樣本)參與分析的過程,通常也稱為樣本抽樣SPSS可根據(jù)指定的抽樣方法從數(shù)據(jù)編輯窗口中選出部分樣本以實現(xiàn)數(shù)據(jù)選取,這樣后面的分析操作就只針對選出的數(shù)據(jù),直到用戶取消這種選取為止現(xiàn)在是134頁\一共有193頁\編輯于星期五數(shù)據(jù)選取的目的服務(wù)于以后的數(shù)據(jù)分析:提高數(shù)據(jù)分析效率
如果數(shù)據(jù)量較大,會在一定程度上影響計算和建模的效率,因此,通??梢砸罁?jù)一定的抽樣方法從總體中抽取少量樣本,后面的分析只針對樣本進行,這樣會大大提高分析的效率檢驗模型的需要在數(shù)據(jù)分析中,所建的模型是否能夠較完整準確地反映數(shù)據(jù)的特征,是否能夠用于以后的數(shù)據(jù)預測,這些問題都是人們極為關(guān)心的。為了驗證模型,一般可依據(jù)一定的抽樣方法只選擇部分樣本參與數(shù)據(jù)建模,剩余的數(shù)據(jù)用于模型檢驗現(xiàn)在是135頁\一共有193頁\編輯于星期五數(shù)據(jù)選取方法按指定條件選取(Ifconditionissatisfied)隨機選取(Randomsampleofcases)近似選取(Approximately)精確選取(Exactly)選取某一區(qū)域內(nèi)的樣本(Basedontimeorcaserange)通過過濾變量選取(Usefiltervariable)現(xiàn)在是136頁\一共有193頁\編輯于星期五按指定條件選取(Ifconditionissatisfied)選取符合條件的數(shù)據(jù)SPSS要求用戶以條件表達式的形式給出數(shù)據(jù)選取的條件。SPSS將自動對數(shù)據(jù)編輯窗口中的所有個案進行條件判斷。那些滿足條件的個案,即條件判斷為真的個案將被自動選取出來,而那些條件判斷為假的個案則不被選中現(xiàn)在是137頁\一共有193頁\編輯于星期五近似選取(Approximately)近似選取要求用戶給出一個百分比數(shù)值。SPSS將按照這個比例自動從數(shù)據(jù)編輯窗口中隨機抽取出相應百分比數(shù)目的個案根據(jù)SPSS隨機數(shù)種子發(fā)生器設(shè)計和實現(xiàn)抽取出的個案總數(shù)不一定恰好精確等于用戶指定的百分比數(shù)目,會有小的偏差,因而稱為近似選取。通常不會對數(shù)據(jù)分析產(chǎn)生重要影響。現(xiàn)在是138頁\一共有193頁\編輯于星期五精確選取(Exactly)近似選取精確選取希望選取的個案數(shù)指定在前幾個個案中選取現(xiàn)在是139頁\一共有193頁\編輯于星期五隨機數(shù)種子發(fā)生器【Transform】→【RandomNumberGenerators】隨機種子為具體的正整數(shù)小于等于2,000,000一般用于隨機化結(jié)果需要重復出現(xiàn)的情況隨機種子每次自動取一個新的值隨機化結(jié)果不會重復出現(xiàn)現(xiàn)在是140頁\一共有193頁\編輯于星期五選取某一區(qū)域內(nèi)的樣本(Basedontimeorcaserange)選取數(shù)據(jù)編輯窗口中的樣本號范圍內(nèi)的所有個案,要求給出這個范圍的上下限個案號碼通常適用于時間序列數(shù)據(jù)現(xiàn)在是141頁\一共有193頁\編輯于星期五通過過濾變量選取(Usefiltervariable)依據(jù)過濾變量的取值進行樣本選取要求指定一個變量作為過濾變量,變量值為非0或非系統(tǒng)缺失值的個案將被選中通常用于排除包含系統(tǒng)缺失值的個案現(xiàn)在是142頁\一共有193頁\編輯于星期五數(shù)據(jù)選取的操作步驟(1)選擇菜單:【Data】→【Selectcases】(2)在select框中選擇抽樣方法。Allcases表示全部選中。(3)指定對未選中個案的處理方式。其中,F(xiàn)iltered表示在未被選中的個案號碼上打一個“\”標記;Deleted表示將未被選中的個案從數(shù)據(jù)編輯窗口中刪除。一般采取第一個處理方式較好?,F(xiàn)在是143頁\一共有193頁\編輯于星期五數(shù)據(jù)選取的操作步驟說明按上述操作步驟完成數(shù)據(jù)這取后,以后的SPSS分析操作僅針對那些被選中的個案,直到用戶再次改變數(shù)據(jù)選取為止采用指定條件抽樣和隨機抽樣方法進行數(shù)據(jù)選取后,SPSS將在數(shù)據(jù)編輯窗口中自動生成一個名為filer_$的新變量,取值為1或0,1表示本條個案被選中,0表示未被選中。filer_$是SPSS產(chǎn)生的中間變量,如果刪除它則自動取消樣本抽樣現(xiàn)在是144頁\一共有193頁\編輯于星期五例題2.5利用居民儲蓄調(diào)查數(shù)據(jù),根據(jù)不同的分析要求采用不同的數(shù)據(jù)選取方法抽樣:(1)希望分析城市儲戶的情況(2)希望對其中的70%的數(shù)據(jù)進行分析,可通過數(shù)據(jù)選擇功能采用隨機抽樣中的近似抽樣方法進行抽樣采用指定條件的抽樣方法采用近似抽樣方法現(xiàn)在是145頁\一共有193頁\編輯于星期五計數(shù)計數(shù)的目的把握個案各方面的特征SPSS實現(xiàn)的計數(shù)是對所有個案或滿足某條件的部分個案,計算若干個變量中有幾個變量的值落在指定的區(qū)間內(nèi),并將計數(shù)結(jié)果存入一個新變量中的過程對個案中的變量進行計數(shù)SPSS實現(xiàn)計數(shù)的關(guān)鍵步驟是:1.指定哪些變量參與計數(shù),計數(shù)的結(jié)果存入哪個新變量中2.指定計數(shù)區(qū)間現(xiàn)在是146頁\一共有193頁\編輯于星期五計數(shù)區(qū)間描述形式:
1.單個變量值(Value)2.系統(tǒng)缺失值(System-missing)3.系統(tǒng)缺失值或用戶缺失值(Systemoruser-missing)
4.給定最大值和最小值的區(qū)間(nthroughm)5.小于等于某指定值的區(qū)間(Lowestthroughn)6.大于等于某指定值的區(qū)間(nthroughhighest)SPSS中的計數(shù)區(qū)間是一個廣義的概念,包含了離散值現(xiàn)在是147頁\一共有193頁\編輯于星期五計數(shù)對大學畢業(yè)班同學的學習成績進行綜合評價時,可以依次計算每個學生的若干門專業(yè)課中有幾門課程得了優(yōu),有幾門課程得了良,有幾門得了中等等,并以門次為權(quán)重做進一步的分析。這樣的計算門次數(shù)據(jù)的過程就是一個計數(shù)過程評價學生成績,成績?yōu)閮?yōu)的計數(shù)區(qū)間可以指定為90throughhighest,成績?yōu)榱嫉挠嫈?shù)區(qū)間指定為80through89,不及格的計數(shù)區(qū)間指定為Lowestthrough59現(xiàn)在是148頁\一共有193頁\編輯于星期五計數(shù)的基本操作步驟選擇菜單:[Transform】→[Count】選擇參與計數(shù)的變量到【NumericVariables】框中在[TargetVariable】框中輸入存放計數(shù)結(jié)果的變量名,并在【TargetLabel】框中輸入相應的變量名標簽按DefineValues按鈕定義計數(shù)區(qū)間,出現(xiàn)如圖所示的窗口。通過【add】,【Change】,【Remove】按鈕完成計數(shù)區(qū)間的增加、修改和刪除如果僅希望對滿足某條件的個案進行計數(shù),則按if按鈕并輸入相應的SPSS條件表達式。否則,本步略?,F(xiàn)在是149頁\一共有193頁\編輯于星期五例題2.6利用住房狀況調(diào)查數(shù)據(jù),分析被調(diào)查家庭中有多少比例的家庭對目前的住房滿意且近幾年不準備購買住房現(xiàn)在是150頁\一共有193頁\編輯于星期五分類匯總分類匯總是按照某分類進行分類匯總計算某企業(yè)希望了解本企業(yè)不同學歷職工的基本工資是否存在較大差距最簡單的做法就是分類匯總,即將職工按學歷進行分類,然后分別計算不同學歷職工的平均工資,就可對平均工資進行比較現(xiàn)在是151頁\一共有193頁\編輯于星期五分類匯總某商廈希望分析假日周內(nèi)不同職業(yè)和不同年齡段的顧客對某商品的“打折促銷”反應是否存在較大差異,用以分析不同消費群體的消費心理。最初步的分析可以是分別計算不同職業(yè)中不同年齡段顧客的平均消費金額和平均消費金額差異程度(標準差),并對它們進行比較。這個過程可通過分類匯總過程完成分析大學男生和大學女生入校和畢業(yè)時每月生活費的變化情況現(xiàn)在是152頁\一共有193頁\編輯于星期五分類匯總SPSS實現(xiàn)分類匯總涉及兩個主要方面:1.按照哪個變量(如上例中的學歷、職業(yè)和文化程度;性別、年級)進行分類。2.對哪個變量(如上例中的基本工資、消費金額、生活費)進行匯總,并指定對匯總變量計算哪些統(tǒng)計量(如上例中的平均工資、平均消費金額和標準差、平均生活費)現(xiàn)在是153頁\一共有193頁\編輯于星期五分類匯總的基本操作步驟選擇菜單:【Data】→【Aggregate】指定分類變量指定匯總變量指定對匯總變量計算哪些統(tǒng)計量SPSS默認計算均值分類匯總結(jié)果覆蓋數(shù)據(jù)編輯窗口中的數(shù)據(jù)將結(jié)果生成到系統(tǒng)默認的名為aggr.sav的SPSS數(shù)據(jù)文件中可以按File按鈕重新指定文件名重新指定結(jié)果文件中的變量名或加變量名標簽SPSS默認的變量名為原變量名后加_1在結(jié)果文件中保存各分類組的個案數(shù)現(xiàn)在是154頁\一共有193頁\編輯于星期五分類匯總說明分類匯總中的分類變量可以是多個,此時的分類匯總稱為多重分類匯總。如上述不同職業(yè)和不同年齡段顧客消費的例子即是多重分類匯總的應用。類似于數(shù)據(jù)的排序,在多重分類匯總中,指定多個分類變量的前后次序是很關(guān)鍵的。第一個指定的分類變量為主分類變量(如職業(yè)),其他的依次為第二(如年齡段)、第三分類變量等,它們決定了分類匯總的先后次序?,F(xiàn)在是155頁\一共有193頁\編輯于星期五例題2.7根據(jù)職工情況數(shù)據(jù)研究不同學歷的職工的工資水平是否存在差異利用分類匯總功能計算不同學歷職工的平均工資,然后進行比較。選擇文化程度為分類變量基本工資為匯總變量現(xiàn)在是156頁\一共有193頁\編輯于星期五例題2.8利用住房狀況調(diào)查數(shù)據(jù),分析本市戶口家庭和外地戶口家庭目前人均住房面積的平均值是否有較大差距,未來打算購買住房的平均面積是否有較大的差距。分類變量是“戶口狀況”,匯總變量是“人均面積”和“計劃面積”現(xiàn)在是157頁\一共有193頁\編輯于星期五數(shù)據(jù)分組數(shù)據(jù)分組就是根據(jù)統(tǒng)計分析的需要,將數(shù)據(jù)按照某種標準重新劃分為不同的組別數(shù)據(jù)分組的目的數(shù)據(jù)分組是對定距型數(shù)據(jù)進行整理和粗略把握數(shù)據(jù)分布的重要工具,因而在實際數(shù)據(jù)分析中經(jīng)常使用。在數(shù)據(jù)分組的基礎(chǔ)上進行的頻數(shù)分析,更能概括和體現(xiàn)數(shù)據(jù)的分布特征。另外,分組還能夠?qū)崿F(xiàn)數(shù)據(jù)的離散化處理等?,F(xiàn)在是158頁\一共有193頁\編輯于星期五數(shù)據(jù)分組職工基本情況數(shù)據(jù)中的基本工資數(shù)據(jù)為定距數(shù)據(jù),表現(xiàn)為具體的工資金額。如此“細致”的數(shù)據(jù)有時并不利于展現(xiàn)數(shù)據(jù)的總體分布特征。因此,可以將工資收入進行“粗化”,即分組,將其按照一定的標準重新分成高收入、中收入、低收入三個組,之后再進行頻數(shù)分析,繪制直方圖等。200只燈泡的使用壽命學生英語成績按照分數(shù)分為優(yōu)秀、良好和不及格現(xiàn)在是159頁\一共有193頁\編輯于星期五組距分組在變量值較多的情況下,數(shù)據(jù)分組通常采用組距分組。組距分組是將全部變量值依次劃分為若干個區(qū)間,并將同一區(qū)間的變量值作為一組組距分組中有兩個關(guān)鍵問題分組數(shù)目的確定組距的確定“不重不漏”的原則"不重"是指一個變量值只能分在某一個組中,不能在其他組中重復出現(xiàn)"不漏"是指所有數(shù)據(jù)都應分配在某個組中,不能遺漏現(xiàn)在是160頁\一共有193頁\編輯于星期五分組數(shù)目的確定數(shù)據(jù)應分成多少組比較合適通常與數(shù)據(jù)本身的特點和數(shù)據(jù)個數(shù)有關(guān)。由于分組的目的之一是觀察數(shù)據(jù)分布的特征,因此組數(shù)的確定應以能夠清楚
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第15課《無言之美》教學設(shè)計2023-2024學年統(tǒng)編版語文九年級下冊
- 一年級數(shù)學計算題專項練習匯編
- 四年級數(shù)學(上)計算題專項練習及答案匯編
- 臥室裝修保潔合同范例
- 餐飲連鎖區(qū)域代理合同協(xié)議書范本
- 公式股合同范例
- 傳媒股合同范例
- 合同范例修編
- Unit 7 A day to remember Section A 2a - 2e 教學設(shè)計 2024-2025學年人教版(2024)七年級英語下冊
- 公司對外合作合同范例
- 110報警服務(wù)臺接處警登記表
- 《鉗工工藝學》課件
- 高考語言運用題之標點符號的表達效果專題訓練
- 安全生產(chǎn)重大事故隱患排查報告表
- 安全費用提取、使用臺賬
- 防沙治沙治理施工方案
- 學前兒童游戲4
- 建設(shè)工程安全生產(chǎn)管理習題庫及答案
- 七下2.1.2蒸騰作用市公開課一等獎省優(yōu)質(zhì)課賽課一等獎?wù)n件
- 項目1 多旋翼無人機的組裝與調(diào)試
- 北京市歷年中考語文現(xiàn)代文之記敘文閱讀25篇(2003-2021)
評論
0/150
提交評論