




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第二章統(tǒng)計數(shù)據(jù)的收集與預處理精選課件主要內(nèi)容2.1統(tǒng)計數(shù)據(jù)的收集2.2SPSS數(shù)據(jù)文件的建立2.3SPSS數(shù)據(jù)文件的編輯2.4SPSS數(shù)據(jù)加工精選課件2.1統(tǒng)計數(shù)據(jù)的收集2.1.1問卷設計1.問卷的構成〔1〕標題〔2〕導語〔前言〕〔3〕正文〔4〕結束語精選課件2.1統(tǒng)計數(shù)據(jù)的收集2.1.1問卷設計2.問卷的問題類型〔1〕封閉型問題〔是否式、選擇式、評判式〕〔2〕開放型問題精選課件2.1統(tǒng)計數(shù)據(jù)的收集2.1.1問卷設計3.問卷中量表的主要類型〔1〕連續(xù)評分量表〔2〕分項評分量表〔Likert量表〕〔3〕排序量表精選課件2.1統(tǒng)計數(shù)據(jù)的收集2.1.1問卷設計4.問卷設計的本卷須知〔1〕目的明確〔2〕先易后難,先簡后繁〔3〕提出的問題要具體,防止提一般性問題〔4〕單項選擇問題的備選答案應完整劃分答案空間〔5〕多項選擇題的備選答案必須分布在兩個以上的維度上,并且至少有一局部不是互相排斥的〔6〕問題的陳述及備選答案不能有多重含義〔7〕問題設計的用語要含義明確,不能讓應答者產(chǎn)生不同的理解〔8〕在問題的陳述中,要對所詢問行為的時間、方式、目的做必要的限定精選課件2.1統(tǒng)計數(shù)據(jù)的收集2.1.1問卷設計4.問卷設計的本卷須知〔9〕對于得不到老實答復而又必須了解的數(shù)據(jù),可以通過變換問題的提法來獲得相應的數(shù)據(jù),或者通過了解相對數(shù)據(jù)來判斷總體的情況〔10〕問卷不能太長,以20~30分鐘為宜;商場攔截類的問卷,以3~5分鐘為宜精選課件2.1.2問卷分析信度分析效度分析2.1統(tǒng)計數(shù)據(jù)的收集精選課件主要內(nèi)容2.1統(tǒng)計數(shù)據(jù)的收集2.2SPSS數(shù)據(jù)文件的建立2.3SPSS數(shù)據(jù)文件的編輯2.4SPSS數(shù)據(jù)加工精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.1統(tǒng)計數(shù)據(jù)的度量尺度名義尺度〔Norminal〕即定類尺度,它僅僅是一種標志,用于區(qū)分變量的不同值,類別數(shù)據(jù)之間沒有次序關系。例如,人口的性別、商品的名稱、身份證、商店類型等。定序尺度〔Ordinal〕是對事物之間等級或順序差異的一種測度。例如,考試成績〔優(yōu)、良、中、差〕、人的身高等級〔高、中、矮〕、學歷等級〔博士、碩士、學士〕等。間隔尺度〔Scale〕定距尺度〔Interval〕,是對事物類別或次序之間間距的測度。例如,100分制考試的成績、重量、溫度等。定比尺度〔Ratio〕,是指能夠測度值之間比值的一種計量尺度。例如,員工的月收入、企業(yè)產(chǎn)值等。精選課件2.2SPSS數(shù)據(jù)文件的建立統(tǒng)計數(shù)據(jù)的度量尺度說明:不同的度量尺度的統(tǒng)計數(shù)據(jù)在SPSS的數(shù)據(jù)文件中,對應不同的變量數(shù)據(jù)類型。名義尺度數(shù)值型、字符型定序尺度數(shù)值型、字符型間隔尺度數(shù)值型精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.2、SPSS數(shù)據(jù)文件的特點
人員編號性別部門體檢日期體重健康狀況1女通信學院08/10/200455好2女計算機學院08/10/200446好3女外語學院08/10/200450一般4男通信學院08/10/200456差5男管理學院08/11/200451差6男光電學院08/11/200453好7女光電學院08/11/200450一般8男通信學院08/12/200450好9女計算機學院08/12/200445一般10男管理學院08/13/200456好樣本
變量變量值個案精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.3輸入數(shù)據(jù)建立數(shù)據(jù)文件SPSS數(shù)據(jù)文件的建立包括兩個方面,首先進行數(shù)據(jù)的結構定義,其次錄入數(shù)據(jù)。〔1〕數(shù)據(jù)的結構定義結構定義包括:名稱、類型、寬度、小數(shù)、標簽、值、缺失值、列、對齊、度量標準、角色精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義名稱命名規(guī)那么:高版本的SPSS的變量名長度可多達64位,但是由于老版本的SPSS變量名長度應在8位之內(nèi),為了防止與低版本及其他軟件出現(xiàn)兼容問題,高版本變量名一般仍控制在8位之內(nèi)且盡量防止中文,必要的中文說明可以放在Label欄中加以說明。首字符應以英文字母開頭,后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點不能為變量名的最后一個字符。變量名必須唯一且不區(qū)分大小寫字母。允許漢字作為變量名,漢字總數(shù)一般不超過4個。變量名不能與SPSS的保存字相同。SPSS的保存字包括:all、by、eq、ge、gt、leIt、ne、not、or、to、with。系統(tǒng)不區(qū)分變量名的大小寫。精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義變量類型精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義變量類型具體說明如下表所示:精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義變量寬度設置變量寬度。一般無需調(diào)整,直接采取默認值。它的大小可通過Width欄后邊的微調(diào)按鈕調(diào)整小數(shù)位數(shù)假設變量類型為數(shù)值型,那么可設置變量的小數(shù)位數(shù),其他類型的變量那么不能設置。小數(shù)位數(shù)默認為兩位變量名標簽考慮到與低版本的兼容問題,變量名最好限制為8位以內(nèi),并且盡量防止中文,這就有可能不能完全描述清楚變量的信息,此時就可在標簽中對變量名做進一步的說明。利用Label欄,不僅可以對變量詳細說明,而且還可以采用中文,大大方便了用戶對變量的理解。精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義變量值標簽(Values)變量值標簽是對變量的可能取值附加的進一步說明,標簽內(nèi)容最多可以有120個字符,通常僅對類型或分類變量的取值指定值標簽例如,將變量Departmt定義為數(shù)值型變量時,可以按照下表中規(guī)定的值和值標簽,具體定義方法見以下圖。變量值變量值標簽1通信學院2計算機學院3管理學院4光電學院5外語學院精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義缺失值SPSS統(tǒng)計軟件的另一特點就是可以通過制定缺失值的方式來定義缺失數(shù)據(jù),這樣就可以更好地利用其他的有效數(shù)據(jù)。列寬定義變量在數(shù)據(jù)窗口中顯示的寬度。對齊定義變量值顯示的對齊方式,默認對齊方式為數(shù)值變量在右邊,字符串變量在左邊,此設置只影響數(shù)據(jù)編輯器中的顯示。度量標準根據(jù)統(tǒng)計數(shù)據(jù)的類型定義度量尺度,度量尺度在數(shù)據(jù)分析中的作用不是很明顯,但是如果用戶要進行交互式繪圖就必須定義好度量尺度。精選課件2.2SPSS數(shù)據(jù)文件的建立〔1〕數(shù)據(jù)的結構定義缺失值SPSS統(tǒng)計軟件的另一特點就是可以通過制定缺失值的方式來定義缺失數(shù)據(jù),這樣就可以更好地利用其他的有效數(shù)據(jù)。角色輸入:變量將用作輸入〔例如預測變量、自變量〕。目標:變量將用作輸出或目標〔例如因變量〕。兩者:變量將同時用作輸入和輸出。無:變量沒有角色分配。分區(qū):變量用于將數(shù)據(jù)劃分為單獨的訓練、檢驗和驗證樣本。拆分:設定此角色是為與SPSSModeler相互兼容,具有此角色的變量不會在SPSSStatistics中用作拆分文件變量。精選課件2.2SPSS數(shù)據(jù)文件的建立〔2〕數(shù)據(jù)的錄入錄入數(shù)據(jù)的一般方法逐行錄入從Word或Excel中直接復制粘貼到數(shù)據(jù)文件中連續(xù)粘貼相同值錄入帶有變量值標簽的數(shù)據(jù)輸入定義了變量值標簽的數(shù)據(jù)時,可以直接輸入變量值,也可以通過下拉列框的形式輸入,如圖,從中選擇值標簽即可。精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.4從其他數(shù)據(jù)文件導入數(shù)據(jù)建立數(shù)據(jù)文件〔1〕直接翻開選擇菜單“文件→翻開→數(shù)據(jù)〞,彈出“翻開文件〞對話框左鍵單擊“文件類型〞,即可看到SPSS所能翻開的數(shù)據(jù)文件類型,如下表所示精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.4從其他數(shù)據(jù)文件導入數(shù)據(jù)建立數(shù)據(jù)文件〔1〕直接翻開說明:其中用的最多的是直接翻開Excel的數(shù)據(jù)文件。在翻開Excel格式的文件時,SPSS默認將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口中,但也可指定僅讀取工作表某個區(qū)域內(nèi)的數(shù)據(jù)。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行上存儲了變量名信息,那么應選擇翻開對話框上的復選框“從第一行數(shù)據(jù)中讀取變量名〞,即以工作表第一行或指定讀取區(qū)域內(nèi)的第一行上的文字信息作為SPSS的變量名;如果不選此項,SPSS的變量名將自動取名為V1、V2等。精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.4從其他數(shù)據(jù)文件導入數(shù)據(jù)建立數(shù)據(jù)文件〔2〕數(shù)據(jù)庫查詢方式如果數(shù)據(jù)為數(shù)據(jù)庫格式的文件,可以同用數(shù)據(jù)庫查詢的方式導入數(shù)據(jù)到SPSS中。其操作步驟如下:第1步選擇菜單“文件→翻開數(shù)據(jù)庫→新建查詢〞,彈出數(shù)據(jù)庫向?qū)Т翱凇_@里顯示了所有可以翻開的數(shù)據(jù)源類型。第2步用戶根據(jù)翻開文件的向?qū)нx擇要翻開的文件類型并逐步翻開文件。精選課件2.2SPSS數(shù)據(jù)文件的建立2.2.4從其他數(shù)據(jù)文件導入數(shù)據(jù)建立數(shù)據(jù)文件〔3〕從文本文件導入文本格式的數(shù)據(jù)文件是一種最通用格式的數(shù)據(jù)文件,SPSS提供了專門讀取文本文件的功能。選擇菜單“文件→翻開文本數(shù)據(jù)…〞,彈出“翻開文件〞對話框,選擇要導入的文本文件名后會出現(xiàn)文本數(shù)據(jù)的向?qū)?,該向?qū)且粋€分為6步的翻開向?qū)В鶕?jù)文本文件的格式和導入數(shù)據(jù)的需求進行每一步的設置即可。精選課件主要內(nèi)容2.1統(tǒng)計數(shù)據(jù)的收集2.2SPSS數(shù)據(jù)文件的建立2.3SPSS數(shù)據(jù)文件的編輯2.4SPSS數(shù)據(jù)加工精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.1數(shù)據(jù)文件的合并SPSS提供兩種形式的合并:一是橫向合并,從外部文件中增加變量到當前數(shù)據(jù)文件中;二是縱向合并,指從外部數(shù)據(jù)文件中增加觀測量到當前數(shù)據(jù)文件中。橫向合并V1V2+V3V4V1V2V3V4縱向合并V1V2+V1V2V1V2精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.1數(shù)據(jù)文件的合并〔1〕橫向合并單擊“瀏覽〞按鈕選擇要合并的SPSS數(shù)據(jù)文件的文件名從左邊文本框中選擇需合并的變量到此框中精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.1數(shù)據(jù)文件的合并〔1〕橫向合并縱向合并數(shù)據(jù)文件的操作方法同橫向合并的方法類似,操作不再贅述,但需注意以下幾點:兩個待合并的SPSS數(shù)據(jù)文件的內(nèi)容合并起來應具有實際意義;兩個數(shù)據(jù)文件的結構最好一致;不同數(shù)據(jù)文件中含義相同的變量最好用相同的變量名,數(shù)據(jù)類型要相同精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.2數(shù)據(jù)文件的拆分SPSS23版本在“數(shù)據(jù)〞菜單中提供了兩種方法:一是“拆分文件…〞,這種拆分并不是要把一個數(shù)據(jù)文件分成幾個數(shù)據(jù)文件,而是按照需求,根據(jù)變量對數(shù)據(jù)進行分組,為以后的分組統(tǒng)計分析提供便利;二是“拆分為文件〞,這種拆分是將拆分后的數(shù)據(jù)寫入新的SAV文件,按拆分變量的值或值標簽生成多個SAV文件。精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.2數(shù)據(jù)文件的拆分
1.拆分文件在進行數(shù)據(jù)分析的時候,有時需要對數(shù)據(jù)文件按某個變量進行拆分,這種拆分并不是要把數(shù)據(jù)文件分成幾個,而是根據(jù)實際情況,根據(jù)變量對數(shù)據(jù)進行分組,為以后的分組統(tǒng)計分析提供便利。第一步數(shù)據(jù)組織第二步翻開主對話框第三步選擇拆分方式第四步按產(chǎn)品分組統(tǒng)計銷售總量和銷售總額精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.2數(shù)據(jù)文件的拆分
2.拆分為文件拆分為文件是將數(shù)據(jù)文件按拆分變量的值或值標簽,拆分為多個數(shù)據(jù)文件。第一步數(shù)據(jù)組織第二步翻開“將數(shù)據(jù)集拆分為單獨的文件〞對話框第三步拆分文件生成設置精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.3數(shù)據(jù)的選取數(shù)據(jù)的選取即按條件選取觀測量進行分析選擇觀測量的目的有時為了進行特定的分析,需要從所有的數(shù)據(jù)資料中選擇一些數(shù)據(jù)進行統(tǒng)計分析。例如:有學生的成績數(shù)據(jù),如果只分析男同學的成績,那么要進行選擇觀測量為男性的數(shù)據(jù)。精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.3數(shù)據(jù)的選取第一步數(shù)據(jù)組織第二步翻開“選擇觀測量〞對話框第三步指定選擇個案的方式第四步設置選中個案的輸出形式第五步設置選擇個案的條件精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.3數(shù)據(jù)的加權
所謂權重是指同一個觀測量值在所有的觀測量里出現(xiàn)的次數(shù)或頻率。SPSS的觀測量加權功能是在數(shù)據(jù)文件中選擇一個變量,這個變量里的值是相應的觀測量出現(xiàn)的次數(shù),這個變量叫做權變量。
SPSS中指定加權變量的本質(zhì)是數(shù)據(jù)復制,例如表2-5是工人每天生產(chǎn)產(chǎn)品的數(shù)量,第一行數(shù)據(jù)表示當天生產(chǎn)產(chǎn)品數(shù)量為20的工人有3個,將“工人數(shù)〞作為加權變量后,實際是將數(shù)據(jù)轉換成表2-6所示的數(shù)據(jù)進行分析。表2-5產(chǎn)品數(shù)量工人數(shù)203產(chǎn)品數(shù)量202020表2-6精選課件2.3SPSS數(shù)據(jù)文件的編輯2.3.3數(shù)據(jù)的加權
說明:一旦指定了加權變量,在以后的分析處理中加權是一直有效的,直到取消加權為止;只有數(shù)值型的變量才能作為加權變量。精選課件主要內(nèi)容2.1統(tǒng)計數(shù)據(jù)的收集2.2SPSS數(shù)據(jù)文件的建立2.3SPSS數(shù)據(jù)文件的編輯2.4SPSS數(shù)據(jù)加工精選課件2.4.1變量的計算2.4SPSS數(shù)據(jù)加工輸入新生成的變量的變量名輸入計算的式子SPSS中提供的用于計算的函數(shù),利用這些函數(shù)可以生成指定分布的隨機數(shù)、生成給定參數(shù)的概率密度函數(shù)等。精選課件2.4SPSS數(shù)據(jù)加工2.4.2數(shù)據(jù)可視分箱SPSS提供的數(shù)據(jù)可視分箱功能可將連續(xù)的數(shù)值型數(shù)據(jù)按由小至大的順序加以分組〔測量值由最低分至最高分分組〕,從而可將等距或比率變量轉換為間斷變量精選課件2.4SPSS數(shù)據(jù)加工2.4.2數(shù)據(jù)可視分箱
見書Page38例2-5
選擇“轉換→可視分箱〞,彈出右圖所示的變量選擇對話框?qū)⑿枰獎澐纸M段的變量“評價結果〞選擇到此框中。精選課件2.4SPSS數(shù)據(jù)加工2.4.2數(shù)據(jù)可視分箱
見書Page38例2-5
單擊此按鈕設置組段分割點輸入存儲組段值的新變量的名稱精選課件2.4SPSS數(shù)據(jù)加工2.4.2數(shù)據(jù)可視分箱
圖中提供
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 線下地推培訓
- 衡重式施工方案
- 2025年合同研究組織合作協(xié)議書
- 數(shù)據(jù)庫基礎知識培訓課件
- 2024-2025學年高二生物人教版選擇性必修3教學課件 第1章 第3節(jié) 發(fā)酵工程及其應用
- 2025年鋅錳電池項目發(fā)展計劃
- 考研臨床專業(yè)介紹
- 2025年高溫超導材料項目發(fā)展計劃
- 課題開題報告:湖北高校繼續(xù)教育學習支持與服務體系建設研究
- 課題開題報告:國際教育援助實施機制研究
- 2025屆高考英語二輪復習備考策略課件
- 2022年7月9日公務員多省聯(lián)考安徽省《申論》(安徽A卷、B卷、C卷)三套真題及參考答案
- 《高鐵乘務安全管理與應急處置(第3版)》全套教學課件
- Unit 5 Dinners ready Part B Let's learn Let's do(教學設計)-2024-2025學年人教PEP版英語四年級上冊
- 歷年湖北省公務員筆試真題2024
- 學校食品安全長效管理制度
- 滋補品項目效益評估報告
- 提綱作文(解析版)- 2025年天津高考英語熱點題型專項復習
- 下肢深靜脈血栓的介入治療
- 2025年南京機電職業(yè)技術學院高職單招數(shù)學歷年(2016-2024)頻考點試題含答案解析
- 2025年春新人教版歷史七年級下冊全冊課件
評論
0/150
提交評論