SPSS在數學建模中的應用PPT課件.ppt_第1頁
SPSS在數學建模中的應用PPT課件.ppt_第2頁
SPSS在數學建模中的應用PPT課件.ppt_第3頁
SPSS在數學建模中的應用PPT課件.ppt_第4頁
SPSS在數學建模中的應用PPT課件.ppt_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2010年8月 SPSS在數學建模中的應用 2020 1 15 1 第一講SPSS的一般應用 一 SPSSforWindows的界面介紹數據編輯窗口包括窗口名顯示欄 主菜單 工具欄 數據編輯區(qū) 變量定義區(qū)和狀態(tài)欄 結果編輯窗口顯示和管理SPSS統(tǒng)計分析結果 報表及圖形的窗口 可以將窗口中的內容以結果文件 spo的形式保存 2020 1 15 2 數據編輯窗口 2020 1 15 3 結果編輯窗口 2020 1 15 4 二 建立數據文件定義變量數據錄入數據編輯數據文件的保存調用其它數據文件 2020 1 15 5 定義變量 單擊數據編輯窗口左下方的 VariableView 標簽或雙擊題頭 Var 進入變量定義窗口 可定義 變量名 Name 變量類型 Type 變量長度 Width 小數點位數 Decimal 變量標簽 Label 變量值標簽 Values 缺失值的定義方式 Missing 變量的顯示寬度 Columns 變量顯示的對齊方式 Align 變量的測量尺度 Measure 2020 1 15 6 定義變量 定義變量名 Name 時 應注意 1 變量名可為漢字或英文 英文的第一個字符必須為字母 后面可跟任意字母 數字 句點或 等 2 變量名不能以句點結尾 3 定義時應避免最后一個字符為下劃線 因為某些過程運行時自動創(chuàng)建的變量名的最后一個字符有可能為下劃線 4 變量的長度一般不能超過8個字符 5 每個變量名必須保證是唯一的 不區(qū)分大小寫 常用的變量類型 Type 包括 數值型 字符串型 日期格式變量等 2020 1 15 7 數據錄入 定義變量后 單擊 DataView 即可在數據編輯窗口中輸入數據 例1 馬尾松腮扁葉蜂調查數據 doc 2020 1 15 8 數據文件的保存 選擇 File 菜單的 Save 命令 可直接保存為SPSS默認的數據文件格式 sav 選擇 File 菜單的 SaveAs 命令 彈出 SaveDataAs 對話框 可選擇保存為Excel xls 等文件格式 2020 1 15 9 數據編輯 1 數據的排序 Data SortCases 2 數據的轉置 Data Transpose 3 數據的聚合 Data AggregateData 4 數據文件的拆分 Data SplitFile 5 數據文件的合并 Data MergeFiles AddCases AddVariables 6 數據的轉換 Transform Compute 例2 數據編輯案例 doc 2020 1 15 10 SPSS調用其他數據文件 按照File Open Data 的順序選擇菜單項 打開 OpenFile 對話框 可以打開的文件格式除了SPSS sav 外 還包括 Excel xls 數據文件 dat 和文本文件 txt 2020 1 15 11 三 SPSS制圖主要通過 Graph 菜單中的選項來創(chuàng)建圖形 SPSS在數學建模中的應用 ppt 2020 1 15 12 第二講方差分析 方差分析是檢驗多個總體均值之間是否存在顯著差異的一種統(tǒng)計方法 例如 研究不同班級學生的學習成績是否存在差異 學習成績 教學方法 接受能力 心理素質 努力程度 所用教材 2020 1 15 13 例題 根據因素的個數 可以將方差分析分為 單因素方差分析多因素方差分析單因素方差分析的控制變量只有一個 而控制變量可以有多個觀察水平 例如 在研究教學方法對學習成績的影響 可以選擇多種不同的教學方法進行實驗 如果這些方法之間存在顯著的差異性 就可以選擇最有效的手段來提高教學水平 2020 1 15 14 一 單因素方差分析 例如 把18名學生分為三個等組 各組內學生的能力相當 在三種不同的教學方法下進行相同內容的學習 其中 第一組為受表揚組 每次練習后 不管成績如何 始終受到表揚 第二組為受訓斥組 始終受到訓斥 第三組為對照組 不受任何信息作用 將三組學生相互隔離 若干天后對他們進行考試 得到每組的學習成績 2020 1 15 15 各組的教學效果是否存在差異 哪種教學效果最好 2020 1 15 16 單因子方差分析的數據結構 2020 1 15 17 單因素方差分析的步驟 提出假設 構造檢驗的統(tǒng)計量 顯著性檢驗 得到結論 2020 1 15 18 1 提出假設 在單因素方差分析中 要檢驗因素A的k個水平 總體 的均值是否相等 因此提出假設的一般形式為 原假設 對立假設 2020 1 15 19 2 構造檢驗的統(tǒng)計量 由于樣本均值可以作為總體均值的估計 所以可以借助樣本均值粗略估計一下總體均值的情況 符號說明 總樣本容量第i水平的樣本均值總樣本均值 2020 1 15 20 2 構造檢驗的統(tǒng)計量 當時 有 對例子中的數據 由于各組樣本容量相等 于是計算得到總樣本均值 2020 1 15 21 2 構造檢驗的統(tǒng)計量 Questions三組的樣本均值各不相等 能否說明三組的總體均值有明顯差異 為什么觀察值之間存在差異 這些差異是由哪些原因造成的 如何來衡量各組之間的差異大小呢 2020 1 15 22 2 構造檢驗的統(tǒng)計量 所有觀察值幾乎各不相等 它們的分散程度可以用總平方和來度量 觀察值之間的差異越大 SST越大 在單因素實驗中 造成觀察值差異的原因有兩個 一個是由隨機誤差引起的 不可避免 另一個就是由因素的不同水平造成的 2020 1 15 23 2 構造檢驗的統(tǒng)計量 我們定義組間平方和來度量各組之間的差異 定義組內平方和來度量組內隨機誤差引起的偏差 可以證明 2020 1 15 24 2 構造檢驗的統(tǒng)計量 按照構造統(tǒng)計量的基本原則 統(tǒng)計量具有一定的實際意義統(tǒng)計量要服從某已知分布可以構造單因素方差分析的統(tǒng)計量 服從自由度為的F分布 2020 1 15 25 3 顯著性檢驗 對給定的顯著性水平 當時 應拒絕原假設 即認為各水平之間有明顯差異 否則應接受原假設 即認為各水平之間無明顯差異 2020 1 15 26 例題的求解 當時 查F分布表得到 由于 因此應拒絕原假設 2020 1 15 27 4 SPSS的實現過程 1 選擇菜單Analyze Comparemeans One WayANOVA 彈出One WayANOVA對話框 2 從左側列表框中選擇觀測變量 指標 通過中間的移動按鈕移入到右側的DependentList框內 3 從左側列表框中選擇因素變量 通過中間的移動按鈕移入到右側的Factor框內 4 依次單擊 Contrasts 按鈕和 PostHoc 按鈕 彈出One WayANOVA Contrasts對話框和One WayANOVA PostHoc對話框 由于這兩個對話框太專業(yè) 也較少用 此處略 2020 1 15 28 4 SPSS的實現過程 5 單擊 Options 按鈕 彈出One WayANOVA Options對話框 Statistics項 選擇Descriptive復選項 輸出基本描述統(tǒng)計量 其他選項略 MissingValues項 定義缺失值的處理方式 其內容設置與One SamplesTTest完全相同 此處不再重復 單擊 Continue 按鈕 返回到One WayANOVA對話框 6 單擊 OK 按鈕 即可完成單因素方差分析的操作 2020 1 15 29 4 SPSS的實現過程 例3 單因素方差分析 doc 2020 1 15 30 二 雙因素方差分析 實際中 有時需要考慮兩個因素對實驗結果的影響 例如飲料銷售 除了關心飲料顏色之外 我們還想了解銷售地區(qū)是否影響銷售量 若把飲料的顏色看作影響銷售量的因素A 飲料的銷售地區(qū)則是影響因素B 對因素A和因素B同時進行分析 就屬于雙因素方差分析的內容 雙因素方差分析是對影響因素進行檢驗 究竟是一個因素在起作用 還是兩個因素都起作用 或是兩個因素的影響都不顯著 2020 1 15 31 二 雙因素方差分析 雙因素方差分析有兩種類型 一個是無交互作用的雙因素方差分析 它假定因素A和因素B的效應之間是相互獨立的 不存在相互關系 另一個是有交互作用的雙因素方差分析 它假定因素A和因素B的結合會產生出一種新的效應 2020 1 15 32 1 理論分析 2020 1 15 33 1 理論分析 以下根據平方和分解的思想來給出檢驗用的統(tǒng)計量的計算公式 先引入下述記號 i 1 2 rj 1 2 s 2020 1 15 34 1 理論分析 其中總樣本容量n r s m 總偏差平方和ST 因素A的效應平方和SA 因素B的效應平方和SB 交互效應平方和SA B以及誤差平方和SE的計算公式如下 2020 1 15 35 1 理論分析 2020 1 15 36 雙因素方差分析表 2020 1 15 37 1 理論分析 2020 1 15 38 2 SPSS實現過程 在 Analyze 菜單的 GeneralLinearModel 子菜單中選擇 Univariate 將觀察變量添加到 DependentVariable 框中 將兩個控制變量添加到 FixedFactor 框中 若考慮因子間的交互作用 可單擊 Model 按鈕 選擇 Fullfactorial 若不考慮交互作用 則選擇 Custom 再在 BuildTerms 下方選擇 MainEffects 與單因素方差分析類似 單擊 Options 可以選擇是否進行方差相等的檢驗等 例4 雙因素方差分析 doc 2020 1 15 39 第三講相關及回歸分析 相關分析與回歸分析是處理變量之間關系的一種常用統(tǒng)計方法 用這種方法可以定量地建立一個變量關于另一個變量或另幾個變量的數學表達式 即數學模型 然后利用這種表達式 可以對該變量進行預測或控制 2020 1 15 40 一 相關分析 相關分析 CorrelationAnalysis 是根據實際觀察的數據資料 在具有相關關系的變量之間 對現象之間的依存關系的表現形式和密切程度的研究 可以用兩種方法來表現變量間的相關關系 一種方法是通過比較直觀的散點圖來表現 另一種方法是通過相關系數來反映 通過圖形和數值兩種方式 能夠有效地揭示變量之間的關系的強弱程度 2020 1 15 41 1 散點圖 散點圖就是將數據以點的形式畫在直角坐標系上 通過點組成的圖形來觀察兩變量之間的相關關系 具體做法是 用橫坐標代表自變量X 縱坐標代表因變量Y 通過觀察或實驗我們可以得到若干組數據 xi yi 將其在平面直角坐標系中用點來表示 2020 1 15 42 2 相關系數 相關系數是根據樣本數據計算的對兩個變量之間線性關系強弱的度量值 用r來表示 若相關系數是根據總體全部數據計算的 則稱為總體相關系數 記為 樣本相關系數的計算公式為 2020 1 15 43 2 相關系數 相關系數的意義 0 r 1表示兩個變量間存在正線性相關關系 1 r 0表示兩個變量間存在負線性相關關系 r 0表示兩個變量間不存在線性相關關系 r 1表示兩個變量間存在完全線性相關關系 r 越接近于0 表示兩個變量間的線性相關程度越低 r 越接近于1 表示兩個變量間的線性相關程度越高 2020 1 15 44 2 相關系數 2020 1 15 45 2020 1 15 46 2 相關系數 2020 1 15 47 3 SPSS實現過程 1 選擇菜單Analyze Correlate Bivariate 彈出BivariateCorrelations對話框 2 把參加計算相關系數的變量從左側列表框中選到右側的Variables列表框中 3 CorrelationCoefficients項 選擇相關系數類型 包含3個復選項 Pearson復選項 簡單相關系數 是系統(tǒng)默認的方式 用于連續(xù)變量或等間距測度的數值型變量 Spearman復選項 等級相關系數 用來度量順序變量 Kendall stau b復選項 等級相關系數 用來度量順序變量 2020 1 15 48 3 SPSS實現過程 4 TestofSignificance項 選擇輸出相關系數檢驗的雙邊或單邊概率p值 包含2個單選項 Two tailed單選項 雙邊檢驗 是系統(tǒng)默認的方式 用于事先不知道相關方向的情況 One tailed單選項 單邊檢驗 用于事先知道相關方向的情況 5 FlagsignificantCorrelations復選項 選擇輸出 標志 以標明變量間的相關性是否顯著 在相關系數上用 標出檢驗結果 表示顯著性概率p 0 05 即一般顯著 表示顯著性概率p 0 01 即特別顯著 2020 1 15 49 3 SPSS實現過程 6 單擊 Options 按鈕 彈出BivariateCorrelationsOptions對話框 Statistics項 選擇要輸出的統(tǒng)計量 包含2個復選項 Meansandstandarddeviations復選項 輸出變量的均值和標準差 Cross productdeviationsandcovariances復選項 輸出各對變量的叉積離差陣和協(xié)方差陣 MissingValues項 指定對缺失值的處理方式 包含2個單選項 2020 1 15 50 3 SPSS實現過程 Excludecasespairwise單選項 剔除本計算變量含有缺失值的數據 Excludecaseslistwise單選項 剔除所有計算變量含有缺失值的數據 單擊 Continue 按鈕 返回BivariateCorrelations對話框 7 單擊 OK 按鈕 得到相關分析輸出結果 例5 相關分析 doc 2020 1 15 51 二 回歸分析 變量關系 確定性關系 相關關系 可用確定的函數表達式表達 相關方向 正相關 負相關 相關程度 完全相關 完全不相關 不完全相關 相關形式 線性相關 非線性相關 變量的個數 單相關 復相關 偏相關 2020 1 15 52 二 回歸分析 一元線性回歸分析多元線性回歸分析非線性回歸分析 2020 1 15 53 回歸 名稱的由來 回歸名稱的由來要歸功于英國統(tǒng)計學F 高爾頓 F Galton 1822 1911 高爾頓和他的學生 現代統(tǒng)計學的奠基者之一K 皮爾遜 K Pearson 1856 1936 在研究父母身高與其子女身高的遺傳問題時 在觀察了1078對夫婦后 以每對夫婦的平均身高作為x 取他們的一個成年兒子的身高為y 將結果繪成散點圖后發(fā)現成一條直線 計算出回歸方程為 2020 1 15 54 這種趨勢說明父母平均身高x每增加一個單位 其成年兒子的平均身高增加0 516個單位 該結果表明 高個子父親確實有生高個子兒子的趨勢 子代人的身高有回歸到同齡人平均身高的趨勢 此例形象的說明了生物學物種的穩(wěn)定性 2020 1 15 55 一元線性回歸 一 一元線性回歸模型 2020 1 15 56 可以用相關分析或非線性回歸分析 1 一元線性回歸模型的建立 畫出兩個變量X和Y的散點圖 由X的變化引起的Y的線性變化部分Y a bX Y a bX 由于其他隨機因素引起的Y的變化部分 N 0 2 觀察散點是否呈直線趨勢 是 否 建立一元線性回歸模型 Y a bX 如何建立方程 最小二乘法 根據距離觀測值的各點平方和最小原則確定參數的方法稱為最小二乘法 2020 1 15 57 最小二乘法就是使實際觀測值的 2 參數的最小二乘估計 與 之間的差的平方和取最小值 即要選擇的參數 應滿足使殘差平方和 取最小值 令 2020 1 15 58 整理得方程組 正規(guī)方程組 解此正規(guī)方程組得 2020 1 15 59 3 離差平方和的分解 總離差平方和 回歸平方和 剩余平方和 xi y x yi xi yi 離差平方和的分解 60 二 一元線性回歸方程的統(tǒng)計檢驗 1 回歸方程的擬合優(yōu)度檢驗 檢驗 R2越接近于1 回歸方程對實際觀測值的擬合優(yōu)度越高 R2越接近于0 回歸方程對實際觀測值的擬合優(yōu)度越低 2020 1 15 61 二 一元線性回歸方程的統(tǒng)計檢驗 2 回歸方程的顯著性檢驗 F檢驗 H0 線性關系不顯著H1 線性關系顯著 當H0為真時 檢驗統(tǒng)計量 F 1 n 2 給定顯著性水平 查表確定臨界點 確定拒絕域 列出方差分析表 2020 1 15 62 方差分析表 2020 1 15 63 二 一元線性回歸方程的統(tǒng)計檢驗 3 回歸系數的顯著性檢驗 t檢驗 回歸系數的顯著性檢驗是檢驗自變量X對因變量Y的影響是否顯著 如果回歸系數b 0 總體回歸直線是一條水平線 表明自變量X的變化對因變量Y沒有影響 因此 回歸系數的顯著性檢驗就是檢驗回歸系數b與0之間是否有顯著差異 2020 1 15 64 t檢驗步驟 2020 1 15 65 三 利用回歸方程進行預測 預測就是指通過自變量X的取值估計或預測因變量Y的取值 2020 1 15 66 三 利用回歸方程進行預測 式中 2020 1 15 67 多元線性回歸 在許多實際問題中 還會遇到一個因變量和多個自變量的線性相關問題 這需要用多元線性回歸分析的方法來解決 例如 企業(yè)的原材料消耗額y與產量x1 單位產量消耗x2 原材料價格x3之間的關系 2020 1 15 68 涉及p個自變量的多元線性回歸模型可表示為 N 0 2 一 多元線性回歸模型 2020 1 15 69 二 多元線性回歸方程 2020 1 15 70 三 參數的最小二乘估計 多元線性回歸分析同樣采用最小二乘法來估計待定參數 就是要求得的 滿足使殘差平方和取最小值 2020 1 15 71 判定系數R2仍然是指回歸平方和占總離差平方和的比例 四 多元線回歸的統(tǒng)計檢驗 1 回歸方程的擬合優(yōu)度檢驗 檢驗 修正的判定系數是指用平均剩余平方和 來代替SSE 用平均總離差平方和 來代替SST 進而得到修正的判定系數的計算公式為 2020 1 15 72 在多元線性回歸分析中 修正的判定系數比判定系數R2更能夠準確地反映回歸方程對實際觀測值的擬合程度 四 多元線回歸的統(tǒng)計檢驗 2020 1 15 73 在多元線性回歸分析中 修正的判定系數比判定系數R2更能夠準確地反映回歸方程對實際觀測值的擬合程度 四 多元線回歸的統(tǒng)計檢驗 2020 1 15 74 四 多元線回歸的統(tǒng)計檢驗 2 回歸方程的顯著性檢驗 F檢驗 給定顯著性水平 查表確定臨界點 當 時 拒絕原假設 認為回歸方程顯著 2020 1 15 75 四 多元線回歸的統(tǒng)計檢驗 3 回歸系數的顯著性檢驗 t檢驗 回歸系數的檢驗就是用來確定每一個單個的自變量Xj對因變量Y的影響是否顯著 在多元線性回歸中 回歸方程的顯著性檢驗不再等價于回歸系數的顯著性檢驗 檢驗的步驟如下 1 提出假設 H0 bj 0H1 bj 0 2 構造檢驗統(tǒng)計量當H0為真時 檢驗統(tǒng)計量為 2020 1 15 76 3 給定顯著性水平 查表確定臨界點 4 確定拒絕域 5 做出統(tǒng)計決策 時 拒絕H0 認為Xj對因變量Y的影響顯著 反之 就認為自變量Xj對因變量Y的影響不顯著 2020 1 15 77 五 SPSS實現過程 選擇Analyze Regression Linear例6 多元線性回歸分析 doc 2020 1 15 78 非線性回歸分析 因變量y與x之間不是線性關系可通過變量代換轉換成線性關系用最小二乘法求出參數的估計值并非所有的非線性模型都可以化為線性模型 2020 1 15 79 幾種常見的非線性模型 線性化方法令 基本形式 雙曲線函數 則 一 非線性模型及其線性化方法 2020 1 15 80 線性化方法兩端取對數得 lny lna blnx令 基本形式 冪函數 則 一 非線性模型及其線性化方法 此外 還有幾種典型的模型可化為線性化模型 2020 1 15 81 一 非線性模型及其線性化方法 多項式函數 對數函數 S型曲線函數 指數函數 2020 1 15 82 非線性回歸 實例 生產率與廢品率的散點圖 2020 1 15 83 用線性模型 y a bx 有y 2 671 0 0018x用指數模型 y abx 有y 4 05 1 0002 x比較直線的殘差平方和 5 3371 指數模型的殘差平方和 6 11 直線模型略好于指數模型 2020 1 15 84 二 SPSS的實現過程 選擇Analyze Regression CurveEstimation1 Dependent框 存放因變量y2 Independent框 存放自變量xTi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論