數(shù)據(jù)挖掘和分析31W21A_第1頁
數(shù)據(jù)挖掘和分析31W21A_第2頁
數(shù)據(jù)挖掘和分析31W21A_第3頁
數(shù)據(jù)挖掘和分析31W21A_第4頁
數(shù)據(jù)挖掘和分析31W21A_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、期末復習2015 第21周數(shù)據(jù)挖掘和分析基礎 數(shù)據(jù)分析中,如果我們希望研究變量之間的關系,會選擇一部分變量作為自變量(預測變量),另一部分變量作為因變量.根據(jù)自變量和因變量的類型(連續(xù)型或類別型),需要用不同的分析方法.請就四種情況按照表格分類說明應用何種分析方法.數(shù)據(jù)的預處理 數(shù)據(jù)的規(guī)范化和標準化 給定幾科的成績,根據(jù)各科“標準分”的平均分進行排序 關鍵換算方式(公式)和流程,文字、偽代碼、流程圖均可 數(shù)據(jù)的相似度和相異度(距離) 給定兩個數(shù)據(jù)點(兩個n維向量),計算它們之間的歐幾里得距離和曼哈頓距離 缺失值 給定某個數(shù)據(jù)集中的缺失值出現(xiàn)狀況,給出對應方案 刪除列、刪除行、還是填補以及如何填

2、補?數(shù)據(jù)的基礎分析 可視化:箱線圖的解釋 箱線圖的示意畫法:標注各種元素 統(tǒng)計方法的選擇:中值、均值、極差、方差 公式和文字說明 偏度、峰度 畫圖說明意義,以及說明取值范圍回歸分析 多元線性回歸 簡單說明數(shù)學原理 給定R的輸出,解釋回歸結果 全子集回歸模型選擇 根據(jù)全子集回歸圖選擇最優(yōu)回歸模型的過程 說明理由 殘差分析圖 理解回歸模型的殘差圖(4聯(lián)) 根據(jù)殘差圖的情況,說明需要對數(shù)據(jù)和模型的處理方差分析和廣義線性模型 廣義線性模型 Logistic回歸的定義和適用范圍 泊松回歸的定義和適用范圍 方差分析 1,2 單因素方差分析的原理和步驟 方差分析對數(shù)據(jù)的統(tǒng)計假設 方差分析的協(xié)方差分析假設檢驗

3、,功效分析,重抽樣與自助法 置換檢驗 描述如何用置換法檢測兩組之間的區(qū)別(t統(tǒng)計量) 流程圖,文字,畫圖等方式,必要時都可使用 自助法 描述如何使用自助法對統(tǒng)計量進行區(qū)間估計 流程圖,文字,畫圖等方式,必要時都可使用 功效分析 給定假設分布的參數(shù),給出第一類和第二類錯誤的值分類分析 決策樹 給定某一節(jié)點上的數(shù)據(jù)集,使用增益計算最優(yōu)的分裂方式 樸素貝葉斯 給定某一訓練集,使用樸素貝葉斯方法對新的數(shù)據(jù)記錄進行分類 根據(jù)應用場景選擇適用的分類方法 決策樹、貝葉斯、KNN、人工神經(jīng)網(wǎng)絡、支持向量機等等關聯(lián)分析 購物籃數(shù)據(jù): 給定數(shù)據(jù)集,計算某些項集的支持度,或者某些規(guī)則的支持度和置信度 Apriori算法: 描述產(chǎn)生頻繁項集或關聯(lián)規(guī)則的Apriori算法 可以使用偽代碼、流程圖或文字敘述 關聯(lián)規(guī)則的評價 對指標的解釋:Lift,興趣,等等聚類分析 基于原型的 簡要描述K-means聚類算法并討論其中的最關鍵操作 可以使用偽代碼、流程圖或文字敘述 基于層次的 簡要描述凝聚層次聚類算法并討論其中的最關鍵操作 可以使用偽代碼、流程圖或文字敘述 基于密度的 簡要描述DBSCAN算法并討論其中的最關鍵操作 可以使用偽代碼、流程圖或文字敘述其他 維歸約 簡述主成分分析PCA和探索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論