版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
國立高雄應(yīng)用科技大學(xué)電機(jī)工程系資料探勘實(shí)驗(yàn)室班級:博電一甲學(xué)號:1097404103姓名:鍾翔航實(shí)驗(yàn)室首頁:http://.tw/利用文件探勘技術(shù),針對萃取癌癥知識之生物資訊研究跨語言與單一語言文件抄襲偵測之研究方法Copyright2003-12,SPSSTaiwanCorp.DataMining
是什麼?DataMining是從資料中找出有用珍貴知識的一個過程何謂珍貴?何謂過程?WhyWhoWhatWhenWhereHow何謂過程?
增加銷售交叉銷售減少流失降低成本忠誠的客戶
警察找出罪犯醫(yī)學(xué)找出疾病國稅局找逃稅
何謂珍貴?許多技術(shù)知識的融合(統(tǒng)計、人工智慧、未來的基因演算法…等),並非一個演算法就可以解決全部問題資料資訊知識將沈睡的資料中的資訊轉(zhuǎn)變?yōu)榛畹闹R,進(jìn)而成為決策的智慧Copyright2003-12,SPSSTaiwanCorp.為什麼要做DataMining?競爭日益劇烈,了解客戶需求才能佔(zhàn)有優(yōu)勢過去及現(xiàn)在和客戶互動方式的改變過去互動單純直接了解客戶個人化需求現(xiàn)在互動複雜難直接了解客戶個人化需求電子化Copyright2003-12,SPSSTaiwanCorp.DataMining和統(tǒng)計不同?DataMining沒有事先假設(shè)多數(shù)狀況下母體參數(shù)已知資料量越大越好,小資料也可以挖只是較不可靠融合各種知識,包括統(tǒng)計、MachineLearning、人工智慧、基因等統(tǒng)計先假設(shè)再檢定母體參數(shù)未知資料量不可太大Copyright2003-12,SPSSTaiwanCorp.資料採礦的定位BusinessValueTimeQuery&ReportingOLAPDataMiningReal-timePersonalizationMeasurement(historical)Prediction(future)我們流失了多少客戶?這些流失客戶是位於哪個地區(qū)?哪些是高風(fēng)險客戶以及原因是?我們應(yīng)該即時提供這位客戶什麼服務(wù)?FromSPSSWhitePaperCopyright2003-12,SPSSTaiwanCorp.DataMining的其他特徵Interactive互動性Automation電腦自動化Continuing連續(xù)性,是動態(tài)的團(tuán)隊分工合作具有決策功能,使企業(yè)組織創(chuàng)新、再造目標(biāo):一對一個人化(Personalize)Copyright2003-12,SPSSTaiwanCorp.
DataMining的應(yīng)用範(fàn)疇
客戶關(guān)係管理(CRM)犯罪(Criminal)教育(Education)醫(yī)療(HealthCare)科學(xué)研究(Research)製程管理(ProcessManagement)Copyright2003-12,SPSSTaiwanCorp.各產(chǎn)業(yè)的應(yīng)用層面電信業(yè) 客戶流失管理 顧客終身價值及利潤價值 行銷回應(yīng)預(yù)測 交叉銷售/再銷售電子商務(wù) 顧客終身價值 交叉銷售/再銷售 瀏覽行為分析政府機(jī)構(gòu) 員工流失管理 犯罪偵測零售業(yè) 忠誠度及通路忠誠度 行銷回應(yīng)預(yù)測 客戶產(chǎn)品偏好分析與鑑別 交叉銷售/再銷售製造業(yè) 良率分析 製程改善 需求預(yù)測醫(yī)療業(yè) 病人流失管理 潛在新病人分析 病人屬性區(qū)隔Copyright2003-12,SPSSTaiwanCorp.各產(chǎn)業(yè)的應(yīng)用層面生命科學(xué) 基因抗藥反應(yīng)分析 基因序列分析 藥物區(qū)隔分析藥物市場風(fēng)險評估娛樂業(yè) 客戶流失管理 目標(biāo)客戶分析 客戶區(qū)隔 需求預(yù)測分析銀行 風(fēng)險管理 行銷回應(yīng)預(yù)測 維持顧客模型 顧客終身價值及利潤價值 多通路行為管理 信用卡冒用偵測保險業(yè) 交叉通路銷售 顧客終身價值及利潤價值 維持顧客模型 詐欺理賠分析
13分析服務(wù)(DataMining)整合性服務(wù)分析服務(wù)報表服務(wù)資料來源檢視表(DataSourceView)定義企業(yè)問題資料準(zhǔn)備資料檢視模型的建立模型評估佈屬與應(yīng)用資料源DM處理流程(1997年於阿姆斯特丹正式誕生CRISP-DMSIG)資料源.6.1.14CRISP-DMBusinessUnderstanding
DataUnderstanding
DataPreparation
Modeling
Deployment
EvaluationFormatDataIntegrateDataConstructDataCleanDataSelectDataDetermineBusinessObjectivesReviewProjectProduceFinalReportPlan
Monitering&MaintenancePlanDeploymentDetermineNext
StepsReviewProcessEvaluateResultsAssessModelBuildModelGenerateTest
DesignSelectModelingTechniqueAssessSituationExploreDataDescribeDataCollectInitialDataDetermineData
MiningGoalsVerifyDataQualityProduceProject
Plan15定義企業(yè)問題(CRISP-DM)確定目前內(nèi)部遇到的問題定義解決的目標(biāo)是開源或是節(jié)流電信用戶忠誠度逐年下降..產(chǎn)品良率持續(xù)下降…零售點(diǎn)庫存情況成長…保戶詐欺狀況不斷升高…卡戶剪卡比例增加…
客戶呆帳發(fā)生數(shù)暴增…客戶轉(zhuǎn)貸頻率提升…
16模型的建立(CRISP-DM)同一商業(yè)問題可以透過多種演算法、調(diào)整參數(shù)找出最佳模型1.選擇建模技術(shù)
建立模型技術(shù),模型假設(shè)2.規(guī)劃測試
測試計畫設(shè)計3.建立模型
參數(shù)設(shè)定,資料採礦模型,模型描述4.選擇最佳模型
模型評估,參數(shù)重新調(diào)整17模型的評估(CRISP-DM)建立預(yù)測模型之後,在真正應(yīng)用前,通常會透過測試計畫來評估整個資料採礦模型能帶來的效益,並協(xié)助檢視整個導(dǎo)入過程的潛在盲點(diǎn),而評估的標(biāo)準(zhǔn)並非數(shù)學(xué)上的正確度,而是以帶給企業(yè)最大利益為考量.1.評估結(jié)果依專案成功要件評估結(jié)果,核可之模型2.流程檢視流程檢視3.決定下一步驟行動列表,決策LiftChart-累積增益圖C
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024賓館室內(nèi)裝修合同標(biāo)準(zhǔn)樣本
- 2024房屋名額轉(zhuǎn)讓協(xié)議,房屋名額轉(zhuǎn)讓協(xié)議范本,寫購房名額轉(zhuǎn)讓合同
- 2024擔(dān)保合同格式參考
- 2024家教的勞動合同范本
- 2024軟件開發(fā)合同標(biāo)準(zhǔn)模板
- 小區(qū)車庫廣告位租賃合同
- 產(chǎn)品臨時借用協(xié)議
- 建筑業(yè)勞動合同:退休政策改革與規(guī)范
- 歷史文化遺產(chǎn)保護(hù)拆遷合同
- 農(nóng)業(yè)項(xiàng)目合作書參考
- 坐標(biāo)紙(網(wǎng)格型坐標(biāo)紙-直接打印即可)
- GB/T 39633-2020協(xié)作機(jī)器人用一體式伺服電動機(jī)系統(tǒng)通用規(guī)范
- FZ/T 01002-2010印染企業(yè)綜合能耗計算辦法及基本定額
- 藥品儲備評估表
- 國家自然科學(xué)基金申請經(jīng)驗(yàn)匯總課件
- 青春期女孩自尊自愛課件
- 2023年西藏開發(fā)投資集團(tuán)有限公司招聘筆試題庫及答案解析
- 小學(xué)語文人教三年級上冊觀察桔子孫娟課件
- 藏族人的名字標(biāo)準(zhǔn)英語翻譯
- 市場營銷產(chǎn)品組合與產(chǎn)品策略課件
- 醫(yī)院會計實(shí)務(wù)操作培訓(xùn)課件
評論
0/150
提交評論