版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘算法及軟件介紹第一頁,共四十六頁,編輯于2023年,星期三Page2主要內(nèi)容一、數(shù)據(jù)挖掘概念及流程二、數(shù)據(jù)挖掘方法分類介紹
二-1、分類算法及案例二-2、聚類分析及案例二-3、關(guān)聯(lián)規(guī)則及案例二-4、時(shí)間序列分析及案例二-5、回歸分析及案例二-6、異常分析及案例二-7、文本挖掘二-8、推薦系統(tǒng)三、常用數(shù)據(jù)挖掘軟件介紹四:數(shù)據(jù)挖掘和分析應(yīng)避免的誤區(qū)誤區(qū)第二頁,共四十六頁,編輯于2023年,星期三Page3一、數(shù)據(jù)挖掘概念及流程數(shù)據(jù)挖掘(DataMining)就是對(duì)觀測(cè)到的數(shù)據(jù)集(經(jīng)常是龐大的、不完全的、有噪聲的、模糊的、隨機(jī)的)進(jìn)行分析,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí),目的是發(fā)現(xiàn)未知的關(guān)系和以數(shù)據(jù)擁有者可以理解并對(duì)其有價(jià)值的新穎方式來總結(jié)數(shù)據(jù)。第三頁,共四十六頁,編輯于2023年,星期三數(shù)據(jù)清理篩選數(shù)據(jù)目標(biāo)數(shù)據(jù)預(yù)處理及變換變換后的數(shù)據(jù)數(shù)據(jù)挖掘解釋/評(píng)估一、數(shù)據(jù)挖掘概念及流程Page4第四頁,共四十六頁,編輯于2023年,星期三二:數(shù)據(jù)挖掘方法分類介紹數(shù)據(jù)挖掘聚類分析預(yù)測(cè)K-meansK-中心點(diǎn)算法分類分析KNN算法Bayes算法時(shí)間序列統(tǒng)計(jì)回歸分類算法決策樹神經(jīng)網(wǎng)絡(luò)相關(guān)性分析回歸分析關(guān)聯(lián)規(guī)則Apriori算法線性回歸邏輯回歸序列模式挖掘異常分析非時(shí)間序列SLIQC4.5CARTCHAID概率回歸統(tǒng)計(jì)分析方差、極差、偏度等統(tǒng)計(jì)特征值異常點(diǎn)分析Page5時(shí)間序列決策樹算法第五頁,共四十六頁,編輯于2023年,星期三Page6挖掘模式預(yù)測(cè)型(Predictive)描述型(Descriptive)實(shí)際功能分為以下幾種模式:分類:對(duì)沒有分類的數(shù)據(jù)進(jìn)行分類;預(yù)測(cè):用歷史來預(yù)測(cè)未來;關(guān)聯(lián)分析:關(guān)聯(lián)規(guī)則;聚類:物以類聚;序列模式:在多個(gè)數(shù)據(jù)序列中發(fā)現(xiàn)共同的行為模式;異常分析:從數(shù)據(jù)分析中發(fā)現(xiàn)異常情況。文本數(shù)據(jù)挖掘:從大量文字中尋找共性進(jìn)行分析。二:數(shù)據(jù)挖掘方法分類介紹第六頁,共四十六頁,編輯于2023年,星期三Page7二-1:分類算法及案例分析分類:
預(yù)測(cè)種類字段基于訓(xùn)練集形成一個(gè)模型,訓(xùn)練集中的類標(biāo)簽是已知的。使用該模型對(duì)新的數(shù)據(jù)進(jìn)行分類預(yù)測(cè):
對(duì)連續(xù)性字段進(jìn)行建模和預(yù)測(cè)。典型應(yīng)用信用評(píng)分DirectMarketing醫(yī)療診斷性用卡欺詐判斷第七頁,共四十六頁,編輯于2023年,星期三客戶ID年齡學(xué)歷是否有房是否結(jié)婚變量5變量6變量7……是否欺詐訓(xùn)練數(shù)據(jù)119中專無11230大學(xué)有00328高中有01測(cè)試數(shù)據(jù)440大學(xué)有10518中專無11633大學(xué)無11客戶ID年齡學(xué)歷是否有房是否結(jié)婚變量5變量6變量7……是否欺詐需要判斷的新數(shù)據(jù)727高中有0?848高中無1?934大學(xué)有1?需要的歷史數(shù)據(jù)表需要判斷的新業(yè)務(wù)數(shù)據(jù)表結(jié)論:可以得出ID為7的客戶卡屬于欺詐的可能性為90%,ID為8和9的客戶不是欺詐的可能性為95%。二-1:分類算法及案例分析Page8第八頁,共四十六頁,編輯于2023年,星期三二-1:分類算法及案例分析Page9年齡overcast學(xué)歷?是否結(jié)婚?010118<=2230-351001023-30決策樹第九頁,共四十六頁,編輯于2023年,星期三結(jié)論規(guī)則:第一類:年齡在18-35歲之間,學(xué)歷是高中,還沒有住房的人群,可能發(fā)生信用卡欺詐的概率是97%.第二類:年齡在23-45歲之間,學(xué)歷是本科,有住房的人群,可能發(fā)生信用卡欺詐的概率是1%.第三類:年齡在30-55歲之間,學(xué)歷是小學(xué),無住房的人群,可能發(fā)生信用卡欺詐的概率是80%.
根據(jù)規(guī)則去執(zhí)行相應(yīng)的措施和政策方針:一:第一類和第三類人群,不通過信用卡審批或者降低信用卡額度,增加調(diào)查力度。二:信用卡用戶的營銷策略,按使用情況和年限增加額度.業(yè)務(wù)主要針對(duì)此類人群宣傳或者增加第二類信用卡用戶的比率。
二-1:分類算法及案例分析Page10第十頁,共四十六頁,編輯于2023年,星期三
行業(yè)應(yīng)用:1)城市綜合環(huán)境質(zhì)量評(píng)價(jià)2)保險(xiǎn)、醫(yī)療、信用卡等等反欺詐模型3)客戶、企業(yè)信用評(píng)級(jí)模型4)公安犯罪預(yù)警預(yù)測(cè)5)氣候分類、農(nóng)業(yè)區(qū)劃、土地類型劃分中有著廣泛的應(yīng)用二-1:分類算法及案例分析Page11第十一頁,共四十六頁,編輯于2023年,星期三Page12二-2:聚類分析及案例簇(Cluster):一個(gè)數(shù)據(jù)對(duì)象的集合聚類分析把一個(gè)給定的數(shù)據(jù)對(duì)象集合分成不同的簇;在同一個(gè)簇(或類)中,對(duì)象之間具有相似性;不同簇(或類)的對(duì)象之間是相異的。聚類是一種無監(jiān)督分類法:沒有預(yù)先指定的類別;典型的應(yīng)用作為一個(gè)獨(dú)立的分析工具,用于了解數(shù)據(jù)的分布;聚類之后分析異常數(shù)據(jù);作為其它算法的一個(gè)數(shù)據(jù)預(yù)處理步驟;第十二頁,共四十六頁,編輯于2023年,星期三Page13二-2:聚類分析及案例聚類方法也常用于進(jìn)行異常數(shù)據(jù)鑒別。第十三頁,共四十六頁,編輯于2023年,星期三Page14二-2:聚類分析及案例案例背景
隨著現(xiàn)代人力資源管理理論的迅速發(fā)展,績(jī)效考評(píng)技術(shù)水平也在不斷提高???jī)效的多因性、多維性,要求對(duì)績(jī)效實(shí)施多標(biāo)準(zhǔn)大樣本科學(xué)有效的評(píng)價(jià)。對(duì)企業(yè)來說,對(duì)上千人進(jìn)行多達(dá)50~60個(gè)標(biāo)準(zhǔn)的考核是很常見的現(xiàn)象。但是,目前多標(biāo)準(zhǔn)大樣本大型企業(yè)績(jī)效考評(píng)問題仍然困擾著許多人力資源管理從業(yè)人員。本案例將列舉某企業(yè)的具體情況確定適當(dāng)?shù)目己藰?biāo)準(zhǔn),采用主成分分析以及聚類分析方法,比較出各員工績(jī)效水平,從而為企業(yè)績(jī)效管理提供一定的科學(xué)依據(jù)。第十四頁,共四十六頁,編輯于2023年,星期三Page15二-2:聚類分析及案例職工代號(hào)工作產(chǎn)量工作質(zhì)量工作出勤工砟損耗工作態(tài)度工作能力19.689.628.378.639.869.7428.098.839.389.799.989.7337.468.736.745.598.838.4646.088.255.045.928.338.2956.618.366.677.468.388.1467.698.856.447.458.198.177.468.935.77.068.588.3687.69.286.758.038.688.2297.68.267.57.638.797.63107.168.625.727.118.198.18116.048.173.958.088.248.65126.277.9434.527.167.81136.618.54.345.618.528.36147.398.445.925.378.837.47157.838.793.855.358.588.03167.368.535.397.098.238.04177.248.614.693.989.048.07186.498.034.567.188.548.57195.437.674.223.878.417.6204.577.42.963.028.747.97216.438.384.874.878.788.37225.887.893.876.348.378.19233.946.912.976.778.178.16244.827.33.075.876.326.01254.027.262.285.639.669.07263.876.962.794.925.326.23274.157.51.564.818.448.38284.997.522.116.238.38.14表——某企業(yè)28位職工績(jī)效考評(píng)結(jié)果第十五頁,共四十六頁,編輯于2023年,星期三Page16二-2:聚類分析及案例聚類分析結(jié)論:表中可以看到第一類別的樣本的工作績(jī)效成績(jī)得分最高,其次是第二類別、第三類別,得分最低的是第四類別,因此,根據(jù)我們可以把最終的分類結(jié)果和計(jì)劃分類結(jié)合起來,即:(1)“優(yōu)秀”為第一類,包括職工1、2;(2)“良好”為第二類,包括職工3、4、5、6、7、8、9、10、11、13、14、15、16、17、18、21、22;(3)“及格”為第三類,包括職工12、19、20、23、25、27、28;(4)“不及格”為第四類,包括職工24、26。決策建議:1、針對(duì)不同的員工決定績(jī)效工資、獎(jiǎng)金等。2、針對(duì)不同的員工類別安排不同性質(zhì)的工作。注釋:數(shù)據(jù)挖據(jù)方法經(jīng)?;旌鲜褂?,比如這里先進(jìn)行聚類分析,得出了員工績(jī)效判別的4種方式,然后新進(jìn)員工績(jī)效考核則可以在此基礎(chǔ)上進(jìn)行分類分析,判別此員工屬于哪一類型。第十六頁,共四十六頁,編輯于2023年,星期三Page17二-2:聚類分析及案例零售業(yè)將經(jīng)常同時(shí)購買的數(shù)據(jù)項(xiàng)聚類到一起有利于改善商品的布置,提高銷售利潤(rùn)。將具有相似的購買模式的顧客聚類到一起,分析每一類顧客的特征,有利于對(duì)特定的顧客群進(jìn)行特定商品的宣傳和銷售保險(xiǎn)對(duì)購買了汽車保險(xiǎn)的客戶,標(biāo)識(shí)那些有較高平均賠償成本的客戶;醫(yī)療分析對(duì)一組新型疾病聚類,得到每類疾病的特征描述,一些特定的癥狀的聚集可能預(yù)示一個(gè)特定的疾病分類。城市規(guī)劃-根據(jù)類型、價(jià)格、地理位置等來劃分不同類型的住宅;傳統(tǒng)制造業(yè)-成本控制社保行業(yè)中如:1、具有什么樣特征的人群醫(yī)療欺詐的幾率大?然后應(yīng)該怎么樣制定政策去應(yīng)對(duì)此類人群?2、具有什么樣特征的人群醫(yī)療費(fèi)用高,高多少?然后制定什么樣的政策去降低醫(yī)療費(fèi)用高的人群的自費(fèi)負(fù)擔(dān)?比如當(dāng)前的55歲以上人群的醫(yī)保個(gè)人賬戶劃入比例是55歲以下的高,這個(gè)年齡間隔的判斷依據(jù)就是分群的分類。
第十七頁,共四十六頁,編輯于2023年,星期三二-3:關(guān)聯(lián)規(guī)則及案例Page18關(guān)聯(lián)規(guī)則挖掘:在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性、或因果結(jié)構(gòu)。應(yīng)用:購物籃分析、交叉銷售、產(chǎn)品目錄設(shè)計(jì)、賠本銷售分析(loss-leaderanalysis)、聚集、分類等。舉例:規(guī)則形式:“Body?Head[support,confidence]”.buys(x,“diapers”)?buys(x,“beers”)[0.5%,60%]major(x,“CS”)^takes(x,“DB”)?grade(x,“A”)[1%,75%]第十八頁,共四十六頁,編輯于2023年,星期三二-3:關(guān)聯(lián)規(guī)則及案例
沃爾瑪現(xiàn)有五種商品的交易記錄表,用關(guān)聯(lián)分析方法試找出三種商品關(guān)聯(lián)銷售情況,最小支持度>=50%。Page19買尿布的客戶二者都買的客戶買啤酒的客戶第十九頁,共四十六頁,編輯于2023年,星期三二-3:關(guān)聯(lián)規(guī)則及案例算法結(jié)論:第一類:30%的人群同時(shí)購買了牛奶,礦泉水和筆;第二類:20%的人群同時(shí)買了尿布、啤酒;而在買尿布的人群中40%的人同時(shí)買了啤酒。業(yè)務(wù)調(diào)查和分析:1、第一類不合理。牛奶和礦泉水本身都屬于飲品類,功能不同,給消費(fèi)者的感受也不同,當(dāng)需求不同時(shí),買礦泉水的人可能不會(huì)再去買牛奶,因?yàn)榈V泉水比牛奶更能達(dá)到解渴的效果。2、按常規(guī)思維,尿布與啤酒風(fēng)馬牛不相及,產(chǎn)生這一現(xiàn)象的原因是:美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而他們中有30%到40%的人同時(shí)也為自己買一些啤酒。決策建議:把啤酒和尿布放在靠近的位置出售,達(dá)到的效果:此后兩者的銷售額都提高了2-3倍。Page20第二十頁,共四十六頁,編輯于2023年,星期三二-3:關(guān)聯(lián)規(guī)則及案例行業(yè)案例:1)超市產(chǎn)品組合分析(產(chǎn)品的互相擺放和針對(duì)性銷售);2)讀者行為分析,書籍推薦(如互聯(lián)網(wǎng)京東、淘寶上的各種產(chǎn)品的推薦);3)保險(xiǎn)行業(yè)的保險(xiǎn)產(chǎn)品推薦。Page21第二十一頁,共四十六頁,編輯于2023年,星期三二-4:時(shí)間序列分析及案例
時(shí)間序列分析:描述時(shí)間序列數(shù)據(jù)隨時(shí)間變化的數(shù)據(jù)的規(guī)律或趨勢(shì),并對(duì)其建模。包括時(shí)間序列趨勢(shì)分析、周期模式匹配等。例如:通過對(duì)交易數(shù)據(jù)的演變分析,可能會(huì)得到"89%情況股票X上漲一周左右后,股票Y會(huì)上漲"這樣一條序列知識(shí)。歷史往往是重復(fù)過去的故事加上一定的變化規(guī)律。應(yīng)用場(chǎng)景:預(yù)測(cè)未來。Page22第二十二頁,共四十六頁,編輯于2023年,星期三一次指數(shù)平滑
(例題分析)Page23一次指數(shù)平滑
(例題分析)第二十三頁,共四十六頁,編輯于2023年,星期三二-4:時(shí)間序列分析及案例案例:某企業(yè)1992年~2006年的銷售收入時(shí)間序列如下表所示.試用時(shí)間序列算法預(yù)測(cè)2008年的銷售收入,并計(jì)算預(yù)測(cè)的標(biāo)準(zhǔn)誤差。
時(shí)間
19921994199619982000200220042006銷售收入(萬元)50000.860574.687306.9120649.8139241153772201816231892.7Page24第二十四頁,共四十六頁,編輯于2023年,星期三二-4:時(shí)間序列分析及案例
結(jié)論:2008年的預(yù)測(cè)值為261840萬元,公司可以根據(jù)預(yù)測(cè)收入來進(jìn)行下一年政策的調(diào)整和各種財(cái)務(wù)預(yù)算的調(diào)整工作。Page25第二十五頁,共四十六頁,編輯于2023年,星期三二-4:時(shí)間序列分析及案例行業(yè)案例:可用于任何行業(yè)時(shí)間序列數(shù)據(jù)。各種保險(xiǎn)基金收支結(jié)的預(yù)測(cè)股票價(jià)格和波動(dòng)預(yù)測(cè)廠家的材料、成本、銷售額等預(yù)測(cè)航班旅客成行率的預(yù)測(cè)中國年底總?cè)丝陬A(yù)測(cè)中國城鎮(zhèn)人口預(yù)測(cè)中國GDP的預(yù)測(cè)(不變價(jià)格)中國航空運(yùn)輸年度總周轉(zhuǎn)量的預(yù)測(cè)中國航空運(yùn)輸月度總周轉(zhuǎn)量的預(yù)測(cè)Page26第二十六頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例Page27
回歸分析是對(duì)具有因果關(guān)系的影響因素(自變量)和預(yù)測(cè)對(duì)象(因變量)所進(jìn)行的數(shù)理統(tǒng)計(jì)分析處理。第二十七頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例Page28第二十八頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例Page29算法結(jié)果:物流人才需求量=-28+25*職工總?cè)藬?shù)結(jié)論:只要知道當(dāng)?shù)芈毠た側(cè)藬?shù),則可以估算出當(dāng)?shù)厮枰奈锪魅瞬牛愃频娜缧枰嗌俟珓?wù)人員,需要多少社保管理人員,需要多少警察等)。社保方面:類似醫(yī)療保險(xiǎn)總費(fèi)用和當(dāng)?shù)厝丝谥g的關(guān)系,各類社保基金收入和當(dāng)?shù)亟?jīng)濟(jì)情況之間的關(guān)系等等。第二十九頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例案例描述:消費(fèi)是宏觀經(jīng)濟(jì)必不可少的環(huán)節(jié),完善消費(fèi)模型可以為宏觀調(diào)控提供重要的依據(jù)。下面給出了我國20年的人均消費(fèi)性支出、人均現(xiàn)金收入和人均實(shí)物收入的數(shù)據(jù),對(duì)其三者之間的關(guān)系可以利用回歸的方法進(jìn)行分析研究。Page30第三十頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例Page31第三十一頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例
模型結(jié)論:在人均實(shí)物收入不變的情況下每增加1元人均現(xiàn)金收入,則人均消費(fèi)支出將增加0.5762元,人均實(shí)物收入同理增長(zhǎng)方式。這樣的話如果有當(dāng)?shù)厝司F(xiàn)金收入和人均實(shí)物收入的數(shù)據(jù)就可以估算人均消費(fèi)性支出。
Page32通過一定的算法使用歷史數(shù)據(jù)得出模型結(jié)果為:
第三十二頁,共四十六頁,編輯于2023年,星期三二-5:回歸分析及案例實(shí)用案例:1、城市居民家庭人均可支配收入與儲(chǔ)蓄存款關(guān)系的分析;2、鑄造廠產(chǎn)品成本分析;3、個(gè)人所得稅和GDP的關(guān)系分析;4、居民家庭教育支出和消費(fèi)性支出之間的關(guān)系。Page33第三十三頁,共四十六頁,編輯于2023年,星期三二-6:異常分析及案例
異常分析:異常值outlier:一組測(cè)定值中與平均值的偏差超過兩倍標(biāo)準(zhǔn)差的測(cè)定值。與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測(cè)定值,稱為高度異常的異常值。對(duì)某些行業(yè)來說,異常數(shù)據(jù)反而有比較高的分析價(jià)值,針對(duì)異常數(shù)據(jù)分析出原因,可以更好的制定策略和方針。比如金融行業(yè)的金融欺詐、信用卡欺詐,保險(xiǎn)行業(yè)的保險(xiǎn)欺詐、警察部門的犯罪嫌疑人甄別等等。
異常數(shù)據(jù)挖掘的核心在于合理描述異常的類型,并用算法精確描述;比如異常類型包括:數(shù)值過大或過小、數(shù)值頻率太高或太小、行為異常(欺詐)等等。Page34第三十四頁,共四十六頁,編輯于2023年,星期三二-6:異常分析及案例Page35第三十五頁,共四十六頁,編輯于2023年,星期三通過異常值判別法得到表2,再經(jīng)過關(guān)聯(lián)分析得出表4的結(jié)果。結(jié)論:TCH話務(wù)高一定導(dǎo)致SDCCH話務(wù)高,但是SDCCH話務(wù)高,TCH話務(wù)量卻不一定高。這與實(shí)際相符。目的:找出異常數(shù)據(jù),分析異常數(shù)據(jù)的產(chǎn)生原因,以此進(jìn)行相關(guān)業(yè)務(wù)政策調(diào)整。二-6:異常分析及案例Page36第三十六頁,共四十六頁,編輯于2023年,星期三行業(yè)案例:1、電信、保險(xiǎn)、銀行中的欺詐檢測(cè)與風(fēng)險(xiǎn)分析2、發(fā)現(xiàn)電子商務(wù)中的犯罪行為3、災(zāi)害氣象預(yù)報(bào)4、稅務(wù)局分析不同團(tuán)體交所得稅的記錄,發(fā)現(xiàn)異常模型和趨勢(shì)6、海關(guān)、民航等安檢部門推斷哪些人可能有嫌疑7、7、海關(guān)報(bào)關(guān)中的價(jià)格隱瞞8、營銷定制:分析花費(fèi)較小和較高顧客的消費(fèi)行為9、醫(yī)學(xué)研究中發(fā)現(xiàn)醫(yī)療方案或藥品所產(chǎn)生的異常反應(yīng)10、計(jì)算機(jī)中的入侵檢測(cè)11、運(yùn)動(dòng)員的成績(jī)分析二-6:異常分析及案例Page37第三十七頁,共四十六頁,編輯于2023年,星期三文本數(shù)據(jù)挖掘(TextMining)是指從文本(文字)數(shù)據(jù)中抽取有價(jià)值的信息和知識(shí)的計(jì)算機(jī)處理技術(shù)。應(yīng)用1、基于內(nèi)容的搜索引擎,代表性的系統(tǒng)有百度、google、北京大學(xué)天網(wǎng)、京東、淘寶等。2、信息自動(dòng)分類,比如智多星中文文本分類。3、自動(dòng)問答、機(jī)器翻譯。4、文本分析已經(jīng)涉足到醫(yī)療、輿情、金融等方面。二-7:文本挖掘Page38第三十八頁,共四十六頁,編輯于2023年,星期三推薦算法的本質(zhì)是通過一定的方式將用戶和物品聯(lián)系起來,從而有效的給用戶推薦本身感興趣或需要但是沒有發(fā)現(xiàn)的物品。個(gè)性化推薦系統(tǒng)的應(yīng)用場(chǎng)景:電子商務(wù)(據(jù)說Amazon35%的銷售額來自推薦系統(tǒng))、電影和視頻網(wǎng)站、個(gè)性化音樂網(wǎng)絡(luò)電臺(tái)、社交網(wǎng)絡(luò)、個(gè)性化閱讀、基于位置的服務(wù)、個(gè)性化郵件、個(gè)性化廣告(上下文廣告、搜索廣告、個(gè)性化展示廣告)。二-8:推薦系統(tǒng)Page39第三十九頁,共四十六頁,編輯于2023年,星期三三:常用數(shù)據(jù)挖掘工具Page40右側(cè)是2012年數(shù)據(jù)挖掘工具排行,值得注意的是,今年排名前五名的數(shù)據(jù)挖掘工具中有四個(gè)是開源軟件。此外R還擊敗SQL和Java,在最受歡迎的數(shù)據(jù)挖掘應(yīng)用編程語言排行榜中排名第一。第四十頁,共四十六頁,編輯于2023年,星期三三:常用數(shù)據(jù)挖掘工具Page41優(yōu)點(diǎn)缺點(diǎn)數(shù)據(jù)量典型行業(yè)R免費(fèi)開源、功能強(qiáng)大,擴(kuò)展性強(qiáng)。很多人為了方便會(huì)寫些R包,很多R包的正確性和效率難以保證;數(shù)據(jù)量大速度慢。由于包更新多,要精通R難。小、中、大(比較麻煩)金融、互聯(lián)網(wǎng)、網(wǎng)游SPSS傻瓜式操作,入門容易,可視化好。功能無法滿足行業(yè)特殊要求、不適合嵌入別的軟件產(chǎn)品、費(fèi)用高小銀行、金融、政府SAS功能強(qiáng)大,可信度高。費(fèi)用超高,入門和精通難大銀行、金融Matlab功能強(qiáng)大,速度快,精度高,主用于研究。費(fèi)用高中學(xué)校、研究所、金融第四十一頁,共四十六頁,編輯于2023年,星期三三:常用數(shù)據(jù)挖掘工具Page42
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 滬科版八年級(jí)數(shù)學(xué)上冊(cè)專項(xiàng)素養(yǎng)綜合練(十)等腰三角形中作輔助線的六種常用方法課件
- 北師大版八年級(jí)生物上冊(cè)第5單元生物圈中的動(dòng)物和微生物第15章動(dòng)物的運(yùn)動(dòng)第2節(jié)第1課時(shí)骨和骨連結(jié)課件
- 七年級(jí)三種時(shí)態(tài)語法練習(xí)modification
- 部編版五年級(jí)上冊(cè)語文期中綜合檢測(cè)
- 五年級(jí)的品德與社會(huì)教育課件
- 2024年四川省安全員B證考試題庫附答案
- 管理會(huì)計(jì)與財(cái)務(wù)會(huì)計(jì)
- 河沙碎石采購合同模板
- 第一課件教學(xué)網(wǎng)
- 租賃公租房合同模板
- 小區(qū)突發(fā)事件應(yīng)急預(yù)案處理方案
- 高三家長(zhǎng)會(huì)班主任發(fā)言稿
- 繪畫心理學(xué)課件
- 國殤-完整版獲獎(jiǎng)?wù)n件
- 血管瘤和脈管畸形課件
- 消防栓月點(diǎn)檢表
- 關(guān)于職業(yè)技能鑒定成績(jī)復(fù)核的管理規(guī)定
- 部編版《蜀道難》課件(61張)
- 抖音公會(huì)掛靠合作協(xié)議(法務(wù)審核最新版)
- 湘教版七年級(jí)上冊(cè)數(shù)學(xué)教學(xué)課件3.1 建立一元一次方程模型
- cs6200系列萬兆路由交換機(jī)安裝手冊(cè)
評(píng)論
0/150
提交評(píng)論