《數(shù)據(jù)挖掘》之分類和預(yù)測(cè)_第1頁(yè)
《數(shù)據(jù)挖掘》之分類和預(yù)測(cè)_第2頁(yè)
《數(shù)據(jù)挖掘》之分類和預(yù)測(cè)_第3頁(yè)
《數(shù)據(jù)挖掘》之分類和預(yù)測(cè)_第4頁(yè)
《數(shù)據(jù)挖掘》之分類和預(yù)測(cè)_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分類和預(yù)測(cè)分類VS.預(yù)測(cè)分類和預(yù)測(cè)是兩種數(shù)據(jù)分析形式,用于提取描述重要數(shù)據(jù)類或預(yù)測(cè)未來的數(shù)據(jù)趨勢(shì)的模型分類:預(yù)測(cè)類對(duì)象的分類標(biāo)號(hào)(或離散值)根據(jù)訓(xùn)練數(shù)據(jù)集和類標(biāo)號(hào)屬性,構(gòu)建模型來分類現(xiàn)有數(shù)據(jù),并用來分類新數(shù)據(jù)預(yù)測(cè):建立連續(xù)函數(shù)值模型比如預(yù)測(cè)空缺值,或者預(yù)測(cè)顧客在計(jì)算機(jī)設(shè)備上的花費(fèi)典型應(yīng)用欺詐檢測(cè)、市場(chǎng)定位、性能預(yù)測(cè)、醫(yī)療診斷分類和預(yù)測(cè)---示例分類銀行貸款員需要分析數(shù)據(jù),來弄清哪些貸款申請(qǐng)者是安全的,哪些是有風(fēng)險(xiǎn)的(將貸款申請(qǐng)者分為“安全”和“有風(fēng)險(xiǎn)”兩類)我們需要構(gòu)造一個(gè)分類器來預(yù)測(cè)類屬編號(hào),比如預(yù)測(cè)顧客屬類預(yù)測(cè)銀行貸款員需要預(yù)測(cè)貸給某個(gè)顧客多少錢是安全的構(gòu)造一個(gè)預(yù)測(cè)器,預(yù)測(cè)一個(gè)連續(xù)值函數(shù)或有序值,常用方法是回歸分析數(shù)據(jù)分類——一個(gè)兩步過程(1)第一步,也成為學(xué)習(xí)步,目標(biāo)是建立描述預(yù)先定義的數(shù)據(jù)類或概念集的分類器分類算法通過分析或從訓(xùn)練集“學(xué)習(xí)”來構(gòu)造分類器。訓(xùn)練集由數(shù)據(jù)庫(kù)元組(用n維屬性向量表示)和他們相對(duì)應(yīng)的類編號(hào)組成;假定每個(gè)元組屬于一個(gè)預(yù)定義的類訓(xùn)練元組:訓(xùn)練數(shù)據(jù)集中的單個(gè)元組學(xué)習(xí)模型可以用分類規(guī)則、決策樹或數(shù)學(xué)公式的形式提供數(shù)據(jù)分類——一個(gè)兩步過程(2)第二步,使用模型,對(duì)將來的或未知的對(duì)象進(jìn)行分類首先評(píng)估模型的預(yù)測(cè)準(zhǔn)確率對(duì)每個(gè)測(cè)試樣本,將已知的類標(biāo)號(hào)和該樣本的學(xué)習(xí)模型類預(yù)測(cè)比較模型在給定測(cè)試集上的準(zhǔn)確率是正確被模型分類的測(cè)試樣本的百分比測(cè)試集要獨(dú)立于訓(xùn)練樣本集,否則會(huì)出現(xiàn)“過分?jǐn)M合”的情況第一步——建立模型訓(xùn)練數(shù)據(jù)集分類算法IFrank=‘professor’ORyears>6THENtenured=‘yes’分類規(guī)則第二步——用模型進(jìn)行分類分類規(guī)則測(cè)試集未知數(shù)據(jù)(Jeff,Professor,4)Tenured?監(jiān)督學(xué)習(xí)VS.無監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)(用于分類)模型的學(xué)習(xí)在被告知每個(gè)訓(xùn)練樣本屬于哪個(gè)類的“指導(dǎo)”下進(jìn)行新數(shù)據(jù)使用訓(xùn)練數(shù)據(jù)集中得到的規(guī)則進(jìn)行分類無監(jiān)督學(xué)習(xí)(用于聚類)每個(gè)訓(xùn)練樣本的類編號(hào)是未知的,要學(xué)習(xí)的類集合或數(shù)量也可能是事先未知的通過一系列的度量、觀察來建立數(shù)據(jù)中的類編號(hào)或進(jìn)行聚類數(shù)據(jù)預(yù)測(cè)的兩步過程數(shù)據(jù)預(yù)測(cè)也是一個(gè)兩步的過程,類似于前面描述的數(shù)據(jù)分類對(duì)于預(yù)測(cè),沒有“類標(biāo)號(hào)屬性”要預(yù)測(cè)的屬性是連續(xù)值,而不是離散值,該屬性可簡(jiǎn)稱“預(yù)測(cè)屬性”E.g.銀行貸款員需要預(yù)測(cè)貸給某個(gè)顧客多少錢是安全的預(yù)測(cè)器可以看作一個(gè)映射或函數(shù)y=f(X)其中X是輸入;y是輸出,是一個(gè)連續(xù)或有序的值與分類類似,準(zhǔn)確率的預(yù)測(cè),也要使用單獨(dú)的測(cè)試集準(zhǔn)備分類和預(yù)測(cè)的數(shù)據(jù)通過對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,可以提高分類和預(yù)測(cè)過程的準(zhǔn)確性、有效性和可伸縮性數(shù)據(jù)清理消除或減少噪聲,處理空缺值,從而減少學(xué)習(xí)時(shí)的混亂相關(guān)分析數(shù)據(jù)中的有些屬性可能與當(dāng)前任務(wù)不相關(guān);也有些屬性可能是冗余的;刪除這些屬性可以加快學(xué)習(xí)步驟,使學(xué)習(xí)結(jié)果更精確數(shù)據(jù)變換與歸約數(shù)據(jù)可以通過規(guī)范化進(jìn)行變換,將所給屬性的所有值按比例進(jìn)行縮放,使其落入一個(gè)較小的指定區(qū)間,例[0.0,1.0](ANN和設(shè)計(jì)距離的度量方法中常用)可以將數(shù)據(jù)概化到較高層概念比較較分分類類方方法法使用用下下列列標(biāo)標(biāo)準(zhǔn)準(zhǔn)比比較較分分類類和和預(yù)預(yù)測(cè)測(cè)方方法法預(yù)測(cè)測(cè)的的準(zhǔn)準(zhǔn)確確率率::模模型型正正確確預(yù)預(yù)測(cè)測(cè)新新數(shù)數(shù)據(jù)據(jù)的的類類編編號(hào)號(hào)的的能能力力速度度::產(chǎn)產(chǎn)生生和和使使用用模模型型的的計(jì)計(jì)算算花花銷銷健壯壯性性::給給定定噪噪聲聲數(shù)數(shù)據(jù)據(jù)或或有有空空缺缺值值的的數(shù)數(shù)據(jù)據(jù),,模模型型正正確確預(yù)預(yù)測(cè)測(cè)的的能能力力可伸伸縮縮性性::對(duì)對(duì)大大量量數(shù)數(shù)據(jù)據(jù),,有有效效的的構(gòu)構(gòu)建建分分類類器器或或預(yù)預(yù)測(cè)測(cè)器器的的能能力力可解解釋釋性性::學(xué)學(xué)習(xí)習(xí)模模型型提提供供的的理理解解和和洞洞察察的的層層次次用決決策策樹樹歸歸納納分分類類(1)什么么是是決決策策樹樹??類似似于于流流程程圖圖的的樹樹結(jié)結(jié)構(gòu)構(gòu)每個(gè)個(gè)內(nèi)內(nèi)部部節(jié)節(jié)點(diǎn)點(diǎn)表表示示在在一一個(gè)個(gè)屬屬性性上上的的測(cè)測(cè)試試每個(gè)個(gè)分分枝枝代代表表一一個(gè)個(gè)測(cè)測(cè)試試輸輸出出每個(gè)個(gè)樹樹葉葉節(jié)節(jié)點(diǎn)點(diǎn)存存放放一一個(gè)個(gè)類類編編號(hào)號(hào)age?student?creditrating?noyesfairexcellentyouthseniornonoyesyesyesMiddleaged決策策樹樹::Buys_computer用決決策策樹樹歸歸納納分分類類(2)使用用決決策策樹樹分分類類給定定一一個(gè)個(gè)類類標(biāo)標(biāo)號(hào)號(hào)未未知知的的元元組組X,在在決決策策樹樹上上測(cè)測(cè)試試元元組組的的屬屬性性值值,,跟跟蹤蹤一一條條由由根根到到葉葉節(jié)節(jié)點(diǎn)點(diǎn)的的路路徑徑,,葉葉節(jié)節(jié)點(diǎn)點(diǎn)存存放放該該元元組組的的類類預(yù)預(yù)測(cè)測(cè)。。決策策樹樹容容易易轉(zhuǎn)轉(zhuǎn)換換為為分分類類規(guī)規(guī)則則決策策樹樹的的生生成成由由兩兩個(gè)個(gè)階階段段組組成成決策策樹樹構(gòu)構(gòu)建建使用用屬屬性性選選擇擇度度量量來來選選擇擇將將元元組組最最好好的的劃劃分分為為不不同同的的類類的的屬屬性性遞歸歸的的通通過過選選定定的的屬屬性性,,來來劃劃分分樣樣本本((必必須須是是離離散散值值))樹剪剪枝枝決策策樹樹建建立立時(shí)時(shí),,許許多多分分枝枝反反映映的的是是訓(xùn)訓(xùn)練練數(shù)數(shù)據(jù)據(jù)中中的的噪噪聲聲和和離離群群點(diǎn)點(diǎn)點(diǎn)點(diǎn),,樹樹剪剪枝枝試試圖圖識(shí)識(shí)別別并并剪剪去去這這種種分分枝枝,,以以提提高高對(duì)對(duì)未未知知數(shù)數(shù)據(jù)據(jù)分分類類的的準(zhǔn)準(zhǔn)確確性性決策策樹樹歸歸納納策策略略(1)輸入入數(shù)據(jù)據(jù)劃劃分分D是訓(xùn)練元組和和對(duì)應(yīng)類標(biāo)號(hào)號(hào)的集合attribute_list,候選屬性的集集合Attribute_selection_method,指定選擇屬屬性的啟發(fā)性性過程算法步驟樹以代表訓(xùn)練練樣本的單個(gè)個(gè)節(jié)點(diǎn)(N)開始如果樣本都在在同一個(gè)類,,則該節(jié)點(diǎn)成成為樹葉,并并用該類標(biāo)記記否則,算法調(diào)調(diào)用Attribute_selection_method,選擇能夠最最好的將樣本本分類的屬性性;確定“分分裂準(zhǔn)則”,,指出“分裂裂點(diǎn)”或“分分裂子集”。。P189圖6-3決策樹歸納策策略(2)對(duì)測(cè)試屬性每每個(gè)已知的值值,創(chuàng)建一個(gè)個(gè)分支,并以以此劃分元組組算法使用同樣樣的過程,遞遞歸的形成每每個(gè)劃分上的的元組決策樹樹。一旦一個(gè)個(gè)屬性出現(xiàn)在在一個(gè)節(jié)點(diǎn)上上,就不在該該節(jié)點(diǎn)的任何何子節(jié)點(diǎn)上出出現(xiàn)遞歸劃分步驟驟停止的條件件劃分D(在N節(jié)點(diǎn)提供)的的所有元組屬屬于同一類沒有剩余屬性性可以用來進(jìn)進(jìn)一步劃分元元組——使用多數(shù)表決決沒有剩余的樣樣本給定分支沒有有元組,則以以D中多數(shù)類創(chuàng)建建一個(gè)樹葉P189圖6-3屬性選擇度量量屬性選擇度量量是一種選擇擇分裂準(zhǔn)則,,將給定類標(biāo)標(biāo)號(hào)的訓(xùn)練元元組最好的進(jìn)進(jìn)行劃分的方方法理想情況,每每個(gè)劃分都是是“純”的,,即落在給定定劃分內(nèi)的元元組都屬于相相同的類屬性選擇度量量又稱為分裂裂準(zhǔn)則常用的屬性選選擇度量信息增益增益率Gini指標(biāo)信息增益(1)S是一個(gè)訓(xùn)練樣本的集合,該樣樣本中每個(gè)集集合的類編號(hào)已知。每個(gè)樣樣本為一個(gè)元組。有個(gè)屬性用用來判定某個(gè)個(gè)訓(xùn)練樣本的的類編號(hào)假設(shè)S中有m個(gè)類,總共s個(gè)訓(xùn)練樣本,,每個(gè)類Ci有si個(gè)樣本(i=1,2,3...m),那么任意一一個(gè)樣本屬于于類Ci的概率是si/s,那么用來分分類一個(gè)給定定樣本的期望信息是:信息增益(2)一個(gè)有v個(gè)值的屬性A{a1,a2,...,av}可以將S分成v個(gè)子集{S1,S2,...,Sv},其中Sj包含S中屬性A上的值為aj的樣本。假設(shè)設(shè)Sj包含類Ci的sij個(gè)樣本。根據(jù)據(jù)A的這種劃分的的期望信息稱稱為A的熵A上該劃分的獲獲得的信息增增益定義為::具有高信息增增益的屬性,,是給定集合合中具有高區(qū)區(qū)分度的屬性性。所以可以以通過計(jì)算S中樣本的每個(gè)個(gè)屬性的信息息增益,來得得到一個(gè)屬性性的相關(guān)性的的排序。ageincomestudentcredit_ratingbuys_computeryouthhighnofairnoyouthhighnoexcellentnomiddle_agedhighnofairyesseniormediumnofairyesseniorlowyesfairyesseniorlowyesexcellentnomiddle_agedlowyesexcellentyesyouthmediumnofairnoyouthlowyesfairyesseniormediumyesfairyesyouthmediumyesexcellentyesmiddle_agedmediumnoexcellentyesmiddle_agedhighyesfairyesseniormediumnoexcellentno判定歸納樹算算法示例(1)對(duì)于上述數(shù)據(jù)據(jù),可以略過過步驟1,2步驟3,計(jì)算基于熵熵的度量——信息增益,作作為樣本劃分分的根據(jù)Gain(age)=0.246Gain(income)=0.029Gain(student)=0.151Gain(credit_rating)=0.048然后,對(duì)測(cè)試試屬性每個(gè)已已知的值,創(chuàng)創(chuàng)建一個(gè)分支支,并以此劃劃分樣本,得得到第一次劃劃分判定歸納樹算算法示例(2)判定歸納樹算算法示例(3)age?overcaststudent?creditrating?noyesfairexcellentyouthseniornonoyesyesyesMiddleaged防止分類中的的過分適應(yīng)產(chǎn)生的決策樹樹會(huì)出現(xiàn)過分分適應(yīng)數(shù)據(jù)的的問題由于數(shù)據(jù)中的的噪聲和孤立立點(diǎn),許多分分枝反應(yīng)的是是訓(xùn)練數(shù)據(jù)中中的異常對(duì)新樣本的判判定很不精確確防止過分適應(yīng)應(yīng)的兩種方法法先剪枝:通過過提前停止樹樹的構(gòu)造——如果在一個(gè)節(jié)節(jié)點(diǎn)劃分樣本本將導(dǎo)致低于于預(yù)定義臨界界值的分裂((e.g.使用信息增益益度量)選擇一個(gè)合適適的臨界值往往往很困難后剪枝:由““完全生長(zhǎng)””的樹剪去分分枝——對(duì)于樹中的每每個(gè)非樹葉節(jié)節(jié)點(diǎn),計(jì)算該該節(jié)點(diǎn)上的子子樹被剪枝可可能出現(xiàn)的期期望錯(cuò)誤率使用一個(gè)獨(dú)立立的測(cè)試集來來評(píng)估每顆樹樹的準(zhǔn)確率,,就能得到具具有最小期望望錯(cuò)誤率的決決策樹由決策樹提取取分類規(guī)則可以提取決策策樹表示的知知識(shí),并以IF-THEN形式的分類規(guī)規(guī)則表示對(duì)從根到樹葉葉的每條路徑徑創(chuàng)建一個(gè)規(guī)規(guī)則沿著給定路徑徑上的每個(gè)屬屬性-值對(duì)形成規(guī)則則前件("IF"部分)的一個(gè)個(gè)合取項(xiàng)葉節(jié)點(diǎn)包含類類預(yù)測(cè),形成成規(guī)則后件(("THEN"部分)IF-THEN規(guī)則易于理解解,尤其樹很很大時(shí)示例:IFage=“youth””ANDstudent=““no”THENbuys_computer=“no”IFage=“youth””ANDstudent=““yes””THENbuys_computer=“yes”IFage=“middle_aged”THENbuys_computer=““yes”IFage=““senior””ANDcredit_rating=““excellent””THENbuys_computer=““yes”IFage=““senior””ANDcredit_rating=““fair”THENbuys_computer=““no””可伸縮縮性與與決策策歸納納樹分類挖挖掘是是一個(gè)個(gè)在統(tǒng)統(tǒng)計(jì)學(xué)學(xué)和機(jī)機(jī)器學(xué)學(xué)習(xí)的的領(lǐng)域域也被被廣為為研究究的問問題,,并提提出了了很多多算法法,但但是這這些算算法都都是內(nèi)內(nèi)存駐駐留的的可伸縮縮性問問題::要求以以合理理的速速度對(duì)對(duì)數(shù)以以百萬萬計(jì)的的樣本本和數(shù)數(shù)以百百計(jì)的的屬性性的進(jìn)進(jìn)行分分類挖挖掘由大型型數(shù)據(jù)據(jù)庫(kù)構(gòu)構(gòu)造決決策樹樹首先將將樣本本劃分分為子子集,,每個(gè)個(gè)子集集可以以放在在內(nèi)存存中然后由由每個(gè)個(gè)自己己構(gòu)造造一顆顆決策策樹輸出的的分類類法將將每個(gè)個(gè)子集集的分分類法法組合合在一一起(其他他方法法包括括SLIQ,SPRINT,RainForest等等))貝葉斯斯分類類貝葉斯斯分類類利用用統(tǒng)計(jì)計(jì)學(xué)中中的貝貝葉斯斯定理理,來來預(yù)測(cè)測(cè)類成成員的的概率率,即即給定定一個(gè)個(gè)樣本本,計(jì)計(jì)算該該樣本本屬于于一個(gè)個(gè)特定定的類類的概概率。。樸素貝貝葉斯斯分類類:假假設(shè)每每個(gè)屬屬性之之間都都是相相互獨(dú)獨(dú)立的的,并并且每每個(gè)屬屬性對(duì)對(duì)非類類問題題產(chǎn)生生的影影響都都是一一樣的的。后向傳傳播分分類后向傳傳播是是一種種神經(jīng)經(jīng)網(wǎng)絡(luò)絡(luò)學(xué)習(xí)習(xí)算法法;神神經(jīng)網(wǎng)網(wǎng)絡(luò)是是一組組連接接的輸輸入/輸出單單元,,每個(gè)個(gè)連接接都與與一個(gè)個(gè)權(quán)相相連。。在學(xué)學(xué)習(xí)階階段,,通過過調(diào)整整神經(jīng)經(jīng)網(wǎng)絡(luò)絡(luò)的權(quán)權(quán),使使得能能夠預(yù)預(yù)測(cè)輸輸入樣樣本的的正確確標(biāo)號(hào)號(hào)來學(xué)學(xué)習(xí)。。優(yōu)點(diǎn)點(diǎn)預(yù)測(cè)測(cè)精精度度總總的的來來說說較較高高健壯壯性性好好,,訓(xùn)訓(xùn)練練樣樣本本中中包包含含錯(cuò)錯(cuò)誤誤時(shí)時(shí)也也可可正正常常工工作作輸出出可可能能是是離離散散值值、、連連續(xù)續(xù)值值或或者者是是離離散散或或量量化化屬屬性性的的向向量量值值對(duì)目目標(biāo)標(biāo)進(jìn)進(jìn)行行分分類類較較快快缺點(diǎn)點(diǎn)訓(xùn)練練((學(xué)學(xué)習(xí)習(xí)))時(shí)時(shí)間間長(zhǎng)長(zhǎng)蘊(yùn)涵涵在在學(xué)學(xué)習(xí)習(xí)的的權(quán)權(quán)中中的的符符號(hào)號(hào)含含義義很很難難理理解解很難難根根專專業(yè)業(yè)領(lǐng)領(lǐng)域域知知識(shí)識(shí)相相整整合合SVM——支支持持向向量量機(jī)機(jī)使用用一一種種非非線線性性的的映映射射,,將將原原訓(xùn)訓(xùn)練練數(shù)數(shù)據(jù)據(jù)映映射射到到較較高高的的維維一個(gè)個(gè)數(shù)數(shù)據(jù)據(jù)被被認(rèn)認(rèn)為為是是p維向向量量,,數(shù)數(shù)據(jù)據(jù)在在這這個(gè)個(gè)p維向向量量空空間間中中被被分分為為兩兩類類;;SVM的目目的的是是找找到到一一個(gè)個(gè)p-1維的的超超平平面面,,來來劃劃分分p維向向量量空空間間的的數(shù)數(shù)據(jù)據(jù)在新新的的維維上上,,它它搜搜索索線線性性最最佳佳分分離離超超平平面面(即將將一一類類的的元元組組與與其其他他類類分分離離的的““決決策策邊邊界界””)。使用用一一個(gè)個(gè)適適當(dāng)當(dāng)?shù)牡膶?duì)對(duì)足足夠夠高高維維的的非非線線性性映映射射,,兩兩類類的的數(shù)數(shù)據(jù)據(jù)總總可可以以被被超超平平面面分分開開。。SVM使用用支支持持向向量量((““基基本本””訓(xùn)訓(xùn)練練元元組組))和和邊邊緣緣((由由支支持持向向量量定定義義))發(fā)發(fā)現(xiàn)現(xiàn)該該超超平平面面。。SVM---特特點(diǎn)點(diǎn)和和應(yīng)應(yīng)用用特點(diǎn)點(diǎn):訓(xùn)練練時(shí)時(shí)間間非非常常長(zhǎng)長(zhǎng),,但但對(duì)對(duì)復(fù)復(fù)雜雜的的非非線線性性決決策策邊邊界界的的建建模模能能力力是是高高度度準(zhǔn)準(zhǔn)確確的的((使使用用最最大大邊邊緣緣))可以以用用來來預(yù)預(yù)測(cè)測(cè)和和分分類類應(yīng)用用:手寫寫數(shù)數(shù)字字識(shí)識(shí)別別,,對(duì)對(duì)象象識(shí)識(shí)別別,,語語音音識(shí)識(shí)別別,以及及基基準(zhǔn)準(zhǔn)時(shí)時(shí)間間序序列列預(yù)預(yù)測(cè)測(cè)檢檢驗(yàn)驗(yàn)SVM——一一般般原原理理支持向量小邊緣大邊緣06January2023DataMining:ConceptsandTechniques31SVM—當(dāng)數(shù)數(shù)據(jù)是線性可可分的時(shí)候m設(shè)給定的數(shù)據(jù)據(jù)集D為(X1,y1),…,(X|D|,y|D|),其中Xi是訓(xùn)練元組,,具有相關(guān)聯(lián)聯(lián)的類標(biāo)號(hào)yi??梢援嫵鰺o限限多條分離直直線(或超平平面)將類+1的元組與類-1的元組分開,,我們想找出出“最好的””那一條(對(duì)先前未見到到的元組具有有最小分類誤誤差的那一條條)。SVM要搜索具有最最大邊緣的超超平面,即最大邊緣超平平面(MMH)其他分類方法法k-最臨近分類給定一個(gè)未知知樣本,k-最臨近分類法法搜索模式空空間,找出最最接近未知樣樣本的k個(gè)訓(xùn)練樣本;;然后使用k個(gè)最臨近者中中最公共的類類來預(yù)測(cè)當(dāng)前前樣本的類標(biāo)標(biāo)號(hào)基于案例的推推理樣本或案例使使用復(fù)雜的符符號(hào)表示,對(duì)對(duì)于新案例,,先檢測(cè)是否否存在同樣的的訓(xùn)練案例;;如果找不到到,則搜索類類似的訓(xùn)練案案例遺傳算法結(jié)合生物進(jìn)化化思想的算法法粗糙集方法模糊集方法允許在分類規(guī)規(guī)則中定義““模糊的”臨臨界值或邊界界什么是預(yù)測(cè)??預(yù)測(cè)是構(gòu)造和和使用模型評(píng)評(píng)估無樣本類類,或評(píng)估給給定樣本可能能具有的屬性性或值空間。。預(yù)測(cè)和分類的的異同相同點(diǎn)兩者都需要構(gòu)構(gòu)建模型都用模型來估估計(jì)未知值預(yù)測(cè)當(dāng)中主要要的估計(jì)方法法是回歸分析析線性回歸和多多元回歸非線性回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論