《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》課件_第1頁(yè)
《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》課件_第2頁(yè)
《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》課件_第3頁(yè)
《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》課件_第4頁(yè)
《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》課件_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

課程簡(jiǎn)介歡迎來(lái)到《基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘》的課程簡(jiǎn)介。在接下來(lái)的28堂課中,我們將全面探討如何利用R語(yǔ)言進(jìn)行數(shù)據(jù)導(dǎo)入、預(yù)處理、分析和可視化,以及各種常用的統(tǒng)計(jì)模型和數(shù)據(jù)挖掘技術(shù)的應(yīng)用。thbytrtehttR語(yǔ)言簡(jiǎn)介1強(qiáng)大的統(tǒng)計(jì)分析工具R語(yǔ)言擅長(zhǎng)執(zhí)行各種統(tǒng)計(jì)分析和數(shù)據(jù)挖掘任務(wù)2開(kāi)源免費(fèi)R語(yǔ)言是開(kāi)源軟件,可以免費(fèi)使用和修改3易于學(xué)習(xí)R語(yǔ)言語(yǔ)法簡(jiǎn)單,上手快,適合初學(xué)者使用R語(yǔ)言是一種開(kāi)源的統(tǒng)計(jì)計(jì)算和圖形可視化軟件環(huán)境,廣泛應(yīng)用于數(shù)據(jù)分析、統(tǒng)計(jì)建模、機(jī)器學(xué)習(xí)等領(lǐng)域。它具有強(qiáng)大的統(tǒng)計(jì)分析功能、豐富的圖表繪制工具,并且使用開(kāi)源免費(fèi),易于學(xué)習(xí)上手,已成為數(shù)據(jù)分析師和研究人員的首選語(yǔ)言之一。R語(yǔ)言基礎(chǔ)語(yǔ)法1變量和數(shù)據(jù)類型R語(yǔ)言支持常見(jiàn)的數(shù)據(jù)類型,如數(shù)字、字符串、邏輯值等??梢允褂觅x值運(yùn)算符(=)來(lái)定義變量。2基本操作符R提供算術(shù)運(yùn)算符(+、-、*、/)、邏輯運(yùn)算符(&&、||、!)等,可以進(jìn)行各種數(shù)學(xué)和邏輯運(yùn)算。3控制流語(yǔ)句R有if-else、for、while等控制流語(yǔ)句,可以根據(jù)條件執(zhí)行不同的代碼塊,實(shí)現(xiàn)復(fù)雜的邏輯。4函數(shù)定義R允許用戶自定義函數(shù),通過(guò)參數(shù)傳遞和返回值實(shí)現(xiàn)代碼復(fù)用和功能擴(kuò)展。5向量和數(shù)組R中的向量和數(shù)組是核心數(shù)據(jù)結(jié)構(gòu),可以進(jìn)行元素級(jí)別的操作,非常適合數(shù)值計(jì)算。6數(shù)據(jù)框數(shù)據(jù)框是R中最常用的二維數(shù)據(jù)結(jié)構(gòu),可以存儲(chǔ)不同類型的列,非常適合處理表格數(shù)據(jù)。數(shù)據(jù)導(dǎo)入與預(yù)處理數(shù)據(jù)獲取通過(guò)API、文件導(dǎo)入或者數(shù)據(jù)庫(kù)查詢等方式,將原始數(shù)據(jù)導(dǎo)入到R環(huán)境中。數(shù)據(jù)清洗檢查并處理缺失值、異常值、格式不一致等問(wèn)題,確保數(shù)據(jù)質(zhì)量。特征工程根據(jù)分析需求,創(chuàng)建新的特征變量,提取有價(jià)值的信息。數(shù)據(jù)探索性分析1數(shù)據(jù)概覽了解數(shù)據(jù)集的基本信息2數(shù)據(jù)特征分析探索變量的分布和關(guān)系3異常值識(shí)別檢測(cè)和處理離群數(shù)據(jù)點(diǎn)數(shù)據(jù)探索性分析是深入了解數(shù)據(jù)特征的關(guān)鍵步驟。首先全面概括數(shù)據(jù)集的基本情況,如樣本量、變量類型等。然后仔細(xì)分析各個(gè)變量的分布情況,發(fā)現(xiàn)它們之間的關(guān)聯(lián)關(guān)系。同時(shí)還要識(shí)別并處理數(shù)據(jù)中的異常值,確保后續(xù)分析的可靠性。只有充分了解數(shù)據(jù)特征,才能選擇合適的分析方法和模型。描述性統(tǒng)計(jì)分析1集中趨勢(shì)平均值、中位數(shù)和眾數(shù)2離散程度方差、標(biāo)準(zhǔn)差和變異系數(shù)3分布特征偏度、峰度和頻數(shù)分布描述性統(tǒng)計(jì)分析是對(duì)數(shù)據(jù)進(jìn)行初步探索的重要手段。我們可以通過(guò)計(jì)算集中趨勢(shì)指標(biāo)了解數(shù)據(jù)的平均水平和中心位置,又可以利用離散程度指標(biāo)分析數(shù)據(jù)的離散程度,還可以基于分布特征指標(biāo)深入理解數(shù)據(jù)的整體分布狀況。這些基礎(chǔ)分析為后續(xù)的統(tǒng)計(jì)推斷和數(shù)據(jù)建模提供了堅(jiān)實(shí)的基礎(chǔ)。假設(shè)檢驗(yàn)1制定假設(shè)基于研究問(wèn)題和背景,提出明確的零假設(shè)和備擇假設(shè)。2選擇檢驗(yàn)方法根據(jù)數(shù)據(jù)類型和研究目的,選擇合適的統(tǒng)計(jì)檢驗(yàn)方法。3計(jì)算檢驗(yàn)統(tǒng)計(jì)量利用R語(yǔ)言函數(shù)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量及其相應(yīng)的p值。4做出判斷將p值與顯著性水平進(jìn)行比較,得出是否拒絕零假設(shè)的結(jié)論。相關(guān)性分析1變量關(guān)系識(shí)別探索變量之間的相關(guān)性2相關(guān)系數(shù)計(jì)算量化變量之間的關(guān)聯(lián)強(qiáng)度3顯著性檢驗(yàn)評(píng)估相關(guān)性的統(tǒng)計(jì)意義相關(guān)性分析是研究變量之間線性關(guān)系的重要方法。首先通過(guò)可視化手段判斷變量之間是否存在相關(guān)性,然后利用相關(guān)系數(shù)的計(jì)算來(lái)量化這種相關(guān)強(qiáng)度。最后進(jìn)行顯著性檢驗(yàn),確定相關(guān)性是否具有統(tǒng)計(jì)意義。這為后續(xù)的深入分析和建模提供了基礎(chǔ)。線性回歸模型模型假設(shè)建立線性回歸模型,假設(shè)因變量與自變量之間存在線性關(guān)系。參數(shù)估計(jì)利用最小二乘法估計(jì)模型的回歸系數(shù)和截距項(xiàng)。模型評(píng)估通過(guò)R方、F檢驗(yàn)等指標(biāo)評(píng)估模型的整體擬合優(yōu)度。預(yù)測(cè)和解釋利用模型預(yù)測(cè)因變量,并解釋自變量對(duì)因變量的影響。邏輯回歸模型模型假設(shè)利用邏輯函數(shù)建立概率模型,假設(shè)因變量與自變量之間存在非線性關(guān)系。參數(shù)估計(jì)采用極大似然估計(jì)法估計(jì)模型的回歸系數(shù),以獲得最佳擬合效果。模型評(píng)估通過(guò)對(duì)數(shù)似然比檢驗(yàn)、ROC曲線等指標(biāo)評(píng)估模型的整體擬合優(yōu)度和預(yù)測(cè)能力。分類預(yù)測(cè)根據(jù)預(yù)測(cè)概率值對(duì)樣本進(jìn)行分類,并計(jì)算準(zhǔn)確率、recall等性能指標(biāo)。方差分析1比較均值差異方差分析通過(guò)比較多個(gè)樣本均值的差異,檢驗(yàn)它們是否源自同一總體。2分析變異來(lái)源將總變異劃分為組內(nèi)變異和組間變異,并評(píng)估它們的相對(duì)貢獻(xiàn)。3假設(shè)檢驗(yàn)與解釋基于F檢驗(yàn)的結(jié)果,判斷是否拒絕原假設(shè),并解釋自變量對(duì)因變量的影響。聚類分析1數(shù)據(jù)預(yù)處理規(guī)范化和標(biāo)準(zhǔn)化數(shù)據(jù),準(zhǔn)備進(jìn)行聚類分析。2距離度量選擇合適的距離度量方法,如歐氏距離、曼哈頓距離等。3聚類算法應(yīng)用k-均值、層次聚類等算法對(duì)數(shù)據(jù)進(jìn)行聚類。4結(jié)果評(píng)估利用輪廓系數(shù)、CH指數(shù)等指標(biāo)評(píng)估聚類效果。聚類分析是一種無(wú)監(jiān)督的數(shù)據(jù)挖掘方法,可以自動(dòng)將相似的樣本劃分到同一個(gè)簇中。首先需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,如規(guī)范化和標(biāo)準(zhǔn)化,以確保各個(gè)特征變量在同一量綱上。然后選擇合適的距離度量方法,如歐氏距離、曼哈頓距離等。接下來(lái)應(yīng)用k-均值、層次聚類等算法對(duì)數(shù)據(jù)進(jìn)行聚類。最后通過(guò)評(píng)估指標(biāo)如輪廓系數(shù)、CH指數(shù)等來(lái)判斷聚類效果的優(yōu)劣。主成分分析1數(shù)據(jù)預(yù)處理對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和去相關(guān)處理2特征提取計(jì)算協(xié)方差矩陣并提取主成分3主成分選擇根據(jù)貢獻(xiàn)率確定保留的主成分?jǐn)?shù)主成分分析是一種強(qiáng)大的數(shù)據(jù)降維方法。首先需要對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和去相關(guān)處理,以消除量綱和相關(guān)性的影響。然后計(jì)算協(xié)方差矩陣,提取出主成分向量。最后根據(jù)各主成分的貢獻(xiàn)率確定保留的主成分?jǐn)?shù)量,從而實(shí)現(xiàn)對(duì)高維數(shù)據(jù)的有效壓縮和表示。主成分分析能夠揭示數(shù)據(jù)中隱藏的潛在結(jié)構(gòu),為后續(xù)的模式識(shí)別和數(shù)據(jù)挖掘提供基礎(chǔ)。因子分析1數(shù)據(jù)預(yù)處理規(guī)范化和標(biāo)準(zhǔn)化數(shù)據(jù)2相關(guān)性分析識(shí)別變量間的相關(guān)結(jié)構(gòu)3因子提取基于主成分分析提取潛在因子4因子旋轉(zhuǎn)使用正交或斜交旋轉(zhuǎn)提高解釋力因子分析是一種數(shù)據(jù)歸約和潛在結(jié)構(gòu)識(shí)別的強(qiáng)大方法。首先需要對(duì)數(shù)據(jù)進(jìn)行規(guī)范化和標(biāo)準(zhǔn)化處理,消除量綱和相關(guān)性的影響。然后從變量之間的相關(guān)性結(jié)構(gòu)入手,提取出能夠最大程度解釋原始數(shù)據(jù)的潛在因子。最后通過(guò)正交或斜交旋轉(zhuǎn)等方法優(yōu)化因子結(jié)構(gòu),使其更具解釋力和可解釋性。因子分析在心理測(cè)量、市場(chǎng)調(diào)研等領(lǐng)域廣泛應(yīng)用,是一種重要的數(shù)據(jù)挖掘工具。時(shí)間序列分析1數(shù)據(jù)預(yù)處理清洗和處理時(shí)間序列數(shù)據(jù),確保數(shù)據(jù)的連續(xù)性和可靠性。2趨勢(shì)分析識(shí)別數(shù)據(jù)中的長(zhǎng)期趨勢(shì),了解變量隨時(shí)間的整體變化趨勢(shì)。3季節(jié)性分析分析數(shù)據(jù)中的周期性波動(dòng),揭示變量的季節(jié)性特征。4預(yù)測(cè)建?;跉v史數(shù)據(jù)建立時(shí)間序列模型,對(duì)未來(lái)走勢(shì)進(jìn)行預(yù)測(cè)。生存分析數(shù)據(jù)準(zhǔn)備清洗和整理時(shí)間事件數(shù)據(jù),確保數(shù)據(jù)的完整性和可靠性。生存函數(shù)估計(jì)應(yīng)用Kaplan-Meier法或Nelson-Aalen法估計(jì)生存概率曲線。組間比較利用Log-rank檢驗(yàn)比較不同組別之間的生存差異。協(xié)變量分析建立Cox比例風(fēng)險(xiǎn)模型,分析影響生存的協(xié)變量效應(yīng)。決策樹(shù)模型1問(wèn)題定義根據(jù)業(yè)務(wù)目標(biāo)選擇合適的預(yù)測(cè)任務(wù)2數(shù)據(jù)預(yù)處理清洗和轉(zhuǎn)換數(shù)據(jù),處理缺失值和異常值3特征工程提取和選擇對(duì)模型性能有影響的特征4模型訓(xùn)練迭代生長(zhǎng)決策樹(shù)模型,調(diào)優(yōu)超參數(shù)5模型評(píng)估利用交叉驗(yàn)證等方法評(píng)估模型性能決策樹(shù)模型是一種廣泛應(yīng)用的機(jī)器學(xué)習(xí)算法,可用于分類和回歸預(yù)測(cè)。其主要步驟包括:首先確定預(yù)測(cè)任務(wù)的目標(biāo),收集和清洗相關(guān)數(shù)據(jù);然后進(jìn)行特征工程,選擇有影響力的輸入變量;接下來(lái)根據(jù)數(shù)據(jù)反復(fù)訓(xùn)練決策樹(shù)模型,并調(diào)優(yōu)超參數(shù);最后利用交叉驗(yàn)證等方法評(píng)估模型的預(yù)測(cè)性能。決策樹(shù)建立的預(yù)測(cè)規(guī)則易于理解和解釋,在許多領(lǐng)域都有廣泛應(yīng)用。隨機(jī)森林模型1數(shù)據(jù)準(zhǔn)備清洗和預(yù)處理數(shù)據(jù),處理缺失值和異常值。2特征工程根據(jù)業(yè)務(wù)需求選擇合適的特征變量。3模型訓(xùn)練使用bagging算法生成多棵決策樹(shù),組成隨機(jī)森林。4模型評(píng)估利用OOB誤差、featureimportance等指標(biāo)評(píng)估模型性能。隨機(jī)森林是一種強(qiáng)大的集成學(xué)習(xí)算法,通過(guò)構(gòu)建多棵相互獨(dú)立的決策樹(shù)并進(jìn)行投票或平均得到最終預(yù)測(cè)結(jié)果。首先需要對(duì)原始數(shù)據(jù)進(jìn)行全面的清洗和預(yù)處理,處理缺失值和異常值。然后根據(jù)業(yè)務(wù)需求選擇合適的特征變量,以提高模型的預(yù)測(cè)能力。在模型訓(xùn)練階段,使用bagging算法生成多棵決策樹(shù),組成隨機(jī)森林模型。最后利用OOB誤差和featureimportance等指標(biāo)對(duì)模型進(jìn)行評(píng)估,優(yōu)化超參數(shù)以獲得滿意的預(yù)測(cè)性能。神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)預(yù)處理清洗和轉(zhuǎn)換數(shù)據(jù),處理缺失值和異常值,確保數(shù)據(jù)質(zhì)量。網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)根據(jù)問(wèn)題復(fù)雜度選擇合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如前饋、卷積或循環(huán)網(wǎng)絡(luò)。超參數(shù)調(diào)優(yōu)通過(guò)交叉驗(yàn)證優(yōu)化學(xué)習(xí)率、層數(shù)、激活函數(shù)等超參數(shù),提高模型性能。模型訓(xùn)練采用反向傳播算法不斷優(yōu)化網(wǎng)絡(luò)權(quán)重和偏置,完成模型訓(xùn)練。模型評(píng)估利用測(cè)試集評(píng)估模型的預(yù)測(cè)準(zhǔn)確性、泛化能力和魯棒性。支持向量機(jī)模型1數(shù)據(jù)預(yù)處理清洗和標(biāo)準(zhǔn)化訓(xùn)練數(shù)據(jù)2特征工程選擇對(duì)模型性能有影響的特征3模型訓(xùn)練利用SVM算法學(xué)習(xí)分類或回歸模型4模型優(yōu)化通過(guò)調(diào)整核函數(shù)和正則化參數(shù)提高泛化能力5模型評(píng)估使用交叉驗(yàn)證等方法評(píng)估模型性能支持向量機(jī)(SVM)是一種廣泛應(yīng)用的監(jiān)督學(xué)習(xí)算法,可用于分類和回歸問(wèn)題。在使用SVM構(gòu)建預(yù)測(cè)模型時(shí),首先需要對(duì)原始數(shù)據(jù)進(jìn)行清洗和標(biāo)準(zhǔn)化處理,確保數(shù)據(jù)質(zhì)量。然后進(jìn)行特征工程,選擇那些對(duì)模型性能有顯著影響的特征變量。接下來(lái)利用SVM算法學(xué)習(xí)分類或回歸模型,并通過(guò)調(diào)整核函數(shù)和正則化參數(shù)等超參數(shù)優(yōu)化模型性能。最后使用交叉驗(yàn)證等方法評(píng)估模型的泛化能力和魯棒性。SVM模型往往能夠產(chǎn)生出精準(zhǔn)而穩(wěn)健的預(yù)測(cè)結(jié)果。模型評(píng)估與選擇1性能指標(biāo)計(jì)算根據(jù)預(yù)測(cè)任務(wù)的不同,計(jì)算相應(yīng)的準(zhǔn)確率、精確率、召回率和F1值等性能指標(biāo)。2交叉驗(yàn)證通過(guò)K折交叉驗(yàn)證方法,評(píng)估模型在新數(shù)據(jù)上的泛化能力。3ROC曲線分析繪制ROC曲線并計(jì)算AUC值,全面評(píng)估分類模型的性能。4模型比較與選擇根據(jù)性能指標(biāo)和業(yè)務(wù)需求,選擇最適合的機(jī)器學(xué)習(xí)模型。模型調(diào)優(yōu)1超參數(shù)優(yōu)化調(diào)整學(xué)習(xí)率、正則化系數(shù)等超參數(shù),以提高模型的泛化性能。2特征工程通過(guò)添加、刪除或轉(zhuǎn)換特征變量,增強(qiáng)模型的預(yù)測(cè)能力。3模型集成將多個(gè)基學(xué)習(xí)器組合在一起,利用集成方法提升預(yù)測(cè)準(zhǔn)確性。4性能監(jiān)測(cè)持續(xù)監(jiān)控模型在新數(shù)據(jù)上的性能變化,及時(shí)發(fā)現(xiàn)并解決問(wèn)題。數(shù)據(jù)可視化1數(shù)據(jù)收集從各種來(lái)源獲取所需數(shù)據(jù)2數(shù)據(jù)預(yù)處理清洗、轉(zhuǎn)換和整理數(shù)據(jù)3可視化設(shè)計(jì)選擇合適的圖表類型和布局4交互設(shè)計(jì)添加動(dòng)態(tài)交互特性5發(fā)布和共享將可視化呈現(xiàn)給目標(biāo)受眾數(shù)據(jù)可視化是將復(fù)雜的數(shù)據(jù)以直觀易懂的圖形化方式呈現(xiàn)的過(guò)程。這涉及到數(shù)據(jù)收集、預(yù)處理、可視化設(shè)計(jì)、交互設(shè)計(jì)和最終發(fā)布共享等多個(gè)步驟。首先通過(guò)各種渠道收集所需的數(shù)據(jù),然后進(jìn)行清洗和轉(zhuǎn)換,確保數(shù)據(jù)的質(zhì)量和一致性。接下來(lái)根據(jù)分析目標(biāo)選擇合適的圖表類型和布局,并添加交互性功能以增強(qiáng)用戶體驗(yàn)。最后將精心設(shè)計(jì)的可視化成果發(fā)布出去,讓目標(biāo)受眾能夠更好地理解數(shù)據(jù)背后的洞見(jiàn)。報(bào)告撰寫確定寫作目標(biāo)根據(jù)報(bào)告的目的和受眾,明確寫作目標(biāo)和預(yù)期效果。結(jié)構(gòu)規(guī)劃確定報(bào)告的主要章節(jié)和內(nèi)容結(jié)構(gòu),保持邏輯性和層次性。內(nèi)容撰寫使用簡(jiǎn)潔明了的語(yǔ)言描述數(shù)據(jù)分析過(guò)程和結(jié)果發(fā)現(xiàn)。視覺(jué)呈現(xiàn)利用圖表、圖像等可視化手段,增強(qiáng)報(bào)告的吸引力和洞見(jiàn)。修改完善反復(fù)推敲、潤(rùn)色報(bào)告內(nèi)容,確保報(bào)告邏輯通順、語(yǔ)言優(yōu)美。案例分析11問(wèn)題定義確定分析目標(biāo)和預(yù)測(cè)任務(wù)2數(shù)據(jù)收集從多個(gè)渠道獲取相關(guān)數(shù)據(jù)3數(shù)據(jù)預(yù)處理清洗、集成和轉(zhuǎn)換數(shù)據(jù)4特征工程構(gòu)建有效的特征集合在這個(gè)案例分析中,我們將以某電子商城的客戶流失預(yù)測(cè)為背景,全面展示從問(wèn)題定義到模型構(gòu)建和評(píng)估的完整數(shù)據(jù)分析流程。首先,我們需要精確定義客戶流失預(yù)測(cè)的分析目標(biāo),確定相關(guān)的數(shù)據(jù)收集范圍。接下來(lái),對(duì)收集的原始數(shù)據(jù)進(jìn)行規(guī)范化清洗和集成處理,以確保數(shù)據(jù)的質(zhì)量和一致性。最后,通過(guò)特征工程的方法構(gòu)建出能夠有效預(yù)測(cè)客戶流失的特征集合,為后續(xù)的模型訓(xùn)練和評(píng)估奠定基礎(chǔ)。案例分析21問(wèn)題背景分析某電信運(yùn)營(yíng)商的用戶流失情況,為制定有效的留存策略提供依據(jù)。2數(shù)據(jù)準(zhǔn)備整合來(lái)自用戶信息系統(tǒng)、計(jì)費(fèi)系統(tǒng)和客戶服務(wù)系統(tǒng)的相關(guān)數(shù)據(jù)。3特征工程基于用戶年齡、消費(fèi)習(xí)慣、投訴記錄等特征構(gòu)建預(yù)測(cè)模型。4模型訓(xùn)練采用決策樹(shù)、隨機(jī)森林等算法訓(xùn)練流失預(yù)測(cè)模型。5模型評(píng)估利用AUC、F1值等指標(biāo)評(píng)估模型性能,并進(jìn)行細(xì)化調(diào)優(yōu)。案例分析3需求分析針對(duì)某電商平臺(tái)建立商品推薦系統(tǒng),提升用戶購(gòu)買轉(zhuǎn)化率。數(shù)據(jù)收集整合用戶瀏覽歷史、購(gòu)買記錄、商品屬性等多個(gè)數(shù)據(jù)源。特征工程構(gòu)建用戶偏好、商品相似度等多維特征指標(biāo)。模型構(gòu)建應(yīng)用協(xié)同過(guò)濾、基于內(nèi)容的推薦等算法建立推薦模型。模型評(píng)估通過(guò)A/B測(cè)試等方式評(píng)估模型效果,優(yōu)化推薦策略。課程總結(jié)1數(shù)據(jù)分析基礎(chǔ)掌握R語(yǔ)言基礎(chǔ)語(yǔ)法與數(shù)據(jù)處理技能2統(tǒng)計(jì)建模方法熟練應(yīng)用常用的統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)算法3實(shí)踐應(yīng)用案例解決實(shí)際業(yè)務(wù)問(wèn)題的完整

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論