大數(shù)據(jù)分析與決策實(shí)驗(yàn)報(bào)告冊(cè)模板_第1頁(yè)
大數(shù)據(jù)分析與決策實(shí)驗(yàn)報(bào)告冊(cè)模板_第2頁(yè)
大數(shù)據(jù)分析與決策實(shí)驗(yàn)報(bào)告冊(cè)模板_第3頁(yè)
大數(shù)據(jù)分析與決策實(shí)驗(yàn)報(bào)告冊(cè)模板_第4頁(yè)
大數(shù)據(jù)分析與決策實(shí)驗(yàn)報(bào)告冊(cè)模板_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGE5PAGE實(shí)驗(yàn)一主成分分析一、實(shí)驗(yàn)?zāi)康闹鞒煞址治隼弥笜?biāo)之間的相關(guān)性,將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),從而達(dá)到降維和數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)化的目的。這些綜合指標(biāo)反映了原始指標(biāo)的多大部分信息,通常表示為原始指標(biāo)的某種線性組合,且綜合指標(biāo)間不相關(guān)。一個(gè)因變量、與兩個(gè)或兩個(gè)以上自變量的回歸稱為多元回歸。在處理測(cè)量數(shù)據(jù)時(shí),經(jīng)常要研究自變量與因變量之間的關(guān)系。變量之間的關(guān)系一般分為兩種,一種是完全確定關(guān)系,即函數(shù)關(guān)系;一種是相關(guān)關(guān)系,即變量之間既存在著密切聯(lián)系,但又不能直接由一個(gè)或多個(gè)變量的值求出另一個(gè)變量的值。人們希望通過(guò)建立比較緊密相關(guān)變量的公式,以便變量之間相互推測(cè)。而多元回歸分析的任務(wù)就是用數(shù)學(xué)表達(dá)式來(lái)描述相關(guān)變量之間的關(guān)系。經(jīng)濟(jì)水平和衛(wèi)生醫(yī)療水平的差異性,導(dǎo)致不同時(shí)期人群壽命大相徑庭;遺傳、生活方式等個(gè)體差異,使得每個(gè)人的生命周期相差懸殊。因此,人均預(yù)期壽命是衡量一個(gè)國(guó)家或地區(qū)現(xiàn)階段經(jīng)濟(jì)社會(huì)發(fā)展水平和醫(yī)療衛(wèi)生服務(wù)水平的綜合指標(biāo)。為此,應(yīng)用多元回歸方法預(yù)測(cè)我國(guó)人口平均壽命有一定的現(xiàn)實(shí)意義。二、實(shí)驗(yàn)要求數(shù)據(jù)類(lèi)型均為數(shù)值型,掌握多種多元回歸模型,如多元線性回歸、多元多項(xiàng)式回歸、逐步回歸等模型,并對(duì)模型評(píng)價(jià),選出最優(yōu)模型。以我國(guó)內(nèi)地31個(gè)?。▍^(qū)、市)的有關(guān)數(shù)據(jù),應(yīng)用多元回歸方法分析人口平均預(yù)期壽命與人均國(guó)內(nèi)生產(chǎn)總值和體質(zhì)得分的關(guān)系。數(shù)據(jù)來(lái)源:國(guó)家統(tǒng)計(jì)局資料。

實(shí)驗(yàn)二基于Apriori關(guān)聯(lián)規(guī)則的商品購(gòu)物列表分析一、實(shí)驗(yàn)?zāi)康腁priori算法是一種數(shù)據(jù)挖掘技術(shù),用于挖掘頻繁項(xiàng)集和相關(guān)的關(guān)聯(lián)規(guī)則,已經(jīng)被廣泛的應(yīng)用到商業(yè),網(wǎng)絡(luò)安全等各個(gè)領(lǐng)域。購(gòu)物籃分析是通過(guò)發(fā)現(xiàn)顧客在一次購(gòu)物行為中放入購(gòu)物籃中不同商品之間的關(guān)聯(lián),研究客戶的購(gòu)買(mǎi)行為,從而輔助零售企業(yè)制定營(yíng)銷(xiāo)策略的一種數(shù)據(jù)分析方法。使用Apriori關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)購(gòu)物籃分析,發(fā)現(xiàn)超市不同商品之間的關(guān)聯(lián)關(guān)系,并根據(jù)商品之間的關(guān)聯(lián)規(guī)則制定營(yíng)銷(xiāo)策略。二、實(shí)驗(yàn)要求1、背景與挖掘目標(biāo)繁雜的選購(gòu)過(guò)程往往會(huì)給顧客疲憊的購(gòu)物體驗(yàn)。對(duì)于某些商品顧客會(huì)選擇同時(shí)購(gòu)買(mǎi),如可樂(lè)和漢堡,蛋糕和酸奶,當(dāng)可樂(lè)和漢堡或者蛋糕和酸奶分布在商場(chǎng)的兩側(cè),且距離十分遙遠(yuǎn)時(shí),顧客購(gòu)買(mǎi)的欲望會(huì)減少,在時(shí)間緊迫的情況下顧客甚至?xí)艞壻?gòu)買(mǎi)某些計(jì)劃購(gòu)買(mǎi)的商品。相反,如果放在相鄰的位置,即給顧客提供便利,提升購(gòu)物體驗(yàn),又提高顧客購(gòu)買(mǎi)的頻率,達(dá)到了促銷(xiāo)的目的。很多商場(chǎng)往往會(huì)以打折方式作為主要促銷(xiāo)手段,以更少的利潤(rùn)為代價(jià)獲得更高的銷(xiāo)售。但好多商店不知道,打折的吸引力遠(yuǎn)遠(yuǎn)不足。而正確的商品擺放卻能提醒顧客購(gòu)買(mǎi)某些必需品,甚至吸引他們購(gòu)買(mǎi)興趣的商品。為了銷(xiāo)售最大的利潤(rùn),貨物擺放的位置很重要,所以應(yīng)該了解客戶的購(gòu)買(mǎi)習(xí)慣和偏好。通過(guò)對(duì)商場(chǎng)銷(xiāo)售數(shù)據(jù)分析,可以獲得顧客的購(gòu)買(mǎi)行為特征,這樣可以發(fā)現(xiàn)的規(guī)律而采取有效的行動(dòng)。制定商品擺放,商品定價(jià),新商品采購(gòu)計(jì)劃,對(duì)商場(chǎng)增加銷(xiāo)售至關(guān)重要。2、數(shù)據(jù)挖掘目標(biāo)通過(guò)網(wǎng)絡(luò)等途徑獲取數(shù)據(jù),實(shí)現(xiàn)以下幾個(gè)目標(biāo):1,構(gòu)建零售商品的Apriori關(guān)聯(lián)規(guī)則模型,分析商品之間的關(guān)聯(lián)性;2,根據(jù)模型結(jié)果給出有效的銷(xiāo)售策略,提升銷(xiāo)售量。

實(shí)驗(yàn)三數(shù)據(jù)挖掘在銀行信用評(píng)級(jí)中的應(yīng)用一、實(shí)驗(yàn)?zāi)康纳虡I(yè)銀行需要客觀、全面、準(zhǔn)確地評(píng)估消費(fèi)者的還款能力和還款意愿,以避免、控制、減少壞賬損失。信用評(píng)分模型技術(shù)的發(fā)展和應(yīng)用,就是應(yīng)個(gè)人消費(fèi)信貸金融機(jī)構(gòu)風(fēng)險(xiǎn)管理的需要而誕生的,然后才逐步應(yīng)用到市場(chǎng)營(yíng)銷(xiāo)管理、收益管理等領(lǐng)域。因而,研究信用風(fēng)險(xiǎn)的特點(diǎn),借鑒國(guó)外先進(jìn)經(jīng)驗(yàn),建立符合我國(guó)國(guó)情的量度信用風(fēng)險(xiǎn)的信用風(fēng)險(xiǎn)評(píng)估體系,客觀、全面、準(zhǔn)確地評(píng)估消費(fèi)者的還款能力和還款意愿,識(shí)別信貸申請(qǐng)人的個(gè)人信用風(fēng)險(xiǎn),是銀行定量地對(duì)各項(xiàng)業(yè)務(wù)實(shí)施有效的風(fēng)險(xiǎn)管理的措施,也是提高經(jīng)營(yíng)水平的最基本的要求;對(duì)于完善我國(guó)商業(yè)銀行的信用風(fēng)險(xiǎn)管理手段,促進(jìn)個(gè)人信貸的快速增長(zhǎng)以及推動(dòng)我國(guó)征信體系的全面建設(shè)具有重要的現(xiàn)實(shí)意義和理論價(jià)值。二、實(shí)驗(yàn)要求收集利用大量的歷史數(shù)據(jù),訓(xùn)練評(píng)分模型,再利用模型進(jìn)行自動(dòng)化評(píng)分。使用的模型包括:決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、SVM等模型。案例數(shù)據(jù):readtable('CreditRating_Historical.dat');實(shí)驗(yàn)四多元回歸方法預(yù)測(cè)我國(guó)人口平均壽命一、實(shí)驗(yàn)?zāi)康囊粋€(gè)因變量、與兩個(gè)或兩個(gè)以上自變量的回歸稱為多元回歸。在處理測(cè)量數(shù)據(jù)時(shí),經(jīng)常要研究自變量與因變量之間的關(guān)系。變量之間的關(guān)系一般分為兩種,一種是完全確定關(guān)系,即函數(shù)關(guān)系;一種是相關(guān)關(guān)系,即變量之間既存在著密切聯(lián)系,但又不能直接由一個(gè)或多個(gè)變量的值求出另一個(gè)變量的值。人們希望通過(guò)建立比較緊密相關(guān)變量的公式,以便變量之間相互推測(cè)。而多元回歸分析的任務(wù)就是用數(shù)學(xué)表達(dá)式來(lái)描述相關(guān)變量之間的關(guān)系。經(jīng)濟(jì)水平和衛(wèi)生醫(yī)療水平的差異性,導(dǎo)致不同時(shí)期人群壽命大相徑庭;遺傳、生活方式等個(gè)體差異,使得每個(gè)人的生命周期相差懸殊。因此,人均預(yù)期壽命是衡量一個(gè)國(guó)家或地區(qū)現(xiàn)階段經(jīng)濟(jì)社會(huì)發(fā)展水平和醫(yī)療衛(wèi)生服務(wù)水平的綜合指標(biāo)。為此,應(yīng)用多元回歸方法預(yù)測(cè)我國(guó)人口平均壽命有一定的現(xiàn)實(shí)意義。二、實(shí)驗(yàn)要求數(shù)據(jù)類(lèi)型均為數(shù)值型,掌握多種多元回歸模型,如多元線性回歸、多元多項(xiàng)式回歸、逐步回歸等模型,并對(duì)模型評(píng)價(jià),選出最優(yōu)模型。以我國(guó)內(nèi)地31個(gè)?。▍^(qū)、市)的有關(guān)數(shù)據(jù),應(yīng)用多元回歸方法分析人口平均預(yù)期壽命與人均國(guó)內(nèi)生產(chǎn)總值和體質(zhì)得分的關(guān)系。數(shù)據(jù)來(lái)源:國(guó)家統(tǒng)計(jì)局資料。實(shí)驗(yàn)五聚類(lèi)方法在投資XX債券分類(lèi)中的應(yīng)用實(shí)驗(yàn)?zāi)康乃^“物以類(lèi)聚,人以群分”,其核心思想是聚類(lèi)。通過(guò)聚類(lèi),人們發(fā)現(xiàn)全局的分布模式,以及多個(gè)類(lèi)之間有趣的相互關(guān)系。把聚類(lèi)分析方法應(yīng)用于投資XX債券分析中,不僅可以彌補(bǔ)債券投資定性分析的不足,也可以使債券投資分析更精確。此外,可作為理性的長(zhǎng)期投資債券的參考依據(jù),聚類(lèi)分析方法使用的主要目的,也在于從多類(lèi)債券的內(nèi)在價(jià)值中挖掘出投資真正價(jià)值所在。通過(guò)聚類(lèi)分析方法建立投資評(píng)價(jià)模型時(shí),考慮行業(yè)和XX的成長(zhǎng)性等對(duì)債券

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論