




已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一、 計(jì)算題(題數(shù):4,共 100.0 分)1.影響中國(guó)人口自然增長(zhǎng)率的因素有很多,據(jù)分析主要因素可能有:(1)從宏觀經(jīng)濟(jì)上看,經(jīng)濟(jì)整體增長(zhǎng)是人口自然增長(zhǎng)的基本源泉;(2)居民消費(fèi)水平,它的高低可能會(huì)間接影響人口增長(zhǎng)率。(3)文化程度,由于教育年限的高低,相應(yīng)會(huì)轉(zhuǎn)變?nèi)说膫鹘y(tǒng)觀念,可能會(huì)間接影響人口自然增長(zhǎng)率(4)人口分布,非農(nóng)業(yè)與農(nóng)業(yè)人口的比率也會(huì)對(duì)人口增長(zhǎng)率有相應(yīng)的影響。為了全面反映中國(guó)“人口自然增長(zhǎng)率”的全貌,選擇人口增長(zhǎng)率作為被解釋變量,以反映中國(guó)人口的增長(zhǎng);選擇“國(guó)名收入”及“人均GDP”作為經(jīng)濟(jì)整體增長(zhǎng)的代表;選擇“居民消費(fèi)價(jià)格指數(shù)增長(zhǎng)率”作為居民消費(fèi)水平的代表。暫不考慮文化程度及人口分布的影響。 從中國(guó)統(tǒng)計(jì)年鑒收集到以下數(shù)據(jù)(見表1): 設(shè)定的線性回歸模型為: 算法1多元線性回歸.xlsx(1)求出模型中的各個(gè)參數(shù),試從多個(gè)角度評(píng)價(jià)此線性回歸模型,并檢驗(yàn)?zāi)P偷慕?jīng)濟(jì)意義;(2)檢驗(yàn)?zāi)P椭惺欠翊嬖诙嘀毓簿€性問題(逐步回歸),若有,試消除多重共線性。答案解析:(1)直接進(jìn)行線性回歸即可得到各個(gè)參數(shù)(用excel)。多元線性回歸模型評(píng)價(jià)可以從擬合優(yōu)度、T檢驗(yàn)、F檢驗(yàn)等多個(gè)方面出發(fā)。(2)求變量的相關(guān)系數(shù)矩陣或采用逐步回歸法(也可以用datahoop平臺(tái)做線性回歸,會(huì)自動(dòng)刪除共線的變量)。2.對(duì)近期上映的10部電影進(jìn)行調(diào)查研究,抽取290人對(duì)這10部電影的評(píng)分(分值010分),結(jié)果如下表所示。(1)根據(jù)表中數(shù)據(jù)對(duì)這10部電影的評(píng)分進(jìn)行因子分析,并解析各個(gè)因子的含義;(2)可否利用電影的評(píng)分?jǐn)?shù)據(jù)對(duì)這290名觀影者進(jìn)行聚類分析?給出你的理由。算法2因子分析.xlsx答案解析:(1)因子分析選擇隱含因子數(shù)為3,分別代表動(dòng)作片、愛情片、動(dòng)畫片的影響評(píng)分因子。(2)可以,這290人對(duì)電影的偏好有區(qū)別,可以進(jìn)行聚類,相關(guān)性分析后排除共線性的影響再進(jìn)行聚類。3.某超市為了優(yōu)化商品擺放結(jié)構(gòu),對(duì)近期顧客購(gòu)買的商品類型進(jìn)行了統(tǒng)計(jì),如附表所示。(1)寫出所有有效強(qiáng)關(guān)聯(lián)規(guī)則(minsupport=10%,minconfidence=50%);(2)結(jié)合實(shí)際情況分析顧客喜歡的商品搭配,并對(duì)該超市提出合理的建議。算法3關(guān)聯(lián)分析.xlsx答案解析:關(guān)聯(lián)規(guī)則分析中設(shè)置參數(shù)(minsupport=10%,minconfidence=50%),結(jié)果中強(qiáng)關(guān)聯(lián)規(guī)則通過調(diào)整顯示條目全部寫出(重復(fù)的刪除)。結(jié)合實(shí)際情況分析要寫詳細(xì)。4.某市為調(diào)查駕駛員視力情況(“1”表示視力正常,“0”表示有視力缺陷)、年齡、是否有駕駛教育經(jīng)歷(“1”表示有,“0”表示沒有),這三個(gè)因素對(duì)是否曾引起交通事故(“1”表示發(fā)生過,“0”表示未發(fā)生過)的影響,隨機(jī)抽樣調(diào)查了45名駕駛員,得到數(shù)據(jù)如下:(1)建立模型分析駕駛員視力情況、年齡、是否有駕駛教育經(jīng)歷對(duì)是否曾引起交通事故的影響,寫出詳細(xì)的思路過程。(2)若要應(yīng)用此模型預(yù)測(cè)某批駕駛員中可能會(huì)引起過交通事故的人都有哪些,則還需要進(jìn)行的研究步驟有哪些?請(qǐng)說明。算法4邏輯回歸.xlsx答案解析:邏輯回歸,數(shù)據(jù)預(yù)處理包括分析共線性和異常值等,數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),綜合訓(xùn)練誤差和測(cè)試誤差評(píng)價(jià)模型。第二問要收集數(shù)據(jù)、處理數(shù)據(jù)、應(yīng)用模型直接預(yù)測(cè)。-一、 計(jì)算題(題數(shù):4,共 100.0 分)1.1993-2007年相關(guān)經(jīng)濟(jì)數(shù)據(jù)如附表所示。設(shè)定國(guó)內(nèi)生產(chǎn)總值為x1,地產(chǎn)投資總額為x2,全國(guó)居民消費(fèi)水平為x3、全社會(huì)固定資產(chǎn)投資房屋竣工面積為x4,作為自變量;全國(guó)房屋銷售均價(jià)設(shè)為Y,作為因變量。建立如下的多元線性回歸模型:y=b0+b1*x1+b2*x2+b3*x3+b4*x4+b0,b1,b2,b3,b4是未知參數(shù),是剩余殘差,且E()=0,與四個(gè)自變量無關(guān)。(1)求出參數(shù)b0,b1,b2,b3,b4,并評(píng)判模型擬合優(yōu)度和實(shí)際意義,寫出詳細(xì)的分析依據(jù)和思路過程;(2)根據(jù)(1)對(duì)模型進(jìn)行修正。多元線性回歸.xlsx答案解析:(1)直接做線性回歸,可得各個(gè)參數(shù)。通過R2,F(xiàn)、T檢驗(yàn),p值等分別分析模型。系數(shù)在經(jīng)濟(jì)意義上存在不合理性,可能是共線性的影響。(datahoop平臺(tái)會(huì)刪除共線的變量,所以這里用excel或spss等做回歸。)(2)相關(guān)性分析和解釋,去掉一些變量,重新做線性回歸(在Datahoop平臺(tái)上直接做也可以,平臺(tái)會(huì)自動(dòng)刪除共線的變量)。2.為了解電影票房的影響因素有哪些,某出品人搜集了2010年至2013年間中國(guó)電影發(fā)放放映協(xié)會(huì)統(tǒng)計(jì)的過千萬票房的國(guó)產(chǎn)電影相關(guān)統(tǒng)計(jì)指標(biāo),共涉及275部影片。具體數(shù)據(jù)如附表所示。Datahoop上傳測(cè)試集:電影票房數(shù)據(jù)(2010-2013).xlsxDatahoop上傳訓(xùn)練集:電影票房數(shù)據(jù)(2010-2013).xlsx對(duì)數(shù)據(jù)進(jìn)行預(yù)處理(包括缺失值、數(shù)據(jù)類型、離散化等),選擇決策樹模型進(jìn)行擬合,并檢驗(yàn)和分析模型。要求寫出詳細(xì)的思路和過程。答案解析:1.影片票房:影片票房是本次模型建模的因變量。通過對(duì)選取數(shù)據(jù)的統(tǒng)計(jì)分析,將票房數(shù)據(jù)進(jìn)行分類,一共分為8個(gè)層次,分類情況如表所示:等級(jí) 1 2 3 4 5 6 7 8范圍 1000萬 2000萬 3000萬 6000萬 1億萬 1億9000萬 3億 20億 2000萬 3000萬 6000萬 1億萬 1億9000萬 3億 乘客IDSurvived = 是否生還Pclass = 乘客等級(jí)(1/2/3等艙位)Name = 乘客姓名Sex = 性別Age = 年齡SibSp = 堂兄弟/妹個(gè)數(shù)Parch = 父母與小孩個(gè)數(shù)Ticket = 船票信息Fare = 票價(jià)Cabin = 客艙Embarked = 登船港口對(duì)收集進(jìn)行預(yù)處理,選擇適當(dāng)?shù)乃惴ㄟM(jìn)行分析,并評(píng)價(jià)和解釋模型,要求寫出具體的思路過程。答案解析:本次分析選取變量包括:Survived = 是否生還、Pclass = 乘客等級(jí)(1/2/3等艙位)、Sex = 性別、Age = 年齡、SibSp = 堂兄弟/妹個(gè)數(shù)、Parch = 父母與小孩個(gè)數(shù)、Fare = 票價(jià)。理把性別進(jìn)行0和1處理,female(女)轉(zhuǎn)換成0,male(男)轉(zhuǎn)換成1。年齡Age存在缺失值,因此對(duì)于年齡的缺失值需要進(jìn)行處理,本次對(duì)年齡的缺失值用所有年齡數(shù)據(jù)的平均值進(jìn)行填充。采用方法:邏輯回歸,根據(jù)模型的預(yù)測(cè)結(jié)果可以看出模型的準(zhǔn)確度還是比較好的,模型的AUC值也是比較高的。因此可以根據(jù)這些變量預(yù)測(cè)乘客生還與否。-一、 計(jì)算題1.電信公司為分析客戶流失狀況,為客戶是否流失提供參考依據(jù),隨機(jī)選取了600名客戶進(jìn)行研究,得到了如附表所示一系列數(shù)據(jù),收集到的數(shù)據(jù)包含下列字段:在網(wǎng)月數(shù)截止數(shù)據(jù)收集時(shí)間為止的在網(wǎng)月數(shù)年齡客戶實(shí)際年齡婚姻狀況客戶婚姻狀況,0代表未婚,1代表已婚現(xiàn)地址居住時(shí)間現(xiàn)在地址的居住月份教育程度1:??埔韵拢?:本科;3:碩士;4:研究生;5:博士工作狀態(tài)0:待業(yè);1:在職性別0:女;1:男租設(shè)備0:不租;1:租IP電話0:無;1:有無線電話0:有;1:無本月話費(fèi)話費(fèi)具體金額語音信箱0:無;1:有網(wǎng)絡(luò)0:無;1:有來電顯示0:無;1:有呼叫等待0:無;1:有呼叫轉(zhuǎn)移0:無;1:有流失狀態(tài)0:未流失;1:流失 根據(jù)這些客戶數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,之后分別用邏輯回歸和SVM算法進(jìn)行分析,對(duì)比兩種算法的擬合優(yōu)度,從而選擇兩者中更加適合的算法模型。寫出分析思路和過程,并為電信公司提供客戶運(yùn)營(yíng)的相關(guān)建議。數(shù)據(jù)分析應(yīng)用1電信客戶流失數(shù)據(jù).xlsx答案解析:根據(jù)邏輯回歸和SVM算法對(duì)數(shù)據(jù)的不同要求,預(yù)處理要分析數(shù)據(jù)的共線性和異常值,之后分別進(jìn)行邏輯回歸和SVM算法分析,發(fā)現(xiàn)SVM的召回率、準(zhǔn)確率、準(zhǔn)確度等指標(biāo)均較好,因此選擇SVM算法。相關(guān)建議包括引入此模型分析客戶,從而針對(duì)性運(yùn)營(yíng)等。2.選取7項(xiàng)經(jīng)濟(jì)指標(biāo)作為決定經(jīng)濟(jì)類型的影響因素,對(duì)全國(guó)31個(gè)省、直轄市、自治區(qū)(浙江、湖南、甘肅除外)進(jìn)行聚類分析(各項(xiàng)數(shù)據(jù)均來自2010年國(guó)家統(tǒng)計(jì)年鑒)。數(shù)據(jù)分析應(yīng)用2省市分類.xlsx對(duì)數(shù)據(jù)進(jìn)行預(yù)處理(創(chuàng)建新的變量等),比較說明聚成幾類時(shí)聚類效果最好,寫出分析思路和過程,并分析每一類的實(shí)際意義。答案解析:若用k-means進(jìn)行聚類,預(yù)處理要考慮共線性和異常值(數(shù)據(jù)比較少不能輕易刪除異常值),且分別分析聚成2、3、4等類的效果(由平均輪廓系數(shù)判定)。-一、 計(jì)算題1.某金融機(jī)構(gòu)為了研究其信用卡發(fā)放風(fēng)險(xiǎn),收集整理了一些客戶的數(shù)據(jù),包括他們的基本信息,經(jīng)濟(jì)情況,以及是否拖欠還款等,具體如附表所示(已經(jīng)將客戶分為了訓(xùn)練集和測(cè)試集)。數(shù)據(jù)分析應(yīng)用1測(cè)試數(shù)據(jù).xlsx數(shù)據(jù)分析應(yīng)用1訓(xùn)練數(shù)據(jù).xlsx進(jìn)行數(shù)據(jù)預(yù)處理,并用不同的算法模型(邏輯回歸、神經(jīng)網(wǎng)絡(luò)等)分析信用卡拖欠還款情況,結(jié)合測(cè)試數(shù)據(jù)對(duì)比模型的擬合優(yōu)度,要求寫出具體的思路過程。答案解析:分析數(shù)據(jù)有沒有缺失值異常值等,數(shù)據(jù)預(yù)處理(邏輯回歸考慮共線性、神經(jīng)網(wǎng)絡(luò)不考慮),分別用邏輯回歸和神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練集進(jìn)行擬合,由召回率、準(zhǔn)確率等分析訓(xùn)練誤差,接著對(duì)測(cè)試集進(jìn)行預(yù)測(cè)分析得到預(yù)測(cè)值與實(shí)際值對(duì)比,求召回率、準(zhǔn)確率等分析泛化誤差。對(duì)比決定用哪個(gè)模型。2.為了研究手機(jī)好評(píng)率與品牌、價(jià)格的關(guān)系,某公司收集如附表所示數(shù)據(jù),數(shù)據(jù)收集的信息包含手機(jī)的評(píng)論得分和評(píng)論內(nèi)容以及手機(jī)品牌和價(jià)格等信息。手機(jī)數(shù)據(jù).xlsx對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,選擇合適的模型分析手機(jī)好評(píng)率與品牌、價(jià)格的關(guān)系,要求寫出詳細(xì)的思路和過程。答案解析:本案例想要通過對(duì)應(yīng)分析分析不同手機(jī)品牌和不同價(jià)格區(qū)間的手機(jī)的好評(píng)情況。對(duì)應(yīng)分析是研究由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系。交互表的信息以圖形的方式展示。主要適用于有多個(gè)類別的定類變量,可以揭示同一個(gè)變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。適用于兩個(gè)或多個(gè)定類變量。因此本案例需要對(duì)要研究的定量變量進(jìn)行定性處理。本案例中品牌屬于類別數(shù)據(jù),但是其中包含漢字,因子需要進(jìn)行重新編碼;價(jià)格屬于連續(xù)型變量,因此需要進(jìn)行離散化處理。好評(píng)數(shù)不能直接代表手機(jī)的好評(píng)情況,因此為了更好地表示手機(jī)的好評(píng)情況,這里采用好評(píng)率進(jìn)行分析。由于好評(píng)率計(jì)算出來仍然是一個(gè)0到1之間的連續(xù)變量,因此需要進(jìn)行離散化處理。數(shù)據(jù)分析:本次分析采用datahoop1.2版本進(jìn)行分析,首先對(duì)品牌和好評(píng)率進(jìn)行對(duì)應(yīng)分析。從分析結(jié)果可以看到數(shù)據(jù)的交叉表,以及提取的3個(gè)公因子的貢獻(xiàn)率和因子得分。從因子貢獻(xiàn)率可以看到提取兩個(gè)因子的貢獻(xiàn)率就達(dá)到了80%以上,因此提取兩個(gè)因子即可。根據(jù)對(duì)應(yīng)分析的圖表可以看到處于hp1也就是低好評(píng)度的品牌主要有品牌7,9,11,12。接著較低好評(píng)度品牌有3,4。較高好評(píng)度品牌包括1,5。高好評(píng)度品牌有8,10。因此品牌好評(píng)率分布為:好評(píng)率等級(jí)品牌低級(jí)ZUK,飛利浦,金立,酷派較低HTC, LG較高360,oppo高級(jí)錘子,華為這樣就可以清晰地看出不同品牌的好評(píng)情況。然后對(duì)價(jià)格等級(jí)和好評(píng)率等級(jí)進(jìn)行對(duì)應(yīng)分析,可以看到用戶評(píng)論中500-1500價(jià)格區(qū)間的手機(jī)好評(píng)率最低,500-6000價(jià)位的手機(jī)好評(píng)率也最低。1500-2000價(jià)位的手機(jī)好評(píng)率較低;2000-2500價(jià)位/3000-3500價(jià)位和6000-7000價(jià)位手機(jī)好評(píng)率較高,好評(píng)率最高的是價(jià)位2500-3000價(jià)位手機(jī)和3500-4000價(jià)位。-1. 下面是7個(gè)地區(qū)2000年的人均國(guó)內(nèi)生產(chǎn)總值(GDP)和人均消費(fèi)水平的統(tǒng)計(jì)數(shù)據(jù): 要求:(1)繪制散點(diǎn)圖,并計(jì)算相關(guān)系數(shù),說明二者之間的關(guān)系;(2)人均GDP作自變量,人均消費(fèi)水平作因變量,利用最小二乘法求出估計(jì)的回歸方程,并解釋回歸系數(shù)的實(shí)際意義;(3)計(jì)算判定系數(shù),并解釋其意義;(4)檢驗(yàn)回歸方程線性關(guān)系的顯著性(a=0.05);(5)如果某地區(qū)的人均GDP為5000元,預(yù)測(cè)其人均消費(fèi)水平;(6)求人均GDP為5000元時(shí),人均消費(fèi)水平95%的置信區(qū)間和預(yù)測(cè)區(qū)間。(所有結(jié)果均保留三位小數(shù))(25.0分)窗體頂端我的答案窗體底端答案解析:提示:(1)使用Datahoop或Excel作出散點(diǎn)圖、相關(guān)系數(shù),作出相關(guān)描述;(2)注意自變量與因變量的確定,利用Datahoop或Excel寫出回歸方程,作出回歸系數(shù)實(shí)際意義的描述;(3)寫出判定系數(shù),并描述意義;(4)在a=0.05的前提下,檢驗(yàn)方程的顯著性,并做描述;(5)使用Datahoop預(yù)測(cè)功能做出結(jié)果;(6)寫出置信區(qū)間和預(yù)測(cè)區(qū)間。-2. 根據(jù)以下給出的數(shù)據(jù)進(jìn)行分析,本次給出鳶尾花數(shù)據(jù),其中包含萼片長(zhǎng)、萼片寬、花瓣長(zhǎng)、花瓣寬、以及花的類型數(shù)據(jù),請(qǐng)根據(jù)以下問題進(jìn)行回答。(本題數(shù)據(jù)提供在excel里面,數(shù)據(jù)分析為三份,一份訓(xùn)練數(shù)據(jù),一份測(cè)試數(shù)據(jù),一份預(yù)測(cè)數(shù)據(jù))(1)根據(jù)訓(xùn)練數(shù)據(jù),用類型_num作為因變量Y,其他變量作為自變量X,做邏輯回歸,寫出邏輯回歸的方程。(2)根據(jù)測(cè)試數(shù)據(jù)得到的結(jié)果,寫出邏輯回歸的混淆矩陣,以及準(zhǔn)確率和召回率,Accuracy和F1的值(可根據(jù)測(cè)試數(shù)據(jù)結(jié)果計(jì)算表格得到測(cè)試數(shù)據(jù)集的相應(yīng)的結(jié)果)。(3)給出一組預(yù)測(cè)數(shù)據(jù),根據(jù)訓(xùn)練模型結(jié)果預(yù)測(cè),寫出預(yù)測(cè)結(jié)果。(25.0分)窗體頂端我的答案窗體底端答案解析:提示: - 3. 下表為購(gòu)物籃事物數(shù)據(jù): (1)設(shè)minsupport=40%,利用Apriori算法寫出所有的頻繁項(xiàng)目集,并指出其中支持度最大的二項(xiàng)頻繁項(xiàng)目集。(2)在第一問基礎(chǔ)上設(shè)minconfidence=60%,找出所有的有效強(qiáng)關(guān)聯(lián)規(guī)則。(25.0分)窗體頂端我的答案窗體底端答案解析:提示:使用Datahoo進(jìn)行Apriori分析,注意參數(shù)調(diào)整- 4. 某廚衛(wèi)公司要開發(fā)一款燃?xì)庠町a(chǎn)品,列舉出5個(gè)可作為賣點(diǎn)的功能屬性:防風(fēng)、定時(shí)、防干燒、不沾油、快速而準(zhǔn)確地打火。該公司的產(chǎn)品設(shè)計(jì)人員不知道該主要開發(fā)哪項(xiàng)功能,分析師小李向公司提出了使用KANO模型對(duì)上述五個(gè)功能進(jìn)行調(diào)研分類的想法。并得到了公司的支持。假設(shè)你是小李1.請(qǐng)你繪制KANO模型圖來介紹對(duì)功能屬性分類的思路2.請(qǐng)你對(duì)燃?xì)庠畹姆栏蔁δ軐傩栽O(shè)計(jì)調(diào)查問題3.針對(duì)燃?xì)庠畹姆栏蔁δ?,受訪者有多少種可能的回答組合,請(qǐng)寫出每一種回答組合所對(duì)應(yīng)的屬性類別符號(hào)(符號(hào)見最后一行題注)4.假設(shè)基于對(duì)240名受訪者的調(diào)研,得到下表,請(qǐng)算出這5種功能各自的worse系數(shù)和better系數(shù),并基于這兩個(gè)系數(shù)判斷這5中功能的屬性類別5.請(qǐng)對(duì)該燃?xì)庠畹倪@5項(xiàng)功能開發(fā)提出建議注:魅力屬性用符號(hào)A表示;必備屬性用符號(hào)M表示;期望屬性用符號(hào)O表示;可有可無屬性用符號(hào)I表示;用戶討厭的屬性用R表示;有問題的回答用Q表示人數(shù)功能OIMA防風(fēng)118302963防干燒47783085定時(shí)22140870快速而準(zhǔn)確地打火452010768不沾油69512989(25.0分)窗體頂端我的答案窗體底端答案解析:提示:(1)繪制KANO模型圖(2)描繪通用調(diào)查問題(3)作出屬性類別表(4)計(jì)算worse和better系數(shù),并畫出象限圖(5)給出開發(fā)建議- 1. 移動(dòng)公司想結(jié)合用戶通話行為,推薦相應(yīng)套餐,或者結(jié)合用戶現(xiàn)有套餐優(yōu)化用戶套餐,提供個(gè)性化套餐,從而對(duì)客戶進(jìn)行精準(zhǔn)營(yíng)銷,增加客戶粘性。為此,移動(dòng)公司收集了下列數(shù)據(jù),移動(dòng)公司收集到的數(shù)據(jù)包含下列字段:變量名稱變量標(biāo)簽Customer_ID用戶編號(hào)Peak_mins工作日上班時(shí)間電話時(shí)長(zhǎng)OffPeak_mins工作日下班時(shí)間電話時(shí)長(zhǎng)Weekend_mins周末電話時(shí)長(zhǎng)International_mins國(guó)際電話時(shí)長(zhǎng)Total_mins總通話時(shí)長(zhǎng)average_mins平均每次通話時(shí)長(zhǎng)請(qǐng)你根據(jù)這些客戶數(shù)據(jù),進(jìn)行數(shù)據(jù)的預(yù)處理(數(shù)據(jù)預(yù)處理過程中可以根據(jù)現(xiàn)有變量構(gòu)造新變量進(jìn)行分析),預(yù)處理之后選擇合適變量進(jìn)行分析,分析算法自行選擇,寫出分析思路和過程,通過數(shù)據(jù)分析對(duì)客戶進(jìn)行細(xì)分,將客戶分為5類。并為移動(dòng)公司提供客戶精準(zhǔn)營(yíng)銷的相關(guān)建議。(請(qǐng)寫出分析的流程并刻畫最后細(xì)分之后的客戶的特點(diǎn)和相應(yīng)的營(yíng)銷建議)(50.0分)窗體頂端我的答案窗體底端答案解析:提示:根據(jù)題目可以選取聚類方法對(duì)客戶進(jìn)行細(xì)分,這里選取k-means聚類方法進(jìn)行分析。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要查看數(shù)據(jù)的相關(guān)性;對(duì)數(shù)據(jù)進(jìn)行聚類分析,選取變量為peak_mins/total_mins,offpeak_mins,weekend_mins,international_mins,total_m
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 具有振震雙控功能的模塊化層并聯(lián)橡膠支座及組合隔振(震)層研究
- 管理與護(hù)理管理學(xué)
- 倉(cāng)庫(kù)人員安全意識(shí)提升方案
- 保護(hù)牙齒健康教案說課
- 腎挫傷患者的常規(guī)護(hù)理
- 超聲波泵技術(shù)解析與應(yīng)用
- 師德警示教育案例解析與應(yīng)用
- 《智能網(wǎng)聯(lián)汽車技術(shù)》課件-智能網(wǎng)聯(lián)汽車發(fā)展目標(biāo)的認(rèn)知
- 預(yù)防職業(yè)病危害課件
- 小學(xué)教師常規(guī)培訓(xùn)
- 實(shí)驗(yàn)室培育鉆石行業(yè)技術(shù)發(fā)展趨勢(shì)報(bào)告
- 2025年領(lǐng)英大制造行業(yè)人才全球化報(bào)告-馬來西亞篇
- 專題:閱讀理解 30篇 中考英語高分提升之新題速遞第二輯【含答案+解析】
- 企業(yè)面試題目和答案大全
- 抖音房產(chǎn)直播課件
- 2025至2030中國(guó)近視眼治療儀市場(chǎng)競(jìng)爭(zhēng)力剖析及企業(yè)經(jīng)營(yíng)形勢(shì)分析報(bào)告
- 2025年高考化學(xué)試卷(廣東卷)(空白卷)
- 體育老師招聘試題及答案
- 自然生態(tài)探險(xiǎn)之旅行業(yè)跨境出海項(xiàng)目商業(yè)計(jì)劃書
- 2025年北京市高考英語試卷真題(含答案解析)
- 西藏自治區(qū)拉薩市達(dá)孜區(qū)孜縣2025年七下英語期中質(zhì)量檢測(cè)模擬試題含答案
評(píng)論
0/150
提交評(píng)論