




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、投資理財數(shù)據(jù)挖掘投資理財數(shù)據(jù)挖掘 目目 錄錄 研究結(jié)論及其建議研究結(jié)論及其建議5.投資理財建模分析投資理財建模分析4.3.數(shù)據(jù)挖掘流程數(shù)據(jù)挖掘流程2.緒論緒論1.投資理財分析中的數(shù)據(jù)挖掘技術(shù)投資理財分析中的數(shù)據(jù)挖掘技術(shù) D MD MC C 1.1.緒緒 論論1.1 1.1 研究背景研究背景1.2 1.2 研究動機(jī)研究動機(jī)1.3 1.3 研究目的研究目的1.4 1.4 研究問題與范圍研究問題與范圍1.5 1.5 報告架構(gòu)與研究流程報告架構(gòu)與研究流程 D MD MC C1.11.1 研研 究究 背背 景景v 臺灣經(jīng)濟(jì)狀況臺灣經(jīng)濟(jì)狀況: D MD MC C1.11.1 研研 究究 背背 景景v 臺灣
2、經(jīng)濟(jì)狀況臺灣經(jīng)濟(jì)狀況: D MD MC Cv 臺灣股市臺灣股市: D MD MC C1.11.1 研研 究究 背背 景景個人理財個人理財熱度比較熱度比較平穩(wěn)平穩(wěn)臺灣人的投資理財觀臺灣人的投資理財觀臺灣經(jīng)濟(jì)在起伏中進(jìn)臺灣經(jīng)濟(jì)在起伏中進(jìn)入平穩(wěn)發(fā)展期入平穩(wěn)發(fā)展期臺灣民眾投資臺灣民眾投資狂熱逐漸消退狂熱逐漸消退有財富積累有財富積累,財務(wù)壓力較財務(wù)壓力較小小,理財愿望相對較弱理財愿望相對較弱臺灣部分資金臺灣部分資金流向海外投資流向海外投資 D MD MC C1.11.1 研研 究究 背背 景景v 由于市場競爭日益激烈,再加上民眾投資熱情減退,證券公司要如何挖掘潛在的客戶,創(chuàng)造客戶的需求,針對客戶的行為做
3、出適當(dāng)?shù)臓I銷決策,最大化自己和盈利,建立自身的核心競爭力,對于證券公司的發(fā)展乃至生存都是至關(guān)重要的。 D MD MC C1.11.1 研研 究究 背背 景景 1.2 1.2 研研 究究 動動 機(jī)機(jī)客戶客戶細(xì)分細(xì)分企業(yè)在明確的戰(zhàn)略業(yè)務(wù)模式和專注市場中根據(jù)客戶的價值、需求和偏好等綜合因素對客戶進(jìn)行分類,對不同的客戶群提供具有針對性的產(chǎn)品、服務(wù)和營銷模式。交叉交叉銷售銷售指向現(xiàn)有客戶提供新的產(chǎn)品和服務(wù)的營銷過程。企業(yè)通過對原有客戶實施交叉銷售既可以因銷售額的增長而獲益,又可以通過為客戶提供更多更好的產(chǎn)品和服務(wù)來增進(jìn)與客戶間的良好關(guān)系。 D MD MC C客戶客戶獲得獲得它對于企業(yè)發(fā)現(xiàn)自己的潛在客戶群
4、,提高市場活動的回報率,有的放矢地進(jìn)行營銷起到至關(guān)重要的作用。商務(wù)智能1數(shù)據(jù)挖掘2數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程32 2 數(shù)據(jù)挖掘流程簡介數(shù)據(jù)挖掘流程簡介 D MD MC C2.1 2.1 商務(wù)智能商務(wù)智能商務(wù)智能是一系列商業(yè)活動行為的數(shù)據(jù)商務(wù)智能是一系列商業(yè)活動行為的數(shù)據(jù)收集與信息轉(zhuǎn)化作業(yè),協(xié)助企業(yè)制訂出收集與信息轉(zhuǎn)化作業(yè),協(xié)助企業(yè)制訂出最佳的策略主題與策略目標(biāo)。最佳的策略主題與策略目標(biāo)。商務(wù)智能能透過數(shù)據(jù)的淬取、整合及分商務(wù)智能能透過數(shù)據(jù)的淬取、整合及分析,支持決策過程的技術(shù)和商業(yè)處理流程析,支持決策過程的技術(shù)和商業(yè)處理流程商務(wù)智能是企業(yè)利用現(xiàn)代信息收集、管商務(wù)智能是企業(yè)利用現(xiàn)代信息收集、管理和分析結(jié)構(gòu)
5、化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,增強(qiáng)綜合競爭力的智慧和能力和信息,增強(qiáng)綜合競爭力的智慧和能力” DMCDMC2.2 2.2 數(shù)據(jù)挖掘數(shù)據(jù)挖掘 D MD MC C 2.3 2.3 數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(CRISP-DM) D MD MC C3 3 投資理財分析中的數(shù)據(jù)挖掘技術(shù)投資理財分析中的數(shù)據(jù)挖掘技術(shù) DMDMC C數(shù)據(jù)挖掘技術(shù)在證券行業(yè)的應(yīng)用數(shù)據(jù)挖掘技術(shù)在證券行業(yè)的應(yīng)用1客戶關(guān)系管理客戶關(guān)系管理2本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法3本文采用的模型評估方法本文采用的模型評估方法43.1 3.1 數(shù)據(jù)挖掘技術(shù)在證券行業(yè)的應(yīng)用數(shù)
6、據(jù)挖掘技術(shù)在證券行業(yè)的應(yīng)用客戶交易數(shù)據(jù)客戶交易數(shù)據(jù)在各個證券公司的營業(yè)部產(chǎn)生,分布于證券公司的營業(yè)部及證券交易所,屬于相對私有數(shù)據(jù).股票行情數(shù)據(jù)股票行情數(shù)據(jù)由交易所產(chǎn)生,一些現(xiàn)有的實時行情接收分析系統(tǒng)如錢龍、匯金、指南針等都能夠?qū)ζ溥M(jìn)行從簡單到復(fù)雜的分析整個運(yùn)營系統(tǒng)產(chǎn)整個運(yùn)營系統(tǒng)產(chǎn)生的兩大類數(shù)據(jù)生的兩大類數(shù)據(jù) D MD MC C3.2 3.2 客戶關(guān)系管理客戶關(guān)系管理 D MD MC C即如何留住客戶,以降低開發(fā)新客戶的成本客戶描繪客戶描繪目標(biāo)市場目標(biāo)市場購物籃購物籃分析分析客戶關(guān)客戶關(guān)系管理系管理準(zhǔn)確篩選營銷對象幫助零售業(yè)者了解客戶的消費(fèi)行為,以提高顧客的消費(fèi)額應(yīng)用于如何獲得新顧客3.3 3
7、.3 本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法 D MD MC CDecision Tree決策樹Logistic Regression 羅吉斯回歸算法Cluster 群集算法Association 關(guān)聯(lián)規(guī)則算法Nave Bayes Classifer貝氏機(jī)率分類算法Neural Network 類神經(jīng)網(wǎng)絡(luò)算法挖掘模型 D MD MC C3.3 3.3 本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法3.3 3.3 本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法 D MD MC C提升圖提升圖挖掘模型最可能介于隨機(jī)推測模型和理想或精確無誤的預(yù)測模型之間。與隨機(jī)推測相比,預(yù)測率的任何提高均被視為提
8、升。.模型的評模型的評估方法估方法分類矩陣分類矩陣每個矩陣的行代表模型的預(yù)測值,而列則代表實際值。由分類矩陣進(jìn)一步比較,判別兩模型的預(yù)測能力。3.3 3.3 本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法模型評估方法提升圖模型評估方法提升圖 D MD MC C紅線表示理想模型3.3 3.3 本文采用的數(shù)據(jù)挖掘算法本文采用的數(shù)據(jù)挖掘算法模型評估方法分類矩陣模型評估方法分類矩陣 D MD MC C4.4.投資理財建模分析投資理財建模分析數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備1購買和未購買股票各占一半的調(diào)查者行為分析購買和未購買股票各占一半的調(diào)查者行為分析2股票購買者投資行為分析股票購買者投資行為分析3美金購買者行為分析美
9、金購買者行為分析4期貨購買者行為分析期貨購買者行為分析5 D MD MC C4.1 數(shù)據(jù)準(zhǔn)備 DMCDMC數(shù)據(jù)的說明數(shù)據(jù)的說明數(shù)據(jù)分類數(shù)據(jù)分類數(shù)據(jù)的獲得數(shù)據(jù)的獲得本數(shù)據(jù)來自臺灣輔仁大學(xué)本數(shù)據(jù)來自臺灣輔仁大學(xué)統(tǒng)計資訊學(xué)系的電話調(diào)查統(tǒng)計資訊學(xué)系的電話調(diào)查(Computer Aided Telephone Investigation, CATI)中心中心。資料總共。資料總共490088筆,我筆,我們將任何一項存在缺失值們將任何一項存在缺失值的數(shù)據(jù)都刪掉,這樣剩下的數(shù)據(jù)都刪掉,這樣剩下有效數(shù)據(jù)有效數(shù)據(jù)425693筆。筆。問卷一共有問卷一共有32個問題個問題調(diào)查所得的有效數(shù)據(jù)中調(diào)查所得的有效數(shù)據(jù)中,未未
10、購買股票的調(diào)查對象占總購買股票的調(diào)查對象占總調(diào)查對象的調(diào)查對象的83.7%,購買,購買股票的調(diào)查對象占總調(diào)查股票的調(diào)查對象占總調(diào)查對象的對象的16.7%。4.1 4.1 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 D MD MC C問題問題Q1 請問您目前有沒有在證券公司或是銀行上班?Q2最近一年內(nèi),請問您有沒有購買上市、上柜公司的股票?Q3請問您目前投資在股票上的金額大約是多少?Q4請問您在購買股票時,最主要的考慮因素是什么? (復(fù)選,請隨機(jī)提示1-5項)。Q5請問在金融保險類股中,您所知道的股票有哪幾家?還有沒有?還有沒有(復(fù)選5項,不提示)?Q6 以下我將念出金融保險類股的股票,請問您聽過哪幾家?(復(fù)選,隨機(jī)提示
11、1-20項)Q7請問您有沒有購買金融保險類股的股票?那么,哪一家股票,您所投資的金額最多?(復(fù)選5項,不提示)Q8那么,您清不清楚這幾家上市公司的主要經(jīng)營項目?Q9請問在電子類股中,您所知道的股票有哪幾家? (復(fù)選5項,不提示)?Q10以下我將念出電子類股的股票,請問您聽過哪幾家?(復(fù)選,隨機(jī)提示1-20項)Q11請問您有沒有購買電子類股的股票?那么,哪一家股票,您所投資的金額最多?(復(fù)選5項,不提示)?Q12那么,您清不清楚這幾家上市公司的主要經(jīng)營項目?Q13請問在紡織纖維類股中,您所知道的股票有哪幾家? (復(fù)選5項,不提示)?Q14以下我將念出紡織纖維類股的股票,請問您聽過哪幾家?(復(fù)選,
12、隨機(jī)提示1-20項)Q15請問您有沒有購買紡織纖維類股的股票?那么,哪一家股票,您所投資的金額最多?(復(fù)選5項,不提示)?Q16那么,您清不清楚這幾家上市公司的主要經(jīng)營項目?Q17請問在鋼鐵類股中,您所知道的股票有哪幾家?還有沒有?還有沒有(復(fù)選5項,不提示)?Q18以下我將念出鋼鐵類股的股票,請問您聽過哪幾家?(復(fù)選,隨機(jī)提示1-20項)Q19請問您有沒有購買鋼鐵類股的股票?那么,哪一家股票,您所投資的金額最多?(復(fù)選5項,不提示)?Q20那么,您清不清楚這幾家上市公司的主要經(jīng)營項目?Q21請問在上柜證券類股中,您所知道的股票有哪幾家? (復(fù)選5項,不提示)?Q22以下我將念出上柜證券類股的
13、股票,請問您聽過哪幾家?(復(fù)選,隨機(jī)提示1-17項)Q23請問您有沒有購買上柜證券類股的股票?那么,哪一家股票,您所投資的金額最多?(復(fù)選5項,不提示)?Q24最近一年內(nèi),請問您有沒有購買美金,我們這里所說的購買美金不包括出國結(jié)匯,純粹為了投資而購買的美金?Q25請問您購買的美金大約折合臺幣多少錢?Q26最近一年內(nèi),請問您有沒有購買期貨?Q27請問您購買的期貨大約折合臺幣多少錢?Q28性別Q29請問您的年齡?Q30請問您的教育程度是?Q31請問您的職業(yè)是?Q32請問您個人一個月的收入大約是多少?4.1 4.1 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 D MD MC C第第1題篩選被訪者,在證券公司和銀題篩選被訪者,
14、在證券公司和銀行工作的人不列為被訪對象行工作的人不列為被訪對象Q28-Q32: 被訪者的個人被訪者的個人信息,包括性別,年齡,信息,包括性別,年齡,學(xué)歷,職業(yè)和收入等學(xué)歷,職業(yè)和收入等第第2題區(qū)分被訪者后續(xù)回答題區(qū)分被訪者后續(xù)回答的問題種類。購買股票的被的問題種類。購買股票的被要回答完所有的問卷,未購要回答完所有的問卷,未購買股票的跳到買股票的跳到24題題Q3-Q4:說明證券投資的金額:說明證券投資的金額及其購買理由及其購買理由Q24-27:被訪者購買:被訪者購買美金和期貨的信息美金和期貨的信息Q5-Q23:股票購買者對金:股票購買者對金融保險融保險,紡織紡織,鋼鐵鋼鐵,電子電子,證券證券類的
15、了解及其購買情況類的了解及其購買情況數(shù)據(jù)說明4.1 4.1 數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 D MD MC C數(shù)據(jù)分析結(jié)構(gòu)數(shù)據(jù)分析結(jié)構(gòu)4.2 購買和未購買股票各占一半的調(diào)查者行為分析購買和未購買股票各占一半的調(diào)查者行為分析 D MD MC C分析購買者及未購買者共同的問題4.2 購買和未購買股票各占一半的調(diào)查者行為分析購買和未購買股票各占一半的調(diào)查者行為分析v 變量的篩選和模型的建立變量的篩選和模型的建立我們將所有個人信息變量輸入作為自變量,來作為判斷其是否購買股票的標(biāo)準(zhǔn)。我們采取我們將所有個人信息變量輸入作為自變量,來作為判斷其是否購買股票的標(biāo)準(zhǔn)。我們采取SQL的的建議(建議(SQL內(nèi)部從中抽取一部分樣本
16、,進(jìn)行驗證),選擇內(nèi)部從中抽取一部分樣本,進(jìn)行驗證),選擇“年齡年齡”,“教育程度教育程度”,“職業(yè)職業(yè)”,和和“收入收入”作為自變量,分別建立決策樹,邏輯回歸,貝葉斯模型來預(yù)測被訪者是否購買股票。作為自變量,分別建立決策樹,邏輯回歸,貝葉斯模型來預(yù)測被訪者是否購買股票。 D MD MC Cv 模型的精確度分析模型的精確度分析v三個模型都能預(yù)測出被訪者是否購買股票,我們對三個模型進(jìn)行對比,分別用提升三個模型都能預(yù)測出被訪者是否購買股票,我們對三個模型進(jìn)行對比,分別用提升圖和分類矩陣方法進(jìn)行篩選。圖和分類矩陣方法進(jìn)行篩選。提升圖:提升圖: D MD MC C4.2 購買和未購買股票各占一半的調(diào)查
17、者行為分析購買和未購買股票各占一半的調(diào)查者行為分析v 分類矩陣:分類矩陣: D MD MC C4.2 購買和未購買股票各占一半的調(diào)查者行為分析購買和未購買股票各占一半的調(diào)查者行為分析選擇決策樹作為我們最終模型4.24.2購買和未購買股票各占一半的調(diào)查者行為分析購買和未購買股票各占一半的調(diào)查者行為分析相依程度: D MD MC C影響投資者是否購買股票因素由強(qiáng)到弱為:收入教育程度職業(yè)年齡4.3股票購買者投資行為分析股票購買者投資行為分析v對于購買的股票的人群來說,考慮的最主要的因素分析如下: D MD MC C選項選項N N比率比率相對于樣本的比率相對于樣本的比率Q41Q41選股理由公司運(yùn)營選股
18、理由公司運(yùn)營414054140530.3%30.3%60.7%60.7%Q42Q42選股理由親友介紹選股理由親友介紹223992239916.4%16.4%32.8%32.8%Q43Q43選股理由朋友選股理由朋友331633162.4%2.4%4.9%4.9%Q44Q44選股理由自己分析選股理由自己分析422064220630.8%30.8%61.8%61.8%Q45Q45選股理由第四臺選股理由第四臺190861908613.9%13.9%28.0%28.0%Q46Q46選股理由其他選股理由其他846084606.2%6.2%12.4%12.4%總計總計136872136872100.0%10
19、0.0%200.5%200.5%4.3股票購買者投資行為分析股票購買者投資行為分析Q5,Q9,Q13,Q17,Q21為在未提醒被訪為在未提醒被訪者的情況下讓被訪者說出至多者的情況下讓被訪者說出至多5只股票只股票,我們認(rèn)為被訪者對這些股票比較熟悉我們認(rèn)為被訪者對這些股票比較熟悉 Q7,Q11,Q15,Q19,Q23為是否購買為是否購買這只股票這只股票,最大選擇個數(shù)為最大選擇個數(shù)為5 D MD MC C股票投資者的購買行為分析股票投資者的購買行為分析數(shù)據(jù)的處理:Q8,Q12,Q16,Q20,問投資者分別對金融板塊,紡織板塊,鋼鐵板塊, 這幾家上市公司的主要經(jīng)營項目是否熟悉。如果投資者對每一個板塊,
20、我們記為1,否則為0。然后將四個板塊的值加權(quán)重,形成新的變量Q30(清楚業(yè)務(wù)匯總).Q6,Q10,Q14,Q18,問題為:以下我將念出金融保險類股(或其他四個板塊)的股票,請問您聽過哪幾家?復(fù)選,隨機(jī)提1-20項。在訪問員說出這只股票,如果被訪者聽說過,我們就將其記為1,說明他對這只股票有印象,否則為0。我們假定聽說過的股票越多,對證券市場越了解。將被訪者對各個板塊聽說過的股票數(shù)量加總起來,作為衡量被訪者對股市的了解程度。但是這個指標(biāo)的范圍在0-90之間,分布圖如下:我們根據(jù)這個指標(biāo)的分布,將選擇數(shù)量在0-40記為1(一般了解),31-50的記為2(比較了解),50-70的記為3(很了解),7
21、0以上的記為4(非常了解)。還有一個重要的指標(biāo)即是股票購買金額。下面我們用這些指標(biāo)建立聚類分析。 D MD MC C股票投資者的購買行為分析股票投資者的購買行為分析 D MD MC C股票投資者的購買行為分析股票投資者的購買行為分析 D MD MC C股票投資者的購買行為分析股票投資者的購買行為分析優(yōu)質(zhì)客戶主婦類客戶潛在優(yōu)質(zhì)客戶普通客戶比較優(yōu)質(zhì)客戶 D MD MC C教育程度較高的男性,對股票非常了解,年齡主要在30-39歲間,職業(yè)大多為管理階層和白領(lǐng),月收入介于3-7萬,中高等的受教育程度較低,高中或高職,男性居多,收入較低,年齡處于30-39歲大多在大專以上,年齡在20-29歲間的白領(lǐng)上班
22、族,收入在3-5萬每月,工作不久年齡在30-50歲的家庭主婦,由于這一類投資者收入較低,大都在1萬以下每月,所以投資金額相對較低,在50萬以下管理階層的男性,對股票也非常了解,教育程度也較高,收入大多在10萬每月以上,所以這類人購買股票的金額很大,在100-500萬股票投資者的購買行為分析股票投資者的購買行為分析關(guān)聯(lián)程度分析: D MD MC C普通客戶和潛在優(yōu)質(zhì)客戶,這兩類目前購買的股票金額都差不多,但是一類會逐漸成為潛在優(yōu)普通客戶和潛在優(yōu)質(zhì)客戶,這兩類目前購買的股票金額都差不多,但是一類會逐漸成為潛在優(yōu)質(zhì)客戶或者上升為優(yōu)質(zhì)客戶,一類可能停滯不前,作為證券公司要挖掘出潛在優(yōu)質(zhì)客戶,為他質(zhì)客戶
23、或者上升為優(yōu)質(zhì)客戶,一類可能停滯不前,作為證券公司要挖掘出潛在優(yōu)質(zhì)客戶,為他們提供細(xì)致的理財服務(wù),贏取未來的優(yōu)質(zhì)客戶。其次第們提供細(xì)致的理財服務(wù),贏取未來的優(yōu)質(zhì)客戶。其次第1類比較優(yōu)質(zhì)客戶和第類比較優(yōu)質(zhì)客戶和第3類潛在優(yōu)質(zhì)客類潛在優(yōu)質(zhì)客戶的關(guān)聯(lián)程度很高,因為他們大多有著相同的背景戶的關(guān)聯(lián)程度很高,因為他們大多有著相同的背景。4.4 美金購買者行為分析美金購買者行為分析v 4.4.1 美金購買者的描述性統(tǒng)計分析 D MD MC C4.4.1 美金購買者的描述性統(tǒng)計分析美金購買者的描述性統(tǒng)計分析 D MD MC C4.4.2 購買美金金額分析購買美金金額分析v 變量的篩選和模型的建立變量的篩選和模
24、型的建立將所有個人信息的變量輸入作為自變量,將所有個人信息的變量輸入作為自變量,SQL從中抽取一部分樣本,進(jìn)行驗證,根據(jù)從中抽取一部分樣本,進(jìn)行驗證,根據(jù)SQL的建議的建議選擇選擇“年齡年齡”,“教育程度教育程度”,“職業(yè)職業(yè)”,“性別性別”和和“收入收入”作為自變量作為自變量,分別建立決策樹,分別建立決策樹,邏輯回歸,貝葉斯模型來預(yù)測被訪者是否購買股票。邏輯回歸,貝葉斯模型來預(yù)測被訪者是否購買股票。 D MD MC Cv 三個模型的精確度分析三個模型的精確度分析提升圖:提升圖: D MD MC C4.4.2 購買美金金額分析購買美金金額分析v 分類矩陣:分類矩陣: D MD MC C選擇決策
25、樹作為我們最終模型4.4.2 購買美金金額分析購買美金金額分析相依程度: D MD MC C影響投資者購買美金金額的因素由強(qiáng)到弱為:收入年齡教育程度性別職業(yè)。4.4.2 購買美金金額分析購買美金金額分析v 模型分析決策樹 D MD MC C4.4.2 購買美金金額分析購買美金金額分析v 模型分析決策樹模型分析決策樹 D MD MC C4.4.2 購買美金金額分析購買美金金額分析4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析v 變量的篩選和模型的建立變量的篩選和模型的建立有41.21%的美金購買者購買了股票,下面分析是什么樣的投資者既投資股票也投資美金。 D MD MC C
26、4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析v變量的篩選和模型的建立變量的篩選和模型的建立我們?nèi)匀灰許QL內(nèi)部篩選的變量作為自變量,來進(jìn)行預(yù)測。發(fā)現(xiàn)只有年齡和職業(yè)決定美金購買者是否購買股票。 D MD MC Cv 三個模型的精確度分析三個模型的精確度分析提升圖:提升圖: D MD MC C4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析v 分類矩陣:分類矩陣: D MD MC C選擇決策樹作為我們最終模型4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析相依程度: D MD MC C對于購買美金的投資者,影響其是否購買股票的主要因素
27、依據(jù)重要程度排序分別是年齡和職業(yè)。4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析相依程度v 模型分析決策樹模型分析決策樹 D MD MC C4.4.3 美金投資者中股票購買行為分析美金投資者中股票購買行為分析4.5 期貨購買者行為分析期貨購買者行為分析v 4.5.1 期貨投資者的描述統(tǒng)計分析 D MD MC C 4.5.2 期貨購買金額分析期貨購買金額分析v 變量的篩選和模型的建立變量的篩選和模型的建立前面分析得出期貨投資者中,83.4%的投資金額在50萬臺幣以下,16.6%的在101-500之間?,F(xiàn)在我們來看是哪些因素影響期貨購買的金額。將所有個人信息的變量輸入作為自變
28、量,SQL從中抽取一部分樣本,進(jìn)行驗證,根據(jù)SQL的建議選擇“性別”,“年齡”,“是否購買股票”,“職業(yè)”和“收入”作為自變量,分別建立決策樹,邏輯回歸,貝葉斯模型來預(yù)測投資者購買的期貨金額。 D MD MC Cv 三個模型的精確度分析三個模型的精確度分析提升圖:提升圖: D MD MC C4.5.2 期貨購買金額分析期貨購買金額分析v 分類矩陣:分類矩陣: D MD MC C三種方法的預(yù)測精度預(yù)測效果都很好,模型的得分都達(dá)到了1,分類矩陣可以看出,每一個都預(yù)測準(zhǔn)確。所以我們可以任意選擇一個模型來進(jìn)行分析。我們選擇貝葉斯模型來分析購買期貨金額的影響因素的強(qiáng)弱,用邏輯模型來分析哪些投資者投資金額
29、為1, 哪些為3。4.5.2 期貨購買金額分析期貨購買金額分析相依程度: D MD MC C從貝葉斯的依賴關(guān)系網(wǎng)絡(luò)來看,影響投資者購買期貨金額的因素由強(qiáng)到弱為職業(yè)性別教育程度年齡收入。4.5.2 期貨購買金額分析期貨購買金額分析4.5.3 期貨投資者中股票購買行為分析期貨投資者中股票購買行為分析v 變量的篩選和模型的建立變量的篩選和模型的建立對期貨購買者而言,我們有必要分析他們其他的投資行為,看其是否購買股票,以作為我們挖掘期貨購買者中潛在的股票購買者的依據(jù)。 D MD MC C4.5.3 期貨投資者中股票購買行為分析期貨投資者中股票購買行為分析v 變量的篩選和模型的建立變量的篩選和模型的建立
30、我們?nèi)匀灰許QL內(nèi)部篩選的變量作為自變量,來進(jìn)行預(yù)測。發(fā)現(xiàn)“期貨金額”,“性別”,“年齡”,“教育程度”,“職業(yè)”和“收入”等變量都可以作為自變量來影響期貨購買者是否購買股票。 D MD MC Cv 三個模型的精確度分析三個模型的精確度分析提升圖:提升圖: D MD MC C4.5.3 期貨投資者中股票購買行為分析期貨投資者中股票購買行為分析v 分類矩陣:分類矩陣: D MD MC C由于模型的準(zhǔn)確率達(dá)到了99.24%,預(yù)測效果較好??梢匀我膺x擇一個選擇決策樹作為分析模型。4.5.3 期貨投資者中股票購買行為分析期貨投資者中股票購買行為分析模型 D MD MC C在購買了期貨的人群中,決定他們
31、是否購買股票的主要因素是他們的職業(yè)。由上圖可以看出藍(lán)領(lǐng)工作者和家庭主婦全部沒有購買股票,白領(lǐng)工作者全部購買了股票。4.5.3 期貨投資者中股票購買行為分析期貨投資者中股票購買行為分析第五章第五章 研究結(jié)論及其建議研究結(jié)論及其建議研究總結(jié)研究總結(jié)1對證券公司的建議對證券公司的建議2對美金承銷商的建議對美金承銷商的建議3對期貨公司的建議對期貨公司的建議4對上市公司的建議對上市公司的建議5 D MD MC C5.1 研究總結(jié)研究總結(jié)1.數(shù)據(jù)量大,數(shù)據(jù)復(fù)雜:臺灣輔仁大學(xué)統(tǒng)計資訊學(xué)系的數(shù)據(jù)量大,數(shù)據(jù)復(fù)雜:臺灣輔仁大學(xué)統(tǒng)計資訊學(xué)系的 調(diào)查中心獲得的調(diào)查中心獲得的490088,在在32個問題中數(shù)據(jù)中有個問題
32、中數(shù)據(jù)中有18題是多選題,而且其中一半的選項達(dá)到題是多選題,而且其中一半的選項達(dá)到23項,形成了項,形成了350 490088數(shù)據(jù)。數(shù)據(jù)。2.變量細(xì)分:變量細(xì)分: 將其歸為篩選變量(用以劃分?jǐn)?shù)據(jù)集);證券投資變量,用以反映被訪者將其歸為篩選變量(用以劃分?jǐn)?shù)據(jù)集);證券投資變量,用以反映被訪者對證券行業(yè)的了解和購買情況;其他金融產(chǎn)品對證券行業(yè)的了解和購買情況;其他金融產(chǎn)品(美金和期貨美金和期貨)投資行為分析以及個投資行為分析以及個人信息變量(被訪者的性別,年齡,學(xué)歷,職業(yè)和收入等)。人信息變量(被訪者的性別,年齡,學(xué)歷,職業(yè)和收入等)。 3.數(shù)據(jù)集的細(xì)分?jǐn)?shù)據(jù)集的細(xì)分 83.7%是未購買股票的,抽
33、出樣本組成購買和未購買股票的人數(shù)比例為是未購買股票的,抽出樣本組成購買和未購買股票的人數(shù)比例為1:1的樣本的樣本,組成數(shù)據(jù)集組成數(shù)據(jù)集1,來分析是什么因素影響被訪者是否購買股票。股票購,來分析是什么因素影響被訪者是否購買股票。股票購買者,我們將其提出作為數(shù)據(jù)集買者,我們將其提出作為數(shù)據(jù)集2,分析其購買特征,分析其購買特征9243個購買美金的投資者,個購買美金的投資者,將其抽出作為數(shù)據(jù)集將其抽出作為數(shù)據(jù)集3,分析其購買美金的行為特征,分析其購買美金的行為特征63個期貨投資者,將其抽出個期貨投資者,將其抽出作為數(shù)據(jù)集作為數(shù)據(jù)集4,看其購買期貨的行為特征,看其購買期貨的行為特征,及其購買美金和購買其
34、他金融品種之間及其購買美金和購買其他金融品種之間的關(guān)系的關(guān)系. D MD MC C5.2 對證券公司的建議對證券公司的建議收入教育程度職業(yè)年齡影響公眾購買股票的因素,由強(qiáng)到弱分別為: D MD MC C5.2.1 挖掘客戶5.2.1 挖掘客戶挖掘客戶v證券公司想要不斷壯大,很重要的一部分提高自己的客戶,那么如何挖掘出客戶。證券公司想要不斷壯大,很重要的一部分提高自己的客戶,那么如何挖掘出客戶。比如可以和一些其他金融機(jī)構(gòu)合作,比如商業(yè)銀行,期貨公司合作,因為他們手中比如可以和一些其他金融機(jī)構(gòu)合作,比如商業(yè)銀行,期貨公司合作,因為他們手中有相關(guān)客戶,和他們聯(lián)合,給投資者建議多種投資品種,不僅使客戶
35、覺得服務(wù)更到有相關(guān)客戶,和他們聯(lián)合,給投資者建議多種投資品種,不僅使客戶覺得服務(wù)更到位,而且為公司贏得客戶,這種方式成本也相對較低。也可以通過宣傳,得到公眾位,而且為公司贏得客戶,這種方式成本也相對較低。也可以通過宣傳,得到公眾的認(rèn)可,贏得客戶。的認(rèn)可,贏得客戶。 D MD MC C5.2.2 細(xì)分客戶細(xì)分客戶優(yōu)質(zhì)客戶群投資金額往往很大,投資金額往往很大,在在100萬萬-500萬之間,萬之間,證券公司應(yīng)配備專門證券公司應(yīng)配備專門的員工對其進(jìn)行聯(lián)絡(luò)的員工對其進(jìn)行聯(lián)絡(luò)和跟蹤,并為其提供和跟蹤,并為其提供單獨(dú)和特別的理財建單獨(dú)和特別的理財建議。議。比較優(yōu)質(zhì)客戶群中堅客戶群,他們在中堅客戶群,他們在投
36、資者中的占有量比投資者中的占有量比較大,所以如何為他較大,所以如何為他們提供優(yōu)質(zhì)的服務(wù)是們提供優(yōu)質(zhì)的服務(wù)是整個公司的基礎(chǔ)。整個公司的基礎(chǔ)。潛在優(yōu)質(zhì)客戶群雖然現(xiàn)在還不是公司的雖然現(xiàn)在還不是公司的大客戶,那是由于這類大客戶,那是由于這類人的特點決定的,他們?nèi)说奶攸c決定的,他們大多是剛參加工作的白大多是剛參加工作的白領(lǐng),但是這類人有可能領(lǐng),但是這類人有可能在未來的在未來的10年或更久后年或更久后成為公司的優(yōu)質(zhì)客戶,成為公司的優(yōu)質(zhì)客戶,所以如何將其培養(yǎng)為忠所以如何將其培養(yǎng)為忠誠客戶是證券公司的一誠客戶是證券公司的一大重點。大重點。 D MD MC C普通客戶群家庭主婦客戶群由于收入的限制,他們由于收入的限制,他們每位投資的金額相對較每位投資的金額相對較少。但是由于他們的數(shù)少。但是由于他們的數(shù)量也較大,而且這部分量也較大,而且這部分投資者對公司的口碑也投資者對公司的口碑也很重要,也要針對其投很重要,也要針對其投資量少給他們提供好的資量少給他們提供好的服務(wù)和研究報告。服務(wù)和研究報告。5.2.3 與其他金融機(jī)構(gòu)合作與其他金融機(jī)構(gòu)合作v 在對美金投資者的分析中,有41.21%的美金投資者同時也購買股票。年齡年齡介于介于20到到29歲的歲的,白領(lǐng)購買股
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代理勞務(wù)合同范本
- 免責(zé)免還協(xié)議合同范本
- 農(nóng)村承包山嶺合同范本
- 廠區(qū)物業(yè)安保服務(wù)合同范本
- 化工設(shè)計合同范本
- 包工土建合同范本
- 雙龍租房合同范本
- 代言合同范本
- 修理漁船 承攬合同范本
- 單位監(jiān)制合同范本
- 2019譯林版高中英語全七冊單詞總表
- T-BJCC 1003-2024 首店、首發(fā)活動、首發(fā)中心界定標(biāo)準(zhǔn)
- 園區(qū)宣傳方案
- 銀行承兌匯票和商業(yè)承兌匯票課件
- 特朗普貿(mào)易戰(zhàn)的基本邏輯、本質(zhì)及其應(yīng)對
- 經(jīng)口鼻吸痰法護(hù)理課件
- 《園林生態(tài)學(xué)》課件
- 初中化學(xué)實驗報告單(上)
- 貨物質(zhì)量與安全控制方案
- 高中物理多普勒效應(yīng)練習(xí)題
- 交通事故授權(quán)委托書樣本(通用)
評論
0/150
提交評論