版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、新股上市合理定價(jià)區(qū)間預(yù)測(cè)二五年四月日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/7工程目的1.11.1工程目的 基金金融工程數(shù)據(jù)庫(kù)中有著中國(guó)一千多只股票及幾百只基金的根底財(cái)務(wù)數(shù)據(jù)、股權(quán)信息、資本運(yùn)作信息及每個(gè)買賣日的行情公告信息。金融工程數(shù)據(jù)庫(kù)是一個(gè)海量的數(shù)據(jù)。作為基金管理單位,針對(duì)如此海量的信息記錄,如何保證從這些數(shù)據(jù)中提取關(guān)鍵信息,找到有潛力的股票,改善持股構(gòu)造, 為基金管理部門相關(guān)決策提供根據(jù)與導(dǎo)游,是我們數(shù)據(jù)發(fā)掘的目的。由于這個(gè)標(biāo)題太大,我們選擇其中一個(gè)較小范圍的新股
2、發(fā)行方面的數(shù)據(jù)進(jìn)展發(fā)掘。 新股發(fā)行時(shí),每個(gè)股票有所屬行業(yè),募集資金合計(jì),發(fā)行市盈率,二級(jí)市場(chǎng)配售發(fā)行數(shù)量,預(yù)測(cè)凈利潤(rùn),上市首日表現(xiàn)等可統(tǒng)計(jì)信息。對(duì)這些數(shù)據(jù)進(jìn)展發(fā)掘,預(yù)測(cè)某只規(guī)模的新股上市時(shí)合理定價(jià)區(qū)間。過(guò)程中需求運(yùn)用數(shù)據(jù)發(fā)掘課程中的一些關(guān)鍵技術(shù)和思想,比如聚類分析、OLAP、決策樹等方法表達(dá)在數(shù)據(jù)的抽取、數(shù)據(jù)的存儲(chǔ)和管理、數(shù)據(jù)的展現(xiàn)和預(yù)測(cè)價(jià)值等過(guò)程中。日期: 2022/3/7工程步驟確定工程目的; 選取典型范圍的新股上市的數(shù)據(jù)源與相關(guān)數(shù)據(jù)字典;數(shù)據(jù)庫(kù)建立與數(shù)據(jù)清理任務(wù);定義數(shù)據(jù)堆積維度和衡量值; 確定數(shù)據(jù)發(fā)掘的實(shí)際方法聚類、決策樹;學(xué)會(huì)運(yùn)用Microsoft SQL Server 2000 E
3、nterprise 和Analysis Server OLAP/Data Mining工具;設(shè)計(jì)定義發(fā)掘模型和算法; 預(yù)測(cè)結(jié)果測(cè)試。 1.2 工程步驟 日期: 2022/3/7工程概述1.3 工程步驟圖 工程步驟圖日期: 2022/3/71.4 工具引見 SQL Server 2000 為用戶提供了大規(guī)模聯(lián)機(jī)事務(wù)處置 (OLTP)、數(shù)據(jù)倉(cāng)庫(kù)和電子商務(wù)運(yùn)用程序所需的最新的出色數(shù)據(jù)庫(kù)平臺(tái)。SQL Server 2000 為用戶提供了完選集成的可擴(kuò)展標(biāo)志言語(yǔ) (XML) 環(huán)境、在分析效力中添加了新的數(shù)據(jù)發(fā)掘功能、用元數(shù)據(jù)效力加強(qiáng)了知識(shí)庫(kù)技術(shù) 工程概述工具引見日期: 2022/3/7目錄工程概述 時(shí)間
4、安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/7總體時(shí)間安排小組各成員分工協(xié)作,完成各自的目的完成課題報(bào)告初稿開題預(yù)備報(bào)告定稿,爭(zhēng)辯 4月16日4月18日4月20日4月22日4月24日4月26日4月28日4月30日5月2日5月4日5月6日5月8日5月10日提交結(jié)果報(bào)告確定課題研討內(nèi)容和方向并明確各成員分工 課題研討課題終了日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/7研討內(nèi)容3.1 建立根本概念
5、數(shù)據(jù)發(fā)掘概念 ; 可用于數(shù)據(jù)發(fā)掘的數(shù)據(jù)類型 ;數(shù)據(jù)發(fā)掘功能及發(fā)掘類型的方式 ;數(shù)據(jù)發(fā)掘系統(tǒng)了解 ; 數(shù)據(jù)發(fā)掘預(yù)處置 ;決策樹概念與算法了解 ;其它發(fā)掘方式的了解 ; 建立根本概念日期: 2022/3/73.2 數(shù)據(jù)源 基金金融工程數(shù)據(jù)庫(kù) ; 新股發(fā)行主要部分; 證券列表, 公司列表, 板塊列表 ;上市公司財(cái)務(wù)數(shù)據(jù) ; 股票買賣數(shù)據(jù) ;上市公司股權(quán)信息;上市公司高管信息; 其他信息法人代表、注冊(cè)地址、等 ;研討內(nèi)容數(shù)據(jù)源日期: 2022/3/73.3 算法研討 根本上我們小組采用決策樹算法。 決策樹算法是以樹的構(gòu)造顯示的分類方式,其中樹構(gòu)造中的節(jié)點(diǎn)代表進(jìn)一步對(duì)數(shù)據(jù)進(jìn)展分類的單個(gè)問題。創(chuàng)建決策樹的
6、各種方法數(shù)十年來(lái)廣泛運(yùn)用,而且有大量的著作講述這些統(tǒng)計(jì)技術(shù)。 決策樹發(fā)掘模型運(yùn)用名為遞歸分區(qū)的過(guò)程,根據(jù)事例集提供的特性將數(shù)據(jù)劃分為假設(shè)干個(gè)分區(qū)。然后,它將這些新建分區(qū)劃分為更多的分區(qū),并且不斷劃分下去,直到無(wú)法執(zhí)行有用的劃分。 研討內(nèi)容算法研討日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/7團(tuán)隊(duì)分工 小組各成員都分別擔(dān)任課題的一部分研討內(nèi)容,每個(gè)人都是課題能順利完成不可短少的一部分。日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)
7、轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/71.1.1.1.1 行情(TB_OBJECT_1120)主鍵:OB_OBJECT_ID獨(dú)一性約束:(F1_1120, F2_1120)序號(hào)字段字段名1OB_OBJECT_ID對(duì)象ID2F2_1120日期3F1_1120證券ID4F4_1120昨收盤價(jià)5F5_1120開盤價(jià)6F6_1120最高價(jià)7F7_1120最低價(jià)8F8_1120最新價(jià)9F9_1120成交量(手)10F11_1120成交金額(千元)行情(TB_OBJECT_1120) 行情日期: 2022/3/7新股發(fā)行(TB_OBJECT_1095) 序號(hào)字段字段名
8、1OB_OBJECT_ID對(duì)象ID2F1_1095證券ID3F72_1095發(fā)行對(duì)象4F13_1095上網(wǎng)發(fā)行代碼5F42_1095上網(wǎng)發(fā)行簡(jiǎn)稱6F64_1095招標(biāo)詢價(jià)申購(gòu)價(jià)錢下限7F63_1095招標(biāo)詢價(jià)申購(gòu)價(jià)錢上限8F8_1095面值9F10_1095發(fā)行價(jià)錢10F9_1095貨幣代碼新股發(fā)行日期: 2022/3/7證券(TB_OBJECT_1090) 序號(hào)字段字段名1OB_OBJECT_ID對(duì)象ID2F16_1090買賣代碼3F22_1090買賣代碼24OB_OBJECT_NAME_1090證券簡(jiǎn)稱5F3_1090簡(jiǎn)稱拼音6F4_1090證券類型代碼證券日期: 2022/3/72.數(shù)據(jù)
9、倉(cāng)庫(kù)模型設(shè)計(jì)及建立序號(hào)字段字段名1OB_OBJECT_ID證券簡(jiǎn)稱2DP大盤漲跌情況3LTG流通股大小4HY5SYL市盈率6ZF上市首日漲幅行業(yè)大類數(shù)據(jù)倉(cāng)庫(kù)日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/76.1數(shù)據(jù)清理原那么 基金金融工程數(shù)據(jù)庫(kù)中新股上市時(shí)信息數(shù)據(jù)上市首日漲跌情況作為數(shù)據(jù)發(fā)掘的重要目的歷年來(lái)的不同盤子、不同市盈率、不同行業(yè)的新股上市時(shí)首日漲跌幅度的大小,具有預(yù)測(cè)價(jià)值數(shù)據(jù)清理原那么日期: 2022/3/76.2數(shù)據(jù)清理過(guò)程 數(shù)據(jù)清理過(guò)程過(guò)程中需求運(yùn)用數(shù)據(jù)發(fā)掘課程
10、中的一些關(guān)鍵技術(shù)和思想,比如聚類分析、OLAP、決策樹等方法表達(dá)在數(shù)據(jù)的抽取、數(shù)據(jù)的存儲(chǔ)和管理、數(shù)據(jù)的展現(xiàn)和預(yù)測(cè)價(jià)值等過(guò)程中。預(yù)測(cè)一定運(yùn)營(yíng)規(guī)模企業(yè)具有良好盈利率曲線的所在行業(yè)、所屬類型。日期: 2022/3/76.3研討目的數(shù)據(jù) 從1991-2005年的股票發(fā)行范圍內(nèi)進(jìn)展數(shù)據(jù)提??;新股發(fā)行主要成分 證券列表, 公司列表, 板塊列表; 上市公司財(cái)務(wù)數(shù)據(jù) 股票首日買賣數(shù)據(jù) 研討目的數(shù)據(jù)日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算及工程展望知識(shí)發(fā)現(xiàn)日期: 2022/3/77.1確定對(duì)象數(shù)據(jù)表關(guān)系確定對(duì)象數(shù)據(jù)表關(guān)系日期:
11、2022/3/77.2定義數(shù)據(jù)維度定義數(shù)據(jù)維度日期: 2022/3/77.3多維數(shù)據(jù)集處置過(guò)程多維數(shù)據(jù)集處置過(guò)程日期: 2022/3/77.4數(shù)據(jù)集查看 數(shù)據(jù)集查看日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算知識(shí)發(fā)現(xiàn)及工程展望日期: 2022/3/78.1微軟決策樹微軟決策樹決策樹是以樹的構(gòu)造顯示的分類方式,其中樹構(gòu)造中的節(jié)點(diǎn)代表進(jìn)一步對(duì)數(shù)據(jù)進(jìn)展分類的單個(gè)問題。創(chuàng)建決策樹的各種方法數(shù)十年來(lái)廣泛運(yùn)用,而且有大量的著作講述這些統(tǒng)計(jì)技術(shù)。決策樹發(fā)掘模型運(yùn)用名為遞歸分區(qū)的過(guò)程,根據(jù)事例集提供的特性將數(shù)據(jù)劃分為假設(shè)干個(gè)分區(qū)。
12、然后,它將這些新建分區(qū)劃分為更多的分區(qū),并且不斷劃分下去,直到無(wú)法執(zhí)行有用的劃分。 日期: 2022/3/78.2發(fā)掘模型 發(fā)掘模型日期: 2022/3/78.3發(fā)掘結(jié)果查看 發(fā)掘結(jié)果查看日期: 2022/3/7目錄工程概述 時(shí)間安排 研討內(nèi)容 團(tuán)隊(duì)分工 源數(shù)據(jù)表數(shù)據(jù)預(yù)處置數(shù)據(jù)轉(zhuǎn)換和處置據(jù)轉(zhuǎn)換和處置數(shù)據(jù)模型演算知識(shí)發(fā)現(xiàn)及工程展望日期: 2022/3/7知識(shí)發(fā)現(xiàn) 知識(shí)發(fā)現(xiàn)經(jīng)過(guò)上述的數(shù)據(jù)演算和分析不難看出:上市新股中的小盤股漲幅大部分為1-5倍,而大盤股漲幅大部分都在1倍以內(nèi),闡明小盤股首日的表現(xiàn)最正確;新股上市首日的表現(xiàn)根本與市盈率大小根本無(wú)關(guān),闡明中國(guó)股市還不成熟,投機(jī)成分較大;日期: 2022/3/7工程展望 工程展望 由于時(shí)間上的緣由,以及小組成員
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于班風(fēng)學(xué)風(fēng)的精彩發(fā)言稿(5篇)
- 污水處理與可持續(xù)發(fā)展-洞察分析
- 新型密封材料耐磨性分析-洞察分析
- 網(wǎng)絡(luò)均衡與數(shù)據(jù)安全-洞察分析
- 虛擬現(xiàn)實(shí)技術(shù)在火災(zāi)風(fēng)險(xiǎn)培訓(xùn)中的作用-洞察分析
- 虛擬現(xiàn)實(shí)的報(bào)告-洞察分析
- 水利工程風(fēng)險(xiǎn)監(jiān)測(cè)技術(shù)-洞察分析
- 虛擬現(xiàn)實(shí)技術(shù)與心理實(shí)驗(yàn)的結(jié)合-洞察分析
- 用戶畫像在人工智能領(lǐng)域的應(yīng)用與挑戰(zhàn)研究-洞察分析
- 下頜下腺癌化療藥物分子標(biāo)記物-洞察分析
- 口腔癌早期診斷與治療
- 2019-2020學(xué)年上海虹口區(qū)實(shí)驗(yàn)中學(xué)六年級(jí)上學(xué)期英語(yǔ)期末卷及答案
- 供應(yīng)鏈總監(jiān)工作計(jì)劃
- 團(tuán)體輔導(dǎo)準(zhǔn)備篇:結(jié)構(gòu)式團(tuán)體練習(xí)及其應(yīng)用
- 大華硬盤錄像機(jī)操作說(shuō)明
- 社會(huì)保險(xiǎn)職工增減表
- 結(jié)婚函調(diào)報(bào)告表(帶參考)
- 2023-2024學(xué)年江蘇省泰州市姜堰市數(shù)學(xué)六年級(jí)第一學(xué)期期末質(zhì)量檢測(cè)試題含答案
- 表-柴油的理化性質(zhì)及危險(xiǎn)特性
- 婦產(chǎn)科名詞解釋及簡(jiǎn)答題
- 了不起的狐貍爸爸精編版課件
評(píng)論
0/150
提交評(píng)論