版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Python金融數據分析金融數據分析流程Chapter02金融數據分析概覽1
數據分析宏觀流程2
數據分析微觀流程3
數據樣本及表示
3.1
基本術語
3.2
樣本表示數據分析宏觀流程數據分析宏觀流程明確數據分析的目標和任務。準備數據分析的計算機語言或軟件,本書中對應的是Python及集成開發(fā)環(huán)境Anaconda。各種炊具代表各種Python數據分析庫或包。菜單中的菜肴代表的是各種數據分析的任務和結果展示,例如作為前菜的探索性數據分析、作為主菜的數據建模和模型評價、作為甜點的結論分析等。數據分析宏觀流程食材代表的是金融數據,依賴于數據分析的目標和任務。菜肴的烹飪過程對應于數據分析的過程。珍藏佳釀代表數據分析得出的結論。數據分析微觀流程數據分析微觀流程1)數據讀取。從數據文件、數據庫等數據源讀取數據,得到結構化的二維表數據。2)初步探索性分析。從純數據抽象的角度(不含業(yè)務邏輯)了解數據集的大小、數據缺失、屬性類別、數據分布等情況。3)特征工程?;诔醪教剿餍苑治龅慕Y果進行數據清洗、數據規(guī)范化、特征提取等預處理。數據分析微觀流程4)探索性數據分析。得到規(guī)范的數據集后,在建模之前結合業(yè)務邏輯背景進行一些簡單的統計分析。5)建模分析。包括數據建模、模型評估、模型預測等步驟,這通常是數據分析特別是數據挖掘的主要環(huán)節(jié)。模型可以分為業(yè)務邏輯模型和機器學習模型。6)結論分析及展示。對探索性分析和建模分析的結果進行總結,得出一些有用的規(guī)律和結論。數據樣本及表示典型的結構化數據集是一張二維表,通常稱為一個樣本(sample)或數據集(dataset),從統計學的角度代表對隨機總體的抽樣。樣本的每一行代表一條數據記錄,稱為示例(instance)或樣品,樣本的每一列代表樣品在某一維度上的取值,稱為樣本的屬性(attribute)。數據樣本及表示樣本的屬性有時也會被稱作特征(feature)、字段(field)或者變量(variable)。我們把擁有了標記信息的示例稱為樣例(example)。從回歸的角度看,樣本屬性即自變量或解釋變量,樣本標記即因變量或被解釋變量。二分類問題;多分類問題;回歸問題。
數據樣本及表示數據樣本及表示根據不同的功能,樣本可以被進一步分為訓練集(training
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寵物飼料配方對寵物內分泌系統的調節(jié)作用考核試卷
- 漁業(yè)機械產業(yè)鏈的技術創(chuàng)新與標準化建設考核試卷
- 自行車服務城市安全指數研究考核試卷
- 升降機智能監(jiān)控與故障預測考核試卷
- 硝酸銅制備技術及其在電鍍行業(yè)的應用考核試卷
- 電氣安裝工程施工考核試卷
- 植物園突發(fā)事件應急處理考核試卷
- 網絡安全教育的國際化合作
- 肝臟移植模型評估新生兒肝炎治療干預
- 遠程醫(yī)療的創(chuàng)新和影響
- 化學螺栓后置錨固埋件施工工法介紹
- 五官科臨床路徑實施方案
- 平均法作業(yè)表
- Jeopardy—英語課堂游戲(課堂PPT)
- 五上U2Storytime
- 兩位數乘以一位數計算題豎式200題
- 旅游翻譯中用詞及翻譯
- 常規(guī)儀表原理與控制要點
- 業(yè)務運營序列專業(yè)知識認證題庫(4)
- 顯微鏡的歷史(課堂PPT)
- 克萊采爾42首練習曲Word版(共67頁)
評論
0/150
提交評論