阿里天池大數(shù)據(jù)競賽實戰(zhàn)_第1頁
阿里天池大數(shù)據(jù)競賽實戰(zhàn)_第2頁
阿里天池大數(shù)據(jù)競賽實戰(zhàn)_第3頁
阿里天池大數(shù)據(jù)競賽實戰(zhàn)_第4頁
阿里天池大數(shù)據(jù)競賽實戰(zhàn)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、阿里天池大數(shù)據(jù)競賽實戰(zhàn):RF&GBRT 完成過程1、Xlab GBRT上手微信公眾號ID: datadw 進入領取資料。1.1、訓練特征表準備訓練的特征表gbrt_offline_section_one_24格式為:user_id,brand_id,feature1,feature2.Label      見下圖:1.2 、建立特征稀疏表,為訓練做準備特征稀疏表可直接在Xlab由原始特征表轉換得到,截圖如下:進入普通表轉稀疏矩陣界面后,在選擇列里填上: user_id對應的列號(表默認從0列開始),brand_id對應的列號,以及想要使用的眾多特征對應的列

2、號(不需要填寫標簽對應的列號?。?;然后在輸出表里填上轉換成的稀疏矩陣:gbrt_offline_section_one_24_1;如下圖1.3 、GBRT訓練       利用訓練的特征表gbrt_offline_section_one_24,進行GBRT訓練,如下圖所以進入配置界面,勾選訓練的標簽,稀疏矩陣名處輸入剛才轉好的稀疏矩陣gbrt_offline_section_one_24_1,模型輸出表處填寫模型輸出表名,參數(shù)配置處根據(jù)效果進行配置(最開始默認就可以的)。如下圖所示:配置好只好就可以進行訓練了,等待訓練好之后等到GBRT預測模型:gbrt

3、_offline_section_one_25;1.4、GBRT預測特征表準備訓練的特征表gbrt_offline_section_two_11格式與訓練特征表格式一樣,為:user_id, brand_id, feature1, feature2.Label      見下圖:1.5、建立預測稀疏矩陣表特征稀疏表可直接在Xlab由原始特征表轉換得到,方法和原來一樣,直接截圖如下:需要注意的是,選擇列必須和訓練時候一樣!1.6、GBRT預測利用轉好的預測稀疏矩陣表gbrt_offline_section_two_11_1進行預測,如下圖所示進入界面如下:model

4、 處填寫剛才訓練好的GBRT模型表:gbrt_offline_section_one_25;輸出表名處填寫預測結果輸出表 gbrt_offline_section_two_13,然后進行預測,如下圖所示:1.7、GBRT碎碎念GBRT預測好之后,得到的結果為與原始預測表gbrt_offline_section_two_11一一對應的單列值y_var(搞不懂為什么不提供類似RF那樣預測結果追加user_id,brand_id 列),如下圖:所以,還得進行追加ID列,進行zxs_gbrt_offline_section_two_13_1和zxs_gbrt_offline_section_

5、two_11_1兩張表的合并,得到類似user_id,brand_id,y_val的表,取閾值進行推薦就可以了,下圖為xlab里提供的腳本,追加ID列代碼。另外:附上腳本實現(xiàn)的代碼,方便測試:2、Xlab RF上手2.1、訓練特征表準備訓練的特征表gbrt_offline_section_one_24格式為:user_id,brand_id,feature1,feature2.Label    (和GBRT時候是一樣的),見下圖所示:                    &

6、#160;      2.2、RF訓練利用訓練的特征表gbrt_offline_section_one_24,進行RF訓練,如下圖所以                          進入配置界面,在Features 框里勾選訓練特征以及該特征連續(xù)與否,在Class框里目標處選擇標簽列,模型輸出表處填寫輸出模型表名:gbrt_offline_section_one_25;進一步,點擊參數(shù)配置選項卡,進入?yún)?shù)配置界面,進行參數(shù)

7、配置,我們主要配置了樹的棵樹,配置好后,進行訓練,如下圖所示:                                                                       訓練結束,得到RF模型表g

8、brt_offline_section_one_25。2.3、RF預測利用預測特征表gbrt_offline_section_two_11進行RF預測,如下圖所示:                      進入配置界面:在結果附加列中添加user_id ,brand_id 列,勾選目標列2分類,主分類為1,這樣預測結果表中就會給出預測為1 的概率值,輸出信息處填寫預測輸出表,進行預測,如下圖:                      

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論