版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
CTRCTR預估系統在商業(yè)并線領域有一個非常大的應用,也是非常核心的一個模塊。業(yè)內各大CTR享的是OPPOCTRCTR首先介紹一下CTR預估系統業(yè)務對接的一個場景,應用層主要在應用分發(fā)領域、搜索、聯征或符號。這里面就包含各種各樣的挖掘算法,比如ID特征、統計類特征等;再往上就是CTR),DNN注是ECPM,或者轉化率等,這些通過配置化都是可以實現的。右邊是我們的一些支撐系HadoopSpark、MPI、Kafka等集群系統。OfflineNearlineOnline,時效是從天級接下來講一下我們CTR預估系統的一個演進,我們是從16年開始做CTR預估系統,通過我們可以更細粒度的去統計,比如之前我們有一個排行榜,每個item是一個榜,我們可以161.02.0,從用戶群體的粒度做到真正的個性化(離線、在線預估,特征引擎,batchLR步特征引擎都在CTR2.0版本完成。17年上半年我們主要是做特征工程,各種各樣的特征17OnlineLR去做學習的時候,是怎么快怎么來,最開始是單機liblinear,這個代碼比較簡單易用效果OKsparkmllibSparkLBFGSSGD,發(fā)現前者效果要好些,但是樣本的權重以及線上效果并不是很理想;之后我們切換到了sparkliblinear平臺,他是TRON優(yōu)化算spark的BatchGD算法。支持支持pretrain、稀疏特征優(yōu)化、細粒度正則、checkpoint基于sparkMPI的OWLQN的算法訓練速度7BatchGDMPI是很底層框架,需要很多額外工作。但是有些場景還是無法滿足,比如快速反應類場景無法滿足,因此基于TensorFlowOnlineLRMPIOnlineLR算法及優(yōu)化。我們從spark切換到MPI6小時,需要的核數從1000下降240,BatchModelOnlineModelOnlineModelmodel是偏向歷史樣本還是當前樣本、如何調參、穩(wěn)定性問題(線上斷流,作弊流量很容我們在OnlineLR模型做了一些優(yōu)化,FTRL算法是google在13年提出的一個算法,主要解決在廣告場景下大規(guī)模離線LR訓練的問題。第一項其實是一個梯度,第二項是一個嚴0-tFTRLρt-s,模型會做歷史樣本衰減,隨著樣本不斷訓練,歷史樣本的BatchModelOnlineModel61(BatchLR30OnlineLR每個樣本過濾一遍另一個效果方面在信息流場景下天氣預測方面BatchLR能達到2.6%這么復雜呢?DNNLR10100LRDNN特征。第三個就是業(yè)界的一些經驗,Google、BAT等大公司在深度學習積累很多經驗。DNNDNNtrick、調參難度大(papers不會透露很多細節(jié))。另一個相比于圖像領域,端對端學習,CTR預估面對的是非標準化CTR預估是用在線上而不是刷比賽或者實驗,線上需要達到穩(wěn)定性的要求,對工我們在選型的時候是Google16Wide&DeepLearningforRecommender樣模型層面比較優(yōu)雅,我們先前的LR有很多經驗可以借鑒。在我們網絡結構確定后,我們如何去落地去實現這個系統。深度學習框架有很多,如TensorFlow、Caffe、Keras、CNTK等,TensorFlow相對于其他框架優(yōu)點在于:易用性們優(yōu)化就是將python邏輯下發(fā)到C++層,另一個算子、io、特征工程性能優(yōu)化,做到更CNNRNN,因此我們自己去EmbeddingPythonJava生命周期,最大限度進行cache,提升提取性能。最后講一下快速實驗機制&EE的一些工作。隨著系統復雜度增加,各種調參和調參,比如bin做A/BText,特征升級等都能做,后面參數調整大部分都是可以支持的。因為探索是不確定性的,效果可能很差;另一個是效果的評估很難,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社交媒體運營總結
- 二零二五年度企業(yè)財務報表分析及投資建議合同范本3篇
- 二零二五年度購物中心物業(yè)管理合同延期及消防設施補充協議范本3篇
- 二零二五年度個人消費貸款合同貸后管理服務標準4篇
- 二零二五版水電站經營權承包與電力價格協商合同3篇
- 報銷流程及相關知識培訓
- 豐富教學手段增強學生語文素養(yǎng)
- 二零二五年度個人合伙清算協議書(清算期間債務重組)4篇
- 新課標人教版小學語文六年級下冊復習題及答案
- 二零二五版水利工程臨時設施搭建勞務分包合同示范文本3篇
- 浙江省寧波市九校2024-2025學年高一上學期期末聯考試題 數學 含答案
- 北京市石景山區(qū)2024-2025學年九年級上學期期末考試數學試卷(含答案)
- 杜邦公司十大安全理念
- 廣聯達2024算量軟件操作步驟詳解
- 2025年新高考語文模擬考試試卷(五) (含答案解析)
- 教育部《中小學校園食品安全和膳食經費管理工作指引》專題培訓
- 中國共產主義青年團團章
- 人教版(2024)七年級英語上冊++單詞默寫-艾賓浩斯記憶法-上
- 暖通空調基礎知識及識圖課件
- 作物栽培學課件棉花
- 防滲墻工程施工用表及填寫要求講義
評論
0/150
提交評論