![矩陣略圖與流數(shù)據(jù)機器學習_第1頁](http://file4.renrendoc.com/view14/M0A/39/01/wKhkGWdnYjaAd54CAACVEqEndVc801.jpg)
![矩陣略圖與流數(shù)據(jù)機器學習_第2頁](http://file4.renrendoc.com/view14/M0A/39/01/wKhkGWdnYjaAd54CAACVEqEndVc8012.jpg)
![矩陣略圖與流數(shù)據(jù)機器學習_第3頁](http://file4.renrendoc.com/view14/M0A/39/01/wKhkGWdnYjaAd54CAACVEqEndVc8013.jpg)
![矩陣略圖與流數(shù)據(jù)機器學習_第4頁](http://file4.renrendoc.com/view14/M0A/39/01/wKhkGWdnYjaAd54CAACVEqEndVc8014.jpg)
![矩陣略圖與流數(shù)據(jù)機器學習_第5頁](http://file4.renrendoc.com/view14/M0A/39/01/wKhkGWdnYjaAd54CAACVEqEndVc8015.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
矩陣略圖與流數(shù)據(jù)機器學習報告提綱流數(shù)據(jù)計算與學習背景介紹FrequentDirections(FD)矩陣略圖算法簡介OurWorks滑動窗口上的最優(yōu)矩陣略圖算法矩陣略圖加速老虎機的通用框架總結與展望數(shù)據(jù)流模型數(shù)據(jù)流是一個由海量數(shù)據(jù)組成的數(shù)據(jù)序列SinglePass:每個數(shù)據(jù)最多訪問一次SmallSpace:存儲空間非常小Smalltime:更新(插入刪除)速度快CPU內存:數(shù)據(jù)摘要回答近似查詢頻繁項有哪些/數(shù)據(jù)分布是什么/Top-K是什么?流式機器學習StreamEfficientLearning(LearnabilitywithTime-SharingComputationalResourceConcerns),
Zhi-hua
Zhou傳統(tǒng)機器學習流式機器學習數(shù)據(jù)特性基于預先給定的有限數(shù)據(jù)集處理潛在無限且不斷變化的數(shù)據(jù)流數(shù)據(jù)大小數(shù)據(jù)集大小已知,數(shù)據(jù)集包含所有數(shù)據(jù)數(shù)據(jù)流可能無限大,需要及時處理數(shù)據(jù)變化數(shù)據(jù)特征在數(shù)據(jù)集中已隱含,假設不變數(shù)據(jù)特征可能隨時間變化計算/存儲資源假設有足夠的資源處理所有數(shù)據(jù)有限的資源,需要及時處理數(shù)據(jù)學習策略通常采用離線學習策略需要近似的略圖算法和動態(tài)調整策略Z.-H.Zhou,“LearnabilitywithTime-SharingComputationalResourceConcerns,”Aug.24,2024,arXiv:arXiv:2305.02217.Accessed:Oct.08,2024.[Online].Available:/abs/2305.02217流式機器學習StreamEfficientLearning(LearnabilitywithTime-SharingComputationalResourceConcerns),
Zhi-hua
Zhou計算/存儲資源受限潛在的
無限數(shù)據(jù)流流量變化
突發(fā)/空閑
分布變化流學習模型調度策略高效算子流式高效機器學習設計高效吞吐能力的流數(shù)據(jù)算法刻畫誤差與計算/存儲復雜度之間的理論關系依據(jù)數(shù)據(jù)流變化動態(tài)分析需要使用的流數(shù)據(jù)算子自適應地實現(xiàn)計算資源與近似精度的折中ML4Sketch&
Sketch4ML機器學習優(yōu)化的略圖算法(ML4Sketch)基于學習的頻率估計[Hsuetal.2019]基于學習的低秩近似[Indyketal.2019]基于學習的分位數(shù)估計[Schieferetal.2023]基于學習的子圖計數(shù)估計[Zhaoetal.2023]略圖算法優(yōu)化的機器學習(Sketch4ML)在線學習線性老虎機算法[Kuzborskijetal.2019,Yuetal.2017]在線梯度下降[Luoetal.2016]核學習增量略圖近似核矩陣[Zhangetal.2019]圖機器學習動態(tài)圖上的異常檢測[Bhatiaetal.2023]本次報告聚焦數(shù)據(jù)流上的矩陣略圖算法及其在流式機器學習上的應用矩陣近似問題
矩陣近似問題
矩陣近似問題
矩陣近似問題
矩陣近似問題
矩陣近似問題…
矩陣近似問題…
…
矩陣略圖(Matrix
Sketch)相關工作FrequentDirections(FD)Sketch[Liberty,KDD’13,BestPaper]
LM-FD&DI-FDSketch[Weietal.,SIGMOD’16]
SparseFDSketch[Huang,ICML’18,BestPaperrunnerup]滑動窗口上的矩陣略圖算法數(shù)據(jù)流上的矩陣略圖算法稀疏向量流上的矩陣略圖算法可持久化的矩陣略圖算法FDATTP&FDBITPSketch[Shietal.,SIGMOD’21]滑動窗口上的最優(yōu)矩陣略圖算法DS-FDSketch[Yinetal.,VLDB’24,BestPaperNomination]
矩陣略圖在流式機器學習上的研究和應用線性老虎機算法[Kuzborskijetal.,AISTATS’19][Chenetal.,IJCAI’20]
在線核學習[Zhangetal.,ICML’19]圖機器學習[Bhatiaetal.,KDD’23]報告提綱流數(shù)據(jù)計算與學習背景介紹FrequentDirections(FD)矩陣略圖算法簡介OurWorks滑動窗口上的最優(yōu)矩陣略圖算法矩陣略圖加速老虎機的通用框架總結與展望FD算法
FD算法
FD算法
FD算法
FD算法
FD算法
FD算法
FD算法
FD算法
FD算法
從頻率估計問題出發(fā)理解FD算法
CPUMemoryi1i1i2i5i9i1i1i9i7Nitemsi3頻率估計問題
CPUMemoryi1i1i2i5i9i1i1i9i3i7Nitems頻率估計問題
CPUMemoryi1i1i2i5i9i1i1i9i3i7NitemsMisra-Gries摘要(1982)
123456789
Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
123456789
Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
123456789Demaine,Lopez-Ortiz與Munro(2002)Karp,Shenker與Papadimitriou(2003)
Misra-Gries摘要(1982)
Misra-Gries算法分析
123456789
111…1234567895613
頻率估計可視為一種特殊的矩陣略圖頻率估計矩陣略圖頻率估計v.s.矩陣略圖
123456789頻率估計矩陣略圖123456789111…1234567895623
頻率估計可視為一種特殊的矩陣略圖1頻率估計v.s.矩陣略圖
123456789頻率估計矩陣略圖123456789111…1234567895623
頻率估計可視為一種特殊的矩陣略圖1頻率估計v.s.矩陣略圖
123456789頻率估計矩陣略圖123456789111…1234567895623
頻率估計可視為一種特殊的矩陣略圖111頻率估計v.s.矩陣略圖
123456789頻率估計矩陣略圖123456789111…1234567895623
頻率估計可視為一種特殊的矩陣略圖111頻率估計v.s.矩陣略圖
123456789頻率估計v.s.矩陣略圖頻率估計矩陣略圖123456789111…1234567895623
頻率估計可視為一種特殊的矩陣略圖11111
123456789頻率估計v.s.矩陣略圖頻率估計矩陣略圖123456789111…123456789563
頻率估計可視為一種特殊的矩陣略圖111112
123456789
256131111111
123456789頻率估計v.s.矩陣略圖頻率估計矩陣略圖123456789111…123456789563
頻率估計可視為一種特殊的矩陣略圖111112
123456789
14521111
123456789
頻率估計v.s.矩陣略圖頻率估計矩陣略圖123456789123456789111…123456789
頻率估計可視為一種特殊的矩陣略圖1114512
FrequentDirections算法分析
E.Liberty,“Simpleanddeterministicmatrixsketching,”inProceedingsofthe19thACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining,ChicagoIllinoisUSA:ACM,Aug.2013,pp.581–588.
報告提綱流數(shù)據(jù)計算與學習背景介紹FrequentDirections(FD)矩陣略圖算法簡介OurWorks滑動窗口上的最優(yōu)矩陣略圖算法矩陣略圖加速老虎機的通用框架總結與展望滑動窗口上的矩陣近似問題
流數(shù)據(jù)模型vs.滑動窗口模型滑動窗口上的矩陣略圖問題流數(shù)據(jù)上的矩陣略圖問題
流數(shù)據(jù)模型vs.滑動窗口模型滑動窗口上的矩陣略圖問題流數(shù)據(jù)上的矩陣略圖問題
流數(shù)據(jù)模型vs.滑動窗口模型滑動窗口上的矩陣略圖問題流數(shù)據(jù)上的矩陣略圖問題
流數(shù)據(jù)模型vs.滑動窗口模型滑動窗口上的矩陣略圖問題流數(shù)據(jù)上的矩陣略圖問題
滑動窗口上的最優(yōu)矩陣略圖算法問題:滑動窗口上的矩陣略圖的最優(yōu)空間復雜度為多少?
LM-FDDi-FD
DS-FDSlidingwindow
FDFull
Stream
2016-2016OurworkVLDB‘24BestPaperNomination2013KDD‘13BestPaper滑動窗口算法數(shù)據(jù)流算法頻率估計問題矩陣略圖問題思路:與頻率估計問題建立聯(lián)系!思路:與頻率估計問題建立聯(lián)系!滑動窗口算法
數(shù)據(jù)流算法頻率估計問題矩陣略圖問題滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口上的矩陣略圖問題
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:頻率估計v.s.矩陣略圖滑動窗口上的頻率估計問題滑動窗口上的矩陣略圖問題i1i1i2i5i9i1i1i9i3i7N=4
滑動窗口:MGv.s.FD123456789頻率估計SlidingWindowMG[PODS2006]矩陣略圖182537
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.123456789182537
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖滑動窗口:MGv.s.FD
12345678948182537
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
12345678948182537
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374818
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
2512345678937481855
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
25123456789374855
L.K.LeeandH.F.Ting,“Asimplerandmoreefficientdeterministicschemeforfindingfrequentitemsoverslidingwindows,”inProceedingsofthetwenty-fifthACMSIGMOD-SIGACT-SIGARTsymposiumonPrinciplesofdatabasesystems,Jun.2006,pp.290–297.頻率估計SlidingWindowMG[PODS2006]矩陣略圖
滑動窗口:MGv.s.FD
Time頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]123456789
TimeHanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD
Time123456789
Time
HanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]
Time123456789
Time
HanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]
Time123456789
Time
=HanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]
Time123456789
Time
=
HanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]
Time123456789
Time
HanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024滑動窗口:MGv.s.FD頻率估計SlidingWindowMG[PODS2006]矩陣略圖OurMethod
[VLDB2024]非歸一化向量&
Time-basedModel
Level0Level1Level2
Time......
...CurrentWindowExpiredSnapshotDroppedSnapshotSavedSnapshotOptimalHanyanYin,DongxieWen,JiajunLi,ZheweiWei,XiaoZhang,ZengfengHuang,FeifeiLi.OptimalMatrixSketchingoverSlidingWindows.VLDB2024最優(yōu)性證明
…
…
SlidingWindow1SlidingWindow2
實驗結果相比于其他算法,使用相同空間開銷可達成更好的估計質量實驗中算法的實際誤差從未超出理論誤差界報告提綱流數(shù)據(jù)計算與學習背景介紹FrequentDirections(FD)矩陣略圖算法簡介OurWorks滑動窗口上的最優(yōu)矩陣略圖算法矩陣略圖加速老虎機的通用框架總結與展望線性老虎機
智能體環(huán)境一組上下文(contexts)決策反饋基于矩陣略圖加速老虎機
ScanningDataSketchQueryRLS
Estimate
獎勵向量數(shù)據(jù)矩陣2011-2017
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工項目合同糾紛處理制度
- 施工日志填寫樣本建筑物消防設施工程
- 教師招聘語文面試唐詩三首教學設計
- 兩位好友合作經(jīng)營店鋪合同模板
- 個人與個人借款合同范本
- 中外合資企業(yè)采購合同中英文對照
- 中外合資經(jīng)營企業(yè)合同(適用于零售連鎖業(yè)務)
- 個人二手房交易合同擔保協(xié)議書
- 專利交易合同協(xié)議
- 個人向企業(yè)借款合同樣板
- 老人心理特征和溝通技巧
- 幼兒阿拉伯數(shù)字描紅(0-100)打印版
- 標桿地產(chǎn)集團 研發(fā)設計 工程管理 品質地庫標準研發(fā)成果V1.0
- TMS開發(fā)業(yè)務需求文檔
- 2023年1月浙江高考英語聽力試題及答案(含MP3+錄音原文)
- HI-IPDV10芯片產(chǎn)品開發(fā)流程V10宣課件
- 房產(chǎn)抵押注銷申請表
- 【課件】第三課 蒙娜麗莎 課件高中美術湘美版美術鑒賞
- 象數(shù)療法好療效
- A320系列飛行訓練課程:電子飛行儀表系統(tǒng)概況
- 2020新版?zhèn)€人征信報告模板
評論
0/150
提交評論