版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數(shù)據(jù)實時計算FlinkSQL架構介紹技術創(chuàng)新
變革未來大數(shù)據(jù)實時計算FlinkSQL架構介紹技術創(chuàng)新1目
錄1Background2Flink
SQL
基本概念3Flink
SQL
核心功能4Flink
SQL
優(yōu)化5阿里云流計算產品目錄1Background2FlinkSQL基本概念32BackgroundBackground3Alibaba
Blink阿里巴巴Blink團隊有
20+flinkcontributor,6名
committer,向社區(qū)貢獻了數(shù)百個Commit+=Apache
FlinkAlibaba’s
ImprovementsBlinkAlibaba
BlinkBlink
Runtime+Flink
SQL=AlibabaBlink阿里巴巴Blink團隊有20+4團隊工作主導制定
Flink
SQL
語義DynamicTable
2016-2017Retraction
2016-2017完善
Flink
SQL功能Agg,Join,Window
2017跑通全部
TPCHQuery
2018性能提升大量的查詢優(yōu)化
2017-2018資源配置自動化
2018貢獻社區(qū)貢獻社區(qū)部分貢獻社區(qū)團隊工作主導制定FlinkSQL語義完善Flink5FlinkSQLFlinkSQL6Why
SQL?DeclarativeOneQuery,One
ResultOptimized Understandable StableUnifyWhySQL?DeclarativeOneQuery,7SQL
不是為流設計的沒有Retraction批計算查詢返回一個結果并結束數(shù)據(jù)是有限的批處理流數(shù)據(jù)是無窮的流上的查詢不斷產生結果且不會結束有對歷史數(shù)據(jù)的修改(Retraction)流處理SQL不是為流設計的沒有Retraction批計算查詢返回8動態(tài)表(Dynamic
Table)動態(tài)表(Dynamic
Table): 數(shù)據(jù)會隨著時間變化的表動態(tài)表(DynamicTable)動態(tài)表(Dynamic9動態(tài)表
+
連續(xù)查詢連續(xù)查詢(Continuous
Query):持續(xù)運行的查詢StreamStream連續(xù)查詢StreamStream連續(xù)查詢連續(xù)查詢Stream動態(tài)表+連續(xù)查詢連續(xù)查詢(ContinuousQuer10流計算
Retraction流計算Retraction11流計算
Retraction流計算Retraction12世界上不需要所謂的
Stream
SQL標準的
ANSI
SQL
就可以用來定義流計算世界上不需要所謂的StreamSQL13Flink
SQL
核心功能DDL&
DMLUDF/UDTF/UDAFWindow
AggJoinGroup
AggOver
AggFlinkSQL核心功能DDL&DMLUDF/UDT14LoadingData--
定義數(shù)據(jù)源表CREATETABLEclicks
(VARCHAR,TIMESTAMP,VARCHARusercTimeurl)WITH
(type=
'kafka',topic=
'click_topic',…);SELECT*FROM
clicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1LoadingData--定義數(shù)據(jù)源表VARCHAR,15SavingData--
定義數(shù)據(jù)結果表CREATETABLElast_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'mysql',…);INSERTINTOlast_clicksSELECT*FROMclicksSavingData--定義數(shù)據(jù)結果表usercT16MultiOutputCREATEVIEWtaobao_clicks
ASSELECT*FROMclicksWHEREurlLIKE
'%’INSERTINTOmysql_resultSELECT*FROM
taobao_clicksINSERTINTO
hbase_resultSELECT*FROM
taobao_clicksCREATETABLEmysql_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'mysql',…);CREATETABLEhbase_clicks
(usercTimeurlVARCHAR,TIMESTAMP,VARCHAR,PRIMARYKEY
(user))WITH
(type=
'hbase',…);MultiOutputCREATEVIEWtaoba17Group
AggregateMary1Mary2resultusercntMary3Bob1SELECTuser,COUNT(url)ascntFROM
clicksGROUPBY
userclicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:00:05./prod?id=1Mary12:01:45./prod?id=7從歷史到現(xiàn)在每個用戶點擊的次數(shù)GroupAggregateMary1Mary2resul18Window
Aggregate每小時每個用戶點擊的次數(shù)resultuserendTcntMary13:00:003Bob13:00:001Bob14:00:001Liz14:00:002Bob13:01:00./prod?id=4Liz13:30:00./cartLiz13:59:00./homeSELECTuser,TUMBLE_END(cTime,INTERVAL'1'
HOURS)ASendT,COUNT(url)AS
cntFROM
clicksGROUP
BYuser,TUMBLE(cTime,INTERVAL'1'
HOURS)clicksusercTimeurlMary12:00:00./homeBob12:00:00./cartMary12:02:00./prod?id=2Mary12:55:00./homeWindowAggregate每小時每個用戶點擊的次數(shù)re19雙流
JOIN:支持
INNER,
LEFT,
RIGHT,
FULL,
SEMI,
ANTISELECTo.orderId,ductId,o.orderTime,s.shipTimFROMOrderJOIN
ShipmON
o.orderOrdersorderIdproductIdorderTime53010:17:0061010:17:0591011:02:00121011:24:11ShipmentsorderIdshipTime510:55:00610:20:00911:58:001211:44:00esAS
oentsAS
sId=
s.orderIdresultorderIdproductIdorderTimeshipTime53010:17:0010:55:0061010:17:0510:20:0091011:02:0011:58:00121011:24:1111:44:00雙流JOIN:支持INNER,LEFT,RIGHT,20維表
JOIN:支持
INNER,
LEFTCREATETABLEProducts
(productIdVARCHAR,productNameVARCHAR,price
DECIMAL,PRIMARYKEY(productId),PERIODFOR
SYSTEM_TIME)WITH(type=
'hbase'…);SELECTo.*,p.*FROMOrdersAS
oJOINProductsFORSYSTEM_TIMEASOFPROCTIME()ASpONductId=
ductId維表JOIN:支持INNER,LEFTCREATET21聊幾個優(yōu)化聊幾個優(yōu)化22awabwbDataBaseReduced
ThroughputWaitfor
ResponseadDataBaseabcbcdSend
RequestReceive
RequestWaitConcurrent
ProcessingIncreased
ThroughputSync.
IOAsync.
IO異步維表
JOINawabwbDataBaseReducedThroughp23異步維表
JOINCREATETABLEProducts(productIdVARCHAR,productNameVARCHAR,price
DECIMAL,PRIMARYKEY(productId),PERIODFOR
SYSTEM_TIME)WITH
(type=
'hbase',async=
'true'…);SELECTo.*,p.*FROMOrdersAS
oJOINProductsFORSYSTEM_TIMEASOF
PROCTIME()AS
pONductId=
ductId一行配置的改動異步維表JOINCREATETABLEProducts24AggAggMapMapMap如何處理數(shù)據(jù)傾斜Data-SkewAggAggMapMapMap如何處理數(shù)據(jù)傾斜Data-Sk25如何處理數(shù)據(jù)傾斜Data-SkewAggAggMapMapMapHot!!反壓反壓反壓如何處理數(shù)據(jù)傾斜Data-SkewAggAggMapMapM26如何處理數(shù)據(jù)傾斜Data-SkewLocal-Global
Aggregation
優(yōu)化如何處理數(shù)據(jù)傾斜Data-SkewLocal-Global27如何處理數(shù)據(jù)傾斜Data-SkewLocalAggLocalAggLocalAggGlobalAggGlo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度汽車租賃合同服務內容詳細描述3篇
- 二零二五年度建筑工程勞務承包與信息化建設合同3篇
- 二零二五年度賓館租賃承包與智能客房服務協(xié)議3篇
- 二零二五年度制造業(yè)學徒工勞動合同范本合同模板3篇
- 2025版二零二五年度醫(yī)療健康產業(yè)合伙人合作協(xié)議2篇
- 課程設計物料橫算
- 二零二五年度店鋪個人股份全部轉讓與投資回報合同3篇
- 海南醫(yī)學院《數(shù)字電子技術基礎》2023-2024學年第一學期期末試卷
- 海南醫(yī)學院《電力系統(tǒng)穩(wěn)態(tài)分析實驗》2023-2024學年第一學期期末試卷
- 二零二五年度房地產代理公司脫貧攻堅合作協(xié)議書3篇
- 鼻腔沖洗護理技術團體標準解讀
- 《流感科普宣教》課件
- 紅領巾知識伴我成長課件
- 廚邦醬油推廣方案
- 乳腺癌診療指南(2024年版)
- 腦血管病的三級預防
- 保險產品創(chuàng)新與市場定位培訓課件
- 2022-2023學年山東省淄博四中高二(上)期末數(shù)學試卷含答案
- 《建筑賦比興》一些筆記和摘錄(上)
- 時間管理的原則與方法
- 【A公司人力資源招聘管理問題及優(yōu)化建議分析13000字(論文)】
評論
0/150
提交評論