PingCAP平凱星辰投資價值分析報告_第1頁
PingCAP平凱星辰投資價值分析報告_第2頁
PingCAP平凱星辰投資價值分析報告_第3頁
PingCAP平凱星辰投資價值分析報告_第4頁
PingCAP平凱星辰投資價值分析報告_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、目錄 HYPERLINK l _TOC_250012 公司概述:崛起的開源分布式/云數(shù)據(jù)庫平臺級公司 1 HYPERLINK l _TOC_250011 發(fā)展歷程:開源極客攻堅全球數(shù)據(jù)庫技術(shù)高地 1 HYPERLINK l _TOC_250010 產(chǎn)品體系:以 TiDB 開源分布式數(shù)據(jù)庫及生態(tài)工具為核心 3 HYPERLINK l _TOC_250009 商業(yè)模式:商業(yè)開源訂閱+DBaaS 助力開源商業(yè)進程加速 4 HYPERLINK l _TOC_250008 行業(yè)分析:HTAP 與云數(shù)據(jù)庫引領(lǐng)全球第四代數(shù)據(jù)庫變革浪潮 6 HYPERLINK l _TOC_250007 技術(shù)演進:關(guān)系型主導(dǎo)

2、,NewSQL 進化,HTAP 引領(lǐng) 7 HYPERLINK l _TOC_250006 部署模式:數(shù)通世界,云化未來 9 HYPERLINK l _TOC_250005 市場競爭:傳統(tǒng)巨頭轉(zhuǎn)型,數(shù)據(jù)庫新勢力與云廠商角逐 10 HYPERLINK l _TOC_250004 公司分析:技術(shù)硬實力奠基,開源商業(yè)化升維 12 HYPERLINK l _TOC_250003 產(chǎn)品技術(shù):Shared-Nothing+HTAP 精準解決行業(yè)痛點 12 HYPERLINK l _TOC_250002 開源生態(tài):賦能產(chǎn)品迭代、人才高地與合作伙伴體系三大動力引擎 14 HYPERLINK l _TOC_250

3、001 云數(shù)據(jù)庫:專業(yè)性、生態(tài)優(yōu)勢和中立性助力與云巨頭競爭 20 HYPERLINK l _TOC_250000 海外對標:中國 Snowflake,全球 PingCAP 22風(fēng)險因素 24插圖目錄圖 1:公司發(fā)展歷程 2圖 2:TiDB 四大特性 4圖 3:商業(yè)開源訂閱是未來趨勢 4圖 3:TiDB 開源協(xié)議 5圖 4:TiDB 社區(qū)組織架構(gòu)圖 5圖 5:全球數(shù)據(jù)量及同比增速(單位:ZB,%) 7圖 6:全球數(shù)據(jù)庫市場規(guī)模及增速(單位:十億美元,%) 7圖 7:全球 OLTP 市場規(guī)模及增速(單位:億美元,%) 7圖 8:全球 OLAP 市場規(guī)模及增速(單位:億美元,%) 7圖 9:中國關(guān)系

4、型與非關(guān)系型市場規(guī)模及增速(單位:億元,%) 8圖 10:OldSQL、NoSQL、NewSQL 應(yīng)用場景對比 8圖 11:谷歌 HTAP 混合事務(wù)分析架構(gòu) 9圖 12:存儲在公有云和傳統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)比例(單位:%) 10圖 13:全球云/本地數(shù)據(jù)庫市場規(guī)模及增速(單位:億元,%) 10圖 14:DBaaS 數(shù)據(jù)庫即服務(wù) 10圖 15:2016-2018 年全球前十大數(shù)據(jù)庫廠商云數(shù)據(jù)庫收入(單位:百萬美元) 11圖 16:2019 年中國數(shù)據(jù)庫管理系統(tǒng)部分廠商銷售額(單位:億元) 12圖 17:2019 年公有云模式下中國關(guān)系型數(shù)據(jù)庫市場份額(單位:%) 12圖 18:三種數(shù)據(jù)庫架構(gòu)對比圖

5、12圖 19:TiDB 整體架構(gòu)示意圖 13圖 20:TiDB 存儲層節(jié)點示意圖 13圖 21:開源數(shù)據(jù)庫與商業(yè)數(shù)據(jù)庫流行程度對比 15圖 22:不同數(shù)據(jù)庫類型中開源與商業(yè)流行程度對比 15圖 23:截至 2020 年 6 月 TiDB 部分上線客戶 17圖 24:TiDB v4.0 VS v3.0 (TPC-H:OLAP 測試) 18圖 25:TiDB v4.0 VS v3.0 (TPC-C:OLTP 測試) 18圖 26:全球知名開源項目 Github 獲星數(shù)量(單位:個) 19圖 27:數(shù)據(jù)庫選型決定者分布(單位:%) 19圖 28:友鄰合作伙伴體系 20圖 29:三個等級的解決方案合作

6、伙伴對應(yīng)不同要求和權(quán)益 20圖 30:TiDB Cloud 架構(gòu)圖 20圖 31:IDC 關(guān)于企業(yè)是否接受混合云的調(diào)研 21圖 32:2020 年企業(yè)多云部署情況 21圖 33:PayPay 引入 TiDB 后的架構(gòu)圖 22圖 34:公司擁有眾多海外客戶 23表格目錄表 1:公司高管團隊介紹 1表 2:公司研發(fā)團隊介紹 1表 3:公司融資經(jīng)歷 3表 4:核心產(chǎn)品 TiDB 迭代版本 3表 5:PingCAP 云產(chǎn)品定價(基于 AWS 公有云) 6表 6:TiDB 替代其他數(shù)據(jù)庫軟件案例 14表 7:全球知名開源項目 14表 8:中國最活躍開源項目 TOP 10 15表 9:社區(qū)版與商業(yè)版功能與

7、服務(wù)支持區(qū)別 16表 10:2020 年度 TUG MVA(Most Valuable Advocate) 18表 11:公司合作伙伴方案 19表 12:可比公司估值 24 公司概述:崛起的開源分布式/云數(shù)據(jù)庫平臺級公司發(fā)展歷程:開源極客攻堅全球數(shù)據(jù)庫技術(shù)高地PingCAP 成立于 2015 年 4 月,公司創(chuàng)始人為開源極客、知名開源項目 TiDB/TiKV/Codis 創(chuàng)作者劉奇、資深 IT 架構(gòu)師黃東旭以及開源重度愛好者、IT 工程師崔秋。PingCAP 是一家開源的新興分布式數(shù)據(jù)庫公司,提供包括開源分布式數(shù)據(jù)庫產(chǎn)品、解決方案與咨詢、技術(shù)支持與培訓(xùn)認證服務(wù),致力于為全球行業(yè)用戶提供穩(wěn)定高效

8、、安全可靠、開放兼容的新型數(shù)據(jù)基礎(chǔ)設(shè)施,解放企業(yè)生產(chǎn)力,加速企業(yè)數(shù)字化轉(zhuǎn)型升級。截至 2021年 1 月,團隊超 350 人,研發(fā)人員占比超過 70%。2020 年 11 月,公司完成 D 輪融資,融資金額 2.7 億美元,創(chuàng)造全球數(shù)據(jù)庫歷史新的里程碑。表 1:公司高管團隊介紹姓名職務(wù)信息創(chuàng)建了 TiDB、TIKV、Codis 等知名開源項目。曾任京東、豌豆莢資深系統(tǒng)架構(gòu)劉奇黃東旭崔秋PingCAP 創(chuàng)始人兼 CEOPingCAP 聯(lián)合創(chuàng)始人兼 CTOPingCAP 聯(lián)合創(chuàng)始人兼 CFO師,同時也是知名的 Go 語言和 Redis 專家?,F(xiàn)從事開源的分布式 NewSQL 數(shù)據(jù)庫 TiDB 的開

9、發(fā)。擅長高并發(fā)、大規(guī)模、分布式數(shù)據(jù)庫系統(tǒng)架構(gòu)設(shè)計。曾就職于微軟亞洲研究院,網(wǎng)易有道及豌豆莢,PingCAP 聯(lián)合創(chuàng)始人兼 CTO,資深基礎(chǔ)軟件工程師,架構(gòu)師。擅長分布式系統(tǒng)以及數(shù)據(jù)庫開發(fā),在分布式存儲領(lǐng)域有豐富的經(jīng)驗和獨到的見解??駸岬拈_源愛好者以及開源軟件作者,代表作品分布式 Redis 緩存方案 Codis,以及分布式關(guān)系型數(shù)據(jù)庫 TiDB。曾任職于搜狗、豌豆莢,資深廣告系統(tǒng)工程師,長期從事廣告系統(tǒng)基礎(chǔ)組件相關(guān)的研究,現(xiàn)主要從事開源 HTAP 數(shù)據(jù)庫 TiDB/TiKV 相關(guān)的設(shè)計和研發(fā)工作。資料來源:PingCAP 官網(wǎng),公司擁有極具專業(yè)性和全球性的研發(fā)團隊。數(shù)據(jù)庫管理系統(tǒng) DBMS 屬

10、于基礎(chǔ)軟件工程,屬于美國對中國卡脖子清單之一,技術(shù)難度高于操作系統(tǒng),因此對團隊研發(fā)實力要求極高。公司擁有享譽國內(nèi)乃至全球的數(shù)據(jù)庫技術(shù)研發(fā)團隊,成員包括 Rust 編程語言聯(lián)合創(chuàng)始人、火狐瀏覽器內(nèi)核 Servo 主要開發(fā)者 Brian Anderson,Rust 核心團隊成員 Nick Carmeron,以及國內(nèi)知名架構(gòu)師、前金山軟件架構(gòu)團隊核心成員劉聰、唐劉等技術(shù)大牛,為產(chǎn)品研發(fā)、迭代奠定了堅實的基礎(chǔ)。表 2:公司研發(fā)團隊介紹姓名信息Brian AndersonRust 編程語言聯(lián)合創(chuàng)始人,前 Mozilla 研究員,F(xiàn)irefox 新一代內(nèi)核 Servo 的主要開發(fā)者Nick Carmero

11、nRust 編程語言核心團隊成員,前Mozilla 研究員Greg WeberHaskell 編程語言社區(qū)知名開發(fā)者YiWu前 Facebook 基礎(chǔ)軟件工程師,知名開源項目 RocksDB 官方維護者LiquanPei前 Pinterest Ad Infra Tech Leader, Confluent 早期成員劉聰前金山軟件架構(gòu)師,前金山快盤創(chuàng)始團隊核心成員唐劉前金山軟件架構(gòu)師,WPS 云服務(wù)后臺架構(gòu)師王鵬飛ODPS 早期團隊成員在 ODPS 負責過 Runtime、Optimizer 和流計算等資料來源:PingCAP 官網(wǎng),開源項目啟程,TiDB 產(chǎn)品高速迭代,TiFlash 成功實現(xiàn)

12、混合事務(wù)分析。2015 年創(chuàng)業(yè)以前,PingCAP 三位聯(lián)合創(chuàng)始人劉奇、黃東旭和崔秋均在豌豆莢任職。在此期間,劉奇和黃東旭為解決 Redis 拓展性問題完成了開源的 Codis 項目,引發(fā)業(yè)界關(guān)注,也由此啟發(fā)了三人對數(shù)據(jù)庫領(lǐng)域的探索。與此同時,2012 年 Google 發(fā)表了 Spanner 和 F1 論文,這一學(xué)術(shù)界的突破進展給了三人指引了方向。2015 年,三人開始創(chuàng)業(yè)的進程,成功開發(fā)第一版TiDB 并在Github 上開源,此后 TiDB 保持每兩年迭代三個版本的產(chǎn)品進化節(jié)奏。2016年 1 月,團隊將 TiKV 作為TiDB 的底層存儲引擎設(shè)計并開發(fā),第一版于 2016 年 4 月開

13、源。隨后 2018 年 8 月,世界知名開源軟件基金會云原生基金會(CNCF)宣布接納 TiKV 為沙箱項目。2019 年 5 月,TiKV 入選為云原生計算基金會孵化項目,并于 2020 年正式畢業(yè),成為 CNCF 第 12 個畢業(yè)項目,同時也是繼 Harbor 后第二個畢業(yè)的中國原創(chuàng)開源項目。這一進展標志著 TiKV 在產(chǎn)品成熟度、項目采用率以及社區(qū)持續(xù)性等方面取得一系列突破,可應(yīng)用到各類行業(yè)、各種規(guī)模的生產(chǎn)環(huán)境。2020 年 9 月,CNCF 宣布云原生的混沌工程 Chaos Mesh 正式進入 CNCF 沙箱托管項目,凸顯出公司在開源技術(shù)上的不斷進步。圖 1:公司發(fā)展歷程資料來源:公司

14、官網(wǎng),繪制公司獲得資本不斷加持,并保持接近每年一融的健康節(jié)奏。2015 年 4 月,公司創(chuàng)業(yè),獲得經(jīng)緯中國領(lǐng)投的天使輪投資。隨后 TiDB Alpha 版本發(fā)布,成為全球第一個基于 Google F1 論文的開源實現(xiàn)。在此之后,公司先后進行四輪融資:2016 年 8 月獲得云啟資本領(lǐng)投的 700 萬美元A 輪融資;2017 年 6 月獲得華創(chuàng)資本領(lǐng)投的 1500 萬美元的 B 輪融資;2018 年 9 月獲得復(fù)星、晨興資本領(lǐng)投的 5000 萬美元的 C 輪融資;2020 年 11月獲得紀源資本、Access Technology Ventures、晨曦投資 、時代資本、五源資本(原晨興資本)共

15、同領(lǐng)投的 2.7 億美元的 D 輪融資,刷新了全球數(shù)據(jù)庫歷史。在此過程中,公司也由一個初創(chuàng)公司迅速成長為一個活躍于全球的知名開源分布式數(shù)據(jù)庫廠商。表 3:公司融資經(jīng)歷融資輪次融資金額時間投資機構(gòu)D 輪2.7 億美元2020-11-17紀源資本、Access Technology Ventures、晨曦投資、時代資本、五源資本、貝塔斯曼亞洲投資基金、Coatue、天際資本、昆侖資本、摯信資本、經(jīng)緯中國、云啟資本C 輪5000 萬美元2018-08-12五源資本、復(fù)星集團、華創(chuàng)資本、經(jīng)緯中國、云啟資本B 輪1500 萬美元2017-06-13華創(chuàng)資本、經(jīng)緯中國、峰瑞資本、險峰長青 K2VC、云啟資

16、本A 輪700 萬美元2016-09-04經(jīng)緯中國、峰睿資本、初心資本、云啟資本天使輪數(shù)百萬人民幣2015-12-09經(jīng)緯中國、險峰長青 K2VC資料來源:公司官網(wǎng),產(chǎn)品體系:以 TiDB 開源分布式數(shù)據(jù)庫及生態(tài)工具為核心公司當前產(chǎn)品體系是以 TiDB 開源分布式數(shù)據(jù)庫為核心(包括社區(qū)版和企業(yè)版),通過TiFlash 高性能列式分析引擎實現(xiàn) HTAP,以及包括一體化數(shù)據(jù)同步平臺 TiDB Data Migration、云原生混沌工程 Chaos Mesh 在內(nèi)的生態(tài)工具。PingCAP 的核心產(chǎn)品為獨立研發(fā)的開源分布式關(guān)系型數(shù)據(jù)庫 TiDB,是一款同時支持在線事務(wù)處理與在線分析處理的融合型分布

17、式數(shù)據(jù)庫產(chǎn)品,具備水平擴容或者縮容、金融級高可用、實時 HTAP、云原生分布式數(shù)據(jù)庫、兼容 MySQL 5.7 協(xié)議和 MySQL 生態(tài)等重要特性。該項目當前在 GitHub 共計獲得 26621 的標星,集合了 1232 位貢獻者。表 4:核心產(chǎn)品 TiDB 迭代版本產(chǎn)品版本時間特點介紹對 MySQL 兼容性、SQL 優(yōu)化器、系統(tǒng)穩(wěn)定性、性能做了大量的工作,TiDB 1.02017 年 10 月 16 日TiDB 2.02018 年 4 月 27 日提升顯著提升大規(guī)模集群的穩(wěn)定性,降低用戶運維成本,性能有明顯提升,TiDB 3.02019 年 6 月 28 日增加了窗口函數(shù)、視圖(實驗特性)

18、、分區(qū)表、插件系統(tǒng)、悲觀鎖(實驗特性)等新功能TiDB 3.12020 年 4 月 16 日兼容性有所提升,引入了眾多新功能TiDB 2.12018 年 11 月 30 日優(yōu)化了內(nèi)部數(shù)據(jù)格式,提升了 MySQL 兼容性重構(gòu) SQL 優(yōu)化器,對 MySQL 兼容性、系統(tǒng)穩(wěn)定性、優(yōu)化器和執(zhí)行器做了眾多改進,OLAP 性能大幅度提升對系統(tǒng)穩(wěn)定性、性能、兼容性、易用性做了大量改進,性能再次大幅TiDB 4.02020 年 5 月 28 日TiDB5.02021 年 1 月 12 日RC優(yōu)化了 TiDB 和 TiCDC 兼容性問題,修復(fù)了 TiKV 及 TiFlash 若干問題并引入了新功能專注于幫助企

19、業(yè)基于 TiDB 數(shù)據(jù)庫快速構(gòu)建應(yīng)用程序,使企業(yè)在構(gòu)建過程中無需擔心數(shù)據(jù)庫的性能、性能抖動、安全、高可用、容災(zāi)、SQL語句的性能問題排查等問題資料來源:公司官網(wǎng),包括純 OLTP 和 HTAP 在內(nèi)的兩個主打應(yīng)用場景:(1)純 OLTP:TiDB 的核心價值,承載企業(yè)關(guān)鍵業(yè)務(wù)的核心生產(chǎn)系統(tǒng)。OLTP 是 TiDB 的核心應(yīng)用場景,在產(chǎn)品性能、成熟度、穩(wěn)定性、可拓展性、靈活性等方面具備極強的競爭力。在面對業(yè)務(wù)快速增長、數(shù)據(jù)量 劇增或者并發(fā)量高且即將分庫分表的企業(yè)客戶時,TiDB 及生態(tài)組件可實現(xiàn)數(shù)據(jù)庫平滑遷移,最大程度節(jié)省時間和成本,對業(yè)務(wù)邏輯頻繁改動的項目非常友好。(2)HTAP=實時寫入+

20、實時更新+實時分析。傳統(tǒng)OLAP 通常基于數(shù)倉實現(xiàn),但數(shù)倉 T+1 的特性無法滿足企業(yè)對 數(shù)據(jù)實時分析的需求。針對有較大數(shù)據(jù)寫入且需要實時分析的場景,TiDB 集群只需要構(gòu)建 一個數(shù)據(jù)庫平臺、一套接口便可做到在增加少量存儲成本的情況下,實現(xiàn)聯(lián)機交易處理、實時數(shù)據(jù)分析,避免 ETL 過程。TiDB 集群的 HTAP 可支持高并發(fā)的數(shù)據(jù)寫入和更新、輕中量級的查詢、重量級的復(fù)雜分析,可覆蓋企業(yè)絕大部分數(shù)據(jù)分析場景。圖 2:TiDB 四大特性資料來源:公司官網(wǎng),商業(yè)模式:商業(yè)開源訂閱+DBaaS 助力開源商業(yè)進程加速公司采用商業(yè)開源訂閱+DBaaS 的模式,即社區(qū)版免費+商業(yè)用戶通過年訂閱模式付費+云

21、數(shù)據(jù)庫即服務(wù)。商業(yè)開源訂閱是指開源項目的軟件產(chǎn)品通過按用量及使用周期(一般以年為基本計算單位)提供給用戶軟件使用和獲得商業(yè)支持服務(wù)。兩個版本在核心功能上一致,但在安全、高可用性以及服務(wù)支持上體現(xiàn)差異:1)從產(chǎn)品功能上看,社區(qū)版和企業(yè)版在數(shù)據(jù)庫基礎(chǔ)核心功能嚴格保持一致;2)從服務(wù)上看,二者均具備用戶社區(qū)支持,而企業(yè)訂閱模式還包括遠程技術(shù)支持、專家現(xiàn)場服務(wù)等增值權(quán)益。對于社區(qū)版用戶,其需要承擔使用 TiDB 社區(qū)版潛在故障事件給業(yè)務(wù)帶來的影響和風(fēng)險。圖 3:商業(yè)開源訂閱是未來趨勢資料來源:Confluent 官網(wǎng),公司采用商業(yè)化友好的開源協(xié)議 Apache Licence 2.0。在開源協(xié)議上,T

22、iDB 采用了 Apache Licence 2.0 協(xié)議,尊重原作者的著作權(quán)并允許代碼修改??蛻艨梢孕薷?TiDB 代碼后將其作為開源或商業(yè)軟件發(fā)布,但延伸的代碼需要保留原先代碼中的協(xié)議、商標、專利聲明等內(nèi)容。對于客戶來說,可以根據(jù)對產(chǎn)品理解進行二次開發(fā)并發(fā)布發(fā)行版。對 PingCAP 而言,Apache 2.0 協(xié)議對原有代碼商標、專利的保留也有效保證了自身的權(quán)益,有效處理了和競爭對手的關(guān)系。公司對待開源社區(qū)中其他公司基于開源項目修改并推出發(fā)行版本持開放態(tài)度,并歡迎合作伙伴一起把 TiDB 的生態(tài)做大。圖 4:TiDB 開源協(xié)議資料來源:GithubTiDB 社區(qū)是由 TiDB 開發(fā)者、用

23、戶、合作伙伴一起建立的分享與學(xué)習(xí)平臺。在組織架構(gòu)上,社區(qū)分為四個部分:1)項目管理委員會,為項目核心管理團隊,參與 roadmap制定與社區(qū)相關(guān)的更大決議。2)TiDB 社區(qū)開發(fā)者組織,包含 Maintainer,Committer, Reviewer,Active Contributor,Contributor。每一個角色在社區(qū)中都承擔相應(yīng)的職責,是推動 TiDB 健壯發(fā)展的重要成員。3)TiDB 用戶組(TiDB User Group,簡稱 TUG),由 TiDB 用戶發(fā)起的獨立用戶社區(qū),以線上的 AskTUG 問答社區(qū)和線下的 TUG 技術(shù)沙龍為大本營。用戶在 TUG 社區(qū)可以學(xué)習(xí)前沿技

24、術(shù)知識,發(fā)表技術(shù)見解,結(jié)識圈內(nèi)朋友,共同建設(shè) TiDB 項目。TUG 核心成員由 Leader、Co-Leader、Ambassador 構(gòu)成。4)項目組織委員會,負責執(zhí)行、輸出、推廣技術(shù)內(nèi)容,成員包括各地區(qū)用戶組組長以及社區(qū)活動負責人。當前,國內(nèi)社區(qū)用戶主要集中在 TUG 社區(qū),國外用戶則集中在 Github 和 Slack 小組。圖 5:TiDB 社區(qū)組織架構(gòu)圖資料來源:公司官網(wǎng),繪制TiDB 采用企業(yè)版訂閱+服務(wù)人天+云訂閱的收費方式。1)用戶首先可以訂閱企業(yè)版,從而獲取到公司的技術(shù)支持和商業(yè)服務(wù)。采用硬件部署+使用量的計價方式,根據(jù)集群規(guī)模 vCPU 用量計量收費。2)在訂閱企業(yè)版的基

25、礎(chǔ)上,用戶可以進一步購買原廠現(xiàn)場專業(yè)服務(wù),包含現(xiàn)場架構(gòu)咨詢、應(yīng)用適配、知識傳遞、深度巡檢、擴容變更支持、多方故障協(xié)查、故障根源分析等服務(wù)。3)PingCAP 還與公有云廠商進行合作,以 DBaaS 的方式提供云數(shù)據(jù)庫服務(wù),企業(yè)可以根據(jù)需要預(yù)先購買流量包或者按小時/月付費。根據(jù)節(jié)點類型、云服務(wù)器性能和使用時長有相應(yīng)定價。類別節(jié)點CPU內(nèi)存存儲按時付費按月付費TiKV8vCPU61GiB1900 GiB ssd_nvme$1.56/時$1123.2/月H1.StandTiDB8vCPU16GiB-$0.85/時$612/月TiFlash8vCPU61GiB1900 GiB ssd_nvme$1.5

26、6/時$1123.2/月TiKV2vCPU2GiB50 GiB ssd_nvme$0.032/時$23.04/月TiDB2vCPU2GiB-$0.032/時$23.04/月TiKV8vCPU61GiB1900 GiB ssd_nvme$1.56/時$1123.2/月TiDB8vCPU16GiB-$0.85/時$612/月表 5:PingCAP 云產(chǎn)品定價(基于 AWS 公有云)T1.TinyT1.Standard資料來源:公司官網(wǎng), 行業(yè)分析:HTAP 與云數(shù)據(jù)庫引領(lǐng)全球第四代數(shù)據(jù)庫變革浪潮宏觀背景:全球互聯(lián)網(wǎng)行業(yè)高速發(fā)展,數(shù)據(jù)爆發(fā)+復(fù)雜度提升驅(qū)動行業(yè)需求。隨著互聯(lián)網(wǎng)行業(yè)的發(fā)展,全球產(chǎn)生數(shù)據(jù)量

27、逐年攀升。根據(jù) IDC 和 Ovum 數(shù)據(jù),2020 年全球數(shù)據(jù)量高達 40ZB(相當于 429 億塊 1TB 容量的硬盤),同比增長 22.5%。同時,隨著語音、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)不斷產(chǎn)生,數(shù)據(jù)結(jié)構(gòu)本身復(fù)雜度不斷提升。未來 5G 的發(fā)展勢必會帶來數(shù)據(jù)量和復(fù)雜度的進一步上升。在此背景下,作為數(shù)字經(jīng)濟時代軟件底座的數(shù)據(jù)庫在企業(yè)信息化建設(shè)中地位將愈發(fā)重要,行業(yè)整體規(guī)模也將隨之擴大。市場規(guī)模:全球數(shù)據(jù)庫市場規(guī)模巨大,云數(shù)據(jù)庫市場高速增長。2019 年全球 DBMS市場規(guī)模高達 493 億美元,同比增長 18.2%。2020 年,全球 DBMS 市場規(guī)模小幅降至 487億美元,主要原因是數(shù)據(jù)庫市

28、場受到疫情沖擊,本地部署的數(shù)據(jù)庫項目被推遲,同比下滑 6.2%,但同時云數(shù)據(jù)庫仍然保持 11.6%的增速。長期來看,數(shù)據(jù)量爆發(fā)疊加數(shù)據(jù)結(jié)構(gòu)復(fù)雜度提升是長期驅(qū)動因素,預(yù)計云數(shù)據(jù)庫將成為未來數(shù)據(jù)庫部署方式。根據(jù) IDC 預(yù)測,2024年全球數(shù)據(jù)庫市場規(guī)模將穩(wěn)步增長至 739 億美元,2020-2024 年 CAGR 將達 8.7%。其中云數(shù)據(jù)庫市場規(guī)模將達到 404 億美元,占比提升至 55%,2020-2024 年 CAGR 達 27.3%。從細分市場角度,公司核心產(chǎn)品 TiDB 應(yīng)用于純 OLTP 和 HTAP 兩大方向,覆蓋企業(yè)強事務(wù)型數(shù)據(jù)處理和大數(shù)據(jù)實時分析場景,分別對應(yīng) 332 億/17

29、0 億美元細分市場規(guī)模。圖 6:全球數(shù)據(jù)量及同比增速(單位:ZB,%)圖 7:全球數(shù)據(jù)庫市場規(guī)模及增速(單位:十億美元,%)140120100806040200中國數(shù)據(jù)量全球數(shù)據(jù)量中國YoY全球YoY2018 2019 2020 2021E 2022E 2023E 2024E60.0%50.0%40.0%30.0%20.0%10.0%0.0%公有云DBMS本地DBMS整體同比增長率8070605040302010020192020 2021E 2022E 2023E 2024E20.0%15.0%10.0%5.0%0.0%-5.0%資料來源:IDC(含預(yù)測),資料來源:IDC(含預(yù)測),圖 8

30、:全球 OLTP 市場規(guī)模及增速(單位:億美元,%)圖 9:全球 OLAP 市場規(guī)模及增速(單位:億美元,%)300250200150100500云OLTP本地OLTP云OLTP增速本地OLTP增速100.0%80.0%60.0%40.0%20.0%0.0%-20.0%200150100500云OLAP本地OLAP云OLAP增速本地OLAP增速100.0%80.0%60.0%40.0%20.0%0.0%-20.0%資料來源:IDC(含預(yù)測),資料來源:IDC(含預(yù)測),技術(shù)演進:關(guān)系型主導(dǎo),NewSQL 進化,HTAP 引領(lǐng)關(guān)系型數(shù)據(jù)庫占據(jù)絕大部分的市場份額,市場規(guī)模占比超過 80%,預(yù)計其仍

31、將在很長一段時間內(nèi)占據(jù)主導(dǎo)地位。關(guān)系型數(shù)據(jù)庫依靠表、字段等關(guān)系模型結(jié)合集合代數(shù)等數(shù)學(xué)方法,滿足 ACID 規(guī)則,格式一致,支持 SQL,可用于一個表及多個表之間的復(fù)雜查詢。非關(guān)系型數(shù)據(jù)庫 NoSQL 誕生于 2005 年,基于 Hadoop 分布式架構(gòu)的 NoSQL 數(shù)據(jù)庫將昂貴的數(shù)據(jù)庫一體機替換為大量廉價的硬件集群,在降低成本的同時實現(xiàn)性能的線性擴展,同時支持非結(jié)構(gòu)化數(shù)據(jù)的處理。但 NoSQL 犧牲了數(shù)據(jù)的一致性因而對 OLTP 支撐不足,也不支持 SQL 查詢。易用性相對欠缺。根據(jù)智研咨詢數(shù)據(jù),2020 年具有復(fù)雜表間結(jié)構(gòu)關(guān)系模型的關(guān)系型數(shù)據(jù)庫的中國市場規(guī)模為 160.4 億元,占比仍然超

32、過 80%,且同比增速達到 17.6%。圖 10:中國關(guān)系型與非關(guān)系型市場規(guī)模及增速(單位:億元,%)500.0關(guān)系型數(shù)據(jù)庫市場非關(guān)系型數(shù)據(jù)庫市場關(guān)系型數(shù)據(jù)庫市場YoY非關(guān)系型數(shù)據(jù)庫市場YoY50.0%400.040.0%300.030.0%200.020.0%100.010.0%0.02012 2013 2014 2015 2016 2017 2018 2019 2020 2021E 2022E 2023E 2024E0.0%資料來源:智研咨詢,預(yù)測NewSQL 兼具 NoSQL 擴展性和 ACID 特性的新型分布式數(shù)據(jù)庫。隨著傳統(tǒng)關(guān)系型數(shù)據(jù)庫(SQL)向分布式非關(guān)系型數(shù)據(jù)庫(NoSQL)的

33、轉(zhuǎn)變,數(shù)據(jù)庫的可擴展性大大增強。然而由于 NoSQL 缺乏強一致性及事務(wù)支持,因此其使得業(yè)務(wù)代碼負擔較重,難以勝任部分工作場景。在 2012 年論文Spanner: Googles Globally-Distributed Database中, Google 創(chuàng)造性地引入原子鐘解決傳統(tǒng)分布式數(shù)據(jù)庫數(shù)據(jù)一致性需要依賴中心節(jié)點而無法大規(guī)模擴展的問題,將事務(wù)型數(shù)據(jù)庫的 ACID 保證與 NoSQL 的可擴展性和高性能相結(jié)合,標志著 NewSQL 時代到來。NewSQL 不僅具有 NoSQL 對海量數(shù)據(jù)的存儲管理能力,保持 NoSQL 的高可擴展和高性能,還具備關(guān)系模型,滿足傳統(tǒng)數(shù)據(jù)庫 ACID 特性

34、。因此, NewSQL 平衡了兩種架構(gòu)的優(yōu)缺點,在某些應(yīng)用場景具備獨特優(yōu)勢。圖 11:OldSQL、NoSQL、NewSQL 應(yīng)用場景對比資料來源:CSDN,繪制第四代數(shù)據(jù)庫革命浪潮:混合事務(wù)處理分析 HTAP 已成為熱點方向,能夠解決傳統(tǒng)數(shù)倉無法滿足企業(yè)實時數(shù)據(jù)分析的痛點。傳統(tǒng)的數(shù)據(jù)架構(gòu)中,企業(yè) OLTP 數(shù)據(jù)需要經(jīng)過復(fù)雜的 ETL 過程才能進入數(shù)倉,因此數(shù)倉對一般都是 T+1 的數(shù)據(jù)分析,對實時分析支持性較低。但隨著 5G 網(wǎng)絡(luò)迭代,催生更多數(shù)據(jù)密集型應(yīng)用,數(shù)據(jù)量爆發(fā)、數(shù)據(jù)結(jié)構(gòu)復(fù)雜度攀升,對大數(shù)據(jù)實時分析的需求變得更加迫切。隨著技術(shù)原理上的突破,當前出現(xiàn)的 HTAP 混合事務(wù)分析打破了 O

35、LTP 和 PLAP 隔閡,既可以應(yīng)用于操作性數(shù)據(jù)庫場景,亦可應(yīng)用于分析型數(shù)據(jù)庫場景。通過改變整體架構(gòu),HTAP 可在數(shù)據(jù)產(chǎn)生之初進行分析,無需進行耗時且難以維護的 ETL 操作。2020 VLDB 發(fā)表了五篇關(guān)于 HTAP 的論文,分別來自 Google F1團隊、IBM、阿里、Databricks 和 PingCAP,HTAP 已成為數(shù)據(jù)庫技術(shù)研究熱點方向。圖 12:谷歌 HTAP 混合事務(wù)分析架構(gòu)資料來源:F1 lightning: HTAP as a service. Proc. VLDB Endow. 13, 12 (August 2020), 33133325 (Google)部署

36、模式:數(shù)通世界,云化未來從性價比角度來看,云數(shù)據(jù)庫具備明顯優(yōu)勢。傳統(tǒng)部署下的數(shù)據(jù)庫需要用戶自行管理,需要安排相關(guān)人員承擔數(shù)據(jù)庫的安裝、升級、管理、測試、安全等任務(wù)。隨著企業(yè)業(yè)務(wù)規(guī)模的擴大,數(shù)據(jù)爆發(fā)式增長,維護工作將越來越復(fù)雜。此外,受到硬件的制約,企業(yè)無法對數(shù)據(jù)庫進行彈性擴充,一定程度上造成了部分資源的閑置和浪費。而云數(shù)據(jù)庫則具備諸多優(yōu)勢:可擴展性: 通過計算存儲分離可解決計算彈性伸縮、存儲彈性擴縮容問題,將傳統(tǒng)的分布式數(shù)據(jù)庫十節(jié)點級擴展到千節(jié)點級。用戶可以利用應(yīng)用軟件的快速部署條件來更為簡單快捷的將自身所需的已有業(yè)務(wù)以及新業(yè)務(wù)進行擴展。成本相對較低:基于云計算的系統(tǒng)能夠節(jié)約計算機、網(wǎng)絡(luò)交換器

37、等硬件設(shè)備的購買和維護成本,為企業(yè)提供相對經(jīng)濟的應(yīng)用軟件服務(wù)。云數(shù)據(jù)庫的資費遠低于自建數(shù)據(jù)庫,企業(yè)可按照自己的需求選擇不同套餐,性價比較高。可靠性高:云數(shù)據(jù)庫擁有完善的數(shù)據(jù)自動備份機制,能夠?qū)崿F(xiàn)云端完全托管各類管理任務(wù)(如硬件擴容、數(shù)據(jù)庫設(shè)置、補丁升級和備份恢復(fù)),具備完善的監(jiān)控、告警功能。用戶可以專注于應(yīng)用程序開發(fā),遠離數(shù)據(jù)庫運維煩惱。從用戶使用上看,云數(shù)據(jù)庫具備強大的生態(tài)粘性。依托 IaaS 生態(tài),云數(shù)據(jù)庫廠商可為用戶提供區(qū)別于傳統(tǒng)數(shù)據(jù)庫的生態(tài)體系。眾多易于使用的生態(tài)組件大大擴充了云數(shù)據(jù)庫的功能,提升了用戶的使用體驗。同時,廣泛的用戶基礎(chǔ)為生態(tài)的構(gòu)建提供了可能,進一步促進了生態(tài)體系的完善。

38、因此對于用戶而言,云數(shù)據(jù)庫具備更加強大的生態(tài)體系,因而具備更強的用戶粘性。綜合來看,行業(yè)云化趨勢明顯,DBaaS 云數(shù)據(jù)庫未來將成為主流。結(jié)合云數(shù)據(jù)庫優(yōu)勢來看,云數(shù)據(jù)庫部署將會是未來的高確定性趨勢。根據(jù) IDC 數(shù)據(jù),存儲在公有云中數(shù)據(jù)占比將在 2020 年追平傳統(tǒng)數(shù)據(jù)中心,且占比仍將不斷提升。同時,國內(nèi)云數(shù)據(jù)庫市場規(guī)模也在 2020 年超過本地部署規(guī)模。由此可見,未來行業(yè)數(shù)據(jù)庫云化趨勢將十分明顯。圖 13:存儲在公有云和傳統(tǒng)數(shù)據(jù)中心的數(shù)據(jù)比例(單位:%)圖 14:全球云/本地數(shù)據(jù)庫市場規(guī)模及增速(單位:億元,%)100.0%90.0%80.0%70.0%60.0%50.0%40.0%30.0

39、%20.0%10.0%0.0%公有云傳統(tǒng)數(shù)據(jù)中心5004003002001000公有云數(shù)據(jù)庫本地數(shù)據(jù)庫云數(shù)據(jù)庫YoY本地數(shù)據(jù)庫YoY2019 2020 2021E 2022E 2023E 2024E40.0%30.0%20.0%10.0%0.0%-10.0%資料來源:IDC(含預(yù)測),資料來源:IDC,預(yù)測圖 15:DBaaS 數(shù)據(jù)庫即服務(wù)資料來源:William Blai,市場競爭:傳統(tǒng)巨頭轉(zhuǎn)型,數(shù)據(jù)庫新勢力與云廠商角逐全球市場:傳統(tǒng)巨頭+云廠商+數(shù)據(jù)庫廠商構(gòu)成市場三類主要競爭者。從市場份額來看,數(shù)據(jù)庫軟件市場格局市場參與者眾多,但份額較為集中。數(shù)據(jù)庫乃至數(shù)據(jù)管理軟件市場集中度較高。根據(jù) I

40、DC 統(tǒng)計,2019 年全球數(shù)據(jù)管理市場中份額前五的廠商包括微軟、Oracle、IBM、AWS 和 ,總計占比接近 80%。從競爭對手來看,傳統(tǒng)巨頭+云廠商+數(shù)據(jù)庫廠商構(gòu)成市場三類主要競爭者。傳統(tǒng)巨頭包括 Oracle、IBM、Microsoft 和 。云廠商包括亞馬遜 AWS、Microsoft Azure 和谷歌。數(shù)據(jù)庫廠商包括 Cloudera、Teradata、MongoDB、Snowflake等公司。傳統(tǒng)巨頭雖然占據(jù)著較大的市場份額,但云轉(zhuǎn)型緩慢,受到公有云廠商的激烈競爭。從競品對比來看,傳統(tǒng)巨頭產(chǎn)品出現(xiàn)較早,成熟度相對較高,多集中于關(guān)系型數(shù)據(jù)庫,在傳統(tǒng)關(guān)系型數(shù)據(jù)庫市場中占據(jù)壟斷地位

41、。而云服務(wù)和新興廠商則主導(dǎo)著非關(guān)系型市場。云廠商產(chǎn)品涵蓋關(guān)系型 OLTP 和非關(guān)系型 OLAP,而純數(shù)據(jù)庫廠商集中于非關(guān)系型 OLAP 領(lǐng)域。圖 16:2016-2018 年全球前十大數(shù)據(jù)庫廠商云數(shù)據(jù)庫收入(單位:百萬美元)2016201720187,0006,0005,0004,0003,0002,0001,000-資料來源:Garther,國內(nèi)市場:海外巨頭份額下滑,國產(chǎn)替代進展加速從市場份額來看,由于海外巨頭先前在國內(nèi)市場的積累,其仍然占據(jù)最大市場份額。但隨著云趨勢和國產(chǎn)化替代推進,傳統(tǒng)海外巨頭的份額不斷縮小。根據(jù)智研咨詢數(shù)據(jù),中國市場國產(chǎn)數(shù)據(jù)庫占比連年增長,國產(chǎn)替代效應(yīng)明顯。從競爭對手

42、看,國內(nèi)市場主要參與者為公有云廠商(阿里云、騰訊云);設(shè)備商(華為、);傳統(tǒng)四大數(shù)據(jù)庫廠商(武漢達夢、人大金倉、南大通用、神州信息)以及新興數(shù)據(jù)庫廠商(巨杉大數(shù)據(jù)、PingCAP、萬里開源等)。從競品對比看,傳統(tǒng)數(shù)據(jù)庫廠商產(chǎn)品發(fā)展較早,多聚焦于關(guān)系型數(shù)據(jù)庫產(chǎn)品;公有云廠商和設(shè)備商則具備更為完整的數(shù)據(jù)庫產(chǎn)品線,各類產(chǎn)品均有所布局,且具備生態(tài)優(yōu)勢。新興數(shù)據(jù)庫公司產(chǎn)品多集中于某一特定場景,通過特定場景下的明顯優(yōu)勢參與市場競爭。圖 17:2019 年中國數(shù)據(jù)庫管理系統(tǒng)部分廠商銷售額(單位:億元)63.0913.47 11.61 9.745.74 2.72 2.56 2.00 1.50 1.457060

43、504030圖 18:2019 年公有云模式下中國關(guān)系型數(shù)據(jù)庫市場份額(單位:%)阿里騰訊AWSOracle華為微軟其他2.50%8.60%3%7%2010.40%10020.40%48.10%資料來源:賽迪顧問,資料來源:智研咨詢, 公司分析:技術(shù)硬實力奠基,開源商業(yè)化升維產(chǎn)品技術(shù):Shared-Nothing+HTAP 精準解決行業(yè)痛點TiDB 是真正的Shared-Nothing 分布式數(shù)據(jù)庫,不需要隨著數(shù)據(jù)量增大而分庫分表。數(shù)據(jù)庫架構(gòu)包含 Shared-Memory、Shared-Disk 和 Shared-Nothing 三種類型。隨著 CPU的增加,前兩種架構(gòu)都增加了對內(nèi)存訪問和網(wǎng)

44、絡(luò)帶寬的競爭,使得系統(tǒng)效率降低。對于傳統(tǒng)的數(shù)據(jù)庫,隨著數(shù)據(jù)量的增大,其往往需要進行復(fù)雜的分庫分表,大大提升了系統(tǒng)的運營成本。而 TiDB 則采用了 Shared-Nothing 架構(gòu)。在這種分布式架構(gòu)中,每一個節(jié)點都是獨立、自給的,整個系統(tǒng)中沒有單點競爭。通過簡單地增加節(jié)點,數(shù)據(jù)庫可以做到獲取幾乎無限的擴展。在 TiDB 存儲計算分離的架構(gòu)設(shè)計下,可按需對計算、存儲分別進行在線擴容或者縮容,大大降低了運營成本。圖 19:三種數(shù)據(jù)庫架構(gòu)對比圖資料來源:CSDN,繪制TiDB 是存儲層和計算層分離的純分布式 HTAP 數(shù)據(jù)庫。1)存儲層,包含 TiKV 和 TiFlash 兩類存儲引擎,其中 Ti

45、KV 采用行式存儲,TiFlash 采用列式存儲。TiFlash 通過特定協(xié)議從 TiKV 中實時復(fù)制數(shù)據(jù),確保 TiKV 和 TiFlash 之間的數(shù)據(jù)強一致問題;通過 TiDB的優(yōu)化器選擇,TiDB 能夠?qū)崿F(xiàn)事務(wù)類處理查詢走 TiKV,分析類查詢走 TiFlash,最大程度發(fā)揮 OLTP 和 OLAP 的優(yōu)勢。TiKV、TiFlash 可按需部署在不同的機器,解決 HTAP 資源隔離的問題。2)計算層,包含 TiDB 和 TiSpark,分別處理 MySQL 和 SparkSQL,負責分配 TSO 和數(shù)據(jù)定位;3)PD,TiDB 集群的智能大腦,主要負責存儲集群元數(shù)據(jù),系統(tǒng)調(diào)度和負載均衡以

46、及分配全局單調(diào)遞增的數(shù)據(jù)時間戳。HTAP 解決了傳統(tǒng)數(shù)據(jù)倉庫弱支持實時數(shù)據(jù)分析的問題。傳統(tǒng)的數(shù)據(jù)架構(gòu)中,企業(yè) OLTP 數(shù)據(jù)需要經(jīng)過復(fù)雜的ETL 過程才能進入數(shù)倉,因此數(shù)倉對一般都是 T+1 的數(shù)據(jù)分析,對實時分析支持性較低。但隨著 5G 網(wǎng)絡(luò)迭代,催生更多數(shù)據(jù)密集型應(yīng)用,數(shù)據(jù)量爆發(fā)、數(shù)據(jù)結(jié)構(gòu)復(fù)雜度攀升,對大數(shù)據(jù)實時分析的需求變得更加迫切。針對有較大數(shù)據(jù)寫入且需要實時分析的場景,TiDB 集群只需要構(gòu)建一個數(shù)據(jù)庫平臺、一套接口便可做到在增加少量存儲成本的情況下,實現(xiàn)聯(lián)機交易處理、實時數(shù)據(jù)分析,避免 ETL 過程。TiDB 集群的 HTAP可支持高并發(fā)的數(shù)據(jù)寫入和更新、輕中量級的查詢、重量級的復(fù)

47、雜分析,可覆蓋企業(yè)絕大部分分析場景。圖 20:TiDB 整體架構(gòu)示意圖資料來源:PingCAP 官網(wǎng),圖 21:TiDB 存儲層節(jié)點示意圖資料來源:PingCAP,產(chǎn)品技術(shù)硬實力助力替換其他頂級數(shù)據(jù)庫廠商。在 TiDB 的底層架構(gòu)下,Sharding Nothing+HTAP 兩大特點適合客戶的眾多場景,因而得到了很多用戶的采用。同時,TiDB兼容 MySQL,也促進了眾多使用 MySQL 的廠商能夠順利遷移到 TiDB 上。在此技術(shù)優(yōu)勢下,PingCAP 獲得了中國平安、伴魚、Shopee 和 PayPay 等一眾海內(nèi)外廠商的認可。表 6:TiDB 替代其他數(shù)據(jù)庫軟件案例客戶替換對手替換原因

48、TiDB 優(yōu)點中國平安Oracle伴魚MongoDBAWSPayPayAuroraShopeeMySQL特定節(jié)日舉辦的營銷活動帶來數(shù)據(jù)量的暴漲,為支持活動需要擴充硬件,成本較高;數(shù)據(jù)量擴大需要拆分復(fù)雜的邏輯表,運營成本較高MongoDB 屬于傳統(tǒng) OLTP 數(shù)據(jù)庫,完成 OLAP 型工作負載過高,無法支持海量數(shù)據(jù);并且 MongoDB 幾乎沒有數(shù)據(jù)約束,使得數(shù)據(jù)模式有可能失控Aurora 采用了單點寫入的模式,當遇到大規(guī)模寫入請求時,二進制日志復(fù)制將成為瓶頸,提交延遲增加。即使將硬件升級到最高硬件規(guī)格也無法應(yīng)付該負載隨著業(yè)務(wù)的不斷增長,MySQL 需要壓縮數(shù)據(jù)并進行服務(wù)器存儲空間擴容,無法徹底

49、解決容量不足的問題NewSQL 數(shù)據(jù)庫可以按需擴展,動態(tài)調(diào)整整個系統(tǒng)的性能以滿足不確定的業(yè)務(wù)需求;海量結(jié)構(gòu)化數(shù)據(jù)存儲和查詢效率更高,提升應(yīng)用程序開發(fā)效率TiDB 支持水平擴展,無需考慮分片,分布式特性擅長處理海量數(shù)據(jù);支持 ACID 事務(wù),通過 Raft 共識算法實現(xiàn)數(shù)據(jù)一致性等特性支持水平擴展,可以處理比 Aurora 多三倍的 TPS,并且支付交易的延遲不到一秒鐘;不必在程序級進行分片,不會侵入業(yè)務(wù)邏輯;PayPay 的云原生架構(gòu)適合使用 TiDBTiDB 支持彈性水平可伸縮性、自動分區(qū)可確保強大的數(shù)據(jù)一致性、 與 MySQL 協(xié)議高度兼容、支持在線 DDL資料來源:公司官網(wǎng),開源生態(tài):賦

50、能產(chǎn)品迭代、人才高地與合作伙伴體系三大動力引擎開源是基礎(chǔ)軟件成功的最佳途徑,開源數(shù)據(jù)庫流行程度已超過商業(yè)數(shù)據(jù)庫。開源基礎(chǔ)軟件曾誕生 Linux 和 Android 等對各個領(lǐng)域產(chǎn)生廣泛而深刻影響的項目,也同樣走出了如 RedHat 的云開發(fā)平臺 OpenShift、分布式數(shù)據(jù)搜索和分析引擎 Elasticsearch、分布式流信息處理平臺 Kafka 等在商業(yè)取得巨大成功的開源項目。開源數(shù)據(jù)庫以 MySQL、 PostgreDB、MariaDB 和 MongoDB 為代表,具有靈活性、可見性、迭代快、生態(tài)資源多等優(yōu)勢。根據(jù)知名數(shù)據(jù)庫統(tǒng)計網(wǎng)站 DB-Egines 數(shù)據(jù)顯示,2021 年 1 月開

51、源數(shù)據(jù)庫的流行程度已經(jīng)超過商業(yè)數(shù)據(jù)庫。在網(wǎng)站列示的所有數(shù)據(jù)庫管理系統(tǒng)中,開源數(shù)據(jù)庫數(shù)量(185)也超過商業(yè)數(shù)據(jù)庫(176)。在占據(jù)市場主導(dǎo)的關(guān)系型數(shù)據(jù)庫領(lǐng)域中,開源數(shù)據(jù)庫流行程度超過商業(yè)型數(shù)據(jù)庫。在代表未來趨勢的多模型數(shù)據(jù)庫中,開源數(shù)據(jù)庫則占據(jù)絕對優(yōu)勢。因此,作為 NewSQL 代表的 TiDB 走在了開源這一條最正確的道路上。表 7:全球知名開源項目初版發(fā)行開發(fā)者公司產(chǎn)品類型基金會Stars融資情況時間人數(shù)RHEL開源Linux2000 年N/AN/AIPO 后被 IBM 收購,交易價值 340 億RedHatOpenShift開源CNCF2014 年7000367美元Elastic Sta

52、ckElasticsearch開源Apache2010 年450001297IPO,市值 147 億美元ClouderaHadoop開源Apache2006 年10000237IPO,市值 45 億美元DtatabricksSpark開源Apache2014 年2400014456F 輪融資 4 億美元,估值達 62 億美元ConfluentKafka開源Apache2011 年14000594E 輪融資 2.5 億美元,估值 45 億美元GoogleKurbernetes開源CNCF2014 年600002350N/AMongoDB, IncMongoDB開源N/A2009 年1700039

53、3IPO,市值 222 億美元Redis LabsRedis開源N/A2009 年40000319F 輪融資 1 億美元,估值超 10 億美元Cockroach LabsCockroachDB開源N/A2017 年17000263E 輪融資 1.6 億美元,估值 20 億美元PingCAPTiDB開源N/A2017 年26621350+D 輪融資 2.7 億美元,估值超 10 億美元資料來源:Wind,36kr 等,圖 22:開源數(shù)據(jù)庫與商業(yè)數(shù)據(jù)庫流行程度對比資料來源:DB-Engines圖 23:不同數(shù)據(jù)庫類型中開源與商業(yè)流行程度對比100.0%90.0%80.0%70.0%60.0%50.

54、0%開源商業(yè)0.0%79.3%77.9% 76.5% 69.5% 65.5% 63.2% 48.7% 41.2% 32.4% 23.2% 10.0%6.8%8.8%4.5%7.6%6.8%0.5%92.1%40.0%30.0%20.0%10.0%0.0%20.7% 223.5% 33351.3% 567 資料來源:DB-Egines,TiDB 是中國開源領(lǐng)域最活躍的開源項目之一。2020 年,開源文化在中國迅速蔓延,中國開源開發(fā)者數(shù)量激增。Github 的中國開發(fā)者數(shù)量增長 37%,同比增速高居全球首位,絕對數(shù)量位居第二。中國的開源土壤也孕育出像 Kylin、Rocket、Vue、Caffe、

55、Linux Deepin等走向世界的頂級開源項目。根據(jù)開源社發(fā)布的2020 年中國開源年度報告,PingCAP囊括中國最活躍開源項目 TOP 50 中的 6 個,包括分布式數(shù)據(jù)庫 TiDB、分布式事務(wù) Key-Value 數(shù)據(jù)庫 TiKV、文檔項目 PingCAP/docs-cn 和 PingCAP/docs 等。其中 TiDB 的 issue-comment 數(shù)量為中國所有開源項目最高,達到驚人的 53550 個,比排名第二的螞蟻集團 anti-design 高出 62.9%,體現(xiàn)出 TiDB 開源項目極高的活躍度。表 8:中國最活躍開源項目 TOP 10排名項目名稱開發(fā)語言活躍度參與開發(fā)者

56、人數(shù)問題/評論數(shù)量1ant-design/ant-designTypeScript8090addlePaddle/PaddlePython5236.1960152263PingCAP/TiDBGo4339.4482535504NervJS/taroJavaScript3649.4162195955apache/shardingsphereJava2858.77869332排名項目名稱開發(fā)語言活躍度參與開發(fā)者人數(shù)問題/評論數(shù)量ant-design/ant-design-proTypeScript2784.21362 6625alibaba/nacosJava2760.6

57、1204 7037apache/incubator-tvmPython2699.6355 8255ElemeFE/elementVue2507.71694 5016apache/incubator-echartsTypeScrip2307.41183 7622資料來源:2020 年中國開源年度報告(開源社),開源項目按照不同的商業(yè)模式可分為三類:開源項目源代碼完全向社區(qū)公開,公司通過向客戶提供運維、升級等服務(wù)獲取收益,例如紅帽 RedHat、OpenStack 和 Cloudera Hadoop;開源軟件訂閱模式,指軟件基礎(chǔ)版本免費,核心功能完全開源,但是額外功能或者升級版本以及支持服務(wù)需要通

58、過軟件訂閱或者授權(quán)獲得,例如 Confluent Kafka和 Elasticsearch;DBaaS 模式,數(shù)據(jù)庫即服務(wù),將數(shù)據(jù)庫軟件部署在云端(或云原生)。客戶向公有云廠商支付計算節(jié)點和存儲費用,向數(shù)據(jù)庫公司支付產(chǎn)品訂閱費用,例如 AWS Aurora,Snowflake 和 MongoDB Atlas。公司采用商業(yè)開源訂閱+DBaaS 的開源商業(yè)模式(Apache 2.0 協(xié)議):TiDB 的開源社區(qū)版本免費,但通過商業(yè)開源訂閱模式提供商業(yè)保障及服務(wù)。兩種模式在功能上保持一致:商業(yè)開源訂閱包括如提供 Hotfix 緊急熱修復(fù)、一對一遠程支持、現(xiàn)場支持、數(shù)據(jù)庫咨詢規(guī)劃等服務(wù)。對于一定規(guī)模和

59、特定領(lǐng)域的企業(yè)而言,安全、高可用性組件幾乎是剛需??蛻暨€可以選擇云原生 TiBD Cloud,除所有商業(yè)版特性的外還可享受云化的靈活性、更高擴展性等優(yōu)勢。表 9:社區(qū)版與商業(yè)版功能與服務(wù)支持區(qū)別序號產(chǎn)品組件名稱商業(yè)版社區(qū)版分布式 SQL 引擎1核心組件分布式存儲引擎集群調(diào)度器TiSpark OLAP 分析引擎2分析引擎TiFlash 分布式列式分析引擎異地災(zāi)備(主從集群異步模式)3高可用多中心強一致多活(RaftBased)安全審計(僅日志)安全審計拓展模塊4安全數(shù)據(jù)存儲加密通信加密白名單控制自動化部署監(jiān)控警告5運維管理全量數(shù)據(jù)備份/恢復(fù)增量數(shù)據(jù)備份/恢復(fù)序號產(chǎn)品組件名稱商業(yè)版社區(qū)版快速備份恢

60、復(fù)全量數(shù)據(jù)邏輯加載6數(shù)據(jù)交換全量數(shù)據(jù)物理加載數(shù)據(jù) CDC 遷移同步工具產(chǎn)品技術(shù)支持服務(wù)商業(yè)支持社區(qū)支持獲取產(chǎn)品技術(shù)支持途徑專業(yè)的商業(yè)支持團隊(現(xiàn)場、電話、IM、郵件)TiDB 社區(qū)網(wǎng)站及 Github7產(chǎn)品支持服務(wù)標準 58,最高 724;1產(chǎn)品故障的響應(yīng)級別無小時內(nèi)響應(yīng)商業(yè)專家協(xié)助規(guī)劃、實施、專家顧問服務(wù)資料來源:PingCAP 官網(wǎng), 主動式巡檢、故障協(xié)查、無知識轉(zhuǎn)移、重要時期保障公司通過社區(qū)版瞄準中國互聯(lián)網(wǎng)企業(yè)的核心業(yè)務(wù)場景資源,不斷迭代產(chǎn)品, 再通過企 業(yè)版本的差異化特性吸引其他垂直領(lǐng)域客戶。傳統(tǒng)國產(chǎn)數(shù)據(jù)庫難以接觸客戶核心業(yè)務(wù)場景,產(chǎn)品迭代速度慢、成熟度低。但 TiDB 通過開源方式瞄

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論