版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、技術(shù)創(chuàng)新,變革未來分布式圖數(shù)據(jù)庫的應(yīng)用實(shí)踐分布式圖數(shù)據(jù)庫在貝殼找房的應(yīng)用實(shí)踐分享提綱貝殼圖數(shù)據(jù)庫應(yīng)用場景圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫平臺(tái)建設(shè)原理&優(yōu)化&不足圖數(shù)據(jù)庫場景行業(yè)知識(shí)圖譜覆蓋房源、客戶、經(jīng)紀(jì)人、開發(fā)商、 小區(qū)、地鐵、醫(yī)院、學(xué)校、商場等 140多個(gè)類別,共計(jì)500多億三元組偏事實(shí)關(guān)系應(yīng)用場景:搜索推薦,智能問答例:查詢開發(fā)商是XXX,小區(qū)綠化率 大于20%,周邊200米有大型商場, 500米有地鐵,1000米有三甲醫(yī)院, 2000米有升學(xué)率超過60%的高中, 房價(jià)在800W以內(nèi),最近被經(jīng)紀(jì)人帶 看次數(shù)最多的房子??圖數(shù)據(jù)庫場景貝殼關(guān)系圖譜節(jié)點(diǎn):經(jīng)紀(jì)人、房源、客戶關(guān)系:瀏覽、關(guān)注、帶看等偏行
2、為關(guān)系應(yīng)用場景:房源推薦、客源維護(hù)、影響力分級例:當(dāng)某個(gè)用戶經(jīng)常瀏覽關(guān)注或者咨 詢某個(gè)房源時(shí),該房源的維護(hù)人A1會(huì) 邀請?jiān)撚脩舻木S護(hù)人A2帶客戶來看房。圖數(shù)據(jù)庫場景風(fēng)控關(guān)系圖譜事實(shí)圖譜、行為圖譜、 社交圖譜、作業(yè)圖譜、 工商圖譜風(fēng)控場景:虛假房源、 虛假客源、虛假帶看、 私單飛單貝殼圖數(shù)據(jù)庫應(yīng)用場景行業(yè)知識(shí)圖譜貝殼關(guān)系圖譜風(fēng)控關(guān)系圖譜分別使用不同圖數(shù)據(jù)庫,各自為戰(zhàn):分享提綱圖數(shù)據(jù)庫在貝殼的應(yīng)用場景圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫平臺(tái)建設(shè)原理&優(yōu)化&不足圖數(shù)據(jù)庫技術(shù)選型開源成熟擴(kuò)展文檔性能穩(wěn)定運(yùn)維易用圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫技術(shù)選型主流圖數(shù)據(jù)庫對比圖數(shù)據(jù)庫Neo4jOrientDBArangoDBJan
3、usGraphDGraph初次release20072010201220172016是否開源社區(qū)版開源開源開源開源開源是否收費(fèi)企業(yè)版收費(fèi)webUI管理模塊收費(fèi)企業(yè)版收費(fèi)免費(fèi)免費(fèi)數(shù)據(jù)模型graphdoc、graph、 KVdoc、graph、 KVgraphgraphSQL不支持類SQL不支持不支持不支持存儲(chǔ)系統(tǒng)原生原生RockDB依賴其他存儲(chǔ)原生分布式企業(yè)版支持后期支持后期支持原生支持原生支持相關(guān)文檔非常多多多少少圖數(shù)據(jù)庫技術(shù)選型JanusGraph架構(gòu)圖數(shù)據(jù)庫技術(shù)選型Dgraph架構(gòu)Zero:集群大腦,用于控制集群,將服務(wù)器 分配到一個(gè)組,并均衡數(shù)據(jù)。通過raft選主Alpha:存儲(chǔ)數(shù)據(jù)并處
4、理查詢,托管謂詞和索引Group:多個(gè)alpha組成一個(gè)group,數(shù)據(jù) 分片存儲(chǔ)到不同group,每個(gè)group內(nèi)數(shù)據(jù) 通過raft保證強(qiáng)一致性Ratel:可視化界面,用戶可通過界面來執(zhí)行查詢,更新或修改schema圖數(shù)據(jù)庫技術(shù)選型性能對比類型JanusGraphDgraph寫入性能實(shí)時(shí)寫入點(diǎn)15000/s35000/s邊9000/s10000/s初始化寫入三元組24W/s查詢性能(隨機(jī)1W次平均)查詢結(jié)點(diǎn)的所有屬性1.63 ms2.24 ms查詢結(jié)點(diǎn)的一度關(guān)系1.25 ms2.30 ms查詢和當(dāng)前結(jié)點(diǎn)關(guān)聯(lián)的所有一度結(jié)點(diǎn)11.84 ms3.18 ms查詢兩節(jié)點(diǎn)間小于6度的所有最短路徑4.37
5、 ms1.03 ms查詢一度以內(nèi)所有頂點(diǎn)及屬性36.36 ms3.26 ms查詢二度以內(nèi)所有頂點(diǎn)及屬性307.07 ms3.58 ms查詢?nèi)纫詢?nèi)所有頂點(diǎn)及屬性763.21 ms3.76 ms測試機(jī)器:3臺(tái)物理機(jī),48核,128G內(nèi)存,SATA硬盤測試數(shù)據(jù)集:4800w點(diǎn),6300w邊,4.5億三元組,大小30G圖數(shù)據(jù)庫技術(shù)選型Dgraph VS JansGraph特性DgraphJanusGraph架構(gòu)分布式構(gòu)建于其他分布式數(shù)據(jù)庫之上副本強(qiáng)一致性依賴底層DB數(shù)據(jù)均衡自動(dòng)依賴底層DB語言GraphQL+-Gremlin全文檢索原生支持依賴外部檢索系統(tǒng)正則表達(dá)式原生支持依賴外部檢索系統(tǒng)地理位置檢
6、索原生支持依賴外部檢索系統(tǒng)可視化原生支持依賴外部系統(tǒng)維護(hù)成本低很高寫入性能高較高查詢性能簡單和復(fù)雜查詢都很快復(fù)雜查詢較慢分享提綱貝殼圖數(shù)據(jù)庫應(yīng)用場景圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫平臺(tái)建設(shè)原理&優(yōu)化&不足圖數(shù)據(jù)庫平臺(tái)建設(shè)集群搭建dgraph zero -replicas 3dgraph alpha -zero localhost:5080圖數(shù)據(jù)庫平臺(tái)建設(shè)數(shù)據(jù)寫入圖數(shù)據(jù)庫平臺(tái)建設(shè)數(shù)據(jù)查詢查詢名字包含“秀園”,綠化率大于30%的小區(qū)附近1km的幼兒園圖數(shù)據(jù)庫平臺(tái)建設(shè)GraphSQL查詢名字包含“秀園”,綠化率大于30%的小區(qū)附近1km的幼兒園圖數(shù)據(jù)庫平臺(tái)建設(shè)GraphSQL圖數(shù)據(jù)庫平臺(tái)建設(shè)GraphSQL
7、/LianjiaTech/dgraph-sql圖數(shù)據(jù)庫平臺(tái)建設(shè)GraphSQL分享提綱圖數(shù)據(jù)庫在貝殼的應(yīng)用場景圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫平臺(tái)建設(shè)原理&優(yōu)化&不足原理&優(yōu)化Dgraph原理存儲(chǔ)引擎Badger:一個(gè)高效和持久化的,基于 LSM的鍵值數(shù)據(jù)庫,純Go語言編寫隨機(jī)讀比RocksDB快3.5倍存儲(chǔ)結(jié)構(gòu)(Predicate, Subject) - sorted list of ValueId(friend, me) - person1,person2,person3,person4,person5數(shù)據(jù)分片根據(jù)謂詞分片,相同謂詞的數(shù)據(jù)按序存儲(chǔ)在同一個(gè)節(jié)點(diǎn),減少RPC定期數(shù)據(jù)均衡(rebalan
8、ce_interval)group根據(jù)replicas和alpha啟動(dòng)順序確定高可用每個(gè)group至少3個(gè)alpha,互為副本,raft協(xié)議保證強(qiáng)一致性write-ahead logs,預(yù)寫日志原理&優(yōu)化Dgraph原理例:查詢我所有朋友的朋友中就職于貝殼的人。Dgraph:避免廣播,一次網(wǎng)絡(luò)調(diào)用 執(zhí)行一次連接,低延遲,可預(yù)測原理&優(yōu)化Dgraph優(yōu)化Bulkloader導(dǎo)入優(yōu)化,解決內(nèi)存溢出問題,分布式導(dǎo)入改造行業(yè)圖譜500億三元組導(dǎo)入時(shí)間:48h - 15h 提升 3 倍(9物理機(jī))增加數(shù)據(jù)均衡開關(guān),業(yè)務(wù)高峰期禁止均衡,避免影響實(shí)時(shí)寫入原理&優(yōu)化&不足Dgraph不足不支持多重邊任意一對頂
9、點(diǎn),相同標(biāo)簽類型的邊只允許存在一條一個(gè)集群只支持一個(gè)圖企業(yè)版支持多圖大數(shù)據(jù)生態(tài)兼容不夠Spark寫入容易o(hù)verload容易出現(xiàn)超級“邊”不是很成熟分享提綱貝殼圖數(shù)據(jù)庫應(yīng)用場景圖數(shù)據(jù)庫技術(shù)選型圖數(shù)據(jù)庫平臺(tái)建設(shè)原理&優(yōu)化&不足新的選型Nebula GraphNebula Graph VS Dgraph查詢Dgraph最大QPS/avg/p99Nebula Graph最大QPS/avg/p99查詢指定節(jié)點(diǎn)7個(gè)屬性10475/18ms/71ms99053/6ms/11ms查詢一度節(jié)點(diǎn)3個(gè)屬性5995/32ms/145ms5403/36ms/78ms查詢二度節(jié)點(diǎn)3個(gè)屬性1899/48ms/344ms2526/39ms/156ms查詢?nèi)裙?jié)點(diǎn)3個(gè)屬性1315/51ms/368ms698/56ms/640ms查詢四度節(jié)點(diǎn)3個(gè)屬性1134/60ms/529ms655/60ms/764ms測試場景:帶過濾條件多度查詢,結(jié)果集在1000以內(nèi),返回部分屬性,壓測最大QPS測試數(shù)據(jù):小區(qū)子圖,200w點(diǎn),8000W邊,1億RDF測試機(jī)器:3臺(tái)物理機(jī),48核,128G內(nèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省南平市五夫中學(xué)高二化學(xué)上學(xué)期期末試題含解析
- 福建省南平市渭田中學(xué)2021年高二生物模擬試題含解析
- 福建省南平市太平中學(xué)高三數(shù)學(xué)文聯(lián)考試題含解析
- 2 《燭之武退秦師》(說課稿)-2024-2025學(xué)年高一語文下學(xué)期同步教學(xué)說課稿專輯(統(tǒng)編版必修下冊)
- 美術(shù)教育之光
- 解密清明節(jié)氣
- 填分家協(xié)議書(2篇)
- 25王戎不取道旁李 說課稿-2024-2025學(xué)年四年級上冊語文統(tǒng)編版
- 有償使用場地租賃合同
- 租賃山地合同
- 2025年臨床醫(yī)師定期考核必考復(fù)習(xí)題庫及答案(900題)
- 反恐應(yīng)急預(yù)案3篇
- 2025年中國社會(huì)科學(xué)院外國文學(xué)研究所專業(yè)技術(shù)人員招聘3人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 微更新視角下老舊社區(qū)公共空間適老化設(shè)計(jì)策略研究
- 《高血壓治療新進(jìn)展》課件
- 小紅書營銷師(初級)認(rèn)證理論知識(shí)考試題及答案
- 貴州省部分學(xué)校2024-2025學(xué)年高三年級上冊10月聯(lián)考 化學(xué)試卷
- 期末綜合試卷(試題)2024-2025學(xué)年人教版數(shù)學(xué)五年級上冊(含答案)
- 2023-2024學(xué)年貴州省貴陽外國語實(shí)驗(yàn)中學(xué)八年級(上)期末數(shù)學(xué)試卷(含答案)
- 國家電網(wǎng)公司電力安全工作規(guī)程營銷習(xí)題庫(含答案)
- 2024年新能源汽車概論考試題庫
評論
0/150
提交評論