




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1華為FusionStorage架構(gòu)分析常濤2基本功能接口: scsi/iscsi數(shù)據(jù)服務(wù):快照,克隆,精簡配置,分布式cache,備份(全量,增量),復(fù)制(基于volume的異步復(fù)制)存儲基本功能:集群狀態(tài)控制,分布式數(shù)據(jù)分布(DHT),rebuild,reblance過程控制,強(qiáng)一致性協(xié)議3基本組件FusionStorage Manager: 管理模塊,提供告警,監(jiān)控,日志等信息。FustionStorage Agent:代理進(jìn)程,實(shí)現(xiàn)和FusitonStorage Manager的通信。MDC(meta data cluster):集群管理,負(fù)責(zé)集群狀態(tài)的監(jiān)控,數(shù)據(jù)分布規(guī)則,數(shù)據(jù)rebu
2、ild的過程控制。(使用zookeeper)VBS(virtual block system)客戶端,提供分布式塊存儲集群接入點(diǎn)服務(wù)。OSD:數(shù)據(jù)服務(wù)組件。每個磁盤對應(yīng)一個OSD(類似于Ceph)4關(guān)鍵技術(shù):數(shù)據(jù)分布(數(shù)據(jù)路由)FusionStorage采用DHT算法 需要全局保存Partition disk 的映射表1)(LUN1,LBA)生產(chǎn)key2)通過key,通過計(jì)算hash值可得到 Partition3)通過查找全局的 partition 到disk 的路由表,可知具體的disk的值優(yōu)點(diǎn):1)保存partition到disk的映射表,可以實(shí)現(xiàn)負(fù)載均衡 2)保存的元數(shù)據(jù)比較少,可以支持
3、的規(guī)模比較大。缺點(diǎn):副本控制和分布的粒度是pool級別,volume級別的數(shù)據(jù)分布和副本的控制比較難。5關(guān)鍵技術(shù):Cache機(jī)制 Write Cache SSD cache,直接寫SSD返回 數(shù)據(jù)定期從SSD批量刷回HDD磁盤 Read Cache: 內(nèi)存 SSD read cache HDD 磁盤Cache沒有啥特別的。關(guān)鍵看cache緩存算法的實(shí)現(xiàn)優(yōu)劣。6關(guān)鍵技術(shù):讀寫IO流程讀操作: 直接讀Primary OSD寫操作:客戶端VBS發(fā)給Primary OSDPrimary OSD同時發(fā)送給本地磁盤和 Second OSD1) Primary OSD等待 Primary OSD 和 Sec
4、ond OSD的操作都完成,才向客戶端應(yīng)答。沒啥特別設(shè)計(jì),基本流程都一樣。7關(guān)鍵技術(shù):快照/克隆FusionStorage 采用 ROW 快照技術(shù) 優(yōu)點(diǎn)是寫操作性能幾乎不受損失 讀操作,特別是順序讀操作,會有影響?如果使用DHT技術(shù),ROW快照的機(jī)制具體如何實(shí)現(xiàn)? Ceph的機(jī)制? 快照的信息記錄在每個對象的屬性上 Sheepdog的機(jī)制?的機(jī)制? 快照的信息記錄在整個快照的信息記錄在整個volume的屬性上的屬性上Consistent Group 不支持? 快照的實(shí)現(xiàn),應(yīng)該是基于sheepdog的原理實(shí)現(xiàn)。ROW機(jī)制的快照還是挺不錯的。8關(guān)鍵技術(shù):數(shù)據(jù)一致性協(xié)議/掉電保護(hù) 每個IO有編號(通
5、過編號,實(shí)現(xiàn)順序處理) 主OSD和備OSD所接收到的IO編號處理順序完全一致。 ordered request 實(shí)現(xiàn)(類似Ceph的pg log, 性能是瓶頸嗎?) FusitonStorage的保電介質(zhì) NVDIM & PCIe SSD 所有的元數(shù)據(jù) + 數(shù)據(jù)都緩存在 保電介質(zhì)中,系統(tǒng)掉電重啟后replay類似ceph,NVDIM或者PCIe SSD 做日志(包括元數(shù)據(jù)和數(shù)據(jù))9關(guān)鍵技術(shù):平滑擴(kuò)容 DHT 技術(shù)比較容易的支持 Reblance/Rebuild 時的所占資源的控制 (沒有提到) 在恢復(fù)速度和不影響前端性能之間平衡10關(guān)鍵技術(shù):災(zāi)備 基于volume的同步復(fù)制 同城雙活 基于故障域?qū)崿F(xiàn)的雙活。但是難以實(shí)現(xiàn)基于volume的同步復(fù)制 基于volume的異步復(fù)制 異地復(fù)制 基于快照實(shí)現(xiàn)的全量和增量備份 可基于Volume的實(shí)現(xiàn)11其它功能 分布式緩存 有必要嗎? 如果負(fù)載均衡 針對熱點(diǎn)?讀熱點(diǎn)緩存在cache中,寫熱點(diǎn)也沒法分布式啊? 支持InifiniBand高速網(wǎng)絡(luò) Data Scrub 定時檢測存儲數(shù)據(jù) 提前預(yù)防數(shù)據(jù)錯誤 硬盤可靠性 壞塊標(biāo)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 止痛藥物應(yīng)用總結(jié)模版
- 平衡的穩(wěn)定性教學(xué)設(shè)計(jì)
- 機(jī)械工程材料基礎(chǔ)第三章鋼的熱處理
- 人教版三年級語文下冊《口語交際:春游去哪兒玩》教學(xué)課件
- 醫(yī)院人事管理課件
- 腫瘤機(jī)器技術(shù)應(yīng)用與發(fā)展
- 提高課堂教學(xué)的有效性心得體會模版
- 本學(xué)期少先隊(duì)工作總結(jié)模版
- 手術(shù)室傳染病分管規(guī)范
- 初一上英語教學(xué)總結(jié)模版
- 經(jīng)營崗位筆試題目及答案
- cng安全管理制度
- 消渴腎病的中醫(yī)護(hù)理方案
- 農(nóng)行反洗錢與制裁合規(guī)知識競賽考試題庫大全-上下
- DGTJ08-202-2020鉆孔灌注樁施工規(guī)程 上海市
- 拆遷協(xié)議中的貸款合同
- 河北省中原名校2025屆高考化學(xué)押題試卷含解析
- 小學(xué)學(xué)生體質(zhì)健康監(jiān)測管理制度
- 輕鋼龍骨隔墻施工方案
- 2025年面包烘培考試試題及答案
- 2025年社會工作者職業(yè)水平考試中級實(shí)務(wù)模擬試卷:社會工作專業(yè)能力與團(tuán)隊(duì)協(xié)作能力試題
評論
0/150
提交評論