版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Redis內(nèi)存使用優(yōu)化與存儲(chǔ)上一篇Redis文章對(duì)其適用場(chǎng)景與特點(diǎn)進(jìn)行了一個(gè)概括的分析,本文將對(duì)Redis的常見數(shù)據(jù)類型的使用場(chǎng)景以及在內(nèi)存優(yōu)化方面和性能優(yōu)化方面做一些詳細(xì)的分析。Redis常用數(shù)據(jù)類型Redis最為常用的數(shù)據(jù)類型主要有以下五種:StringHashListSetSortedset在具體描述這幾種數(shù)據(jù)類型之前,我們先通過一張圖了解下Redis內(nèi)部?jī)?nèi)存管理中是如何描述這些不同數(shù)據(jù)類型的:首先Redis內(nèi)部使用一個(gè)redisObject對(duì)象來表示所有的key和value,redisObject最主要的信息如上圖所示:type代表一個(gè)value對(duì)象具體是何種數(shù)據(jù)類型,encoding是不同數(shù)據(jù)類型在redis內(nèi)部的存儲(chǔ)方式,比如:type=string代表value存儲(chǔ)的是一個(gè)普通字符串,那么對(duì)應(yīng)的encoding可以是raw或者是int,如果是int則代表實(shí)際redis內(nèi)部是按數(shù)值型類存儲(chǔ)和表示這個(gè)字符串的,當(dāng)然前提是這個(gè)字符串本身可以用數(shù)值表示,比如:"123""456"這樣的字符串。這里需要特殊說明一下vm字段,只有打開了Redis的虛擬內(nèi)存功能,此字段才會(huì)真正的分配內(nèi)存,該功能默認(rèn)是關(guān)閉狀態(tài)的,該功能會(huì)在后面具體描述。通過上圖我們可以發(fā)現(xiàn)Redis使用redisObject來表示所有的key/value數(shù)據(jù)是比較浪費(fèi)內(nèi)存的,當(dāng)然這些內(nèi)存管理成本的付出主要也是為了給Redis不同數(shù)據(jù)類型提供一個(gè)統(tǒng)一的管理接口,實(shí)際作者也提供了多種方法幫助我們盡量節(jié)省內(nèi)存使用,我們隨后會(huì)具體討論。下面我們先來逐一的分析下這五種數(shù)據(jù)類型的使用和內(nèi)部實(shí)現(xiàn)方式:String常用命令:set,get,decr,incr,mget等。應(yīng)用場(chǎng)景:String是最常用的一種數(shù)據(jù)類型,普通的key/value存儲(chǔ)都可以歸為此類,這里就不所做解釋了。實(shí)現(xiàn)方式:String在redis內(nèi)部存儲(chǔ)默認(rèn)就是一個(gè)字符串,被redisObject所引用,當(dāng)遇到incr,decr等操作時(shí)會(huì)轉(zhuǎn)成數(shù)值型進(jìn)行計(jì)算,此時(shí)redisObject的encoding字段為int。Hash常用命令:hget,hset,hgetall等。應(yīng)用場(chǎng)景:我們簡(jiǎn)單舉個(gè)實(shí)例來描述下Hash的應(yīng)用場(chǎng)景,比如我們要存儲(chǔ)一個(gè)用戶信息對(duì)象數(shù)據(jù),包含以下信息:用戶ID為查找的key,存儲(chǔ)的value用戶對(duì)象包含姓名,年齡,生日等信息,如果用普通的key/value結(jié)構(gòu)來存儲(chǔ),主要有以下2種存儲(chǔ)方式:第一種方式將用戶ID作為查找key,把其他信息封裝成一個(gè)對(duì)象以序列化的方式存儲(chǔ),這種方式的缺點(diǎn)是,增加了序列化/反序列化的開銷,并且在需要修改其中一項(xiàng)信息時(shí),需要把整個(gè)對(duì)象取回,并且修改操作需要對(duì)并發(fā)進(jìn)行保護(hù),引入CAS等復(fù)雜問題。第二種方法是這個(gè)用戶信息對(duì)象有多少成員就存成多少個(gè)key-value對(duì)兒,用用戶ID+對(duì)應(yīng)屬性的名稱作為唯一標(biāo)識(shí)來取得對(duì)應(yīng)屬性的值,雖然省去了序列化開銷和并發(fā)問題,但是用戶ID為重復(fù)存儲(chǔ),如果存在大量這樣的數(shù)據(jù),內(nèi)存浪費(fèi)還是非??捎^的。那么Redis提供的Hash很好的解決了這個(gè)問題,Redis的Hash實(shí)際是內(nèi)部存儲(chǔ)的Value為一個(gè)HashMap,并提供了直接存取這個(gè)Map成員的接口,如下圖:也就是說,Key仍然是用戶ID,value是一個(gè)Map,這個(gè)Map的key是成員的屬性名,value是屬性值,這樣對(duì)數(shù)據(jù)的修改和存取都可以直接通過其內(nèi)部Map的Key(Redis里稱內(nèi)部Map的key為field),也就是通過key(用戶ID)+field(屬性標(biāo)簽)就可以操作對(duì)應(yīng)屬性數(shù)據(jù)了,既不需要重復(fù)存儲(chǔ)數(shù)據(jù),也不會(huì)帶來序列化和并發(fā)修改控制的問題。很好的解決了問題。這里同時(shí)需要注意,Redis提供了接口(hgetall)可以直接取到全部的屬性數(shù)據(jù),但是如果內(nèi)部Map的成員很多,那么涉及到遍歷整個(gè)內(nèi)部Map的操作,由于Redis單線程模型的緣故,這個(gè)遍歷操作可能會(huì)比較耗時(shí),而另其它客戶端的請(qǐng)求完全不響應(yīng),這點(diǎn)需要格外注意。實(shí)現(xiàn)方式:上面已經(jīng)說到RedisHash對(duì)應(yīng)Value內(nèi)部實(shí)際就是一個(gè)HashMap,實(shí)際這里會(huì)有2種不同實(shí)現(xiàn),這個(gè)Hash的成員比較少時(shí)Redis為了節(jié)省內(nèi)存會(huì)采用類似一維數(shù)組的方式來緊湊存儲(chǔ),而不會(huì)采用真正的HashMap結(jié)構(gòu),對(duì)應(yīng)的valueredisObject的encoding為zipmap,當(dāng)成員數(shù)量增大時(shí)會(huì)自動(dòng)轉(zhuǎn)成真正的HashMap,此時(shí)encoding為ht。List常用命令:lpush,rpush,lpop,rpop,lrange等。應(yīng)用場(chǎng)景:Redislist的應(yīng)用場(chǎng)景非常多,也是Redis最重要的數(shù)據(jù)結(jié)構(gòu)之一,比如twitter的關(guān)注列表,粉絲列表等都可以用Redis的list結(jié)構(gòu)來實(shí)現(xiàn),比較好理解,這里不再重復(fù)。實(shí)現(xiàn)方式:Redislist的實(shí)現(xiàn)為一個(gè)雙向鏈表,即可以支持反向查找和遍歷,更方便操作,不過帶來了部分額外的內(nèi)存開銷,Redis內(nèi)部的很多實(shí)現(xiàn),包括發(fā)送緩沖隊(duì)列等也都是用的這個(gè)數(shù)據(jù)結(jié)構(gòu)。Set常用命令:sadd,spop,smembers,sunion等。應(yīng)用場(chǎng)景:Redisset對(duì)外提供的功能與list類似是一個(gè)列表的功能,特殊之處在于set是可以自動(dòng)排重的,當(dāng)你需要存儲(chǔ)一個(gè)列表數(shù)據(jù),又不希望出現(xiàn)重復(fù)數(shù)據(jù)時(shí),set是一個(gè)很好的選擇,并且set提供了判斷某個(gè)成員是否在一個(gè)set集合內(nèi)的重要接口,這個(gè)也是list所不能提供的。實(shí)現(xiàn)方式:set的內(nèi)部實(shí)現(xiàn)是一個(gè)value永遠(yuǎn)為null的HashMap,實(shí)際就是通過計(jì)算hash的方式來快速排重的,這也是set能提供判斷一個(gè)成員是否在集合內(nèi)的原因。Sortedset常用命令:zadd,zrange,zrem,zcard等使用場(chǎng)景:Redissortedset的使用場(chǎng)景與set類似,區(qū)別是set不是自動(dòng)有序的,而sortedset可以通過用戶額外提供一個(gè)優(yōu)先級(jí)(score)的參數(shù)來為成員排序,并且是插入有序的,即自動(dòng)排序。當(dāng)你需要一個(gè)有序的并且不重復(fù)的集合列表,那么可以選擇sortedset數(shù)據(jù)結(jié)構(gòu),比如twitter的publictimeline可以以發(fā)表時(shí)間作為score來存儲(chǔ),這樣獲取時(shí)就是自動(dòng)按時(shí)間排好序的。實(shí)現(xiàn)方式:Redissortedset的內(nèi)部使用HashMap和跳躍表(SkipList)來保證數(shù)據(jù)的存儲(chǔ)和有序,HashMap里放的是成員到score的映射,而跳躍表里存放的是所有的成員,排序依據(jù)是HashMap里存的score,使用跳躍表的結(jié)構(gòu)可以獲得比較高的查找效率,并且在實(shí)現(xiàn)上比較簡(jiǎn)單。常用內(nèi)存優(yōu)化手段與參數(shù)通過我們上面的一些實(shí)現(xiàn)上的分析可以看出redis實(shí)際上的內(nèi)存管理成本非常高,即占用了過多的內(nèi)存,作者對(duì)這點(diǎn)也非常清楚,所以提供了一系列的參數(shù)和手段來控制和節(jié)省內(nèi)存,我們分別來討論下。首先最重要的一點(diǎn)是不要開啟Redis的VM選項(xiàng),即虛擬內(nèi)存功能,這個(gè)本來是作為Redis存儲(chǔ)超出物理內(nèi)存數(shù)據(jù)的一種數(shù)據(jù)在內(nèi)存與磁盤換入換出的一個(gè)持久化策略,但是其內(nèi)存管理成本也非常的高,并且我們后續(xù)會(huì)分析此種持久化策略并不成熟,所以要關(guān)閉VM功能,請(qǐng)檢查你的redis.conf文件中vm-enabled為no。其次最好設(shè)置下redis.conf中的maxmemory選項(xiàng),該選項(xiàng)是告訴Redis當(dāng)使用了多少物理內(nèi)存后就開始拒絕后續(xù)的寫入請(qǐng)求,該參數(shù)能很好的保護(hù)好你的Redis不會(huì)因?yàn)槭褂昧诉^多的物理內(nèi)存而導(dǎo)致swap,最終嚴(yán)重影響性能甚至崩潰。另外Redis為不同數(shù)據(jù)類型分別提供了一組參數(shù)來控制內(nèi)存使用,我們?cè)谇懊嬖敿?xì)分析過RedisHash是value內(nèi)部為一個(gè)HashMap,如果該Map的成員數(shù)比較少,則會(huì)采用類似一維線性的緊湊格式來存儲(chǔ)該Map,即省去了大量指針的內(nèi)存開銷,這個(gè)參數(shù)控制對(duì)應(yīng)在redis.conf配置文件中下面2項(xiàng):hash-max-zipmap-entries64hash-max-zipmap-value512hash-max-zipmap-entries含義是當(dāng)value這個(gè)Map內(nèi)部不超過多少個(gè)成員時(shí)會(huì)采用線性緊湊格式存儲(chǔ),默認(rèn)是64,即value內(nèi)部有64個(gè)以下的成員就是使用線性緊湊存儲(chǔ),超過該值自動(dòng)轉(zhuǎn)成真正的HashMap。hash-max-zipmap-value含義是當(dāng)value這個(gè)Map內(nèi)部的每個(gè)成員值長(zhǎng)度不超過多少字節(jié)就會(huì)采用線性緊湊存儲(chǔ)來節(jié)省空間。以上2個(gè)條件任意一個(gè)條件超過設(shè)置值都會(huì)轉(zhuǎn)換成真正的HashMap,也就不會(huì)再節(jié)省內(nèi)存了,那么這個(gè)值是不是設(shè)置的越大越好呢,答案當(dāng)然是否定的,HashMap的優(yōu)勢(shì)就是查找和操作的時(shí)間復(fù)雜度都是O(1)的,而放棄Hash采用一維存儲(chǔ)則是O(n)的時(shí)間復(fù)雜度,如果成員數(shù)量很少,則影響不大,否則會(huì)嚴(yán)重影響性能,所以要權(quán)衡好這個(gè)值的設(shè)置,總體上還是最根本的時(shí)間成本和空間成本上的權(quán)衡。同樣類似的參數(shù)還有:list-max-ziplist-entries512說明:list數(shù)據(jù)類型多少節(jié)點(diǎn)以下會(huì)采用去指針的緊湊存儲(chǔ)格式。list-max-ziplist-value64說明:list數(shù)據(jù)類型節(jié)點(diǎn)值大小小于多少字節(jié)會(huì)采用緊湊存儲(chǔ)格式。set-max-intset-entries512說明:set數(shù)據(jù)類型內(nèi)部數(shù)據(jù)如果全部是數(shù)值型,且包含多少節(jié)點(diǎn)以下會(huì)采用緊湊格式存儲(chǔ)。最后想說的是Redis內(nèi)部實(shí)現(xiàn)沒有對(duì)內(nèi)存分配方面做過多的優(yōu)化,在一定程度上會(huì)存在內(nèi)存碎片,不過大多數(shù)情況下這個(gè)不會(huì)成為Redis的性能瓶頸,不過如果在Redis內(nèi)部存儲(chǔ)的大部分?jǐn)?shù)據(jù)是數(shù)值型的話,Redis內(nèi)部采用了一個(gè)sharedinteger的方式來省去分配內(nèi)存的開銷,即在系統(tǒng)啟動(dòng)時(shí)先分配一個(gè)從1~n那么多個(gè)數(shù)值對(duì)象放在一個(gè)池子中,如果存儲(chǔ)的數(shù)據(jù)恰好是這個(gè)數(shù)值范圍內(nèi)的數(shù)據(jù),則直接從池子里取出該對(duì)象,并且通過引用計(jì)數(shù)的方式來共享,這樣在系統(tǒng)存儲(chǔ)了大量數(shù)值下,也能一定程度上節(jié)省內(nèi)存并且提高性能,這個(gè)參數(shù)值n的設(shè)置需要修改源代碼中的一行宏定義REDIS_SHARED_INTEGERS,該值默認(rèn)是10000,可以根據(jù)自己的需要進(jìn)行修改,修改后重新編譯就可以了。Redis的持久化機(jī)制Redis由于支持非常豐富的內(nèi)存數(shù)據(jù)結(jié)構(gòu)類型,如何把這些復(fù)雜的內(nèi)存組織方式持久化到磁盤上是一個(gè)難題,所以Redis的持久化方式與傳統(tǒng)數(shù)據(jù)庫(kù)的方式有比較多的差別,Redis一共支持四種持久化方式,分別是:定時(shí)快照方式(snapshot)基于語句追加文件的方式(aof)虛擬內(nèi)存(vm)Diskstore方式在設(shè)計(jì)思路上,前兩種是基于全部數(shù)據(jù)都在內(nèi)存中,即小數(shù)據(jù)量下提供磁盤落地功能,而后兩種方式則是作者在嘗試存儲(chǔ)數(shù)據(jù)超過物理內(nèi)存時(shí),即大數(shù)據(jù)量的數(shù)據(jù)存儲(chǔ),截止到本文,后兩種持久化方式仍然是在實(shí)驗(yàn)階段,并且vm方式基本已經(jīng)被作者放棄,所以實(shí)際能在生產(chǎn)環(huán)境用的只有前兩種,換句話說Redis目前還只能作為小數(shù)據(jù)量存儲(chǔ)(全部數(shù)據(jù)能夠加載在內(nèi)存中),海量數(shù)據(jù)存儲(chǔ)方面并不是Redis所擅長(zhǎng)的領(lǐng)域。下面分別介紹下這幾種持久化方式:定時(shí)快照方式(snapshot):該持久化方式實(shí)際是在Redis內(nèi)部一個(gè)定時(shí)器事件,每隔固定時(shí)間去檢查當(dāng)前數(shù)據(jù)發(fā)生的改變次數(shù)與時(shí)間是否滿足配置的持久化觸發(fā)的條件,如果滿足則通過操作系統(tǒng)fork調(diào)用來創(chuàng)建出一個(gè)子進(jìn)程,這個(gè)子進(jìn)程默認(rèn)會(huì)與父進(jìn)程共享相同的地址空間,這時(shí)就可以通過子進(jìn)程來遍歷整個(gè)內(nèi)存來進(jìn)行存儲(chǔ)操作,而主進(jìn)程則仍然可以提供服務(wù),當(dāng)有寫入時(shí)由操作系統(tǒng)按照內(nèi)存頁(page)為單位來進(jìn)行copy-on-write保證父子進(jìn)程之間不會(huì)互相影響。該持久化的主要缺點(diǎn)是定時(shí)快照只是代表一段時(shí)間內(nèi)的內(nèi)存映像,所以系統(tǒng)重啟會(huì)丟失上次快照與重啟之間所有的數(shù)據(jù)。基于語句追加方式(aof):aof方式實(shí)際類似mysql的基于語句的binlog方式,即每條會(huì)使Redis內(nèi)存數(shù)據(jù)發(fā)生改變的命令都會(huì)追加到一個(gè)log文件中,也就是說這個(gè)log文件就是Redis的持久化數(shù)據(jù)。aof的方式的主要缺點(diǎn)是追加log文件可能導(dǎo)致體積過大,當(dāng)系統(tǒng)重啟恢復(fù)數(shù)據(jù)時(shí)如果是aof的方式則加載數(shù)據(jù)會(huì)非常慢,幾十G的數(shù)據(jù)可能需要幾小時(shí)才能加載完,當(dāng)然這個(gè)耗時(shí)并不是因?yàn)榇疟P文件讀取速度慢,而是由于讀取的所有命令都要在內(nèi)存中執(zhí)行一遍。另外由于每條命令都要寫log,所以使用aof的方式,Redis的讀寫性能也會(huì)有所下降。虛擬內(nèi)存方式:虛擬內(nèi)存方式是Redis來進(jìn)行用戶空間的數(shù)據(jù)換入換出的一個(gè)策略,此種方式在實(shí)現(xiàn)的效果上比較差,主要問題是代碼復(fù)雜,重啟慢,復(fù)制慢等等,目前已經(jīng)被作者放棄。diskstore方式:diskstore方式是作者放棄了虛擬內(nèi)存方式后選擇的一種新的實(shí)現(xiàn)方式,也就是傳統(tǒng)的B-tree的方式,目前仍在實(shí)驗(yàn)階段,后續(xù)是否可用我們可以拭目以待。Redis持久化磁盤IO方式及其帶來的問題有Redis線上運(yùn)維經(jīng)驗(yàn)的人會(huì)發(fā)現(xiàn)Redis在物理內(nèi)存使用比較多,但還沒有超過實(shí)際物理內(nèi)存總?cè)萘繒r(shí)就會(huì)發(fā)生不穩(wěn)定甚至崩潰的問題,有人認(rèn)為是基于快照方式持久化的fork系統(tǒng)調(diào)用造成內(nèi)存占用加倍而導(dǎo)致的,這種觀點(diǎn)是不準(zhǔn)確的,因?yàn)閒ork調(diào)用的copy-on-write機(jī)制是基于操作系統(tǒng)頁這個(gè)單位的,也就是只有有寫入的臟頁會(huì)被復(fù)制,但是一般
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年云計(jì)算服務(wù)采購(gòu)合同
- 2024關(guān)于新冠病毒疫苗研發(fā)的技術(shù)共享與保密合同
- 2023年山東大學(xué)第二醫(yī)院護(hù)理人員招聘考試真題
- 2024年專業(yè)離婚調(diào)解服務(wù)協(xié)議
- 2024年城市供水系統(tǒng)建設(shè)特許經(jīng)營(yíng)權(quán)協(xié)議
- 2024年二手車買賣合同樣式
- 2024年國(guó)際版權(quán)交易與出版合作協(xié)議
- 2024年企業(yè)社會(huì)責(zé)任履行與可持續(xù)發(fā)展合同
- 2024年工程建筑項(xiàng)目資料全權(quán)委托承包合同
- 2024聲學(xué)技術(shù)研發(fā)與產(chǎn)業(yè)化合同
- 質(zhì)量為綱-華為公司質(zhì)量理念與實(shí)踐
- 17難忘的潑水節(jié)第一課時(shí)公開課一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- 大一統(tǒng)王朝的鞏固(課件) 2024-2025學(xué)年七年級(jí)歷史上冊(cè)同步教學(xué)課件(統(tǒng)編版2024)
- 課件第一章第1節(jié)動(dòng)量定理(16張)
- 2024年銀行合規(guī)心得體會(huì)(五篇)
- 水生產(chǎn)企業(yè)(自來水公司)水務(wù)安全生產(chǎn)三項(xiàng)制度(安全生產(chǎn)責(zé)任制、制度、操作規(guī)程)匯編
- 加強(qiáng)學(xué)校食堂管理提高食品安全意識(shí)(培訓(xùn)課件)
- 醫(yī)療質(zhì)量管理與控制制度
- 2024年重慶市高考物理試卷(含答案解析)
- 2019新人教版高中生物選擇性必修二全冊(cè)重點(diǎn)知識(shí)點(diǎn)歸納總結(jié)
- 2023版國(guó)開電大本科《高級(jí)財(cái)務(wù)會(huì)計(jì)》在線形考(任務(wù)一至四)試題及答案
評(píng)論
0/150
提交評(píng)論