【生物信息學(xué)第二版】計算表觀遺傳學(xué)_第1頁
【生物信息學(xué)第二版】計算表觀遺傳學(xué)_第2頁
【生物信息學(xué)第二版】計算表觀遺傳學(xué)_第3頁
【生物信息學(xué)第二版】計算表觀遺傳學(xué)_第4頁
【生物信息學(xué)第二版】計算表觀遺傳學(xué)_第5頁
已閱讀5頁,還剩140頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、生物信息學(xué)生物信息學(xué)第十章第十章 計算表觀遺傳學(xué)計算表觀遺傳學(xué)哈爾濱醫(yī)科大學(xué)哈爾濱醫(yī)科大學(xué) 張巖張巖生物信息學(xué)生物信息學(xué)長頸鹿的來源長頸鹿的來源第一節(jié)第一節(jié) 引言引言Section 1 Introduction 一、表觀遺傳學(xué)(一、表觀遺傳學(xué)(epigeneticsepigenetics) 表觀遺傳學(xué)是研究不涉及表觀遺傳學(xué)是研究不涉及DNA序列改變的情況下,序列改變的情況下,DNA甲基化譜、染色質(zhì)結(jié)構(gòu)狀態(tài)和基因表達(dá)譜在細(xì)甲基化譜、染色質(zhì)結(jié)構(gòu)狀態(tài)和基因表達(dá)譜在細(xì)胞代間傳遞的遺傳現(xiàn)象的一門科學(xué)。胞代間傳遞的遺傳現(xiàn)象的一門科學(xué)。遺傳現(xiàn)象遺傳現(xiàn)象:生物界普遍存在的現(xiàn)象生物界普遍存在的現(xiàn)象表觀遺傳現(xiàn)象表

2、觀遺傳現(xiàn)象:生物界普遍存在的另一現(xiàn)象生物界普遍存在的另一現(xiàn)象二、計算表觀遺傳學(xué)二、計算表觀遺傳學(xué) 應(yīng)用及開發(fā)應(yīng)用及開發(fā)生物信息學(xué)方法生物信息學(xué)方法(統(tǒng)計分析,模式識(統(tǒng)計分析,模式識別等)解決生物醫(yī)學(xué)相關(guān)的表觀遺傳學(xué)問題。別等)解決生物醫(yī)學(xué)相關(guān)的表觀遺傳學(xué)問題。生物信息學(xué)構(gòu)架了基因組學(xué)與表觀基因組學(xué)的橋梁生物信息學(xué)構(gòu)架了基因組學(xué)與表觀基因組學(xué)的橋梁計計算算表表觀觀遺遺傳傳學(xué)學(xué)表觀遺傳學(xué)領(lǐng)域全球發(fā)表的論文表觀遺傳學(xué)領(lǐng)域全球發(fā)表的論文計算表觀遺傳學(xué)的發(fā)展計算表觀遺傳學(xué)的發(fā)展三、計算表觀遺傳學(xué)研究方向三、計算表觀遺傳學(xué)研究方向 預(yù)測預(yù)測的角度研究表觀遺傳現(xiàn)象。的角度研究表觀遺傳現(xiàn)象。 應(yīng)用生物信息學(xué)

3、工具建立遺傳與表觀遺傳應(yīng)用生物信息學(xué)工具建立遺傳與表觀遺傳調(diào)控調(diào)控網(wǎng)絡(luò)網(wǎng)絡(luò)。 表觀遺傳表觀遺傳數(shù)據(jù)庫數(shù)據(jù)庫。 建立在表觀遺傳機(jī)制基礎(chǔ)的建立在表觀遺傳機(jī)制基礎(chǔ)的功能基因組及比較功能基因組及比較基因組研究基因組研究。四、計算表觀遺傳學(xué)研究內(nèi)容四、計算表觀遺傳學(xué)研究內(nèi)容(一)數(shù)據(jù)層面(一)數(shù)據(jù)層面分子水平的表觀遺傳修飾分子水平的表觀遺傳修飾(二)數(shù)據(jù)分類(二)數(shù)據(jù)分類(三)算法層面(三)算法層面開發(fā)新開發(fā)新方法方法和工具和工具 處理及分析表處理及分析表觀遺傳數(shù)據(jù)觀遺傳數(shù)據(jù) 挖掘表觀挖掘表觀遺傳現(xiàn)象遺傳現(xiàn)象常用的算法常用的算法統(tǒng)計學(xué)方法統(tǒng)計學(xué)方法 回歸分析回歸分析 相關(guān)分析及判別分析相關(guān)分析及判別分析

4、 聚類分析聚類分析 主成分分析主成分分析 因子分析因子分析模式識別方法模式識別方法 支持向量機(jī)支持向量機(jī) 決策樹決策樹 貝葉斯網(wǎng)絡(luò)貝葉斯網(wǎng)絡(luò) 最小二乘法最小二乘法 最近鄰算法最近鄰算法(四)功能層面(四)功能層面目的目的 有效利用當(dāng)前已有的高通量表觀基因組數(shù)據(jù)有效利用當(dāng)前已有的高通量表觀基因組數(shù)據(jù) 單核苷酸多態(tài)、單核苷酸多態(tài)、DNA甲基化與基因表達(dá)之間的關(guān)甲基化與基因表達(dá)之間的關(guān)系,挖掘調(diào)控基因表達(dá)的關(guān)鍵因子。系,挖掘調(diào)控基因表達(dá)的關(guān)鍵因子。 舉例:利用舉例:利用DNA甲基化數(shù)據(jù)預(yù)測新的癌癥相關(guān)基因甲基化數(shù)據(jù)預(yù)測新的癌癥相關(guān)基因Prioritizing cancer-related genes

5、 with aberrant methylation based on a weighted protein-protein interaction network.人類蛋白質(zhì)互作網(wǎng)絡(luò)人類蛋白質(zhì)互作網(wǎng)絡(luò) 癌癥相關(guān)的子網(wǎng)癌癥相關(guān)的子網(wǎng)腫瘤腫瘤神經(jīng)退行神經(jīng)退行性疾病性疾病心血管心血管疾病疾病精神性精神性疾病疾病代謝性代謝性疾病疾?。ㄒ唬┯嬎惚碛^遺傳學(xué)與疾?。ㄒ唬┯嬎惚碛^遺傳學(xué)與疾病五、計算表觀遺傳學(xué)的應(yīng)用五、計算表觀遺傳學(xué)的應(yīng)用內(nèi)源性逆轉(zhuǎn)錄表達(dá)內(nèi)源性逆轉(zhuǎn)錄表達(dá)腫瘤抑制基因表達(dá)腫瘤抑制基因表達(dá)染色質(zhì)結(jié)構(gòu)異常染色質(zhì)結(jié)構(gòu)異常 腫瘤表觀遺傳的特征腫瘤表觀遺傳的特征精神性疾病精神性疾病DNA甲基化的特征甲基

6、化的特征(二)計算表觀遺傳學(xué)與發(fā)育(二)計算表觀遺傳學(xué)與發(fā)育發(fā)育中發(fā)育中DNA甲基化的特征甲基化的特征早期胚胎早期胚胎DNA甲基化的特征甲基化的特征(三)計算表觀遺傳學(xué)與進(jìn)化(三)計算表觀遺傳學(xué)與進(jìn)化DNA甲基化的進(jìn)化分析甲基化的進(jìn)化分析DNA甲基化的進(jìn)化分析甲基化的進(jìn)化分析DNA甲基化的進(jìn)化分析甲基化的進(jìn)化分析DNADNA甲基化和組蛋白修飾有潛在的臨床用途甲基化和組蛋白修飾有潛在的臨床用途附加的診斷工具附加的診斷工具預(yù)后因子預(yù)后因子治療反應(yīng)預(yù)測治療反應(yīng)預(yù)測用于普遍臨床實踐用于普遍臨床實踐抑癌基因高甲基化和抑癌基因高甲基化和DNA高甲基化譜可用于癌癥病高甲基化譜可用于癌癥病人預(yù)后指示器人預(yù)后指

7、示器特定基因的高甲基化可對特定基因的高甲基化可對治療反應(yīng)進(jìn)行預(yù)測治療反應(yīng)進(jìn)行預(yù)測第二節(jié)第二節(jié) 基因組的基因組的DNADNA甲基化甲基化Section 2 Genome-wide DNA Methylation一、一、CpGCpG島的島的DNADNA甲基化調(diào)控基因表達(dá)甲基化調(diào)控基因表達(dá)(一)(一) DNADNA甲基化與甲基化與CpGCpG島島 DNA甲基化是一種發(fā)生在甲基化是一種發(fā)生在DNA序列上的化學(xué)修飾,序列上的化學(xué)修飾,可以在轉(zhuǎn)錄及細(xì)胞分裂前后被穩(wěn)定地遺傳??梢栽谵D(zhuǎn)錄及細(xì)胞分裂前后被穩(wěn)定地遺傳。DNA甲甲基化是重要的表觀遺傳代碼?;侵匾谋碛^遺傳代碼。 DNA甲基化的發(fā)生機(jī)制甲基化的發(fā)

8、生機(jī)制(二)(二)DNADNA甲基化對轉(zhuǎn)錄的調(diào)控甲基化對轉(zhuǎn)錄的調(diào)控1. DNA甲基化阻礙轉(zhuǎn)錄因子的結(jié)合甲基化阻礙轉(zhuǎn)錄因子的結(jié)合2. DNA甲基化識別染色質(zhì)標(biāo)記甲基化識別染色質(zhì)標(biāo)記 3. DNA甲基化募集其他蛋白引起染色質(zhì)沉默甲基化募集其他蛋白引起染色質(zhì)沉默4. DNA甲基化影響核小體定位甲基化影響核小體定位CpG島甲基化和轉(zhuǎn)錄的關(guān)系島甲基化和轉(zhuǎn)錄的關(guān)系(三)(三)DNADNA甲基化的意義甲基化的意義 CpG二核苷酸的甲基化與重復(fù)元件沉默二核苷酸的甲基化與重復(fù)元件沉默 CpG二核苷酸的甲基化與染色體的選擇性沉默二核苷酸的甲基化與染色體的選擇性沉默 DNA甲基化與基因的組織特異表達(dá)甲基化與基因的組

9、織特異表達(dá)二、基因組二、基因組CpGCpG島識別方法島識別方法(一)一)CpGCpG島識別準(zhǔn)則島識別準(zhǔn)則Gardiner-Garden和和Frommer長度最短長度最短200bpGC含量至少含量至少50%CpG O/E最小最小0.6許多啟動子缺乏嚴(yán)格定義的許多啟動子缺乏嚴(yán)格定義的CpG島,但是有組織島,但是有組織特異的甲基化模式和轉(zhuǎn)錄活性有密切聯(lián)系。特異的甲基化模式和轉(zhuǎn)錄活性有密切聯(lián)系。1. 最初的最初的CpG島定義島定義2. 改進(jìn)的改進(jìn)的CpG島定義島定義Takai和和Jones增加最短長度、增加最短長度、CpG O/E值值GC含量分別到含量分別到500 bp,0.65% 和和 55%對預(yù)測

10、精度對預(yù)測精度的影響。的影響。通過使閾值更加嚴(yán)格,通過使閾值更加嚴(yán)格,Alu重復(fù)元件得到最大程重復(fù)元件得到最大程度的排除,但此時卻排除了原來數(shù)量度的排除,但此時卻排除了原來數(shù)量10%的的CpG島,這表明一些真正的島,這表明一些真正的CpG島可能也被排除。島可能也被排除。常見的常見的CpG島預(yù)測算法島預(yù)測算法預(yù)測方法預(yù)測方法長度長度(bpbp)GCGC含量含量(% %)CpG CpG O/EO/E重復(fù)元重復(fù)元件屏蔽件屏蔽備注備注ENSEMBL40050%0.6否否嚴(yán)格的參數(shù)限制嚴(yán)格的參數(shù)限制NCBI寬松寬松20050%0.6否否總總CpG島數(shù)目島數(shù)目307193NCBI嚴(yán)格嚴(yán)格50050%0.6

11、否否總總CpG島數(shù)目島數(shù)目24163UCSC20050%0.6是是總總CpG島數(shù)目島數(shù)目28226常見的常見的CpG島預(yù)測算法島預(yù)測算法預(yù)測方法預(yù)測方法長度長度(bpbp)GCGC含量含量(% %)CpG CpG O/EO/E重復(fù)元重復(fù)元件屏蔽件屏蔽備注備注EMBOSS指定指定指定指定指定指定否否參數(shù)可調(diào)參數(shù)可調(diào)CpGProD50050%0.6是是總總CpG島數(shù)目島數(shù)目76793CpGcluster無限無限制制無限制無限制無限制無限制否否總總CpG島數(shù)目島數(shù)目197727CpG_MI50無限制無限制無限制無限制否否總總CpG島數(shù)目島數(shù)目40926差異取決于以下因素差異取決于以下因素(1 1)任

12、意閾值的應(yīng)用;)任意閾值的應(yīng)用;(2 2)沒有考慮到)沒有考慮到CpGCpG島的異質(zhì)性;島的異質(zhì)性;(3 3)基于)基于DNADNA序列的預(yù)測方法忽略了序列的預(yù)測方法忽略了DNADNA甲基化狀態(tài)。甲基化狀態(tài)。舉例:窗口法舉例:窗口法Analyze a window. Does it meet CpG island criteria? If not, slide to the right one nucleotideAnd analyze again.And again.Until it meets the criteria Then jump ahead and check the windo

13、w adjacent to the island on the 3 side.Repeat as needed, until the new window does not meet the CpG island criteriaThen slide the window back toward the island.Keep sliding until the window meets CpG island criteria. If it doesnt meet the criteria, try trimming a base pair off each end and analyzing

14、 again. 削減削減削減削減削減削減Once it meets CpG island criteria, move on to the next adjacent window and analyze that. (二)實驗方法尋找(二)實驗方法尋找CpGCpG島島 Illingworth等人最近開發(fā)了一項等人最近開發(fā)了一項CXXC親和純化技親和純化技術(shù)(術(shù)(CAP,CXXC affinity purification)以富集非)以富集非甲基化的甲基化的CpG富集的富集的DNA片段(片段(CpG島)。島)。 該技術(shù)使用了半胱氨酸富集的對非甲基化的該技術(shù)使用了半胱氨酸富集的對非甲基化的CpG

15、位位點有高親和性的點有高親和性的CXXC3結(jié)構(gòu)域。結(jié)構(gòu)域。CXXC結(jié)構(gòu)域?qū)χ唤Y(jié)構(gòu)域?qū)χ话谆陌谆腃pG位點或缺乏位點或缺乏CpG位點的位點的DNA片段片段幾乎沒有親和性。幾乎沒有親和性。 從小鼠從小鼠Mbd1中得到的重組的中得到的重組的CXXC結(jié)構(gòu)域?qū)Ψ羌谆Y(jié)構(gòu)域?qū)Ψ羌谆幕腃pG位點有高的結(jié)合特異性,并被用于從全基位點有高的結(jié)合特異性,并被用于從全基因組因組DNA中提取中提取CpG島。他們從人類血液中提取了島。他們從人類血液中提取了超過超過17000個個CpG島。島。實驗方法確定的基因組范圍實驗方法確定的基因組范圍CpG島圖譜島圖譜(三)(三)CpGCpG島定位有助于發(fā)現(xiàn)新

16、基因島定位有助于發(fā)現(xiàn)新基因 CpG島是重要的調(diào)控元件島是重要的調(diào)控元件,可用于新基因的發(fā)現(xiàn)??捎糜谛禄虻陌l(fā)現(xiàn)。CpG島通常是不被甲基化的,作為管家基因的重島通常是不被甲基化的,作為管家基因的重要標(biāo)志之一。要標(biāo)志之一。UCSC數(shù)據(jù)庫的截圖展示了三個數(shù)據(jù)庫的截圖展示了三個CpG島島三、實驗檢測技術(shù)測定三、實驗檢測技術(shù)測定DNADNA甲基化狀態(tài)甲基化狀態(tài)(一)一)DNADNA甲基化的檢測方法甲基化的檢測方法 目前常用的目前常用的DNA甲基化檢測方法是將待檢序列中甲基化檢測方法是將待檢序列中甲基化的胞嘧啶轉(zhuǎn)化為其他堿基組成的變化。最新甲基化的胞嘧啶轉(zhuǎn)化為其他堿基組成的變化。最新的檢測方法還用到了基因

17、微陣列(的檢測方法還用到了基因微陣列(microarray)。)。 1.限制性內(nèi)切酶法限制性內(nèi)切酶法2.親和純化親和純化3.重亞硫酸鈉法重亞硫酸鈉法1.限制性內(nèi)切酶法限制性內(nèi)切酶法使用甲基化敏感的酶檢測使用甲基化敏感的酶檢測DNA甲基化甲基化2.親和純化親和純化3.重亞硫酸鈉法重亞硫酸鈉法(二)基因組范圍高通量的(二)基因組范圍高通量的DNADNA甲基化檢測方法甲基化檢測方法高通量測序是最新發(fā)展起來的但卻是最有前途的高通量測序是最新發(fā)展起來的但卻是最有前途的全基因組全基因組DNA甲基化分析方法。高通量測序技術(shù)甲基化分析方法。高通量測序技術(shù)的出現(xiàn),使得產(chǎn)生大量序列信息的時間和成本均的出現(xiàn),使得產(chǎn)

18、生大量序列信息的時間和成本均要低于桑格法。要低于桑格法。目前,兩種高通量的測序平臺最為流行:一種是目前,兩種高通量的測序平臺最為流行:一種是454生命科學(xué)公司開發(fā)的焦磷酸測序方法,另外一生命科學(xué)公司開發(fā)的焦磷酸測序方法,另外一種是種是Illumina前身的前身的Solexa開發(fā)的基于熒光核苷酸開發(fā)的基于熒光核苷酸的系統(tǒng)。的系統(tǒng)。 技術(shù)技術(shù)應(yīng)用應(yīng)用優(yōu)勢優(yōu)勢局限局限Illumina磁珠磁珠陣列陣列甲基化多態(tài)甲基化多態(tài)性發(fā)現(xiàn)和分性發(fā)現(xiàn)和分析析定量,多達(dá)定量,多達(dá)96個樣品個樣品的同時快速分析的同時快速分析需要設(shè)計引物文需要設(shè)計引物文庫,同時只能分庫,同時只能分析析1536個位點個位點Affymetr

19、ix芯片芯片全基因組甲全基因組甲基化測定基化測定探針密度大,支持物探針密度大,支持物種多,可定制,價格種多,可定制,價格合理合理短寡核苷酸噪聲短寡核苷酸噪聲大,單通道雜交,大,單通道雜交,定制芯片昂貴定制芯片昂貴NimbleGen微陣列微陣列全基因組甲全基因組甲基化測定基化測定長寡核苷酸探針產(chǎn)生長寡核苷酸探針產(chǎn)生更純凈的數(shù)據(jù),雙通更純凈的數(shù)據(jù),雙通道雜交,定制芯片不道雜交,定制芯片不昂貴,價格合理昂貴,價格合理較較Affymetrix芯芯片的探針密度小片的探針密度小DNA甲基化大規(guī)模分析可用平臺一覽表甲基化大規(guī)模分析可用平臺一覽表技術(shù)技術(shù)應(yīng)用應(yīng)用優(yōu)勢優(yōu)勢局限局限Agilent微陣微陣列列大規(guī)模

20、甲大規(guī)模甲基化測定基化測定長寡核苷酸探針產(chǎn)長寡核苷酸探針產(chǎn)生更純凈的數(shù)據(jù),生更純凈的數(shù)據(jù),雙通道雜交雙通道雜交較較Affymetrix和和NimbleGen芯芯片的探針密度小片的探針密度小得多得多Solexa測序測序全基因組全基因組甲基化測甲基化測定,分析定,分析印記位點印記位點定量化,無需雜交,定量化,無需雜交,并行的基因型信息并行的基因型信息下一代技術(shù),需下一代技術(shù),需要購買昂貴的儀要購買昂貴的儀器或服務(wù)器或服務(wù)DNA甲基化大規(guī)模分析可用平臺一覽表甲基化大規(guī)模分析可用平臺一覽表四、異常四、異常DNADNA甲基化特征識別甲基化特征識別(一)癌癥基因組整體低甲基化一)癌癥基因組整體低甲基化(二

21、)癌基因的印記丟失(二)癌基因的印記丟失(三)基因超甲基化是癌癥的標(biāo)志(三)基因超甲基化是癌癥的標(biāo)志不同癌癥之間存在差異不同癌癥之間存在差異MeInfoText和和PubMeth數(shù)據(jù)庫匯總了癌癥特異的異數(shù)據(jù)庫匯總了癌癥特異的異常甲基化信息。使用生物信息學(xué)方法有助于進(jìn)一步常甲基化信息。使用生物信息學(xué)方法有助于進(jìn)一步擴(kuò)充已知的異常甲基化基因列表的信息。擴(kuò)充已知的異常甲基化基因列表的信息。第三節(jié)第三節(jié) 組蛋白修飾的表觀基因組組蛋白修飾的表觀基因組Section 3 Epigenome of Histone Modifications一、組蛋白密碼是重要表觀遺傳標(biāo)記之一一、組蛋白密碼是重要表觀遺傳標(biāo)記

22、之一(一)核小體與組蛋白修飾(一)核小體與組蛋白修飾1. 核小體與組蛋白核小體與組蛋白 組蛋白修飾位點組蛋白修飾位點2. 組蛋白修飾與轉(zhuǎn)錄組蛋白修飾與轉(zhuǎn)錄 關(guān)于組蛋白修飾在轉(zhuǎn)錄中的作用,已經(jīng)有許多模型關(guān)于組蛋白修飾在轉(zhuǎn)錄中的作用,已經(jīng)有許多模型如電中性模型、組蛋白密碼以及信號通路模型被提如電中性模型、組蛋白密碼以及信號通路模型被提出來。出來。 不同的組蛋白修飾類型的作用不盡相同。不同的組蛋白修飾類型的作用不盡相同。 組蛋白乙?;饕偈够虮磉_(dá)和組蛋白乙?;饕偈够虮磉_(dá)和DNA復(fù)制,使復(fù)制,使組蛋白乙?;ㄎ坏幕虻玫絼討B(tài)的調(diào)控。組蛋白組蛋白乙?;ㄎ坏幕虻玫絼討B(tài)的調(diào)控。組蛋白去乙酰化則

23、使基因沉默。去乙?;瘎t使基因沉默。 組蛋白的磷酸化可以改變組蛋白的電荷,對基因轉(zhuǎn)組蛋白的磷酸化可以改變組蛋白的電荷,對基因轉(zhuǎn)錄、錄、DNA修復(fù)和染色質(zhì)凝聚等過程起調(diào)控作用。修復(fù)和染色質(zhì)凝聚等過程起調(diào)控作用。 組蛋白的泛素化可以降解組蛋白的泛素標(biāo)記,啟動組蛋白的泛素化可以降解組蛋白的泛素標(biāo)記,啟動基因表達(dá)。基因表達(dá)。3. 組蛋白修飾的命名法組蛋白修飾的命名法 一個組蛋白修飾的精確表示由三部分組成:組蛋白一個組蛋白修飾的精確表示由三部分組成:組蛋白名稱名稱+組蛋白尾巴上的位點組蛋白尾巴上的位點+修飾類型和個數(shù)。修飾類型和個數(shù)。例如基因轉(zhuǎn)錄起始位點富集普遍存在例如基因轉(zhuǎn)錄起始位點富集普遍存在H3K4

24、me3修飾,它是組蛋白修飾,它是組蛋白H3上,具體的位置為第四個上,具體的位置為第四個位置即賴氨酸(位置即賴氨酸(lysine, K),該位置存在三個甲),該位置存在三個甲基基團(tuán)。基基團(tuán)。又如又如H3K9me,則表示組蛋白,則表示組蛋白H3上的第九位置上上的第九位置上的甲基化修飾,但并沒有指定甲基集團(tuán)的數(shù)目,的甲基化修飾,但并沒有指定甲基集團(tuán)的數(shù)目,則泛指組蛋白甲基化修飾,這些模糊記法已被廣則泛指組蛋白甲基化修飾,這些模糊記法已被廣泛地使用。泛地使用。(二)激活性和抑制性的組蛋白修飾(二)激活性和抑制性的組蛋白修飾 根據(jù)對基因起到激活還是抑制作用,組蛋白修飾可根據(jù)對基因起到激活還是抑制作用,組

25、蛋白修飾可以大致分為兩類:激活性的組蛋白修飾和抑制性的以大致分為兩類:激活性的組蛋白修飾和抑制性的組蛋白修飾。組蛋白修飾。 激活性的組蛋白修飾中最常見的是激活性的組蛋白修飾中最常見的是H3K4me。 抑制性的組蛋白修飾中最常見的是抑制性的組蛋白修飾中最常見的是H3K27me。(三)組蛋白密碼(三)組蛋白密碼1. 動態(tài)而又穩(wěn)定的組蛋白密碼動態(tài)而又穩(wěn)定的組蛋白密碼 組蛋白的氨基酸殘基可以接受許多種化學(xué)修飾,包組蛋白的氨基酸殘基可以接受許多種化學(xué)修飾,包括甲基化和乙?;刃揎?。質(zhì)譜分析檢測到組蛋白括甲基化和乙?;刃揎?。質(zhì)譜分析檢測到組蛋白H2A有有13個可以接受修飾的位點,個可以接受修飾的位點,H

26、2B、H3和和H4則分別有則分別有12個,個,21個和個和14個可以接受修飾的位點。個可以接受修飾的位點。每個氨基酸殘基位點可以發(fā)生至少一種化學(xué)修飾。每個氨基酸殘基位點可以發(fā)生至少一種化學(xué)修飾。 2. 細(xì)胞分化過程中的組蛋白密碼細(xì)胞分化過程中的組蛋白密碼 組蛋白修飾的調(diào)控在許多生理過程中起到重要作用,組蛋白修飾的調(diào)控在許多生理過程中起到重要作用,這其中就包括細(xì)胞分化。研究發(fā)現(xiàn)組蛋白乙?;瘜S這其中就包括細(xì)胞分化。研究發(fā)現(xiàn)組蛋白乙?;瘜S持細(xì)胞的未分化和多能狀態(tài)十分重要。使用組蛋白去持細(xì)胞的未分化和多能狀態(tài)十分重要。使用組蛋白去乙酰酶抑制劑有助于維持干細(xì)胞的多能性乙酰酶抑制劑有助于維持干細(xì)胞的多

27、能性(pluripotency)。)。 相反,用去乙酰酶抑制劑刺激人類成熟細(xì)胞或癌癥相反,用去乙酰酶抑制劑刺激人類成熟細(xì)胞或癌癥細(xì)胞會誘導(dǎo)分化的進(jìn)行。因此,表觀遺傳調(diào)控對于細(xì)胞會誘導(dǎo)分化的進(jìn)行。因此,表觀遺傳調(diào)控對于細(xì)胞成熟至關(guān)重要。到底是什么類型組蛋白修飾或細(xì)胞成熟至關(guān)重要。到底是什么類型組蛋白修飾或組蛋白修飾組合控制分化呢?如前所述,組蛋白乙組蛋白修飾組合控制分化呢?如前所述,組蛋白乙?;兄诒3旨?xì)胞的多能性。?;兄诒3旨?xì)胞的多能性。 細(xì)胞分化過程中的組蛋白修飾變化細(xì)胞分化過程中的組蛋白修飾變化 (一)測定組蛋白修飾的高通量技術(shù)(一)測定組蛋白修飾的高通量技術(shù)二、組蛋白修飾的高通量測

28、定及分析技術(shù)二、組蛋白修飾的高通量測定及分析技術(shù)檢測技術(shù)檢測技術(shù)ChIP-chipChIP-chipChIP-SAGEChIP-SAGEChIP-SeqChIP-Seq定量性定量性受雜交效率影受雜交效率影響響定量定量定量定量分辨率的影響分辨率的影響因素因素染色質(zhì)長度及染色質(zhì)長度及探針密度探針密度酶切效率酶切效率染色質(zhì)長度,測序深染色質(zhì)長度,測序深度度全基因組范圍全基因組范圍實驗花銷實驗花銷多多多多少少實驗對于測定實驗對于測定區(qū)域的局限性區(qū)域的局限性局限于預(yù)設(shè)的局限于預(yù)設(shè)的基因組區(qū)域基因組區(qū)域受酶切位點受酶切位點的限制的限制可覆蓋大部分基因組可覆蓋大部分基因組區(qū)域區(qū)域ChIPchip來自來自Ge

29、nome-wide approaches to studying chromatin modificationsChIPSAGEChIPSeq(二)分析基因組范圍的組蛋白修飾數(shù)據(jù)(二)分析基因組范圍的組蛋白修飾數(shù)據(jù)1. 高通量組蛋白修飾分析工具高通量組蛋白修飾分析工具Tiling ArrayTileMap 基于模型的瓦式芯片分析算法(基于模型的瓦式芯片分析算法(model-based analysis of tilingarray algorithm, MAT)。)。 ChIP-SeqCisGenomeMACS2. 組蛋白修飾峰值探測組蛋白修飾峰值探測 與其他基于與其他基于ChIP的高通量技術(shù)

30、一致的是,從的高通量技術(shù)一致的是,從ChIP-Seq標(biāo)簽數(shù)據(jù)鑒別出可靠的組蛋白修飾譜,等價于標(biāo)簽數(shù)據(jù)鑒別出可靠的組蛋白修飾譜,等價于尋找一段基因組區(qū)域內(nèi)的統(tǒng)計學(xué)顯著的組蛋白修飾尋找一段基因組區(qū)域內(nèi)的統(tǒng)計學(xué)顯著的組蛋白修飾標(biāo)簽的峰。標(biāo)簽的峰。 一個最直接的想法是,對于一段長度一定的基因組一個最直接的想法是,對于一段長度一定的基因組區(qū)域來說,包含區(qū)域來說,包含R個序列標(biāo)簽可以從統(tǒng)計學(xué)水平支個序列標(biāo)簽可以從統(tǒng)計學(xué)水平支持這段區(qū)域被組蛋白修飾所定位。持這段區(qū)域被組蛋白修飾所定位。一般原理一般原理 構(gòu)造背景分布:構(gòu)造背景分布: 泊松分布泊松分布 例:人類基因組例:人類基因組gsize=3.0E9*0.8

31、=2.4E9 窗寬窗寬w 基因組期望的標(biāo)簽數(shù)(基因組期望的標(biāo)簽數(shù)(CD4+ T細(xì)胞細(xì)胞H3K9me3) 求求 使使 0.01-/ !nen6348997*200/0.5291gsize-1-01-/!RnnpenR 當(dāng)當(dāng)R=3時,時,p=0.0021,滿足要求。所以,以,滿足要求。所以,以w為窗為窗寬,將基因組打碎,以寬,將基因組打碎,以d為步長,移動窗口,找出為步長,移動窗口,找出滿足大于滿足大于3個標(biāo)簽的窗口,合并后即為組蛋白修飾個標(biāo)簽的窗口,合并后即為組蛋白修飾H3K9me3定位區(qū)域。定位區(qū)域。三、組蛋白修飾與其他表觀遺傳修飾的協(xié)同調(diào)控三、組蛋白修飾與其他表觀遺傳修飾的協(xié)同調(diào)控(一)(一

32、)DNA甲基化和組蛋白修飾的相互作用甲基化和組蛋白修飾的相互作用(二)通過貝葉斯網(wǎng)絡(luò)重構(gòu)表觀遺傳修飾協(xié)同調(diào)控基因表(二)通過貝葉斯網(wǎng)絡(luò)重構(gòu)表觀遺傳修飾協(xié)同調(diào)控基因表達(dá)網(wǎng)絡(luò)達(dá)網(wǎng)絡(luò)四、組蛋白修飾異常與人類疾病四、組蛋白修飾異常與人類疾?。ㄒ灰唬┊惓#┊惓=M蛋白修飾模式組蛋白修飾模式與與癌癥癌癥(二二)組蛋白修飾與其他疾病組蛋白修飾與其他疾?。ㄈ┦称窢I養(yǎng)與食品營養(yǎng)與組蛋白修飾組蛋白修飾第四節(jié)第四節(jié) 基因組印記基因組印記Section 4 Genomic Imprinting一、基因組印記是表觀遺傳現(xiàn)象一、基因組印記是表觀遺傳現(xiàn)象基因組印記是在母基因組印記是在母本和父本之間產(chǎn)生本和父本之間產(chǎn)生功能

33、性區(qū)別并在哺功能性區(qū)別并在哺乳動物發(fā)育與生長乳動物發(fā)育與生長中起重要作用的一中起重要作用的一種表觀遺傳學(xué)機(jī)制。種表觀遺傳學(xué)機(jī)制。二、基于生物信息學(xué)方法識別新印記基因二、基于生物信息學(xué)方法識別新印記基因 目前實驗測得印記基因的主要方法是利用目前實驗測得印記基因的主要方法是利用DNA甲基甲基化和基因表達(dá)分析基因的印記情況,只關(guān)注染色體的化和基因表達(dá)分析基因的印記情況,只關(guān)注染色體的一小段區(qū)域。由于基因的單等位表達(dá)可能只發(fā)生在特一小段區(qū)域。由于基因的單等位表達(dá)可能只發(fā)生在特定亞型、組織或發(fā)育階段,所以實驗確定印記基因面定亞型、組織或發(fā)育階段,所以實驗確定印記基因面臨很多問題。臨很多問題。 主要預(yù)測印

34、記基因的方法是用機(jī)器學(xué)習(xí)方法基于基因主要預(yù)測印記基因的方法是用機(jī)器學(xué)習(xí)方法基于基因的序列特征預(yù)測全基因組印記基因。的序列特征預(yù)測全基因組印記基因。常用的模式識別方法常用的模式識別方法 支持向量機(jī)(支持向量機(jī)(SVM) 徑向基神經(jīng)網(wǎng)絡(luò)(徑向基神經(jīng)網(wǎng)絡(luò)(RBF) 隱馬爾可夫模型隱馬爾可夫模型 Logistic回歸回歸 主成分分析和二次判別分析主成分分析和二次判別分析DNADNA序列特征序列特征 CpG島和島和GC含量含量重復(fù)序列重復(fù)序列長散在核元件(長散在核元件(LINEs)短散在核元件(短散在核元件(SINEs)簡單重復(fù)序列簡單重復(fù)序列DNA elements低復(fù)雜度重復(fù)序列低復(fù)雜度重復(fù)序列長末

35、端重復(fù)序列(長末端重復(fù)序列(LTRs)基于主成分分析和二次判別的預(yù)測模型基于主成分分析和二次判別的預(yù)測模型三、印記基因的表觀遺傳異常與人類疾病三、印記基因的表觀遺傳異常與人類疾病印記基因?qū)Σ溉閯游锏陌l(fā)育是至關(guān)重要的,哺乳動物印記基因?qū)Σ溉閯游锏陌l(fā)育是至關(guān)重要的,哺乳動物的基因印記抑制基因表達(dá),印記基因的異常表達(dá)會導(dǎo)的基因印記抑制基因表達(dá),印記基因的異常表達(dá)會導(dǎo)致多種人類疾病。研究發(fā)現(xiàn)許多印記基因?qū)ε咛ズ吞ブ露喾N人類疾病。研究發(fā)現(xiàn)許多印記基因?qū)ε咛ズ吞撼錾蟮纳L發(fā)育有重要的調(diào)節(jié)作用,對行為和大兒出生后的生長發(fā)育有重要的調(diào)節(jié)作用,對行為和大腦的功能也有很大的影響,印記基因的異常同樣可誘腦的功能

36、也有很大的影響,印記基因的異常同樣可誘發(fā)癌癥。發(fā)癌癥。第五節(jié)第五節(jié) 表觀遺傳學(xué)數(shù)據(jù)庫及軟件表觀遺傳學(xué)數(shù)據(jù)庫及軟件Section 5 Databases and Softwares in Epigenetics一、表觀遺傳學(xué)常用數(shù)據(jù)庫一、表觀遺傳學(xué)常用數(shù)據(jù)庫 1.人類表觀基因組計劃數(shù)據(jù)庫人類表觀基因組計劃數(shù)據(jù)庫2.表觀基因組圖譜表觀基因組圖譜3.人類人類DNA甲基化與癌癥數(shù)據(jù)庫甲基化與癌癥數(shù)據(jù)庫Epigenome ProjectRivera, C.M., and Ren, B. (2013). Mapping human epigenomes. Cell 155, 39-55.Epigenome

37、 Data ResourcesEpigenome BrowserRahul Karnik1 and Alexander Meissner (2013). Browsing (Epi)genomes: A Guide to Data Resources and Epigenome Browsers for Stem Cell Researchers. Cell Stem Cell 13, 14-21.Local Epigenome BrowserUCSC Genome Browser 本地化本地化http:/ of Differentially Methylated Regions (DMRs)

38、 Case and Control Multiple CasesCase and ControlMultiple Cases Entropy差異甲基化區(qū)域的識別差異甲基化區(qū)域的識別QDMRQDMR導(dǎo)入甲基化數(shù)據(jù)導(dǎo)入甲基化數(shù)據(jù)定量甲基化差異定量甲基化差異篩選差異甲基化區(qū)域篩選差異甲基化區(qū)域定量差異甲基化區(qū)域的特異性定量差異甲基化區(qū)域的特異性導(dǎo)出分析結(jié)果導(dǎo)出分析結(jié)果使用流程使用流程導(dǎo)入甲基化數(shù)據(jù)導(dǎo)入甲基化數(shù)據(jù)目目前前QDMR只只接受接受txt文件文件瀏覽本地甲基瀏覽本地甲基化數(shù)據(jù)文件化數(shù)據(jù)文件例子甲基化數(shù)據(jù)例子甲基化數(shù)據(jù)數(shù)據(jù)中最大的數(shù)據(jù)中最大的甲基化值甲基化值物種信息物種信息區(qū)域列信息區(qū)域列信息樣本開始的列樣本開始的列甲基化數(shù)據(jù)預(yù)覽甲基化數(shù)據(jù)預(yù)覽定量甲基化差異定量甲基化差異熵表示甲基化差異的大小,熵表示甲基化差異的大小,熵越小表示各樣本間的甲熵越小表示各樣本間的甲基化差異越大基化差異越大通過點擊上面的某一行,通過點擊上面的某一行,來查看相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論