版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第十二章 非編碼RNA與 復(fù)雜疾病,生物信息學(xué),人類基因組的蛋白質(zhì)編碼區(qū)的總和占總基因組長度為12,那么其他98的基因組有什么功能呢(junk dna)? (1)42的基因組是插入編碼序列的內(nèi)含子序列;人類基因平均每個基因有7個內(nèi)含子。但這么冗長的內(nèi)含子序列有什么生物學(xué)功能呢? (2)其他55%的基因組的功能是什么? 【注:90%以上的基因組都是轉(zhuǎn)錄的!】,人類基因組草圖帶給科學(xué)家們的困惑,人類基因組絕大部分都被轉(zhuǎn)錄成RNA,細(xì)胞內(nèi)非編碼RNA的數(shù)量是編碼RNA的上百倍。這促使許多科學(xué)家認(rèn)為生物體復(fù)雜性被隱藏在它們所輸出的非編碼RNA內(nèi),而非編碼序列內(nèi)。,non-coding RNA, ncR
2、NA,不能翻譯成蛋白的功能性RNA分子 Housekeeping non-coding RNA tRNAs、 rRNAs、snRNAs etc. Regulatory non-coding RNA small non-coding RNA siRNA、miRNA、piRNA etc. Long non-coding RNA (lncRNA,200 nt ),第一節(jié) 引言,Section 1 Introduction,隨著ncRNA在復(fù)雜疾病中的研究深入,研究者發(fā)現(xiàn)其在疾病的發(fā)生發(fā)展過程中起著巨大的作用,其功能異常能夠?qū)е赂鞣N人類復(fù)雜疾病的發(fā)生。這將使ncRNA可能成為疾病診斷、預(yù)后的新的生物學(xué)
3、標(biāo)記(biomark),并為更進(jìn)一步理解復(fù)雜疾病的發(fā)病機(jī)理提供了新的手段。,第二節(jié) 非編碼RNA與其靶基因,Section 2 Non-coding RNAs and Targets,(一)miRNA的發(fā)現(xiàn),一、miRNA概述,miRNA was first discovered in 1993 by Victor Ambros at Harvard (lin-4) The second miRNA Let-7 was discovered in 2000 by Frank Slack as a postdoc at Harvard (Gary Ruvkun lab),The discover
4、y of miRNAs,Victor Ambros,Gary Ruvkun,microRNAs had been neglected for so many years because of their small size.,The underlying reason is: people never dream that small RNAs will have important biological roles.,The number of the identified miRNAs is growing rapidly in recent years. Release 21 (Jul
5、y 2014)of the miRBase database have added 4196 new hairpin sequences and 5441 new mature products Release 20 contains 24521 entries representing hairpin precursor miRNAs, expressing 30424 mature miRNA products, in 206 species.,These miRNAs are from primates, rodents嚙齒類, birds, fish, worms, flies, pl
6、ants and viruses. The data are freely available to all through the web interface at / .,Since around 2007, the overwhelming majority of microRNAs deposited in miRBase have been predicted from small RNA deep sequencing experiments.,miRNA的生物合成過程,mature miRNA,Precursor miRNA,Primar
7、y miRNA,miRNA gene,轉(zhuǎn)錄,剪切,剪切,miRNA,(二)miRNA的生物合成,幾百幾千堿基,約70 90堿基,約22堿基,miRNA 例子,The miRNA genes and Structure of pri-miRNAs,Pri-miRNAs bear the 5 cap and 3 poly(A)tails,(三)miRNA的特點(diǎn)、作用機(jī)制及分類,microRNA命名規(guī)則,hsa-miR-181a-2* hsa人,mus小鼠,rat大鼠 let,lin, mir,miR, 181:編號,按注冊順序 a:與已注冊的miRNA序列高度同源,2: 由不同染色體上的DNA序列
8、轉(zhuǎn)錄加工而成的具有相同成熟體序列的 miRNA,則在后面加上阿拉伯?dāng)?shù)字以區(qū)分 *:如果一個前體的2個臂分別產(chǎn)生miRNA,則根據(jù)克隆實驗,在表達(dá)水平較低的miRNA 后加“*”; 或進(jìn)行如下命名 hsa-miR-188-5p (或hsa-miR-188-3p) 5p:表示從 5 端的臂加工而來; 3p:表示從 3 端的臂加工而來,miRNA/miRNA-star VS -5p/-3p,the dominant strand could change in different biological settings leading to different names describing th
9、e same molecule,5p arm (placenta)to the 3p arm (heart, liver, and kidney),物理位置特點(diǎn) miRNA基因以單拷貝、多拷貝和基因簇等多種形式存在于基因組中。 miRNA簇(miRNA clusters)是指在染色體上彼此緊密相鄰的兩個或者多個miRNA構(gòu)成的miRNA群 miRNA傾向于成簇出現(xiàn)在染色體上;通常定義50kb的距離為一簇 同一簇中的miRNA傾向是共表達(dá)的,miRNA一般特點(diǎn) miRNA家族/簇,序列(特別是種子序列)高度同源的miRNA被歸為一個miRNA家族 同一家族中的miRNA并不一定是成簇的。,see
10、d,miRNA的一般特點(diǎn),序列特點(diǎn) 非編碼性 成熟的miRNA 5 端為單一磷酸基團(tuán),3端為羥基,這一特點(diǎn)使它與大多數(shù)寡核苷酸和功能RNA 的降解片段區(qū)別開來;,表達(dá)特點(diǎn) miRNA具有時序性以及組織特異性 在特定的時間,組織中才會表達(dá) 保守性特點(diǎn) 在物種間高度保守,miRNA的作用機(jī)制,通過和靶基因3UTR(3非翻譯區(qū))結(jié)合 導(dǎo)致RNA誘導(dǎo)的沉默復(fù)合體(RNA-induced silencing complex,簡稱RISC)降解其靶mRNA或阻礙其靶的翻譯。,RISC,轉(zhuǎn)錄后層面 調(diào)控基因表達(dá),二、基于序列的miRNA靶基因預(yù)測方法,miRNA靶基因預(yù)測遵循的基本原則 miRanda Ta
11、rgetScan,Three Classes of miRNA Target Sites (Brennecke et al. Plos Biology 2005),(一)miRNA靶基因預(yù)測遵循的原則和基本步驟,miRNA的“種子區(qū)”與mRNA的3UTR序列堿基互補(bǔ) 靶點(diǎn)在多物種間的序列保守性 miRNA與mRNA形成雙鏈結(jié)構(gòu)的熱力學(xué)穩(wěn)定性 靶基因二級結(jié)構(gòu)和靶點(diǎn)外的序列對靶基因預(yù)測的影響,遵循的原則,miRNA靶位點(diǎn)預(yù)測的難點(diǎn): miRNA與靶位點(diǎn)的不完全互不配對,基本步驟,在3UTR上探尋和miRNA“種子區(qū)”完全互補(bǔ)的序列; 計算miRNA和這些序列結(jié)合產(chǎn)生的自由能下降值,對靶點(diǎn)進(jìn)行篩選;
12、 對靶點(diǎn)進(jìn)行物種間序列比對,利用物種保守性進(jìn)一步篩選。,(三)TargetScan,TargetScan主要考慮物種間保守的miRNA靶基因,并且在TargetScan中首次提出了“種子匹配”(seed match)的概念。,/,TargetScan算法的基本步驟,在TargetScan算法中,“種子匹配”被定義為miRNA 5端的第28位堿基與mRNA 3UTR 上的一段7nt(nucleotide)序列完全互補(bǔ),miRNA上的這7個核苷酸被稱為miRNA “種子區(qū)”。 從種子區(qū)開始向miRNA兩側(cè)尋找互補(bǔ)堿基,允許G-U配對,直到出現(xiàn)堿基錯配
13、為止。在物種保守方面,TargetScan算法發(fā)現(xiàn)隨著物種數(shù)目的增多, 預(yù)測的靶基因數(shù)目逐漸減少, 但預(yù)測結(jié)果的準(zhǔn)確率得到提高。,三、基于表達(dá)信息預(yù)測miRNA靶基因,Huang等人利用在88個組織中同時檢測了miRNA和mRNA表達(dá)的數(shù)據(jù),并結(jié)合貝葉斯方法開發(fā)了靶基因預(yù)測算法GenMiR+,得到了104個人類miRNA的高精度靶基因,并通過實驗證實了預(yù)測的let-7b靶基因,結(jié)果表明,與基于序列的方法相比,利用相同樣本中同時檢測miRNA和mRNA的表達(dá)譜可以更準(zhǔn)確的預(yù)測miRNA靶基因。 (Huang, Using expression profiling data to identify
14、 human microRNA targets. Nat. Methods.),四、基于高通量測序結(jié)果預(yù)測miRNA靶基因,Argonaute CLIP-Seq RIP-CLIP pSILAC Degradome-Seq,Ago binds in a ternary 三元的 complex to both miRNA and mRNA, with sufficiently close contacts to allow UV-crosslinking to either RNA; mRNA tags will be in the immediate vicinity of miRNA bind
15、ing sites.,Argonaute CLIP-Seq,Argonaute CLIP-Seq,Argonaute CLIP-Seq ,又稱為HITS-CLIP (ultraviolet cross-linking and immune-precipitationand and high-throughput sequencing ),即紫外交聯(lián)免疫共沉淀與高通量測序偶聯(lián)技術(shù)。 CLIP 技術(shù)是研究RNA結(jié)合蛋白(或者RNA)體內(nèi)結(jié)合靶標(biāo)的新技術(shù)。 通過紫外交聯(lián)將RNA結(jié)合蛋白與體內(nèi)結(jié)合的RNA分子進(jìn)行固定,用Ago蛋白的抗體免疫共沉淀之后酶解未受蛋白保護(hù)的RNA,可以獲得Ago蛋白直接結(jié)合
16、的RNA序列。,針對AGO蛋白的CLIP-seq技術(shù)能夠在全基因組范圍內(nèi)鑒定與AGO蛋白結(jié)合的小RNA及其mRNA靶標(biāo)。 Chi, SW, Zang, JB, Mele, A, Darnell, RB.2009. Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps. Nature. 460:479-86。,Furthermore HITS-CLIP reads do not precisely pinpoint the position of crosslinking between the RNA and protein, a
17、nd thus can only identify a targeted region (100-nt)as opposed to a specific target site.,2010年,Gene W. Yeo采用AGO-CLIPseq技術(shù)在線蟲中鑒定了Argonaute的結(jié)合位點(diǎn),發(fā)現(xiàn)其不僅結(jié)合mRNA的3UTR區(qū)域,也會結(jié)合編碼外顯子區(qū)域,還發(fā)現(xiàn)Argonaute大量結(jié)合的區(qū)域?qū)τ趍iRNA 的功能非常重要,揭示了其新的自我調(diào)控的功能。,要想獲得檢測區(qū)域被哪個miRNA調(diào)控,還需結(jié)合預(yù)測算法,五、整合已有知識預(yù)測miRNA靶基因,在當(dāng)前的miRNA靶基因預(yù)測研究中,研究人員逐漸意識到單
18、一依靠序列信息或表達(dá)信息已不能繼續(xù)提高miRNA靶基因預(yù)測效能。 整合功能信息、蛋白質(zhì)互作信息、表達(dá)信息、序列信息以及當(dāng)前實驗證實的miRNA靶基因等已有資源預(yù)測miRNA靶基因十分必要。,miRNA靶點(diǎn)優(yōu)化算法,六、lncRNA概述及靶基因識別,lncRNA定義 lncRNA特點(diǎn) lncRNA作用機(jī)制,Definition of lncRNA,Long non-coding RNAs (long ncRNAs, lncRNAs)are non-protein coding transcripts longer than 200 nucleotides (Perkel 2013). lncRN
19、As are transcripts that are 200 nucleotides in length and do not have the potential to encode for proteins exceeding lengths of 30 amino acids (Mercer TR. Nat. Rev. Genet. 2009, Li X Med. Res. Rev. 2012 ).,This somewhat arbitrary limit distinguishes long ncRNAs from small regulatory RNAs such as miR
20、NAs, siRNAs, piRNAs, snoRNAs, and other short RNAs.,Large scale RNA-seqindicate that lncRNA number in the order of tens of thousands in mammals. 9277 manually annotated genes producing 14880 transcripts (GENCODE v7). The number of protein coding genes in our genome has been revised downward multiple
21、 times whereas the number of known non protein coding transcripts has increased exponentially over the past decade.,Features of lncRNAs,Features of lncRNAs,lncRNAs are generated by the same transcriptional machinery as are other mRNAs lncRNAs are with similar histone-modification profiles, splicing
22、signals. H3K4me3, H3K36me3 lncRNAs are predominantly localized in the chromatin and nucleus, and a fraction appear to be preferentially processed into small RNAs.,lncRNA expression,Tissue-specific lncRNAs expressed in the brain.,conservation,Many small RNAs, such as miRNAs or snoRNAs, exhibit strong
23、 conservation across diverse species (Bentwich 2005). In contrast, in general lncRNAs lack strong conservation, which is often cited as evidence of non-functionality (Brosius 2005; Struhl 2007). Despite low conservation of long ncRNAs in general, it should be noted that many long ncRNAs still contai
24、n strongly conserved elements,生化鑒定和功能研究尚處于起步階段, 目前僅有大約100多種已知功能的lncRNAs。 As of December 2012, 127 LncRNAs have been functionally annotated inLncRNAdb(a database of literature described LncRNAs)(Amral 2011). lncRNA通過表觀遺傳學(xué)調(diào)控、轉(zhuǎn)錄調(diào)控、轉(zhuǎn)錄后調(diào)控、蛋白活性調(diào)控等多種方式調(diào)控相關(guān)基因的作用,LncRNA as Scaffold for Transcription Repressi
25、on,HOTAIR and PRC2,lncRNA as miRNA Decoy,Poliseno et al, Nat 2011,lncRNA研究存在的問題,lncRNA的定義 200nt,過于武斷 lncRNA的命名原則:目前根據(jù)功能、結(jié)構(gòu)、作用方式等命名 lncRNA相關(guān)數(shù)據(jù)庫的內(nèi)容不夠全,注釋內(nèi)容不夠豐富,lncRNA生物學(xué)功能的闡明 lncRNA功能預(yù)測的工具不多 區(qū)分功能性和非功能性非編碼轉(zhuǎn)錄本 種類和功能復(fù)雜,使不同的lncRNA研究結(jié)果之間的借鑒意義并不高,七、ncRNA數(shù)據(jù)資源,ncRNA常用數(shù)據(jù)庫,miRBase是一個集miRNA序列、注釋信息以及預(yù)測的靶基因數(shù)據(jù)為一體的數(shù)
26、據(jù)庫,是目前存儲miRNA信息最主要的公共數(shù)據(jù)庫之一 網(wǎng)址:/,(一)miRBase數(shù)據(jù)庫,TarBase是一個目前使用廣泛的存儲實驗檢測的miRNA與靶基因間關(guān)系的數(shù)據(jù)庫,涵蓋多種實驗方法檢測的超過65000個miRNA與靶基因關(guān)系對。 其網(wǎng)址為:http:/diana.cslab.ece.ntua.gr/tarbase/,(二)TarBase數(shù)據(jù)庫,TarBase數(shù)據(jù)庫界面介紹,(三)microRNA.org數(shù)據(jù)庫,microRNA.org數(shù)據(jù)庫 包含miRNA靶基因以及表達(dá)譜數(shù)據(jù) 網(wǎng)址:/microrn
27、a/home.do miRNA靶基因數(shù)據(jù) 主要是利用miRanda算法預(yù)測得來 miRNA表達(dá)譜數(shù)據(jù) 來自一個針對人類主要器官和細(xì)胞系的小RNA庫測序計劃,(四)lncRNA相關(guān)數(shù)據(jù)庫,因為lncRNA是一個非常新的研究領(lǐng)域,lncRNA在疾病中的作用的研究還是起步階段,數(shù)據(jù)量還不夠大,因此,相關(guān)的數(shù)據(jù)庫也是處于起步階段,相關(guān)數(shù)據(jù)庫還不多,也不夠豐富。,第三節(jié) 非編碼RNA多態(tài)和復(fù)雜疾病,Section 3 Non-coding RNA Polymorphisms and Complex Disease,miRNA多態(tài)(miRNA polymorphisms)是影響miRNA功能的多態(tài),可能發(fā)
28、生在miRNA形成和行使功能的任一個過程,以插入、刪除、擴(kuò)增或染色體異位的形式出現(xiàn),最終導(dǎo)致miRNA綁定位點(diǎn)或者功能的缺失(獲得),是人類基因組一類新的功能多態(tài)。 不僅會影響miRNA的產(chǎn)生和表達(dá),而且會影響miRNA與靶基因的結(jié)合從而影響靶基因的表達(dá)。,介紹,影響蛋白質(zhì)參與miRNA合成與成熟,導(dǎo)致新的miRNA生成和靶基因的調(diào)控。,一、位于miRNA基因內(nèi)部影響miRNA生物學(xué)形成的多態(tài),在染色體基因組水平上單個核苷酸變異引起的miRNA序列多態(tài)性對miRNA的轉(zhuǎn)錄、形成、輸出和調(diào)控具有重要影響。,Saunders, M.A.等對人類474個miRNAs的SNPs進(jìn)行系統(tǒng)的分析發(fā)現(xiàn)單核苷
29、酸多態(tài)在miRNA序列內(nèi)的密度低于其周圍的側(cè)翼序列。,49個pre-miRNA內(nèi)存在65個SNPs位點(diǎn),其中3個miRNAs的種子序列存在SNPs。,(一)位于pri/pre-miRNA基因序列內(nèi)部,Saunders, M.A.和Duan等人利用生物信息學(xué)的方法研究發(fā)現(xiàn)在pri/pre-miRNA內(nèi)部存在單核苷酸多態(tài)。位于pri/pre-miRNA內(nèi)部的多態(tài)會影響miRNA的表達(dá),產(chǎn)生新的miRNA以及影響miRNA與靶基因的結(jié)合,甚至與疾病的風(fēng)險相關(guān)。,1.影響miRNA的表達(dá),Duan等人在研究miR-125時發(fā)現(xiàn),該基因位點(diǎn)存在SNP,含有miR-125a-G/U兩種等位,其中miR-1
30、25a-U能夠顯著影響DGCR8與pri-miRNA-125a的結(jié)合與剪接,使成熟的miR-125a生成減少,使miR-125a對靶基因Lin-128的翻譯抑制作用減弱。,2.產(chǎn)生新的miRNA,miR-146a前體會產(chǎn)生miR-146a(正鏈)和miR-146a*(負(fù)鏈)兩種miRNA。在miR-146a前體的莖環(huán)上存在的SNP(rs2910164)不僅會影響miR-146a的表達(dá),而且會導(dǎo)致miR-146a*C和miR-146a*G兩種miRNA的產(chǎn)生。,(二)位于成熟的miRNA序列內(nèi)部,成熟的miRNA與mRNA的3UTR區(qū)域結(jié)合對mRNA進(jìn)行轉(zhuǎn)錄后調(diào)控。 miRNA與mRNA結(jié)合的區(qū)
31、域包括兩部分: 種子區(qū)域 ,這一部分區(qū)域要求與mRNA嚴(yán)格匹配; 種子區(qū)域附近的3端方向,允許一定的程度的錯配 位于成熟miRNA序列的這些多態(tài)會影響對靶基因的調(diào)控,消除、弱化、增強(qiáng)或者產(chǎn)生新的結(jié)合靶點(diǎn)。,目前的研究發(fā)現(xiàn),位于miRNA種子區(qū)域的多態(tài)不僅會影響靶結(jié)合位點(diǎn),還影響miRNA的表達(dá)。 例如 位于miR-125a種子區(qū)域的多態(tài)顯著的抑制了pri/pre-miRNA過程,導(dǎo)致miRNA表達(dá)的減少。,二、 miRNA靶點(diǎn)的多態(tài),miRNA靶點(diǎn)的多態(tài)性 靶基因上影響miRNA與靶基結(jié)合的序列多態(tài)性。 這些多態(tài)性位點(diǎn)可以影響miRNA對靶基因表達(dá)的調(diào)控。越來越多研究發(fā)現(xiàn)與多種疾病的發(fā)病風(fēng)險有
32、關(guān)。,miRNA靶點(diǎn)多態(tài)可分為: miRNA結(jié)合位點(diǎn)上的多態(tài)性 miRNA結(jié)合位點(diǎn)上下游的多態(tài)性,miRNA結(jié)合位點(diǎn)上(或上下游)的多態(tài)性與疾病,與疾病相關(guān)的miRNA結(jié)合位點(diǎn)上的多態(tài)性舉例 位于整聯(lián)蛋白基因-4(IGBT-4)miRNA結(jié)合位點(diǎn)的SNP(rs743553)與乳腺癌發(fā)病密切相關(guān)(Brendle等)。 位于GEMIN3基因miRNA結(jié)合位點(diǎn)的SNP(rs197414)與膀胱癌發(fā)病密切相關(guān)(Yang等)。,位于靶點(diǎn)附近的多態(tài)位點(diǎn)可能會改變mRNA的二級結(jié)構(gòu)從而影響miRNA與靶基因的結(jié)合;或影響miRNA與3UTR上其他調(diào)控元件的協(xié)同作用 (間接影響) 例如,HLA-G基因3UTR
33、區(qū)的SNP影響miR-148a,miR-148b和miR-152與HLA-G結(jié)合,從而與哮喘的發(fā)病風(fēng)險相關(guān)(Zheng等)。,五、lncRNA多態(tài)與復(fù)雜疾病,近些年,高通量技術(shù)(如GWAS,全基因組關(guān)聯(lián)分析)已經(jīng)確定大量和疾病相關(guān)的SNP。 因此,如果該SNP是位于一個lncRNA上的話,很可能是該SNP影響了該lncRNA的功能,從而和疾病有關(guān)。,乳頭狀甲狀腺癌(papillary thyroid carcinoma,PTC)相關(guān)的風(fēng)險SNP(rs944289)位于一個lncRNA(PTCSC3)的上游3.2kb處,這個風(fēng)險SNP可以影響該lncRNA的表達(dá),并闡明了這個SNP通過影響lnc
34、RNA功能導(dǎo)致乳頭狀甲狀腺癌發(fā)生的致病機(jī)制。,例子,數(shù)據(jù)資源,miRNASNP miRNA-related SNPs their potential target loss and gain information dbSMR數(shù)據(jù)庫 http:/miracle.igib.res.in/polyreg/ 一個分析基因3UTR上的SNP對miRNA與靶點(diǎn)結(jié)合關(guān)系影響的數(shù)據(jù)庫。,PolymiRTS數(shù)據(jù)庫 /miRSNP/ 整合了序列多態(tài)性位點(diǎn)數(shù)據(jù)、表型數(shù)據(jù)和基因表達(dá)譜數(shù)據(jù),來挖掘潛在的可以用于解釋表達(dá)數(shù)量性狀位點(diǎn)和表型數(shù)量性狀位點(diǎn)效應(yīng)的miRNA靶基因的
35、結(jié)合區(qū)域上的多態(tài)性位點(diǎn),并把這些多態(tài)稱作PolymiRTS。,lincSNP數(shù)據(jù)庫簡介,LincSNP是一個整合的數(shù)據(jù)庫,為了識別和注釋人類lncRNA上疾病相關(guān)的SNP而構(gòu)建的全面的綜合數(shù)據(jù)庫。 目前該數(shù)據(jù)庫中包括大約140,000疾病相關(guān)的SNP,這些SNP位于大約5000個人類的lncRNA周圍。這個數(shù)據(jù)庫也包含了注釋的,實驗證實的SNP-lncRNA-疾病的關(guān)聯(lián)數(shù)據(jù)以及疾病相關(guān)的lncRNA數(shù)據(jù),并提供了友好的界面和有效的工具獲得疾病相關(guān)的SNP以及l(fā)ncRNA。,LincSNP數(shù)據(jù)庫(,Ning,et al, BMC bioinformatics, 2014,第四節(jié) 非編碼RNA表達(dá)
36、譜與復(fù)雜疾病,Section 4 Non-coding RNA Expression Profile and Complex Disease,癌癥的本質(zhì)歸結(jié)為各種原因引起的基因結(jié)構(gòu)和功能的異常,一、ncRNA表達(dá)譜識別癌癥相關(guān)ncRNA,致癌基因的高表達(dá) 抑癌基因的低表達(dá),miRNA和lncRNA作為兩類重要的基因調(diào)控子,其表達(dá)變化將會對靶基因的活動產(chǎn)生深遠(yuǎn)的影響,復(fù)雜疾病的診斷和治療研究中必定會引入miRNA及l(fā)ncRNA,(一)miRNA表達(dá)譜,1. ncRNA的特征,低豐度、組織特異性、發(fā)育階段特異性、疾病狀態(tài)特異性,2. ncRNA表達(dá)檢測技術(shù),Northern印跡、克?。╟lonin
37、g)、定量PCR擴(kuò)增、 SAGE技術(shù)、磁珠技術(shù)和寡核苷酸芯片技術(shù)、新一代測序技術(shù),miRNA表達(dá)譜,microRNA芯片制作和分析流程,制作芯片,1. ncRNA表達(dá)數(shù)據(jù)來源,Gene Expression Omnibus (GEO)數(shù)據(jù)庫、ArrayExpress 數(shù)據(jù)庫、Sequence Read Archive(SRA),2.miRNA表達(dá)譜數(shù)據(jù)標(biāo)準(zhǔn)化 中值處理,mRNA表達(dá)譜數(shù)據(jù)標(biāo)準(zhǔn)化方法并不能簡單地應(yīng) 用于miRNA表達(dá)譜數(shù)據(jù),目前仍沒有統(tǒng)一有效 的標(biāo)準(zhǔn)化方法可用于miRNA表達(dá)譜,small RNAseq library preparation(Directional),A pip
38、eline for small RNA annotation (see in GED Galaxy),豐度數(shù)據(jù)(count)預(yù)處理,數(shù)據(jù)過濾-去除低質(zhì)量的或噪聲數(shù)據(jù)點(diǎn),去除序列標(biāo)簽匹配性差的表達(dá)值 重復(fù)數(shù)據(jù)合并 加和,代表同一個基因的標(biāo)簽的tag(或完全相同讀段)的表達(dá)數(shù)目相加 缺失數(shù)據(jù)的處理 一般不補(bǔ)缺失值,因為0是有意義的,可以發(fā)現(xiàn)某種條件下不表達(dá)的基因 數(shù)據(jù)標(biāo)準(zhǔn)化 RPM(Reads Per Million reads),miRNA表達(dá)譜,M個miRNA N1個疾病樣本、N2個正常樣本,利用表達(dá)譜尋找復(fù)雜疾病相關(guān)miRNA,差異表達(dá)分析 尋找異常表達(dá)miRNA Fold change、T
39、-test 、 ANOVA 、 SAM等 低通量實驗證實,miRNA功能預(yù)測和病理假設(shè) miRNA表達(dá)的失調(diào)和許多復(fù)雜疾病相關(guān),比如心血管類疾病和癌癥等,miRNA與癌癥,miRNA表達(dá)譜的基因組范圍研究指出原發(fā)癌中存在miRNA的表達(dá)變化 特異的miRNA表達(dá)譜與特定類型的癌癥有關(guān),提示其有用于診斷的潛能,癌癥的本質(zhì)歸結(jié)為各種原因引起的基因結(jié)構(gòu)和功能的異常 致癌基因的高表達(dá) 抑癌基因的低表達(dá) 某些miRNA作用靶基因是重要的癌通路組成部分,參與了癌基因網(wǎng)絡(luò)調(diào)控,miRNA表達(dá)的變化認(rèn)為是發(fā)生癌癥的共同特征 oncogenic miRNAs (oncomiRs),ProliferationIn
40、vasion metastasis Angiogenesis Apoptosis,Oncogenic miRNAs,Tumor Suppressor miRNAs,Cancer,表達(dá)降低,表達(dá)升高,mir-17-92 cluster as oncogenic miRNAs,mir-17-92 cluster is located at a amplified region DNA in B-cell lymphomas. Here, we have shown that one miRNA polycistron is not only the subject of tumour-specif
41、ic amplification, but that it is also overexpressed in tumours and tumour cell lines, and can act as an oncogene in vivo. A detailed, mechanistic understanding of how this non-coding RNA cluster acts as an oncogene is at present hampered by the lack of a validated biochemical strategy for identifyin
42、g miRNA targets.,mir-17-92 cluster as tumour suppressor,Loss-of-heterozygosity of the chromosomal region encompassing the mir-17 cluster (13q31)has been observed in human malignancies. Negative regulation of E2F1 translation by miR-17-5p and miR-20a provides a mechanism to dampen this reciprocal act
43、ivation, promoting tightly controlled expression of c-Myc and E2F1 gene products. It suggests that the mir-17 cluster, by decreasing E2F1 expression, tightly regulates c-Myc-mediated cellular proliferation.,It is thus likely that these miRNAs influence cell proliferation and tumorigenesis in a cell-
44、type specific manner, depending on the milieu of target mRNAs that are expressed.,與癌癥相關(guān)的miRNA,Journal of Thoracic Oncology: December 2011 - Volume 6,癌癥中的ncRNA表達(dá),ncRNA表達(dá)譜可作為特定癌癥的表型標(biāo)簽 癌癥中的ncRNA表達(dá)變化是因還是果,需要對ncRNA功能的進(jìn)一步研究,二、ncRNA表達(dá)譜分類人類癌癥,許多研究已經(jīng)表明編碼蛋白的轉(zhuǎn)錄本(mRNA)可以有效地區(qū)分各種癌癥。這些與癌癥相關(guān)的轉(zhuǎn)錄本作為一種可靠的生物學(xué)標(biāo)記(biomark
45、)已被廣泛應(yīng)用于各種癌癥的分型研究。 我們將采用Lu等人發(fā)表于2005年nature期刊miRNA表達(dá)譜數(shù)據(jù)來探索基于miRNA表達(dá)水平的癌癥分類。,首先GEO數(shù)據(jù)庫GSE2564獲取所有相關(guān)數(shù)據(jù),其中包括334個樣本的原始miRNA表達(dá)數(shù)據(jù),預(yù)處理后的miRNA表達(dá)數(shù)據(jù),探針信息,樣本信息等。該表達(dá)譜數(shù)據(jù)包含用兩個芯片平臺檢測的334個樣本的miRNA表達(dá)譜。 所采用的預(yù)處理過程包括基于控制探針的標(biāo)準(zhǔn)化,修正表達(dá)強(qiáng)度偏低的探針,刪除所有控制探針,以及對表達(dá)值進(jìn)行以2為底的對數(shù)轉(zhuǎn)換。,采用層次聚類方法 平均鏈路算法,皮爾森相關(guān)系數(shù)可以明顯看出具有共同組織發(fā)育起源的樣本被聚到一起。,除了上述所用
46、到218個樣本,該數(shù)據(jù)還包括了檢測自73個急性淋巴細(xì)胞白血病患者骨髓樣本的miRNA表達(dá)水平。,利用t檢驗方法對正常組織與腫瘤組織的miRNA表達(dá)水平進(jìn)行比較,并使用隨機(jī)擾動的方法為每個miRNA產(chǎn)生一個p值,最后對p值進(jìn)行bonferroni校正。,2012年8月28日Genome Biology,斯坦福大學(xué)醫(yī)學(xué)院研究人員進(jìn)行首個大型的癌癥lncRNA表達(dá)譜分析。對64個腫瘤樣品高通量RNA-seq測序,在各種腫瘤類型之間找出差異表達(dá)的1065個lncRNA(圖12-13)。因此lncRNA可以成為生物標(biāo)志物。,圖12-13 lncRNA表達(dá)譜分類人類癌癥,Glioma gene expre
47、ssion data used in this study were obtained from the publicly available GEO. Affymetrix HG-U133 Plus 2.0 platform 2448 lncRNA transcripts with corresponding Affymetrix probe IDs Significance Analysis of Microarrays was used to determine the differentially expressed lncRNAs 2-fold, FDR10%,Differentia
48、lly expressed lncRNA probe sets between normal brains and gliomas,A total of 129 lncRNA probe sets (corresponding to 102 lncRNAs)identified as significantly different between normal brain tissues and gliomas by SAM.,Blue-normal brain tissues;yellow-glioma samples.,三、ncRNA表達(dá)譜與mRNA表達(dá)譜的整合分析,隨著檢測技術(shù)的不斷發(fā)展
49、,生物學(xué)資源的大量涌現(xiàn),生物信息學(xué)研究者已經(jīng)不僅僅局限于使用一種數(shù)據(jù)資源,表型數(shù)據(jù),互作網(wǎng)絡(luò),表達(dá)數(shù)據(jù),SNP,整合,整合多種類型的生物數(shù)據(jù)(如各種表達(dá)譜數(shù)據(jù)、互作網(wǎng)絡(luò)、調(diào)控網(wǎng)絡(luò)、 SNP數(shù)據(jù)、表型數(shù)據(jù)等)來解決特定復(fù)雜的生物醫(yī)學(xué)問題,剖析重大疾病相關(guān)miRNA的調(diào)控機(jī)制和功能,Target genes,miRNA,功能1,功能n,功能2,背景信息 ?,HITS-CLIP,It is clear that miRNAs have many different targets dozens in some cases, hundreds in others but depending on th
50、e cells involved, it seems likely that only a small number of them have a crucial role in cancer pathogenesis. nature reviews genetics (2009),預(yù)測疾病背景下miRNA調(diào)控的靶基因,數(shù)據(jù) mRNA表達(dá)譜,miRNA表達(dá)譜,miRNA-mRNA靶向關(guān)系,皮爾森相關(guān)系數(shù),A hub miRNA signature predicts survival in glioma,前提假設(shè) miRNAs implicated in a specific tumor phenotype will show aberrant regulation of their target genes A key difference from other methods is that we identified dysregulated network edges (regulations)instead of dysregulated nodes (miRNAs)to assemble disease-related signatures.,miRNA family 的協(xié)同失調(diào)作用,包含三個miRNA家族 mir-125, mir-18
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度婚慶司儀婚禮現(xiàn)場化妝造型服務(wù)合同6篇
- 人教版初中歷史與社會七年級上冊 2.1.2 海洋對人類的影響說課稿及反思
- 人教版七年級歷史與社會上冊 2.2《自然黃靜》之氣象萬千、風(fēng)光迥異 說課稿
- 2025版快遞業(yè)務(wù)數(shù)據(jù)處理與信息安全保密合同2篇
- 湖北省黃岡市普通高中2024-2025學(xué)年高二上學(xué)期11月階段性聯(lián)考語文試卷(含答案)
- 2025年環(huán)保設(shè)施安裝與運(yùn)營服務(wù)合同3篇
- 湖北恩施市2024-2025學(xué)年九年級上學(xué)期語文期末考試題卷(含答案)
- 河南省南陽市(2024年-2025年小學(xué)六年級語文)統(tǒng)編版小升初模擬(上學(xué)期)試卷及答案
- 2025高考數(shù)學(xué)二輪復(fù)習(xí)-微培優(yōu)7 數(shù)列中的情境創(chuàng)新與數(shù)學(xué)文化【課件】
- Unit 7 第3課時 Section B (1a-2b)2024-2025學(xué)年新教材七年級英語上冊同步說課稿(人教版2024)河北專版
- 換藥室工作總結(jié)
- 四年級上冊數(shù)學(xué)乘法豎式
- 藥品集中采購教育培訓(xùn)
- 《攝影入門基礎(chǔ)知識》課件
- 門禁系統(tǒng)施工規(guī)范
- 《如何調(diào)節(jié)情緒》課件
- 振動試驗大綱模板
- 隨班就讀評價表
- 清理化糞池施工方案
- 中國地理空白圖(政區(qū)、分省輪廓、地形、鐵路空白圖)-(3)1
- 猜歌名教學(xué)講解課件
評論
0/150
提交評論