轉(zhuǎn)錄組RNAseq術(shù)語解釋.docx_第1頁
轉(zhuǎn)錄組RNAseq術(shù)語解釋.docx_第2頁
轉(zhuǎn)錄組RNAseq術(shù)語解釋.docx_第3頁
轉(zhuǎn)錄組RNAseq術(shù)語解釋.docx_第4頁
轉(zhuǎn)錄組RNAseq術(shù)語解釋.docx_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、RNA-Seq名詞解釋1.index測(cè)序的標(biāo)簽,用于測(cè)定混合樣本,通過每個(gè)樣本添加的不同標(biāo)簽進(jìn)行數(shù)據(jù)區(qū)分,鑒別測(cè)序樣品。2.堿基質(zhì)量值(Quality Score或Q-score)是堿基識(shí)別(Base Calling)出錯(cuò)的概率的整數(shù)映射。堿基質(zhì)量值越高表明堿基識(shí)別越可靠,堿基測(cè)錯(cuò)的可能性越小。3.Q30堿基質(zhì)量值為Q30代表堿基的精確度在99.9%。4.FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)每1百萬個(gè)map上的reads中map到外顯子的每1K個(gè)堿基上的fragment個(gè)數(shù)。計(jì)算公式為公式

2、中,cDNA Fragments 表示比對(duì)到某一轉(zhuǎn)錄本上的片段數(shù)目,即雙端Reads數(shù)目;Mapped Reads(Millions)表示Mapped Reads總數(shù),以10為單位;Transcript Length(kb):轉(zhuǎn)錄本長度,以kb個(gè)堿基為單位。5.FC(Fold Change)即差異表達(dá)倍數(shù)。6.FDR(False Discovery Rate)即錯(cuò)誤發(fā)現(xiàn)率,定義為在多重假設(shè)檢驗(yàn)過程中,錯(cuò)誤拒絕(拒絕真的原(零)假設(shè))的個(gè)數(shù)占所有被拒絕的原假設(shè)個(gè)數(shù)的比例的期望值。通過控制FDR來決定P值的閾值。7.P值(P-value)即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方

3、法所得到的P 值,一般以P0.05為顯著,P0.01為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于0.05或0.01。8.可變剪接(Alternative splicing)有些基因的一個(gè)mRNA前體通過不同的剪接方式(選擇不同的剪接位點(diǎn))產(chǎn)生不同的mRNA剪接異構(gòu)體,這一過程稱為可變剪接(或選擇性剪接,alternative splicing)。可變剪接是調(diào)節(jié)基因表達(dá)和產(chǎn)生蛋白質(zhì)組多樣性的重要機(jī)制,是導(dǎo)致真核生物基因和蛋白質(zhì)數(shù)量較大差異的重要原因。在生物體內(nèi),主要存在7種可變剪接類型:A)Exon skipping;B)Intron retention;C) Alternative

4、 5 splice site;D) Alternative 3 splice site;E) Alternative first exon;F) Alternativelast exon;G) Mutually exclusive exon。9.外顯子跳躍(Exon skipping)外顯子在前體mRNA剪接形成成熟mRNA過程中被跳過,最終沒有出現(xiàn)在某些成熟mRNA上,這種剪接機(jī)制被稱為外顯子跳躍。10. 內(nèi)含子保留(Intron retention)前體mRNA在剪接形成成熟mRNA的過程中,部分內(nèi)含子被保留下來,這種剪接機(jī)制被稱為內(nèi)含子保留。11. 5或3端可變剪接前體mRNA在剪接形成

5、成熟mRNA的過程中,5端或3端邊界發(fā)生不同方式的剪接,這種剪接機(jī)制被稱為5或3端可變剪接。12.基因結(jié)構(gòu)優(yōu)化由于使用的軟件或數(shù)據(jù)本身的局限性,導(dǎo)致所選參考基因組的注釋往往不夠精確,需要對(duì)原有注釋的基因結(jié)構(gòu)進(jìn)行修正,這一過程稱為基因結(jié)構(gòu)優(yōu)化。13. 基因間區(qū)(intergenic)指基因與基因之間的間隔序列,不屬于基因結(jié)構(gòu),不直接決定氨基酸,可能通過轉(zhuǎn)錄后調(diào)控影響性狀的區(qū)域。14. UTR:(UntranslateRegions)非翻譯區(qū)域。是信使 RNA(mRNA)分子兩端的非編碼片段。5-UTR從mRNA起點(diǎn)的甲基化鳥嘌呤核苷酸帽延伸至 AUG 起始密碼子,3-UTR從編碼區(qū)末端的終止密碼

6、子延伸至多聚 A 尾巴(Poly-A)的前端。15. ORF(open reading frame)開放閱讀框或開放讀碼框。是結(jié)構(gòu)基因的正常核苷酸序列,從起始密碼子到終止密碼子的閱讀框可編碼完整的多肽鏈,其間不存在使翻譯中斷的終止密碼子。16. CDS(Coding sequence)是編碼一段蛋白產(chǎn)物的序列,是結(jié)構(gòu)基因組學(xué)術(shù)語。DNA轉(zhuǎn)錄成mRNA,mRNA經(jīng)剪接等加工后翻譯出蛋白質(zhì),所謂CDS就是與蛋白質(zhì)序列一一對(duì)應(yīng)的DNA序列,且該序列中間不含其它非該蛋白質(zhì)對(duì)應(yīng)的序列,不考慮mRNA加工等過程中的序列變化,總之,就是與蛋白質(zhì)的密碼子完全對(duì)應(yīng)。17. 插入片段大?。╥nsert size)

7、通過檢測(cè)雙端序列在基因組上的起止位置,可以得到插入片段的實(shí)際長度,決定了測(cè)序的長度,是信息分析的重要參數(shù)。18. 分子標(biāo)記是遺傳標(biāo)記的一種,直接在DNA分子上檢測(cè)遺傳變異。分子標(biāo)記能對(duì)不同發(fā)育時(shí)期的個(gè)體、組織器官甚至細(xì)胞作檢測(cè),數(shù)量極多,遍及整個(gè)基因組,多態(tài)性高,遺傳穩(wěn)定,不受環(huán)境及基因表達(dá)與否的影響。目前常見分子標(biāo)記主要有SNP、InDel、SSR 等。19. SNP(Single Nucleotide Polymorphism)即單核苷酸多態(tài)性,主要是指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性。SNP所表現(xiàn)的多態(tài)性只涉及到單個(gè)堿基的變異,這種變異可由單個(gè)堿基的轉(zhuǎn)換(tran

8、sition)或顛換(transversion)所引起,也可由堿基的插入或缺失所致。但通常所說的SNP并不包括后兩種情況。20. SSR(Simple Sequence Repeat,SSR)即簡(jiǎn)單重復(fù)序列,又叫微衛(wèi)星序列,指的是基因組中由1-6個(gè)核苷酸組成的基本單位重復(fù)多次構(gòu)成的一段DNA,廣泛分布于基因組的不同位置,長度一般在200bp以下。21. 轉(zhuǎn)換(transition)同類型(嘌呤和嘌呤,或嘧啶和嘧啶)堿基之間的相互替換稱為轉(zhuǎn)換。22. 顛換(transversion)不同類型(嘌呤和嘧啶)堿基之間的相互替換稱為顛換。23. RNA編輯(RNA editing)是指在mRNA水平上

9、改變遺傳信息的過程。具體來說,指基因轉(zhuǎn)錄產(chǎn)生的mRNA分子中,由于核苷酸的缺失,插入或置換,基因轉(zhuǎn)錄物的序列不與編碼序列互補(bǔ),使翻譯生成的蛋白質(zhì)的氨基酸組成,不同于基因序列中的編碼信息現(xiàn)象。24. 差異表達(dá)轉(zhuǎn)錄本(DifferentiallyExpressed Transcript,DET)指表達(dá)水平存在顯著差異的轉(zhuǎn)錄本。25. 差異表達(dá)基因(Differentially Expressed Gene,DEG)指在兩個(gè)不同條件(如對(duì)照與處理、野生型和突變型、不同時(shí)間點(diǎn)、不同組織等)下,表達(dá)水平存在顯著差異的基因,稱之為差異表達(dá)基因。26. 生物學(xué)重復(fù)(Biological Replicates

10、)可以定義為使用來自不同抽提的RNA樣本進(jìn)行雜交,例如,同一來源獨(dú)立制備的樣本,或者不同來源的樣本(不同組織或者一個(gè)細(xì)胞系的不同培養(yǎng)物)。27. 技術(shù)重復(fù)使用同一個(gè)抽提的RNA進(jìn)行實(shí)驗(yàn)稱為技術(shù)重復(fù)。與生物學(xué)重復(fù)相比,技術(shù)重復(fù)不是完全獨(dú)立的,取平均值不能去除共有的系統(tǒng)偏差。28. 皮爾遜相關(guān)系數(shù)r(Pearsons Correlation Coefficient)用于度量兩個(gè)變量X和Y之間的相關(guān)(線性相關(guān)),其值介于-1與1之間。其中,1表示變量完全正相關(guān),0表示無關(guān),-1表示完全負(fù)相關(guān)。在高通量測(cè)序中,將皮爾遜相關(guān)系數(shù)作為生物學(xué)重復(fù)相關(guān)性的評(píng)估指標(biāo)。越接近1,說明兩個(gè)重復(fù)樣品相關(guān)性越強(qiáng)。29.

11、 UnigeneUnique Gene的英文縮寫,意為廣泛通用的基因數(shù)據(jù)庫,通過電腦對(duì)相同基因座(Locus)的收集整理集合形成一個(gè)非冗余的基因數(shù)據(jù)庫。30. Contig高通量測(cè)序中利用軟件將具有一定長度overlap的reads連成更長的片段,這些通過reads overlap關(guān)系得到的不含N的組裝片段稱之為Contig。31. Scaffold高通量測(cè)序中reads經(jīng)過拼接獲得Contigs,Contig經(jīng)過確定先后順序用N連接起來組成Scaffold。32. Contig N50Reads拼接后會(huì)得到長度不同的Contigs。將所有Contigs的長度相加后獲得一個(gè)Contig的總長度

12、。之后將所有Contig按照序列長度由短到長進(jìn)行排序,如獲得Contig1,Contig2,Contig3.。將Contig按照這個(gè)順序一次相加,當(dāng)相加的長度達(dá)到Contig總長度的一半時(shí),最后一個(gè)加上的Contig長度即為Contig N50。33. componentTRINITY 軟件拼接過程中,由于contig的構(gòu)造方法,使得各個(gè)contig之間不可能共享k個(gè)以上序列,因此這些 inchwormcontigs不能很好的表征各種可變剪切形式和同源基因等情況,軟件中“chrysalis”這一步驟將那些有重疊的contigs聚類,構(gòu)成ponent就成為一組可變剪切

13、isoform或同源基因可能的表征的集合。34. de Bruijn graph使用 TRINITY 軟件拼接時(shí),在“chrysalis”步驟中會(huì)將 component通過 overlap 關(guān)系構(gòu)建成 de Bruijn圖,便于獲取可變剪切的序列。35. 數(shù)字基因表達(dá)譜(DigitalGene Expression Profile,DGE)利用新一代高通量測(cè)序技術(shù)和高性能的計(jì)算分析技術(shù),能夠全面、經(jīng)濟(jì)、快速地檢測(cè)某一物種特定組織在特定狀態(tài)下的基因表達(dá)情況。36. small RNA對(duì)長度在18-40bp的短 RNA 進(jìn)行序列、結(jié)構(gòu)、表達(dá)、功能上的分析,主要進(jìn)行miRNA,siRNA,piRNA

14、 幾種類型 sRNA 的分析;可與 mRNA 關(guān)聯(lián)分析。37. ncRNA(non-coding RNA)非編碼RNA。指不編碼蛋白質(zhì)的RNA。其中包括 rRNA,tRNA,snRNA,snoRNA和microRNA 等多種已知功能的 RNA,及未知功能的 RNA。其共同特點(diǎn)是都能從基因組上轉(zhuǎn)錄而來,不需要翻譯成蛋白即可在 RNA 水平上行使各自的生物學(xué)功能。38. 降解組測(cè)序(Degradome Sequencing)利用高通量測(cè)序平臺(tái),針對(duì)miRNA介導(dǎo)的剪切降解片段進(jìn)行深度測(cè)序,從中篩選miRNA作用的靶基因,并結(jié)合生物信息學(xué)分析確定降解片段與miRNA的精確配對(duì)信息。該技術(shù)能從細(xì)胞或組

15、織中準(zhǔn)確高效的篩選出 miRNA 的靶基因,為研究miRNA 與其對(duì)應(yīng)的靶基因的相互關(guān)系提供準(zhǔn)確、高效的篩選手段。39. lncRNA(long noncoding RNA)長鏈非編碼RNA。在長度200-100000nt之間,不具有編碼蛋白功能的轉(zhuǎn)錄本。40. 正鏈/負(fù)鏈(plus strand/minus strand)對(duì)于一個(gè)基因來說,DNA的兩條鏈中有一條鏈作為RNA合成時(shí)的模板,這條鏈叫負(fù)鏈,另一條叫正鏈。41. 反義鏈/有義鏈(antisense strand/sense strand)在雙鏈DNA中,用來轉(zhuǎn)錄mRNA的DNA鏈稱為模板鏈(template strand),不用于轉(zhuǎn)

16、錄的鏈則稱為非模板鏈(nontemplate strand)。根據(jù)堿基互補(bǔ)配對(duì)原則,轉(zhuǎn)錄出的mRNA鏈的堿基序列與非模板鏈的堿基序列一致,惟一不同的是,非模板鏈中的T mRNA鏈中全部置換成了U。正是由于非模板鏈的堿基序列實(shí)際上代表了 mRNA的堿基序列(只不過在mRNA中T換成了U),因此非模板鏈又被稱為編碼鏈( coding strand),有義鏈(sense strand)和克里克鏈(crick strand),而用來轉(zhuǎn)錄mRNA的DNA鏈被稱為非編碼鏈(anticoding strand)或反義鏈(antisense strand)或沃森鏈(watson strand)。42. 鏈特異

17、性(strand specific):鏈特異性建庫,可以確定轉(zhuǎn)錄本來自正鏈還是負(fù)鏈。以便更加準(zhǔn)確的獲得基因的結(jié)構(gòu)以及基因表達(dá)信息。并且可以更好的發(fā)現(xiàn)新的基因。(研究表明:很多基因組區(qū)域具有正負(fù)鏈的轉(zhuǎn)錄本,反義轉(zhuǎn)錄是真核基因的一個(gè)特征,是一種重要的調(diào)控方式。對(duì)于原核以及低等真核生物的基因組,常常具有重疊基因。43. GO(Gene Ontology)基因本體聯(lián)合會(huì)(Gene Ontology Consortium)所建立的數(shù)據(jù)庫,旨在建立一個(gè)適用于各種物種的,堆積因何蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語言詞匯標(biāo)準(zhǔn)。GO 是多種生物本體語言中的一種,提供了三層結(jié)構(gòu)(分子功能、

18、生物學(xué)途徑、細(xì)胞組件)的系統(tǒng)定義方式,用于描述基因產(chǎn)物的功能。網(wǎng)址:/。44. BSR(Bulked Segregant RNA sequencing)將轉(zhuǎn)錄組測(cè)序與集群分離分析相結(jié)合,在轉(zhuǎn)錄組范圍內(nèi)開發(fā)SNPs,篩選與性狀緊密連鎖的SNPs,進(jìn)行功能基因的定位,同時(shí)進(jìn)行基因差異表達(dá)分析等轉(zhuǎn)錄組常規(guī)分析的技術(shù)。45. eQTL以一個(gè)分離群體中不同個(gè)體(基因型)或者是其它有遺傳結(jié)構(gòu)的群體作為樣本,運(yùn)用QTL分析方法分析特定基因轉(zhuǎn)錄豐度差異而得到的一些遺傳區(qū)域,轉(zhuǎn)錄豐度用于作為個(gè)體中基因表達(dá)水平的衡量方式,并且作為一個(gè)性狀來分析(e Trait)。46. COG/KOGCOG是Clusters of Orthologous Groups of proteins的簡(jiǎn)稱,KOG 為euKaryotic Ortholog Groups。這兩個(gè)注釋系統(tǒng)都是NCBI中基于基因直系同源關(guān)系的數(shù)據(jù)庫,其中COG針對(duì)原核生物,KOG針對(duì)真核生物。COG/KOG結(jié)合進(jìn)化關(guān)系將來自不同物種的同源基因分為不同的 Ortholog簇,目前COG有4873個(gè)分類,KOG有4852個(gè)分類。來自同一 ortholog 的基因具有相同的功能,這樣就可以將功能注釋直接繼承給同一 COG/KOG 簇的其他成員。詳見http:/www.ncbi.nlm.nih

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論