




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第二代測序簡介
劉云山第一代測序第一代技術主要采用1977年Sanger發(fā)明的末端終止測序法在每一輪的Sanger測序反應中,在鏈延伸的同時加入熒光標記過的ddNTP,被結(jié)合的鏈將終止合成反應,沒有被結(jié)合的將繼續(xù)根據(jù)模板鏈合成,一直重復這樣的過程直到所有的合成反應都被終止。這樣將得到大量長短—末端被同熒光標記的序列,通過電泳對以將不同長度的序列分離開,這樣就可以逐個堿基的讀出整個序列了。一個反應所測的序列不可能太長,通常為1000個核苷酸左右,測序通量不大,且測序反應費時費力;由于DNA聚合酶造成的堿基錯配,因此測序的準確度并不高;基于技術的基因組測序十分昂貴,從基因組中預測基因的方法也十分有限。測序技術的發(fā)展90年代:DNA芯片技術21世紀:第二代高通量測序技術第二代測序第二代測序,即大規(guī)模平行測序平臺,具有通量大,讀長短的特點。代表技術: Illumina公司遺傳分析儀
(Solexa)
:邊合成邊測序法; Roche公司的454平臺:焦磷酸合成測序法; ABI公司推出的SOLiD系統(tǒng):邊連接邊測序法。Illumina-Solexa基本流程:1.構(gòu)建測序文庫。提取基因組DNA,隨機打斷成100~200bp片段,末端加上接頭;2.橋式擴增。解鏈后的單鏈DNA片段兩端被分別固定于芯片上,形成橋狀結(jié)構(gòu),進行橋式PCR擴增。經(jīng)過PCR擴增,產(chǎn)生數(shù)百萬條待測的DNA片段,隨后被線性化;3.測序。將熒光標記的dNTP、聚合酶、引物加入到測序通道啟動測序循環(huán)。DNA合成時,伴隨著堿基的加入會有焦磷酸被釋放,從而發(fā)出熒光,不同堿基用不同熒光標記,讀取到核苷酸發(fā)出的熒光后,將3′羥基末端切割,隨后加入第2個核苷酸,重復第一個核苷酸的步驟,直到模板序列全部被合成雙鏈DNA。特點:測序通量大、速度快、成本低;性價比最高。Illumina-SolexaFlow-cellRoche-454基本流程:1.構(gòu)建測序文庫。將基因組DNA打碎成300~800bp的片段后,在兩端加上錨定接頭;2.乳液PCR擴增。每個含有接頭的DNA片段被固定在特定的磁珠上,進行乳液PCR擴增。多個循環(huán)后,磁珠表面被打破,擴增產(chǎn)生的成千上萬個拷貝仍然在磁珠表面;3.焦磷酸測序。將磁珠轉(zhuǎn)移到PTP板上,每個PTP板上的小孔只能容下1個磁珠。分別裝有A、T、C、G4種堿基的試劑瓶,依次進入PTP板,每次只進1個堿基,如果發(fā)生配對,就會釋放1個焦磷酸,釋放出的熒光信號會被CCD捕獲到。每個堿基反應都會捕獲到1個熒光信號,由此一一對應,模板的堿基序列由此獲得。特點:讀長長,但是準確率低、成本高。Roche-454乳化:形成油包水的混合物。ABI-SOLiD基本流程:
1.文庫制備。將基因組DNA打斷,在其兩頭加上接頭,構(gòu)建成文庫;2.乳液PCR/磁珠富集。此過程與454測序技術類似,不過SOLiD的微珠只有1μm;3.連接測序?;旌系模笁A基單鏈熒光探針為連接反應的底物,探針的5′端用4色熒光標記,3′端第1、2位堿基對應5′端熒光信號的顏色。因為只有四色熒光,而2個堿基卻有16個組合情況,故4種堿基對應一種顏色的熒光。單次測序由5輪測序反應組成,反應后得到的為原始顏色序列。特點:通量最大,最準確(>99.94%);但讀長最短,雙末端測序困難。ABI-SOLiDSingle-read,Paired-end,Mate-pair單末端測序(Single-read):,首先將DNA樣本進行片段化處理形成200-500bp的片段,引物序列連接到DNA片段的一端,然后末端加上接頭,將片段固定在flowcell上生成DNA簇,上機測序單端讀取序列。這種方法較簡單,但是它只有一端有拼接信息,不利于拼裝;Single-read,Paired-end,Mate-pair雙末端測序(Paired-end):構(gòu)建待測DNA文庫時在兩端的接頭上都加上測序引物結(jié)合位點,在第一輪測序完成后,去除第一輪測序的模板鏈,用對讀測序模塊(Paired-End
Module)引導互補鏈在原位置再生和擴增,以達到第二輪測序所用的模板量,進行第二輪互補鏈的合成測序。Single-read,Paired-end,Mate-pairMate-pair文庫制備:旨在生成一些短的DNA片段,這些片段包含基因組中較大跨度(2-10kb)片段兩端的序列,更具體地說:首先將基因組DNA隨機打斷到特定大?。?-10kb范圍可選);然后經(jīng)末端修復,生物素標記和環(huán)化等實驗步驟后,再把環(huán)化后的DNA分子打斷成400-600bp的片段并通過帶有鏈親和霉素的磁珠把那些帶有生物素標記的片段捕獲。這些捕獲的片段再經(jīng)末端修飾和加上特定接頭后建成mate-pair文庫,然后上機測序。第二代測序的應用
——基因組學與轉(zhuǎn)錄組學基因組從頭測序及重測序從頭測序:
denovosequencing,主要應用于基因組序列未知的物種,DNA片段測序后,用生物信息學軟件對序列進行拼接、組裝,從而獲得該物種的基因組序列圖譜。重測序是指該物種基因組序列已被測序,有參考基因組序列的測序工作。由于第2代測序技術測序讀長較短,完成基因組的從頭測序一般需要第一代測序技術的輔助,但是可以完成簡單生物的基因組從頭測序及所有生物的基因組重測序。在第二代測序技術的推動下,大量生物的全基因組被順利測序,大量物種的基因組計劃完成。基因組研究策略
主要分為基因組測序、基因組組裝、基因組完成、基因預測、基因注釋和基因組比較分析六大部分。
第一步:DNA的提取及測序。
常用平臺有:Solexa、454、SOLiD。第二步:基因組組裝。
常用的軟件有Newbler、AMOScmp、Phred/Phrap/Consed和Velvet等。第三步:基因組完成。即確定組裝獲得的Contigs之間的連接順序并修補Gaps。第四步:基因預測。常用的蛋白質(zhì)編碼基因預測軟件有Glimmer、GeneMarkS和Prodigal。第五步:基因注釋。通常要整合多個數(shù)據(jù)庫,通過序列比對進行預測基因的注釋。第六步:基因組比較分析。通常會進行相近物種之間或同一物種不同個體之間的基因組比較分析。轉(zhuǎn)錄組研究內(nèi)容
轉(zhuǎn)錄本結(jié)構(gòu)的研究(起始密碼子鑒定、內(nèi)含子邊界確定、UTR確定、可變剪切等),表達量研究,SNP(單核苷酸多態(tài)性)位點研究,新轉(zhuǎn)錄本檢測,非編碼區(qū)功能研究(小RNA、非編碼RNA的研究)
轉(zhuǎn)錄組:是指在特定的發(fā)育階段和生理條件下細胞中轉(zhuǎn)錄產(chǎn)生的所有轉(zhuǎn)錄物,包括mRNA、rRNA、tRNA和其他的非編碼RNA,狹義上也可以指細胞所能轉(zhuǎn)錄出的所有mRNA,這個術語適用的范圍是一個給定的有機體、組織或者特定的細胞集合。轉(zhuǎn)錄組學(transcriptomics):是一門從整體水平上研究基因轉(zhuǎn)錄情況和轉(zhuǎn)錄調(diào)控規(guī)律的學科。轉(zhuǎn)錄組學研究分為序列水平與表達量水平兩個層面的內(nèi)容,這兩個層面綜合在一起完整的反映了生物體遺傳信息的表達方式。序列水平的研究:包括對未知轉(zhuǎn)錄本的探索以及對同一個基因在不同樣品中的序列差異分析。表達量水平的研究:可以加深了解生物體基因調(diào)節(jié)的過程和特殊性狀產(chǎn)生的分子機制。RNA-seq:基于第二代測序平臺的轉(zhuǎn)錄組測序技術。轉(zhuǎn)錄組研究策略第一步:RNA提取和測序。提取總RNA,進行預處理;將預處理后的RNA打斷后反轉(zhuǎn)錄成cDNA,在兩端加上接頭后固定到測序芯片上;隨后對測序芯片上的每個cDNA進行擴增和測序,測到的每一段序列都是一個read。測得的所有reads就包含了樣品中的轉(zhuǎn)錄組信息。第二步,檢查reads質(zhì)量。當二代測序的原始數(shù)據(jù)拿到手之后,第一步要做的就是看一看原始reads的質(zhì)量,常用的工具就是fastqc。轉(zhuǎn)錄組研究策略橫軸代表位置,縱軸quality。紅色表示中位數(shù),黃色是25%-75%區(qū)間,觸須是10%-90%區(qū)間,藍線是平均數(shù)。若任一位置的下四分位數(shù)低于10或中位數(shù)低于25,報"WARN";若任一位置的下四分位數(shù)低于5或中位數(shù)低于20,"FAIL".第三步,Readsmapping首先將Reads進行Mapping,從而獲得Reads在基因組上的位置,常用的Mapping軟件有BWA、Bowtie、SOAP2等?;诤缶YTrie思想的Burrows-Wheeler轉(zhuǎn)換可以用“循環(huán)、排序”四個字來概括.將基因組序列按一定規(guī)則壓縮并建立索引,再通過查找和回溯來定位讀段,在查找時可通過堿基替代來實現(xiàn)允許的錯配。轉(zhuǎn)錄組研究策略轉(zhuǎn)錄組研究策略第四步,根據(jù)Readsmapping結(jié)果,進行后繼分析。TSS鑒定:根據(jù)基因組上的Readscoverage來鑒定轉(zhuǎn)錄起始位點;5′UTR和3′UTR鑒定:鑒定編碼基因中轉(zhuǎn)錄但不翻譯的區(qū)域,即5′UTR和3′UTR;Operon鑒定:根據(jù)TSS、Readscoverage等鑒定;新基因鑒定:找出之前沒有注釋但是表達的區(qū)域,并根據(jù)是否存在ORF區(qū)分為蛋白質(zhì)編碼基因(Codinggene)和非蛋白質(zhì)編碼基因(SmallRNAgene);AntisenseRNA鑒定:根據(jù)SmallRNA與其他基因的位置關系確定是否是AntisenseRNA;Pseudogenes分析:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河道保潔長效管理辦法
- 河南綠化養(yǎng)護管理辦法
- 行業(yè)行為管理與運營優(yōu)化
- 來華工作經(jīng)費管理辦法
- 水文自動測報系統(tǒng)的運行機制與質(zhì)量評價標準研究
- 杭州法院薪酬管理辦法
- 前臺考勤考核管理辦法
- 保健按摩養(yǎng)生管理辦法
- 水土保持生態(tài)產(chǎn)品價值轉(zhuǎn)化機制研究
- 企業(yè)安全生產(chǎn)費用計提標準
- 2025年湖北荊門市交通旅游投資集團有限公司招聘筆試參考題庫附帶答案詳解
- 無損檢測員(鐵路探傷工)理論試題(高級工)
- 2025-2030年中國無水叔丁醇產(chǎn)業(yè)發(fā)展現(xiàn)狀及前景趨勢分析報告
- DB37T4252-2020靈芝菌種質(zhì)量要求
- 《學前教育法》知識考試題庫100題(含答案)
- 2025年工業(yè)和信息化部人才交流中心第二次招聘1人管理單位筆試遴選500模擬題附帶答案詳解
- 寧夏回族自治區(qū)城市體檢工作技術指南(試行)2024
- 國開《課堂提問與引導》期末大作業(yè)及答案
- 固定式啟閉機及閘門的檢修與維護規(guī)范
- 內(nèi)蒙古呼和浩特市(2024年-2025年小學五年級語文)統(tǒng)編版期末考試(下學期)試卷及答案
- 企業(yè)ESG治理體系構(gòu)建
評論
0/150
提交評論