




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一講 基因組序列解析-1主要內(nèi)容:什么是基因組什么是基因DNA測(cè)序的方法DNA序列的組裝人類基因組方案水稻基因組方案后基因組學(xué)1. 什么是基因組 基因組就是一個(gè)物種中所有基因的整體組成。 基因組有兩層意義:遺傳物質(zhì)和遺傳信息。 要揭開(kāi)生命的奧秘,就需要從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系。 Homo sapiens 3,000E.coli 4.6Genome Size (Mb)什么是C 值?通常是指一種生物單倍體基因組DNA的總量. 在真核生物中,C值一般隨著生物的進(jìn)化而增加,高等生物C值一般大于低等生物。 C值悖理: 生物的復(fù)雜性與基因組的大小并不完全成比例增加細(xì)
2、菌真菌等動(dòng)物陰影局部為一個(gè)門(mén)內(nèi)C-值的范圍重復(fù)順序高度重復(fù)順序: 長(zhǎng)度:幾個(gè)幾千個(gè)bp 拷貝數(shù):幾百個(gè)上百萬(wàn)個(gè) 首尾相連,串聯(lián)排列 集中分布于染色體的特定區(qū)段如端粒,著絲粒等 也稱衛(wèi)星DNA中度重復(fù)順序: 一般分散于整個(gè)基因組中; 長(zhǎng)度和拷貝數(shù)差異很大單一順序: 基因主要位于單一順序 動(dòng)物中單一順序約占50 植物中單一順序約占20 是遺傳信息的物理和功能單位,包含產(chǎn)生一條多肽鏈或功能RNA所必需的全部核苷酸序列。 基因分類: 編碼RNA的基因,如rRNA基因,snRNA基因等; 編碼蛋白質(zhì)的基因2. 什么是基因?基因的不連續(xù)性Intron 和Exon: 大多數(shù)真核生物蛋白質(zhì)基因的編碼順序(Ex
3、on)都被或長(zhǎng)或短的非編碼順序(Intron)隔開(kāi)基因家族 一群具有一致的或相似順序的基因,有的還擔(dān)負(fù)類似的生物學(xué)功能, 可以相互補(bǔ)償, 比方:E2f transcription factor Mouse symbolHuman OrthologE2f1E2F1 E2f2E2F2E2f3E2F3E2f4E2F4E2f5E2F5E2f6E2F6假基因(Pseudogene) 來(lái)源于功能基因 但已失去活性 的DNA序列產(chǎn)生假基因的原因有:由重復(fù)產(chǎn)生的假基因;加工的假基因, 由RNA反轉(zhuǎn)錄為cDNA 后再整合到基因組中;殘缺的基因(Truncated gene) 重疊基因:同一段DNA 能攜帶兩種不
4、同蛋白的信息.重迭基因有以下幾種情況:*一個(gè)基因完全在另一個(gè)基因內(nèi)部*局部重疊* 兩個(gè)基因共用少數(shù)堿基對(duì) *一個(gè)基因完全在另一個(gè)基因內(nèi)部如:B和A, E和D 其讀碼結(jié)構(gòu)互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA-A*BATGCCN-NNATAA*局部重疊 如: K和C *兩個(gè)基因共用少數(shù)堿基對(duì) 如: D和J-TAATG-D 終止密碼子J 起始密碼子3. DNA測(cè)序的方法鏈終止法測(cè)序化學(xué)降解法測(cè)序自動(dòng)化測(cè)序-鏈終止法測(cè)序非常規(guī)DNA測(cè)序3.3 自動(dòng)化測(cè)序根本原理 與鏈終止法測(cè)序原理相同,只是用不同的熒光色彩標(biāo)記ddNTP,如ddATP標(biāo)記紅色熒光,ddCTP標(biāo)記藍(lán)色熒光
5、, ddGTP標(biāo)記黃色熒光, ddTTP標(biāo)記綠色熒光.由于每種ddNTP帶有各自特定的熒光顏色,而簡(jiǎn)化為由1個(gè)泳道同時(shí)判讀4種堿基. PCR產(chǎn)物直接測(cè)序和克隆測(cè)序的比較4 序列的組裝4.1 隨機(jī)測(cè)序與序列組裝 隨機(jī)測(cè)序也稱鳥(niǎo)槍法. 序列組裝原理:直接從已測(cè)序的小片段中尋找彼此重疊的測(cè)序克隆,然后依次向兩側(cè)鄰接的序列延伸. 優(yōu)點(diǎn):不需預(yù)先了解任何基因組的情況.ABCABCABCABC小片段測(cè)序計(jì)算機(jī)拼裝ABC小片段測(cè)序計(jì)算機(jī)拼裝鳥(niǎo)槍法(Shotgun)測(cè)序的問(wèn)題 CAATGCATTAGCAGCCAATGCGAP錯(cuò)裝實(shí)例:流感嗜血桿菌基因組的測(cè)序及順序組裝超聲波打斷純化的基因組DNA 瓊脂糖電泳收
6、集1.62.0Kb的區(qū)段、純化 構(gòu)建到質(zhì)粒載體中 隨機(jī)挑選19687個(gè)克隆,進(jìn)行28643次測(cè)序,得到可讀順序?yàn)?1 631 485 bp 組裝成140個(gè)覆蓋全基因組范圍的獨(dú)立的順序重疊群, 各重疊群間仍有間隙 順序間隙 物理間隙 載體或宿主菌 選用不當(dāng)而被喪失的順序測(cè)序時(shí)遺漏的測(cè)序解決方法:通過(guò)相鄰順序作為探針篩選已有的基因組文庫(kù)解決方法:利用其它宿主菌與載體重新構(gòu)建文庫(kù)4.2 限制測(cè)序 限制測(cè)序:是指將一段染色體區(qū)段的DNA 順序進(jìn)行組裝. 一些已繪制了遺傳圖與物理圖的微生物基因組測(cè)序中也采用這一方法. 如高等植物擬南芥基因組的測(cè)序完全依據(jù)克隆重疊群,先進(jìn)行各個(gè)BAC克隆的隨機(jī)測(cè)序,再進(jìn)行
7、序列組裝; 水稻基因組測(cè)序方案采取得策略與此相同.4.3 指導(dǎo)測(cè)序與序列組裝 建立在基因組圖譜根底上的鳥(niǎo)槍法,即所謂指導(dǎo)鳥(niǎo)槍法或指導(dǎo)測(cè)序。 先將染色體打成比較大的片段(幾十-幾百Kb), 利用分子標(biāo)記將這些大片段排成重疊的克隆群(Contig), 分別測(cè)序后拼裝. 這種策略叫基于克隆群(contig-based)的策略.ABCABC大片段contig小片段測(cè)序拼裝兩種策略的比較鳥(niǎo)槍法策略 指導(dǎo)測(cè)序策略不需背景信息 構(gòu)建克隆群 (遺傳、物理圖譜)時(shí)間短 需要幾年的時(shí)間 需要大型計(jì)算機(jī)得到的是草圖(Draft) 得到精細(xì)圖譜4.5 其他測(cè)序路線重要區(qū)域優(yōu)先測(cè)序 人們對(duì)感興趣的基因或與疾病相關(guān)的基因
8、優(yōu)先測(cè)序.如:人類主要組織相容性復(fù)合區(qū)位于第6號(hào)染色體,與人類免疫系統(tǒng)有關(guān),因而優(yōu)先測(cè)序.EST (Expressed sequence tag) 測(cè)序 EST是一種重要的基因組圖分子標(biāo)記,以EST為探針很容易從 cDNA文庫(kù)中篩選全基因,又可從BAC克隆中找到其基因組的基因序列. 優(yōu)點(diǎn): A mRNA 可直接反轉(zhuǎn)錄成cDNA,而且cDNA文庫(kù)也比較容易構(gòu)建; B 對(duì)cDNA文庫(kù)大量測(cè)序,即可獲得大量EST的序列; C EST為基因的編碼區(qū),不包括內(nèi)含子和基因間區(qū)域,一次測(cè)序的結(jié)果足以鑒定所代表的基因;5.人類基因組方案 人類基因組方案Human genome project于1990年啟動(dòng),
9、我國(guó)于1999年參加該方案,承擔(dān)其中1%的任務(wù),即人類3號(hào)染色體短臂上約30Mb的測(cè)序任務(wù)。 5.1 人類基因組方案的目的說(shuō)明人類基因組30億個(gè)堿基對(duì)的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體上的位置;破譯人類全部遺傳信息,使人類第一次在分子水平上全面地認(rèn)識(shí)自我;解碼生命、了解生命的起源、了解生命體生長(zhǎng)發(fā)育的規(guī)律;認(rèn)識(shí)種屬之間和個(gè)體之間存在差異的起因、認(rèn)識(shí)疾病產(chǎn)生的機(jī)制以及長(zhǎng)壽與衰老等生命現(xiàn)象、為疾病的診治提供科學(xué)依據(jù)。5.2 人類基因組草圖的完成 2000年6月26日是人類歷史上值得紀(jì)念的一天。人類基因組的工作草圖已經(jīng)繪制完畢并于這天向全世界公布。最終完成圖要求測(cè)序所用的克隆能忠實(shí)地代表常染
10、色體的基因組結(jié)構(gòu),序列錯(cuò)誤率低于萬(wàn)分之一。5.4 人類基因組測(cè)序結(jié)果基因數(shù)是3萬(wàn)、4萬(wàn)還是10萬(wàn) 人類遺傳基因數(shù)量比原先估計(jì)的少很多。目前研究說(shuō)明,人類基因組中約有3萬(wàn)至4萬(wàn)個(gè)蛋白編碼基因,僅僅是果蠅基因數(shù)目的兩倍,人有而鼠沒(méi)有的基因只有300個(gè)。此結(jié)論是由兩大科研小組的數(shù)據(jù)是從DNA水平上得出的;而“人類有10萬(wàn)多個(gè)基因那么是從RNA水平上得出的結(jié)論。所以,這些數(shù)據(jù)不能推翻“人類有10萬(wàn)個(gè)基因的說(shuō)法。人類基因組研究的驚人發(fā)現(xiàn) 19號(hào)染色體是含基因最豐富的染色體,而13號(hào)染色體含基因量最少目前已經(jīng)發(fā)現(xiàn)和定位了26000多個(gè)功能基因,其中尚有42%的基因尚不知道功能人類基因組中存在“熱點(diǎn)和大片“
11、荒漠。在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無(wú)用DNA 不包含或含有極少基因的成分。基因組上大約有14的區(qū)域沒(méi)有基因的片段。 353的基因包含重復(fù)的序列。這說(shuō)明那些原來(lái)被認(rèn)為是“垃圾的DNA也起重要作用,應(yīng)該被進(jìn)一步研究。什么是單核苷酸多態(tài)性 人類999的基因密碼是相同的,而差異不到01,不同人群僅有140萬(wàn)個(gè)核苷酸差異。這些差異是由“單一核苷酸多樣性SNP產(chǎn)生的,它構(gòu)成了不同個(gè)體的遺傳根底,個(gè)體的多樣性被認(rèn)為是產(chǎn)生遺傳疾病的原因。在整個(gè)基因組序列中,人與人之間的變異僅為萬(wàn)分之一,從而說(shuō)明人類不同“種屬之間并沒(méi)有本質(zhì)上的區(qū)別。 5.6 人類基因組方案的論理學(xué)A 個(gè)人DNA順序
12、的隱私權(quán). 如:次等基因攜帶者可能受到岐 視,職業(yè)限制,醫(yī)療保險(xiǎn)等問(wèn)題;B 基因?qū)@麊?wèn)題6. 后人類基因組方案 破解貯存于基因組之中的遺傳語(yǔ)言;識(shí)別、別離、鑒定和克隆所有基因;搞清每個(gè)基因的功能及基因之間的相互作用和相互關(guān)系。7 水稻的基因組 2002年我國(guó)科學(xué)家完成了水稻基因組定序和初步分析。出人意表的是,水稻的基因竟比人類基因還要多得多。人類基因大約有3-4萬(wàn)個(gè),水稻有46022-55615個(gè)基因。因此水稻基因組可說(shuō)是繼人類基因組之后,完成定序的最大基因組,也是至今最大的植物基因組。由于水稻是全球半數(shù)以上人口的主食,對(duì)解決全球糧食問(wèn)題具有重要意義。第二講 基因組序列解析-2問(wèn)題基因組序列所
13、包含的全部遺傳信息是什么?基因組作為一個(gè)整體如何行使其功能?用什么方法尋找基因,研究基因地功能呢?主要內(nèi)容:尋找基因獲取基因的全長(zhǎng)cDNA序列確定DNA順序中基因的位置研究基因的功能基因表達(dá)蛋白質(zhì)組學(xué)1. 尋找基因1.1 根據(jù)開(kāi)放讀碼框預(yù)測(cè)基因A 起始密碼子 ATG第一個(gè)ATG確實(shí)定那么依據(jù)Kozak規(guī)那么; Kozak規(guī)那么是基于數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,所謂Kozak規(guī)那么,即第一個(gè)ATG側(cè)翼序列的堿基分布所滿足的統(tǒng)計(jì)規(guī)律. 假設(shè)將第一個(gè)ATG中的堿基A,T,G分別標(biāo)為1,2,3位,那么Kozak規(guī)那么可描述如下:(1)第4位的偏好堿基為G;(2)ATG的5端約15bp范圍的側(cè)翼序列內(nèi)不含堿基T;(
14、3)在-3,-6和-9位置,G是偏好堿基;(4)除-3,-6和-9位,在整個(gè)側(cè)翼序列區(qū),C是偏好堿基。信號(hào)肽分析 信號(hào)肽分析軟件(SignalP :/ ) 把預(yù)測(cè)過(guò)程中證實(shí)含完整mRNA 5端的Contig翻譯為蛋白序列; 然后用SignalP軟件對(duì)前50個(gè)氨基酸序列(從第一個(gè)ATG對(duì)應(yīng)的甲硫氨酸Met開(kāi)始)進(jìn)行評(píng)估,如果SignalP分析給出正面結(jié)果,那么測(cè)試序列有可能為信號(hào)肽; C 3端確實(shí)認(rèn) 3端確實(shí)認(rèn)主要根據(jù)Poly(A)尾序列,假設(shè)測(cè)試Contig不含Poly(A)序列,那么根據(jù)加尾信號(hào)序列“AATAAA和BLAST同源性比較結(jié)果共同判斷。E 密碼子偏愛(ài)性 編碼同一氨基酸的不同密碼子
15、稱為同義密碼,其差異僅在密碼子的第3位堿基不同。 不同種屬間使用同義密碼的頻率有很大差異,如人類基因中,丙氨酸Ale密碼子多為GCA,GCC或GCT,而GCG很少使用。H 軟件預(yù)測(cè) 采用NCBI的ORF預(yù)測(cè)軟件 ( ORF finder: :/ )判斷ORF的可能范圍。1.2 mRNA的5端即轉(zhuǎn)錄起始位點(diǎn)區(qū) 通過(guò)同源性比較來(lái)預(yù)測(cè)mRNA的5端,最常用的與轉(zhuǎn)錄起始位點(diǎn)相關(guān)的數(shù)據(jù)庫(kù)是真核啟動(dòng)子數(shù)據(jù)庫(kù)(The TRADAT Project , Eukaryotic Promoter Database, EPD. :/ )。1.3 同源查詢途徑 通過(guò)已存入數(shù)據(jù)庫(kù)中的基因順序與待查的基因組序列進(jìn)行比較,從中查找可與之匹配的堿基順序及其比例,用于界定基因的方法稱為同源查詢。 同源有如下幾種情況: A DNA序列某些片段完全相同;B 開(kāi)放讀碼框ORF排列類似,如有長(zhǎng)外顯子;C 開(kāi)放讀碼框翻譯成氨基酸序列的相似性;D 模擬多肽高級(jí)結(jié)構(gòu)相似1.4 試驗(yàn)分析A Northern 雜交確定DNA片段是表達(dá)序列: 本卷須知: a 當(dāng)某一基因的轉(zhuǎn)錄產(chǎn)物進(jìn)行可變剪接時(shí),由于連接的外顯子不同,會(huì)產(chǎn)生好幾條長(zhǎng)度不一的雜交帶,如果該基因是某一基因家族的成員也會(huì)出現(xiàn)多個(gè)信息; b 考慮組織專一性和發(fā)育階段的問(wèn)題; C 基因表達(dá)產(chǎn)物豐度的問(wèn)題 如
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同范本價(jià)稅分離
- 鄉(xiāng)村兒童之家合同范本
- 教育教學(xué)改革課題申報(bào)書(shū)
- 合作開(kāi)洗車(chē)店合同范本
- 農(nóng)村購(gòu)買(mǎi)門(mén)面合同范本
- 廠房建筑加固工程合同范本
- 書(shū)法育人課題申報(bào)書(shū)
- 廠房建設(shè)各類合同范本
- 中價(jià)出租合同范例
- 雙向投資合同范本
- 《研學(xué)旅行課程設(shè)計(jì)》課件-初識(shí)研學(xué)旅行發(fā)展歷程
- 傳染病手術(shù)的處理流程
- 新質(zhì)生產(chǎn)力:中國(guó)創(chuàng)新發(fā)展的著力點(diǎn)與內(nèi)在邏輯
- 《中醫(yī)常用護(hù)理技術(shù)基礎(chǔ)》課件-八綱辨證施護(hù)
- 心理健康與職業(yè)生涯(中等職業(yè))全套教學(xué)課件
- 市政園林安全生產(chǎn)培訓(xùn)課件
- 黑龍江農(nóng)業(yè)經(jīng)濟(jì)職業(yè)學(xué)院?jiǎn)握小墩Z(yǔ)文》考試復(fù)習(xí)題庫(kù)(含答案)
- 基于BIM的軸流通風(fēng)機(jī)施工工藝優(yōu)化
- 2024年大學(xué)生自我意識(shí)教學(xué)案
- 女生青春期知識(shí)講座(六年級(jí))課件
- 在醫(yī)院新員工入職儀式上的講話
評(píng)論
0/150
提交評(píng)論