版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
比較基因組學(xué)原理及應(yīng)用比較基因組學(xué)原理及應(yīng)用第1頁比較基因組學(xué)
相關(guān)概念韓柳比較基因組學(xué)原理及應(yīng)用第2頁基因組學(xué)概念及范圍基因組(genome)泛指一個有生命體、病毒或細(xì)胞器全部遺傳物質(zhì);在真核生物,基因組是指一套染色體(單倍體)DNA。
基因組學(xué)(genomics)就是發(fā)展和應(yīng)用DNA制圖、測序新技術(shù)以及計算機(jī)程序,分析生命體(包含人類)全部基因組結(jié)構(gòu)及功效。比較基因組學(xué)原理及應(yīng)用第3頁基因組學(xué)概念比較基因組學(xué)原理及應(yīng)用第4頁比較基因組學(xué)概念定義:比較基因組學(xué)(ComparativeGenomics)是基于基因組圖譜和測序基礎(chǔ)上,對已知基因和基因組結(jié)構(gòu)進(jìn)行比較,來了解基因功效、表示機(jī)理和物種進(jìn)化學(xué)科。研究內(nèi)容:種間比較基因組學(xué)和種內(nèi)比較基因組學(xué)比較基因組學(xué)原理及應(yīng)用第5頁比較基因組學(xué)原理及應(yīng)用第6頁概念工具:
1、FASTA
2、BLAST
3、CLUSTALW基因組分類:
1、經(jīng)過比較確知其功效。
2、在數(shù)據(jù)庫中有相匹配蛋白,但不知道其功效。
3、在現(xiàn)有數(shù)據(jù)庫中找不到任何相匹配蛋白質(zhì)序列新基因。比較基因組學(xué)原理及應(yīng)用第7頁比較基因組學(xué)原理及應(yīng)用第8頁個別真核、原核生物基因組成成份分析比較基因組學(xué)原理及應(yīng)用第9頁經(jīng)過基因組數(shù)據(jù)進(jìn)行比較基因組學(xué)研究例子:尿殖道支原體帶有已知最小基因組,可依此確定能自我復(fù)制細(xì)胞必需一套最少關(guān)鍵基因。流感嗜血桿菌基因組為1.83MB,尿殖道支原體基因組只有0.58Mb,二者相差3倍多,那么,基因組是大小影響了基因數(shù)目還是基因尺度?比較基因組學(xué)原理及應(yīng)用第10頁流感嗜血桿菌基因大小平均900bp,尿殖道支原體基因為1040bp,他們基因大小差不多流感嗜血桿菌中平均1024bp有一個基因,尿殖道支原體平均1235bp有一個基因。結(jié)論:基因尺度減小并不引發(fā)基因密度增加和基因本身尺寸減小。二者差異在于基因數(shù)量上,流感嗜血桿菌基因有1743個ORF,而尿殖道支原體只有470個ORF比較基因組學(xué)原理及應(yīng)用第11頁比較基因組有利于處理進(jìn)化距離問題
比較基因組學(xué)原理及應(yīng)用第12頁測序技術(shù)與
比較基因組學(xué)
閻永偉比較基因組學(xué)原理及應(yīng)用第13頁
比較基因組學(xué)是在基因組圖譜和測序基礎(chǔ)上,利用某個基因組研究取得信息推測其它原核生物、真核生物類群中基因數(shù)目、位置、功效、表示機(jī)制和物種進(jìn)化學(xué)科。
該學(xué)科發(fā)展及所取得結(jié)果與序列積累相同時,尤其是人類全基因組序列分析與比較使比較基因組學(xué)成為整個生物學(xué)領(lǐng)域最新、最主要、進(jìn)展最快和影響最大學(xué)科之一。
比較基因組學(xué)原理及應(yīng)用第14頁
1.已完成測序
比較基因組學(xué)從一開始就是人類基因組計劃一個別。人類基因組計劃原始計劃是測定人類和一個別模式生物(如細(xì)菌,酵母,果蠅,秀麗隱桿線蟲,小鼠等)全基因組序列。比較基因組學(xué)原理及應(yīng)用第15頁Homosapiens
年全部完成PantroglodytesLanderetal.
;Musmusculus
Waterstonetal.
;Rattusnorvegicus
Gibbsetal.
;Drosophilamelanogaster
Adamsetal.
;Escherichiacoli
Blattneretal.1997;Saccharomycescerevisiae
Goffeauetal.1996;CionaintestinalisDehaletal.,
Smalletal.;Caenorhabditiselegans
Stainetal.
,
Steinetal.1998。比較基因組學(xué)原理及應(yīng)用第16頁HGP完成以后:
Gallusgallus
雞Blattneretal.,Bostaurus
牛Elsiketal.,Canisfamiliaris
狗Lindblad-Tohetal.,Apismellifera
蜜蜂Lindblad-Tohetal.,Anthocidariscrassispina
紫海丹Sodergrenetal.
Macacamulatta
恒河猴Gibbsetal.
比較基因組學(xué)原理及應(yīng)用第17頁
InEntrezGenome,1000completeProkaryoticGenomesareavailable!測序完成情況統(tǒng)計比較基因組學(xué)原理及應(yīng)用第18頁2.測序技術(shù)概述絕大多數(shù)生物遺傳物質(zhì)為DNA,然而遺傳信息卻僅僅由四種堿基——A,T,C,G排列組合而成。自從DNA雙螺旋結(jié)構(gòu)被發(fā)覺以后,能夠知道DNA分子上四種堿基次序就成為了一個新熱點。于是,繼蛋白質(zhì)和RNA測序之后,又出現(xiàn)了DNA測序。比較基因組學(xué)原理及應(yīng)用第19頁自1977年出現(xiàn)DNA測序技術(shù)至今,第一代測序技術(shù)
第二代測序技術(shù)
第三代測序技術(shù)比較基因組學(xué)原理及應(yīng)用第20頁(1)測序技術(shù)出現(xiàn)及第一代測序技術(shù)
1)測序技術(shù)出現(xiàn)
1975年,Sanger和Coulson創(chuàng)造了“加減法”測定DNA序列;1977年,又引入ddNTP,創(chuàng)造了雙脫氧終止法;
1977,Maxam和Gilbert創(chuàng)造了化學(xué)降解法測定DNA序列。比較基因組學(xué)原理及應(yīng)用第21頁
Fig1.雙脫氧終止法測序比較基因組學(xué)原理及應(yīng)用第22頁2)第一代測序技術(shù)
傳統(tǒng)化學(xué)降解法、雙脫氧鏈終止法以及在它們基礎(chǔ)上發(fā)展來各種DNA測序技術(shù)統(tǒng)稱為第一代DNA測序技術(shù)。
第一代測序技術(shù)在分子生物學(xué)研究中發(fā)揮過主要作用,如人類基因組計劃主要基于第一代DNA測序技術(shù)。
比較基因組學(xué)原理及應(yīng)用第23頁
當(dāng)前基于熒光標(biāo)識和Sanger雙脫氧鏈終止法原理熒光自動測序儀(如ABI3730XL)仍被廣泛地應(yīng)用。雜交測序技術(shù)也是第一代測序技術(shù),不過并非基于以上兩種原理。速度快,不過誤差大。比較基因組學(xué)原理及應(yīng)用第24頁
Fig.2ABI3730XL比較基因組學(xué)原理及應(yīng)用第25頁(2)第二代測序技術(shù)后基因組時代亦即功效基因組時代測序技術(shù),顯著特征是高通量、低成本。
主要包含羅氏454企業(yè)GSFLX測序平臺、Illumina企業(yè)SolexaGenomeAnalyzer測序平臺和ABI企業(yè)SOLiD測序平臺。比較基因組學(xué)原理及應(yīng)用第26頁
Fig.3Roche454GSFLX平臺比較基因組學(xué)原理及應(yīng)用第27頁比較基因組學(xué)原理及應(yīng)用第28頁Fig.4IlluminaSolexa平臺比較基因組學(xué)原理及應(yīng)用第29頁比較基因組學(xué)原理及應(yīng)用第30頁
Fig.5ABISOLiD平臺比較基因組學(xué)原理及應(yīng)用第31頁比較基因組學(xué)原理及應(yīng)用第32頁參考文件:DNA測序技術(shù)發(fā)展歷史與最新進(jìn)展,解增言等;DNA測序技術(shù)發(fā)展及其展望,孫海汐等。比較基因組學(xué)原理及應(yīng)用第33頁(3)第三代測序技術(shù)
以單分子測序為特點;
如:BioScienceCorporationHeliScopeSingleMolecularSequencer;PacificBiosciencesSingleMoleculeRealTime(SMRT)DNAsequencingtechnology(正在研制);OxfordNanoporeTechnologiesLtd納米孔單分子測序技術(shù)。中科院北京基因組研究所,年,第一臺國產(chǎn)樣機(jī)比較基因組學(xué)原理及應(yīng)用第34頁測序技術(shù)與比較基因組學(xué)
DNA測序已經(jīng)成為分子生物學(xué)研究中一個基礎(chǔ)研究伎倆與工具,對于這種伎倆需要也已經(jīng)極大地促進(jìn)了DNA測序技術(shù)進(jìn)步與發(fā)展。在此基礎(chǔ)上,將會有更多生物全基因組序列被測定,那么針對任何一個生物比較基因組學(xué)研究將會變得愈加簡單。比較基因組學(xué)原理及應(yīng)用第35頁基因組序列分析計算方法
1.引言
2.點陣圖
3.兩序列比對
4.多序列比對
5.數(shù)據(jù)庫搜索朱琳比較基因組學(xué)原理及應(yīng)用第36頁引言人類基因組計劃(HGP)遺傳圖、物理圖、序列圖和轉(zhuǎn)錄圖區(qū)分兩個概念:同源性---------共同祖先相同性---------定量特征高度相同很可能是同源序列;相同性很低序列也可能含有同源序列比較基因組學(xué)原理及應(yīng)用第37頁點陣圖ACTGTTAGA⊙⊙C⊙T⊙⊙⊙T⊙⊙⊙T⊙⊙⊙A⊙⊙G⊙⊙C⊙ACTGTTAG|||||||ACT-TTAG比較基因組學(xué)原理及應(yīng)用第38頁兩序列比對
面臨問題:進(jìn)化過程中同源序列可經(jīng)過屢次插入或缺失,造成它們長度不一樣,這就給比對帶來了麻煩。要處理問題:最優(yōu)比對算法-----尋找最正確缺失方式使比對序列相同度到達(dá)整體最大比較基因組學(xué)原理及應(yīng)用第39頁Needleman-wunsch全局比對算法
首先構(gòu)建含有m行n列矩陣M,依據(jù)殘基配正確函數(shù),給每個矩陣單元格賦值,將矩陣初始化。再進(jìn)行變換操作,規(guī)則是將某單元格右下方路徑中最大值疊加到該單元格即M(I,j)=M(I,j)+max[M(i+1,j+1);M(i+1,j+2,…,jmax)-gappenalty;M(i+2,…,imax,j+1)-gappenalty]使用最簡單打分系統(tǒng)進(jìn)行比對,殘基相同時分值是1,不一樣時分值為0,空位罰分。另外還有Smith-waterman算法比較基因組學(xué)原理及應(yīng)用第40頁
基因組比對只能對序列親密相關(guān)或非常相同基因組比對,序列太長,現(xiàn)有算法無能為力方法:suffixtree數(shù)據(jù)結(jié)構(gòu)軟件MUMer
能找出兩個基因組DNA序列上最大且唯一匹配區(qū)域,然后除去序列中用Smith-waterman最正確局部比對算法對大量插入序列、重復(fù)序列、短變異區(qū)域進(jìn)行局部判定時插入空位,完成這兩個基因組序列比對。比較基因組學(xué)原理及應(yīng)用第41頁多序列比對
三條或多條序列同時比對是序列分析中最常見技術(shù)之一。經(jīng)過一系列同源序列全局比對來實現(xiàn)遞進(jìn)法:基礎(chǔ)思想是同源序列與系統(tǒng)發(fā)育相關(guān)。詳細(xì)步驟:
1、比對全部可能序列對。2、用相鄰連接法使用兩兩比正確相同度分值構(gòu)建(tree)。3、這種樹用于指導(dǎo)遞進(jìn)多序列比對。比較基因組學(xué)原理及應(yīng)用第42頁數(shù)據(jù)庫搜索
三大核酸數(shù)據(jù)庫:GenBank、EMBL、DDBJ比較基因組學(xué)原理及應(yīng)用第43頁
數(shù)據(jù)庫搜索使用最廣泛算法:FASTA算法和BLAST算法。FASTA算法利用一個包含四個連續(xù)階段啟發(fā)式方法來檢測被查序列與一組序列是相同性。BLAST算法采取非??焖惴▉聿檎覕?shù)據(jù)庫中與預(yù)查詢序列最相同是序列。基礎(chǔ)思想是:兩個同源序列即使有很大差異,也有可能共有高分值相同片段,這使咱們能夠了解可靠區(qū)分相關(guān)和非相關(guān)序列。比較基因組學(xué)原理及應(yīng)用第44頁蛋白質(zhì)序列分析
對新蛋白質(zhì)序列進(jìn)行分析第一步是用BLAST進(jìn)行數(shù)據(jù)庫搜索。假如有顯著相同性能夠推測其序列功效假如沒有,可用模式識別方法依據(jù)特定結(jié)構(gòu)域或蛋白質(zhì)家族特征進(jìn)行搜索。-----模式數(shù)據(jù)庫已經(jīng)成為識別新序列特定功效活性主要工具。InterPro數(shù)據(jù)庫是最主要蛋白質(zhì)模式數(shù)據(jù)庫之一。比較基因組學(xué)原理及應(yīng)用第45頁
另外還有蛋白質(zhì)信號肽識別及亞細(xì)胞定位預(yù)測預(yù)測卷曲螺旋和螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)蛋白質(zhì)折疊識別與分類等比較基因組學(xué)原理及應(yīng)用第46頁種內(nèi)比較基因組學(xué)
模式生物姜南比較基因組學(xué)原理及應(yīng)用第47頁種內(nèi)基因組比較同種群體內(nèi)基因組存在大量變異和多態(tài)性,正是這種基因組序列差異組成了不一樣個體與群體對疾病易感性和對藥品與環(huán)境因子不一樣反應(yīng)遺傳學(xué)基礎(chǔ)。比較基因組學(xué)原理及應(yīng)用第48頁我總結(jié)了:凡是能夠用來研究同一個群內(nèi)兩個個體基因組不一樣分子伎倆都屬于種內(nèi)比較基因組學(xué)范圍。主流方法是分子標(biāo)識技術(shù):RAPD,RFLP,AFLP,基因芯片。。?;仡櫡肿訕?biāo)識比較基因組學(xué)原理及應(yīng)用第49頁水產(chǎn)界舉例李太武老師等用20條隨機(jī)引物對皺紋盤鮑、雜色鮑進(jìn)行RAPD分析,結(jié)果均能產(chǎn)生清楚可重復(fù)擴(kuò)增產(chǎn)物,計算出各群體擴(kuò)增位點多態(tài)性百分比分別為43.66%和53.05%,群體平均遺傳雜合度分別為0.1557和0.1686,群體間遺傳距離0.2898,表明皺紋盤鮑與雜色鮑親緣關(guān)系較遠(yuǎn)。比較基因組學(xué)原理及應(yīng)用第50頁模式生物基因進(jìn)化上保守往性和遺傳密碼通用性,從某一生物得到相關(guān)基因性質(zhì)或功效方面信息往往也適合用于其它生物。個體小,易操作,易培養(yǎng),繁殖快。病毒,大腸桿菌,酵母,線蟲,果蠅,斑馬魚,小鼠,擬南芥比較基因組學(xué)原理及應(yīng)用第51頁種間比較基因組學(xué)研究馬壽光黃繼比較基因組學(xué)原理及應(yīng)用第52頁經(jīng)過對不一樣親緣關(guān)系物種基因組序列進(jìn)行比較,能夠判定出編碼序列、非編碼調(diào)控序列及給定物種獨有序列。而基因組范圍之內(nèi)序列比對,能夠了解不一樣物種在核苷酸組成、同線性關(guān)系和基因次序方面異同,進(jìn)而得到基因分析預(yù)測與定位、生物系統(tǒng)發(fā)生進(jìn)化關(guān)系等方面信息。比較基因組學(xué)原理及應(yīng)用第53頁1全基因組比較研究2系統(tǒng)發(fā)生進(jìn)化關(guān)系分析比較基因組學(xué)原理及應(yīng)用第54頁比較基因組學(xué)基礎(chǔ)是相關(guān)生物基因組相同性。兩種含有較近共同祖先生物,它們之間含有種屬差異基因組是由祖先基因組進(jìn)化而來,兩種生物在進(jìn)化階段上越靠近,它們基因組相關(guān)性就越高。假如生物之間存在很近親緣關(guān)系,那么它們基因組就會表現(xiàn)出同線性(synteny),即基因序列個別或全部保守。1.全基因組比較研究比較基因組學(xué)原理及應(yīng)用第55頁Synteny能夠這么假設(shè),人與小鼠或其它哺乳動物有一個共同祖先,在漫長進(jìn)化中,染色體發(fā)生斷裂,重排,加上基因內(nèi)部改變,成為各種不一樣物種。不過未發(fā)生斷裂重排完整片段內(nèi)部基因組織和連鎖次序在不一樣物種中保持不變,這就是synteny,是基因組比較作圖基礎(chǔ)所在。比較基因組學(xué)原理及應(yīng)用第56頁在各種不一樣物種中,絕大多數(shù)關(guān)鍵生物功效是由相當(dāng)數(shù)量orthologous蛋白負(fù)擔(dān),所謂or-thologous蛋白就是一些在不一樣物種中有共同祖先蛋白質(zhì)。在不一樣物種中這些蛋白數(shù)量十分相同,它們主要是在生物體中執(zhí)行中介代謝,DNA,RNA代謝,蛋白折疊,trafficking,和降解功效。在較為復(fù)雜生物中,伴隨功效不停地復(fù)雜,就會出現(xiàn)許多蛋白以執(zhí)行其復(fù)雜功效,而維持最基礎(chǔ)生命活動蛋白是保守。兩種物種中蛋白總數(shù)上差異是由負(fù)擔(dān)各自特有任務(wù)蛋白數(shù)目標(biāo)不一樣而造成。比較基因組學(xué)原理及應(yīng)用第57頁能夠利用?;蚪M之間編碼次序上和結(jié)構(gòu)上同源性,經(jīng)過已知基因組作圖信息定位另外基因組中基因,從而揭示基因潛在功效、說明物種進(jìn)化關(guān)系及基因組內(nèi)在結(jié)構(gòu)。比較基因組學(xué)原理及應(yīng)用第58頁人類與多個靈長類動物比較基因組學(xué)研究,在說明靈長類特異基因調(diào)整元件和劃分多基因外顯子方面顯示出了很大優(yōu)勢。林木可與擬南芥(已經(jīng)取得了全基因組序列,一些基因功效已被注釋)和毛果楊等功效基因組研究較深入物種進(jìn)行比較基因組學(xué)研究,這將為林木上相關(guān)基因功效研究提供便利。比較基因組學(xué)原理及應(yīng)用第59頁生物最本質(zhì)特征是進(jìn)化,比較基因組學(xué)一樣以進(jìn)化理論作為理論基石,同時其研究結(jié)果又前所未有地豐富和發(fā)展了進(jìn)化理論。當(dāng)在兩種以上基因組間進(jìn)行序列比較時,實質(zhì)上就得到了序列在系統(tǒng)發(fā)生樹中進(jìn)化關(guān)系?;蚪M信息增多使得在基因組水平上研究分子進(jìn)化、基因功效成為可能。2.系統(tǒng)發(fā)生進(jìn)化關(guān)系分析比較基因組學(xué)原理及應(yīng)用第60頁經(jīng)過對各種生物基因組數(shù)據(jù)及其垂直進(jìn)化、水平演化過程進(jìn)行研究,就能夠?qū)εc生命至關(guān)主要基因結(jié)構(gòu)及其調(diào)控作用有所了解。但因為生物基因組中約有1.5%~14.5%基因與“橫向遷移現(xiàn)象”相關(guān),即基因能夠在同時存在種群間遷移,這么就會造成與進(jìn)化無關(guān)序列差異。比較基因組學(xué)原理及應(yīng)用第61頁橫向遷移現(xiàn)象對人類基因組分析發(fā)覺,有幾十個人基因只與細(xì)菌基因相同,而在果蠅、線蟲中都不存在。假如以人這些基因序列來研究進(jìn)化將會得到荒謬結(jié)論。所以在當(dāng)前分子進(jìn)化研究中必須選擇垂直進(jìn)化分子作為樣本。而且在系統(tǒng)發(fā)生分析中需要建立較完整生物進(jìn)化模型,以防止基因轉(zhuǎn)移和欠缺適當(dāng)多物種共有保守序列影響。比較基因組學(xué)原理及應(yīng)用第62頁Z曲線GC輪廓圖方法基因組序列變換為等價三維空間曲線——Z曲線,經(jīng)過適當(dāng)投影和座標(biāo)旋轉(zhuǎn)后得到Z’曲線,后者又稱為累積GC輪廓圖(CumulativeGCprofile)。定義:在基因組某一堿基處G+C含量正比于Z’曲線在該點切線斜率。而在某一窗口中平均G+C含量則正比于此量在該窗口內(nèi)定積分。對于任一給定DNA序列,有唯一一條Z曲線與之對應(yīng);反之,給定一條Z曲線,它所代表DNA序列能夠唯一地導(dǎo)出。所以,Z曲線攜帶了DNA序列全部息。對兩個基因組或染色體序列比較,能夠經(jīng)過對它們所對應(yīng)Z曲線比較來進(jìn)行。比較基因組學(xué)原理及應(yīng)用第63頁在研究物種間進(jìn)化關(guān)系時,傳統(tǒng)分子進(jìn)化研究方法普通選取一個大分子(如16SRNA)序列為標(biāo)準(zhǔn),研究其在各個物種同源序列之間差異,并以此構(gòu)建進(jìn)化樹。不過一個物種基因組編碼了成千上萬個序列,以其中一個序列差異來代表整個生物體差異是不全方面。所以,從全基因組水平來碩士物進(jìn)化應(yīng)該更為合理。利用比較基因組學(xué)方法在基因組水平上構(gòu)建進(jìn)化樹將會愈加合理闡述物種之間進(jìn)化關(guān)系。比較基因組學(xué)原理及應(yīng)用第64頁物種序列優(yōu)化選擇:當(dāng)在比較40~80My進(jìn)化距離DNA序列時,其編碼序列與一些主要非編碼序列將是保守,如人與鼠。然而至今在這一進(jìn)化距離內(nèi)保守非編碼序列中只有少數(shù)被判定為有特征性功效元件,其它僅被認(rèn)為是臨近或200kb附近基因轉(zhuǎn)錄調(diào)控元件。在進(jìn)化距離較遠(yuǎn)(450My)序列比較時,將主要揭示保守編碼序列,主要是因為蛋白質(zhì)要維持其功效,所以對替換更為嚴(yán)謹(jǐn)保守,進(jìn)化稍慢一點。所以在建立多序列比較時加入一支稍遠(yuǎn)物種序列(450My)將提升保守序列判別能力。比較分析較近物種序列如:人與himpanzees或與其它類人猿能夠用來判定在近期進(jìn)化史上發(fā)生基因改變和重組等。所以在建立多序列比較分析中加入一支近距離物種序列不但有利于編碼和非編碼功效序列識別,也能揭示那些相關(guān)物種特征基因組信息、比較基因組學(xué)原理及應(yīng)用第65頁在進(jìn)行DNA序列比較而判定保守序列時,有兩種比較分析伎倆:局部比對和整體比對。局部比對是對序列亞區(qū)分析取得最高一致性計算方法,其基礎(chǔ)原理是在兩序列排隊時采取不一樣比對方法,排除了從頭到尾單一匹配方式。比如當(dāng)兩長序列進(jìn)行匹配時,可能內(nèi)含同源基因亞區(qū)排列次序或基因走向不一樣,所以對這種比對采取各種方式進(jìn)行搜索分析結(jié)果將比較準(zhǔn)確,常見分析工具是PipMarker服務(wù)器。整體比對是尋找所要比較整個基因序列上最大同源性分值,它適合用于高度分化但組織結(jié)構(gòu)同源序列比對,整體比對適合用于基因序列整體上同源性較高比較分析,如保守片斷(conservedsegments)比對,能夠使用VISTA進(jìn)行分析。比較基因組學(xué)原理及應(yīng)用第66頁Smith-Waterman算法時間復(fù)雜度O(n2);Sij=maxof 0 Si-1,j-1+σ(xi,yj) Si-1,j-d(從左到右) Si,j-1-d(從上到下)本例中:gap:d=12,線性罰分模型。比較基因組學(xué)原理及應(yīng)用第67頁例5:Smith-Waterman算法
進(jìn)行雙序列局部比對兩條序列以下:LDSCHGESLCK目標(biāo):使用局部優(yōu)化算法尋找比正確結(jié)果比較基因組學(xué)原理及應(yīng)用第68頁例5:Smith-Waterman算法
進(jìn)行雙序列局部比對兩條序列以下:LDSCHGESLCK目標(biāo):使用局部優(yōu)化算法尋找比正確結(jié)果比較基因組學(xué)原理及應(yīng)用第69頁Smith-Waterman算法GapLDSCHGap000000G0SijE0S0L0C0K0Smith-Waterman算法;Sij=maxofSi-1,j-1+σ(xi,yj)
Si-1,j-d(從左到右)Si,j-1-d(從上到下)0比較基因組學(xué)原理及應(yīng)用第70頁Smith-Waterman算法GapLDSCHGap000000G0SijE0S0L0C0K0-12-12-3比較基因組學(xué)原理及應(yīng)用第71頁Smith-Waterman算法GapLDSCHGap000000G000E0S0L0C0K0-12-12-4比較基因組學(xué)原理及應(yīng)用第72頁Smith-Waterman算法GapLDSCHGap000000G000000E002000S002600L040050C001092K000008-12-2比較基因組學(xué)原理及應(yīng)用第73頁局部比對結(jié)果:GapLDSCHGap000000G000000E002000S002600L040050C001092K000008L
DS–C
HG
ESLC
K局部優(yōu)化比對:9分比較基因組學(xué)原理及應(yīng)用第74頁中性突變與隨機(jī)漂移學(xué)說關(guān)鍵就是認(rèn)為大個別對生物種群遺傳結(jié)構(gòu)與進(jìn)化有貢獻(xiàn)分子突變在自然選擇意義上都是中性或近中性,因而自然選擇對這些突變并不起到篩選作用。中性突變產(chǎn)生后是經(jīng)過一代一代隨機(jī)漂移,或者被固定在種群中并占有一定百分比,或者消失。生物種群內(nèi)遺傳多樣性,如蛋白質(zhì)(酶)以及DNA多態(tài)性,都是經(jīng)過這類中性或近中性突變隨機(jī)漂移而產(chǎn)生。中性理論并不是說全部突變都是中性,實際上,相當(dāng)大一個別突變是有害,這一個別突變詳細(xì)有多少與相關(guān)分子本身可允許改變程度相關(guān)。有害突變產(chǎn)生后,會影響攜帶這些突變蛋白質(zhì)以及基因正常功效,影響生物生存與繁殖,所以很快就會被淘汰掉,從而在進(jìn)化上是沒有意義。另首先,對生物有利所謂正突變其實是極少,從而對種群遺傳結(jié)構(gòu)也沒有什么貢獻(xiàn),不能說明分子進(jìn)化中多態(tài)性現(xiàn)象。自然選擇只對那些對種群遺傳結(jié)構(gòu)并不主要有害突變和正突變起作用,卻不能決定對種群遺傳結(jié)構(gòu)起主要作用中性或近中性突變命運,中性或近中性突變命運是由隨機(jī)原因決定。所以,又能夠把中性理論看作是一個“幸運者生存”學(xué)說。比較基因組學(xué)原理及應(yīng)用第75頁3從模式生物基因組研究中得出一些規(guī)律3.1模式生物基因組普通都比較小,不過編碼基因百分比較高,重復(fù)次序和非編碼次序較少,是一些“壓縮”基因組3.2模式生物基因組G+C%比較高同時CpG島百分比也比較高。FugurubripesG+C%時44·2%(這是脊椎動物種最高),而人類則是40·3%。這可能是因為低等生物中編碼次序百分比比較高,另一個原因與模式生物密碼子第三位堿基選擇相關(guān)。3.3模式生物基因組中,內(nèi)含子和外顯子結(jié)構(gòu)組織比較保守,剪切位點在各種生物中一致。這是Fugurubripes和現(xiàn)有哺乳動物基因組次序比較結(jié)果3.4在幾個模式生物都發(fā)覺了重復(fù)(duplication)。同時存在兩份或兩份以上次序一致或十分相同編碼蛋白DNA次序,稱為冗余。了解重復(fù)真正本質(zhì)是說明基因組中基因生物功效和物種進(jìn)化前提。3.5生物體復(fù)雜性普通表現(xiàn)在“生物學(xué)”復(fù)雜性,與基因組C值大小及基因數(shù)量未必一定呈線性關(guān)系。比較基因組學(xué)原理及應(yīng)用第76頁首先比較基因組學(xué)建立基礎(chǔ)是功效元件因為選擇作用其進(jìn)化速率稍慢一點,這有背于中性理論;其次在序列比較中對保守區(qū)域thresholds(lengthandpercentidentity)選擇還沒有一套有效方法,往往兩個物種不一樣區(qū)域thresholds各異比較基因組學(xué)原理及應(yīng)用第77頁比較基因組學(xué)應(yīng)用揭示非編碼功效序列發(fā)覺新基因發(fā)覺功效性SNP闡述物種間進(jìn)化史說明人類疾病過程分子機(jī)制
李春麗比較基因組學(xué)原理及應(yīng)用第78頁比較基因組學(xué)與進(jìn)化古細(xì)菌---產(chǎn)甲烷球菌與原核生物共同之處:
1染色體組織與結(jié)構(gòu):環(huán)狀基因組、基因操縱子結(jié)構(gòu)等
2能量產(chǎn)生和固氮基因與細(xì)菌基因有很高同源
3與細(xì)胞分裂相關(guān)蛋白質(zhì)、20多個編碼無機(jī)離子運輸?shù)鞍譕RF與細(xì)菌基因同源
4調(diào)控模式類似于原核生物與真核生物共同之處:
1細(xì)胞遺傳信息傳遞,尤其是轉(zhuǎn)錄和翻譯系統(tǒng)
2分泌系統(tǒng)說明該細(xì)菌與真核生物親緣關(guān)系較近。
比較基因組學(xué)原理及應(yīng)用第79頁比較基因組學(xué)與進(jìn)化
比較基因組學(xué)提供結(jié)果表明,在進(jìn)化系統(tǒng)樹上,古細(xì)菌與真核生物親緣關(guān)系比原核生物更近。自養(yǎng)生物三個分支,細(xì)菌、古細(xì)菌和真核生物中,細(xì)菌分化發(fā)生較早。比較基因組學(xué)原理及應(yīng)用第80頁比較基因組學(xué)詳細(xì)應(yīng)用方法和策略序列比對分析確定基因組序列進(jìn)化關(guān)系
基因共線性synteny:染色體片段分析物種序列優(yōu)化選擇對DNA序列信息注釋比較基因組學(xué)原理及應(yīng)用第81頁比較基因組學(xué)研究舉例原核模式生物比較基因組學(xué)釀酒酵母基因組人類基因組比較基因組學(xué)原理及應(yīng)用第82頁模式生物比較基因組研究特點1模式生物基因組普通都比較小,但編碼基因百分比較高,重復(fù)序列和非編碼序列較少,是“壓縮”基因組。2模式生物基因組中G+C%含量高,同時CpG島百分比也比較高。3一些模式生物,尤其在人基因組中發(fā)覺了重復(fù)。4各種不一樣物種中,大多數(shù)主要生物學(xué)功效是由相當(dāng)數(shù)量同源序列基因蛋白負(fù)擔(dān)。5同線(synteny)連鎖同源基因在不一樣物種基因組中有相同連鎖關(guān)系。比較基因組學(xué)原理及應(yīng)用第83頁模式生物基因組研究尿殖道支原體是已知最小基因組0.58Mb,由此可能確定能自我復(fù)制細(xì)胞必需一套最少關(guān)鍵基因。流感嗜血桿菌基因組為1.83Mb流感嗜血桿菌基因大小平均900bp,尿殖道支原體基因為1040bp,基因大小差不多;流感嗜血桿菌中平均1042bp有1個基因,尿殖道支原體中平均1235bp有1個基因??梢娀蚪M尺度減小并不引發(fā)基因密度增加和基因尺寸減小。二者差異在于基因數(shù)量上,流感嗜血桿菌基因組有1743個ORF,尿殖道支原體只有470個ORF。
比較基因組
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年互聯(lián)網(wǎng)醫(yī)療解決方案技術(shù)合作協(xié)議
- 2025年雙方協(xié)商勞務(wù)派遣協(xié)議
- 2025年P(guān)PP項目合作財務(wù)管理協(xié)議
- 主材供應(yīng)及合作框架合同 2024年版一
- 2025版區(qū)塊鏈技術(shù)應(yīng)用合伙人合作協(xié)議3篇
- 2025年度智能建筑安裝工程承包技師合同4篇
- 二零二五年度酒吧食品安全管理與承包合同
- 2025年度城市公交車定點維修與應(yīng)急保障合同
- 二零二五年度汽車維修免責(zé)聲明適用于車主自帶配件
- 2025年度地鐵隧道鋼筋工勞務(wù)施工安全質(zhì)量保障合同
- 建筑結(jié)構(gòu)課程設(shè)計成果
- 班級建設(shè)方案中等職業(yè)學(xué)校班主任能力大賽
- 纖維增強復(fù)合材料 單向增強材料Ⅰ型-Ⅱ 型混合層間斷裂韌性的測定 編制說明
- 習(xí)近平法治思想概論教學(xué)課件緒論
- 寵物會展策劃設(shè)計方案
- 孤殘兒童護(hù)理員(四級)試題
- 梁湘潤《子平基礎(chǔ)概要》簡體版
- 醫(yī)院急診醫(yī)學(xué)小講課課件:急診呼吸衰竭的處理
- 腸梗阻導(dǎo)管在臨床中的使用及護(hù)理課件
- 小學(xué)英語單詞匯總大全打印
- 衛(wèi)生健康系統(tǒng)安全生產(chǎn)隱患全面排查
評論
0/150
提交評論