生物信息學名詞解釋個人整理_第1頁
生物信息學名詞解釋個人整理_第2頁
生物信息學名詞解釋個人整理_第3頁
生物信息學名詞解釋個人整理_第4頁
生物信息學名詞解釋個人整理_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、一、名詞解釋:1 .生物信息學:研究大量生物數(shù)據(jù)復雜關系的學科,其特征是多學科交叉,以互聯(lián)網(wǎng)為媒介,數(shù)據(jù)庫為載體.利用數(shù)學知識建立各種數(shù)學模型;利用計算機為工具對實驗所得大量生物學數(shù)據(jù)進行儲存、檢索、處理及分析,并以生物學知識對結果進行解釋.2 .二級數(shù)據(jù)庫:在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的根底上針對特定目標衍生而來,是對生物學知識和信息的進一步的整理.3 .FASTA序列格式:是將DNA或者蛋白質(zhì)序列表示為一個帶有一些標記的核甘酸或者氨基酸字符串,大于號表示一個新文件的開始,其他無特殊要求.4 .genbank序列格式:是GenBank數(shù)據(jù)庫的根本信息單位,是最為廣泛的生物信息學序列格式之

2、一.該文件格式按域劃分為4個局部:第一局部包含整個記錄的信息描述符;第二局部包含注釋;第三局部是引文區(qū),提供了這個記錄的科學依據(jù);第四局部是核甘酸序列本身,以“結尾.5 .Entrez檢索系統(tǒng):是NCBI開發(fā)的核心檢索系統(tǒng),集成了NCBI的各種數(shù)據(jù)庫,具有鏈接的數(shù)據(jù)庫多,使用方便,能夠進行交叉索引等特點.6 .BLAST:根本局部比對搜索工具,用于相似性搜索的工具,對需要進行檢索的序列與數(shù)據(jù)庫中的每個序列做相似性比擬.P947 .查詢序列querysequence:也稱被檢索序列,用來在數(shù)據(jù)庫中檢索并進行相似性比擬的序列.P988 .打分矩陣scoringmatrix:在相似性檢索中對序列兩兩

3、比對的質(zhì)量評估方法.包括基于理論如考慮核酸和氨基酸之間的類似性和實際進化距離如PAM兩類方法.P299 .空位gap:在序列比對時,由于序列長度不同,需要插入一個或幾個位點以取得最正確比對結果,這樣在其中一序列上產(chǎn)生中斷現(xiàn)象,這些中斷的位點稱為空位.P2910 .空位罰分:空位罰分是為了補償插入和缺失對序列相似性的影響,序列中的空位的引入不代表真正的進化事件,所以要對其進行罰分,空位罰分的多少直接影響比照的結果.P3711 .E值:衡量序列之間相似性是否顯著的期望值.E值大小說明了可以找到與查詢序列query相匹配的隨機或無關序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味著序

4、列的相似性偶然發(fā)生的時機越小,也即相似性越能反映真實的生物學意義.P9512 .低復雜度區(qū)域:BLAST搜索的過濾選項.指序列中包含的重復度高的區(qū)域,如polyA.13 .點矩陣dotmatrix:構建一個二維矩陣,其X軸是一條序列,Y軸是另一個序列,然后在2個序列相同堿基的對應位置x,y加點,如果兩條序列完全相同那么會形成一條主對角線,如果兩條序列相似那么會出現(xiàn)一條或者幾條直線;如果完全沒有相似性那么不能連成直線.14 .多序列比對:通過序列的相似性檢索得到許多相似性序列,將這些序列做一個總體的比對,以觀察它們在結構上的異同,來答復大量的生物學問題.15 .分子鐘:認為分子進化速率是恒定的或

5、者幾乎恒定的假說,從而可以通過分子進化推斷出物種起源的時間.16 .系統(tǒng)發(fā)育分析:通過一組相關的基因或者蛋白質(zhì)的多序列比對或其他性狀,可以研究推斷不同物種或基因之間的進化關系.17 .進化樹的二歧分叉結構:指在進化樹上任何一個分支節(jié)點,一個父分支都只能被分成兩個子分支.系統(tǒng)發(fā)育圖:用枝長表示進化時間的系統(tǒng)樹稱為系統(tǒng)發(fā)育圖,是引入時間概念的支序圖.18 .直系同源:指由于物種形成事件來自一個共同祖先的不同物種中的同源序列,具有相似或不同的功能.書:在缺乏任何基因復制證據(jù)的情況下,具有共同祖先和相同功能的同源基因.19 .旁系并系同源:指同一個物種中具有共同祖先,通過基因重復產(chǎn)生的一組基因,這些基

6、因在功能上可能發(fā)生了改變.書:由于基因重復事件產(chǎn)生的相似序列.20 .外類群:是進化樹中處于一組被分析物種之外的,具有相近親緣關系的物種.21 .有根樹:能夠確定所有分析物種的共同祖先的進化樹.22 .除權配對算法UPGMA:最初,每個序列歸為一類,然后找到距離最近的兩類將其歸為一類,定義為一個節(jié)點,重復這個過程,直到所有的聚類被參加,最終產(chǎn)生樹根.23 .鄰接法neighbor-joiningmethod:是一種不僅僅計算兩兩比對距離,還對整個樹的長度進行最小化,從而對樹的拓撲結構進行限制,能夠克服UPGMA算法要求進化速率保持恒定的缺陷.24 .最大簡2法MP:在一系列能夠解釋序列差異的的

7、進化樹中找到具有最少核酸或氨基酸替換的進化樹.25 .最大似然法ML:它對每個可能的進化位點分配一個概率,然后綜合所有位點,找到概率最大的進化樹.最大似然法允許采用不同的進化模型對變異進行分析評估,并在此根底上構建系統(tǒng)發(fā)育樹.26 .一致樹consensustree:在同一算法中產(chǎn)生多個最優(yōu)樹,合并這些最優(yōu)樹得到的樹即一致樹.27 .自舉法檢驗Bootstrap:放回式抽樣統(tǒng)計法.通過對數(shù)據(jù)集屢次重復取樣,構建多個進化樹,用來檢查給定樹的分枝可信度.28 .開放閱t新!ORF:開放閱讀框是基因序列的一局部,包含一段可以編碼蛋白的堿基序列.29 .密碼子偏好性codonbias:氨基酸的同義密碼

8、子的使用頻率與相應的同功tRNA的水平相一致,大多數(shù)高效表達的基因僅使用那些含量高的同功tRNA所對應的密碼子,這種效應稱為密碼子偏好性.30 .基因預測的從頭分析:依據(jù)綜合利用基因的特征,如剪接位點,內(nèi)含子與外顯子邊界,調(diào)控區(qū),預測基因組序列中包含的基因.31 .結構域domain:保守的結構單元,包含獨特的二級結構組合和疏水內(nèi)核,可能單獨存在,也可能與其他結構域組合.相同功能的同源結構域具有序列的相似性.32 .超家族:進化上相關,功能可能不同的一類蛋白質(zhì).33 .模體motif:短的保守的多肽段,含有相同模體的蛋白質(zhì)不一定是同源的,一般10-20個殘基.34 .序列表譜profile:是

9、一種特殊位點或模體序列,在多序列比擬的根底上,氨基酸的權值和空位罰分的表格.35 .PAM矩陣:PAM指可接受突變百分率.一個氨基酸在進化中變成另一種氨基酸的可能性,通過這種可能性可以鑒定蛋白質(zhì)之間的相似性,并產(chǎn)生蛋白質(zhì)之間的比對.一個PAM單位是蛋白質(zhì)序列平均發(fā)生1%的替代量需要的進化時間.36 .BLOSUM矩陣:模塊替代矩陣.矩陣中的每個位點的分值來自蛋白比對的局部塊中的替代頻率的觀察.每個矩陣適合特定的進化距離.例如,在BLOSUM62矩陣中,比對的分值來自不超過62%一致率的一組序列.37 .PSI-BLAST:位點特異性迭代比對.是一種專門化的的比對,通過調(diào)節(jié)序列打分矩陣scori

10、ngmatrix探測遠緣相關的蛋白.38 .RefSeq:給出了對應于基因和蛋白質(zhì)的索引號,對應于最穩(wěn)定、最被人成認的Genbank序列.39 .PDBProteinDataBank:PDB中收錄了大量通過實驗X射線晶體衍射,核磁共振NMR測定的生物大分子的三維結構,記錄有原子坐標、配基的化學結構和晶體結構的描述等.PDB數(shù)據(jù)庫的訪問號由一個數(shù)字和三個字母組成如,4HHB,同時支持關鍵詞搜索,還可以FASTA程序進行搜索.40 .GenPept:是由GenBank中的DNA序列譯得到的蛋白質(zhì)序列.數(shù)據(jù)量很大,且隨核酸序列數(shù)據(jù)庫的更新而更新,但它們均是由核酸序列譯得到的序列,未經(jīng)試驗證實,也沒有

11、詳細的注釋.41 .折疊子Fold:在兩個或更多的蛋白質(zhì)中具有相似二級結構的大區(qū)域,這些大區(qū)域具有特定的空間取向.42 .TrEMBL:是與SWISS-PROT相關的一個數(shù)據(jù)庫.包含從EMBL核酸數(shù)據(jù)庫中根據(jù)編碼序列CDS譯而得到的蛋白質(zhì)序列,并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫中.43 .MMDBMolecularModelingDatabase:是NCBI所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個局部,數(shù)據(jù)庫的內(nèi)容包括來自于實驗的生物大分子結構數(shù)據(jù).與PDB相比,對于數(shù)據(jù)庫中的每一個生物大分子結構,MMDB具有許多附加的信息,如分子的生物學功能、產(chǎn)生功能的機制、分子的進化

12、歷史等,還提供生物大分子三維結構模型顯示、結構分析和結構比擬工具.44 .SCOP數(shù)據(jù)庫:提供關于結構的蛋白質(zhì)之間結構和進化關系的詳細描述,包括蛋白質(zhì)結構數(shù)據(jù)庫PDB中的所有條目.SCOP數(shù)據(jù)庫除了提供蛋白質(zhì)結構和進化關系信息外,對于每一個蛋白質(zhì)還包括下述信息:到PDB的連接,序列,參考文獻,結構的圖像等.可以按結構和進化關系對蛋白質(zhì)分類,分類結果是一個具有層次結構的樹,其主要的層次依次是類class、折疊子fold、超家族superfamily、家族family、單個PDB蛋白結構記錄.45 .PROSITE:是蛋白質(zhì)家族和結構域數(shù)據(jù)庫,包含具有生物學意義的位點、模式、可幫助識別蛋白質(zhì)家族的

13、統(tǒng)計特征.PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結合的區(qū)域等;PROSITE還包括根據(jù)多序列比對而構建的序列統(tǒng)計特征,能更敏感地發(fā)現(xiàn)一個序列是否具有相應的特征.46 .GeneOntology協(xié)會:編輯一組動態(tài)的、可控的基因產(chǎn)物不同方面性質(zhì)的字匯的協(xié)會.從3個方面描述基因產(chǎn)物的性質(zhì),即,分子功能,生物過程,細胞區(qū)室.47 .表譜PSSM:指一張基于多序列比對的打分表,表示一個蛋白質(zhì)家族,可以用來搜索序列數(shù)據(jù)庫.48 .比擬基因組學:是在基因組圖譜和測序的根底上,利用某個基因組研究獲得的信息推測其他原核生物、真核

14、生物類群中的基因數(shù)目、位置、功能、表達機制和物種進化的學科.49 .簡約信息位點:指基于DNA或蛋白質(zhì)序列,利用最大簡約法構建系統(tǒng)發(fā)育樹時,如果每個位點的狀態(tài)至少存在兩種,每種狀態(tài)至少出現(xiàn)兩次的位點.其它位點為都是非簡約性信息位點.1 .生物信息學:狹義專指應用信息技術儲存和分析基因組測序所產(chǎn)生的分子序列及其相關數(shù)據(jù)的學科;廣義指生命科學與數(shù)學、計算機科學和信息科學等交匯融合所形成的一門交叉學科.2 .人類基因組測序方案:3基因組學p150:以基因組分析為手段,研究基因組的結構組成、時序表達模式和功能,并提供有關生物物種及其細胞功能的進化信息.4基因組p150:是指一個生物體、細胞器或病毒的整

15、套基因.5.比擬基因組學p166:是指基因組學與生物信息學的一個重要分支.通過模式生物基因組之間或模式生物基因組與人類基因組之間的比擬與鑒別,可以為研究生物進化和別離人類遺傳病的候選基因以及預測新的基因功能提供依據(jù).6功能基因組:表達一定功能的全部基因所組成的DNA序列,包括編碼基因和調(diào)控基因.功能基因組學:利用結構基因組學研究所得的各種來源的信息,建立與開展各種技術和實驗模型來測定基因及基因組非編碼序列的生物學功能.7蛋白質(zhì)組p179:是指一個基因組中各個基因編碼產(chǎn)生的蛋白質(zhì)的總體,即一個基因組的全部蛋白產(chǎn)物及其表達情況.8蛋白質(zhì)組學:指應用各種技術手段來研究蛋白質(zhì)組的一門新興科學,其目的是

16、從整體的角度分析細胞內(nèi)動態(tài)變化的蛋白質(zhì)組成成分、表達水平與修飾狀態(tài),了解蛋白質(zhì)之間的相互作用與聯(lián)系,揭示蛋白質(zhì)功能與細胞生命活動規(guī)律.9功能蛋白質(zhì)組學:課件上只能找到功能蛋白質(zhì)組,即細胞在一定階段或與某一生理現(xiàn)象相關的所有蛋白.10序列對位排列:通過插入間隔的方法使不同長度的序列對齊,到達長度一致.11分子系統(tǒng)樹:是表達類群或序列問系統(tǒng)發(fā)育關系的一種樹狀圖.12 BLAST搜索p73:是一種根本的局部對位排列搜索工具.13 SNPp152:即單核酸多態(tài)性,是指基因組內(nèi)特定核甘酸位點上存在兩種不同堿基,其中每種在群體中的頻率不小于1%.SNP大多數(shù)為轉(zhuǎn)換置換.14 ESTp91:即表達序列標簽,

17、是從cDNA文庫中生成的一些很短的序列300500bp,它們代表在特定組織或發(fā)育階段表達的基因,有時可代表特定的cDNAo16基因組作圖p155:是確定界標或基因在構成基因組的每條染色體上的位置,以及同條染色體上各個界標或基因之間的相對距離.17后基因組時代p3:其標志是大規(guī)模基因組分析、蛋白質(zhì)組分析以及各種數(shù)據(jù)的比擬和整合.18電子克隆p98:又稱虛擬克隆,其原理是依據(jù)大量EST具有相互重疊的性質(zhì),通過計算機法獲得cDNA全長序列.電子克隆是由一個查詢序列開始,依靠EST數(shù)據(jù)庫在計算機上對EST進行兩端延伸,從而獲得全長的cDNA序列.19遺傳連鎖圖p155:是用遺傳模式來描述DNA標記基因

18、和其他確定DNA序列在染色體上的相對位置.20物理圖譜p156:是標明一些界標如限制酶切點、單一序列、基因等在DNA分子或染色體上鎖處位置的圖,圖距以物理長度為單位如核甘酸對的數(shù)目.1. 生物信息學:1生物信息學包含了生物信息的獲取、處理、分析、和解釋等在內(nèi)的一門交叉學科;2它綜合運用了數(shù)學、計算機學和生物學的各種工具來進行研究;3目的在于說明大量生物學數(shù)據(jù)所包含的生物學意義.2. BLASTBasicLocalAlignmentSearchTool直譯:根本局部排比搜索工具意譯:基于局部序列排比的常用數(shù)據(jù)庫搜索工具含義:蛋白質(zhì)和核酸序列數(shù)據(jù)庫搜索軟件系統(tǒng)及相關數(shù)據(jù)庫3. PSI-BLAST:

19、是一種迭代的搜索方法,可以提升BLASTSFASTA的相似序列發(fā)現(xiàn)率.4. 一致序列:這些序列是指把多序列聯(lián)配的信息壓縮至單條序列,主要的缺點是除了在特定位置最常見的殘基之外,它們不能表示任何概率信息.5. HMM隱馬爾可夫模型:一種統(tǒng)計模型,它考慮有關匹配、錯配和間隔的所有可能的組合來生成一組序列排列.課件定義是蛋白質(zhì)結構域家族序列的一種嚴格的統(tǒng)計模型,包括序列的匹配,插入和缺失狀態(tài),并根據(jù)每種狀態(tài)的概率分布和狀態(tài)間的相互轉(zhuǎn)換來生成蛋白質(zhì)序列.6. 信息位點:由位點產(chǎn)生的突變數(shù)目把其中的一課樹與其他樹區(qū)分開的位點.7,非信息位點:對于最大簡約法來說沒有意義的點.8.標度樹:分支長度與相鄰節(jié)點

20、對的差異程度成正比的樹.9,非標度樹:只表示親緣關系無差異程度信息.10 .有根樹:單一的節(jié)點能指派為共同的祖先,從祖先節(jié)點只有唯一的路徑歷經(jīng)進化到達其他任何節(jié)點.11 .無根樹:只說明節(jié)點間的關系,無進化發(fā)生方向的信息,通過引入外群或外部參考物種,可以在無根樹中指派根節(jié)點.12 .注釋:指從原始序列數(shù)據(jù)中獲得有用的生物學信息.這主要是指在基因組DNA中尋找基因和其他功能元件結構注釋,并給出這些序列的功能功能注釋.13 .聚類分析:一種通過將相似的數(shù)據(jù)劃分到特定的組中以簡化大規(guī)模數(shù)據(jù)集的方法.14 .無監(jiān)督分析法:這種方法沒有內(nèi)建的分類標準,組的數(shù)目和類型只決定于所使用的算法和數(shù)據(jù)本身的分析方

21、法.15 .有監(jiān)督分析法:這種方法引入某些形式的分類系統(tǒng),從而將表達模式分配到一個或多個預定義的類目中.16,微陣列芯片:將探針有規(guī)律地排列固定于載體上,與標記熒光分子的樣品進行雜交,通過掃描儀掃描對熒光信號的強度進行檢測,從而迅速得出所要的信息.17.虛擬消化:是基于蛋白序列和切斷酶的特異性的情況下進行的理論酶切課件定義.是在蛋白質(zhì)序列和蛋白外切酶之類切斷試劑的特異性的根底上,由計算機進行的一種理論上的蛋白裂解反響.19,分子途徑是指一組連續(xù)起作用以到達共同目標的蛋白質(zhì).20 .虛擬細胞:一種建模手段,把細胞定義為許多結構,分子,反響和物質(zhì)流的集合體.21 .先導化合物:是指具有一定藥理活性

22、的、可通過結構改造來優(yōu)化其藥理特性而可能導致藥物發(fā)現(xiàn)的特殊化合物.就是利用計算機在含有大量化合物三維結構的數(shù)據(jù)庫中,搜索能與生物大分子靶點匹配的化合物,或者搜索能與結合藥效團相符的化合物,又稱原型物,簡稱先導物,是通過各種途徑或方法得到的具有生物活性的化學結構22 .權重矩陣序列輪廓:它們表示完全結構域序列,多序列聯(lián)配中每個位點的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方法課件定義.根底上針對特定的應用目標而建立的數(shù)據(jù)庫.23 .系統(tǒng)發(fā)育學phylogenetic:確定生物體間進化關系的科學分支.24 .系統(tǒng)生物學systemsbiology:是研究一個生物系統(tǒng)中所有組分成

23、分基因、mRNA蛋白質(zhì)等的構成以及在特定條件下這些組分間的相互關系,并分析生物系統(tǒng)在一定時間內(nèi)的動力學過程25 .蛋白質(zhì)組proteome:是指一個基因組、一種生物或一個細胞/組織的基因組所表達的全套蛋白質(zhì).1、生物信息學廣義:生命科學中的信息科學.生物體系和過程中信息的存貯、傳遞和表達;細胞、組織、器官的生理、病理、藥理過程的中各種生物信息.狹義:生物分子信息的獲取、存貯、分析和利用.2、基因:有遺傳效應的DNA片斷,是限制生物性狀的根本遺傳單位.3、中央法那么是指遺傳信息從DNA傳遞給RNA再從RNA傳遞給蛋白質(zhì),即完成遺傳信息的轉(zhuǎn)錄和譯的過程.也可以從DNA傳遞給DNA即完成DNA的復制

24、過程.這是所有有細胞結構的生物所遵循的法那么.4、一級數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋5、基因芯片基因芯片(genechip),又稱DNA散陣歹U(microarray),是由大量cDNAlE寡核甘酸探針密集排列所形成的探針陣列,其工作的根本原理是通過雜交檢測信息.6、推動生物信息學快速開展的學科核心和靈魂:生物學根本工具:數(shù)學與計算機技術7、“組學的主要創(chuàng)新點對生命科學開展的作用與意義21世紀是生物技術和信息技術的時代,基因組研究由結構基因組研究轉(zhuǎn)向功能基因組研究,蛋白質(zhì)組學已成為當前研究的熱點和重點,生物信息學加快了生命科學的開展步伐.蛋白組研究

25、的興起和開展,在揭示生命運動的本質(zhì)及疾病的診斷、治療等方面發(fā)揮著重要作用.隨著基因組學研究的不斷深入,在基因組測序、蛋白質(zhì)序列測定和結構解析等實驗的根底上,產(chǎn)生了大量有關生物分子的原始數(shù)據(jù),這些原始的數(shù)據(jù)需要利用現(xiàn)代計算機技術進行收集、整理、治理以便檢索使用,生物信息學應用而生,其研究重點集中在核酸和蛋白質(zhì)兩個方面.所謂組學,即從一個整體的角度來研究.相對于傳統(tǒng)生命科學零敲碎打的研究手段,研究單個的基因或蛋白的功能、結構,而組學那么是著眼于大局,將單個的基因、蛋白以“組的水平進行研究,從而對于生命科學能夠有一個大局的把握.作用:(1)從學科角度方面:生命科學進入了新的開展時期;研究體系的突破:

26、局部到整體;學科性質(zhì):經(jīng)驗型、資料積累到總結規(guī)律(2)從研究人員角度:提升研究效率、深化研究成果、顯著增加論文“厚度與“重量意義:正對生命科學產(chǎn)生深遠的影響,極大提升科研的效率、質(zhì)量、促進生命科學實現(xiàn)跨越式的開展.數(shù)據(jù)處理、分析水平直接影響當今生命科學研究機構的科研水平與研究成果水平.8、世界上最權威的四大生物數(shù)據(jù)平臺美國人工蛋白質(zhì)數(shù)據(jù)庫:1960年GenBanK據(jù)庫:1979年歐洲分子生物學實驗室(EMBL):1982年日本核酸序列數(shù)據(jù)庫(DDBJ):1984年19、分子鐘蛋白質(zhì)同系物的替換率,在幾百萬至幾千萬年的時間跨度上是根本保持恒定的,因此將氨基酸的勻速變異現(xiàn)象比作分子鐘.根本規(guī)律:(

27、1)不同類的基因間的氨基酸替換率的存在顯著差異(2)同類的分子進化速率那么幾乎完全一致,同源蛋白質(zhì)的差異取決于它們獨立分化的時間20、進化樹構建的主要方法、各自的原理及優(yōu)缺點距離建樹方法:利用雙重序列比對的差異程度進行建樹;最大簡約法:進化往往會走最短的路-DNA序列發(fā)生的堿基替換數(shù)量最少最大似然法:進化會走可能性最大的路1距離建樹方法非加權組平均法UPGMA相令口歸并法Neighbor-joining,NJ優(yōu)點:快速,Fitch-MargoliashFM優(yōu)點:允許OTU操作分類單位問存在不同的進化速率原理:根據(jù)雙重序列比對的差異程度距離優(yōu)點:使用序列進化模型、計算強度較小缺點:屏蔽了真實的特

28、征符數(shù)據(jù).2最大簡約法原理:最能反映進化歷史的樹具有最短的樹長treelength,即進化步數(shù)性狀在系統(tǒng)樹中狀態(tài)改變的次數(shù)最少.即:DNAff列發(fā)生的堿基替換數(shù)最少.3最大似然法原理:首先選定一個進化模型,計算該模型下,各種分支樹產(chǎn)生現(xiàn)有數(shù)據(jù)的可能性.具有最大可能性的系統(tǒng)樹為最優(yōu).即一個樹的似然性likelihood等于每一個性狀的似然性之和或每一個性狀的似然性對數(shù)之和.優(yōu)點:完全基于統(tǒng)計,在每組序列比對中考慮了每個核甘酸替換的概率,使用越來越普遍缺點:計算量非常大,缺乏普遍適用的替換模型不同的替換模型給出不同的結果21、domain,fold,motif31、蛋白質(zhì)的各級結構的定義Domain:指具有特定且相對獨立的三維立體結構、而且能夠獨立完成某種功能的蛋白質(zhì)的一局部,但有時候也泛指蛋白質(zhì)序列的一局部.Fold:蛋白質(zhì)根本三維結構,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論