生物信息學(xué)名詞解釋71438

上傳人：8*** IP屬地：湖北上傳時(shí)間：2022-04-25 格式：DOC 頁(yè)數(shù)：8 大小：69KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩3頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1.生物信息學(xué)：研究大量生物數(shù)據(jù)復(fù)雜關(guān)系的學(xué)科，其特征是多學(xué)科交叉，以互聯(lián)網(wǎng)為媒介，數(shù)據(jù)庫(kù)為載體。利用數(shù)學(xué)知識(shí)建立各種數(shù)學(xué)模型; 利用計(jì)算機(jī)為工具對(duì)實(shí)驗(yàn)所得大量生物學(xué)數(shù)據(jù)進(jìn)行儲(chǔ)存、檢索、處理及分析，并以生物學(xué)知識(shí)對(duì)結(jié)果進(jìn)行解釋。2.二級(jí)數(shù)據(jù)庫(kù)：在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定目標(biāo)衍生而來(lái)，是對(duì)生物學(xué)知識(shí)和信息的進(jìn)一步的整理。3.FASTA序列格式：是將DNA或者蛋白質(zhì)序列表示為一個(gè)帶有一些標(biāo)記的核苷酸或者氨基酸字符串，大于號(hào)（）表示一個(gè)新文件的開(kāi)始，其他無(wú)特殊要求。4.genbank序列格式：是GenBank 數(shù)據(jù)庫(kù)的基本信息單位，是最為廣泛的生物信息學(xué)序列格式之一。該文件格

2、式按域劃分為4個(gè)部分：第一部分包含整個(gè)記錄的信息（描述符）；第二部分包含注釋；第三部分是引文區(qū)，提供了這個(gè)記錄的科學(xué)依據(jù)；第四部分是核苷酸序列本身，以“/”結(jié)尾。5.Entrez檢索系統(tǒng)：是NCBI開(kāi)發(fā)的核心檢索系統(tǒng)，集成了NCBI的各種數(shù)據(jù)庫(kù)，具有鏈接的數(shù)據(jù)庫(kù)多，使用方便，能夠進(jìn)行交叉索引等特點(diǎn)。6.BLAST：基本局部比對(duì)搜索工具，用于相似性搜索的工具，對(duì)需要進(jìn)行檢索的序列與數(shù)據(jù)庫(kù)中的每個(gè)序列做相似性比較。P947.查詢序列（query sequence）：也稱被檢索序列，用來(lái)在數(shù)據(jù)庫(kù)中檢索并進(jìn)行相似性比較的序列。P988.打分矩陣（scoring matrix）：在相似性檢索中對(duì)序列兩兩

3、比對(duì)的質(zhì)量評(píng)估方法。包括基于理論（如考慮核酸和氨基酸之間的類似性）和實(shí)際進(jìn)化距離（如PAM）兩類方法。P299.空位（gap）：在序列比對(duì)時(shí)，由于序列長(zhǎng)度不同，需要插入一個(gè)或幾個(gè)位點(diǎn)以取得最佳比對(duì)結(jié)果，這樣在其中一序列上產(chǎn)生中斷現(xiàn)象，這些中斷的位點(diǎn)稱為空位。P2910.空位罰分：空位罰分是為了補(bǔ)償插入和缺失對(duì)序列相似性的影響，序列中的空位的引入不代表真正的進(jìn)化事件，所以要對(duì)其進(jìn)行罰分，空位罰分的多少直接影響對(duì)比的結(jié)果。P3711.E值：衡量序列之間相似性是否顯著的期望值。E值大小說(shuō)明了可以找到與查詢序列（query）相匹配的隨機(jī)或無(wú)關(guān)序列的概率，E值越接近零，越不可能找到其他匹配序列，E值越小

4、意味著序列的相似性偶然發(fā)生的機(jī)會(huì)越小，也即相似性越能反映真實(shí)的生物學(xué)意義。P9512.低復(fù)雜度區(qū)域：BLAST搜索的過(guò)濾選項(xiàng)。指序列中包含的重復(fù)度高的區(qū)域，如poly（A）。13.點(diǎn)矩陣（dot matrix）：構(gòu)建一個(gè)二維矩陣，其X軸是一條序列，Y軸是另一個(gè)序列，然后在2個(gè)序列相同堿基的對(duì)應(yīng)位置（x，y）加點(diǎn)，如果兩條序列完全相同則會(huì)形成一條主對(duì)角線，如果兩條序列相似則會(huì)出現(xiàn)一條或者幾條直線；如果完全沒(méi)有相似性則不能連成直線。14.多序列比對(duì)：通過(guò)序列的相似性檢索得到許多相似性序列，將這些序列做一個(gè)總體的比對(duì)，以觀察它們?cè)诮Y(jié)構(gòu)上的異同，來(lái)回答大量的生物學(xué)問(wèn)題。15.分子鐘：認(rèn)為分子進(jìn)化速率是

5、恒定的或者幾乎恒定的假說(shuō)，從而可以通過(guò)分子進(jìn)化推斷出物種起源的時(shí)間。16.系統(tǒng)發(fā)育分析：通過(guò)一組相關(guān)的基因或者蛋白質(zhì)的多序列比對(duì)或其他性狀，可以研究推斷不同物種或基因之間的進(jìn)化關(guān)系。17.進(jìn)化樹(shù)的二歧分叉結(jié)構(gòu)：指在進(jìn)化樹(shù)上任何一個(gè)分支節(jié)點(diǎn)，一個(gè)父分支都只能被分成兩個(gè)子分支。系統(tǒng)發(fā)育圖：用枝長(zhǎng)表示進(jìn)化時(shí)間的系統(tǒng)樹(shù)稱為系統(tǒng)發(fā)育圖，是引入時(shí)間概念的支序圖。18.直系同源：指由于物種形成事件來(lái)自一個(gè)共同祖先的不同物種中的同源序列，具有相似或不同的功能。（書(shū)：在缺乏任何基因復(fù)制證據(jù)的情況下，具有共同祖先和相同功能的同源基因。）19.旁系（并系）同源：指同一個(gè)物種中具有共同祖先，通過(guò)基因重復(fù)產(chǎn)生的一組基因

6、，這些基因在功能上可能發(fā)生了改變。(書(shū)：由于基因重復(fù)事件產(chǎn)生的相似序列。)20.外類群：是進(jìn)化樹(shù)中處于一組被分析物種之外的，具有相近親緣關(guān)系的物種。21.有根樹(shù)：能夠確定所有分析物種的共同祖先的進(jìn)化樹(shù)。22.除權(quán)配對(duì)算法（UPGMA）：最初，每個(gè)序列歸為一類，然后找到距離最近的兩類將其歸為一類，定義為一個(gè)節(jié)點(diǎn)，重復(fù)這個(gè)過(guò)程，直到所有的聚類被加入，最終產(chǎn)生樹(shù)根。23.鄰接法（neighbor-joining method）：是一種不僅僅計(jì)算兩兩比對(duì)距離，還對(duì)整個(gè)樹(shù)的長(zhǎng)度進(jìn)行最小化，從而對(duì)樹(shù)的拓?fù)浣Y(jié)構(gòu)進(jìn)行限制，能夠克服UPGMA算法要求進(jìn)化速率保持恒定的缺陷。24.最大簡(jiǎn)約法（MP）：在一系列能夠

7、解釋序列差異的的進(jìn)化樹(shù)中找到具有最少核酸或氨基酸替換的進(jìn)化樹(shù)。25.最大似然法（ML）：它對(duì)每個(gè)可能的進(jìn)化位點(diǎn)分配一個(gè)概率，然后綜合所有位點(diǎn)，找到概率最大的進(jìn)化樹(shù)。最大似然法允許采用不同的進(jìn)化模型對(duì)變異進(jìn)行分析評(píng)估，并在此基礎(chǔ)上構(gòu)建系統(tǒng)發(fā)育樹(shù)。26.一致樹(shù)（consensus tree）：在同一算法中產(chǎn)生多個(gè)最優(yōu)樹(shù)，合并這些最優(yōu)樹(shù)得到的樹(shù)即一致樹(shù)。27.自舉法檢驗(yàn)（Bootstrap）：放回式抽樣統(tǒng)計(jì)法。通過(guò)對(duì)數(shù)據(jù)集多次重復(fù)取樣，構(gòu)建多個(gè)進(jìn)化樹(shù)，用來(lái)檢查給定樹(shù)的分枝可信度。28.開(kāi)放閱讀框（ORF）：開(kāi)放閱讀框是基因序列的一部分，包含一段可以編碼蛋白的堿基序列。29.密碼子偏好性（codon

8、bias）：氨基酸的同義密碼子的使用頻率與相應(yīng)的同功tRNA的水平相一致，大多數(shù)高效表達(dá)的基因僅使用那些含量高的同功tRNA所對(duì)應(yīng)的密碼子，這種效應(yīng)稱為密碼子偏好性。30.基因預(yù)測(cè)的從頭分析：依據(jù)綜合利用基因的特征，如剪接位點(diǎn)，內(nèi)含子與外顯子邊界，調(diào)控區(qū)，預(yù)測(cè)基因組序列中包含的基因。31.結(jié)構(gòu)域（domain）：保守的結(jié)構(gòu)單元，包含獨(dú)特的二級(jí)結(jié)構(gòu)組合和疏水內(nèi)核，可能單獨(dú)存在，也可能與其他結(jié)構(gòu)域組合。相同功能的同源結(jié)構(gòu)域具有序列的相似性。32.超家族：進(jìn)化上相關(guān)，功能可能不同的一類蛋白質(zhì)。33.模體（motif）：短的保守的多肽段，含有相同模體的蛋白質(zhì)不一定是同源的，一般10-20個(gè)殘基。34.

9、序列表譜（profile）：是一種特殊位點(diǎn)或模體序列，在多序列比較的基礎(chǔ)上，氨基酸的權(quán)值和空位罰分的表格。35.PAM矩陣：PAM指可接受突變百分率。一個(gè)氨基酸在進(jìn)化中變成另一種氨基酸的可能性，通過(guò)這種可能性可以鑒定蛋白質(zhì)之間的相似性，并產(chǎn)生蛋白質(zhì)之間的比對(duì)。一個(gè)PAM單位是蛋白質(zhì)序列平均發(fā)生1%的替代量需要的進(jìn)化時(shí)間。36.BLOSUM矩陣：模塊替代矩陣。矩陣中的每個(gè)位點(diǎn)的分值來(lái)自蛋白比對(duì)的局部塊中的替代頻率的觀察。每個(gè)矩陣適合特定的進(jìn)化距離。例如，在BLOSUM62矩陣中，比對(duì)的分值來(lái)自不超過(guò)62%一致率的一組序列。37.PSI-BLAST：位點(diǎn)特異性迭代比對(duì)。是一種專門化的的比對(duì)，通過(guò)調(diào)

10、節(jié)序列打分矩陣（scoring matrix）探測(cè)遠(yuǎn)緣相關(guān)的蛋白。38.RefSeq：給出了對(duì)應(yīng)于基因和蛋白質(zhì)的索引號(hào)碼，對(duì)應(yīng)于最穩(wěn)定、最被人承認(rèn)的Genbank序列。39.PDB（Protein Data Bank）：PDB中收錄了大量通過(guò)實(shí)驗(yàn)（X射線晶體衍射，核磁共振NMR）測(cè)定的生物大分子的三維結(jié)構(gòu)，記錄有原子坐標(biāo)、配基的化學(xué)結(jié)構(gòu)和晶體結(jié)構(gòu)的描述等。PDB數(shù)據(jù)庫(kù)的訪問(wèn)號(hào)由一個(gè)數(shù)字和三個(gè)字母組成（如，4HHB），同時(shí)支持關(guān)鍵詞搜索，還可以FASTA程序進(jìn)行搜索。40.GenPept:是由GenBank中的DNA序列翻譯得到的蛋白質(zhì)序列。數(shù)據(jù)量很大，且隨核酸序列數(shù)據(jù)庫(kù)的更新而更新，但它們均是

11、由核酸序列翻譯得到的序列，未經(jīng)試驗(yàn)證實(shí)，也沒(méi)有詳細(xì)的注釋。41.折疊子（Fold）：在兩個(gè)或更多的蛋白質(zhì)中具有相似二級(jí)結(jié)構(gòu)的大區(qū)域，這些大區(qū)域具有特定的空間取向。42.TrEMBL：是與SWISS-PROT相關(guān)的一個(gè)數(shù)據(jù)庫(kù)。包含從EMBL核酸數(shù)據(jù)庫(kù)中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列，并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫(kù)中。43.MMDB(Molecular Modeling Database)：是（NCBI）所開(kāi)發(fā)的生物信息數(shù)據(jù)庫(kù)集成系統(tǒng)Entrez的一個(gè)部分，數(shù)據(jù)庫(kù)的內(nèi)容包括來(lái)自于實(shí)驗(yàn)的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比，對(duì)于數(shù)據(jù)庫(kù)中的每一個(gè)生物大分子結(jié)構(gòu)，MMDB具有

12、許多附加的信息，如分子的生物學(xué)功能、產(chǎn)生功能的機(jī)制、分子的進(jìn)化歷史等，還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。44.SCOP數(shù)據(jù)庫(kù)：提供關(guān)于已知結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進(jìn)化關(guān)系的詳細(xì)描述，包括蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中的所有條目。SCOP數(shù)據(jù)庫(kù)除了提供蛋白質(zhì)結(jié)構(gòu)和進(jìn)化關(guān)系信息外，對(duì)于每一個(gè)蛋白質(zhì)還包括下述信息：到PDB的連接，序列，參考文獻(xiàn)，結(jié)構(gòu)的圖像等?？梢园唇Y(jié)構(gòu)和進(jìn)化關(guān)系對(duì)蛋白質(zhì)分類，分類結(jié)果是一個(gè)具有層次結(jié)構(gòu)的樹(shù)，其主要的層次依次是類（class）、折疊子（fold）、超家族（super family）、家族（family）、單個(gè)PDB蛋白結(jié)構(gòu)記錄。45.PROSITE：

13、是蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫(kù)，包含具有生物學(xué)意義的位點(diǎn)、模式、可幫助識(shí)別蛋白質(zhì)家族的統(tǒng)計(jì)特征。 PROSITE中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等；PROSITE還包括根據(jù)多序列比對(duì)而構(gòu)建的序列統(tǒng)計(jì)特征，能更敏感地發(fā)現(xiàn)一個(gè)序列是否具有相應(yīng)的特征。 46.Gene Ontology 協(xié)會(huì)：編輯一組動(dòng)態(tài)的、可控的基因產(chǎn)物不同方面性質(zhì)的字匯的協(xié)會(huì)。從3個(gè)方面描述基因產(chǎn)物的性質(zhì)，即，分子功能，生物過(guò)程，細(xì)胞區(qū)室。47.表譜（PSSM）：指一張基于多序列比對(duì)的打分表，表示一個(gè)蛋白質(zhì)家族，可以用來(lái)搜索序列數(shù)據(jù)庫(kù)。48.比較

14、基因組學(xué)：是在基因組圖譜和測(cè)序的基礎(chǔ)上，利用某個(gè)基因組研究獲得的信息推測(cè)其他原核生物、真核生物類群中的基因數(shù)目、位置、功能、表達(dá)機(jī)制和物種進(jìn)化的學(xué)科。49.簡(jiǎn)約信息位點(diǎn)：指基于DNA或蛋白質(zhì)序列，利用最大簡(jiǎn)約法構(gòu)建系統(tǒng)發(fā)育樹(shù)時(shí)，如果每個(gè)位點(diǎn)的狀態(tài)至少存在兩種，每種狀態(tài)至少出現(xiàn)兩次的位點(diǎn)。其它位點(diǎn)為都是非簡(jiǎn)約性信息位點(diǎn)。1、生物信息學(xué)：生物分子信息的獲取、存貯、分析和利用；以數(shù)學(xué)為基礎(chǔ)，應(yīng)用計(jì)算機(jī)技術(shù)，研究生物學(xué)數(shù)據(jù)的科學(xué)。2、相似性（similarity）：兩個(gè)序列（核酸、蛋白質(zhì)）間的相關(guān)性。3、同源性（homology）：生物進(jìn)化過(guò)程中源于同一祖先的分支之間的關(guān)系。4、同一性（identi

15、ty）：兩個(gè)序列（核酸、蛋白質(zhì)）間未發(fā)生變異序列的關(guān)系。5、序列比對(duì)（alignment）：為確定兩個(gè)或多個(gè)序列之間的相似性以至于同源性，而將它們按照一定的規(guī)律排列。6、生物數(shù)據(jù)庫(kù)檢索（database query，數(shù)據(jù)庫(kù)查詢）：對(duì)序列、結(jié)構(gòu)以及各種二次數(shù)據(jù)庫(kù)中的注釋信息進(jìn)行關(guān)鍵詞匹配查找。7、生物數(shù)據(jù)庫(kù)搜索（database search)：通過(guò)特定序列相似性比對(duì)算法，找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫(kù)中與待檢序列具有一定程度相似性的序列。1. 生物信息學(xué)：1）生物信息學(xué)包含了生物信息的獲取、處理、分析、和解釋等在內(nèi)的一門交叉學(xué)科；2）它綜合運(yùn)用了數(shù)學(xué)、計(jì)算機(jī)學(xué)和生物學(xué)的各種工具來(lái)進(jìn)行研究；3）目的

16、在于闡明大量生物學(xué)數(shù)據(jù)所包含的生物學(xué)意義。2. BLAST（Basic Local Alignment Search Tool）直譯：基本局部排比搜索工具意譯：基于局部序列排比的常用數(shù)據(jù)庫(kù)搜索工具含義：蛋白質(zhì)和核酸序列數(shù)據(jù)庫(kù)搜索軟件系統(tǒng)及相關(guān)數(shù)據(jù)庫(kù)3. PSI-BLAST：是一種迭代的搜索方法，可以提高BLAST和FASTA的相似序列發(fā)現(xiàn)率。4. 一致序列：這些序列是指把多序列聯(lián)配的信息壓縮至單條序列，主要的缺點(diǎn)是除了在特定位置最常見(jiàn)的殘基之外，它們不能表示任何概率信息。5. HMM 隱馬爾可夫模型：一種統(tǒng)計(jì)模型，它考慮有關(guān)匹配、錯(cuò)配和間隔的所有可能的組合來(lái)生成一組序列排列。（課件定義）是蛋

17、白質(zhì)結(jié)構(gòu)域家族序列的一種嚴(yán)格的統(tǒng)計(jì)模型，包括序列的匹配，插入和缺失狀態(tài)，并根據(jù)每種狀態(tài)的概率分布和狀態(tài)間的相互轉(zhuǎn)換來(lái)生成蛋白質(zhì)序列。6. 信息位點(diǎn)：由位點(diǎn)產(chǎn)生的突變數(shù)目把其中的一課樹(shù)與其他樹(shù)區(qū)分開(kāi)的位點(diǎn)。7. 非信息位點(diǎn)：對(duì)于最大簡(jiǎn)約法來(lái)說(shuō)沒(méi)有意義的點(diǎn)。8. 標(biāo)度樹(shù)：分支長(zhǎng)度與相鄰節(jié)點(diǎn)對(duì)的差異程度成正比的樹(shù)。9. 非標(biāo)度樹(shù)：只表示親緣關(guān)系無(wú)差異程度信息。10. 有根樹(shù)：?jiǎn)我坏墓?jié)點(diǎn)能指派為共同的祖先，從祖先節(jié)點(diǎn)只有唯一的路徑歷經(jīng)進(jìn)化到達(dá)其他任何節(jié)點(diǎn)。11. 無(wú)根樹(shù)：只表明節(jié)點(diǎn)間的關(guān)系，無(wú)進(jìn)化發(fā)生方向的信息，通過(guò)引入外群或外部參考物種，可以在無(wú)根樹(shù)中指派根節(jié)點(diǎn)。12. 注釋：指從原始序列數(shù)據(jù)中獲得

18、有用的生物學(xué)信息。這主要是指在基因組DNA中尋找基因和其他功能元件（結(jié)構(gòu)注釋），并給出這些序列的功能（功能注釋）。13. 聚類分析：一種通過(guò)將相似的數(shù)據(jù)劃分到特定的組中以簡(jiǎn)化大規(guī)模數(shù)據(jù)集的方法。14. 無(wú)監(jiān)督分析法：這種方法沒(méi)有內(nèi)建的分類標(biāo)準(zhǔn)，組的數(shù)目和類型只決定于所使用的算法和數(shù)據(jù)本身的分析方法。15. 有監(jiān)督分析法：這種方法引入某些形式的分類系統(tǒng)，從而將表達(dá)模式分配到一個(gè)或多個(gè)預(yù)定義的類目中。16. 微陣列芯片：將探針有規(guī)律地排列固定于載體上，與標(biāo)記熒光分子的樣品進(jìn)行雜交，通過(guò)掃描儀掃描對(duì)熒光信號(hào)的強(qiáng)度進(jìn)行檢測(cè)，從而迅速得出所要的信息。17. 虛擬消化：是基于已知蛋白序列和切斷酶的特異性的

19、情況下進(jìn)行的理論酶切（課件定義）。是在已知蛋白質(zhì)序列和蛋白外切酶之類切斷試劑的已知特異性的基礎(chǔ)上，由計(jì)算機(jī)進(jìn)行的一種理論上的蛋白裂解反應(yīng)。18. 質(zhì)譜(MS)是一種準(zhǔn)確測(cè)定真空中離子的分子質(zhì)量/電荷比(m/z)的方法，從而使分子質(zhì)量的準(zhǔn)確確定成為可能。質(zhì)譜分析的兩個(gè)工具19. 分子途徑是指一組連續(xù)起作用以達(dá)到共同目標(biāo)的蛋白質(zhì)。20. 虛擬細(xì)胞：一種建模手段，把細(xì)胞定義為許多結(jié)構(gòu)，分子，反應(yīng)和物質(zhì)流的集合體。21. 先導(dǎo)化合物：是指具有一定藥理活性的、可通過(guò)結(jié)構(gòu)改造來(lái)優(yōu)化其藥理特性而可能導(dǎo)致藥物發(fā)現(xiàn)的特殊化合物。就是利用計(jì)算機(jī)在含有大量化合物三維結(jié)構(gòu)的數(shù)據(jù)庫(kù)中，搜索能與生物大分子靶點(diǎn)匹配的化合

20、物，或者搜索能與結(jié)合藥效團(tuán)相符的化合物，又稱原型物，簡(jiǎn)稱先導(dǎo)物，是通過(guò)各種途徑或方法得到的具有生物活性的化學(xué)結(jié)構(gòu)22. 權(quán)重矩陣（序列輪廓）：它們表示完全結(jié)構(gòu)域序列，多序列聯(lián)配中每個(gè)位點(diǎn)的氨基酸都有分值，并且特定位置插入或缺失的可能性均有一定的衡量方法（課件定義）?；A(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的數(shù)據(jù)庫(kù)。23. 系統(tǒng)發(fā)育學(xué)（phylogenetic）：確定生物體間進(jìn)化關(guān)系的科學(xué)分支。24. 系統(tǒng)生物學(xué)（systems biology）：是研究一個(gè)生物系統(tǒng)中所有組分成分（基因、mRNA、蛋白質(zhì)等）的構(gòu)成以及在特定條件下這些組分間的相互關(guān)系，并分析生物系統(tǒng)在一定時(shí)間內(nèi)的動(dòng)力學(xué)過(guò)程25. 蛋白質(zhì)組（

21、proteome）：是指一個(gè)基因組、一種生物或一個(gè)細(xì)胞/組織的基因組所表達(dá)的全套蛋白質(zhì)。26. ESI電噴霧離子化：一種適合大分子如蛋白質(zhì)離子化沒(méi)有明顯降解的質(zhì)譜技術(shù)。一、名詞解釋1. GenBank：是美國(guó)全國(guó)衛(wèi)生研究所維護(hù)的基因序列數(shù)據(jù)庫(kù)，匯集并注釋了所有公開(kāi)的核酸序列，與日本的DNA數(shù)據(jù)庫(kù)DDBJ以及歐洲分子實(shí)驗(yàn)室核酸序列數(shù)據(jù)庫(kù)EMBL一起，都是國(guó)際核苷酸序列數(shù)據(jù)庫(kù)合作的成員。2. EMBL：EMBL實(shí)驗(yàn)室歐洲分子生物學(xué)實(shí)驗(yàn)室，EMBL數(shù)據(jù)庫(kù)是非盈利性學(xué)術(shù)組織EMBL建立的綜合性數(shù)據(jù)庫(kù)，EMBL核酸數(shù)據(jù)庫(kù)是歐洲最重要的核酸序列數(shù)據(jù)庫(kù)，它定期地與美國(guó)的GenBank、日本的DDBJ數(shù)據(jù)庫(kù)

22、中的數(shù)據(jù)進(jìn)行交換，并同步更新。3. DDBJ：日本DNA數(shù)據(jù)庫(kù)，主要向研究者收集DNA序列信息并賦予其數(shù)據(jù)存取號(hào)，信息來(lái)源主要是日本的研究機(jī)構(gòu)，也接受其他國(guó)家呈遞的序列。4. BLAST：基本局部比對(duì)搜索工具的縮寫，是一種序列類似性檢索工具。BLAST采用統(tǒng)計(jì)學(xué)幾分系統(tǒng)，同時(shí)采用局部比對(duì)算法， BLAST程序能迅速與公開(kāi)數(shù)據(jù)庫(kù)進(jìn)行相似性序列比較。BLAST結(jié)果中的得分是對(duì)一種對(duì)相似性的統(tǒng)計(jì)說(shuō)明。5. BLASTn：是核酸序列到核酸庫(kù)中的一種查詢。庫(kù)中存在的每條已知序列都將同所查序列作一對(duì)一地核酸序列比對(duì)。6. BLASTp：是蛋白序列到蛋白庫(kù)中的一種查詢。庫(kù)中存在的每條已知序列將逐一地同每條所

23、查序列作一對(duì)一的序列比對(duì)。7. Clustsl X：是CLUSTAL多重序列比對(duì)程序的Windows版本，是用來(lái)對(duì)核酸與蛋白序列進(jìn)行多序列比較的程序，也可以對(duì)來(lái)自不同物種的功能或結(jié)構(gòu)相似的序列進(jìn)行比對(duì)和聚類，通過(guò)重建系統(tǒng)發(fā)生樹(shù)判斷親緣關(guān)系，并對(duì)序列在生物進(jìn)化過(guò)程中的保守性進(jìn)行估計(jì)。8. Entrez：是由NCBI主持的一個(gè)數(shù)據(jù)庫(kù)檢索系統(tǒng)，它包括核酸，蛋白以及Medline文摘數(shù)據(jù)庫(kù)，在這三個(gè)數(shù)據(jù)庫(kù)中建立了非常完善的聯(lián)系。因此，可以從一個(gè)DNA序列查詢到蛋白產(chǎn)物以及相關(guān)文獻(xiàn)，而且，每個(gè)條目均有一個(gè)類鄰(neighboring)信息，給出與查詢條目接近的信息。9. SRS(sequence ret

24、rieval system)：序列查詢系統(tǒng)，是EBI提供的多數(shù)據(jù)庫(kù)查詢工具之一。有與Entrez類似的功能外，還提供了一系列的序列分析工具，可以直接進(jìn)行在線序列分析處理。10. SWLSSMODE：是目前最著名的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)服務(wù)器，建立在已知生物大分子結(jié)構(gòu)基礎(chǔ)上，利用同源建模的方法對(duì)未知序列的蛋白質(zhì)三級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。11. homology modeling：是目前最為成功且實(shí)用的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法，它的前提是已知一個(gè)或多個(gè)同源蛋白質(zhì)的結(jié)構(gòu)。當(dāng)兩個(gè)蛋白質(zhì)的序列同源性高于35%，一般情況下認(rèn)為他們的三維結(jié)構(gòu)基本相同。12. Ab initio prediction：蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)方法從

25、頭預(yù)測(cè)法，在既沒(méi)有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒(méi)有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)的情況下，只能采用從頭預(yù)測(cè)方法，即（直接）僅僅根據(jù)序列本身來(lái)預(yù)測(cè)其結(jié)構(gòu)。13. molecular phylogenetic tree：分子進(jìn)化樹(shù)，精確地反映物種間或群體間在進(jìn)化過(guò)程中發(fā)生的極微細(xì)的遺傳變異，而且借助化石提供的大分子類群的分化年代能定量地估計(jì)出物種間或群體間的分化年代。14. gene tree：基因樹(shù)，表示一組基因或一組DNA順序進(jìn)化關(guān)系的系統(tǒng)發(fā)生樹(shù)。15. neighborjoining method：鄰接法，基于最小進(jìn)化原理經(jīng)常被使用的一種算法，它不檢驗(yàn)所有可能的拓?fù)浣Y(jié)構(gòu)，能同時(shí)給出拓?fù)浣Y(jié)構(gòu)和分支長(zhǎng)度。

26、在重建系統(tǒng)發(fā)生樹(shù)時(shí)，認(rèn)為在進(jìn)化分子上，發(fā)生趨異的次數(shù)可以不同，它是最有效的的基于距離數(shù)據(jù)重建系統(tǒng)樹(shù)的方法之一。16. maximum parsimony method：最大簡(jiǎn)約法基于進(jìn)化過(guò)程中所需核苷酸（或氨基酸）替代數(shù)目最少的假說(shuō)，對(duì)所有可能正確的拓?fù)浣Y(jié)構(gòu)進(jìn)行計(jì)算并挑選出所需替代數(shù)最小的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)系統(tǒng)樹(shù)。17. MEGA(Molecular Evolutionary Genetics Analysis)：是一款免費(fèi)的構(gòu)樹(shù)軟件，它提供了序列比對(duì)、格式轉(zhuǎn)換、數(shù)據(jù)修訂、距離計(jì)算、系統(tǒng)樹(shù)重建和可信度評(píng)估等全套功能，能對(duì)DNA、mRNA氨基酸序列及遺傳距離進(jìn)行系統(tǒng)發(fā)生分析以及基因分化年代的分析。

27、18. BioEdit：BioEdit是一個(gè)序列編輯器與分析工具軟件。功能包括：序列編輯、外掛分析程序、RNA分析、尋找特征序列、支持超過(guò)20000個(gè)序列的多序列文件、基本序列處理功能、質(zhì)粒圖繪制等等。19. EST：表達(dá)序列標(biāo)簽是從一個(gè)隨機(jī)選擇的cDNA 克隆，進(jìn)行5端和3端單一次測(cè)序挑選出來(lái)獲得的短的cDNA 部分序列,代表一個(gè)完整基因的一小部分20. GSS：基因組勘測(cè)序列，是基因組DNA克隆的一次性部分測(cè)序得到的序列。包括隨機(jī)的基因組勘測(cè)序列、cosmid/BAC/YAC末端序列、通過(guò)Exon trapped獲得基因組序列、通過(guò)Alu PCR獲得的序列、以及轉(zhuǎn)座子標(biāo)記（序列等。21.

28、ORF：核酸序列的開(kāi)放閱讀框，一個(gè)ORF就是一個(gè)潛在的蛋白質(zhì)編碼區(qū)。22. promoter：?jiǎn)?dòng)子，是RNA聚合酶識(shí)別、結(jié)合并開(kāi)始轉(zhuǎn)錄所必需的一段DNA序列。23. 3UTR：3非翻譯區(qū)的縮寫，真核生物的轉(zhuǎn)錄終止信號(hào)是在3非翻譯區(qū)的polyA。24. CpG island：是DNA上的一個(gè)區(qū)域，富含GC，兩者以磷酸酯鍵相連，長(zhǎng)度約幾百到幾千bp不等，常出現(xiàn)在管家基因或頻繁表達(dá)的基因的啟動(dòng)子附近，在這些部位，CpG島具有阻止序列甲基化的作用。25. coiled coil：卷曲螺旋，是蛋白質(zhì)中由27條螺旋鏈相互纏繞形成類似麻花狀結(jié)構(gòu)的總稱。卷曲螺旋是控制蛋白質(zhì)寡聚化的元件，在機(jī)體內(nèi)執(zhí)行著分子識(shí)

29、別、代謝調(diào)控、細(xì)胞分化、肌肉收縮、膜通道等生物學(xué)功能。26. heptad repeat：七肽重復(fù)區(qū)是典型的卷曲螺旋結(jié)構(gòu)類型之一，由多個(gè)七肽單元連接而成的重復(fù)序列。27. structure domain：結(jié)構(gòu)域，是在蛋白質(zhì)三級(jí)結(jié)構(gòu)中介于二級(jí)和三級(jí)結(jié)構(gòu)之間的可以明顯區(qū)分但又相對(duì)獨(dú)立的折疊單元，每個(gè)結(jié)構(gòu)域自身形成緊實(shí)的三維結(jié)構(gòu)，可以獨(dú)立存在或折疊，但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。28. motif：又稱模體，實(shí)序列中局部的保守區(qū)域，或者是一組序列中共有的一小段序列模式。通常由2、3個(gè)二級(jí)結(jié)構(gòu)單位組成，一般為螺旋、折疊和環(huán)。motif作為結(jié)構(gòu)域中的亞單位，表現(xiàn)結(jié)構(gòu)域的各種生物學(xué)功能。29. li

30、nux operating system：linux操作系統(tǒng)，Linux是一類Unix計(jì)算機(jī)操作系統(tǒng)的統(tǒng)稱。Linux操作系統(tǒng)也是自由軟件和開(kāi)放源代碼發(fā)展中最著名的例子。30. BioPerl：是Perl語(yǔ)言專門用于生物信息學(xué)、基因組學(xué)及其他生命科學(xué)領(lǐng)域的工具與函數(shù)模塊集。31. PubMed：是一個(gè)免費(fèi)的生物醫(yī)學(xué)文摘數(shù)據(jù)庫(kù)，提供部分論文的摘要及指向全文的鏈接。作為 Entrez 資訊檢索系統(tǒng)的一部分。32. PDB(Protein Data Bank)：PDB是目前最主要的收集生物大分子(蛋白質(zhì)、核酸和糖)三維結(jié)構(gòu)的數(shù)據(jù)庫(kù)，允許用戶用各種方式以及布爾邏輯組合(AND、OR和NOT)進(jìn)行檢索。

31、33. HGP(human genome project)；人類基因組計(jì)劃，1990年由美國(guó)能源部(DOE)和國(guó)立健康研究院(NIH)資助的一個(gè)研究計(jì)劃。目的是：鑒定出人類的所有基因；確定構(gòu)成人類基因組的約30億個(gè)堿基對(duì)的序列；將上述信息儲(chǔ)存于專門的數(shù)據(jù)庫(kù)中，并開(kāi)發(fā)出相應(yīng)的分析工具；研究由此而產(chǎn)生的倫理、法律和社會(huì)問(wèn)題并提出相應(yīng)對(duì)策。34. ncRNA：非編碼RNA，是指沒(méi)有編碼蛋白質(zhì)功能的所有RNA,它缺乏開(kāi)放閱讀框，常由編碼蛋白質(zhì)的基因反轉(zhuǎn)錄而來(lái)。35. miRNA：是一類小的非編碼單鏈RNA，由1925個(gè)核苷酸構(gòu)成，廣泛存在于動(dòng)植物中，調(diào)節(jié)著基因表達(dá)。Silicon clonin

32、g：利用公共數(shù)據(jù)庫(kù)信息, 借助計(jì)算機(jī)軟件分析, 推測(cè)目的基因的編碼區(qū)序列, 輔助全長(zhǎng)cDNA克隆的方法BLAST：即基本局域聯(lián)配搜索工具，Basic Local Alignment Search Tool，是一個(gè)局部比對(duì)搜索工具，用來(lái)確定一條查詢序列和一個(gè)數(shù)據(jù)庫(kù)的比對(duì)，最早的版本不引入間隙，但現(xiàn)在所用的版本已經(jīng)允許比對(duì)中引入間隙。Entrez ：是由 NCBI 主持的一個(gè)數(shù)據(jù)庫(kù)檢索系統(tǒng)，它包括核酸，蛋白以及 Medline 文摘數(shù)據(jù)庫(kù)，在這三個(gè)數(shù)據(jù)庫(kù)中建立了非常完善的聯(lián)系。因此，可以從一個(gè) DNA 序列查詢到蛋白產(chǎn)物以及相關(guān)文獻(xiàn)，而且，每個(gè)條目均有一個(gè)類鄰 (neighboring)信息，

33、給出與查詢條目接近的信息。 Entrez 中的數(shù)據(jù)庫(kù)包括： Entrez 中核酸數(shù)據(jù)庫(kù)為：GenBank, EMBL, DDBJ 蛋白質(zhì)數(shù)據(jù)庫(kù)為：Swiss-Prot, PIR, PFR, PDBPSI-BLAST：是一種迭代的搜索方法，可以提高 BLAST 和 FASTA 的相似序列發(fā)現(xiàn)率。ORF：開(kāi)放閱讀框（ORF)是基因序列的一部分，包含一段可以編碼蛋白的堿基序列，不能被終止子打斷。編碼一個(gè)蛋白質(zhì)的外顯子連接成為一個(gè)連續(xù)的 ORF。當(dāng)一個(gè)新基因被識(shí)別，其 DNA 序列被解讀，人們?nèi)耘f無(wú)法搞清相應(yīng)的蛋白序列是什么。這是因?yàn)樵跊](méi)有其它信息的前提下，DNA 序列可以按六種框架閱讀和翻譯（

34、每條鏈三種，對(duì)應(yīng)三種不同的起始密碼子）ORF 識(shí)別包括檢測(cè)這六個(gè)閱讀框架并決定哪一個(gè)包含以啟動(dòng)子和終止子為界限的 DNA 。序列而其內(nèi)部不包含啟動(dòng)子或終止子，符合這些條件的序列有可能對(duì)應(yīng)一個(gè)真正的單一的基因產(chǎn)物。 ORF 的識(shí)別是證明一個(gè)新的 DNA 序列為特定的蛋白質(zhì)編碼基因的部分或全部的先決條件。相似性（similarity）/（identify）：相似性是指序列比對(duì)過(guò)程中用來(lái)描述檢測(cè)序列和目標(biāo)序列之間相同DNA堿基或氨基酸殘基順序所占比例的高低。生物數(shù)據(jù)庫(kù)檢索(database query,數(shù)據(jù)庫(kù)查詢):對(duì)序列,結(jié)構(gòu)以及各種二次數(shù)據(jù)庫(kù) 中的注釋信息進(jìn)行關(guān)鍵詞匹配查找.生物數(shù)據(jù)

35、庫(kù)搜索(database search):通過(guò)特定序列相似性比對(duì)算法,找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫(kù)中與待檢序列具有一定程度相似性的序列. E 值：對(duì)某個(gè)已識(shí)別出的相似度值 S，E 值是分值大于等于 S 的期望頻率，改值可以被理解為期望隨機(jī)得到等于 S 或大于 S 值的分值數(shù)目。序列比對(duì)(alignment):為確定兩個(gè)或多個(gè)序列之間的相似性以至于同源性,而將它們按照一定的規(guī)律排列.同源性(homology):生物進(jìn)化過(guò)程中源于同一祖先的分支之間的關(guān)系.Refseq：美國(guó)國(guó)家生物信息技術(shù)中心（NCBI）提供了具有生物意義上的非冗余的基因和蛋白質(zhì)序列的RefSeq參考序列數(shù)據(jù)庫(kù) 。3UTR：

36、3非翻譯區(qū)的縮寫，真核生物的轉(zhuǎn)錄終止信號(hào)是在 3非翻譯區(qū)的： polyA。CpG island：是 DNA 上的一個(gè)區(qū)域，富含 GC，兩者以磷酸酯鍵相連，長(zhǎng)度：約幾百到幾千 bp 不等，常出現(xiàn)在管家基因或頻繁表達(dá)的基因的啟動(dòng)子附近，在這些部位，CpG 島具有阻止序列甲基化的作用。GSS：基因組勘測(cè)序列，是基因組 DNA 克隆的一次性部分測(cè)序得到的序：cosmid/BAC/YAC 末端序列、通過(guò) Exon 列。包括隨機(jī)的基因組勘測(cè)序列、 trapped 獲得基因組序列、通過(guò) Alu PCR 獲得的序列、以及轉(zhuǎn)座子標(biāo)記（序列等。EST：表達(dá)序列標(biāo)簽是從一個(gè)隨機(jī)選擇的 cDNA 克隆

37、，進(jìn)行 5端和 3 端單一次測(cè)序挑選出來(lái)獲得的短的 cDNA 部分序列,代表一個(gè)完整基因的一小部分.。MEGA(Molecular Evolutionary Genetics Analysis)：是一款免費(fèi)的構(gòu)樹(shù)軟件，：它提供了序列比對(duì)、格式轉(zhuǎn)換、數(shù)據(jù)修訂、距離計(jì)算、系統(tǒng)樹(shù)重建和可信度 mRNA 氨基酸序列及遺傳距離進(jìn)行系統(tǒng)發(fā)生分評(píng)估等全套功能，能對(duì) DNA、析以及基因分化年代的分析。maximum parsimony method：最大簡(jiǎn)約法基于進(jìn)化過(guò)程中所需核苷酸（或氨基酸）替代數(shù)目最少的假說(shuō)，對(duì)所有可能正確的拓?fù)浣Y(jié)構(gòu)進(jìn)行計(jì)算并挑選出所需替代數(shù)最小的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)系統(tǒng)樹(shù)。

38、neighborjoining method：鄰接法，基于最小進(jìn)化原理經(jīng)常被使用的一種算法，它不檢驗(yàn)所有可能的拓?fù)浣Y(jié)構(gòu)，能同時(shí)給出拓?fù)浣Y(jié)構(gòu)和分支長(zhǎng)度。在重建系統(tǒng)發(fā)生樹(shù)時(shí)，認(rèn)為在進(jìn)化分子上，發(fā)生趨異的次數(shù)可以不同，它是最有效的的基于距離數(shù)據(jù)重建系統(tǒng)樹(shù)的方法之一。molecular phylogenetic tree：分子進(jìn)化樹(shù)，精確地反映物種間或群體間在進(jìn) ：化過(guò)程中發(fā)生的極微細(xì)的遺傳變異，而且借助化石提供的大分子類群的分化年代能定量地估計(jì)出物種間或群體間的分化年代。Domain ：功能域。蛋白質(zhì)中具有某種特定功能的部分，它在序列上未必是連續(xù)的。某蛋白質(zhì)中所有功能域組合其起來(lái)決定著該

39、蛋白質(zhì)的全部功能。 EMBL：EMBL 實(shí)驗(yàn)室歐洲分子生物學(xué)實(shí)驗(yàn)室，EMBL 數(shù)據(jù)庫(kù)是非盈利：性學(xué)術(shù)組織 EMBL 建立的綜合性數(shù)據(jù)庫(kù)，EMBL 核酸數(shù)據(jù)庫(kù)是歐洲最重要的核酸序列數(shù)據(jù)庫(kù)，它定期地與美國(guó)的 GenBank、日本的 DDBJ 數(shù)據(jù)庫(kù)中的數(shù) 據(jù)進(jìn)行交換，并同步更新。BLAST ：Basic Local Alignment Search Tool，基本的基于局部對(duì)準(zhǔn)的搜索工具；一種快速查找與給定序列具有連續(xù)相同片斷的序列的技術(shù)。SRS(sequence retrieval system)：序列查詢系統(tǒng)，是 EBI 提供的多數(shù)據(jù)庫(kù)查詢：工具之一。有與 Entrez 類似的功能

40、外，還提供了一系列的序列分析工具，可以直接進(jìn)行在線序列分析處理。 dynamic programming：動(dòng)態(tài)規(guī)劃程序；它將一個(gè)問(wèn)題合理分解成一些小的子問(wèn)題，然后利用部分計(jì)算解得到最終答案。Match score maximum likelihood approach methylation microarray microsatellite MIAME(the minimum information about a microarray experiment) minisatellite mismatch score molecular clock匹配得分最大似然法：序列比較算法對(duì)相同字

41、符匹配設(shè)置的得分。指在一系列的序列比對(duì)中，考慮每一個(gè)字符被替代的概率的一種系統(tǒng)發(fā)生學(xué)方法；也是一種基于純統(tǒng)計(jì)的系統(tǒng)發(fā)生重建方法。一個(gè)甲基 ( CH 3 ) 附著在一個(gè)核苷酸的含氮堿基或者蛋白質(zhì) 上。在一個(gè)固體基片上的已知位置固定了 DNA 探針的有序陣列。在基因組中很多非常短的核酸序列出現(xiàn)的區(qū)域，例如串接出現(xiàn) 5 -CA-3 的重復(fù)序列；通常在個(gè)體間變化很大。PAM unit：PAM 單位是一種進(jìn)化單位；特別地，指被觀察的對(duì)象中每 100 個(gè)殘基發(fā)生一個(gè)替換所需要的平均進(jìn)化時(shí)間。對(duì)兩條序列進(jìn)行編輯操作，通過(guò)字符匹配和替換，或者插入和刪除。 PubMed：是一個(gè)免費(fèi)的生物醫(yī)學(xué)文摘

42、數(shù)據(jù)庫(kù)，提供部分論文的摘要及指：向全文的鏈接。作為 Entrez 資訊檢索系統(tǒng)的一部分。motif：又稱模體，實(shí)序列中局部的保守區(qū)域，或者是一組序列中共有的一小：段序列模式。通常由 2、個(gè)二級(jí)結(jié)構(gòu)單位組成， 3 一般為螺旋、折疊和環(huán)。 motif 作為結(jié)構(gòu)域中的亞單位，表現(xiàn)結(jié)構(gòu)域的各種生物學(xué)功能。tructure domain：結(jié)構(gòu)域，是在蛋白質(zhì)三級(jí)結(jié)構(gòu)中介于二級(jí)和三級(jí)結(jié)構(gòu)之間：的可以明顯區(qū)分但又相對(duì)獨(dú)立的折疊單元，每個(gè)結(jié)構(gòu)域自身形成緊實(shí)的三維結(jié)構(gòu)，可以獨(dú)立存在或折疊，但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。coiled coil：卷曲螺旋，是蛋白質(zhì)中由 27 條螺旋鏈相互纏繞形

43、成類似麻花狀結(jié)構(gòu)的總稱。卷曲螺旋是控制蛋白質(zhì)寡聚化的元件，在機(jī)體內(nèi)執(zhí)行著分子識(shí)別、代謝調(diào)控、細(xì)胞分化、肌肉收縮、膜通道等生物學(xué)功能。NCBI ：美國(guó)國(guó)立生物技術(shù)信息中心（National Center for Biotechnology Information），1988 年設(shè)立，為美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館（NLM）和國(guó)家健康協(xié)會(huì)（NIH）下屬部門之一。提供生物醫(yī)學(xué)領(lǐng)域的信息學(xué)服務(wù)，如世界三大核酸數(shù)據(jù)庫(kù)之一的 GenBank 數(shù)據(jù)庫(kù)，PubMed 醫(yī)學(xué)文獻(xiàn)檢索數(shù)據(jù)庫(kù)等。Conserved sequence ：保守序列。演化過(guò)程中基本上不變的 DNA 中的堿基序列或蛋白質(zhì)中的氨基酸序列。Tan

44、dem repeat sequences：串聯(lián)重復(fù)序列。染色體上同一堿基序列的多拷貝重復(fù)，在物理作圖中用作標(biāo)記物。Sequence tagged site：序列示蹤位點(diǎn)，簡(jiǎn)寫為STS。在人類基因組中只出現(xiàn)一次的位置和序列已知的長(zhǎng)約200到500bp的短DNA序列片斷。由于可以通過(guò)PCR檢測(cè)到，STS在將來(lái)源于許多不同實(shí)驗(yàn)室的基因圖譜和測(cè)序數(shù)據(jù)進(jìn)行定位和定向時(shí)非常有用，并且STS在人類基因組的物理圖譜中也具有界標(biāo)的作用。表達(dá)的序列標(biāo)簽（ESTs）就是那些得自cDNAs的STSs。Gene mapping：基因作圖。對(duì)DNA分子（染色體或質(zhì)粒）中基因的相對(duì)位置和距離進(jìn)行確定的過(guò)程。Physical map ：物理圖譜。不考慮遺傳，DNA 中可識(shí)別的界標(biāo)（如限制性酶切位點(diǎn)和基因等）的位置圖。界標(biāo)之間的距離用堿基對(duì)度量。對(duì)人類基因組而言，最低分辨率的物理圖譜是染色體上的條帶圖譜；最高分辨率的物理圖譜是染色體中完整的核苷酸序列。UniGene ：美國(guó)國(guó)家生物技術(shù)信息中心提供的公用數(shù)據(jù)庫(kù)，該數(shù)據(jù)庫(kù)將 GenBank 中屬于同一條基因的所有片斷

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

生物信息學(xué)名詞解釋71438

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

生物信息學(xué)名詞解釋71438

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔