生物信息學復習題

上傳人：1*** IP屬地：浙江上傳時間：2021-05-19 格式：DOC 頁數(shù)：37 大小：235.50KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩32頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、精品好資料學習推薦名詞解釋1.生物信息學 : 是研究生物信息的采集、處理、存儲、傳播，分析和解釋等各方面的學科，也是隨著生命科學和計算機科學的迅猛發(fā)展，生命科學和計算機科學相結(jié)合形成的一門新學科。2.二級數(shù)據(jù)庫：在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定目標衍生而來，是對生物學知識和信息的進一步的整理。3.FASTA序列格式：是將DNA或者蛋白質(zhì)序列表示為一個帶有一些標記的核苷酸或者氨基酸字符串，大于號（）表示一個新文件的開始，其他無特殊要求。4.genbank序列格式：是GenBank 數(shù)據(jù)庫的基本信息單位，是最為廣泛的生物信息學序列格式之一。該文件格式按域劃分為4個部分：第一部分包含

2、整個記錄的信息（描述符）；第二部分包含注釋；第三部分是引文區(qū)，提供了這個記錄的科學依據(jù)；第四部分是核苷酸序列本身，以“/”結(jié)尾。5.Entrez檢索系統(tǒng)：是NCBI開發(fā)的核心檢索系統(tǒng)，集成了NCBI的各種數(shù)據(jù)庫，具有鏈接的數(shù)據(jù)庫多，使用方便，能夠進行交叉索引等特點。6.BLAST：基本局部比對搜索工具，用于相似性搜索的工具，對需要進行檢索的序列與數(shù)據(jù)庫中的每個序列做相似性比較。P94 7.查詢序列（query sequence）：也稱被檢索序列，用來在數(shù)據(jù)庫中檢索并進行相似性比較的序列。P98 8.打分矩陣（scoring matrix）：在相似性檢索中對序列兩兩比對的質(zhì)量評估方法。包括基于理

3、論（如考慮核酸和氨基酸之間的類似性）和實際進化距離（如PAM）兩類方法。P29 9.空位（gap）：在序列比對時，由于序列長度不同，需要插入一個或幾個位點以取得最佳比對結(jié)果，這樣在其中一序列上產(chǎn)生中斷現(xiàn)象，這些中斷的位點稱為空位。P29 10.空位罰分：空位罰分是為了補償插入和缺失對序列相似性的影響，序列中的空位的引入不代表真正的進化事件，所以要對其進行罰分，空位罰分的多少直接影響對比的結(jié)果。P37 11.E值：衡量序列之間相似性是否顯著的期望值。12.低復雜度區(qū)域：BLAST搜索的過濾選項。指序列中包含的重復度高的區(qū)域，如poly（A）。13.點矩陣（dot matrix）：構(gòu)建一個二維矩陣

4、，其X軸是一條序列，Y軸是另一個序列，然后在2個序列相同堿基的對應(yīng)位置（x，y）加點，如果兩條序列完全相同則會形成一條主對角線，如果兩條序列相似則會出現(xiàn)一條或者幾條直線；如果完全沒有相似性則不能連成直線。14.多序列比對：通過序列的相似性檢索得到許多相似性序列，將這些序列做一個總體的比對，以觀察它們在結(jié)構(gòu)上的異同，來回答大量的生物學問題。15.分子鐘：認為分子進化速率是恒定的或者幾乎恒定的假說，從而可以通過分子進化推斷出物種起源的時間。16.系統(tǒng)發(fā)育分析：通過一組相關(guān)的基因或者蛋白質(zhì)的多序列比對或其他性狀，可以研究推斷不同物種或基因之間的進化關(guān)系。17.進化樹的二歧分叉結(jié)構(gòu)：指在進化樹上任何一

5、個分支節(jié)點，一個父分支都只能被分成兩個子分支。系統(tǒng)發(fā)育圖：用枝長表示進化時間的系統(tǒng)樹稱為系統(tǒng)發(fā)育圖，是引入時間概念的支序圖。18.直系同源：指由于物種形成事件來自一個共同祖先的不同物種中的同源序列，具有相似或不同的功能。（書：在缺乏任何基因復制證據(jù)的情況下，具有共同祖先和相同功能的同源基因。）19.旁系（并系）同源：指同一個物種中具有共同祖先，通過基因重復產(chǎn)生的一組基因，這些基因在功能上可能發(fā)生了改變。(書：由于基因重復事件產(chǎn)生的相似序列。) 20.外類群：是進化樹中處于一組被分析物種之外的，具有相近親緣關(guān)系的物種。21.有根樹：能夠確定所有分析物種的共同祖先的進化樹。22.除權(quán)配對算法（UP

6、GMA）：最初，每個序列歸為一類，然后找到距離最近的兩類將其歸為一類，定義為一個節(jié)點，重復這個過程，直到所有的聚類被加入，最終產(chǎn)生樹根。23.鄰接法（neighbor-joining method）：是一種不僅僅計算兩兩比對距離，還對整個樹的長度進行最小化，從而對樹的拓撲結(jié)構(gòu)進行限制，能夠克服UPGMA算法要求進化速率保持恒定的缺陷。24.最大簡約法（MP）：在一系列能夠解釋序列差異的的進化樹中找到具有最少核酸或氨基酸替換的進化樹。25.最大似然法（ML）：它對每個可能的進化位點分配一個概率，然后綜合所有位點，找到概率最大的進化樹。最大似然法允許采用不同的進化模型對變異進行分析評估，并在此基礎(chǔ)

7、上構(gòu)建系統(tǒng)發(fā)育樹。26.一致樹（consensus tree）：在同一算法中產(chǎn)生多個最優(yōu)樹，合并這些最優(yōu)樹得到的樹即一致樹。27.自舉法檢驗（Bootstrap）：放回式抽樣統(tǒng)計法。通過對數(shù)據(jù)集多次重復取樣，構(gòu)建多個進化樹，用來檢查給定樹的分枝可信度。28.開放閱讀框（ORF）：開放閱讀框是基因序列的一部分，包含一段可以編碼蛋白的堿基序列。29.密碼子偏性（codon bias）：氨基酸的同義密碼子的使用頻率與相應(yīng)的同功tRNA的水平相一致，大多數(shù)高效表達的基因僅使用那些含量高的同功tRNA所對應(yīng)的密碼子，這種效應(yīng)稱為密碼子偏性。30.基因預測的從頭分析：依據(jù)綜合利用基因的特征，如剪接位點，內(nèi)

8、含子與外顯子邊界調(diào)控區(qū)，預測基因組序列中包含的基因。31.結(jié)構(gòu)域（domain）：保守的結(jié)構(gòu)單元，包含獨特的二級結(jié)構(gòu)組合和疏水內(nèi)核，可能單獨存在，也可能與其他結(jié)構(gòu)域組合。相同功能的同源結(jié)構(gòu)域具有序列的相似性。32.超家族：進化上相關(guān)，功能可能不同的一類蛋白質(zhì)。33.模體（motif）：短的保守的多肽段，含有相同模體的蛋白質(zhì)不一定是同源的，一般10-20個殘基。34.序列表譜（profile）：是一種特殊位點或模體序列，在多序列比較的基礎(chǔ)上，氨基酸的權(quán)值和空位罰分的表格。35.PAM矩陣：PAM指可接受突變百分率。一個氨基酸在進化中變成另一種氨基酸的可能性，通過這種可能性可以鑒定蛋白質(zhì)之間的相似

9、性，并產(chǎn)生蛋白質(zhì)之間的比對。一個PAM單位是蛋白質(zhì)序列平均發(fā)生1%的替代量需要的進化時間。36.BLOSUM矩陣：模塊替代矩陣。矩陣中的每個位點的分值來自蛋白比對的局部塊中的替代頻率的觀察。每個矩陣適合特定的進化距離。例如，在BLOSUM62矩陣中，比對的分值來自不超過62%一致率的一組序列。37.PSI-BLAST：位點特異性迭代比對。是一種專門化的的比對，通過調(diào)節(jié)序列打分矩陣（scoring matrix）探測遠緣相關(guān)的蛋白。38.RefSeq：給出了對應(yīng)于基因和蛋白質(zhì)的索引號碼，對應(yīng)于最穩(wěn)定、最被人承認的Genbank序列。39.PDB（Protein Data Bank）：PDB中收錄

10、了大量通過實驗（X射線晶體衍射，核磁共振NMR）測定的生物大分子的三維結(jié)構(gòu)，記錄有原子坐標、配基的化學結(jié)構(gòu)和晶體結(jié)構(gòu)的描述等。PDB數(shù)據(jù)庫的訪問號由一個數(shù)字和三個字母組成（如，4HHB），同時支持關(guān)鍵詞搜索，還可以FASTA程序進行搜索。40.GenPept:是由GenBank中的DNA序列翻譯得到的蛋白質(zhì)序列。數(shù)據(jù)量很大，且隨核酸序列數(shù)據(jù)庫的更新而更新，但它們均是由核酸序列翻譯得到的序列，未經(jīng)試驗證實，也沒有詳細的注釋。41.折疊子（Fold）：在兩個或更多的蛋白質(zhì)中具有相似二級結(jié)構(gòu)的大區(qū)域，這些大區(qū)域具有特定的空間取向。42.TrEMBL：是與SWISS-PROT相關(guān)的一個數(shù)據(jù)庫。包含從E

11、MBL核酸數(shù)據(jù)庫中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質(zhì)序列，并且這些序列尚未集成到SWISS-PROT數(shù)據(jù)庫中。43.MMDB(Molecular Modeling Database)：是（NCBI）所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個部分，數(shù)據(jù)庫的內(nèi)容包括來自于實驗的生物大分子結(jié)構(gòu)數(shù)據(jù)。與PDB相比，對于數(shù)據(jù)庫中的每一個生物大分子結(jié)構(gòu)，MMDB具有許多附加的信息，如分子的生物學功能、產(chǎn)生功能的機制、分子的進化歷史等，還提供生物大分子三維結(jié)構(gòu)模型顯示、結(jié)構(gòu)分析和結(jié)構(gòu)比較工具。44.SCOP數(shù)據(jù)庫：提供關(guān)于已知結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進化關(guān)系的詳細描述，包括蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB中

12、的所有條目。SCOP數(shù)據(jù)庫除了提供蛋白質(zhì)結(jié)構(gòu)和進化關(guān)系信息外，對于每一個蛋白質(zhì)還包括下述信息：到PDB的連接，序列，參考文獻，結(jié)構(gòu)的圖像等。可以按結(jié)構(gòu)和進化關(guān)系對蛋白質(zhì)分類，分類結(jié)果是一個具有層次結(jié)構(gòu)的樹，其主要的層次依次是類（class）、折疊子（fold）、超家族（super family）、家族（family）、單個PDB蛋白結(jié)構(gòu)記錄。45.PROSITE：是蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫，包含具有生物學意義的位點、模式、可幫助識別蛋白質(zhì)家族的統(tǒng)計特征。PROSITE中涉及的序列模式包括酶的催化位點、配體結(jié)合位點、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等；PRO

13、SITE還包括根據(jù)多序列比對而構(gòu)建的序列統(tǒng)計特征，能更敏感地發(fā)現(xiàn)一個序列是否具有相應(yīng)的特征。46.Gene Ontology 協(xié)會：編輯一組動態(tài)的、可控的基因產(chǎn)物不同方面性質(zhì)的字匯的協(xié)會。從3個方面描述基因產(chǎn)物的性質(zhì)，即，分子功能，生物過程，細胞區(qū)室。47.表譜（PSSM）：指一張基于多序列比對的打分表，表示一個蛋白質(zhì)家族，可以用來搜索序列數(shù)據(jù)庫。48.蛋白質(zhì)組p179：是指一個基因組中各個基因編碼產(chǎn)生的蛋白質(zhì)的總體，即一個基因組的全部蛋白產(chǎn)物及其表達情況。49.中心法則是指遺傳信息從DNA傳遞給RNA，再從RNA傳遞給蛋白質(zhì)，即完成遺傳信息的轉(zhuǎn)錄和翻譯的過程。也可以從DNA傳遞給DNA，即完

14、成DNA的復制過程。這是所有有細胞結(jié)構(gòu)的生物所遵循的法則。50.一級數(shù)據(jù)庫：數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù)，只經(jīng)過簡單的歸類整理和注釋51.基因芯片（gene chip），又稱DNA微陣列（microarray），是由大量cDNA或寡核苷酸探針密集排列所形成的探針陣列，其工作的基本原理是通過雜交檢測信息。52.序列比對：為確定兩個或多個序列之間的相似性以至于同源性，而將它們按照一定的規(guī)律排列。53.數(shù)據(jù)庫查詢（database query）：是指對序列、結(jié)構(gòu)以及各種二次數(shù)據(jù)中的注釋信息進行關(guān)鍵詞匹配查找檢索。54.數(shù)據(jù)庫搜索（database search）：在分子生物信息學中有特

15、定含義，它是指通過特定的序列相似性比對算法，找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫中與檢測序列具有一定程度相似性的序列。55.相似性（similarity）：數(shù)學上，相似性指兩個圖形的形狀完全相似。若存在兩個點的集，其中一個能透過放大縮小、平移或旋轉(zhuǎn)等方式變成另一個，就說它們具有相似性。56.同源性：在進化上或個體發(fā)育上的共同來源而呈現(xiàn)的本質(zhì)上的相似性，但其功能不一定相同。57.同一性：是指兩序列在同一位點核苷酸或氨基酸殘基完全相同的序列比例。58.一致序列：在兩個或多個同源序列的每一個位置上多數(shù)出現(xiàn)的核苷酸或氨基酸組成的序列。59.HMM（隱馬爾可夫模型）：是統(tǒng)計模型，它用來描述一個含有隱含未知參數(shù)的

16、馬爾可夫過程。其難點是從可觀察的參數(shù)中確定該過程的隱含參數(shù)。然后利用這些參數(shù)來作進一步的分析，例如模式識別。60.簡約性信息位點：指基于DNA或蛋白質(zhì)序列、利用最大簡約法構(gòu)建系統(tǒng)發(fā)育樹時，在兩個及以上分類單元（的序列）中存在差異，且其中至少有兩種變異類型在該位點出現(xiàn)兩次及以上，此類位點稱為簡約性信息位點。61.信息位點：由位點產(chǎn)生的突變數(shù)目把其中的一課樹與其他樹區(qū)分開的位點。62.非信息位點：對于最大簡約法來說沒有意義的點。63.標度樹：分支長度與相鄰節(jié)點對的差異程度成正比的樹。64.非標度樹：只表示親緣關(guān)系無差異程度信息。65.有根樹：單一的節(jié)點能指派為共同的祖先，從祖先節(jié)點只有唯一的路徑歷

17、經(jīng)進化到達其他任何節(jié)點。66.無根樹：只表明節(jié)點間的關(guān)系，無進化發(fā)生方向的信息，通過引入外群或外部參考種，可以在無根樹中指派根節(jié)點。67.注釋（annotation）對數(shù)據(jù)庫中原始的DNA堿基序列添加相關(guān)信息（比如編碼的基因，氨基酸序列等）或其他的注解。68.基因組注釋(Genome annotation) 是利用生物信息學方法和工具，對基因組所有基因的生物學功能進行高通量注釋，是當前功能基因組學研究的一個熱點。69.虛擬細胞：一種建模手段，把細胞定義為許多結(jié)構(gòu)，分子，反應(yīng)和物質(zhì)流的集合體。70.質(zhì)譜(MS)是一種準確測定真空中離子的分子質(zhì)量/電荷比(m/z)的方法，從而使分子質(zhì)量的準確確定成

18、為可能。71.分子途徑是指一組連續(xù)起作用以達到共同目標的蛋白質(zhì)。72.先導化合物：是指具有一定藥理活性的、可通過結(jié)構(gòu)改造來優(yōu)化其藥理特性而可能導致藥物發(fā)現(xiàn)的特殊化合物。73.權(quán)重矩陣（序列輪廓）：它們表示完全結(jié)構(gòu)域序列，多序列聯(lián)配中每個位點的氨基酸都有分值，并且特定位置插入或缺失的可能性均有一定的衡量方法（課件定義）。74.系統(tǒng)發(fā)育學（phylogenetic）：確定生物體間進化關(guān)系的科學分支。75.系統(tǒng)生物學（systems biology）：是研究一個生物系統(tǒng)中所有組分成分（基因、mRNA、蛋白質(zhì)等）的構(gòu)成以及在特定條件下這些組分間的相互關(guān)系，并分析生物系統(tǒng)在一定時間內(nèi)的動力學過程。76.

19、蛋白質(zhì)組（proteome）：是指一個基因組、一種生物或一個細胞/組織的基因組所表達的全套蛋白質(zhì)。77. ESI電噴霧離子化：一種適合大分子如蛋白質(zhì)離子化沒有明顯降解的質(zhì)譜技術(shù)。78.微陣列芯片：是指采用光導原位合成或微量點樣等方法，將大量生物大分子比如核酸片段、多肽分子甚至組織切片、細胞等生物樣品有序地固化于支持物（如玻片、尼龍膜等載體）的表面，組成密集二維分子排列，然后與已標記的待測生物樣品中靶分子反應(yīng)，通過特定的儀器，比如激光共聚焦掃描儀或電荷偶聯(lián)攝影像機對反應(yīng)信號的強度進行快速、并行、高效地檢測分析，從而判斷樣品中靶分子的數(shù)量。79.有監(jiān)督分析法：這種方法引入某些形式的分類系統(tǒng)，從而將

20、表達模式分配到一個或多個預定義的類目中。80.聚類分析：指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。81.虛擬消化：針對重要疾病特定靶標生物大分子的三維結(jié)構(gòu)或定量構(gòu)效關(guān)系（Quantitative structure-activity relationships，QSAR）模型，從現(xiàn)有小分子數(shù)據(jù)庫中，搜尋與靶標生物大分子結(jié)合或符合QSAR模型的化合物，進行篩選實驗研究。82.無監(jiān)督分析法：這種方法沒有內(nèi)建的分類標準，組的數(shù)目和類型只決定于所使用的算法和數(shù)據(jù)本身的分析方法。83.GenBank：是美國國家生物技術(shù)信息中心(National Center for Biotec

21、hnology Information ，NCBI)建立的DNA序列數(shù)據(jù)庫，從公共資源中獲取序列數(shù)據(jù)，主要是科研人員直接提供或來源于大規(guī)模基因組測序計劃( Benson等， 1998)。84. EMBL：（歐洲分子生物學實驗室）（The European Molecular Biology Laboratory），于1974年由歐洲14個國家加上亞洲的以色列共同發(fā)起建立，包括一個位于德國Heidelberg的核心實驗室，及三個位于德國Hamburg，法國Grenoble及英國Hinxton的研究分部。85.DDBJ：(DNA Data Bank of Japan)，于1984年建立，是世界三大

22、DNA 數(shù)據(jù)庫之一，與NCBI的GenBank，EMBL的EBI數(shù)據(jù)庫共同組成國際DNA數(shù)據(jù)庫，每日都交換更新數(shù)據(jù)和信息，并主持兩個國際年會國際DNA數(shù)據(jù)庫咨詢會議和國際DNA數(shù)據(jù) 庫協(xié)作會議，互相交換信息，因此三個庫的數(shù)據(jù)實際上是相同的。86.BLAST：是英語Bell Labs Layered Space-Time 的縮寫，是一項新的通信技術(shù)，它采用多天線系統(tǒng)利用多徑傳播效應(yīng)以達到提高頻譜利用率的目的。87.BLASTn：是核酸序列到核酸庫中的一種查詢。庫中存在的每條已知序列都將同所查序列作一對一地核酸序列比對。88.BLASTp：是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將

23、逐一地同每條所查序列作一對一的序列比對。88.Clustsl X：是一種利用漸近法（progressive alignment）進行多條序列比對的軟件。即從多條序列中最相似（距離最近）的兩條序列開始比對，按照各個序列在進化樹上的位置，由近及遠的將其它序列依次加入到最終的比對結(jié)果。89. Entrez：是美國國家生物技術(shù)信息中心所提供的在線資源檢索器。該資源將GenBank序列與其原始文獻出處鏈接在一起。 Entrez 是由NCBI主持的一個數(shù)據(jù)庫檢索系統(tǒng)。90.Medline文摘數(shù)據(jù)庫：是美國國立醫(yī)學圖書館(The National Library of Medicine, 簡稱NLM)生產(chǎn)的

24、國際性綜合生物醫(yī)學信息書目數(shù)據(jù)庫，是當前國際上最權(quán)威的生物醫(yī)學文獻數(shù)據(jù)庫。91. SRS(sequence retrieval system)：是歐洲生物信息研究所開發(fā)的SRS（Sequence Retrieval System）是以WWW界面運行的數(shù)據(jù)庫檢索系統(tǒng)，其主要功能是將所有數(shù)據(jù)庫建立參照(cross-references)索引，用戶可通過輸入查詢代碼、編號、物種來源、說明、文獻、作者、日期、關(guān)鍵詞等信息對所有已建立索引的數(shù)據(jù)庫進行檢索，從而得到用戶所需的序列或相關(guān)內(nèi)容。92. SWLSSMODEL：是一個自動化的蛋白質(zhì)比較建模服務(wù)器。93.homology modeling：對于一

25、個未知結(jié)構(gòu)的蛋白質(zhì)，找到一個已知結(jié)構(gòu)的同源蛋白質(zhì)，以該蛋白質(zhì)的結(jié)構(gòu)為模板，為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。94.Ab initio prediction：僅根據(jù)序列本身來預測其結(jié)構(gòu)95. molecular phylogenetic tree：又名分子進化樹，是生物信息學中描述不同生物之間的相關(guān)關(guān)系的方法。通過系統(tǒng)學分類分析可以幫助人們了解所有生物的進化歷史過程。96. gene tree（基因樹）：是指基于單個同源基因差異構(gòu)建的系統(tǒng)發(fā)生樹。96. neighborjoining method：是一種不僅僅計算兩兩比對距離，還對整個樹的長度進行最小化，從而對樹的拓撲結(jié)構(gòu)進行限制，能夠克服UPG

26、MA算法要求進化速率保持恒定的缺陷。97. maximum parsimony method：在一系列能夠解釋序列差異的的進化樹中找到具有最少核酸或氨基酸替換的進化樹。98. MEGA(Molecular Evolutionary Genetics Analysis)：is an integrated tool for automatic and manual sequence alignment, inferring phylogenetic trees, mining web-based databases, estimating rates of molecular evolution,

27、 and testing evolutionary hypotheses.99. BioEdit：是一個序列編輯器與分析工具軟件。功能包括：序列編輯、外掛分析程序、RNA分析、尋找特征序列、支持超過20000個序列的多序列文件、基本序列處理功能、質(zhì)粒圖繪制等等。100. EST：(Expressed Sequence Tag)表達序列標簽是從一個隨機選擇的cDNA 克隆，進行5端和3端單一次測序挑選出來獲得的短的cDNA 部分序列。101. GSS：基因組勘測序列，是基因組DNA克隆的一次性部分測序得到的序列。包括隨機的基因組勘測序列、cosmid/BAC/YAC末端序列、通過Exon tra

28、pped獲得基因組序列、通過Alu PCR獲得的序列、以及轉(zhuǎn)座子標記序列等。102. ORF：是基因序列的一部分，包含一段可以編碼蛋白的堿基序列，不能被終止子打斷。（P86，指從5端開始翻譯起始密碼子到終止密碼子的蛋白質(zhì)編碼堿基序列。）103. promoter（啟動子）：是基因（gene）的一個組成部分，控制基因表達（轉(zhuǎn)錄）的起始時間和表達的程度。104. 3UTR： 3非翻譯區(qū)的縮寫，真核生物的轉(zhuǎn)錄終止信號是在 3非翻譯區(qū)的： polyA。105. CpG island： CpG雙核苷酸在人類基因組中的分布很不均一，而在基因組的某些區(qū)段，CpG保持或高于正常概率。106. coiled

29、coil：卷曲螺旋，是蛋白質(zhì)中由27條螺旋鏈相互纏繞形成類似麻花狀結(jié)構(gòu)的總稱。卷曲螺旋是控制蛋白質(zhì)寡聚化的元件，在機體內(nèi)執(zhí)行著分子識別、代謝調(diào)控、細胞分化、肌肉收縮、膜通道等生物學功能。107. heptad repeat：七肽重復區(qū)是典型的卷曲螺旋結(jié)構(gòu)類型之一，由多個七肽單元連接而成的重復序列。108. structure domain：結(jié)構(gòu)域，是在蛋白質(zhì)三級結(jié)構(gòu)中介于二級和三級結(jié)構(gòu)之間的可以明顯區(qū)分但又相對獨立的折疊單元，每個結(jié)構(gòu)域自身形成緊實的三維結(jié)構(gòu)，可以獨立存在或折疊，但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。109. motif：蛋白質(zhì)序列中較短的保守區(qū)域，通常為按一定的模式排列的氨基

30、酸殘基也稱為指紋（figureprint）。110. linux operating system：linux 操作系統(tǒng)，Linux 是一類 Unix 計算機操作系統(tǒng)的統(tǒng)稱。Linux 操作系統(tǒng)也是自由軟件和開放源代碼發(fā)展中最著名的例子。111. BioPerl： an international association of users & developers of open source Perl tools for bioinformatics, genomics and life science 112. PubMed：是一個免費的生物醫(yī)學文摘數(shù)據(jù)庫，提供部分論文的摘要及指向全文的

31、鏈接。作為 Entrez 資訊檢索系統(tǒng)的一部分。113. HGP(human genome project)：是一項規(guī)模宏大，跨國跨學科的科學探索工程。114. ncRNA：非編碼RNA（Non-coding RNA）是指不編碼蛋白質(zhì)的RNA。115. miRNA：是一類由內(nèi)源基因編碼的長度約為22 個核苷酸的非編碼單鏈RNA 分子，它們在動植物中參與轉(zhuǎn)錄后基因表達調(diào)控。填空題1. 常用的三種序列格式：NBRF/PIR,FASTA和GDE2. 初級序列數(shù)據(jù)庫：GenBank，EMBL和DDBJ3. 蛋白質(zhì)序列數(shù)據(jù)庫：SWISS-PROT和TrEMBL4. 提供蛋白質(zhì)功能注釋信息的數(shù)據(jù)庫：KEG

32、G（京都基因和基因組百科全書）和PIR（蛋白質(zhì)信息資源）5. 目前由NCBI維護的大型文獻資源是PubMed6. 數(shù)據(jù)庫常用的數(shù)據(jù)檢索工具：Entrez，SRS，DBGET7. 常用的序列搜索方法：FASTA和BLAST8. 高分值局部聯(lián)配的BLAST參數(shù)是HSPs（高分值片段對），E（期望值）9. 多序列聯(lián)配的常用軟件：Clustal10. 蛋白質(zhì)結(jié)構(gòu)域家族的數(shù)據(jù)庫有：Pfam，SMART11. 系統(tǒng)發(fā)育學的研究方法有：表現(xiàn)型分類法，遺傳分類法和進化分類法12. 系統(tǒng)發(fā)育樹的構(gòu)建方法：距離矩陣法，最大簡約法和最大似然法13. 常用系統(tǒng)發(fā)育分析軟件：PHYLIP14. 檢測系統(tǒng)發(fā)育樹可靠性的

33、技術(shù)：bootstrapping和Jack-knifing15. 原核生物和真核生物基因組中的注釋所涉及的問題是不同的16. 檢測原核生物ORF的程序：NCBI ORF finder17. 測試基因預測程序正確預測基因的能力的項目是GASP（基因預測評估項目）18. 二級結(jié)構(gòu)的三種狀態(tài)：螺旋，折疊和轉(zhuǎn)角19. 用于蛋白質(zhì)二級結(jié)構(gòu)預測的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò)，包括輸入層，隱含層和輸出層20. 通過比較建模預測蛋白質(zhì)結(jié)構(gòu)的軟件有SWISS-PDBVIEWER（SWISSMODEL網(wǎng)站）21. 蛋白質(zhì)質(zhì)譜數(shù)據(jù)搜索工具：SEQUEST22. 分子途徑最廣泛數(shù)據(jù)庫：KEGG23. 聚類分析方法

34、，分為有監(jiān)督學習方法，無監(jiān)督學習方法24.識別基因主要有兩個途徑即基因組DNA外顯子識別和基于EST策略的基因鑒定。25.表達序列標簽是從 mRNA 中生成的一些很短的序列（300-500bp），它們代表在特定組織或發(fā)育階段表達的基因。26.序列比對的基本思想，是找出檢測基因和目標序列的相似性，就是通過在序列中插入空位的方法使所比較的序列長度達到一致。比對的數(shù)學模型大體分為兩類，分別是整體比對和局部比對。27.2-DE的基本原理是根據(jù)蛋白質(zhì) 等電點和分子量不同，進行兩次電泳將之分離。第一向是等電聚焦分離 ,第二向是 SDS-PAGE分離。 28.蛋白質(zhì)組研究的三大關(guān)

35、鍵核心技術(shù)是雙向凝膠電泳技術(shù) 、質(zhì)譜鑒定技術(shù) 、計算機圖像數(shù)據(jù)處理與蛋白質(zhì)數(shù)據(jù)庫。判斷題1、生物體的結(jié)構(gòu)和功能越復雜的種類就越多，所需要的基因也越多，C值越大，這是真核生物基因組的特點之一。（對）2、CDS一定就是ORF。（對）3、兩者之間有沒有共同的祖先，可以通過序列的同源性來確定，如果兩個基因或蛋白質(zhì)有著幾乎一樣的序列，那么它們高度同源,就具有共同的祖先。（錯）4、STS，是一段200-300bp的特定DNA序列，它的序列已知，并且在基因組中屬于單拷貝。（對）5、非編碼DNA是“垃圾DNA”，不具有任何的分析價值，對于細胞沒有多大的作用。（錯）6、基因樹和物種樹同屬于系統(tǒng)樹，它們之

36、間可以等同。（錯）7、基因的編碼序列在DNA分子上是被不編碼的序列隔開而不連續(xù)排列的。(對）8、對任意一個DNA序列，在不知道哪一個堿基代表CDS的起始時，可用6框翻譯法，獲得6個潛在的蛋白質(zhì)序列。（對）9、一個機體只有一個確定的基因組，但基因組內(nèi)各個基因表達的條件和表達的程度隨時間、空間和環(huán)境條件而不同。（對）10、外顯子和內(nèi)含子之間沒有絕對的區(qū)分，一個基因的內(nèi)含子可以是另一個基因的外顯子，同一個基因在不同的生理狀況或生長發(fā)育的不同階段，外顯子組成也可以不同。（對）11、比較是科學研究中最常見的方法，在生物信息學研究中，比對是最常用和最經(jīng)典的研究方法。（對）12、ORF一定就是CDS。（錯

37、）13、用不同的方法可以構(gòu)建不同的系統(tǒng)發(fā)育樹,為保證分析結(jié)果的可靠性,需要對進化樹進行評估。（對）14、相似性是一種很直接的數(shù)量關(guān)系，無需實驗驗證。（錯）15、基因樹和物種樹同屬于系統(tǒng)樹，它們之間可以等同。（錯）16、蛋白質(zhì)和DNA的同源性常常通過它們序列的相似性來判定，如果兩個基因或蛋白質(zhì)有著幾乎一樣的序列，具有高度的相似性，那么它們一定是同源。（錯）17、所謂局部比對是找出兩個被比較序列的最類似片段。（對）不定項選擇題1、（ ABC ）是現(xiàn)在國際上最主要的三大核酸序列數(shù)據(jù)庫A. EMBL B. DDBJ C. GenBank D. NCBI E. EBI2、RFLP是DNA多態(tài)性中最多見的

38、一種，它產(chǎn)生的機制包括（ ABE ）A.DNA分子產(chǎn)生突變，使某些酶切位點數(shù)增加B. DNA分子產(chǎn)生突變，使某些酶切位點數(shù)減少C. 限制性酶切位點之間重復序列數(shù)目變異D. 限制性酶星活性E. 限制性酶切位點前后的DNA片斷發(fā)生插入或刪除3、下面序列哪些為反向重復序列 ( BD )A. GCACTTGGCACTTG B. GCACTTGCAAGTGC CGTGAACCGTGAAC CGTGAACGTTCACGC. GCACTTGCAAGTGC D. GCACTAGCTAGCGGCGTGAACGTTCACG CGTGATCGATCGCC4、分析EST序列時首要注意以下幾點（ ACDE ）A.EST

39、序列中除了AGTC外，可能出現(xiàn)未知堿基B.EST只是單次測序，得出的結(jié)果沒有可信度C.EST序列中可能出現(xiàn)錯誤的插入和缺失，導致讀碼框移位D.某個EST序列是數(shù)據(jù)庫中另一序列的一個片段E.某個EST序列不在基因的編碼區(qū)內(nèi)5、人類基因組計劃要完成的幾張圖譜分別是（ABCE ）A. 物理圖譜 B. 遺傳圖譜 C. 序列圖譜 D. 生物圖譜 E. 基因圖譜6、最常用的序列相似性查詢工具是（ AB ）A.FASTA B.BLAST C.SWISS-PROT D.PDB E.PIR7、下列哪些分子類型屬于非蛋白質(zhì)編碼區(qū)（ABCDE ）A.內(nèi)含子 B.衛(wèi)星DNA C.偽基因 D.啟動子 E.增強子8、衛(wèi)星

40、DNA的多態(tài)性是由（ D ）所決定的。A. DNA點突變個數(shù)B. 限制性內(nèi)切酶識別序列個數(shù)不同C. DNA的二級結(jié)構(gòu)不同D. 重復單位不同E重復次數(shù)不同9、真核基因組特點包括（ ABCDE ）A. 基因組大，巨大的非編碼序列，重復序列占了絕大部分B. 基因結(jié)構(gòu)復雜，無顯著長度的開放閱讀框C. 存在可變剪接 D. CpG島 E. 等值區(qū)10、20世紀三大著名計劃包括（ ACE ）A.阿波羅登月計劃 B.衛(wèi)星計劃 C.HGP D.腫瘤計劃 E.曼哈頓原子彈計劃簡答題1.BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么？答：blastn是將給定

41、的核酸序列與核酸數(shù)據(jù)庫中的序列進行比較；Blastp是使用蛋白質(zhì)序列與蛋白質(zhì)數(shù)據(jù)庫中的序列進行比較，可以尋找較遠的關(guān)系；Blastx將給定的核酸序列按照六種閱讀框架將其翻譯成蛋白質(zhì)與蛋白質(zhì)數(shù)據(jù)庫中的序列進行比對，對分析新序列和EST很有用；Tblastn將給定的氨基酸序列與核酸數(shù)據(jù)庫中的序列（雙鏈）按不同的閱讀框進行比對，對于尋找數(shù)據(jù)庫中序列沒有標注的新編碼區(qū)很有用；Tblastx只在特殊情況下使用，它將DNA被檢索的序列和核酸序列數(shù)據(jù)庫中的序列按不同的閱讀框全部翻譯成蛋白質(zhì)序列，然后進行蛋白質(zhì)序列比對。P972. 序列的相似性與同源性有什么區(qū)別與聯(lián)系？答：相似性是指序列之間相關(guān)的一種量度，兩

42、序列的的相似性可以基于序列的一致性的百分比；而同源性是指序列所代表的物種具有共同的祖先，強調(diào)進化上的親緣關(guān)系。P1473. 美國國家生物技術(shù)信息中心（NCBI）的主要工作是什么？請列舉3個以上Entrez系統(tǒng)可以檢索的數(shù)據(jù)庫。（NCBI維護的數(shù)據(jù)庫）NCBI的主要工作是在分子水平上應(yīng)用數(shù)學和計算機科學的方法研究基礎(chǔ)生物，醫(yī)學問題。為科學界開發(fā)，維護和分享一系列的生物信息數(shù)據(jù)庫；開發(fā)和促進生物信息學數(shù)據(jù)庫，數(shù)據(jù)的儲存，交換以及生物學命名規(guī)則的標準化。維護的主要數(shù)據(jù)庫包括答：PubMed、核酸序列數(shù)據(jù)庫GenBank、PROW、三維蛋白質(zhì)結(jié)構(gòu)分子模型數(shù)據(jù)庫MMDB。4.簡述BLAST搜索的算法思想

43、。答：BLAST是一種局部最優(yōu)比對搜索算法，將所查詢的序列打斷成許多小序列片段，然后小序列逐步與數(shù)據(jù)庫中的序列進行比對，這些小片段被叫做字”word”；當一定長度的的字（W）與檢索序列的比對達到一個指定的最低分（T）后，初始比對就結(jié)束了；一個序列的匹配度由各部分匹配分數(shù)的總和決定，獲得高分的序列叫做高分匹配片段（HSP），程序?qū)⒆詈玫腍SP雙向擴展進行比對，直到序列結(jié)束或者不再具有生物學顯著性，最后所得到的序列是那些在整體上具有最高分的序列，即，最高分匹配片段（MSP），這樣，BLAST既保持了整體的運算速度，也維持了比對的精度。P955. 什么是物種的標記序列？答：指物種特有的一段核苷酸序

44、列?？梢酝ㄟ^相似性查詢，得到某一序列在數(shù)據(jù)庫中的某一物種中反復出現(xiàn)，且在其他物種中沒有的明顯相似的序列。6.什么是多序列比對的累進算法？（三個步驟）答：第一，所有的序列之間逐一比對（雙重比對）；第二，生成一個系統(tǒng)樹圖，將序列按相似性大致分組；第三，使用系統(tǒng)樹圖作為引導，產(chǎn)生出最終的多序列比對結(jié)果。P527.簡述構(gòu)建進化樹的步驟，每一步列舉1-2種使用的軟件或統(tǒng)計學方法。答：（1）多序列比對：Clustal W （2）校對比對結(jié)果：BIOEDIT（3）建樹：MEGA（4）評估系統(tǒng)發(fā)育信號和進化樹的牢固度：自舉法（Bootstrap）8. 簡述除權(quán)配對法（UPGMA）的算法思想。答：通過兩兩比對聚

45、類的方法進行，在開始時，每個序列分為一類，分別作為一個樹枝的生長點，然后將最近的兩序列合并，從而定義出一個節(jié)點，將這個過程不斷的重復，直到所有的序列都被加入，最后得到一棵進化樹。9.簡述鄰接法（NJ）構(gòu)樹的算法思想。答：鄰接法的思想不僅僅計算最小兩兩比對距離，還對整個樹的長度進行最小化，從而對樹的拓撲結(jié)構(gòu)進行限制。這種算法由一棵星狀樹開始，所有的物種都從一個中心節(jié)點出發(fā)，然后通過計算最小分支長度的和相繼尋找到近鄰的兩個序列，每一輪過程中考慮所有可能的序列對，把能使樹的整個分支長度最小的序列對一組，從而產(chǎn)生新的距離矩陣，直到尋找所有的近鄰序列。P11710. 簡述最大簡約法（MP）的算法思想。P

46、68答：是一種基于離散特征的進化樹算法。生物演化應(yīng)該遵循簡約性原則，所需變異次數(shù)最少（演化步數(shù)最少）的演化樹可能為最符合自然情況的系統(tǒng)樹。在具體的操作中，分為非加權(quán)最大簡約分析（或稱為同等加權(quán)）和加權(quán)最大簡約分析，后者是根據(jù)性狀本身的演化規(guī)律（比如DNA不同位點進化速率不同）而對其進行不同的加權(quán)處理。P12011.簡述最大似然法（ML）的算法思想。P69答：是一種基于離散特征的進化樹算法。該法首先選擇一個合適的進化模型，然后對所有可能的進化樹進行評估，通過對每個進化位點的替代分配一個概率，最后找出概率最大的進化樹。P12212.UPGMA構(gòu)樹法不精確的原因是什么？P69答：由個于UPGMA假設(shè)

47、在進化過程中所有核苷酸/氨基酸都有相同的變異率，也就是存在著一個分子鐘；這種算法當所構(gòu)建的進化樹的序列進化速率明顯不一致時，得到的進化樹相對來說不準確的。13.在MEGA2軟件中，提供了哪些堿基替換距離模型，試列舉其中3種，解釋其含義。答：堿基替換模型包括，No.of differences 、p-distance、Jukes-Cantor distance、T ajima-Nei distance、Kimur 2-parameter distance、Tamura 3-parameter distance、Tamura-Nei distancep-distance：表示有差異的核苷酸位點在

48、序列中所占比例，將有差異的核苷酸位點數(shù)除已經(jīng)比對的總位點數(shù)就可以得到Jukes-Cantor：模型假設(shè) A T C G 的替換速率是一致的，然后給出兩個序列核苷酸替換數(shù)的最大似然估計Kimura 2-parameter：模型考慮到了轉(zhuǎn)換很顛換隊多重擊中的影響，但假設(shè)整個序列中4鐘核苷酸的頻率是相同哈德在不同位點上的堿基替換頻率是相同的。14.試述DNA序列分析的流程及代表性分析工具。（1）尋找重復元件：RepeatMasker（2）同源性檢索確定是否存在已知基因：BLASTn（3）從頭開始方法預測基因：Genscan（4）分析各種調(diào)控序列：TRES/DRAGON PROMOTOR FINDER

49、(5) CpG島：CpGPlot 代表性工具：ORF Finder、BLASTn、tBLASTx、BLASTx、Gene Wise15.如何用BLAST發(fā)現(xiàn)新基因？；答：從一個一直蛋白質(zhì)序列開始，通過tBLASTn工具搜索一個DNA數(shù)據(jù)庫，可以找到相應(yīng)的匹配，如與DNA編碼的已知蛋白質(zhì)的匹配或者與DNA編碼的相關(guān)蛋白質(zhì)的匹配。然后通過BLASTx或BLASTp在蛋白質(zhì)數(shù)據(jù)庫中搜索DNA或蛋白質(zhì)序列來“確定”一個新基因。16.試述SCOP蛋白質(zhì)分類方案；答：SCOP將PDB數(shù)據(jù)庫中的蛋白質(zhì)按傳統(tǒng)分類方法分成型、型、/型、+型，并將多結(jié)構(gòu)域蛋白、膜蛋白和細胞表面蛋白、N蛋白單獨分類，一共分成7種類

50、型，并在此基礎(chǔ)上，按折疊類型、超家族、家族三個層次逐級分類。對于具有不同種屬來源的同源蛋白家族，SCOP數(shù)據(jù)庫按照種屬名稱將它們分成若干子類，一直到蛋白質(zhì)分子的亞基。17.試述SWISS-PROT中的數(shù)據(jù)來源。答：（1）從核酸數(shù)據(jù)庫經(jīng)過翻譯推導而來；（2）從蛋白質(zhì)數(shù)據(jù)庫PIR挑選出合適的數(shù)據(jù)；（3）從科學文獻中摘錄；（4）研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù)。18.TrEMBL哪兩個部分？答：（1）SP-TrEMBL(SWISS-PROT TrEMBL)：包含最終將要集成到SWISS-PROT的數(shù)據(jù)，所有的SP-TrEMBL序列都已被賦予SWISS-PROT的登錄號。（2）REM-TrEMBL(R

51、EMaining TrEMBL)：包括所有不準備放入SWISS-PROT的數(shù)據(jù)，因此這部分數(shù)據(jù)都沒有登錄號。19.試述PSI-BLAST 搜索的5個步驟。答：1 選擇待查序列（query）和蛋白質(zhì)數(shù)據(jù)庫；2 PSI-BLAST 構(gòu)建一個多序列比對，然后創(chuàng)建一個序列表譜（profile）又稱特定位置打分矩陣（PSSM）；3 PSSM被用作 query搜索數(shù)據(jù)庫4 PSI-BLAST 估計統(tǒng)計學意義 (E values)5 重復 3 和 4 , 直到?jīng)]有新的序列發(fā)現(xiàn)。20.生物信息學數(shù)據(jù)庫的組成包括哪些部分？數(shù)據(jù)庫有哪些類型？答案：生物信息學數(shù)據(jù)庫的組成包括一級數(shù)據(jù)庫和二級數(shù)據(jù)庫。數(shù)據(jù)庫的類型包

52、括核算和蛋白質(zhì)一級結(jié)構(gòu)序列數(shù)據(jù)庫、基因組數(shù)據(jù)庫、生物大分子三維空間結(jié)構(gòu)數(shù)據(jù)庫、以上述3類數(shù)據(jù)庫和文獻資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫。21. 簡要介紹 GenBank中的DNA序列格式。答案：GenBank中的DNA序列格式可以分成三個部分，第一部分為描述符，從第一行LOCUS行到ORIGIN行，包含了關(guān)于整個記錄的信息；第二部分為特性表，從FEATURES行開始，包含了注釋這一紀錄的特性，是條目的核心，中間使用一批關(guān)鍵字；第三部分是核苷酸序列的本身。22. 生物信息學的目標和任務(wù)？答案：收集和管理生物分子數(shù)據(jù)；數(shù)據(jù)分析和挖掘；開發(fā)分析工具和實用軟件：生物分子序列比較工具、基因識別工具、生物分子結(jié)構(gòu)

53、預測工具、基因表達數(shù)據(jù)分析工具。23.生物信息學主要研究內(nèi)容。答案（1）生物分子數(shù)據(jù)的收集與管理；（2）數(shù)據(jù)庫搜索及序列比較；（3）基因組序列分析；（4）基因表達數(shù)據(jù)的分析與處理；（5）蛋白質(zhì)結(jié)構(gòu)預測。24. 為什么要構(gòu)建生物分子數(shù)據(jù)庫。答案：（1）生物分子數(shù)據(jù)高速增長（2）分子生物學及相關(guān)領(lǐng)域研究人員迅速獲得最新實驗數(shù)據(jù)。25.預測基因的一般步驟是什么？答案：獲取DNA目標序列查找ORF并將目標序列翻譯成蛋白質(zhì)序列，利用相應(yīng)工具查找ORF并將DNA序列翻譯成蛋白質(zhì)序列在數(shù)據(jù)庫中進行序列搜索，利用BLAST進行ORF核苷酸序列和ORF翻譯的蛋白質(zhì)序列搜索進行目標序列與搜索得到的相似序列的

54、全局對比查找基因家族進行多序列比對，獲得比對區(qū)段的基因家族信息查找目標序列中的特定模序，分別在Prosite、BLOCK、Motif數(shù)據(jù)庫中進行profile、模塊（block）、模序（motif）檢索預測目標序列蛋白質(zhì)結(jié)構(gòu)，利用PredictProtein（EMBL）、NNPREDICT等預測目標序列的蛋白質(zhì)二級結(jié)構(gòu)。26.生物信息學所用的方法和技術(shù)。答案（1）數(shù)學統(tǒng)計方法；（2）動態(tài)規(guī)劃方法；（3）機器學習與模式識別技術(shù) ；（4）數(shù)據(jù)庫技術(shù)及數(shù)據(jù)挖掘；（5）人工神經(jīng)網(wǎng)絡(luò)技術(shù)；（6）專家系統(tǒng) ；（7）分子模型化技術(shù)；（8）量子力學和分子力學計算；（9）生物分子的計算機模擬；（10）因特

55、網(wǎng)（Internet）技術(shù)。27. 國際上權(quán)威的核酸序列數(shù)據(jù)庫有那些？答案（1）歐洲分子生物學實驗室的EMBL 。（2）美國生物技術(shù)信息中心的GenBank。（3）日本遺傳研究所的DDBJ。28. 生物信息學在基因芯片中的應(yīng)用有哪些？答案：（1）確定芯片檢測目標。（2）芯片設(shè)計。（3）實驗數(shù)據(jù)管理與分析。29.生物信息學分析的數(shù)據(jù)對象主要有哪幾種？這些數(shù)據(jù)之間存在著什么關(guān)系？答案：其研究重點主要落實在核酸和蛋白質(zhì)兩個方面，包括它們的序列、結(jié)構(gòu)和功能。生物信息學以基因組DNA序列信息分析作為出發(fā)點，破譯遺傳語言，認識遺傳信息的組織規(guī)律，辨別隱藏在DNA序列中的基因，掌握基因調(diào)控信息，對蛋白質(zhì)空間

56、結(jié)構(gòu)進行模擬和預測，依據(jù)蛋白質(zhì)結(jié)構(gòu)和功能的關(guān)系進行藥物分子設(shè)計。30.基因芯片對于生物分子信息檢測的作用和意義？答案：在生命科學領(lǐng)域中，基因芯片為分子生物學、生物醫(yī)學等研究提供了強有力的手段。利用基因芯片技術(shù)，可研究生命體系中不同部位、不同生長發(fā)育階段的基因表達，比較不同個體或物種之間的基因表達，比較正常和疾病狀態(tài)下基因及其表達的差異?；蛐酒夹g(shù)也有助于研究不同層次的多基因協(xié)同作用的生命過程，發(fā)現(xiàn)新的基因功能，研究生物體在進化、發(fā)育、遺傳過程中的規(guī)律。31.基因組序列分析方面，科學家關(guān)注哪些信息？答案：就人類基因組而言，編碼區(qū)域在人類基因組所占的比例不超過3%。其余97%是非編碼序列。對于非

57、編碼序列，人們了解得比較少，尚不清楚其含義或功能。然而，非編碼區(qū)域?qū)τ谏顒泳哂兄匾囊饬x。這部分序列主要包括內(nèi)含子、簡單重復序列、移動元件（mobile element）及其遺留物、偽基因（pseudo gene）等。32.為什么要進行序列片段組裝？在進行序列片段組裝時會遇到哪些問題？答案：大規(guī)?；蚪M測序得到待測序列的一系列序列片段，這些序列片段覆蓋待測序列，序列片段之間也存在著相互覆蓋或者重疊。遇到的問題：堿基標識錯誤；不知道片段的方向；存在重復區(qū)域；缺少覆蓋。33.序列分析的任務(wù)和目的分別是什么？答案：任務(wù)（1）發(fā)現(xiàn)序列之間的相似性；（2）辨別序列之間的差異。目的：（1）相似序列：相似的結(jié)構(gòu)，相似的功能（2）判別序列之間的同源性（3）推測序列之間的進化關(guān)系34.P CR引物設(shè)計有哪些原則？答案：產(chǎn)物不能形成二級結(jié)構(gòu)；引物長度一般在1530個堿基之間；G+C含量在4060之間；堿基

人人文庫> 全部分類> 應(yīng)用文書 > 合同范本

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

生物信息學復習題

文檔簡介

溫馨提示

最新文檔

評論

生物信息學復習題

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔