南京工業(yè)大學生物信息學期末考試_第1頁
南京工業(yè)大學生物信息學期末考試_第2頁
南京工業(yè)大學生物信息學期末考試_第3頁
南京工業(yè)大學生物信息學期末考試_第4頁
南京工業(yè)大學生物信息學期末考試_第5頁
免費預覽已結束,剩余3頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring生工類1301-3生物信息學考試說明時間:第17周周五(6月17日)上午3-4節(jié)地點:厚學201題型:(開卷)名詞解釋5題20分,單項選擇題10題20分,綜合分析題4題60分。重點:可參考以下課后題2.2 何為一級數(shù)據(jù)庫?有哪些一級數(shù)據(jù)庫?一級數(shù)據(jù)庫屬于檔案數(shù)據(jù)庫,庫中的主要內容是來源于實驗室操作所得到的原始數(shù)據(jù)結果;一級數(shù)據(jù)庫:核酸序列數(shù)據(jù)庫GenBank、EMBL、DDBJ及蛋白質數(shù)據(jù)庫PDB(proteindataba

2、nk)。2.3 二級數(shù)據(jù)庫、三級數(shù)據(jù)庫等是指什么樣的數(shù)據(jù)庫?二級數(shù)據(jù)庫是在一級數(shù)據(jù)庫的信息基礎上進行了計算加工處理并增加了許多人為的注釋而構成的。例如,NCBI的RefSeq數(shù)據(jù)庫,其mRNA序列式綜合了GenBank中來源于同一物種相同基因的所有Mrna序列信息的一致性序列;而公共數(shù)據(jù)庫中大多數(shù)的蛋白質序列是將核昔酸序列中的編碼序列區(qū)域進行蛋白質翻譯后,通過后續(xù)的一些計算分析,主觀的人為地為序列加上蛋白質產物名稱及功能注釋。三級數(shù)據(jù)庫:參考書本P16頁2.6 請查閱資料,了解序列信息的標準數(shù)據(jù)存放格式:FASTA、NBRF/PIR、GDE和Raw。書10頁到11頁2.8 GenBank數(shù)據(jù)庫

3、中的GenBank條目包含哪些內容?請結合GenBank中的一條具體的序列信息加以說明。書17頁到19頁2.12 蛋白質序列數(shù)據(jù)庫有哪些?書22頁2.13 Uniprot數(shù)據(jù)庫分哪幾個層次?書22頁,分為三個層次。一是UniprotKnowledgebase(UniprotKB)它涵蓋大量人工注釋的蛋白質信息,包括功能、分類以及數(shù)據(jù)庫的交叉引用等;二是UniprotArchive(Uniparc)力圖收集最完整、最全面的蛋白質序列數(shù)據(jù),不過數(shù)據(jù)沒有加以注釋整理,只給出了相關序列的來源;三是UniprotReferenceClusters(UniRef),是將UniParc中的序列數(shù)據(jù)依據(jù)不同的

4、參數(shù)條件去除冗余后得到的結果。2.14 UniProtKB/SwissProt和UniProtKB/TrEMBL有何關聯(lián)?書23頁SwissProt提供了最全面和可靠的注釋信息,被稱為是蛋白質序列數(shù)據(jù)的“黃金標NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring準";TrEMBL是為了在不降低SwissProt高水平注釋質量的同時,又能使經由測序和翻譯獲取的蛋白質序列數(shù)據(jù)得以盡快地發(fā)布,作為SwissProt數(shù)據(jù)庫的補充。3.1 序列比對在什么情況下選擇核甘酸序列?

5、在什么情況選擇蛋白質序列?書51頁核甘酸序列:在確認給定DNA序列和DNA數(shù)據(jù)庫中的序列的一致性時。在搜索多態(tài)性時。在分析所克隆的cDNA片段的一致性時。蛋白質序列:由于蛋白質序列比DNA所含信息多,所以除以上情況外用蛋白質序列。3.2 請比較同源性、相似性和一致性三個概念。書51頁到53頁同源性:是指從某個共同祖先經趨異進化而形成的不同序列,也就是從一些數(shù)據(jù)中推斷出的兩個基因在進化上具有共同祖先的結論,是質的判斷。一致性:是指兩序列在同一位點核甘酸或氨基酸殘基完全相同的序列比例。相似性:兩序列間直接的數(shù)量關系,如部分相同,相似的百分比或其他一些合適的度量。3.4在進化過程中,兩條同源蛋白質序

6、列之間會產生分歧的突變有哪些?書P54替換、插入、刪除替換:發(fā)生于一個突變導致的一種氨基酸的密碼子變成另一種氨基酸的密碼子時,在比對結果中顯示為同一位置上出現(xiàn)兩個不同的氨基酸。插入和刪除:發(fā)生于殘基添加或消除時,比對中由一單點表示(.),加在一條或另一條序列中。插入和刪除(即使只有一個字符長度)都被認為是比對中的空位3.13查閱資料了解BLAST比對程序家族的主要程序,如何選擇?程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)陳中的序列畀Blastp蛋白質蛋白質蛋臼質序列搜索逐一蛋白質數(shù)據(jù)庫中的序列。Blastx核酸蛋白質核酸序列6框翻譯成蛋白質序列后和蛋白質數(shù)據(jù)庫中的

7、序列逐一搜索.Tblastn蛋白質核酸蛋白攝序列和核酸數(shù)據(jù)庠中的極酸序列6框期譯后的宙白質序列逐一比對TBIastx核酸核酸核酸序列6框胡譯版蛋白質序列.再和核酸數(shù)據(jù)庫中的核酸序列6挺翅譯成的蛋白質序列逐一進行比對“NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcchncilcyandPharinac-cuticalEngineering3.15 如何尋找遠緣相關的蛋白質?PSI-BLAST是位點特異性迭代BLAST,用來尋找遠緣相關的蛋白質序列,對于蛋白質的相似序列的尋找比常規(guī)blastp更敏感。PSI-BLAST工具的比對步驟為:(1)用blast

8、p在目標數(shù)據(jù)庫中進行比對搜索;(2)從第一步中獲得的結果構建多序列對比,根據(jù)多序列比對構建一個位點特異性矩陣PSSM;(3)用第二步獲得的PSSM矩陣再一次搜索目標數(shù)據(jù)庫;(4)位點特異性反復比對后用缺失比對的參數(shù)檢驗每個匹配的統(tǒng)計顯著性;反復執(zhí)行24步,一般要重復5次,而當新的結果不再出現(xiàn)或者程序明確指出不會再有新的結果出現(xiàn)時,可以停止比對循環(huán)。3.16 如何利用BLAST來發(fā)現(xiàn)新基因?(1)用一個已知序列蛋白質開始TBLAST比對,搜索一個DNA數(shù)據(jù)庫;(2)檢查結果:尋找與已知蛋白質,相關蛋白質的DNA序列匹配,非顯著序列的匹配;(3)進行BLASTXNR或BLASTPNR比對(4)用你

9、新發(fā)現(xiàn)的DNA或蛋白質搜索一個蛋白質數(shù)據(jù)庫來證實是否真的發(fā)現(xiàn)一個新的基因或蛋白質。4.3什么是外顯子?什么是內含子?外顯子:是真核生物基因的一部分,他在剪接后仍會被保存下來,并可在蛋白質生物合成過程中被表達為蛋白質。內含子:是一個基因中非編碼DNA片段,他分開相鄰的外顯子。內含子是阻斷基因線性表達的序列。NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring4.6 基因預測方法有哪些?書本P107基于表達數(shù)據(jù)的基因預測、基于機器學習方法的基因預測基于表達數(shù)據(jù)的基因預測方法主要是

10、利用基因產物(包括cDNA、EST以及蛋白質等)反推基因結構?;跈C器學習方法的基因預測主要是通過挖掘基因組序列以及各類證據(jù)以及各類證據(jù)數(shù)據(jù)信息中蘊含的基因結構特征,并建立數(shù)據(jù)模型進行基因結構預測。4.7 什么是EST序列?如何利用EST序列預測基因?EST:完整mRNA轉錄物的片段。把來自不同克隆的EST拼接起來形成完整的cDNA彌補其數(shù)量缺少的情況利用PASA程序軟件將聚類的轉錄物片段(全長cDNA和EST)拼接成最大對比片段得到完整地或者部分的基因結構,并獲得更多的可變剪切的信息5.3 什么是系統(tǒng)發(fā)生樹?在研究生物進化和系統(tǒng)分類中,常用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣

11、關系,這種樹狀分支的圖形稱為系統(tǒng)發(fā)生樹。5.5 構建系統(tǒng)發(fā)生樹有哪兩類方法?P131一類是基于距離的方法,也直接稱為基于距離法另一類是基可二字母特征的方法5.8 分子系統(tǒng)發(fā)生分析常用的軟件有哪些?PHYLIP。(2)PAUP。(3)MEGA。(4)TREE-PUZZLE。(5)MrBayes。(6)PhyML。6.1 提供了蛋白質結構的檢索和查詢服務的數(shù)據(jù)庫主要有哪些?PDB數(shù)據(jù)庫、DSSP數(shù)據(jù)庫、HSSP數(shù)據(jù)庫SCOPCATH6.2 簡要說明四個層次的蛋白質結構。(一)一級結構蛋白質的一級結構(primarystructure)是指多肽鏈的氨基酸殘基的排列順序。(二)二級結構蛋白質二級結構(

12、secondarystructure)是指多肽鏈主鏈原子借助于氫鍵沿一維方向排列成具有周期性的結構構象,是多肽鏈局部的空間結構(構象)主要有“螺旋、浙疊、3轉角、無規(guī)卷曲等形式(三)超二級結構、結構域超二級結構(supersecondarystructure)是指相鄰的二級結構單元組合在一起,彼此相互作用,排列形成規(guī)則的、在空間結構上能夠辨認的二級結構組合體,同時充當三級結構的構件,基本形式有aa>333a等。NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring(四)三

13、級結構三級結構(tertiarystructure)是指整條多肽鏈的三維結構,包括骨架和側鏈在內的所有原子的空間排列。(五)四級結構e四級結構(quatrnarystructure)指在亞基和亞基之間通過疏水作用等次級鍵結合成為有序排列的特定的空間結構。6.4 PDB收錄了哪些實驗類型的結構數(shù)據(jù)?X射線晶圖譜法,核磁共振法,電子顯微鏡二維晶體三維結構6.6 蛋白質結構家族分類數(shù)據(jù)庫主要有哪些?SCOP,CATH,FFSP6.8 蛋白質結構分析主要包含哪些方面?組織層次、結構測定及預測,蛋白質折疊6.9 如何進行蛋白質結構比對?有那些常用的結構比對工具?首先對兩個蛋白質結構定義結構相似部分(或稱

14、共同子結構);然后通過多次迭代策略來調整共同子結構,直到找出優(yōu)化的結構比對,即找到兩個蛋白質空間上最大的重疊部分。DALI方法、CE方法、STRUCTURAL方法、SSM方法、TM-align方法6.13 同源建模方法預測蛋白質結構的基本步驟有哪些?1、模板的選擇2、待測序列與模板序列的比對3、同源模型的建立4、同源模型精修和評估7.2常用的蛋白質序列分析和功能預測方法有哪幾類?書171頁大致分為四類:1 .基于序歹U或結構的分析方法(sequenceandstructurebasedmethods),又稱進化方法,這類方法基于全局或局部序列或者結構上的保守性來預測蛋白質功能。2 .基于基因組

15、上下文的方法,又稱比較基因組方法,分別基于結構融合事件、系統(tǒng)進化特征譜、保守的基因順序、表達譜以及共調控等預測蛋白質功能。3 .基于相互作用的方法,又稱細胞方法,利用蛋白質相互作用數(shù)據(jù)預測功能4 .基于過程的方法,又稱代謝方法,利用生物化學路徑的結構化網絡來匹配蛋白質的非典型反應。7.6 基于序列相似性預測蛋白質功能的主要依據(jù)是什么?具基本步NANJINGTECHUNJVKRSJITY工物號制藥工程學院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring驟有哪些?P171大致分為四類:1 .基于序歹U或結構的分析方法(sequenceandstructurebasedmethods),又稱進化方法,這類方法基于全局或局部序列或者結構上的保守性來預測蛋白質功能。2 .基于基因組上下文的方法,又稱比較基因組方法,分別基于結構融合事件、系統(tǒng)進化特征譜、保守的基因順序、表達譜以及共調控等預測蛋白質功能。3 .基于相互作用的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論