南京工業(yè)大學(xué)生物信息學(xué)期末考試_第1頁
南京工業(yè)大學(xué)生物信息學(xué)期末考試_第2頁
南京工業(yè)大學(xué)生物信息學(xué)期末考試_第3頁
南京工業(yè)大學(xué)生物信息學(xué)期末考試_第4頁
南京工業(yè)大學(xué)生物信息學(xué)期末考試_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring生工類1301-3生物信息學(xué)考試說明時間:第17周周五(6月17日)上午3-4節(jié)地點(diǎn):厚學(xué)201題型:(開卷)名詞解釋5題20分,單項(xiàng)選擇題10題20分,綜合分析題4題60分。重點(diǎn):可參考以下課后題2.2 何為一級數(shù)據(jù)庫?有哪些一級數(shù)據(jù)庫?一級數(shù)據(jù)庫屬于檔案數(shù)據(jù)庫,庫中的主要內(nèi)容是來源于實(shí)驗(yàn)室操作所得到的原始數(shù)據(jù)結(jié)果;一級數(shù)據(jù)庫:核酸序列數(shù)據(jù)庫GenBank、EMBL、DDBJ及蛋白質(zhì)數(shù)據(jù)庫PDB(proteindataba

2、nk)。2.3 二級數(shù)據(jù)庫、三級數(shù)據(jù)庫等是指什么樣的數(shù)據(jù)庫?二級數(shù)據(jù)庫是在一級數(shù)據(jù)庫的信息基礎(chǔ)上進(jìn)行了計算加工處理并增加了許多人為的注釋而構(gòu)成的。例如,NCBI的RefSeq數(shù)據(jù)庫,其mRNA序列式綜合了GenBank中來源于同一物種相同基因的所有Mrna序列信息的一致性序列;而公共數(shù)據(jù)庫中大多數(shù)的蛋白質(zhì)序列是將核昔酸序列中的編碼序列區(qū)域進(jìn)行蛋白質(zhì)翻譯后,通過后續(xù)的一些計算分析,主觀的人為地為序列加上蛋白質(zhì)產(chǎn)物名稱及功能注釋。三級數(shù)據(jù)庫:參考書本P16頁2.6 請查閱資料,了解序列信息的標(biāo)準(zhǔn)數(shù)據(jù)存放格式:FASTA、NBRF/PIR、GDE和Raw。書10頁到11頁2.8 GenBank數(shù)據(jù)庫

3、中的GenBank條目包含哪些內(nèi)容?請結(jié)合GenBank中的一條具體的序列信息加以說明。書17頁到19頁2.12 蛋白質(zhì)序列數(shù)據(jù)庫有哪些?書22頁2.13 Uniprot數(shù)據(jù)庫分哪幾個層次?書22頁,分為三個層次。一是UniprotKnowledgebase(UniprotKB)它涵蓋大量人工注釋的蛋白質(zhì)信息,包括功能、分類以及數(shù)據(jù)庫的交叉引用等;二是UniprotArchive(Uniparc)力圖收集最完整、最全面的蛋白質(zhì)序列數(shù)據(jù),不過數(shù)據(jù)沒有加以注釋整理,只給出了相關(guān)序列的來源;三是UniprotReferenceClusters(UniRef),是將UniParc中的序列數(shù)據(jù)依據(jù)不同的

4、參數(shù)條件去除冗余后得到的結(jié)果。2.14 UniProtKB/SwissProt和UniProtKB/TrEMBL有何關(guān)聯(lián)?書23頁SwissProt提供了最全面和可靠的注釋信息,被稱為是蛋白質(zhì)序列數(shù)據(jù)的“黃金標(biāo)NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring準(zhǔn)";TrEMBL是為了在不降低SwissProt高水平注釋質(zhì)量的同時,又能使經(jīng)由測序和翻譯獲取的蛋白質(zhì)序列數(shù)據(jù)得以盡快地發(fā)布,作為SwissProt數(shù)據(jù)庫的補(bǔ)充。3.1 序列比對在什么情況下選擇核甘酸序列?

5、在什么情況選擇蛋白質(zhì)序列?書51頁核甘酸序列:在確認(rèn)給定DNA序列和DNA數(shù)據(jù)庫中的序列的一致性時。在搜索多態(tài)性時。在分析所克隆的cDNA片段的一致性時。蛋白質(zhì)序列:由于蛋白質(zhì)序列比DNA所含信息多,所以除以上情況外用蛋白質(zhì)序列。3.2 請比較同源性、相似性和一致性三個概念。書51頁到53頁同源性:是指從某個共同祖先經(jīng)趨異進(jìn)化而形成的不同序列,也就是從一些數(shù)據(jù)中推斷出的兩個基因在進(jìn)化上具有共同祖先的結(jié)論,是質(zhì)的判斷。一致性:是指兩序列在同一位點(diǎn)核甘酸或氨基酸殘基完全相同的序列比例。相似性:兩序列間直接的數(shù)量關(guān)系,如部分相同,相似的百分比或其他一些合適的度量。3.4在進(jìn)化過程中,兩條同源蛋白質(zhì)序

6、列之間會產(chǎn)生分歧的突變有哪些?書P54替換、插入、刪除替換:發(fā)生于一個突變導(dǎo)致的一種氨基酸的密碼子變成另一種氨基酸的密碼子時,在比對結(jié)果中顯示為同一位置上出現(xiàn)兩個不同的氨基酸。插入和刪除:發(fā)生于殘基添加或消除時,比對中由一單點(diǎn)表示(.),加在一條或另一條序列中。插入和刪除(即使只有一個字符長度)都被認(rèn)為是比對中的空位3.13查閱資料了解BLAST比對程序家族的主要程序,如何選擇?程序名查詢序列數(shù)據(jù)庫搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)陳中的序列畀Blastp蛋白質(zhì)蛋白質(zhì)蛋臼質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫中的序列。Blastx核酸蛋白質(zhì)核酸序列6框翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫中的

7、序列逐一搜索.Tblastn蛋白質(zhì)核酸蛋白攝序列和核酸數(shù)據(jù)庠中的極酸序列6框期譯后的宙白質(zhì)序列逐一比對TBIastx核酸核酸核酸序列6框胡譯版蛋白質(zhì)序列.再和核酸數(shù)據(jù)庫中的核酸序列6挺翅譯成的蛋白質(zhì)序列逐一進(jìn)行比對“NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcchncilcyandPharinac-cuticalEngineering3.15 如何尋找遠(yuǎn)緣相關(guān)的蛋白質(zhì)?PSI-BLAST是位點(diǎn)特異性迭代BLAST,用來尋找遠(yuǎn)緣相關(guān)的蛋白質(zhì)序列,對于蛋白質(zhì)的相似序列的尋找比常規(guī)blastp更敏感。PSI-BLAST工具的比對步驟為:(1)用blast

8、p在目標(biāo)數(shù)據(jù)庫中進(jìn)行比對搜索;(2)從第一步中獲得的結(jié)果構(gòu)建多序列對比,根據(jù)多序列比對構(gòu)建一個位點(diǎn)特異性矩陣PSSM;(3)用第二步獲得的PSSM矩陣再一次搜索目標(biāo)數(shù)據(jù)庫;(4)位點(diǎn)特異性反復(fù)比對后用缺失比對的參數(shù)檢驗(yàn)每個匹配的統(tǒng)計顯著性;反復(fù)執(zhí)行24步,一般要重復(fù)5次,而當(dāng)新的結(jié)果不再出現(xiàn)或者程序明確指出不會再有新的結(jié)果出現(xiàn)時,可以停止比對循環(huán)。3.16 如何利用BLAST來發(fā)現(xiàn)新基因?(1)用一個已知序列蛋白質(zhì)開始TBLAST比對,搜索一個DNA數(shù)據(jù)庫;(2)檢查結(jié)果:尋找與已知蛋白質(zhì),相關(guān)蛋白質(zhì)的DNA序列匹配,非顯著序列的匹配;(3)進(jìn)行BLASTXNR或BLASTPNR比對(4)用你

9、新發(fā)現(xiàn)的DNA或蛋白質(zhì)搜索一個蛋白質(zhì)數(shù)據(jù)庫來證實(shí)是否真的發(fā)現(xiàn)一個新的基因或蛋白質(zhì)。4.3什么是外顯子?什么是內(nèi)含子?外顯子:是真核生物基因的一部分,他在剪接后仍會被保存下來,并可在蛋白質(zhì)生物合成過程中被表達(dá)為蛋白質(zhì)。內(nèi)含子:是一個基因中非編碼DNA片段,他分開相鄰的外顯子。內(nèi)含子是阻斷基因線性表達(dá)的序列。NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring4.6 基因預(yù)測方法有哪些?書本P107基于表達(dá)數(shù)據(jù)的基因預(yù)測、基于機(jī)器學(xué)習(xí)方法的基因預(yù)測基于表達(dá)數(shù)據(jù)的基因預(yù)測方法主要是

10、利用基因產(chǎn)物(包括cDNA、EST以及蛋白質(zhì)等)反推基因結(jié)構(gòu)。基于機(jī)器學(xué)習(xí)方法的基因預(yù)測主要是通過挖掘基因組序列以及各類證據(jù)以及各類證據(jù)數(shù)據(jù)信息中蘊(yùn)含的基因結(jié)構(gòu)特征,并建立數(shù)據(jù)模型進(jìn)行基因結(jié)構(gòu)預(yù)測。4.7 什么是EST序列?如何利用EST序列預(yù)測基因?EST:完整mRNA轉(zhuǎn)錄物的片段。把來自不同克隆的EST拼接起來形成完整的cDNA彌補(bǔ)其數(shù)量缺少的情況利用PASA程序軟件將聚類的轉(zhuǎn)錄物片段(全長cDNA和EST)拼接成最大對比片段得到完整地或者部分的基因結(jié)構(gòu),并獲得更多的可變剪切的信息5.3 什么是系統(tǒng)發(fā)生樹?在研究生物進(jìn)化和系統(tǒng)分類中,常用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣

11、關(guān)系,這種樹狀分支的圖形稱為系統(tǒng)發(fā)生樹。5.5 構(gòu)建系統(tǒng)發(fā)生樹有哪兩類方法?P131一類是基于距離的方法,也直接稱為基于距離法另一類是基可二字母特征的方法5.8 分子系統(tǒng)發(fā)生分析常用的軟件有哪些?PHYLIP。(2)PAUP。(3)MEGA。(4)TREE-PUZZLE。(5)MrBayes。(6)PhyML。6.1 提供了蛋白質(zhì)結(jié)構(gòu)的檢索和查詢服務(wù)的數(shù)據(jù)庫主要有哪些?PDB數(shù)據(jù)庫、DSSP數(shù)據(jù)庫、HSSP數(shù)據(jù)庫SCOPCATH6.2 簡要說明四個層次的蛋白質(zhì)結(jié)構(gòu)。(一)一級結(jié)構(gòu)蛋白質(zhì)的一級結(jié)構(gòu)(primarystructure)是指多肽鏈的氨基酸殘基的排列順序。(二)二級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)(

12、secondarystructure)是指多肽鏈主鏈原子借助于氫鍵沿一維方向排列成具有周期性的結(jié)構(gòu)構(gòu)象,是多肽鏈局部的空間結(jié)構(gòu)(構(gòu)象)主要有“螺旋、浙疊、3轉(zhuǎn)角、無規(guī)卷曲等形式(三)超二級結(jié)構(gòu)、結(jié)構(gòu)域超二級結(jié)構(gòu)(supersecondarystructure)是指相鄰的二級結(jié)構(gòu)單元組合在一起,彼此相互作用,排列形成規(guī)則的、在空間結(jié)構(gòu)上能夠辨認(rèn)的二級結(jié)構(gòu)組合體,同時充當(dāng)三級結(jié)構(gòu)的構(gòu)件,基本形式有aa>333a等。NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring(四)三

13、級結(jié)構(gòu)三級結(jié)構(gòu)(tertiarystructure)是指整條多肽鏈的三維結(jié)構(gòu),包括骨架和側(cè)鏈在內(nèi)的所有原子的空間排列。(五)四級結(jié)構(gòu)e四級結(jié)構(gòu)(quatrnarystructure)指在亞基和亞基之間通過疏水作用等次級鍵結(jié)合成為有序排列的特定的空間結(jié)構(gòu)。6.4 PDB收錄了哪些實(shí)驗(yàn)類型的結(jié)構(gòu)數(shù)據(jù)?X射線晶圖譜法,核磁共振法,電子顯微鏡二維晶體三維結(jié)構(gòu)6.6 蛋白質(zhì)結(jié)構(gòu)家族分類數(shù)據(jù)庫主要有哪些?SCOP,CATH,FFSP6.8 蛋白質(zhì)結(jié)構(gòu)分析主要包含哪些方面?組織層次、結(jié)構(gòu)測定及預(yù)測,蛋白質(zhì)折疊6.9 如何進(jìn)行蛋白質(zhì)結(jié)構(gòu)比對?有那些常用的結(jié)構(gòu)比對工具?首先對兩個蛋白質(zhì)結(jié)構(gòu)定義結(jié)構(gòu)相似部分(或稱

14、共同子結(jié)構(gòu));然后通過多次迭代策略來調(diào)整共同子結(jié)構(gòu),直到找出優(yōu)化的結(jié)構(gòu)比對,即找到兩個蛋白質(zhì)空間上最大的重疊部分。DALI方法、CE方法、STRUCTURAL方法、SSM方法、TM-align方法6.13 同源建模方法預(yù)測蛋白質(zhì)結(jié)構(gòu)的基本步驟有哪些?1、模板的選擇2、待測序列與模板序列的比對3、同源模型的建立4、同源模型精修和評估7.2常用的蛋白質(zhì)序列分析和功能預(yù)測方法有哪幾類?書171頁大致分為四類:1 .基于序歹U或結(jié)構(gòu)的分析方法(sequenceandstructurebasedmethods),又稱進(jìn)化方法,這類方法基于全局或局部序列或者結(jié)構(gòu)上的保守性來預(yù)測蛋白質(zhì)功能。2 .基于基因組

15、上下文的方法,又稱比較基因組方法,分別基于結(jié)構(gòu)融合事件、系統(tǒng)進(jìn)化特征譜、保守的基因順序、表達(dá)譜以及共調(diào)控等預(yù)測蛋白質(zhì)功能。3 .基于相互作用的方法,又稱細(xì)胞方法,利用蛋白質(zhì)相互作用數(shù)據(jù)預(yù)測功能4 .基于過程的方法,又稱代謝方法,利用生物化學(xué)路徑的結(jié)構(gòu)化網(wǎng)絡(luò)來匹配蛋白質(zhì)的非典型反應(yīng)。7.6 基于序列相似性預(yù)測蛋白質(zhì)功能的主要依據(jù)是什么?具基本步NANJINGTECHUNJVKRSJITY工物號制藥工程學(xué)院CollegeofBiotcuhnNcYandPharimac-E'uticalEngi口已已ring驟有哪些?P171大致分為四類:1 .基于序歹U或結(jié)構(gòu)的分析方法(sequenceandstructurebasedmethods),又稱進(jìn)化方法,這類方法基于全局或局部序列或者結(jié)構(gòu)上的保守性來預(yù)測蛋白質(zhì)功能。2 .基于基因組上下文的方法,又稱比較基因組方法,分別基于結(jié)構(gòu)融合事件、系統(tǒng)進(jìn)化特征譜、保守的基因順序、表達(dá)譜以及共調(diào)控等預(yù)測蛋白質(zhì)功能。3 .基于相互作用的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論