(完整)生物信息學期末復習知識點總結,推薦文檔_第1頁
(完整)生物信息學期末復習知識點總結,推薦文檔_第2頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學:利用數(shù)學、物理、化學的理論、 技術和方法,以計算機為工具,對生命現(xiàn)象 加以研究,得到深層次的生物學知識。研究任務:收集與管理生物分子數(shù)據(jù),對數(shù) 據(jù)進行處理分析,為其它生物學研究提供服 務四大“模式生物”:酵母、線蟲、果蠅、小鼠小分大分子多瘵3淀*L糖廉、纖維素核糖核酸脫氧核糖孩酸糖的生物功能,作為燃料(是生命活動所需 的能源),重要的中間代謝物,參與生物大分 子組成,作為信號分子脂類的生物功能,構成生物膜的骨架,儲存 能量(效率是糖的2倍左右),構成生物表面 的保護層、保溫層,重要的生物學活性物質 蛋白質的生物功能,是遺傳信息轉化成生物 結構和功能的表達者;參與基因表達的調節(jié), 以

2、及細胞中氧化還原反應、電子傳遞、神經 傳遞、學習記憶等重要生命過程;酶(一類重要的蛋白質)在細胞和生物體內各種生 化反應中起催化作用; 蛋白質的空間結構一級結構(primary structure)多肽鏈中氨基酸數(shù)目、種類和線性排列順序二級結構(secondary structure)氫鍵形成-螺旋(-helix)鏈間形成-折疊(-sheet)三級結構(tertiary structure)肽鏈進一步 沿多方向盤繞成緊密的近似球狀結構四級結構(quaternary structure)具有特定 構象的肽鏈進一步結合,并在空間相互作用 檢索方法:1)追溯法:通過已知文獻后附有的參考文獻中提供的線

3、索來查找文獻。(2)常用法:利用各種檢索工具來查找文獻。(3) 循環(huán)法:是將常用法和追溯法交替使用 的一種綜合文獻檢索方法。(4) 瀏覽法:是從本專業(yè)期刊或其它類型 的原始文獻中直接查閱文獻資料。檢索途徑:著者途徑:分類途徑:主題途徑: 其它途徑;檢索過程:(1)分析研究課題(2)制定檢索 策略(3)查找文獻線索(4)獲得原始文獻 大規(guī)?;蚪MDNA測序:鳥槍法 (Shot-gun sequencing)方法:借 助物理或化學的手段將整個基因組隨機打斷 成一定大小的片段進行測序,再根據(jù)序列間 的重疊關系進行計算機排序與組裝,確定它 們在基因組中的位置。適用范圍:主要用于重復序列少、相對簡單 的

4、原核生物基因組的測序工作。不適用于分 析較大的、更復雜的基因組。優(yōu)點:速度快、 簡單易行、成本低克隆重疊群法(cl one con tig seque ncing)方法:先將染色體打成比較大的片段(幾十-幾百Kb),利用分子標記將這些大片段排成 重疊的克隆群,分別測序后拼裝。需要繪制 物理圖譜,以鳥槍法為基礎。適用范圍:較 大的、更復雜的基因組 蛋白質結構解析:X射線晶體衍射; 核磁共 振波譜學其他方法:掃描隧道電子顯微鏡-圓二色譜 一級數(shù)據(jù)庫:直接來源于實驗獲得的原始數(shù) 據(jù),只經過簡單的歸類、整理和注釋。二級數(shù)據(jù)庫:在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理 論分析的基礎上,針對不同的研究內容和需 要,對生

5、物學知識和信息的進一步整理得到 的數(shù)據(jù)庫。序列比較的根本任務是:通過比較生物分子 序列,發(fā)現(xiàn)他們之間的相似性,找出序列之間共同的區(qū)域,同時辨 別序列之間的差異。同源性:是指序列們是由共同祖先進化而來, 講兩條序列的同源關系,只有兩種情況:同 源、不同源。相似性:指序列間的差別,是 一個度量。同源與相似的關系:一般認為序列相似性達 到一定程度,即可認為是同源,但不絕對。 序列比對算法實現(xiàn):點陣分析:尋找序列間 可能的性狀對位排列;尋找蛋白質、DNA序列中正向或反向重復;預測RNA中自補區(qū)域;直觀,整體水平;動態(tài)規(guī)劃算法:精確而全 面,非常耗費資源;啟發(fā)式算法 滑動窗口技術:使用滑動窗口代替一次一

6、個 位點的比較是解決這個問題的有效方法。動態(tài)規(guī)劃算法計算過程:1計算過程從d 0 ,0開始,2可以是按行計算,每行從左到右, 也可以是按列計算,每列從上到下。3當然, 任何計算過程,只要滿足在計算d i , j時d i-1 , j、d i-1 ,j-1、和d i, j-1都已 經被計算這個條件即可。3在計算d i , j后, 需要保存d i , j是從d i-1 , j、d i-1 ,j-1、或d i, j-1中的哪一個推進的,或保存計算的路徑,以便于后續(xù)處理。上述計算過程到d m , n結束。最優(yōu)路徑求解:與計算過程相反,從d m, n開始,反向前推?;虻亩x1、基因是一段與多肽鏈或功能R

7、NA產生有關的DNA片段, 包括編碼區(qū)前的 引導序列、編碼區(qū)后的尾部序列、編碼區(qū)內 的插入序列和編碼區(qū)序列?;虻姆N類:結構基因、調控基因,rRNA基因和tRNA基因啟動子,操縱基因 因組(genome是指一個細胞或病毒包含的 全部遺傳信息的總和。TP(true positive):實際編碼區(qū)的核酸中 被成功預測的核酸數(shù)目;TN(true negative):實際非編碼區(qū)的核酸 中被成功預測的核酸數(shù)目;FN( false negative):實際編碼區(qū)的核酸中 被誤測為非編碼的核酸數(shù)目;FP( false positive):實際非編碼區(qū)的核酸 中被誤測為編碼的核酸數(shù)目。REALITY算與每一

8、個其他序列的距離,生成新的距離 矩陣5.確定下一對關系最近的序列,重復前面的 步聚計算枝長7.從每個序列對開始,重復整個過程8.對每個樹計算每對序列間的預測距離,發(fā) 現(xiàn)與原始數(shù)據(jù)最符合的樹蛋白質亞細胞定位預測的方法:1)基于信號肽的方法來預測蛋白質亞細胞定 位(2) 基于氨基酸組份或氨基酸物理化學性質 的方法來預測蛋白質亞細胞定位(3) 基于蛋白質功能注解的方法來預測蛋白 質亞細胞定位(4) 基于系統(tǒng)發(fā)生的分布圖、結構域投影或 結合進化和結構信息的方法來預測蛋白質亞 細胞定位Sn二TP/(TP+FN)Sp=TP/(TP+FP)項目Lengt hTPFPFN Sn SpaccuracyZCURVE V 121020.10.92863Glimmer1414 40.0. 0.7NCBI071 71 1Gen eMark99 0 50.10.8NCBI642 1核酸數(shù)據(jù)庫:Gen Ba nk EMBL DDBJ蛋白質序列數(shù)據(jù)庫:SWISS-PROTPIR蛋白質結構數(shù)據(jù)庫:PDBSp特異性(specificity,Sp):TP FPFM法:1.找出關系最近的序列對,如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論