




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
生物信息學(xué)概述一.生物信息蛋白質(zhì)結(jié)構(gòu)與功能細胞染色體核酸生物分子信息生物分子至少攜帶著三種信息遺傳信息與功能相關(guān)的結(jié)構(gòu)信息進化信息生物分子信息的特征生物分子信息數(shù)據(jù)量大生物分子信息復(fù)雜生物分子信息之間存在著密切的聯(lián)系遺傳信息的載體——DNA
遺傳信息的載體主要是DNA
控制生物體性狀的基因是一系列DNA片段生物體生長發(fā)育的本質(zhì)就是遺傳信息的傳遞和表達DNA通過自我復(fù)制,在生物體的繁衍過程中傳遞遺傳信息基因通過轉(zhuǎn)錄和翻譯,使遺傳信息在生物個體中得以表達,并使后代表現(xiàn)出與親代相似的生物性狀2023/4/104蛋白質(zhì)RNA轉(zhuǎn)錄DNA翻譯DNA前體RNAmRNA多肽鏈2023/4/10生命機器的執(zhí)行者--蛋白質(zhì)蛋白質(zhì)功能取決于蛋白質(zhì)的空間結(jié)構(gòu)
蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的序列(這是目前基本共認的假設(shè)),蛋白質(zhì)結(jié)構(gòu)的信息隱含在蛋白質(zhì)序列之中。2023/4/10DNA分子和蛋白質(zhì)分子都含有進化信息通過比較相似的蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復(fù)制而產(chǎn)生的分子進化證據(jù)。通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關(guān)系,推測它們共同的祖先蛋白質(zhì)。2023/4/107生物分子信息DNA序列數(shù)據(jù)
蛋白質(zhì)序列數(shù)據(jù)
生物分子結(jié)構(gòu)數(shù)據(jù)
生物分子功能數(shù)據(jù)
最基本直觀復(fù)雜生物信息數(shù)據(jù)類型2023/4/10
DNA核酸序列蛋白質(zhì)氨基酸序列蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)功能最基本的生物信息維持生命活動的機器第一部遺傳密碼第二部遺傳密碼?生命體系千姿百態(tài)的變化生物分子數(shù)據(jù)及其關(guān)系2023/4/109第一部遺傳密碼已被破譯,但對密碼的轉(zhuǎn)錄過程還不清楚,對大多數(shù)DNA非編碼區(qū)域的功能還知之甚少對于第二部密碼,目前則只能用統(tǒng)計學(xué)的方法進行分析。破譯“第二遺傳密碼”:即折疊密碼(foldingcode),從蛋白質(zhì)的一級結(jié)構(gòu)得到立體結(jié)構(gòu),即可直接從基因推測其編碼蛋白質(zhì)所對應(yīng)的生物學(xué)功能。破解折疊密碼被列為“21世紀的生物學(xué)”的重要課題。生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫是金礦,等待我們?nèi)ネ诰蚝屠?023/4/10Bioinformatics,生物
+信息
+學(xué)--新興的交叉學(xué)科ComputersciencesMathematicalsciencesLifesciences二、生物信息學(xué)的概念定義一:生物信息學(xué)是一門收集、分析遺傳數(shù)據(jù)以及分發(fā)給研究機構(gòu)的新學(xué)科(1987)定義二:生物信息學(xué)特指數(shù)據(jù)庫類的工作,包括持久穩(wěn)固的在一個穩(wěn)定的地方提供對數(shù)據(jù)的支持(1994)定義三:采用信息科學(xué)技術(shù),對各種生物信息(包括核酸、蛋白質(zhì)等)的收集、加工、儲存、分析、解釋的一門學(xué)科。收集、加工、儲存:計算機科學(xué)家分析、解釋:生物學(xué)家三、生物信息學(xué)發(fā)展簡史(一)前基因組時代的生物信息學(xué)
起源于20世紀70-80年代。這一階段的主要成就包括核酸和蛋白質(zhì)序列的初步分析、生物學(xué)數(shù)據(jù)庫的建立以及檢索工具的開發(fā)。例如Dayhoff的替換矩陣、Neelleman和Wunsch的序列比對及GenBank(由美國國立生物技術(shù)信息中心建立和維護的核酸與蛋白質(zhì)序列數(shù)據(jù)庫)等大型數(shù)據(jù)庫的建立,形成了生物信息學(xué)的雛形。1967:Dayhoff研制出蛋白質(zhì)序列圖集,即后來著名的蛋白質(zhì)信息源PIR;1970:Needleman和Wunsch提出了著名的序列比對算法,是生物信息學(xué)發(fā)展中最重要的貢獻;1978:Gingeras等人研制了核酸序列中酶切位點識別程序;1981:Doolittle提出了關(guān)于序列模式的概念;1986:日本核酸序列數(shù)據(jù)庫DDBJ誕生;1986:蛋白質(zhì)數(shù)據(jù)庫SWISS-PROT誕生;1988:美國國家生物技術(shù)信息中心NCBI誕生;1988:成立歐洲分子生物學(xué)網(wǎng)絡(luò)(EMBNet),EMBL數(shù)據(jù)庫誕生(二)基因組時代的生物信息學(xué)以基因組計劃的實施為標(biāo)志的基因組時代(1990年至2001年)是生物信息學(xué)成為一個較完整的新興學(xué)科并得到高速發(fā)展的時期。這一時期生物信息學(xué)確立了自身的研究領(lǐng)域和學(xué)科特征,成為生命科學(xué)的熱點學(xué)科和重要前沿領(lǐng)域之一。這一階段的主要成就包括大分子序列以及表達序列標(biāo)簽(expressedsequencetag,EST)數(shù)據(jù)庫的高速發(fā)展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具軟件的研制和相應(yīng)新算法的提出、基因的尋找與識別、電子克隆(insilicocloning)技術(shù)等,大大提高了管理和利用海量數(shù)據(jù)的能力。人類基因組計劃開始(HumanGenomeProject,HGP)人類基因組計劃帶來了
生物信息學(xué)20世紀90年代人類基因組計劃(HGP,HumanGenomeProject)目標(biāo):整體上破解人類遺傳信息的奧秘由美國NIH和能源部提出和帶頭,美、英、德、法、日、中共同參與的國際合作項目。完成人全部24(22+X+Y)條染色體中3.2×109個堿基對的序列測定,主要任務(wù)包括做圖(遺傳圖譜、物理圖譜以及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別,其根本任務(wù)是解讀和破譯生物體的生老病死以及與疾病相關(guān)的遺傳信息?;蚪M(Genome):包含細胞或生物體全套的遺傳信息的全部遺傳物質(zhì)
包括:細胞核基因組DNA細胞質(zhì)(線粒體、葉綠體)基因組DNA
人類基因組:3.2×109bp18曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃人類自然科學(xué)史上的3大計劃AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.212001年2月15日《Nature》封面2001年2月16日《Science》封面22我國對人類基因組計劃的貢獻24humanArabidopsis擬南芥ThermotogamaritimaEscherichiacoli大腸桿菌Buchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis數(shù)據(jù)庫中的蛋白質(zhì)序列Swiss-prot:≈550,000條蛋白質(zhì)序列29結(jié)構(gòu)與功能信號網(wǎng)絡(luò)代謝途徑細胞重建系統(tǒng)重建基因組基因(三)后基因組時代的生物信息學(xué)四、生物信息學(xué)的研究領(lǐng)域基因組序列裝配基因識別基因功能預(yù)報基因多態(tài)性分析基因進化mRNA結(jié)構(gòu)預(yù)測基因芯片設(shè)計基因芯片數(shù)據(jù)分析疾病相關(guān)基因分析蛋白質(zhì)序列分析蛋白質(zhì)家族分類蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)折疊研究代謝途徑分析轉(zhuǎn)錄調(diào)控機制蛋白質(zhì)芯片設(shè)計蛋白質(zhì)芯片數(shù)據(jù)分析藥物設(shè)計大規(guī)模核酸測序及拼接基因識別與定位基因相關(guān)的SNP研究非編碼區(qū)信息結(jié)構(gòu)分析比較基因組學(xué)
(一)核酸及基因組信息大規(guī)?;蚪M測序33運用計算機軟件進行序列拼接基因識別與定位
基因相關(guān)的SNP研究:
單核苷酸多態(tài)性(SingleNucleotidePolymorphisms,SNP):主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種。占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛存在,平均每500~1000個堿基對中就有1個,估計其總數(shù)可達300萬個甚至更多。SNP的研究意義尋找疾病相關(guān)的突變位點法醫(yī)學(xué)研究器官移植中供體/受體配對分析
37
全基因組關(guān)聯(lián)分析(Genome-wideassociationstudy,GWAS):是指在人類全基因組范圍內(nèi)找出存在的序列變異,即單核苷酸多態(tài)性(SNP),從中篩選出與疾病相關(guān)的SNPs
非編碼區(qū)信息結(jié)構(gòu)分析:基因表達調(diào)控分析在微生物中,非編碼區(qū)只占整個基因組序列的10%-20%;但在高等生物和人類基因組中,非編碼序列則占了基因組序列的絕大部分。在人的基因組中,非編碼序列超過95%。非編碼區(qū)有調(diào)控作用的核苷酸序列,包括位于編碼區(qū)上游的RNA聚合酶結(jié)合位點。比較基因組學(xué)(ComparativeGenomics)是基于基因組圖譜和測序基礎(chǔ)上,對已知的基因和基因組結(jié)構(gòu)進行比較,來了解基因的功能、表達機理和物種進化的學(xué)科(二)蛋白質(zhì)及蛋白質(zhì)組信息蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)功能預(yù)測基因表達及蛋白質(zhì)組信息學(xué)蛋白質(zhì)三維結(jié)構(gòu)測定主要方法:X射線晶體結(jié)構(gòu)分析、多維核磁共振(NMR)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白質(zhì)結(jié)構(gòu)及功能預(yù)測蛋白質(zhì)組研究
蛋白質(zhì)組(proteome):即包括一種細胞乃至一種生物所表達的全部蛋白質(zhì)。蛋白質(zhì)組本質(zhì)上指的是在大規(guī)模水平上研究蛋白質(zhì)的特征,包括蛋白質(zhì)的表達水平,翻譯后的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質(zhì)水平上的關(guān)于疾病發(fā)生,細胞代謝等過程的整體而全面的認識。
它是人類可遺傳的變異中最常見的一種。AquifexaeolicusRickettsiaprowazekii尋找疾病相關(guān)的突變位點(HumanGenomeProject,HGP)定義三:采用信息科學(xué)技術(shù),對各種生物信息(包括核酸、蛋白質(zhì)等)的收集、加工、儲存、分析、解釋的一門學(xué)科。AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關(guān)系,推測它們共同的祖先蛋白質(zhì)。Aquifexaeolicus2001年2月16日《Science》封面尋找疾病相關(guān)的突變位點基因表達及蛋白質(zhì)組信息學(xué)序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。定義三:采用信息科學(xué)技術(shù),對各種生物信息(包括核酸、蛋白質(zhì)等)的收集、加工、儲存、分析、解釋的一門學(xué)科。2×109個堿基對的序列測定,主要任務(wù)包括做圖(遺傳圖譜、物理圖譜以及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別,其根本任務(wù)是解讀和破譯生物體的生老病死以及與疾病相關(guān)的遺傳信息。Mathematical我國對人類基因組計劃的貢獻非編碼區(qū)信息結(jié)構(gòu)分析所謂基因組藥物(Genomicdrug)是指利用基因序列數(shù)據(jù),經(jīng)生物信息學(xué)分析、高通量基因表達、高通量功能篩選和體內(nèi)外藥效研究開發(fā)得到的新藥候選物.生命體系千姿百態(tài)的變化Thermotogamaritima生物信息學(xué)和人類基因組計劃為藥物靶標(biāo)的發(fā)現(xiàn)和新藥的研制開創(chuàng)了新天地,未來的藥物設(shè)計將是基于生物信息學(xué)的知識挖掘的過程蛋白質(zhì)組本質(zhì)上指的是在大規(guī)模水平上研究蛋白質(zhì)的特征,包括蛋白質(zhì)的表達水平,翻譯后的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質(zhì)水平上的關(guān)于疾病發(fā)生,細胞代謝等過程的整體而全面的認識。美國EliLilly公司開發(fā)的第一個高效、高選擇性人體非胰腺分泌型磷脂酶抑制劑LY311727,進入臨床研究非編碼區(qū)有調(diào)控作用的核苷酸序列,包括位于編碼區(qū)上游的RNA聚合酶結(jié)合位點。(三)生物分子數(shù)據(jù)的收集與管理基因相關(guān)的SNP研究(HumanGenomeProject,HGP)基因組數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子數(shù)據(jù)的收集與管理2023/4/10(四)數(shù)據(jù)庫搜索及序列比較
搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。
2023/4/1046發(fā)現(xiàn)同源分子2023/4/104748生物信息學(xué)和人類基因組計劃為藥物靶標(biāo)的發(fā)現(xiàn)和新藥的研制開創(chuàng)了新天地,未來的藥物設(shè)計將是基于生物信息學(xué)的知識挖掘的過程通過數(shù)據(jù)分析首先確立靶標(biāo)分子預(yù)測蛋白質(zhì)分子結(jié)構(gòu)設(shè)計藥物分子與靶標(biāo)分子相互作用(五)
在藥學(xué)領(lǐng)域應(yīng)用
所謂基因組藥物(Genomicdrug)是指利用基因序列數(shù)據(jù),經(jīng)生物信息學(xué)分析、高通量基因表達、高通量功能篩選和體內(nèi)外藥效研究開發(fā)得到的新藥候選物.
基于機理的藥物發(fā)現(xiàn):基因組藥物實際上利用了反向生物學(xué)的原理.沿著從基因序列一蛋白質(zhì)一功能一藥物的途徑研制新藥,其優(yōu)勢是取自龐大的人類基因資源及其編碼蛋白質(zhì)做為原材料,具有巨大的開發(fā)潛力?;蚪M藥物人類基因組約有10萬左右的基因.編碼10萬以上的蛋白質(zhì),其中至少5%即5000以上的基因編碼蛋白質(zhì)可能具有藥物開發(fā)前景。大量基因特別是疾病相關(guān)基因申請專利,如肥胖。
理想的抗生素靶標(biāo)應(yīng)為微生物細胞存活所必須,在病原體中高度保守,且在人體中不存在或與人類基因有根本差異診斷類藥物設(shè)計:生物芯片設(shè)計
遺傳?。夯蛟\斷(腺苷脫胺酶基因突變可引起重癥聯(lián)合免疫缺陷癥(SCID);而淋巴細胞表面分子CD40或其配體(CD40L)基因突變則可引起無丙種球蛋白血癥)
感染性疾病
癌癥?
預(yù)防類藥物設(shè)計:
計算機輔助疫苗設(shè)計計算機預(yù)測抗原表位計算機輔助藥物設(shè)計(Computer-AidedDrugDesign,CADD)是近年來發(fā)展起來的研究與開發(fā)新藥的一種嶄新技術(shù),以數(shù)學(xué)、藥物化學(xué)、生物化學(xué)、分子生物學(xué)、分子藥理學(xué)、結(jié)構(gòu)化學(xué)、結(jié)構(gòu)生物學(xué)、細胞生物學(xué)等學(xué)科為基礎(chǔ),以量子化學(xué)、分子力學(xué)和分子動力學(xué)等為理論依
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版七年級英語下冊教學(xué)工作計劃(及進度表)
- 2025年湖北省中考化學(xué)模擬試卷(附答案)
- 2021年上海高考語文真題卷(附答案)
- 藝術(shù)品交易居間服務(wù)協(xié)議
- 二零二五年度北京市危險品倉儲安全評價合同范本
- 展覽館裝修合同參考模板
- 中醫(yī)護理學(xué)(第5版)課件 第二章藏象
- 特殊作業(yè)施工方案
- 餐飲業(yè)可行性分析報告
- 農(nóng)業(yè)小鎮(zhèn)規(guī)劃
- (完整版)英語四級詞匯表
- GB/T 18281.7-2024醫(yī)療保健產(chǎn)品滅菌生物指示物第7部分:選擇、使用和結(jié)果判斷指南
- 中車招聘在線測評題
- 2024年事業(yè)單位考試(綜合管理類A類)職業(yè)能力傾向測驗試卷及答案指導(dǎo)
- 2023年全國職業(yè)院校技能大賽-護理技能賽項規(guī)程2
- 2024文旅景區(qū)暑期檔大型神話傳說情景體驗人氣活動策劃方案
- DL∕T 253-2012 直流接地極接地電阻、地電位分布、跨步電壓和分流的測量方法
- NB-T+31010-2019陸上風(fēng)電場工程概算定額
- 裝配式建筑裝飾裝修技術(shù) 課件 模塊四 裝配式墻面
- DZ∕T 0175-2014 煤田地質(zhì)填圖規(guī)范(1:50 000 1:25 000 1:10 000 1:5 000)(正式版)
- 《阿Q正傳》《邊城》比較閱讀課件高中語文選擇性必修下冊
評論
0/150
提交評論