北京大學(xué)化學(xué)信息學(xué)_第1頁
北京大學(xué)化學(xué)信息學(xué)_第2頁
北京大學(xué)化學(xué)信息學(xué)_第3頁
北京大學(xué)化學(xué)信息學(xué)_第4頁
北京大學(xué)化學(xué)信息學(xué)_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、課程內(nèi)容安排第十一講:Chemoinformatics分子結(jié)構(gòu)信息的計算機存儲和表達分子二維數(shù)據(jù)庫和數(shù)據(jù)庫檢索技術(shù)第十二講:Cheminformatics分子多樣性和化合物篩選三維結(jié)構(gòu)的實驗數(shù)據(jù)資源基于三維結(jié)構(gòu)的計算方法化合物組合庫高通量虛擬篩選1化學(xué)信息學(xué)第十一講Chemoinformatics2內(nèi) 容相關(guān)名詞辨析及化學(xué)信息學(xué)由來分子結(jié)構(gòu)信息的計算機存儲和表達分子二維數(shù)據(jù)庫和數(shù)據(jù)庫檢索技術(shù)3名詞解釋 Computational Chemistry 計算化學(xué): 使用數(shù)學(xué)方法計算分子性質(zhì)和模擬分子行為的方法。并且包括合成設(shè)計、數(shù)據(jù)庫搜索、組合庫操作等 (Hopfinger, 1981; Ugi

2、et al., 1990). IUPAC Computational 4相關(guān)名詞辨析5名詞解釋 Molecular Modeling 分子建模方法: 使用計算化學(xué)和圖形顯示技術(shù)研究分子結(jié)構(gòu)和性質(zhì),從而獲得在給定環(huán)境下的分子三維結(jié)構(gòu)的近似表達 IUPAC Medicinal Chemistry, IUPAC Computational6名詞解釋 Chemometrics 化學(xué)統(tǒng)計學(xué): 使用數(shù)理統(tǒng)計學(xué)的方法對化學(xué)信息(如有機,分析和藥物化學(xué))進行分析,或進行化學(xué)實驗的設(shè)計和模擬IUPAC Computational7名詞解釋 Bio-informatics 生物信息學(xué): 使用數(shù)理統(tǒng)計學(xué)的方法對化學(xué)

3、信息(如有機,分析和藥物化學(xué))進行分析,或進行化學(xué)實驗的設(shè)計和模擬IUPAC Computational8名詞解釋 Chemoinformatics ?: Chemoinformatics 是知識管理(knowledge management)的有機組成部分Nicholas J. Hrib, Norton P. PeetChemoinformatics: are we exploiting these new science?“Drug Discovery Today 5 (11): 483-485, Nov. 20009名詞解釋 Cheminformatics 化學(xué)信息學(xué): 結(jié)合化學(xué)合成、生

4、物篩選及數(shù)據(jù)挖掘技術(shù)指導(dǎo)藥物發(fā)現(xiàn)和開發(fā), 用于合理的設(shè)計具有類藥性質(zhì)的化合物,構(gòu)建用于虛擬高通量篩選的智能化合物庫,研究以往的數(shù)據(jù)知道先導(dǎo)化合物的優(yōu)化Cheminformatics: Intelligent Drug Discovery May 28- 30, 2003 Philadelphia PA 1011Human Alcohol Dehydrogenase (Adh1A) 分類:Oxidoreductase簡介:Molecule: Class I Alcohol Dehydrogenase 1, Subunit; Chain: A, B; Engineered: Yes實驗方法:X-r

5、ay Diffraction12Human Alcohol Dehydrogenase (Adh1A) 13分子結(jié)構(gòu)信息的計算機存儲和表達如何使用計算機存儲化學(xué)結(jié)構(gòu)?如何處理存儲的結(jié)構(gòu)信息?計算機在Chemoinfomatics中的應(yīng)用?14分子結(jié)構(gòu)信息表達的內(nèi)容原子原子間的連接鍵型立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms15分子結(jié)構(gòu)信息表達的內(nèi)容原子原子間的連接鍵型立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms16分子結(jié)構(gòu)信息表達的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atom

6、s17分子結(jié)構(gòu)信息表達的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms18分子結(jié)構(gòu)信息表達的內(nèi)容原子原子間的連接鍵型(芳香環(huán))立體化學(xué)構(gòu)型電荷同位素 3D-coordinates for atoms1920分子結(jié)構(gòu)一維表示法(Line Notation)簡介:使用字符串表示分子結(jié)構(gòu)現(xiàn)有的幾種表示法Wiswesser Line Notation (WLN) (Dialog)Simplified Molecular Input Line System (SMILES/SMARTS) (Daylight)Representation of

7、Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein)Sybyl Line Notation (SLN)- (Tripos)ROSDAL1O-2=3O,2-4-5N,4-6-7=-12-7,10-13OSLNOHC(=O)CH(NH2)CH2C1=CHCH=C(OH)CH=CH1WLN QVYZ1R DQSMILESOC(=O)C(N)CC1=CC=C(O)C=C121分子結(jié)構(gòu)一維表示法(Line Notation)Simplified Molecular Input Line Entry System (SMILES) 基于價鍵模

8、型的標記法Author: Dave Weininger (Daylight)22CMethaneC1CCCCC1cyclohexaneOwaterc1ccccc1benzeneCCethaneCOmethanolOC methanol NCH(C)C(=O)OCCOethanolCC(=O)CacetoneO=C=Ocarbon dioxideL-alanineSMILE標記示例23atom : symbol sign 雙字母原子符號: Br (Upper/lower case)原子的預(yù)定義價鍵:B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1),

9、 Cl(1), Br(1), I(1)大寫的字母表示非芳香體系示例:ClHydrochloric acidSH2S Fe+Iron(II)cationAtoms 語法24Bond 語法bond : | - | = | # | . ; single | double | triple | disconnectionEthene C=CFormaldehyde C=OHydrogen Cyanide C#NButadiene C=CC=C25分支 將支鏈放在括號中SMILES: CCCC(C(=O)O)CCCbranch : ( ) | ( ) | ( ) | ( )26環(huán)定義 合環(huán)鍵用數(shù)字標出2

10、7 非連接關(guān)系 (disconnections): 同位素表示:SMILES: Na+.O-c1ccccc1specified inside brackets. SMILES: 13CH4其它定義28F/C=C/FF/C=CF雙鍵構(gòu)型的表示 / 29從旋光中心沿字符串順序觀察,逆時針為,順時針為NC(C)(F)C(=O)O手性表示 or 30氫原子表示顯式表示氫原子的四種情況:帶電荷的氫, 如:質(zhì)子 H+ 與其它氫相連的氫, 如:氫氣 HH 氫橋同位素,如:重水, 2HO2H 31芳香性N1ccccc1 N1=CC=CC=C1C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C1

11、32O-n+1ccccc1pyridine-N-oxideOCH1CCCCCH1Ocis-resorcinolCC(C)NCC(O)COc1cccc2ccccc12Propranolol a beta-blocker一些例子33SMILES的正規(guī)化標記c1ccccc1Oc2ccccc2(N)Nc2ccccc2Oc1ccccc1O(c1ccccc1)(c2ccccc2N)Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 34分子結(jié)構(gòu)一維表示法(Line Notation)優(yōu)點:易于手工書寫結(jié)構(gòu)緊湊局限:信息量小對復(fù)雜分子的標記比較繁

12、瑣。某些情況下,標記具有二義性。35分子結(jié)構(gòu)一維表示法的應(yīng)用構(gòu)造查詢語言子結(jié)構(gòu)匹配相似性搜索(結(jié)構(gòu)指紋)化合物組合庫的壓縮存儲反應(yīng)數(shù)據(jù)庫36SMILES 應(yīng)用示例ClogP 辛醇/水分配系數(shù)實驗方法logP計算 pH 7.0時的分配系數(shù)數(shù)據(jù)庫規(guī)模 = 2,000,000化合物工作站搜索速度= 500,000/s37ClogP的計算使用片斷加和法 (片斷值校正項)片斷值基于實驗值,與片斷的類型有關(guān),如:極性基團、鹵素、離子、不飽和鍵校正項描述不同片斷間的相互作用,如:氫鍵等383940分子結(jié)構(gòu)信息的計算機存儲和表達分子結(jié)構(gòu)二維表示法連接表 (Connection Table)鄰接矩陣 (Adja

13、cency Table)41連接表 (Connection Table)簡介:計算機系統(tǒng)中主流結(jié)構(gòu)表示方法類型 “內(nèi)部” CTs (內(nèi)存) 程序處理“外部” CTs (磁盤文件)文件存儲 數(shù)據(jù)交換42“Redundant” Connection TableO1 2 1C0 1 1 3 2 4 1O0 2 2C 1 2 1 5 1 6 1N2 4 1C2 4 1 7 1C0 6 1 8 212 1C1 7 2 9 1C1 8 110 2C0 9 211 113 1C110 112 2C111 2 7 1O110 143MDL Connection Table數(shù)據(jù)交換的事實標準衍生文件格式Molf

14、ile (single molecule)SDfile (set of molecules and data)RGfile (Markush structure)Rxnfile (single reaction)RDfile (set of reactions with data)示例44benzene WLViewer 3D 0 12 12 0 0 0 0 0 0 0 0 0 1.1202 0.0003 0.0002 C 0 0 0 0 0 0 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0 3.

15、8522 0.0006 -0.0007 C 0 0 0 0 0 0 3.1691 -1.1823 0.0001 C 0 0 0 0 0 0 1.8034 -1.1829 -0.0003 C 0 0 0 0 0 0 0.1202 0.0002 0.0011 H 0 0 0 0 0 0 1.3028 2.0494 -0.0011 H 0 0 0 0 0 0 3.6690 2.0500 -0.0001 H 0 0 0 0 0 0 4.8522 0.0005 -0.0015 H 0 0 0 0 0 0 3.6692 -2.0482 0.0010 H 0 0 0 0 0 0 1.3036 -2.0490

16、 -0.0010 H 0 0 0 0 0 0 1 2 4 0 0 0 1 6 4 0 0 0 2 3 4 0 0 0 3 4 4 0 0 0 4 5 4 0 0 0 5 6 4 0 0 0 1 7 1 0 0 0 2 8 1 0 0 0 3 9 1 0 0 0 4 10 1 0 0 0 5 11 1 0 0 0 6 12 1 0 0 0M END45其它CTs格式Standard Molecular Data (SMD) formatnever gained wide acceptanceProtein Data Bank (PDB) formatCrystallographic Inform

17、ation File (CIF)Molecular Information File (MIF) developed from SMD and compatible with CIFChemical Exchange Format (CXF) Chemical Abstracts ServiceChemical Markup Language (CML)for data exchange using the InternetIChI (IUPAC Chemical Identifier) 46分子結(jié)構(gòu)信息的計算機存儲和表達分子結(jié)構(gòu)三維表示法三維坐標文件 (Mol, XYZ, SD )內(nèi)部坐標表

18、示法 (Z-Matrix)47benzene WLViewer 3D 0 12 12 0 0 0 0 0 0 0 0 0 1.1202 0.0003 0.0002 C 0 0 0 0 0 0 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0 3.8522 0.0006 -0.0007 C 0 0 0 0 0 0 3.1691 -1.1823 0.0001 C 0 0 0 0 0 0 1.8034 -1.1829 -0.0003 C 0 0 0 0 0 0 0.1202 0.0002 0.0011 H

19、0 0 0 0 0 0 1.3028 2.0494 -0.0011 H 0 0 0 0 0 0 3.6690 2.0500 -0.0001 H 0 0 0 0 0 0 4.8522 0.0005 -0.0015 H 0 0 0 0 0 0 3.6692 -2.0482 0.0010 H 0 0 0 0 0 0 1.3036 -2.0490 -0.0010 H 0 0 0 0 0 0 1 2 4 0 0 0 1 6 4 0 0 0 2 3 4 0 0 0 3 4 4 0 0 0 4 5 4 0 0 0 5 6 4 0 0 0 1 7 1 0 0 0 2 8 1 0 0 0 3 9 1 0 0 0

20、 4 10 1 0 0 0 5 11 1 0 0 0 6 12 1 0 0 0M END48Methanol Z-matrix C O 1 l1 H 1 l2 2 a1 H 1 l3 2 a2 3 da1 H 1 l3 2 a2 3 -da1 H 2 l4 1 a3 3 180.0 l1 1.42 l2 1.09 l3 1.09 l4 1.09 l5 1.09 l6 1.0 a1 109.0 a2 110.0 a3 108.0 a4 110.0 a5 110.0 da1 60.0 da2 120.0 da3 60.0z-matrix49分子芳香性問題使用單雙鍵交替表示法導(dǎo)致同一分子有不同的拓撲

21、表示法,以及其它問題解決方式:使用芳香鍵類型使用規(guī)一化的原子鍵類型50共振結(jié)構(gòu)是否看作同一分子?答案是你期望如何處理使用規(guī)一化的鍵型使用單雙鍵交替法51共振結(jié)構(gòu)共振式定義的方法HQX=R Q=XRHQ, X or R只能是特定原子keto-enol 共振結(jié)構(gòu)CA不能正確識別單一的不飽和碳鏈Daylight不能正確識別52結(jié)構(gòu)習(xí)慣規(guī)則有時稱 “business rules”某些化學(xué)基團的不同表示法習(xí)慣規(guī)則確定哪一種更合適需要軟件進行轉(zhuǎn)換53Stereochemistrydifferent compounds with identical connectivitysame topology, di

22、fferent topographyS-tyrosineR-tyrosine54立體化學(xué)不同的表示法上下鍵Cahn, Ingold, Prelog (CIP) designators (R, S, E, Z)基于文本的描述符 (光學(xué)旋光)55立體化學(xué): 上下鍵給圖的節(jié)點著色很多連接表格式包含特殊的上下鍵表示需要確定連接的原子便于生成圖形顯示可以轉(zhuǎn)換成其它手性定義56上/下鍵問題不同的上/下鍵表示可能是同一手性分子 不同的圖,相同的分子某些上下鍵組合并不足以確定手性57Stereochemistry: CIP designatorsR.S. Cahn, C. Ingold, and V. Pre

23、log, Angewandte Chemie Intl. Ed. in English 1966, 5, 385-551one-letter designator for stereocentersbased on rules assigning priorities to groups around ittetrahedral carbons (R, S)double bonds (E, Z)additional colors for graph nodes or edgesuseful for distinguishing stereoisomers when absolute confi

24、guration is knownless useful for matching parts of structures (substructure search) as priority rules can cause designator to change when remote part of structure is changed58其它復(fù)雜情況有機金屬和配合物復(fù)雜立體化學(xué)特殊鍵型共價或離子鍵型不確定 “business rules” 無機物沒有象有機物類似的明確拓撲關(guān)系部分組成為分數(shù)晶體結(jié)構(gòu)59其它復(fù)雜情況氫橋二茂鐵可能的解決方法鍵連接任意一個碳原子鍵連所有5個碳原子鍵連一個環(huán)中心的偽原子(dummy atom)60生物大分子使用縮寫描述基本單元61生物大分子每個縮寫具有預(yù)定義的連接點混合表示法定義新的縮寫62聚合物聚合物的性質(zhì)與聚合條件有關(guān)重復(fù)單元

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論