計(jì)算機(jī)藥物輔助設(shè)計(jì)cadd課件9-10_第1頁
計(jì)算機(jī)藥物輔助設(shè)計(jì)cadd課件9-10_第2頁
計(jì)算機(jī)藥物輔助設(shè)計(jì)cadd課件9-10_第3頁
計(jì)算機(jī)藥物輔助設(shè)計(jì)cadd課件9-10_第4頁
計(jì)算機(jī)藥物輔助設(shè)計(jì)cadd課件9-10_第5頁
已閱讀5頁,還剩151頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

11/27/2022藥物的化學(xué)信息計(jì)算機(jī)系統(tǒng)11/27/2022藥物的化學(xué)信息計(jì)算機(jī)系統(tǒng)1化學(xué)信息學(xué)(Chemoinformatics,chemicalinformatics,Cheminformatics,chemi-informatics)利用計(jì)算機(jī)信息處理技術(shù)對化學(xué)分子結(jié)構(gòu),性質(zhì),來源及用途等相關(guān)信息進(jìn)行管理(包括儲存,分析,處理,檢索和傳遞等)的一種綜合性技術(shù)和學(xué)科。應(yīng)用化學(xué)信息學(xué)可促進(jìn)化學(xué)信息的獲取、轉(zhuǎn)化與共享化學(xué)信息處理化學(xué)信息學(xué)(Chemoinformatics,chemica22D:3D:H3CC化學(xué)分子結(jié)構(gòu)的層次

1D:CH3CHO

OH*一、2D和3D分子結(jié)構(gòu)的計(jì)算機(jī)處理方法2D:3D:H3CC化學(xué)分子結(jié)構(gòu)的層次H*一、2D和3D分3(一)以一維形式表示

對2D結(jié)構(gòu)進(jìn)行編碼——儲存和交換化學(xué)結(jié)構(gòu)式數(shù)據(jù) 的命名法?SMILES(SimplifiedMolecularInputLineEntrySystem,簡化分子線性輸入系統(tǒng))?SLN(Sybyllinearnotation,Sybyl線性標(biāo)記法)*(一)以一維形式表示?SMILES(Simplifi4SMILES

按化合價(jià)模型,每個(gè)原子被氫原子飽和;雙鍵用=

表示;三鍵用#表示;環(huán)化分子用閉合原子序號表 示;芳香環(huán)中不飽和原子用小寫字母表示甲烷CH4C水乙醇

H2OOC2H5OHCCO氰化氫HCNC#N環(huán)已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc1*SMILES甲烷CH4C水 H2OO氰化5?分子中分支用()表示;用/和\表示雙鍵順反異 構(gòu);對映異構(gòu):手性原子用[]表示,@表示反時(shí) 針,@@表示順時(shí)針反式二溴甲烷順式二溴甲烷L-丙氨酸D-丙氨酸

Br/C=C/Br或Br\C=C\Br Br\C=C/Br或Br/C=C\BrN[C@@H](C)C(=O)O N[C@H](C)C(=O)O*?分子中分支用()表示;用/和\表示雙鍵順反異反6?用圖表示?用矩陣表示CCCC CCC

NCHHC OHO*(二)以二維形式表示?用圖表示?用矩陣表示CCCCCC NHHCHO*(二)7?用連接表表示*?用連接表表示*8(三)以三維形式表示

1、直接坐標(biāo)法

用卡迪爾坐標(biāo)直接存儲每個(gè)原子的三維坐 標(biāo)(x,y,z)*(三)以三維形式表示*9每個(gè)原子位置以與其他原子間的3個(gè)相對位置關(guān)系表示——距離、夾角、二面角r1和r2為鍵長,α為鍵角,τ為扭轉(zhuǎn)角α876

514321378624τ 5zr2r1y1,2-二氯乙烷*2、內(nèi)坐標(biāo)法每個(gè)原子位置以與其他原子間的3個(gè)相對r1和r2為鍵長,α為鍵10(四)分子存儲格式及其相互轉(zhuǎn)換

每一軟件系統(tǒng)都有自己的分子存儲格式

MDL公司的MOL格式(MACSS格式) Tripos公司的MOL2格式 劍橋晶體數(shù)據(jù)庫CSD的FDAT和CIF格式 蛋白質(zhì)數(shù)據(jù)庫PDB的PDB格式(ENT格式)*(四)分子存儲格式及其相互轉(zhuǎn)換*11基本存儲: 分子的元素組成、原子坐標(biāo)、原子連接關(guān)系還能存儲: 分子子結(jié)構(gòu)信息,能適用于生物大分子 原子電荷信息,調(diào)用時(shí)不必再計(jì)算 確定特定原子化學(xué)環(huán)境的原子類型信息*基本存儲:*12二、化合物數(shù)據(jù)庫的生成和管理

輸入 搜尋和檢索 管理 輸出二、化合物數(shù)據(jù)庫的生成和管理13合成反應(yīng)信息管理軟件及數(shù)據(jù)庫目的:用于計(jì)算機(jī)獲取,管理,搜尋,檢索合成反應(yīng),包括反應(yīng)物,產(chǎn)物的結(jié)構(gòu)式及其反應(yīng)的有關(guān)信息計(jì)算機(jī)輔助有機(jī)合成:應(yīng)用計(jì)算機(jī)合成反應(yīng)管理軟件從反應(yīng)數(shù)據(jù)庫中尋找和檢索合成反應(yīng)方法合成反應(yīng)信息管理軟件及數(shù)據(jù)庫目的:用于計(jì)算機(jī)獲取,管理,搜尋14合成反應(yīng)信息管理軟件及數(shù)據(jù)庫管理軟件的功能:輸入:繪制反應(yīng)物和產(chǎn)物結(jié)構(gòu)輸入其他反應(yīng)信息搜尋與檢索:一般用戶繪制出并指明產(chǎn)物或反應(yīng)物結(jié)構(gòu)。合成反應(yīng)信息管理軟件及數(shù)據(jù)庫管理軟件的功能:輸入其他反應(yīng)信息15ISIS(IntegratedScientificInformationManagement System)——MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件?由三個(gè)主要分軟件組成:(1)ISIS/DRAW——用于輸入結(jié)構(gòu)式和搜尋詢問條件(2)ISIS/BASE——用于生成局部數(shù)據(jù)庫及處理信息(3)ISIS/HOST——主服務(wù)器應(yīng)用程序,進(jìn)行通訊連 接,集中數(shù)據(jù)庫數(shù)據(jù)并作處理ISIS(IntegratedScientificIn162D結(jié)構(gòu)輸入:

——計(jì)算機(jī)繪制化學(xué)結(jié)構(gòu)式 ?首先輸入原子和鍵的骨架結(jié)構(gòu),原子數(shù)、電荷會自動(dòng)變 為上下標(biāo) ?軟件的模板中收集大量分子片段 ?可智能分析結(jié)構(gòu)式,處理結(jié)構(gòu)式的編碼和變換 ?還可有附加功能, 如自動(dòng)命名、化學(xué)計(jì) 算、光譜分析等2D結(jié)構(gòu)輸入:17三維結(jié)構(gòu)的轉(zhuǎn)化:

3D結(jié)晶結(jié)構(gòu)轉(zhuǎn)入3D數(shù)據(jù)庫 軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型NHHNCH3OCH3O三維結(jié)構(gòu)的轉(zhuǎn)化:NHCH3OCH3O18三.組合化學(xué)信息管理軟件及數(shù)據(jù)庫意義:產(chǎn)生先導(dǎo)化合物的有效方法庫中化合物既可是分子實(shí)體,也可是虛擬化合物庫的質(zhì)量指標(biāo):化學(xué)多樣性先導(dǎo)化合物優(yōu)化庫的規(guī)模先導(dǎo)化合物篩選103~106<103三.組合化學(xué)信息管理軟件及數(shù)據(jù)庫意義:產(chǎn)生先導(dǎo)化合物的有效方19例:五肽的合成用20種天然氨基酸合成的五肽,組合起來有以下種:二聚體202=400三聚體203=8000四聚體204=160,000五聚體205=3200,000例:五肽的合成用20種天然氨基酸合成的五肽,組合起來有以下種20分子相似性和多樣性分析

數(shù)據(jù)庫的化學(xué)多樣性(chemicaldiversity) 數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)——適用于 先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學(xué)相似性(chemicalsimilarity)

——適用于先導(dǎo)化合物優(yōu)化分子相似性和多樣性分析21

化學(xué)多樣性的定量表達(dá)——Tanimoto系數(shù)用化學(xué)空間中電荷和電勢等描述符比較不同分子的性質(zhì)

TC=c/(a+b-c)

a為A中基礎(chǔ)片斷的描述符的數(shù)目; b為B中基礎(chǔ)片斷的描述符的數(shù)目; c為共有的基礎(chǔ)片斷的描述符的數(shù)目 相同分子TC=1;分子沒有共同描述符時(shí)TC=0 化學(xué)多樣性的定量表達(dá)——Tanimoto系數(shù)22四、化學(xué)信息學(xué)資源

FCD(FineChemicalsDirectory)——MDL維護(hù)。 收載約90000個(gè)化合物和20000種化合物數(shù)據(jù),包括 化學(xué)系統(tǒng)名、俗稱、分子式、分子量、供應(yīng)商、價(jià)格、

CAS登錄號、純度等??赏ㄟ^結(jié)構(gòu)式或其它任何數(shù)據(jù) 檢索

ACD(AvailableChemicalsDirectory)——MDL維 護(hù)。FCD數(shù)據(jù)庫加上可大批量供貨的化學(xué)品信息。目 前有25萬個(gè)化合物

CSD(CambridgeStructureDatabase)——20多 萬個(gè)結(jié)晶的3D結(jié)構(gòu)實(shí)驗(yàn)數(shù)據(jù)及相關(guān)數(shù)據(jù)四、化學(xué)信息學(xué)資源23生物信息處理

生物信息學(xué)(bioinformatics)?基于數(shù)學(xué)、生命科學(xué)、化學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科?利用計(jì)算機(jī)信息處理技術(shù)對大量生物大分子作信息獲取、加工、儲存、分類、檢索與統(tǒng)計(jì)分析,揭示生物大分子的分子結(jié)構(gòu)、功能、同源性和進(jìn)化關(guān)系?推動(dòng)生命科學(xué)的發(fā)展,為創(chuàng)新藥物的研究和開發(fā)奠定基礎(chǔ)生物信息處理 生物信息學(xué)(bioinformatics)24生物信息學(xué)的內(nèi)容

建立可貯存和管理大量生物信息學(xué)數(shù)據(jù)集 的數(shù)據(jù)庫 處理大量數(shù)據(jù)的算法和統(tǒng)計(jì)方法 分析和解釋不同類型的生物數(shù)據(jù),如RNA、

DNA和蛋白質(zhì)序列、蛋白質(zhì)結(jié)構(gòu)、基因表 達(dá)以及生化途徑生物信息學(xué)的內(nèi)容25

可視化,數(shù)據(jù)處理結(jié)構(gòu)預(yù)測(同源模建)GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACAT...ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV...

序列分析蛋白質(zhì)作用網(wǎng)絡(luò)生物信息學(xué)的應(yīng)用

分子動(dòng)力學(xué)模擬 分子相互作用

PowerEdge 6400 可視化,數(shù)據(jù)處理Genomes蛋白質(zhì)作用網(wǎng)絡(luò)生物信息學(xué)的應(yīng)26氨基酸疏水值氨基酸疏水值氨基酸疏水值A(chǔ)la(A)1.8Gly(G)-0.4Pro(P)-1.6Arg(R)-4.5His(H)-3.2Ser(S)-0.8Asn(N)-3.5Ile(I)4.5Thr(T)-0.7Asp(D)-3.5Leu(L)3.8Trp(W)-0.9Cys(C)2.5Lys(K)-3.9Tyr(Y)-1.3Gln(Q)-3.5Met(M)1.9Val(V)4.2Glu(E)-3.5Phe(F)2.8(一)單個(gè)序列分析

根據(jù)單個(gè)氨基酸的物化性質(zhì)推測整個(gè)蛋白質(zhì)的性質(zhì), 也可預(yù)測二級結(jié)構(gòu)出現(xiàn)的可能性

20種氨基酸的疏水參數(shù)*一、核酸和蛋白質(zhì)的序列分析sequenceanalysis氨基酸疏水值氨基酸疏水值氨基酸疏水值A(chǔ)la(A)1.8Gly27氨基酸螺旋(α)偏好鏈(β)偏好Glu1.590.52Val0.901.87Pro0.340.31Ala1.410.72Leu1.341.22Lys1.230.69………………根據(jù)統(tǒng)計(jì)值:谷氨酸(Glu)經(jīng)常出現(xiàn)在α-螺旋中;纈氨酸(Val)常在β-折疊中發(fā)現(xiàn);脯氨酸(Pro)通常不出現(xiàn)于α-螺旋中和β-折疊中,而傾向于在回折中……(數(shù)值=1代表偏好處于平均;>1代表偏好大于平均;<1代表偏好小于平均)*氨基酸螺旋(α)偏好鏈(β)偏好Glu1.590.52Val28(二)雙重序列比較——序列比對sequencealignment

序列對比可以用各種矩陣表達(dá)并作相似性打分 兩個(gè)殘基越相似則打分值越高*(二)雙重序列比較——序列比對sequencealign29多重序列比對可以從更多細(xì)節(jié)上揭示保守模式和結(jié)構(gòu)信息可采用多種統(tǒng)計(jì)算法進(jìn)行多重序列比對*(三)多重序列比對multiplesequencealignment多重序列比對可以從更多細(xì)節(jié)上揭示保守模式和結(jié)構(gòu)信息*(三)30二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測基因

蛋白質(zhì)一級結(jié)構(gòu)

蛋白質(zhì)三維結(jié)構(gòu)決定折疊預(yù)測二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測基因 蛋白質(zhì) 蛋白質(zhì)決定折疊預(yù)測31

主要方法蛋白三維結(jié)構(gòu)預(yù)測從頭預(yù)測法

abinitio

線引法threading

同源模建法homologymodeling基于知識的預(yù)測方法knowledge-basedprediction基于理論的預(yù)測方法theory-basedprediction 主要方法從頭預(yù)測法 線引法 同源模建法基于知識的預(yù)測方法k321、從頭預(yù)測法(abinitioprediction)

采用理論計(jì)算(分子力學(xué)、分子動(dòng)力學(xué)、量子 化學(xué))方法,直接從分子和原子參數(shù)計(jì)算出蛋 白質(zhì)分子的穩(wěn)定構(gòu)象, 理論上最理想的方法,但計(jì)算量極大,對于實(shí) 際分子的計(jì)算超過能力范圍1、從頭預(yù)測法(abinitioprediction)332、穿針引線法,線串法,線程法,折疊識別 (threading,foldrecognition)

根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維 結(jié)構(gòu)——基于知識的預(yù)測 可應(yīng)用于進(jìn)化非常疏遠(yuǎn)的結(jié)構(gòu)預(yù)測 未知蛋白序列與折疊庫中已知結(jié)構(gòu)的蛋白序列 作匹配計(jì)算,將序列吻合的三維結(jié)構(gòu)模塊串連 起來,得到整個(gè)蛋白三維結(jié)構(gòu)2、穿針引線法,線串法,線程法,折疊識別343、同源蛋白模建法homologousmodelbuilding比較分子模擬法comparativemolecularmodeling同源模建homologymodeling同源蛋白法proteinhomology

根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維 結(jié)構(gòu)——基于知識的預(yù)測 同源蛋白有著相似的來源、相似的結(jié)構(gòu)和生物 功能。通過比較蛋白序列的相似性,按同源蛋 白的三維結(jié)構(gòu)為模板,構(gòu)建未知蛋白的結(jié)構(gòu) 一般要求同源性在30%以上,特別是在結(jié)合區(qū) 域同源性要好3、同源蛋白模建法homologousmodelbui35步驟:(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白 (2)二重或多重序列對比 (3)找出共同的二級結(jié)構(gòu)區(qū)域,構(gòu)建骨架 (4)對初始模型作能量優(yōu)化 (5)判斷結(jié)構(gòu)合理性步驟:(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白36

三、代表性生物信息學(xué)數(shù)據(jù)庫(一)核酸數(shù)據(jù)庫

GenBank——美國國立衛(wèi)生研究所NIH國家生物技術(shù)信息中心NCBI

NucleicAcidDatabase(NDB)——由European MolecularBiologyLaboratory(EMBL)創(chuàng)建,現(xiàn)由 英國劍橋的歐洲生物信息學(xué)研究所(European BioinformaticsInstitute,EBI)維護(hù)

DNADataBankofJapan(DDBJ)——日本國 立遺傳學(xué)研究所的日本信息生物學(xué)中心(Centerfor InformationBiology,CIB)開發(fā)維護(hù)三大庫可交互 三、代表性生物信息學(xué)數(shù)據(jù)庫三大庫可交互37PDB(ProteinDataBankatBrookhavenNationalLaboratories)——美國ResearchCollaborationforStructuralBioinformatics(RCSB)開發(fā)維護(hù)的多肽、酶、病毒、碳水化合物和核酸的三維結(jié)構(gòu)數(shù)據(jù)(二)蛋白質(zhì)數(shù)據(jù)庫PDB(ProteinDataBankatBrookh38虛擬篩選(virtualscreening)計(jì)算機(jī)輔助篩選(computer-aidedscreening)計(jì)算機(jī)篩選(screeninginsilico)三維結(jié)構(gòu)搜尋(three-dimensionalstructuresearching)

虛擬:

?計(jì)算機(jī)上進(jìn)行 ?不需要化合物,只需結(jié)構(gòu) ?化合物數(shù)據(jù)庫——實(shí)際分子的索引;虛擬分子; 類藥性分子虛擬篩選(virtualscreening)39

靶點(diǎn)三維結(jié)構(gòu)命中物一、基于靶點(diǎn)結(jié)構(gòu)的虛擬篩選——對接

target-basedvirtualscreening——docking

化合物庫搜尋 靶點(diǎn)命中物一、基于靶點(diǎn)結(jié)構(gòu)的虛擬篩選——對接搜尋40VirtualScreening?對接——受體和配基之間通過能量匹配和空間匹配而相互識別形成分子復(fù)合物,并預(yù)測復(fù)合物結(jié)構(gòu)的操作過程

數(shù)據(jù)庫VirtualScreening?對接——受體和配基之間41分子對接的原理分子對接是將已知三維結(jié)構(gòu)數(shù)據(jù)庫中的分子逐一放在靶標(biāo)分子的活性位點(diǎn)處。通過不斷優(yōu)化受體化合物的位置、構(gòu)象、分子內(nèi)部可旋轉(zhuǎn)鍵的二面角和受體的氨基酸殘基側(cè)鏈和骨架,尋找受體小分子化合物與靶標(biāo)大分子作用的最佳構(gòu)象,并預(yù)測其結(jié)合模式、親和力和通過打分函數(shù)挑選出接近天然構(gòu)象的與受體親和力最佳的配體的一種理論模擬分子間作用的方法。

分子對接的原理42分子對接的種類分子對接的種類主要包括:(1)剛體對接:指在對接過程中,研究體系(受體和配體)的構(gòu)象不發(fā)生變化。適合考察比較大的體系,如蛋白質(zhì)和蛋白質(zhì)間以及蛋白質(zhì)和核酸之間的對接。(2)半柔性對接:指在對接過程中,研究體系尤其是配體的構(gòu)象允許在一定的范圍內(nèi)變化。適合處理大分子和小分子間的對接,對接過程中,小分子的構(gòu)象一般是可以變化的,但大分子是剛性的。(3)柔性對接:指在對接過程中,研究體系的構(gòu)象基本上可以自由變化的。一般用于精確考慮分子間的識別情況。由于計(jì)算過程中體系的構(gòu)象可以變化,所以計(jì)算耗費(fèi)最大。分子對接的種類431、靶點(diǎn)檢驗(yàn):

X-晶體衍射——分辨率、R因子、溫度因子評價(jià) 結(jié)構(gòu)的準(zhǔn)確率

NMR——RMSD評價(jià) 同源模型——同源性、序列與3D結(jié)構(gòu)的相容性打 分值*

(一)靶點(diǎn)結(jié)構(gòu)的預(yù)處理1、靶點(diǎn)檢驗(yàn):*442、靶點(diǎn)處理:加氫原子、加電荷、帶電殘基的質(zhì)子化*2、靶點(diǎn)處理:*453、結(jié)合位點(diǎn)確定:

復(fù)合物中的配體剝離 同源蛋白模型的提示 定點(diǎn)突變(site-mutation) 以程序模擬:InsiteII/Bindsiteanalysis Sybyl/SiteID*3、結(jié)合位點(diǎn)確定:*463D結(jié)構(gòu)轉(zhuǎn)化結(jié)構(gòu)優(yōu)化加電荷類藥性分析多樣性分析*

(二)小分子數(shù)據(jù)庫的預(yù)處理3D結(jié)構(gòu)轉(zhuǎn)化*47(三)分子對接

將小分子配體旋轉(zhuǎn)到靶點(diǎn)結(jié)合位點(diǎn),搜尋 合適的構(gòu)象和取象,使作用力和形狀匹 配,按結(jié)合能打分 一般只考慮配體構(gòu)象,忽略靶點(diǎn)柔性(三)分子對接48

(1)同一分子各種構(gòu)象 (2)不同分子的最佳構(gòu)象基于力場的打分函數(shù)——以分子間作用力表達(dá),忽略熵變半經(jīng)驗(yàn)的自由能打分函數(shù)基于知識的打分函數(shù)——根據(jù)已知復(fù)合物結(jié)構(gòu),計(jì)算作用力統(tǒng)計(jì)值一致性打分——以不同方法分別打分,統(tǒng)計(jì)出打分值排名*

(四)打分函數(shù) (1)同一分子各種構(gòu)象*49[例]

抗艾滋病藥物的發(fā)現(xiàn)——虛擬篩選

艾滋病病毒,人類免疫缺陷病毒

humanimmunodeficiencyvirus,HIV[例]抗艾滋病藥物的發(fā)現(xiàn)——虛擬篩選50

HIV-1蛋白酶(HIV-PR),所催化的水解反應(yīng)在艾滋病病毒 導(dǎo)入人體細(xì)胞過程中起著重要的作用?高效的HIV-PR抑制劑為治療艾滋病的有效藥物?肽類HIV-PR抑制劑生物性質(zhì)不穩(wěn)定,吸收性差,易被代謝分解,因此口服給藥無效 HIV-1蛋白酶(HIV-PR),所催化的水解反應(yīng)在艾滋511.X-射線晶體結(jié)構(gòu)2.搜尋數(shù)據(jù)庫

DOCK程序受點(diǎn)影象反轉(zhuǎn)

DOCK程序搜尋CSD,對接>200個(gè)分子限制:親和力,易合成NOHRF

O

R=Br:溴氟哌啶醇

R=Cl:氟哌啶醇3.生物測試:高選擇性,高活性(Ki=0.1nM)1.X-射線晶體結(jié)構(gòu) DOCK程序 DOCK程序>20052嚴(yán)重急性呼吸道綜合征SevereAcuteRespiratorySyndrome

SARS病原體——SARS冠狀病毒SARS-Cov[例]抗SARS冠狀病毒藥物的設(shè)計(jì)——基于SARS-CoV3CL蛋白酶的虛擬篩選*嚴(yán)重急性呼吸道綜合征SevereAcuteRespira53??????E蛋白(smallenvelopeprotein,小信封蛋白)S蛋白(spikeglycoprotein,刺突糖蛋白)M蛋白(membraneprotein,膜蛋白)N蛋白(nucleocapsidprotein,核衣殼蛋白)多聚酶(polymerase)類3C蛋白酶(3Clikeproteinase,3CL)*SARS-Cov感染宿主細(xì)胞起重要作用的結(jié)構(gòu)蛋白:?E蛋白(smallenvelopeprotein,小信54獲得SARS病毒 重要蛋白基因蛋白表達(dá)蛋白結(jié)構(gòu) 與功能基本思路:

藥物篩選 靶點(diǎn)*獲得SARS病毒蛋白蛋白結(jié)構(gòu)基本思路:*553CL蛋白酶作為抗SARS藥物篩選靶點(diǎn)的優(yōu)點(diǎn):?在冠狀病毒復(fù)制過程中起著重要作用?有許多已知抑制劑,便于迅速開發(fā)?較易表達(dá),有利于加緊研究?有較高的同源性,可用同源法模建三維結(jié)構(gòu)模型*3CL蛋白酶作為抗SARS藥物篩選靶點(diǎn)的優(yōu)點(diǎn):*56(1)3CL蛋白酶序列(GenBank)與各類冠狀病毒蛋白酶序列(PDB)作序列分析和同源性分析(BLAST程序)人冠狀病毒;鼠科肝炎病毒;豬傳染性腹瀉病毒;貓傳染性腹膜炎病毒;禽傳染性支氣管炎病毒;豬冠狀病毒;傳染性胃腸炎病毒(2)傳染性胃腸炎病毒(TGEV)的MPRo與3CL蛋白酶有極高的同源性,特別在底物結(jié)合口袋(活性部位)(3)以TGEVMPRo的X-射線晶體結(jié)構(gòu)為模板,模建3CL蛋白酶三維結(jié)構(gòu)(Sybyl6.8/SiteID程序)*步驟1.同源模建(1)3CL蛋白酶序列(GenBank)與各類冠狀病毒蛋57(1)所建模型與TGEVMPRo晶體結(jié)構(gòu)基本重疊(2)3CL蛋白酶的折疊方式與TGEVMPRo相同,結(jié)合口袋的結(jié)構(gòu)以及空間特征幾乎一樣3CL蛋白酶結(jié)構(gòu)與MPRo蛋白酶晶體結(jié)構(gòu)的重疊圖3CL蛋白酶的緞帶模型*結(jié)果:(1)所建模型與TGEVMPRo晶體結(jié)構(gòu)基本重疊3CL蛋白58步驟2.分析酶-配體作用模型兩種蛋白酶的結(jié)合部位(Sybyl6.8/MOLCAD程序)中,小分子C能以同樣的方式與兩種酶的結(jié)合口袋契合

A.TGEVMPRo蛋白酶

B.SARS3CL蛋白酶

C.蛋白酶抑制劑

兩種蛋白酶的底物結(jié)合口袋的表面特征∴3CL蛋白酶模建模型或TGEVMPRo的晶體結(jié)構(gòu)*步驟2.分析酶-配體作用模型兩種蛋白酶的結(jié)合部位(S59步驟3.虛擬篩選

以SARS冠狀病毒3CL蛋白酶三維結(jié)構(gòu)模型和TGEVMPRo為篩選模型作虛擬篩選(SGIOrigin3800超級計(jì)算機(jī)和392CPU的神威1號超級計(jì)算機(jī))ACD數(shù)據(jù)庫、MDDR數(shù)據(jù)庫、SPECS數(shù)據(jù)庫、中國天然產(chǎn)物數(shù)據(jù)庫(CNPD)和國家藥物篩選中心內(nèi)部樣品庫——共數(shù)十萬個(gè)化合物(1)DOCK4.0作初篩,選出得分高的前1000個(gè)化合物;(2)用Cscore軟件和AutoDock3.0軟件作評價(jià),從每個(gè)數(shù)據(jù)庫中挑選出100個(gè)得分最高的化合物結(jié)果:共找到300個(gè)可能具有抗SARS冠狀病毒潛力的*步驟3.虛擬篩選 以SARS冠狀病毒3CL蛋白酶三維結(jié)60(1)用病毒3CL蛋白酶分子水平篩選模型篩選候選化合物——發(fā)現(xiàn)了7個(gè)具有高活性的化合物(2)在P3實(shí)驗(yàn)室中作SARS病毒感染細(xì)胞水平的測試,發(fā)現(xiàn)5-HT受體拮抗劑(DDDC-AS-001)有明顯的抗SARS病毒感染和保護(hù)細(xì)胞的作用(3)申請專利,以CADD作結(jié)構(gòu)優(yōu)化步驟4.藥理測試*(1)用病毒3CL蛋白酶分子水平篩選模型篩選候步驟4.61對接研究

?阿爾茨海默癥(Alzheimer’sDisease,AD)與乙 酰膽堿(ACh)水平降低和對AChE誘導(dǎo)的β-淀 粉樣蛋白(Aβ)聚集有關(guān) ?治療AD的藥靶:乙酰膽堿酯酶(

acetylcholinesterase,AChE)和Aβ ?AchE抑制劑:美普他酚(Meptazinol)

?研究發(fā)現(xiàn)Aβ的聚集與AChE上的外周陰離子位 點(diǎn)(PAS)有關(guān)XieQetal.J.Med.Chem.2008,51(7):2027*[例]美普他酚雙配體衍生物與AChE的對接研究XieQetal.J.Med.Chem.62

合成n=2-12的多個(gè)美普他酚雙配體類似物,發(fā)現(xiàn)n=9的AChE抑制活性最強(qiáng)(IC50=3.9nM),比美普他酚高2萬倍,同時(shí)對AChE誘導(dǎo)的Aβ聚集具有明顯的抑制作用(IC50=79μM),具雙重作用OH

在美普他酚分子中通過引入不同長度連接鏈,希望使另一個(gè)配體能與PAS相互作用

N(CH2)nNHO*美普他酚雙配體類似物的設(shè)計(jì): 合成n=2-12的多個(gè)美普他酚雙配體類似物,發(fā)現(xiàn)OH 在美63?小鼠乙酰膽堿酯酶(mAChE)——PDB數(shù)據(jù)庫中的琥珀酰膽堿與mAChE的復(fù)合物(PDB編號:2HA2)?雙配體分子(n=9)的三維結(jié)構(gòu)——以CORINA軟件生成,將N原子質(zhì)子化,再用Tripos力場進(jìn)行分子力學(xué)優(yōu)化?以GOLD3.0進(jìn)行分子對接,最后用SYBYL/CScore一致性打分和半經(jīng)驗(yàn)自由能評價(jià)函數(shù)X-SCORE打分,評價(jià)出最優(yōu)結(jié)合構(gòu)象以分子對接證明作用模式:*?小鼠乙酰膽堿酯酶(mAChE)——PDB數(shù)據(jù)庫以分子64*對接模型:證明了AChE抑制作用和Aβ聚集抑制作用AChE催化位點(diǎn)PAS中心*對接模型:證明了AChE抑制作用和Aβ聚集抑制作用ACh65224n=9雙配體與mAChE對接的二維平面示意圖(Ligplot)配體單元深入底部的催化中心,苯環(huán)與Trp86發(fā)另一配體單元處于PAS區(qū)生面對面的疏水作用 酚羥基與His447

的羰基形成氫鍵 氮原子與Tyr124

酚羥基形成氫鍵 氮雜卓環(huán)與Trp286形生面對面的疏水作用*224n=9雙配體與mAChE對接的二維平面示意圖(Ligp66結(jié)合方式與對接相似*雙配基配體與電鰩TcAChE復(fù)合物的單晶X衍射證明:結(jié)合方式與對接相似*雙配基配體與電鰩TcAChE復(fù)合物的單67n=9酚羥基與His440

形成氫鍵 氮卓雜環(huán)與Trp84面 對面的疏水作用 氮卓雜環(huán)與Trp279

形成疏水作用酚羥基與Tyr70和Glu73形成氫鍵*n=9酚羥基與His440 形成氫鍵*68藥物三維結(jié)構(gòu)

(含藥效基團(tuán)單元)藥效基團(tuán)識別藥效基團(tuán)命中物二、基于配體相似性的虛擬篩選ligandsimilarity-basedvirtualscreening

基于藥效基團(tuán)的結(jié)構(gòu)搜尋

化合物庫搜尋藥物三維結(jié)構(gòu)藥效基團(tuán)識別藥效命中物二、基于配體相似性的虛擬篩69藥效基團(tuán)的獲取基于靶點(diǎn)的藥效基團(tuán)基于配體的藥效基團(tuán)藥效基團(tuán)的獲取基于靶點(diǎn)的藥效基團(tuán)基于配體的藥效基團(tuán)701、二維藥效基團(tuán)搜尋

以平面的提問結(jié)構(gòu)搜尋化合物結(jié)構(gòu)式

二維藥效基團(tuán)搜尋

二維子結(jié)構(gòu)搜尋 二維相似性搜尋1、二維藥效基團(tuán)搜尋71NONNOONNNNNNNNO

O

OO

NNOONOONOOquery(1)二維子結(jié)構(gòu)搜尋

搜尋具有與提問結(jié)構(gòu)相同子結(jié)構(gòu)的化合物分子NONNOONNNNNNNNO ONONOO72(2)二維相似性搜尋

搜尋與提問結(jié)構(gòu)某些特征相似的化合物分子

生物電子等排體(2)二維相似性搜尋73OONOOOOO

NOOOONNNOOOOOONNNNSOOOOOPOOPO OOOPOONNNNNOOOOONNNONOOObnbabc2、三維藥效基團(tuán)搜尋

搜尋具有與相同作用基團(tuán)和空間排布的化合物分子OONOOOOO NOOONNNOOOOOONNNNSOOO74?D3受體選擇性拮抗劑——苯酰胺類和的四氫萘類NNHNN

[例]D2/D3受體選擇性拮抗劑藥效基團(tuán)模型?多巴胺D2類受體為抗帕金森癥和安定類藥物的靶點(diǎn)?D3/D4受體可能與精神分裂癥有關(guān)?D2受體選擇性拮抗劑——取代哌嗪/哌啶類

RNNNHClNNNHXORNNNR1R2*?D3受體選擇性拮抗劑——苯酰胺類和的四氫萘類NNHNN [75?挑選26個(gè)D2受體選擇性和22個(gè)D3受體選擇性的化合物分別作為訓(xùn)練集,分別產(chǎn)生D2受體D3受體模型?以Catalyst將結(jié)構(gòu)式轉(zhuǎn)化為三維構(gòu)象,用Bestconformationalanalysis進(jìn)行構(gòu)象優(yōu)化?用Catalyst/HypoGen產(chǎn)生藥效基團(tuán)。選擇5個(gè)結(jié)構(gòu)特征作為藥效基團(tuán)單元:HBAcceptor,HBDonor,HYDPHOBIC,HYDROPHOBaromatic,RINGAROMATIC?為D2/D3受體選擇性拮抗劑分別產(chǎn)生了10個(gè)得分從高到低的Hypothesis*藥效基團(tuán)模型的建立:?挑選26個(gè)D2受體選擇性和22個(gè)D3受體選擇性的化合*76

藥效基團(tuán)模型的可信度:?對于D2受體和D3受體產(chǎn)生的藥效團(tuán)模型,每個(gè)藥效基團(tuán)模型的得分與理想模型的得分差值均大于40,說明數(shù)據(jù)關(guān)聯(lián)的可能性較大?所建立的D2受體和D3受體藥效團(tuán)模型可用于虛擬篩選* 藥效基團(tuán)模型的可信度:*77?以未知化合物作為驗(yàn)證集?大部分預(yù)測值與實(shí)驗(yàn)值處于同一個(gè)數(shù)量級,并反映D2/D3受體的選擇性D2(左)和D3(右)受體拮抗劑藥效基團(tuán)MAPPING圖*未知化合物的活性預(yù)測:?以未知化合物作為驗(yàn)證集?大部分預(yù)測值與實(shí)驗(yàn)值處于同一個(gè)數(shù)7811/27/2022藥物的化學(xué)信息計(jì)算機(jī)系統(tǒng)11/27/2022藥物的化學(xué)信息計(jì)算機(jī)系統(tǒng)79化學(xué)信息學(xué)(Chemoinformatics,chemicalinformatics,Cheminformatics,chemi-informatics)利用計(jì)算機(jī)信息處理技術(shù)對化學(xué)分子結(jié)構(gòu),性質(zhì),來源及用途等相關(guān)信息進(jìn)行管理(包括儲存,分析,處理,檢索和傳遞等)的一種綜合性技術(shù)和學(xué)科。應(yīng)用化學(xué)信息學(xué)可促進(jìn)化學(xué)信息的獲取、轉(zhuǎn)化與共享化學(xué)信息處理化學(xué)信息學(xué)(Chemoinformatics,chemica802D:3D:H3CC化學(xué)分子結(jié)構(gòu)的層次

1D:CH3CHO

OH*一、2D和3D分子結(jié)構(gòu)的計(jì)算機(jī)處理方法2D:3D:H3CC化學(xué)分子結(jié)構(gòu)的層次H*一、2D和3D分81(一)以一維形式表示

對2D結(jié)構(gòu)進(jìn)行編碼——儲存和交換化學(xué)結(jié)構(gòu)式數(shù)據(jù) 的命名法?SMILES(SimplifiedMolecularInputLineEntrySystem,簡化分子線性輸入系統(tǒng))?SLN(Sybyllinearnotation,Sybyl線性標(biāo)記法)*(一)以一維形式表示?SMILES(Simplifi82SMILES

按化合價(jià)模型,每個(gè)原子被氫原子飽和;雙鍵用=

表示;三鍵用#表示;環(huán)化分子用閉合原子序號表 示;芳香環(huán)中不飽和原子用小寫字母表示甲烷CH4C水乙醇

H2OOC2H5OHCCO氰化氫HCNC#N環(huán)已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc1*SMILES甲烷CH4C水 H2OO氰化83?分子中分支用()表示;用/和\表示雙鍵順反異 構(gòu);對映異構(gòu):手性原子用[]表示,@表示反時(shí) 針,@@表示順時(shí)針反式二溴甲烷順式二溴甲烷L-丙氨酸D-丙氨酸

Br/C=C/Br或Br\C=C\Br Br\C=C/Br或Br/C=C\BrN[C@@H](C)C(=O)O N[C@H](C)C(=O)O*?分子中分支用()表示;用/和\表示雙鍵順反異反84?用圖表示?用矩陣表示CCCC CCC

NCHHC OHO*(二)以二維形式表示?用圖表示?用矩陣表示CCCCCC NHHCHO*(二)85?用連接表表示*?用連接表表示*86(三)以三維形式表示

1、直接坐標(biāo)法

用卡迪爾坐標(biāo)直接存儲每個(gè)原子的三維坐 標(biāo)(x,y,z)*(三)以三維形式表示*87每個(gè)原子位置以與其他原子間的3個(gè)相對位置關(guān)系表示——距離、夾角、二面角r1和r2為鍵長,α為鍵角,τ為扭轉(zhuǎn)角α876

514321378624τ 5zr2r1y1,2-二氯乙烷*2、內(nèi)坐標(biāo)法每個(gè)原子位置以與其他原子間的3個(gè)相對r1和r2為鍵長,α為鍵88(四)分子存儲格式及其相互轉(zhuǎn)換

每一軟件系統(tǒng)都有自己的分子存儲格式

MDL公司的MOL格式(MACSS格式) Tripos公司的MOL2格式 劍橋晶體數(shù)據(jù)庫CSD的FDAT和CIF格式 蛋白質(zhì)數(shù)據(jù)庫PDB的PDB格式(ENT格式)*(四)分子存儲格式及其相互轉(zhuǎn)換*89基本存儲: 分子的元素組成、原子坐標(biāo)、原子連接關(guān)系還能存儲: 分子子結(jié)構(gòu)信息,能適用于生物大分子 原子電荷信息,調(diào)用時(shí)不必再計(jì)算 確定特定原子化學(xué)環(huán)境的原子類型信息*基本存儲:*90二、化合物數(shù)據(jù)庫的生成和管理

輸入 搜尋和檢索 管理 輸出二、化合物數(shù)據(jù)庫的生成和管理91合成反應(yīng)信息管理軟件及數(shù)據(jù)庫目的:用于計(jì)算機(jī)獲取,管理,搜尋,檢索合成反應(yīng),包括反應(yīng)物,產(chǎn)物的結(jié)構(gòu)式及其反應(yīng)的有關(guān)信息計(jì)算機(jī)輔助有機(jī)合成:應(yīng)用計(jì)算機(jī)合成反應(yīng)管理軟件從反應(yīng)數(shù)據(jù)庫中尋找和檢索合成反應(yīng)方法合成反應(yīng)信息管理軟件及數(shù)據(jù)庫目的:用于計(jì)算機(jī)獲取,管理,搜尋92合成反應(yīng)信息管理軟件及數(shù)據(jù)庫管理軟件的功能:輸入:繪制反應(yīng)物和產(chǎn)物結(jié)構(gòu)輸入其他反應(yīng)信息搜尋與檢索:一般用戶繪制出并指明產(chǎn)物或反應(yīng)物結(jié)構(gòu)。合成反應(yīng)信息管理軟件及數(shù)據(jù)庫管理軟件的功能:輸入其他反應(yīng)信息93ISIS(IntegratedScientificInformationManagement System)——MDL的綜合性結(jié)構(gòu)和反應(yīng)管理軟件?由三個(gè)主要分軟件組成:(1)ISIS/DRAW——用于輸入結(jié)構(gòu)式和搜尋詢問條件(2)ISIS/BASE——用于生成局部數(shù)據(jù)庫及處理信息(3)ISIS/HOST——主服務(wù)器應(yīng)用程序,進(jìn)行通訊連 接,集中數(shù)據(jù)庫數(shù)據(jù)并作處理ISIS(IntegratedScientificIn942D結(jié)構(gòu)輸入:

——計(jì)算機(jī)繪制化學(xué)結(jié)構(gòu)式 ?首先輸入原子和鍵的骨架結(jié)構(gòu),原子數(shù)、電荷會自動(dòng)變 為上下標(biāo) ?軟件的模板中收集大量分子片段 ?可智能分析結(jié)構(gòu)式,處理結(jié)構(gòu)式的編碼和變換 ?還可有附加功能, 如自動(dòng)命名、化學(xué)計(jì) 算、光譜分析等2D結(jié)構(gòu)輸入:95三維結(jié)構(gòu)的轉(zhuǎn)化:

3D結(jié)晶結(jié)構(gòu)轉(zhuǎn)入3D數(shù)據(jù)庫 軟件將2D化學(xué)結(jié)構(gòu)迅速地轉(zhuǎn)為3D模型NHHNCH3OCH3O三維結(jié)構(gòu)的轉(zhuǎn)化:NHCH3OCH3O96三.組合化學(xué)信息管理軟件及數(shù)據(jù)庫意義:產(chǎn)生先導(dǎo)化合物的有效方法庫中化合物既可是分子實(shí)體,也可是虛擬化合物庫的質(zhì)量指標(biāo):化學(xué)多樣性先導(dǎo)化合物優(yōu)化庫的規(guī)模先導(dǎo)化合物篩選103~106<103三.組合化學(xué)信息管理軟件及數(shù)據(jù)庫意義:產(chǎn)生先導(dǎo)化合物的有效方97例:五肽的合成用20種天然氨基酸合成的五肽,組合起來有以下種:二聚體202=400三聚體203=8000四聚體204=160,000五聚體205=3200,000例:五肽的合成用20種天然氨基酸合成的五肽,組合起來有以下種98分子相似性和多樣性分析

數(shù)據(jù)庫的化學(xué)多樣性(chemicaldiversity) 數(shù)量巨大的、結(jié)構(gòu)不同的貯藏和檢索系統(tǒng)——適用于 先導(dǎo)化合物發(fā)現(xiàn) 數(shù)據(jù)庫的化學(xué)相似性(chemicalsimilarity)

——適用于先導(dǎo)化合物優(yōu)化分子相似性和多樣性分析99

化學(xué)多樣性的定量表達(dá)——Tanimoto系數(shù)用化學(xué)空間中電荷和電勢等描述符比較不同分子的性質(zhì)

TC=c/(a+b-c)

a為A中基礎(chǔ)片斷的描述符的數(shù)目; b為B中基礎(chǔ)片斷的描述符的數(shù)目; c為共有的基礎(chǔ)片斷的描述符的數(shù)目 相同分子TC=1;分子沒有共同描述符時(shí)TC=0 化學(xué)多樣性的定量表達(dá)——Tanimoto系數(shù)100四、化學(xué)信息學(xué)資源

FCD(FineChemicalsDirectory)——MDL維護(hù)。 收載約90000個(gè)化合物和20000種化合物數(shù)據(jù),包括 化學(xué)系統(tǒng)名、俗稱、分子式、分子量、供應(yīng)商、價(jià)格、

CAS登錄號、純度等??赏ㄟ^結(jié)構(gòu)式或其它任何數(shù)據(jù) 檢索

ACD(AvailableChemicalsDirectory)——MDL維 護(hù)。FCD數(shù)據(jù)庫加上可大批量供貨的化學(xué)品信息。目 前有25萬個(gè)化合物

CSD(CambridgeStructureDatabase)——20多 萬個(gè)結(jié)晶的3D結(jié)構(gòu)實(shí)驗(yàn)數(shù)據(jù)及相關(guān)數(shù)據(jù)四、化學(xué)信息學(xué)資源101生物信息處理

生物信息學(xué)(bioinformatics)?基于數(shù)學(xué)、生命科學(xué)、化學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科?利用計(jì)算機(jī)信息處理技術(shù)對大量生物大分子作信息獲取、加工、儲存、分類、檢索與統(tǒng)計(jì)分析,揭示生物大分子的分子結(jié)構(gòu)、功能、同源性和進(jìn)化關(guān)系?推動(dòng)生命科學(xué)的發(fā)展,為創(chuàng)新藥物的研究和開發(fā)奠定基礎(chǔ)生物信息處理 生物信息學(xué)(bioinformatics)102生物信息學(xué)的內(nèi)容

建立可貯存和管理大量生物信息學(xué)數(shù)據(jù)集 的數(shù)據(jù)庫 處理大量數(shù)據(jù)的算法和統(tǒng)計(jì)方法 分析和解釋不同類型的生物數(shù)據(jù),如RNA、

DNA和蛋白質(zhì)序列、蛋白質(zhì)結(jié)構(gòu)、基因表 達(dá)以及生化途徑生物信息學(xué)的內(nèi)容103

可視化,數(shù)據(jù)處理結(jié)構(gòu)預(yù)測(同源模建)GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACAT...ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV...

序列分析蛋白質(zhì)作用網(wǎng)絡(luò)生物信息學(xué)的應(yīng)用

分子動(dòng)力學(xué)模擬 分子相互作用

PowerEdge 6400 可視化,數(shù)據(jù)處理Genomes蛋白質(zhì)作用網(wǎng)絡(luò)生物信息學(xué)的應(yīng)104氨基酸疏水值氨基酸疏水值氨基酸疏水值A(chǔ)la(A)1.8Gly(G)-0.4Pro(P)-1.6Arg(R)-4.5His(H)-3.2Ser(S)-0.8Asn(N)-3.5Ile(I)4.5Thr(T)-0.7Asp(D)-3.5Leu(L)3.8Trp(W)-0.9Cys(C)2.5Lys(K)-3.9Tyr(Y)-1.3Gln(Q)-3.5Met(M)1.9Val(V)4.2Glu(E)-3.5Phe(F)2.8(一)單個(gè)序列分析

根據(jù)單個(gè)氨基酸的物化性質(zhì)推測整個(gè)蛋白質(zhì)的性質(zhì), 也可預(yù)測二級結(jié)構(gòu)出現(xiàn)的可能性

20種氨基酸的疏水參數(shù)*一、核酸和蛋白質(zhì)的序列分析sequenceanalysis氨基酸疏水值氨基酸疏水值氨基酸疏水值A(chǔ)la(A)1.8Gly105氨基酸螺旋(α)偏好鏈(β)偏好Glu1.590.52Val0.901.87Pro0.340.31Ala1.410.72Leu1.341.22Lys1.230.69………………根據(jù)統(tǒng)計(jì)值:谷氨酸(Glu)經(jīng)常出現(xiàn)在α-螺旋中;纈氨酸(Val)常在β-折疊中發(fā)現(xiàn);脯氨酸(Pro)通常不出現(xiàn)于α-螺旋中和β-折疊中,而傾向于在回折中……(數(shù)值=1代表偏好處于平均;>1代表偏好大于平均;<1代表偏好小于平均)*氨基酸螺旋(α)偏好鏈(β)偏好Glu1.590.52Val106(二)雙重序列比較——序列比對sequencealignment

序列對比可以用各種矩陣表達(dá)并作相似性打分 兩個(gè)殘基越相似則打分值越高*(二)雙重序列比較——序列比對sequencealign107多重序列比對可以從更多細(xì)節(jié)上揭示保守模式和結(jié)構(gòu)信息可采用多種統(tǒng)計(jì)算法進(jìn)行多重序列比對*(三)多重序列比對multiplesequencealignment多重序列比對可以從更多細(xì)節(jié)上揭示保守模式和結(jié)構(gòu)信息*(三)108二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測基因

蛋白質(zhì)一級結(jié)構(gòu)

蛋白質(zhì)三維結(jié)構(gòu)決定折疊預(yù)測二、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測基因 蛋白質(zhì) 蛋白質(zhì)決定折疊預(yù)測109

主要方法蛋白三維結(jié)構(gòu)預(yù)測從頭預(yù)測法

abinitio

線引法threading

同源模建法homologymodeling基于知識的預(yù)測方法knowledge-basedprediction基于理論的預(yù)測方法theory-basedprediction 主要方法從頭預(yù)測法 線引法 同源模建法基于知識的預(yù)測方法k1101、從頭預(yù)測法(abinitioprediction)

采用理論計(jì)算(分子力學(xué)、分子動(dòng)力學(xué)、量子 化學(xué))方法,直接從分子和原子參數(shù)計(jì)算出蛋 白質(zhì)分子的穩(wěn)定構(gòu)象, 理論上最理想的方法,但計(jì)算量極大,對于實(shí) 際分子的計(jì)算超過能力范圍1、從頭預(yù)測法(abinitioprediction)1112、穿針引線法,線串法,線程法,折疊識別 (threading,foldrecognition)

根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維 結(jié)構(gòu)——基于知識的預(yù)測 可應(yīng)用于進(jìn)化非常疏遠(yuǎn)的結(jié)構(gòu)預(yù)測 未知蛋白序列與折疊庫中已知結(jié)構(gòu)的蛋白序列 作匹配計(jì)算,將序列吻合的三維結(jié)構(gòu)模塊串連 起來,得到整個(gè)蛋白三維結(jié)構(gòu)2、穿針引線法,線串法,線程法,折疊識別1123、同源蛋白模建法homologousmodelbuilding比較分子模擬法comparativemolecularmodeling同源模建homologymodeling同源蛋白法proteinhomology

根據(jù)已知的蛋白質(zhì)三維結(jié)構(gòu)來預(yù)測可能的三維 結(jié)構(gòu)——基于知識的預(yù)測 同源蛋白有著相似的來源、相似的結(jié)構(gòu)和生物 功能。通過比較蛋白序列的相似性,按同源蛋 白的三維結(jié)構(gòu)為模板,構(gòu)建未知蛋白的結(jié)構(gòu) 一般要求同源性在30%以上,特別是在結(jié)合區(qū) 域同源性要好3、同源蛋白模建法homologousmodelbui113步驟:(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白 (2)二重或多重序列對比 (3)找出共同的二級結(jié)構(gòu)區(qū)域,構(gòu)建骨架 (4)對初始模型作能量優(yōu)化 (5)判斷結(jié)構(gòu)合理性步驟:(1)根據(jù)未知蛋白質(zhì)的序列,尋找同源蛋白114

三、代表性生物信息學(xué)數(shù)據(jù)庫(一)核酸數(shù)據(jù)庫

GenBank——美國國立衛(wèi)生研究所NIH國家生物技術(shù)信息中心NCBI

NucleicAcidDatabase(NDB)——由European MolecularBiologyLaboratory(EMBL)創(chuàng)建,現(xiàn)由 英國劍橋的歐洲生物信息學(xué)研究所(European BioinformaticsInstitute,EBI)維護(hù)

DNADataBankofJapan(DDBJ)——日本國 立遺傳學(xué)研究所的日本信息生物學(xué)中心(Centerfor InformationBiology,CIB)開發(fā)維護(hù)三大庫可交互 三、代表性生物信息學(xué)數(shù)據(jù)庫三大庫可交互115PDB(ProteinDataBankatBrookhavenNationalLaboratories)——美國ResearchCollaborationforStructuralBioinformatics(RCSB)開發(fā)維護(hù)的多肽、酶、病毒、碳水化合物和核酸的三維結(jié)構(gòu)數(shù)據(jù)(二)蛋白質(zhì)數(shù)據(jù)庫PDB(ProteinDataBankatBrookh116虛擬篩選(virtualscreening)計(jì)算機(jī)輔助篩選(computer-aidedscreening)計(jì)算機(jī)篩選(screeninginsilico)三維結(jié)構(gòu)搜尋(three-dimensionalstructuresearching)

虛擬:

?計(jì)算機(jī)上進(jìn)行 ?不需要化合物,只需結(jié)構(gòu) ?化合物數(shù)據(jù)庫——實(shí)際分子的索引;虛擬分子; 類藥性分子虛擬篩選(virtualscreening)117

靶點(diǎn)三維結(jié)構(gòu)命中物一、基于靶點(diǎn)結(jié)構(gòu)的虛擬篩選——對接

target-basedvirtualscreening——docking

化合物庫搜尋 靶點(diǎn)命中物一、基于靶點(diǎn)結(jié)構(gòu)的虛擬篩選——對接搜尋118VirtualScreening?對接——受體和配基之間通過能量匹配和空間匹配而相互識別形成分子復(fù)合物,并預(yù)測復(fù)合物結(jié)構(gòu)的操作過程

數(shù)據(jù)庫VirtualScreening?對接——受體和配基之間119分子對接的原理分子對接是將已知三維結(jié)構(gòu)數(shù)據(jù)庫中的分子逐一放在靶標(biāo)分子的活性位點(diǎn)處。通過不斷優(yōu)化受體化合物的位置、構(gòu)象、分子內(nèi)部可旋轉(zhuǎn)鍵的二面角和受體的氨基酸殘基側(cè)鏈和骨架,尋找受體小分子化合物與靶標(biāo)大分子作用的最佳構(gòu)象,并預(yù)測其結(jié)合模式、親和力和通過打分函數(shù)挑選出接近天然構(gòu)象的與受體親和力最佳的配體的一種理論模擬分子間作用的方法。

分子對接的原理120分子對接的種類分子對接的種類主要包括:(1)剛體對接:指在對接過程中,研究體系(受體和配體)的構(gòu)象不發(fā)生變化。適合考察比較大的體系,如蛋白質(zhì)和蛋白質(zhì)間以及蛋白質(zhì)和核酸之間的對接。(2)半柔性對接:指在對接過程中,研究體系尤其是配體的構(gòu)象允許在一定的范圍內(nèi)變化。適合處理大分子和小分子間的對接,對接過程中,小分子的構(gòu)象一般是可以變化的,但大分子是剛性的。(3)柔性對接:指在對接過程中,研究體系的構(gòu)象基本上可以自由變化的。一般用于精確考慮分子間的識別情況。由于計(jì)算過程中體系的構(gòu)象可以變化,所以計(jì)算耗費(fèi)最大。分子對接的種類1211、靶點(diǎn)檢驗(yàn):

X-晶體衍射——分辨率、R因子、溫度因子評價(jià) 結(jié)構(gòu)的準(zhǔn)確率

NMR——RMSD評價(jià) 同源模型——同源性、序列與3D結(jié)構(gòu)的相容性打 分值*

(一)靶點(diǎn)結(jié)構(gòu)的預(yù)處理1、靶點(diǎn)檢驗(yàn):*1222、靶點(diǎn)處理:加氫原子、加電荷、帶電殘基的質(zhì)子化*2、靶點(diǎn)處理:*1233、結(jié)合位點(diǎn)確定:

復(fù)合物中的配體剝離 同源蛋白模型的提示 定點(diǎn)突變(site-mutation) 以程序模擬:InsiteII/Bindsiteanalysis Sybyl/SiteID*3、結(jié)合位點(diǎn)確定:*1243D結(jié)構(gòu)轉(zhuǎn)化結(jié)構(gòu)優(yōu)化加電荷類藥性分析多樣性分析*

(二)小分子數(shù)據(jù)庫的預(yù)處理3D結(jié)構(gòu)轉(zhuǎn)化*125(三)分子對接

將小分子配體旋轉(zhuǎn)到靶點(diǎn)結(jié)合位點(diǎn),搜尋 合適的構(gòu)象和取象,使作用力和形狀匹 配,按結(jié)合能打分 一般只考慮配體構(gòu)象,忽略靶點(diǎn)柔性(三)分子對接126

(1)同一分子各種構(gòu)象 (2)不同分子的最佳構(gòu)象基于力場的打分函數(shù)——以分子間作用力表達(dá),忽略熵變半經(jīng)驗(yàn)的自由能打分函數(shù)基于知識的打分函數(shù)——根據(jù)已知復(fù)合物結(jié)構(gòu),計(jì)算作用力統(tǒng)計(jì)值一致性打分——以不同方法分別打分,統(tǒng)計(jì)出打分值排名*

(四)打分函數(shù) (1)同一分子各種構(gòu)象*127[例]

抗艾滋病藥物的發(fā)現(xiàn)——虛擬篩選

艾滋病病毒,人類免疫缺陷病毒

humanimmunodeficiencyvirus,HIV[例]抗艾滋病藥物的發(fā)現(xiàn)——虛擬篩選128

HIV-1蛋白酶(HIV-PR),所催化的水解反應(yīng)在艾滋病病毒 導(dǎo)入人體細(xì)胞過程中起著重要的作用?高效的HIV-PR抑制劑為治療艾滋病的有效藥物?肽類HIV-PR抑制劑生物性質(zhì)不穩(wěn)定,吸收性差,易被代謝分解,因此口服給藥無效 HIV-1蛋白酶(HIV-PR),所催化的水解反應(yīng)在艾滋1291.X-射線晶體結(jié)構(gòu)2.搜尋數(shù)據(jù)庫

DOCK程序受點(diǎn)影象反轉(zhuǎn)

DOCK程序搜尋CSD,對接>200個(gè)分子限制:親和力,易合成NOHRF

O

R=Br:溴氟哌啶醇

R=Cl:氟哌啶醇3.生物測試:高選擇性,高活性(Ki=0.1nM)1.X-射線晶體結(jié)構(gòu) DOCK程序 DOCK程序>200130嚴(yán)重急性呼吸道綜合征SevereAcuteRespiratorySyndrome

SARS病原體——SARS冠狀病毒SARS-Cov[例]抗SARS冠狀病毒藥物的設(shè)計(jì)——基于SARS-CoV3CL蛋白酶的虛擬篩選*嚴(yán)重急性呼吸道綜合征SevereAcuteRespira131??????E蛋白(smallenvelopeprotein,小信封蛋白)S蛋白(spikeglycoprotein,刺突糖蛋白)M蛋白(membraneprotein,膜蛋白)N蛋白(nucleocapsidprotein,核衣殼蛋白)多聚酶(polymerase)類3C蛋白酶(3Clikeproteinase,3CL)*SARS-Cov感染宿主細(xì)胞起重要作用的結(jié)構(gòu)蛋白:?E蛋白(smallenvelopeprotein,小信132獲得SARS病毒 重要蛋白基因蛋白表達(dá)蛋白結(jié)構(gòu) 與功能基本思路:

藥物篩選 靶點(diǎn)*獲得SARS病毒蛋白蛋白結(jié)構(gòu)基本思路:*1333CL蛋白酶作為抗SARS藥物篩選靶點(diǎn)的優(yōu)點(diǎn):?在冠狀病毒復(fù)制過程中起著重要作用?有許多已知抑制劑,便于迅速開發(fā)?較易表達(dá),有利于加緊研究?有較高的同源性,可用同源法模建三維結(jié)構(gòu)模型*3CL蛋白酶作為抗SARS藥物篩選靶點(diǎn)的優(yōu)點(diǎn):*134(1)3CL蛋白酶序列(GenBank)與各類冠狀病毒蛋白酶序列(PDB)作序列分析和同源性分析(BLAST程序)人冠狀病毒;鼠科肝炎病毒;豬傳染性腹瀉病毒;貓傳染性腹膜炎病毒;禽傳染性支氣管炎病毒;豬冠狀病毒;傳染性胃腸炎病毒(2)傳染性胃腸炎病毒(TGEV)的MPRo與3CL蛋白酶有極高的同源性,特別在底物結(jié)合口袋(活性部位)(3)以TGEVMPRo的X-射線晶體結(jié)構(gòu)為模板,模建3CL蛋白酶三維結(jié)構(gòu)(Sybyl6.8/SiteID程序)*步驟1.同源模建(1)3CL蛋白酶序列(GenBank)與各類冠狀病毒蛋135(1)所建模型與TGEVMPRo晶體結(jié)構(gòu)基本重疊(2)3CL蛋白酶的折疊方式與TGEVMPRo相同,結(jié)合口袋的結(jié)構(gòu)以及空間特征幾乎一樣3CL蛋白酶結(jié)構(gòu)與MPRo蛋白酶晶體結(jié)構(gòu)的重疊圖3CL蛋白酶的緞帶模型*結(jié)果:(1)所建模型與TGEVMPRo晶體結(jié)構(gòu)基本重疊3CL蛋白136步驟2.分析酶-配體作用模型兩種蛋白酶的結(jié)合部位(Sybyl6.8/MOLCAD程序)中,小分子C能以同樣的方式與兩種酶的結(jié)合口袋契合

A.TGEVMPRo蛋白酶

B.SARS3CL蛋白酶

C.蛋白酶抑制劑

兩種蛋白酶的底物結(jié)合口袋的表面特征∴3CL蛋白酶模建模型或TGEVMPRo的晶體結(jié)構(gòu)*步驟2.分析酶-配體作用模型兩種蛋白酶的結(jié)合部位(S137步驟3.虛擬篩選

以SARS冠狀病毒3CL蛋白酶三維結(jié)構(gòu)模型和TGEVMPRo為篩選模型作虛擬篩選(SGIOrigin3800超級計(jì)算機(jī)和392CPU的神威1號超級計(jì)算機(jī))ACD數(shù)據(jù)庫、MDDR數(shù)據(jù)庫、SPECS數(shù)據(jù)庫、中國天然產(chǎn)物數(shù)據(jù)庫(CNPD)和國家藥物篩選中心內(nèi)部樣品庫——共數(shù)十萬個(gè)化合物(1)DOCK4.0作初篩,選出得分高的前1000個(gè)化合物;(2)用Cscore軟件和AutoDock3.0軟件作評價(jià),從每個(gè)數(shù)據(jù)庫中挑選出100個(gè)得分最高的化合物結(jié)果:共找到300個(gè)可能具有抗SARS冠狀病毒潛力的*步驟3.虛擬篩選 以SARS冠狀病毒3CL蛋白酶三維結(jié)138(1)用病毒3CL蛋白酶分子水平篩選模型篩選候選化合物——發(fā)現(xiàn)了7個(gè)具有高活性的化合物(2)在P3實(shí)驗(yàn)室中作SARS病毒感染細(xì)胞水平的測試,發(fā)現(xiàn)5-HT受體拮抗劑(DDDC-AS-001)有明顯的抗SARS病毒感染和保護(hù)細(xì)胞的作用(3)申請專利,以CADD作結(jié)構(gòu)優(yōu)化步驟4.藥理測試*(1)用病毒3CL蛋白酶分子水平篩選模型篩選候步驟4.139對接研究

?阿爾茨海默癥(Alzheimer’sDisease,AD)與乙 酰膽堿(ACh)水平降低和對AChE誘導(dǎo)的β-淀 粉樣蛋白(Aβ)聚集有關(guān) ?治療AD的藥靶:乙酰膽堿酯酶(

acetylcholinesterase,AChE)和Aβ ?AchE抑制劑:美普他酚(Meptazinol)

?研究發(fā)現(xiàn)Aβ的聚集與AChE上的外周陰離子位 點(diǎn)(PAS)有關(guān)XieQetal.J.Med.Chem.2008,51(7):2027*[例]

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論