網(wǎng)絡藥理學與多向藥理學的藥物靶點預測_第1頁
網(wǎng)絡藥理學與多向藥理學的藥物靶點預測_第2頁
網(wǎng)絡藥理學與多向藥理學的藥物靶點預測_第3頁
網(wǎng)絡藥理學與多向藥理學的藥物靶點預測_第4頁
網(wǎng)絡藥理學與多向藥理學的藥物靶點預測_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

網(wǎng)絡藥理學與多向藥理學的藥物靶點預測

隨著遺傳因子組的時代,隨著化學遺傳因素和藥理學技術的快速發(fā)展,大量潛在目標點和大量生物活性數(shù)據(jù)出現(xiàn)。然而,隨著剩余數(shù)據(jù)的積累,僅通過簡單的分析方法無法滿足高流量大數(shù)據(jù)分析的需要。化學信息學的快速發(fā)展恰好滿足了化學基因組學急需解決的大數(shù)據(jù)處理和信息提取任務要求?;瘜W信息學主要研究如何適當?shù)剡x取化合物庫的多樣性、如何表征藥物分子特征、如何度量不同分子間的差異性、如何識別類藥分子、分子結構和生物性能關系、如何研發(fā)相應的計算機軟硬件等,這就包括了化學計量學及計算化學的研究任務和內容?;瘜W信息學方法在后基因組時代的一個重要應用就是根據(jù)已有的各種生物和化學信息來預測小分子化合物的潛在作用靶點,以及闡釋其作用機制,加速藥物的研發(fā)進程。藥物靶點的預測對于早期藥物分子的成藥性評價和老藥新用等領域都具有重大意義,但由于通量、精度和費用的限制,實驗手段的應用難以廣泛開展。作為一類快速而低成本的方法,計算機輔助靶點預測算法的開發(fā)正受到越來越多的重視。本文結合國內外多個課題組的研究成果,綜述各種常見的藥物靶點預測理論方法及資源,并介紹了化學信息學方法在藥物靶標預測方面的成功應用。根據(jù)研究策略的不同,可將基于化學信息學的藥物靶點預測分為3類:基于配體特征的預測、基于蛋白結構特征的預測、基于數(shù)據(jù)挖掘方法的預測。對于每種研究策略,作者將結合靶點預測的方法原理與國內外研究成果進行較為詳細的介紹(表1)。1查詢分子潛在作用靶點的預測基于配體結構特征的藥物靶點預測主要包括化學相似性搜索以及反向藥效團搜索?;瘜W相似性搜索的理論依據(jù)是結構或物理化學性質相似的小分子化合物可作用于性質相同或相近的靶點。因此,可通過比較查詢分子與已知靶點活性分子的結構或物理化學性質來預測查詢分子的潛在作用靶點。反向藥效團搜索是指通過預先構建好含有多個藥效團模型的藥效團數(shù)據(jù)庫,再用單個查詢分子去反向匹配,最終尋找與查詢結構匹配較好的靶點。1.1基于三維分子相似性方法的在線靶點預測最常見的化學相似性檢索有二維結構相似性檢索和三維分子相似性方法。二維結構相似性檢索主要是采用基于分子指紋方法生成的二維拓撲描述符,如MDLPublicKeys、SciTegicECFP(extendedconnectivityfingerprints)等,然后通過計算相似度如Tanimoto系數(shù)來比較兩個分子之間的相似性。Keiser等通過將65000個配體分子與數(shù)百個藥物靶點進行關聯(lián),進而使用配體拓撲學計算每個藥物靶點集合的相似性打分值,并使用統(tǒng)計學模型對相似性分值的重要性進行排序。最終發(fā)現(xiàn)了一些已有的藥物可靶向新的靶點,如麻醉藥美沙酮可作用于新的靶點毒蕈堿M3受體,麻醉和止瀉藥洛哌丁胺可靶向神經(jīng)激肽NK2受體。SEArch正是該課題組基于此理論基礎進一步發(fā)展起來的一個基于二維分子指紋描述符(ScitegicECFP4)的在線靶點預測工具。該工具可通過輸入查詢分子的smiles格式,選擇檢索ChEMBL、MDLDrugDataReport等不同的活性數(shù)據(jù)庫,最終預測查詢分子的潛在靶點。三維分子相似性方法是基于三維形狀相似的分子可作用于相似或相同靶點的假設。ChemMapper是基于華東理工大學李洪林課題組開發(fā)的三維分子相似性程序SHJAFTS進行靶點預測及化學關系發(fā)現(xiàn)的多功能免費Web計算平臺。該平臺從各類化合物數(shù)據(jù)庫中整合了超過35萬個包含生物活性及靶點注釋的化合物。該課題組針對NMDA型谷氨酸受體抑制劑Vadilex進行了預測,發(fā)現(xiàn)了數(shù)個已證實的靶點。AbdulHameed等通過整合Drugbank上1150個包含生物活性及靶點注釋信息的藥物分子,然后應用三維形狀比較程序ROCs計算查詢分子與藥物分子的相似度,從而預測查詢分子的潛在靶點。該方法經(jīng)過了DatabaseofUsefulDecoy(DUD)數(shù)據(jù)庫上2950個含有靶點注釋信息活性分子的外部驗證,并被證實可成功預測已知藥物的新靶點。ReverseScreen3D是由英國麗茲大學Jackson課題組在2011年開發(fā)的一個基于二維/三維雜合相似性方法的在線靶點預測程序。該程序基于RCSBProteinDataBank(PDB)數(shù)據(jù)庫,通過自行構建藥物靶點數(shù)據(jù)庫,采用LigaMatch匹配法,搜尋與查詢分子相匹配的潛在靶點。通過對20個查詢分子進行外部驗證,結果表明該程序可成功預測大部分的藥物靶點。另外以4-OHtamoxifen作為查詢分子的驗證結果表明,該程序明顯優(yōu)于其他在線靶點預測程序如INVDOCK、TarFisDock和PharmMapper。1.2反向以及基于配體結構的藥物靶點預測反向藥效團搜索是另一種常見的基于配體特征靶點預測方法。PharmMapper是上海藥物研究所劉曉峰博士開發(fā)的以活性小分子為探針、搜尋潛在藥物靶點,從而預測小分子生物活性的反向藥效團匹配方法。該課題組建立了相應的公共網(wǎng)絡服務器PharmMapper(1/pharmmapper)。PharmMapper內置了超過7000個藥效團模型,這些模型關聯(lián)1627個藥物靶點信息。PharmMapper可自動尋找與查詢分子構象最為匹配的藥效團,并根據(jù)其匹配程序進行打分排序。PharmMapper在計算速度方面具有較大優(yōu)勢,可以在數(shù)分鐘至數(shù)十分鐘內完成靶點的預測,為藥物新靶標發(fā)現(xiàn)提供信息技術支撐,有力地促進藥物靶標發(fā)現(xiàn)研究。Inte:Ligand藥效團數(shù)據(jù)庫由奧地利維也納Inte:Ligand公司開發(fā)的一個高質量的三維藥效團數(shù)據(jù)庫。該數(shù)據(jù)庫包含2500多個藥效團模型,覆蓋了300多種臨床相關的藥物治療靶點,該數(shù)據(jù)庫可無縫地集成到Catalyst和DiscoveryStudio/PipelinePilot環(huán)境中,從而在Accelrys標準軟件產(chǎn)品中進行使用。Schuster于2010年綜述了使用反向藥效團模型方法預測小分子靶點的幾個典型成功案例。Steindl等用LigandScout構建了5個抗病毒靶點的50個藥效團模型,然后用基于PipelinePilot的藥效團并行篩選方法測試100個注釋有靶點信息的抗病毒化合物。測試結果表明,該方法可以成功預測88%化合物的靶點信息。類似的研究也被成功運用于CYP抑制劑以及PPAR抑制劑的靶點預測。Rollinger等采用基于配體的反向藥效團方法對曇香科植物曇香的16個次級代謝物進行靶點預測的研究,他們使用了Inte:Ligand公司開發(fā)的包含2289個藥效團模型的數(shù)據(jù)庫進行反向尋靶,最終挑選預測結果中的3個靶點進行了實驗驗證。結果表明,arborinine分子可在體外抑制乙酰膽堿酯酶(AchE)的活性(IC50=34.8μmol·L-1),在人類鼻病毒外殼蛋白(HBV)抑制實驗中6,7,8-trimethoxycoumarin與arborinine活性分別為11.98和3.16μmol·L-1;同時rutamarin分子被驗證為大麻受體-2(CB2)配體分子,實驗親和力為7.4μmol·L-1?;谂潴w結構特征的藥物靶點預測方法近年來發(fā)展迅速,一方面是由于具有靶點注釋信息的生物活性數(shù)據(jù)庫越來越多,這些數(shù)據(jù)庫均可利用相似度搜索進行靶點預測;另一方面該類方法計算速度非常迅速,可在數(shù)秒內完成對數(shù)百萬分子的檢索,這為通過網(wǎng)絡訪問提交任務從而迅速反饋結果提供了可行性。但由于該類方法并不考慮相應生物靶點大分子的三維結構,未能充分體現(xiàn)查詢分子與預測靶點的相互結合模式。另外僅僅考慮查詢小分子與活性數(shù)據(jù)庫中小分子相似度打分值未能真正客觀體現(xiàn)藥物與潛在靶點的親和力,這是由于活性數(shù)據(jù)庫中小分子間活性值差異大,或針對同一個靶點的活性測試結果因來源不同而測試方法不統(tǒng)一的情況。因此,如能在打分函數(shù)中合理考慮到這些因素,則可提高預測的精度。2反向對接優(yōu)化靶點預測基于蛋白結構特征的靶點預測通常指的是反向分子對接方法。該方法是將查詢分子與靶點數(shù)據(jù)庫如PDB中的若干個藥物靶點分子進行分子對接,從中挑選出結合情況最好的候選者,認為其為給定小分子化合物的潛在靶點。INVDOCK是由新加坡國立大學于2001年開發(fā)的第一個反向對接程序,并成功應用于藥物分子4H-三苯氧胺和維生素E的靶點預測。所有蛋白分子的三維結構來自PDB數(shù)據(jù)庫,并采用分子對接程序DOCK中的算法,通過重疊球體定義受體分子潛在結合位點,將藥物分子與2700多個結合位點進行反向對接,用基于蛋白-配體相互作用能的親合性打分函數(shù)進行打分并排序,從而預測出藥物分子的潛在靶點。上海交通大學Bio-X研究所楊輪博士等同樣采用DOCK分子對接程序,開發(fā)了基于反向分子對接的網(wǎng)站服務DRAR-CPI:/drar/,用于化合物-蛋白質相互作用網(wǎng)絡預測,并成功發(fā)現(xiàn)多個與藥物副作用密切相關的脫靶蛋白。TarFisDock。這提示了TarFishDock進行靶點預測可靠性較高,有望成為一種對老藥進行靶點辨識及機制研究的有用工具。2008年他們又進一步發(fā)展了潛在藥物靶點庫(PDTD),包含1207個重要靶點的信息和三維結構,為用反向對接方法尋找化合物的藥物作用靶點提供了技術支撐。IDTarget是由國立臺灣大學生物信息學課題組開發(fā)的一款反向尋靶的免費在線工具。該程序目前可預測小分子與7864個靶點的相互作用,它采用改良的Autodock打分函數(shù),考慮小分子的柔性構象變化,通過結合自由能作為對接結果優(yōu)劣的依據(jù)。該程序已被成功應用于蛋白激酶抑制劑和他汀類藥物靶點的預測。復旦大學Liu等系統(tǒng)地評價了5種反向對接程序(Gold、Flex、Tarfisdock、TarSearch-X以及TarSearch-M)在靶點預測方面的準確性。該研究小組使用了8個活性小分子作為查詢結構,靶點數(shù)據(jù)庫包含1594個已知的藥物靶點,結果顯示5個反向對接程序中靶點預測準確率最好的程序為TarSearch-X,其次為Gold程序。為了尋找5個含有1,3,5-triazepan-2,6-dione骨架的代表性衍生物潛在靶點,Muller等從PDB數(shù)據(jù)庫中收集了2150個成藥性活性位點,構建新的靶點數(shù)據(jù)庫,并運用高通量分子對接的方法,將5個分子反向對接至所構建的靶點數(shù)據(jù)庫,從中挑選預測結果較好的5個潛在靶點進行實驗驗證,結果發(fā)現(xiàn)該類衍生物均可作用于其中一個靶點secretedphospholipaseA2(sPLA2),其抑制活性在微摩爾級別。Zahler等同樣利用反向對接的方法預測了3個靛玉紅衍生物(5BIO、6BIO和7BIO)可能作用的激酶靶點,共預測了84個含有不同亞型的激酶蛋白,最終挑取了排名前五中的PDK-1激酶進行體外活性驗證,結果發(fā)現(xiàn)了6BIO具有較強抑制該激酶活性(IC50=1.5μmol·L-1)。Lauro等課題組也報道了類似的研究,他們使用反向對接方法研究了多酚類天然產(chǎn)物可能作用的與癌癥相關的163個靶點,值得提出的是他們將不同靶點的結合自由能打分進行了歸一化,從而降低了預測結果的假陽性。根據(jù)預測結果,他們用體外實驗證實了xanthohumol和isoxanthohumol對PDK1以及PKC蛋白激酶的抑制活性。盡管基于蛋白結構特征的靶點預測方法準確率較基于配體特征的高些,但仍存在一些制約因素使得其推廣不容樂觀。首先,反向對接方法本身以及所依賴的打分函數(shù)的精度仍需要提高,同時需要考慮打分值在不同靶點體系上如何歸一化的問題。其次該類方法對計算資源要求較高,很難實現(xiàn)及時反饋預測結果;此外,目前仍有大量的靶蛋白未被實驗解析出來,而同源膜建蛋白又難以準確反映真實靶點的三維結構,造成其預測譜相對局限。3預測數(shù)據(jù)庫的建設數(shù)據(jù)挖掘方法是另一種較為常用的藥物靶點預測方法。數(shù)據(jù)挖掘一般是指從海量數(shù)據(jù)中自動搜索隱藏于其中的與活性有著特殊關系性信息的過程。機器學習是最為常見的數(shù)據(jù)挖掘方法之一。首先,需要將收集的數(shù)據(jù)集分為訓練集與測試集,選擇合適的機器學習算法如神經(jīng)網(wǎng)絡、支持向量機等,以訓練集為學習對象構建預測模型,并用測試集驗證模型的可靠性。目前已有大量采用機器學習算法進行藥物靶點預測的研究報道。通常所用到的數(shù)據(jù)集是包含標準化注釋信息的化學基因組數(shù)據(jù)庫。這些數(shù)據(jù)庫可很好的滿足對海量藥物靶點作用信息進行數(shù)據(jù)挖掘的素材要求。表2列出了可用于數(shù)據(jù)挖掘方法預測藥物靶點的一些常用商業(yè)數(shù)據(jù)庫。這些數(shù)據(jù)庫的源數(shù)據(jù)收集自權威化學或生物類期刊以及專利數(shù)據(jù)庫,包含小分子的化學結構信息與活性數(shù)據(jù)。通過數(shù)據(jù)挖掘這些配體的信息,可建立相應的靶點預測模型。3.1評估化合物的預測能力Nidhi等采用多類別的樸素貝葉斯算法對WOMBAT數(shù)據(jù)庫中關聯(lián)964個已知靶點的活性化合物進行訓練,建立預測模型。每個靶點對應于一個類別,使用二維分子指紋描述符ECFP表征每個化合物的特征。并用最終的輸出模型預測MDDR數(shù)據(jù)庫中化合物的靶點,獲得了77%的準確率。Nigsh等運用兩種不同機器學習算法(Bayesian和Winnow)對WOMBAT數(shù)據(jù)庫中覆蓋20類不同藥理活性的13000個化合物進行訓練,分別使用ECFP_4以及MOLPRINT2D兩種不同分子指紋描述符描述化合物,結果表明Winnow算法所構建的預測模型較Bayesian的更準確。Niwa采用概率神經(jīng)網(wǎng)絡方法,對MDDR數(shù)據(jù)庫中關聯(lián)7大類靶點注釋信息的799個化合物進行研究,隨機選取其中60%用作訓練集,20%用于改進模型參數(shù)的測試集,剩余20%用于評估模型預測能力的外部測試集。在預測模型的建立過程中,僅以常見的24種原子類型作為化合物結構的描述符,預測結果表明90%左右的化合物靶點信息可被正確分類。緊接著模型被用于測試含有靶點注釋信息(非原先7大類靶點)的另外26317個化合物,結果顯示67%~98%的化合物可被正確地劃分到所屬靶蛋白家族中。Wale等使用了ECFP4分子指紋描述符進行藥物靶點預測研究,數(shù)據(jù)集是基于Pubchem上含有231種靶點注釋信息的40170個小分子,運用貝葉斯分類法、二類支持向量機、基于排序的支持向量機、基于級聯(lián)的支持向量機等4種不同方法訓練模型并比較了模型的預測情況。結果表明,基于級聯(lián)的支持向量機方法構建的模型優(yōu)于基于其他方法。Koutsoukas等采用兩類概率算法(拉普拉斯臉的貝葉斯優(yōu)化算法以及Parzen窗口估計法)分別對ChEMBL數(shù)據(jù)庫中關聯(lián)894個人源靶蛋白注釋信息的105946個化合物進行學習,分子指紋描述符采用ECFP_4,輸出的預測模型經(jīng)外部測試集驗證表明結果不是特別理想,兩類模型對于排在前1%化合物的預測準確率分別僅為63.3%和66.6%。本實驗室應用支持向量機技術和貝葉斯算法,構建了丁酰膽堿酯酶抑制劑(BuChEI)的分類模型,并成功應用于BuChEI的虛擬篩選,結合生物活性評價實驗,發(fā)現(xiàn)了10個活性化合物,其中6個為結構新穎的化合物。3.2基于數(shù)據(jù)挖掘的藥物靶點預測方法數(shù)據(jù)挖掘方法預測藥物靶點不僅僅只限于單純引入配體的描述信息,還能通過同時考慮配體與受體信息的方法來進行預測。四川大學楊勝勇課題組最近開發(fā)了一種采用概率融合的方法將分子對接與藥效團結合起來用于藥物靶點的預測,可互補兩種方法單獨使用時的缺陷。這種概率融合方法是基于信度函數(shù)理論(Dempster-ShaferTheory),通過計算查詢分子與靶蛋白庫中每個靶點對接得到的ChemSoreGoldscore以及藥效團匹配得到的fitvalue值,經(jīng)概率分配曲線將3個打分值轉換為3個概率值,運用該理論最終輸出針對每個靶點的綜合概率C-value值,將所有的C-value值進行排序,排名靠前的則是該查詢結構的潛在靶點。作者采用經(jīng)典的多靶點藥物4-tamoxifen對該方法進行驗證,結果表明該方法明顯優(yōu)于單獨使用藥效團或分子對接進行靶點預測的其他方法。另一種同時考慮配體和受體信息的方法是基于計算化學基因組學的數(shù)據(jù)挖掘方法。計算化學基因組學方法是指同時計算小分子與靶點蛋白的描述符,整合成描述配體-受體復合物的組合描述符,然后運用機器學習的方法構建計算模型用于藥物靶點信息的預測。Yabuuchi等采用機器學習算法構建了預測藥物-靶點相互作用信息的化學基因組模型,并將其運用于發(fā)現(xiàn)GPCRs和激酶兩類靶點家族的全新活性小分子。他們的方法獲得了較為滿意的預測結果,其中幾個新的配體已被生物實驗所證實。中國科學院上海藥物研究所王飛博士等計算配體的物理化學描述符和靶點蛋白一級序列描述符,使用支持向量機構建了計算化學基因組模型用于化合物-蛋白質預測。幾個新化學結構骨架的配體作用于GPR40、SIRTKp38和GSK-3P被試驗成功確證。華東理工大學程飛雄博士等基于多個高準確度的多靶點QSAR模型,開發(fā)了預測藥物-靶點相互作用的軟件和相應基于網(wǎng)頁服務CPI-Predictor,該軟件可以對GPCR和激酶兩大家族中300多個重要靶點進行系統(tǒng)性預測,從而輸出小分子可能作用各個靶點的概率值,可用于全新化合物的靶點蛋白預測。目前CPI-Predictor預測的多個老藥如星形孢菌素、可卡因的新靶點已被文獻報道的試驗數(shù)據(jù)證實。黃酮類化合物百可利是本實驗室研制的具有自主知識產(chǎn)權的一類新藥,針對前期在動物模型水平發(fā)現(xiàn)其具有抗帕金森藥效的基礎,為了尋找百可利可能作用的靶點,解釋其作用機制,作者結合了數(shù)據(jù)庫挖掘、分子對接、藥效團搜索、化學相似性搜索等多種藥物靶點預測方法,成功預測了百可利可作用于抗帕金森靶點COMT以及MAO-B,同時證明了其并非作用于NMDA受體。南開大學程彬峰等利用Molinspiration、PharmMapper和KEGG等生物信息學手段對清肺消炎丸進行吸收、靶點及作用通路的預測分析從而探索其抗炎的網(wǎng)絡調控機制。該研究建立了“藥物-靶點-通路-網(wǎng)絡”的研究模式,初步揭示了清肺消炎丸抗炎的多維調控機制,為中藥復方的研究提供了新的思路和方法。基于數(shù)據(jù)挖掘方法的藥物靶點預測具有快速靈活、準確率較高等優(yōu)點。其主要缺點有:(1)采用機器學習方法構建的模型只能適用于預測特定化學空間上的化合物,而對于非該化學空間的化合物則不能保證其原有預測準確率;(2)訓練模型采用的數(shù)據(jù)集必須含有精確的注釋信息,即要求小分子與靶點有明確的對應關系且靶點命名需要標準化,因此普通的化合物數(shù)據(jù)庫并不適用;(3)這類模型往往難以做到定量預測,這是由于構建模型所需生物活性數(shù)據(jù)的來源以及類型不統(tǒng)一難以保證源數(shù)據(jù)的高精度。4種預測方法的比較大量藥物靶點預測方法的開發(fā)與運用,促進了新興學科網(wǎng)絡藥理學的發(fā)展。在這些靶點預測工具的輔助下,研究者發(fā)現(xiàn)了很多在研活性化合物或經(jīng)典老藥新的作用機制,這對加速藥物研發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論