計算機輔助藥物設計(完整版).doc_第1頁
計算機輔助藥物設計(完整版).doc_第2頁
計算機輔助藥物設計(完整版).doc_第3頁
計算機輔助藥物設計(完整版).doc_第4頁
計算機輔助藥物設計(完整版).doc_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

資料收集于網絡 如有侵權請聯系網站 刪除 謝謝 計算機輔助藥物設計完整版第1章 概論一、藥物發(fā)現一般過程新藥的研究有三個決定階段:先導化合物的發(fā)現,新藥物的優(yōu)化研究,臨床與開發(fā)研究。計算機輔助藥物設計的主要任務就是先導化合物的發(fā)現與優(yōu)化。二、合理藥物設計1、合理藥物設計(rational drug design)是依據與藥物作用的靶點,即廣義上的受體,如酶、受體、離子通道、病毒、核酸、多糖等,尋找和設計合理的藥物分子。通過對藥物和受體的結構在分子水平甚至電子水平的全面準確了解進行基于結構的藥物設計和通過對靶點的結構、功能、與藥物作用方式及產生生理活性的機理的認識基于機理的藥物設計。CADD通過內源性物質或外源性小分子作為效應子作用于機體的靶點,考察其形狀互補,性質互補(包括氫鍵、疏水性、靜電等),溶劑效應及運動協調性等進行分子設計。2、方法分類(1)合理藥物設計有基于靶點結構的三維結構搜索和全新藥物設計等方法。后者分為模板定位法、原子生長法、分子碎片法。(2)根據受體是否已知分為直接藥物設計和間接藥物設計。前者即通過結構測定已知受體或受體-配體復合物的三維結構,根據受體的三維結構要求設計新藥的結構。受體結構測定方法:同源模建(知道氨基酸序列不知道空間結構時),X射線衍射(可結晶并得到晶體時),多維核磁共振技術(在體液即在水溶液環(huán)境中)。后者通過一些配體的結構知識(SAR,計算機圖形顯示等)推測受體的圖像,提出假想受體,采用建立藥效團模型或3D-QSAR和基于藥效團模型的三維結構搜索等方法,間接進行藥物設計。三、計算化學計算化學包括分子模型、計算方法、計算機輔助分子設計(CAMD)、化學數據庫及有機合成設計。計算方法基本上可分為兩大類:分子力學(采用經典的物理學定律只考慮分子的核而忽略外圍的電子)和量子力學(采用薛定諤方程考慮外圍電子的影響,分為從頭計算方法和半經驗方法)。常用的計算應用有:(1)單點能計算:根據模型中原子的空間位置給出相應原子坐標的勢能;(2)幾何優(yōu)化:系統的修改原子坐標使原子的三維構象能量最小化;(3)性質計算:預測某些物理化學性質,如電荷、偶極矩、生成熱等;(4)構象搜索:尋找能量最低的構象;(5)分子動力學模擬:模擬分子的構象變化。方法選擇主要有三個標準:(1)模型大??;(2)可用的參數;(3)計算機資源四、計算化學中的基本概念1、坐標系統分為笛卡爾坐標(三維空間坐標)和內坐標(Z矩陣表示,參數為鍵長、鍵角、二面角數據)。前者適合于描述一系列的不同分子,多用于分子力學程序,有3N個坐標;后者常用于描述單分子系統內各原子的相互關系,多用于量子力學程序,有3N-6個坐標。2、原子類型:用來標記原子屬性。3、勢能面體系能量的變化被認為能量在一個多維的面上運動,這個面被稱為勢能面。坐標上能量的一階導數為零的點為定點(原子力為零,局部或全局最穩(wěn)定)。4、面積Van der Waals面積:原子以van der Waals為半徑的球的簡單堆積。分子面積:試探分子(常為半徑1.4的水分子)在Van der Waals面積上滾動的面積(包括試探球與分子的接觸面積和分子空穴產生的懸空面積)??山咏娣e:試探球在分子van der Waals表面滾動時試探球原點處所產生的面積。5、單位:鍵長多用(埃,angstroms),鍵能多用kcal/mol表示。五、計算機輔助藥物設計軟件及限制目前CADD存在的問題:蛋白質結構三維結構的真實性和可用性問題(細胞膜上的受體或跨膜蛋白離開原先環(huán)境,空間排列會發(fā)生很大變化,難以得到真實的三維空間結構;大量受體結構未知;很多受體只有一級結構,獲得的三維結構有限);受體-配體相互作用的方式問題;設計的分子能否進行化學合成;藥物體內轉運、代謝和體內毒副作用問題等。第2章 分子力學分子力學是基于原子間存在化學鍵、非鍵原子之間的范德華及靜電相互作用這一經典理論,通過分子幾何、能量、振動光譜及其他物理性質的計算尋求分子的平衡構型及能量,確定有機分子的結構、構象、能量及動力學模型。其計算忽略了電子的貢獻,只考慮核。計算較小僅與分子中原子數目的平方成正比。一般分子動力學軟件提供三種位能面采樣算法:單點:只是對位能面上某一點計算,給出該構象下的系統能量和梯度(反應能量下降方向上該點在位能曲線上陡度)幾何優(yōu)化:對單點位能面采樣,尋找梯度為零的構象,局部最小分子動力學:對勢能面增加動能,導致分子系統按Newton定律運動,在勢能低點運動加快。主要用于能量最小化和構象搜索。受體結構已知,該法計算藥物與受體的結合能;受體未知通過已知配體導出藥效團模型。一、理論簡介分子力學基本思想是通過選擇一套勢函數和從實驗中得到的一套力常數,從給定的分子體系原子的空間坐標的初值,用分子力場描述的體系總能量對于原子坐標的梯度,通過多次迭代的數值算法來得到合理的分子體系的結構。分子的化學鍵具有一定的鍵長、鍵角,分子要調整它的幾何形狀(構象),必須使其鍵長值和鍵角值盡可能接近標準值,同時非鍵作用能處于最小的狀態(tài),由這些鍵長和鍵角調節(jié)構象,給出核位置的最佳分布,即分子的平衡構型。分子力學優(yōu)化只能是局部優(yōu)化,若為了找到全局能量最低構象,須將所有可能的初始構象分別進行優(yōu)化,最后進行比較確定分子體系的最優(yōu)構象。二、分子力場分子力學有能力處理大分子體系,它從經典力學的觀點來描述分子中原子的拓撲結構,是通過分子立場這個分子模擬的基石實現的。如果一個解析表達式能擬合位能面,則此解析表達式就成為分子力場,亦即一個力場的確定就是選擇解析函數形式和確定參數。分子力學用幾個典型結構參數和作用力來描述結構的變化,由分子內相互作用(鍵伸縮,角彎曲,扭轉能 ,面外彎曲等)和分子間相互作用(靜電、氫鍵、vdW)構成。三、能量最小化按是否采用能量的導數分為兩類:非導數法(即單純型法:以逐個改變原子的位置來尋找能量最小值,找到的并不一定是局部最小值,主要用于調整分子的起始構象)和導數法。一階能量導數的方向指向能量最小化的點,梯度反映該點的陡度,有最陡下降法(SD)、共軛梯度法、任意步長逼近法;二階能量導數預測何處能量梯度方向發(fā)生變化,有牛頓-拉普森法。SD:梯度是進行搜索的方向,每次搜索之后舊的方向被新點處的梯度取代,適合優(yōu)化最初段,尤其是減少大量的非鍵相互作用非常有用,適用于大分子。共軛梯度法:不僅運用當前梯度,也采用先前的最小化歷史來確定下一步,收斂比SD快,用于大分子。Newton-Raphson法:原則上可一步收斂,但存儲導數的矩陣太大,不適用于大體系。四、常用的分子力場以適合生物大分子的Amber和適合小分子的MM2為代表。MM3:MM力場對靜電的相互作用采用鍵的偶極方法,對于極性或電荷系統不能充分模擬,適用于小非極性分子的結構和熱動力學模擬。AMBER力場:廣泛用于蛋白質和核酸,不適合用于小分子。OPLS力場:用于蛋白質和核酸,特別適用在液相系統中模擬物理性質。CHARMM力場:適用于生物大分子,充分考慮溶劑和溶劑、溶質和溶質、溶劑和溶質之間的相互作用。BIO+力場:CHARMM力場的補充,采用CHARMM立場的參數,結果與CHARMM一樣。MMFF94力場:運用凝聚態(tài)過程,適合大分子和小分子,且精確一致。Universal力場:針對整個周期表的分子力學和動態(tài)模擬力場,有過渡元素時的最佳選擇。COMPASS力場 五、分子動力學以牛頓力學為基礎,把每個原子看做符合牛頓運動定律的粒子,在一定時間內,連續(xù)幾分牛頓運動方程計算原子的位置和速度得出原子的運動軌道。分子動力學涉及Newton運動方程的積分,需要選取適當的時間步長,選取的時間步長和運動的頻率有關。分子動力學模擬經過三個階段:加熱、模擬(包括平衡期和資料收集期)、冷卻。構建分子的時候是0K(原子運動速度為0),緩慢加熱(使系統在每個步長里都接近平衡,在較短時間達到模擬溫度下的平衡)到模擬溫度。對室溫下的模擬,梯度應小于3,是為了避免人為的在高能區(qū)產生的局部力使分子在張力較大的地方發(fā)生斷裂或扭曲。在模擬期的平衡很重要,可以避免加熱過程中引入人為因素。分子體系冷卻可降低在較高溫度時分子的張力,冷卻過程也叫模擬退火,使分子從高能構象越過一定的能壘轉向穩(wěn)定的低能構象。分子動力學模擬溶劑的作用,可通過選擇媒介的介電常數和周期邊界條件模擬,水的介電常數80.4。采用周期邊界條件模擬是為了消除剛性壁邊界條件和自然邊界條件的表面效應。去頂八面體常用于球形分子。分子力學模擬一般都應先對分子進行幾何優(yōu)化,在幾何優(yōu)化基礎上再對分子進行動力學模擬。分子動力學的作用:(1)分子動力學主要用于能量最小化,和分子力學的區(qū)別:分子力學不能越過一定的能壘,只是局部優(yōu)化;分子動力學模擬則是全局優(yōu)化低能構象(越過能壘高度與模擬溫度有關)。(2)通過分子動力學模擬,可再現分子的各種構象形式,用于推測藥物與受體相作用的構象。(3)分子力學適合處理分子內張力(鍵,角,二面角)或vdw力等分子處于非極性溶劑中,當考慮到極性溶劑(如體內)或溶劑效應時,使用分子動力學方法,Monte carlo方法,Langevin動力學或模擬退火法。六、Monte Carlo方法 利用隨機取樣處理問題的方法稱為Monte Carlo方法,它是一種通過的采取隨機數和概率統計進行猜測來研究問題。分子動力學不能越過的能壘,Monte Carlo構象搜尋可以是跳躍式的,其優(yōu)點是取樣的構象恰當,對低能構象取樣幾率大。七、Langevin Langevin模擬是隨機動力學模擬,通過給各原子分配分子在溶劑中與其他分子相互碰撞并隨著在溶劑中運動產生的摩擦力的值進行模擬。Langevin動力學模擬只是對分子施加一個力模擬碰撞后的能量損失,所以不需要指明溶劑分子,多用于長鏈分子和聚合物。特別適用于研究溶劑中的大分子。八、構象分析描述分子結構的三個層次:分子構造,分子構型,分子構象。構象搜尋采用適當的方法產生各種不同的構象,并對這些構象進行能量最小化,比較這些構象并找出其中能量最低的構象。根據產生構象的方法不同,可分為(1)系統搜尋法(系統地搜尋分子的爭購構象空間,尋找勢能面上的極小點。最基本的搜索方法是格點搜索,即在分子構象空間中以柔性鍵的旋轉角度小間隔為變量逐漸搜索。只適合處理小分子體系,也不適用于環(huán)狀結構。)和(2)非系統搜尋兩類。九、隨機搜尋法(1)模擬退火方法是分子動力學,Monte Carlo和Langevin動力學在模擬時采取溫度緩慢降低的方法。它首先使體系升溫,使分子體系有足夠的能量,克服柔性分子中存在的各種旋轉能壘和順反異構能壘,搜尋全部構象空間,在構象空間中選出一些能量相對極小的構象,然后逐步降溫,再進行分子動力學模擬,此時較高能壘已無法越過,在極小化后去除能量較高的構象,最后可以得到能量最小的優(yōu)勢構象。Monte Carlo退火方法采用Monte Carlo方法的Metropolis采樣算法。在某溫度下,體系有起始構象,構象發(fā)生微小的隨機變化產生新的構象,相應的能量發(fā)生變化。如果能量差不大于零則接受構象變化,新構象成為下一步的初始構象。如果能量大于零,選擇一個隨機數將其與原相比較,若能量小于零則接受,新的構象成為下一次隨機變化的起始點;否則拒絕變化,老的構象仍是下一次隨機變化的起始點(過程中產生Boltzmann分布)。(與Monte Carlo的區(qū)別在于Monte Carlo模擬退火方法中溫度也是體系的變量。模擬退火方法可有效地尋找分子的優(yōu)勢構象,因為其取舍構象時不僅接受能量下降的變化,也接收部分部分能量上升的變化,并且該法不依賴于初始構象。(2)高溫淬火動力學是高溫分子動力學與能量最低化相結合來判斷一系列構象的分布,往往還需要結合模擬退火。(3)遺傳算法(主要用于全局優(yōu)化)算法步驟:隨機產生初始群體,群體中個體以二進制序列標記計算適應值(個體優(yōu)劣的度量和下一代存活概率)通過復制算子、雜交算子和變異算子產生新一代更具適應的群體。對于構象搜尋,染色體二進制序列的值表示分子可旋轉的扭角。適應值為能量的函數。(4)距離幾何法 該方法核心仍為隨機技術。特別適用于導出大量信息無法手工解析的蛋白質與核酸的結構。第3章 量子力學一、量子化學理論簡介應用量子力學原理處理化學問題,形成分子軌道理論、價鍵理論與配位場理論。分子軌道理論(又稱Hartee-Fock理論)在物理模型上有三個基本近似:非相對近似是電子在原子核附近運動而不被的原子核俘獲,必須保持很高運動度。近似認為電子質量等于電子靜止的質量,即電子質量恒為1個單位。Born-Oppenheimer近似是在計算分子總能量(電子總能量與核排斥能值和)時,把電子的運動和核的運動分開處理,忽略貢獻很小的電子態(tài)之間偶合項,即非絕熱項,故又稱絕熱近似。單電子近似則認為電子波函數為n個電子所占據的軌道(單電子函數)的乘積。自洽場:每一個電子的運動狀態(tài)不僅受核力的作用,而且還要受其他n-1個電子所產生的勢場的作用,這樣在描述與電子勢場時,必須考慮受作用的那一個電子狀態(tài)和它本身作為其他電子運動時對勢場的貢獻要一致起來,即自洽起來。這樣的勢場,成為自洽場。1、Hartree-Fock方法固有近似性,它忽略了局部的電子-電子效應,即忽略了電子相關。因此常采取組態(tài)相互作用彌補這一缺點。組態(tài)指電子在其可能達到的各軌道上的排布方式的描述。通過用不同組態(tài)的波函數進行混合來表示分子的波函數稱為組態(tài)相互作用。利用組態(tài)相互作用給出基態(tài)與激發(fā)態(tài)的能量可以預測電子的吸收頻率、紫外可見光譜,用RHF的組態(tài)相互作用而不是用UHF研究鍵的斷裂。2、另一個考慮電子相關能的方法是Mller-Plesset微擾法(MP)(MP2最常用)。3、密度泛函(DFT)方法計算電子相關能。傳統的ab initio HF SCF方法難以考慮電子相關作用,而MP等方法難以處理即使是稍稍較大的體系。與波函數方法相比。DFT使得量子力學方法可以直接用于大分子的計算,比如生物大分子。二、從頭計算法從頭計算法(ab initio)是解全電子體系的非相對論的量子力學方程,全部嚴格計算分子積分,不做任何近似處理。體系的Hamilton算符顯全部電子(包括內層電子)的貢獻。求解Hartree-Fock方程是一個試探和迭代的過程,全部計算達到進一步迭代時軌道能量(或總能量)不再變化(超過某閾值)為止,于是就稱這些軌道與它們所產生的位能場自洽,并將全部過程稱為自洽場(SCF)方法。Roothaan把分子軌道(MO)表示為原子軌道(AO)的基函數線性組合(LCAO-MO),即用LCAO逼近Hartree-Fock軌道,導出一組代數函數,即Hartree-Fock-Roothaan方程或Roothaan方程。原子軌道的集合稱為基組(basis set)。極小基組是Slater型軌道(Slater type orbitals,STO),每個占據軌道只用一個指數相表示,形式為STO-nG,n表示每個原子軌道的Gaussian函數個數,適當表示Slater軌道至少需要有3個Gaussian函數。用具有不同指數來表示每個占據軌道,用兩個指數時的基組稱為雙基組(由一個收縮指數和一個發(fā)散指數線性組合給出計算結果)。若對內層電子采用一個指數,而對價電子采用兩個指數,即為雙混合基組(一般表示為3-21G,3代表有3個Gauss函數描述內層軌道,價電子也有3個gauss函數,2個收縮函數,1個發(fā)散函數)。在雙基組再加上極化函數,用*號表示增加一組d型函數描述2p軌道分子中的極化情況,用*表示表示除增加d型函數外,又增加p型函數表示1s軌道在分子中的計劃情況,稱為雙擴展基組。從頭計算法只是說明它是全電子的、非經驗的計算方法。量子化學從頭計算方法可以獲得相當高的精度,甚至達到所謂的化學精度。三、簡化的從頭計算方法1、價電子從頭計算方法(VE-AB INITIO)2、浮動球高斯軌道方法(FSGO)3、分子碎片法(MF)通常用于研究有機大分子。4、模擬從頭計算分子軌道方法(SAMO)5、基于固體物理的Slater-X方法 四、半經驗方法 定義:引入可調參數,體系Hamilton算符只顯價電子的貢獻。一種基于Hartree-Fock-Roothaan方程,借用經驗或半經驗參數代替分子積分??煞譃樘幚韮r電子和處理全部價電子兩大類。每一類中又分為單電子法和雙電子法兩種。前者忽略了電子間的相互作用,后者則考察了電子間的排斥能。(1)價電子處理(Huckel近似):只考察價電子,對于共軛分子是十分成功的。其單電子法為簡單分子軌道法(HMO),雙電子法為PPP法。(2)全價電子處理:對于非平面型分子,已不能將電子單獨分離出來,必須將電子包括在內的所有價電子都考察進去。單電子法:包括推廣的HMO法(EHMO)。EHMO從是否要求電荷自恰與自洽的嚴格程度又分為簡單EHMO,電荷迭代EHMO(IT-EMHO)和電荷迭代與組態(tài)相關EHMO(C-EHMO,即MWH法)。EHMO不能預測鍵長,計算電荷密度較高,一定條件下計算鍵角比較準確。由于EHMO方法計算量小,又能在研究同系物和分子內部電荷分布、鍵性質、分子軌道能級及其對稱性,較多應用于大分子和含重元素的化合物或原子簇。雙電子法:包括各種忽略微分重疊方法(NDO)及修正的NDO方法。NDO根據雙電子積分時忽略程度又分為全忽略微分重疊方法(CNDO),間略忽略微分重疊方法(INDO)和忽略雙原子微分重疊方法(NDDO)。半經驗方法中常用的計算方法CNDO、INDO:CNDO是最簡單的自洽方法,用于計算敞開和封閉體系基態(tài)的電子性質,是計算藥物電荷分布的首選方法(注:但并非精度最高的方法)。MINDO3是將INDO許多相互作用的計算用參數代替,計算分子基態(tài)性質較為成功,主要用于有機大分子,特別適用于含硫化合物。ZINDO/1將INDO擴展到過渡金屬,用于計算含過渡金屬分子的能量與幾何優(yōu)化,ZINDO/S可用于預測紫外可見光譜,不適用于計算幾何優(yōu)化和分子動力學?;诤雎噪p原子重疊方法有MNDO和AMI法,MNDO方法對NDDO方法所做的的修正主要是采用電荷多極矩作用表示雙中心電子積分,其次是引入帶參數的函數來表示幾個重要積分,最后,它用光譜數據對單中心雙電子積分參數化時部份地考慮了相關能。AM1是對MNDO方法的改進,也是最精確的方法之一,用于含有第一周期和第二周期元素的有機分子,不適用于過渡金屬,計算同時含有氮和氧的分子結果好于MNDO。PM3與AM1方法一樣,只是參數和不一樣,其對非鍵相互作用計算優(yōu)于AM1,主要用于有機分子和主族元素。五、藥物設計中量子力學活性指標無論是藥物分子還是生物大分子,都是具有一定結構的化學物質,它們的化學性質都是有其外周電子的基本結構特性所決定的。1、軌道能量以前沿軌道能量最為重要,它們是HOMO(最高占有軌道能)和LUMO(最低空軌到能)。HOMO能可作為分子給電子能力的量度,而LUMO能則可作為分子接收電子能力的量度。EHOMO與分子的電離勢相關,作為分子給電子能力的量度,其值越小,該軌道中的電子越穩(wěn)定,分子給電子能力越小,ELUMO與分子的電子親和能直接相關,其值越小,電子進入該軌道后體系能量降低越多,該分子接收電子的能力越強。EHOMO與ELUMO之差是非常重要的穩(wěn)定性指標,其差越大穩(wěn)定性越好,在化學反應中的活性越差,該值近似等于分子的最低激發(fā)能,所以有時也將其作為化學反應的最低活化能(但這種想法忽略了分子在激發(fā)態(tài)時的重組,常出現錯誤)。2、電荷密度的大小可以反映各原子發(fā)生反應的傾向性,電子密度越大的位置與親電試劑的反應性越大,而電子密度越小的位置則于親和試劑的反應性越大。3、鍵級(bond order,Prs)即鍵的數目,表示兩個相鄰原子間成鍵的強度。4、離域能亦稱共軛能,是指通過電子的共軛作用發(fā)生超共軛而使體系趨于穩(wěn)定,活化能降低的能量。離域能越大,反應則越易于進行。超離域度(Sr)是以軌道能級系數的倒數加權的電子密度,是離域能的度量參數。5、原子自極化率(r)其值越大則表明他在攻擊物質面前越容易調節(jié)自己的電荷,因而活性也較大,常成為反應活性點。6、前沿電子密度fr也稱福井函數,前沿軌道的電子密度fr是比較分子內部不同位置的化學反應活性的量度。注:前沿軌道電荷只能用來描述同一分子內不同原子的活性。7、靜電勢指一個單位正電荷從無限遠處帶到某一點所要做的功,比單個原子的靜電荷密度更反映實際。六、QM/MM量子力學與分子力學相結合在研究受體與藥物相互作用時,有時要涉及到化學鍵的生成和斷裂,近年來發(fā)展了量子力學與經驗力學相結合的方法QM/MM模型。方法中最重要的一步是根據研究的目的劃分體系,通常將體系化分為如下幾個區(qū)域:量子力學區(qū)域,分子力學區(qū)域和邊界區(qū)域。第4章 二維定量構效關系定量構效關系是研究一組化合物的活性或毒性或藥代性質與其結構之間、物理化學性質之間之間或者拓撲結構之間的相關關系,用數理統計和數理模型加以表征的研究方法。其意義為:在受體結構未知的情況下,揭示化合物的結構與活性的依賴關系,建立表征這種關系的數學模型,以預測新化合物的活性,演繹受體與藥物結合并呈活性時的立體環(huán)境及物理化學要求。 QSAR數據主要由兩部分組成:活性數據又可稱為應變量,在QSAR中,應變量活性參數通常以產生標準生物效應時藥物的物質的量劑量或物質的量濃度的負對數(log1/C)表示?;瘜W描述變量(即為自變量)包括:(1)理化參數描述符疏水性參數 LogP,脂水分配系數。通過搖瓶法和HPLC法測定。電性參數 Hammett 常數:表示芳香取代基的誘導和共軛效應之和;值:取代基誘導效應之和;偶極矩();解離常數pKa;紅外、紫外、NMR、MS等光譜數據。立體參數 Taft立體參數:Es=lg(kx/kH)A Es越小,表示體積越大,水解速度越慢。摩爾折射:=212+2/(3/),數值越大代表體積越大;Van der Waals體積;STERIMOL多維立體參數。(2)分子片段描述符 描述符將分子中某一特征片斷,如原子片斷、環(huán)片斷以及亞結構片斷作為描述符代碼,是一種拓撲學范疇的描述符。 (3)分子連接性指數 反映了分子中各原子排列狀況、分支大小且與多種理化常數及生物活性相關??捎觅|譜的質荷比作為描述符。 (4)其他參數QSAR的分析方法:線性回歸分析法和模式判別法。回歸分析:是對一組數據進行最小二乘擬合處理并建立函數關系的過程。當有幾種性質可能對活性有貢獻時,可用多元回歸來處理。擬合函數的統計評價也是這種分析的一部分。常用的包括Free-Wilson方法和Hansch分析法等。 investigation n. 調查線性關系的判別:因變量與自變量之間是否存在線性關系,可通過對回歸系數進行t檢驗來斷定。進行t檢驗后,如果發(fā)現有的偏回歸系數不顯著,那么就要從回歸方程中刪除這些沒有明顯作用的自變量,刪除變量時不可同時將幾個不顯著的自變量一起去掉,應當先刪去t值最小的一個變量,重新計算回歸方程,對新的回歸方程的回歸系數作檢驗,再刪去新方程中一個不顯著的自變量,如此重復,直到回歸方程中所有的自變量都顯著為止。方程的顯著性檢驗可用復相關系數取值R斷定。復相關系數R反映了因變量與所有自變量之間回歸關系密切的程度,檢驗R的顯著性就是檢驗回歸方程的顯著性。 因變量與自變量總體相關并不意味因變量與每個自變量都顯著相關,因此還需按上述方法對偏回歸系數作顯著性檢驗。 雖然R是衡量總回歸效果的重要標志,但R值的大小與回歸方程中自變量的個數n,及因變量所取的觀察值的個數k有關。當n相對于k不很大時,會獲得較大的R值,即容易產生偶然相關。進行多元回歸時要注意n與k的比例。一般認為n至少是k的4倍或5倍以上,就是說1個自變量要求因變量有45個觀察值對應,以消除偶然相關的影響。另外,需要注意,由自變量預測因變量時,所用的數據不應超出建立回歸方程時數據范圍,不能隨意外推。 數據擬合后所得方程的好壞也可用R2和S兩種統計量來判斷。R2是方程方差在數據方差中所占的份數,R21表示數據對方程完全適合,而R20.50表示數據中只有50的方差可用方程解釋;補充統計量S是觀察值與方程預測值的標準偏差。如果方程的S值較實際測定的標準偏差小,表明數據擬合得較理想。 回歸分析通常被運用于結構非常近似的化合物。當化合物結構差別較大時,由于描述符類型過多且難以產生相關性,此時有模式識別:以建立能區(qū)分活性種類的判別函數為目的。常用的方法:(1)聚類分析 預先將為數眾多的不同取代基(稱為樣本或樣品),按其化學結構參數(稱作變量或指標)進行分類,使化學結構參數相近者歸為一類,不同者歸為其它類別。對樣本分類的方法為Q型聚類方法,對變量分類的方法為R型聚類分析法。 (2)主成分分析 合理地從k個主成分中挑選出少數幾個彼此無相關性的主成分作代表,就可以獲取由原始變量提供的絕大部分信息。(3)非線性變換(4)因子分析 和主成分分析相當類似,利用相關系數矩陣以少數幾個互不相關的主因子來代表原始變量所提供的信息。(5)人工神經網絡QSAR應用:(1)預測同源物質的生物活性(2)避免合成過多的化合物;(3)更有目的地提高化合物的選擇性作用;(4)預測化合物的某些成藥性質;(5)幫助了解藥物的作用機制及描述受體的圖像。2D-QSAR限制:使用前提(1)假定化合物的結構和生物活性之間存在一定的關系,也就是說,結構和活性之間存在函數關系(2)根據已知化合物結構活性數據建立的函數,可以外推置新的化合物(3)化合物的結構可用適當的結構描述符來表示(4)所有化合物的限速反應均相同(5)化合物與酶或受體結合時,藥物、酶或受體所引起的構象變化不予考慮(6)與受體親和力有關的線性自由能參數的具有加和性(7)藥物在體內代謝的差異均予以忽略。定量構效關系的應用注意以下幾個方面:(1)只能應用于作用機制相同的化合物,作用機制不同的化合物難于應用。一般認為,結構相近的同源物,其在體內的作用機制是相同的;(2)只能預測同源物的生物活性,對于非同源物由于作用機制不同不能預測;(3)在預測生物活性方面并不都是成功的。因為所得到的定量關系式還不能完全解釋化合物與受體或酶間的作用情況,同時現有的理化參數還不足以真正描述化合物生物活性的本質;(4)一組同源物質的生物活性變化幅度若小于一個對數單位時,往往難于得到滿意的相關結果,這可以由相關系數r的計算方法造成的;(5)參與回歸分析的化合物數目與所得到的相關式中參數項數目之比至少為5:1,在進行回歸分析計算中,若有偏離較大的化合物需要除掉時,除掉的數據點不能多于原化合物總數的10%,以避免摻入人為的因素而導致機會相關。對于被除去的數據點應給以合理的解釋;(6)定量構效關系的研究不能代替藥物設計的所用工作,也不能發(fā)現結構全新的先導化合物,對于一個全新的化合物也無法預測他的生物活性,這一方面可以通過三維定量構效關系進行。非極性化合物與水混合時會形成互不相溶的兩相,即非極性分子有離開水相進入非極性相的趨勢,即疏水性,非極性溶質與水溶劑的相互作用則稱為疏水效應。疏水常數的定義:化合物在脂水兩相中平衡濃度之比,通常將分子在水-正辛醇體系中的分配系數logP作為疏水性的度量,選擇水正辛醇體系是由于該體系與生物體系相似。LogP的測定方法:(1)搖瓶法。搖動一個裝有兩種互不相溶溶劑和一種溶質的燒瓶,待達到平衡后,分析溶質在其中一相或兩相中的濃度。缺點:速度慢、費時、繁瑣、易受溶質的穩(wěn)定性或純度的影響。(2)薄層色譜法(原理是logP與色譜保留指數RM具有線性關系);(3)反相高效液相色譜法;(4)估算方法 碎片加合性法(原理是把分子劃分為基本片段,每種特定的基本片段具有特定的貢獻值,整個分子的logP值是其所含的所有片段貢獻的加和。由于該法假定分子的疏水常數具有加和性,因而若偏離該假定則就有較大誤差。)基于分子性質的計算方法(注意:含羧基等極性基團的分子在疏水過程中包含電離、水合和形成離子對等現象,其logP的計算偏差較大。)用20個已知LOGP的甾體化合物庫名為建立只有5個參數的回歸方程,預測化合物LOGP的取舍的原則(有可能以實驗題考核): (1)若交叉相關系數0.9,說明兩參數是高度相關的,也就是說回歸方程中只需其中一個就可(2)若刪除與logP相關系數0.05的參數導致F值下降,則不應刪除(3)對兩個參數其它條件相似可刪除與logP相關性小的參數(4)刪除過程中應注意復相關系數R2和Fisher值,以判斷參數的取舍。Hansh回歸方程(即多元線性回歸方程,又稱二維定量構效關系)提出了同源物的生物活性與各種取代基的理化參數之間的依賴關系,采用最小二乘法經多重回歸,用與自由能相關的參數方程表示也就是線性自由能相關方法。Log1/C=-kl2 +k2k3k4Esks,其中C為化合物產生指定生物效應的物質的量濃度、為疏水參數、為電性參數、Es為立體參數、k1,k2,k3,k4代表權重即各因素貢獻大小的系數。1、疏水參數是被取代的化合物的脂水分配系數(正辛醇-水)(logP)與未取代的母體化合物的脂水分配系數之差。-2表示藥物的親脂性和生物活性呈倒拋物線關系。隨著脂溶性增加,到達作用部位的概率也逐漸增加,達高峰后,又由于親脂性過大,則藥物難以在水相中運轉,而在脂肪組織中含量增加,使到達作用部位的概率又下降,所以藥物需要適當的疏水性,活性最大時的疏水性為最適值(logP0 )。(參見下面的HANSCH拋物線模型)2、電性參數指取代基的電性效應對分子反應性能的影響。Hammett取代常數()反映芳環(huán)間位或對位上側鏈取代基的影響(共軛效應與誘導效應之和),為正值表示為吸電子基;負值表示為推電子基。Taft取代常數( *)是反映脂肪族化合物中未構成共軛體系的取代基團極性效應的量度。 3、立體參數:反映所代表基團的大小及它對配體-受體位相互作用接近的影響。Taft Es值為用酸性介質中的水解速率常數反映立體因素的影響。氫的Es值為零,基團越大,Es值越負。摩爾折射(MR)反應是液體的物質的量體積,若方程中MR項為負值,即表示空間位阻為重要影響因素,如果為正值,說明由誘導極化產生的色散力為主要影響因素。van der Waals參數,用van der Waals體積(Vs)和半徑(rv)來表示基團的實際大小,van der Waals半徑和Taft Es值用作立體參數的主要缺點是具有這些常數的基團數目很有限。最小立體差異(MSD)參數:反映一個化學式與另一個化學式相互重疊在一起時,以其不重合部分的差異為基礎。Kubinyi雙線性模型:該模型與Hansch的拋物線模型的不同點是曲線的上升及下降部分均為直線,僅在最適logP0附近為拋物線,且兩直線的斜率根據數據的分布情況而變化,而不是像拋物線那樣上升和下降兩部分為對稱的弧線,因此對數據可更好地擬合。HANSCH-FUJITA法的注意:(1)所有化合物必須是同源物,即母環(huán)相同(2)與受體具有相同的作用機理(3)需要化合物具有較大的物理化學性質的差異(4)所選擇的參數之間不能有相關性(5)化合物的活性差異至少要大于10倍(6)建?;衔锏臄盗恐辽偈腔貧w分析選用參數的5倍。 HANSCH-FUJITA法的限制:(1)只考慮化合物與受體的作用位點,而不考慮化合物化合物與受體結合時的構象變化(2)所有參數只能表達二維意義上的結構特征,不能表征三維特征;不能定量的解釋三維結構與生物活性之間的關系(3)只能用于先導物的優(yōu)化,不能用于先導物的發(fā)現。 第五章 基于受體的藥物設計(直接設計法)分子對接(Molecular Docking),是將小分子化合物(配體)識別、適配和結合于生物大分子(受體)的虛擬操作,旨在發(fā)現與受體結合部位相匹配的小分子化合物。是從虛擬庫中篩選苗頭和先導化合物的重要方法。受體和藥物分子之間通過空間匹配和能量匹配而相互識別形成分子復合物,并預測復合物結構的操作過程。分子對接的用途:(1)研究分子間的結合模式(2)預測分子間的結合能力(3)藥物設計(先導化合物的發(fā)現或者改造)(4)蛋白質工程分子對接的原理:藥物與受體分子的結合強度取決于結合的自由能變化(G結合),結合的自由能變化與藥物-受體復合物的解離常數的對數成線性關系。G結合=-2.303 RT lgKi,即G結合=- 5.85 lgKi基于該公式,由分子對接的能量值即可預測配體與受體間的親和力。結合自由能的變化與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論