應(yīng)用R進(jìn)行QSAR的嘗試.ppt_第1頁
應(yīng)用R進(jìn)行QSAR的嘗試.ppt_第2頁
應(yīng)用R進(jìn)行QSAR的嘗試.ppt_第3頁
應(yīng)用R進(jìn)行QSAR的嘗試.ppt_第4頁
應(yīng)用R進(jìn)行QSAR的嘗試.ppt_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,應(yīng)用R進(jìn)行QSAR的嘗試,以PAHs在根際消解效果的QSAR分析為例,馬 斌 浙江大學(xué)環(huán)境與資源學(xué)院 2008.12,馬斌:R在QSAR中的應(yīng)用,2,關(guān)于QSAR的背景,定量構(gòu)效關(guān)系(Quantitative Structure-Activity Relationship,簡稱QSAR)是指利用理論計(jì)算和統(tǒng)計(jì)分析工具來研究系列化合物結(jié)構(gòu)與其效應(yīng)之間的定量關(guān)系,即借助結(jié)構(gòu)參數(shù)構(gòu)建數(shù)學(xué)模型來描述化合物結(jié)構(gòu)與活性之間的關(guān)系,馬斌:R在QSAR中的應(yīng)用,3,環(huán)境科學(xué)中進(jìn)行QSAR的目的,由于測定化合物的各種毒性需要花費(fèi)大量的人力、物力和財(cái)力,人們不可能對(duì)眾多化學(xué)品進(jìn)行逐一測定 而利用QSAR 模型

2、即可對(duì)化學(xué)品的生物毒性和環(huán)境行為進(jìn)行預(yù)測,并篩選出具有潛在危害的化學(xué)品,這在環(huán)境科學(xué)研究中無疑是一件極具意義的工作,馬斌:R在QSAR中的應(yīng)用,4,R與QSAR,統(tǒng)計(jì)分析工具,數(shù)學(xué)模型構(gòu)建,馬斌:R在QSAR中的應(yīng)用,5,QSAR中需要的數(shù)學(xué)方法,R中的各種包提供幾乎所有QSAR研究需要的數(shù)學(xué)方法 如果將這些方法集合為一個(gè)QSAR專用的包,無論對(duì)R的發(fā)展還是QSAR的應(yīng)用都是有利的,馬斌:R在QSAR中的應(yīng)用,6,QSAR過程與R,結(jié)構(gòu)參數(shù)的計(jì)算 R的meta-analysis包,主觀篩選 客觀篩選,多元分析 神經(jīng)網(wǎng)絡(luò),交叉驗(yàn)證法 蒙特卡羅驗(yàn)證,輸入未知參數(shù),馬斌:R在QSAR中的應(yīng)用,7,R

3、中包含QSAR數(shù)學(xué)方法的包,馬斌:R在QSAR中的應(yīng)用,8,R是QSAR的有力工具,但是,需要的數(shù)學(xué)方法分散在大量不同的包中,就如無數(shù)的寶藏埋藏在世界各地,馬斌:R在QSAR中的應(yīng)用,9,應(yīng)用R進(jìn)行QSAR的一個(gè)嘗試,以R進(jìn)行多環(huán)芳烴(PAHs)在植物根際消解效果的QSAR分析為例子來說明R再Q(mào)SAR中的應(yīng)用,馬斌:R在QSAR中的應(yīng)用,10,為什么研究多環(huán)芳烴(PAHs,馬斌:R在QSAR中的應(yīng)用,11,數(shù)據(jù)庫的建立,活性參數(shù)是PAHs在植物根際消解效果,采用meta-analysis中常用的效應(yīng)值(effect sizes, d)表示。d=ln(E/C) 分子結(jié)構(gòu)參數(shù)通過Dragon 5(

4、Talanet)計(jì)算得到965個(gè)結(jié)構(gòu)參數(shù),包括拓?fù)鋮?shù)和理化參數(shù),馬斌:R在QSAR中的應(yīng)用,12,參數(shù)的篩選,用主觀選擇對(duì)結(jié)構(gòu)參數(shù)進(jìn)行篩選,去掉所有值為恒量的參數(shù),然后計(jì)算余下參數(shù)的相關(guān)系數(shù)矩陣,去掉相關(guān)系數(shù)大于等于0.95的兩個(gè)參數(shù)中的一個(gè)。 采用R極大提高篩選效率,馬斌:R在QSAR中的應(yīng)用,13,R中結(jié)構(gòu)參數(shù)的主觀篩選(去除恒量,mol.structuredim.molanfor(k in 1:(dim.mol2-n) if (mol.structure1,k=mol.structurea,k) + mol.structurewrite.table(mol.structure, fil

5、e=molstruc1.csv, sep=,馬斌:R在QSAR中的應(yīng)用,14,R中結(jié)構(gòu)參數(shù)的主觀篩選(去除高相關(guān)性參數(shù),cor.matrix=0.95) +mol.structure-mol.structure,-i; +i-i+1 dim(mol.structure) write.table(cor.matrix,file=matrix.csv, sep=,) write.table(mol.structure,file=molstruc2.csv, sep=,馬斌:R在QSAR中的應(yīng)用,15,PLS構(gòu)建模型, modeling QSAR by PLS library(pls) lnR-re

6、ad.table(lnR.csv,header=TRUE, sep=,) data-cbind(lnR,mol.structure) QSAR-plsr(lnRMLOGP2+MSD+Se+ZM1+X0v+ +X6CH+Eig1Z.1+TI2+MWC08+piPC08 +GGI2+AEig1Z+VRD2+IDDM+HDcpx+IC0+CIC0+ +BIC0+TIC1+SIC1+BIC1+CIC2,data=data, +method=simpls,model=TRUE,馬斌:R在QSAR中的應(yīng)用,16,模型驗(yàn)證,cross-validation the QSAR model crossval-c

7、rossval(QSAR, segments = 40, + segment.type = c(random) RMSEP-RMSEP(QSAR) R2-R2(QSAR) plot(crossval) plot(RMSEP) plot(R2) plot(QSAR, ncomp=15,馬斌:R在QSAR中的應(yīng)用,17,RMSE和R2,R2,RMSE,馬斌:R在QSAR中的應(yīng)用,18,優(yōu)化預(yù)測模型,馬斌:R在QSAR中的應(yīng)用,19,用于預(yù)測和預(yù)報(bào),predict unstudied compound perylene-read.table(perylene.csv, header=TRUE, sep=,) new.mol-predict(QSAR, type = response, newdata = perylene,輸入還沒有研究資料的perylene的結(jié)構(gòu)參數(shù),得到效應(yīng)值為-0.86,馬斌:R在QSAR中的應(yīng)用,20,結(jié)論與展望,R在QSAR分析中的最大特點(diǎn)是快捷和簡便。 QSAR的模型構(gòu)建、驗(yàn)證和應(yīng)用過程中都有多種方法可以選擇,而這些方法目前都分布在不同的包中 收集和整理各種常用的QSAR用到的方法,編寫QSAR常用過程的函數(shù),并開發(fā)出不斷更新的包就尤為重要 本文為R的QSAR包作出了一個(gè)開端,馬斌:R在QSAR中的應(yīng)用,21,致謝,感謝第一屆R

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論