版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1,應(yīng)用R進(jìn)行QSAR的嘗試,以PAHs在根際消解效果的QSAR分析為例,馬 斌 浙江大學(xué)環(huán)境與資源學(xué)院 2008.12,馬斌:R在QSAR中的應(yīng)用,2,關(guān)于QSAR的背景,定量構(gòu)效關(guān)系(Quantitative Structure-Activity Relationship,簡稱QSAR)是指利用理論計(jì)算和統(tǒng)計(jì)分析工具來研究系列化合物結(jié)構(gòu)與其效應(yīng)之間的定量關(guān)系,即借助結(jié)構(gòu)參數(shù)構(gòu)建數(shù)學(xué)模型來描述化合物結(jié)構(gòu)與活性之間的關(guān)系,馬斌:R在QSAR中的應(yīng)用,3,環(huán)境科學(xué)中進(jìn)行QSAR的目的,由于測定化合物的各種毒性需要花費(fèi)大量的人力、物力和財(cái)力,人們不可能對(duì)眾多化學(xué)品進(jìn)行逐一測定 而利用QSAR 模型
2、即可對(duì)化學(xué)品的生物毒性和環(huán)境行為進(jìn)行預(yù)測,并篩選出具有潛在危害的化學(xué)品,這在環(huán)境科學(xué)研究中無疑是一件極具意義的工作,馬斌:R在QSAR中的應(yīng)用,4,R與QSAR,統(tǒng)計(jì)分析工具,數(shù)學(xué)模型構(gòu)建,馬斌:R在QSAR中的應(yīng)用,5,QSAR中需要的數(shù)學(xué)方法,R中的各種包提供幾乎所有QSAR研究需要的數(shù)學(xué)方法 如果將這些方法集合為一個(gè)QSAR專用的包,無論對(duì)R的發(fā)展還是QSAR的應(yīng)用都是有利的,馬斌:R在QSAR中的應(yīng)用,6,QSAR過程與R,結(jié)構(gòu)參數(shù)的計(jì)算 R的meta-analysis包,主觀篩選 客觀篩選,多元分析 神經(jīng)網(wǎng)絡(luò),交叉驗(yàn)證法 蒙特卡羅驗(yàn)證,輸入未知參數(shù),馬斌:R在QSAR中的應(yīng)用,7,R
3、中包含QSAR數(shù)學(xué)方法的包,馬斌:R在QSAR中的應(yīng)用,8,R是QSAR的有力工具,但是,需要的數(shù)學(xué)方法分散在大量不同的包中,就如無數(shù)的寶藏埋藏在世界各地,馬斌:R在QSAR中的應(yīng)用,9,應(yīng)用R進(jìn)行QSAR的一個(gè)嘗試,以R進(jìn)行多環(huán)芳烴(PAHs)在植物根際消解效果的QSAR分析為例子來說明R再Q(mào)SAR中的應(yīng)用,馬斌:R在QSAR中的應(yīng)用,10,為什么研究多環(huán)芳烴(PAHs,馬斌:R在QSAR中的應(yīng)用,11,數(shù)據(jù)庫的建立,活性參數(shù)是PAHs在植物根際消解效果,采用meta-analysis中常用的效應(yīng)值(effect sizes, d)表示。d=ln(E/C) 分子結(jié)構(gòu)參數(shù)通過Dragon 5(
4、Talanet)計(jì)算得到965個(gè)結(jié)構(gòu)參數(shù),包括拓?fù)鋮?shù)和理化參數(shù),馬斌:R在QSAR中的應(yīng)用,12,參數(shù)的篩選,用主觀選擇對(duì)結(jié)構(gòu)參數(shù)進(jìn)行篩選,去掉所有值為恒量的參數(shù),然后計(jì)算余下參數(shù)的相關(guān)系數(shù)矩陣,去掉相關(guān)系數(shù)大于等于0.95的兩個(gè)參數(shù)中的一個(gè)。 采用R極大提高篩選效率,馬斌:R在QSAR中的應(yīng)用,13,R中結(jié)構(gòu)參數(shù)的主觀篩選(去除恒量,mol.structuredim.molanfor(k in 1:(dim.mol2-n) if (mol.structure1,k=mol.structurea,k) + mol.structurewrite.table(mol.structure, fil
5、e=molstruc1.csv, sep=,馬斌:R在QSAR中的應(yīng)用,14,R中結(jié)構(gòu)參數(shù)的主觀篩選(去除高相關(guān)性參數(shù),cor.matrix=0.95) +mol.structure-mol.structure,-i; +i-i+1 dim(mol.structure) write.table(cor.matrix,file=matrix.csv, sep=,) write.table(mol.structure,file=molstruc2.csv, sep=,馬斌:R在QSAR中的應(yīng)用,15,PLS構(gòu)建模型, modeling QSAR by PLS library(pls) lnR-re
6、ad.table(lnR.csv,header=TRUE, sep=,) data-cbind(lnR,mol.structure) QSAR-plsr(lnRMLOGP2+MSD+Se+ZM1+X0v+ +X6CH+Eig1Z.1+TI2+MWC08+piPC08 +GGI2+AEig1Z+VRD2+IDDM+HDcpx+IC0+CIC0+ +BIC0+TIC1+SIC1+BIC1+CIC2,data=data, +method=simpls,model=TRUE,馬斌:R在QSAR中的應(yīng)用,16,模型驗(yàn)證,cross-validation the QSAR model crossval-c
7、rossval(QSAR, segments = 40, + segment.type = c(random) RMSEP-RMSEP(QSAR) R2-R2(QSAR) plot(crossval) plot(RMSEP) plot(R2) plot(QSAR, ncomp=15,馬斌:R在QSAR中的應(yīng)用,17,RMSE和R2,R2,RMSE,馬斌:R在QSAR中的應(yīng)用,18,優(yōu)化預(yù)測模型,馬斌:R在QSAR中的應(yīng)用,19,用于預(yù)測和預(yù)報(bào),predict unstudied compound perylene-read.table(perylene.csv, header=TRUE, sep=,) new.mol-predict(QSAR, type = response, newdata = perylene,輸入還沒有研究資料的perylene的結(jié)構(gòu)參數(shù),得到效應(yīng)值為-0.86,馬斌:R在QSAR中的應(yīng)用,20,結(jié)論與展望,R在QSAR分析中的最大特點(diǎn)是快捷和簡便。 QSAR的模型構(gòu)建、驗(yàn)證和應(yīng)用過程中都有多種方法可以選擇,而這些方法目前都分布在不同的包中 收集和整理各種常用的QSAR用到的方法,編寫QSAR常用過程的函數(shù),并開發(fā)出不斷更新的包就尤為重要 本文為R的QSAR包作出了一個(gè)開端,馬斌:R在QSAR中的應(yīng)用,21,致謝,感謝第一屆R
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 焊接工藝課件-焊條電弧焊V形坡口板對(duì)接橫焊
- 《慢阻肺gold指南》課件
- 《草帽圖解析話術(shù)》課件
- 《心理學(xué)章》課件
- 【課件】發(fā)現(xiàn)你的優(yōu)勢
- 【大學(xué)課件】建筑電氣安裝工程定額計(jì)價(jià)
- 單位管理制度展示匯編【人力資源管理】
- 單位管理制度展示大全職工管理篇
- 單位管理制度展示大合集員工管理篇十篇
- 2025營改增后工程分包合同版本
- 無錫市區(qū)2024-2025學(xué)年四年級(jí)上學(xué)期數(shù)學(xué)期末試題一(有答案)
- GB/T 45014-2024聚合物基復(fù)合材料層壓板緊固件拉脫阻抗試驗(yàn)方法
- 傳播學(xué)(東北林業(yè)大學(xué))知到智慧樹章節(jié)答案
- 2024年安全員之A證考試題庫及完整答案(網(wǎng)校專用)
- 血液凈化中心院內(nèi)感染控制課件
- 統(tǒng)編版2024-2025學(xué)年三年級(jí)上冊語文期末情景測試卷 (無答案)
- 年產(chǎn)1.5萬噸長鏈二元酸工程建設(shè)項(xiàng)目可研報(bào)告
- 績效考核辦法1
- 【MOOC】外科護(hù)理學(xué)-中山大學(xué) 中國大學(xué)慕課MOOC答案
- 年度學(xué)校辦公室工作總結(jié)
- 2025版國家開放大學(xué)法律事務(wù)??啤睹穹▽W(xué)(2)》期末紙質(zhì)考試總題庫
評(píng)論
0/150
提交評(píng)論