




已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1,應用R進行QSAR的嘗試,-以PAHs在根際消解效果的QSAR分析為例,馬 斌 浙江大學環(huán)境與資源學院 2008.12,馬斌:R在QSAR中的應用,2,關于QSAR的背景,定量構效關系(Quantitative Structure-Activity Relationship,簡稱QSAR)是指利用理論計算和統(tǒng)計分析工具來研究系列化合物結構與其效應之間的定量關系,即借助結構參數(shù)構建數(shù)學模型來描述化合物結構與活性之間的關系。,馬斌:R在QSAR中的應用,3,環(huán)境科學中進行QSAR的目的,由于測定化合物的各種毒性需要花費大量的人力、物力和財力,人們不可能對眾多化學品進行逐一測定 而利用QSAR 模型即可對化學品的生物毒性和環(huán)境行為進行預測,并篩選出具有潛在危害的化學品,這在環(huán)境科學研究中無疑是一件極具意義的工作,馬斌:R在QSAR中的應用,4,R與QSAR,統(tǒng)計分析工具,數(shù)學模型構建,馬斌:R在QSAR中的應用,5,QSAR中需要的數(shù)學方法,R中的各種包提供幾乎所有QSAR研究需要的數(shù)學方法 如果將這些方法集合為一個QSAR專用的包,無論對R的發(fā)展還是QSAR的應用都是有利的,馬斌:R在QSAR中的應用,6,QSAR過程與R,結構參數(shù)的計算 R的meta-analysis包,主觀篩選 客觀篩選,多元分析 神經(jīng)網(wǎng)絡,交叉驗證法 蒙特卡羅驗證,輸入未知參數(shù),馬斌:R在QSAR中的應用,7,R中包含QSAR數(shù)學方法的包,馬斌:R在QSAR中的應用,8,R是QSAR的有力工具,但是,需要的數(shù)學方法分散在大量不同的包中,就如無數(shù)的寶藏埋藏在世界各地。,馬斌:R在QSAR中的應用,9,應用R進行QSAR的一個嘗試,以R進行多環(huán)芳烴(PAHs)在植物根際消解效果的QSAR分析為例子來說明R再QSAR中的應用。,馬斌:R在QSAR中的應用,10,為什么研究多環(huán)芳烴(PAHs),馬斌:R在QSAR中的應用,11,數(shù)據(jù)庫的建立,活性參數(shù)是PAHs在植物根際消解效果,采用meta-analysis中常用的效應值(effect sizes, d)表示。d=ln(E/C) 分子結構參數(shù)通過Dragon 5(Talanet)計算得到965個結構參數(shù),包括拓撲參數(shù)和理化參數(shù)。,馬斌:R在QSAR中的應用,12,參數(shù)的篩選,用主觀選擇對結構參數(shù)進行篩選,去掉所有值為恒量的參數(shù),然后計算余下參數(shù)的相關系數(shù)矩陣,去掉相關系數(shù)大于等于0.95的兩個參數(shù)中的一個。 采用R極大提高篩選效率,馬斌:R在QSAR中的應用,13,R中結構參數(shù)的主觀篩選(去除恒量),mol.structuredim.molanfor(k in 1:(dim.mol2-n) if (mol.structure1,k=mol.structurea,k) + mol.structurewrite.table(mol.structure, file=molstruc1.csv, sep=,),馬斌:R在QSAR中的應用,14,R中結構參數(shù)的主觀篩選(去除高相關性參數(shù)),cor.matrix=0.95) +mol.structure-mol.structure,-i; +i-i+1 dim(mol.structure) write.table(cor.matrix,file=matrix.csv, sep=,) write.table(mol.structure,file=molstruc2.csv, sep=,),馬斌:R在QSAR中的應用,15,PLS構建模型,# modeling QSAR by PLS library(pls) lnR-read.table(lnR.csv,header=TRUE, sep=,) data-cbind(lnR,mol.structure) QSAR-plsr(lnRMLOGP2+MSD+Se+ZM1+X0v+ +X6CH+Eig1Z.1+TI2+MWC08+piPC08 +GGI2+AEig1Z+VRD2+IDDM+HDcpx+IC0+CIC0+ +BIC0+TIC1+SIC1+BIC1+CIC2,data=data, +method=simpls,model=TRUE),馬斌:R在QSAR中的應用,16,模型驗證,#cross-validation the QSAR model crossval-crossval(QSAR, segments = 40, + segment.type = c(“random“) RMSEP-RMSEP(QSAR) R2-R2(QSAR) plot(crossval) plot(RMSEP) plot(R2) plot(QSAR, ncomp=15),馬斌:R在QSAR中的應用,17,RMSE和R2,R2,RMSE,馬斌:R在QSAR中的應用,18,優(yōu)化預測模型,馬斌:R在QSAR中的應用,19,用于預測和預報,#predict unstudied compound perylene-read.table(perylene.csv, header=TRUE, sep=,) new.mol-predict(QSAR, type = “response“, newdata = perylene),輸入還沒有研究資料的perylene的結構參數(shù),得到效應值為-0.86,馬斌:R在QSAR中的應用,20,結論與展望,R在QSAR分析中的最大特點是快捷和簡便。 QSAR的模型構建、驗證和應用過程中都有多種方法可以選擇,而這些方法目前都分布在不同的包中 收集和整理各種常用的QSAR用到的方法,編寫QSAR常用過程的函數(shù),并開發(fā)出不斷更新的包就尤為重要 本文為R的QSAR包作出了一個開端,馬斌:R在QSAR中的應用,21,致謝,感謝第一屆
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 狼的名師教學課件
- 小學生語文課前預習有效性的研究
- 山坡羊教學課件
- 【課件】三角形全等的判定(第1課時SAS)+課件-2025-2026學年人教版八年級數(shù)學上冊
- 散學班會課件下載
- 罐頭玩偶教學課件
- 教學課件制作注意
- 【十堰】2025年湖北十堰市丹江口市事業(yè)單位招聘393人筆試歷年典型考題及考點剖析附帶答案詳解
- 日本祭典活動方案
- 春季脫毛活動方案
- 2025年湖北省中考英語試題(附答案)
- 2024年河南省豫地科技集團有限公司招聘真題
- 2024山西杏花村汾酒集團有限責任公司人才招聘筆試參考題庫附帶答案詳解
- GA 1809-2022城市供水系統(tǒng)反恐怖防范要求
- 中醫(yī)內科學癭病
- 醫(yī)療技術分級授權與再授權申請表
- 項目管理九大過程英漢對照表
- 拖欠工資起訴狀模版
- 醫(yī)療技術臨床應用管理信息系統(tǒng)操作手冊
- 北師大版小學數(shù)學四年級下冊《優(yōu)化》同步練習附答案
- 商業(yè)銀行風險預警系統(tǒng)整體架構設計
評論
0/150
提交評論