版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議運(yùn)用運(yùn)用R進(jìn)展進(jìn)展QSAR的嘗試的嘗試 -以PAHs在根際消解效果的QSAR分析為例 馬 斌 binmagmail浙江大學(xué)環(huán)境與資源學(xué)院 2019.12第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議關(guān)于QSAR的背景 定量構(gòu)效關(guān)系定量構(gòu)效關(guān)系(Quantitative Structure-Activity Relationship,簡(jiǎn)稱,簡(jiǎn)稱QSAR)是是指利用實(shí)際計(jì)算和統(tǒng)計(jì)分析工具來(lái)研討指利用實(shí)際計(jì)算和統(tǒng)計(jì)分析工具來(lái)研討系列化合物構(gòu)造與其效應(yīng)之間的定量關(guān)系列化合物構(gòu)造與其效應(yīng)之間的定量關(guān)系,即借助構(gòu)造參數(shù)構(gòu)建數(shù)學(xué)模型來(lái)描系,即借助構(gòu)造參數(shù)構(gòu)建數(shù)學(xué)模型來(lái)描畫化合物
2、構(gòu)造與活性之間的關(guān)系。畫化合物構(gòu)造與活性之間的關(guān)系。 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議環(huán)境科學(xué)中進(jìn)展QSAR的目的 由于測(cè)定化合物的各種毒性需求破費(fèi)大量的人力、物力和財(cái)力,人們不能夠?qū)Ρ姸嗷瘜W(xué)品進(jìn)展逐一測(cè)定 而利用QSAR 模型即可對(duì)化學(xué)品的生物毒性和環(huán)境行為進(jìn)展預(yù)測(cè),并挑選出具有潛在危害的化學(xué)品,這在環(huán)境科學(xué)研討中無(wú)疑是一件極具意義的任務(wù) 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議R與與QSAR統(tǒng)計(jì)分析工具數(shù)學(xué)模型構(gòu)建第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議QSAR中需求的數(shù)學(xué)方法 R中的各種包提供幾乎一切QSAR研討需求的數(shù)學(xué)方法 假設(shè)將這些方法集合為一個(gè)QSAR公用的包,無(wú)論對(duì)R的開(kāi)展還
3、是QSAR的運(yùn)用都是有利的第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議QSAR過(guò)程與R數(shù)據(jù)庫(kù)的建立數(shù)據(jù)庫(kù)的建立 參數(shù)的挑選參數(shù)的挑選 定量關(guān)系模型的構(gòu)建定量關(guān)系模型的構(gòu)建 模型檢驗(yàn)?zāi)P蜋z驗(yàn) 預(yù)測(cè)與預(yù)告運(yùn)用預(yù)測(cè)與預(yù)告運(yùn)用 構(gòu)造參數(shù)的計(jì)算R的meta-analysis包客觀挑選客觀挑選多元分析神經(jīng)網(wǎng)絡(luò)交叉驗(yàn)證法 蒙特卡羅驗(yàn)證 輸入未知參數(shù)第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議R中包含中包含QSAR數(shù)學(xué)方法的包數(shù)學(xué)方法的包逐步回歸stepPLrstepwise前進(jìn)法forwardlars遺傳算法rfwdmvgafitgenalg多元分析lmtestbpcadepthheplotsICSLabdsvLeap
4、s神經(jīng)網(wǎng)絡(luò)NeuralNeuralnet偏最小二乘法GplsPlsLsplsPlsPlsgenomiPplsgplsSpls第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議R是是QSAR的有力工具,但是的有力工具,但是 需求的數(shù)學(xué)方法分散在大量不同的包中,就如無(wú)數(shù)的寶藏埋藏在世界各地。第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議運(yùn)用運(yùn)用R進(jìn)展進(jìn)展QSAR的一個(gè)嘗試的一個(gè)嘗試 以R進(jìn)展多環(huán)芳烴PAHs在植物根際消解效果的QSAR分析為例子來(lái)闡明R再Q(mào)SAR中的運(yùn)用。 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議為什么研討多環(huán)芳烴為什么研討多環(huán)芳烴PAHs第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議數(shù)據(jù)庫(kù)的建立數(shù)據(jù)庫(kù)的建立
5、活性參數(shù)是PAHs在植物根際消解效果,采用meta-analysis中常用的效應(yīng)值(effect sizes, d)表示。d=ln(E/C) 分子構(gòu)造參數(shù)經(jīng)過(guò)Dragon 5(Talanet)計(jì)算得到965個(gè)構(gòu)造參數(shù),包括拓?fù)鋮?shù)和理化參數(shù)。 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議參數(shù)的挑選參數(shù)的挑選 用客觀選擇對(duì)構(gòu)造參數(shù)進(jìn)展挑選,去掉一切值為恒量的參數(shù),然后計(jì)算余下參數(shù)的相關(guān)系數(shù)矩陣,去掉相關(guān)系數(shù)大于等于0.95的兩個(gè)參數(shù)中的一個(gè)。 采用R極大提高挑選效率 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議R中構(gòu)造參數(shù)的客觀挑選去除恒量中構(gòu)造參數(shù)的客觀挑選去除恒量mol.structuredim.mol
6、anfor(k in 1:(dim.mol2-n) if (mol.structure1,k=mol.structurea,k)+ mol.structure-mol.structure,-k; +n-n+1;+kwrite.table(mol.structure, file=molstruc1.csv, sep=,)第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議R中構(gòu)造參數(shù)的客觀挑選去除高相關(guān)性參數(shù)中構(gòu)造參數(shù)的客觀挑選去除高相關(guān)性參數(shù)cor.matrixdim.cormfor(i in 1:(dim.cor1-1)for(j in (i+1):(dim.cor2)if (cor.matrixi,j=
7、0.95)+mol.structure+idim(mol.structure)write.table(cor.matrix,file=matrix.csv, sep=,)write.table(mol.structure,file=molstruc2.csv, sep=,) 第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議PLS構(gòu)建模型構(gòu)建模型 # modeling QSAR by PLS library(pls) lnR data QSAR +X6CH+Eig1Z.1+TI2+MWC08+piPC08 +GGI2+AEig1Z+VRD2+IDDM+HDcpx+IC0+CIC0+ +BIC0+TIC1+
8、SIC1+BIC1+CIC2,data=data, +method=simpls,model=TRUE)第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議模型驗(yàn)證模型驗(yàn)證 #cross-validation the QSAR model crossval + segment.type = c(random) RMSEP R2 plot(crossval) plot(RMSEP) plot(R2) plot(QSAR, ncomp=15)第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議RMSE和和R2R2RMSE第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議優(yōu)化預(yù)測(cè)模型優(yōu)化預(yù)測(cè)模型第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議用于預(yù)
9、測(cè)和預(yù)告用于預(yù)測(cè)和預(yù)告 #predict unstudied compound perylene new.mol-predict(QSAR, type = response, newdata = perylene)輸入還沒(méi)有研討資料的輸入還沒(méi)有研討資料的perylene的構(gòu)造參數(shù),得到效應(yīng)值為的構(gòu)造參數(shù),得到效應(yīng)值為-0.86第一屆中國(guó)第一屆中國(guó)R語(yǔ)言語(yǔ)言會(huì)議會(huì)議結(jié)論與展望結(jié)論與展望 R在QSAR分析中的最大特點(diǎn)是快捷和簡(jiǎn)便。 QSAR的模型構(gòu)建、驗(yàn)證和運(yùn)用過(guò)程中都有多種方法可以選擇,而這些方法目前都分布在不同的包中 搜集和整理各種常用的QSAR用到的方法,編寫QSAR常用過(guò)程的函數(shù),并開(kāi)發(fā)出不斷更新的包就尤為重要 本文為R的QSAR包作出了一個(gè)開(kāi)端第一屆中國(guó)第
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- YY/T 1941-2024采用機(jī)器人技術(shù)的腹腔內(nèi)窺鏡手術(shù)系統(tǒng)
- YY/T 1940-2024用于增材制造的醫(yī)用鎳鈦合金粉末
- 貴陽(yáng)康養(yǎng)職業(yè)大學(xué)《焊接專業(yè)英語(yǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年上海市安全員B證考試題庫(kù)及答案
- 廣州醫(yī)科大學(xué)《大學(xué)英語(yǔ)自主學(xué)習(xí)(Ⅱ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025河北省安全員C證考試(專職安全員)題庫(kù)附答案
- 2025年河北省建筑安全員《A證》考試題庫(kù)及答案
- 2025云南省建筑安全員知識(shí)題庫(kù)附答案
- 2025江西省建筑安全員《C證》考試題庫(kù)
- 2025建筑安全員-B證考試題庫(kù)附答案
- 2025共團(tuán)永康市委下屬青少年綜合服務(wù)中心駐團(tuán)市委機(jī)關(guān)人員招聘2人(浙江)高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年中國(guó)服裝制造行業(yè)市場(chǎng)深度研究及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 2025年計(jì)算機(jī)二級(jí)WPS考試題目
- 2024-2030年中國(guó)車載導(dǎo)航儀行業(yè)發(fā)展?fàn)顩r及投資前景規(guī)劃研究報(bào)告
- 雙高建設(shè)的路徑設(shè)計(jì)與實(shí)施方案
- 人工智能:AIGC基礎(chǔ)與應(yīng)用 課件 03模塊三AIGC賦能辦公應(yīng)用
- 醫(yī)院純水系統(tǒng)施工方案
- 各類骨折病人體位護(hù)理
- 肺部感染的護(hù)理查房課件
- 網(wǎng)絡(luò)評(píng)論員培訓(xùn)
- 大型醫(yī)院多院區(qū)一體化基礎(chǔ)信息平臺(tái)建設(shè)方案
評(píng)論
0/150
提交評(píng)論