(完整word版)化學(xué)信息學(xué)計(jì)算機(jī)化學(xué)_第1頁
(完整word版)化學(xué)信息學(xué)計(jì)算機(jī)化學(xué)_第2頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1702006-2007化學(xué)信息學(xué)(計(jì)算機(jī)化學(xué))學(xué)科發(fā)展報(bào)告隨著化學(xué)信息的大量積累及計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)的飛速發(fā)展, “化學(xué)信息學(xué) ”已成為化學(xué)學(xué) 科的重要分支之一。盡管尚缺乏被廣泛接受的嚴(yán)格定義,但其精髓可描述為 “從數(shù)據(jù)到信息 然后到知識(shí) ”的說法已得到普遍認(rèn)可,其具體研究?jī)?nèi)容包括:計(jì)算化學(xué)、分子模擬與設(shè)計(jì)、 化學(xué)計(jì)量學(xué)、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)及Internet 的利用16-1,2。(一)化學(xué)信息學(xué)在社會(huì)與經(jīng)濟(jì)可持續(xù)發(fā)展中的地位與重要性門捷列夫可被認(rèn)為是最早的化學(xué)信息學(xué)家,他通過對(duì)化學(xué)元素結(jié)構(gòu)與性質(zhì)的總結(jié)建立 了化學(xué)元素周期表。 近年來,化學(xué)信息學(xué)在功能材料與分子設(shè)計(jì)、 產(chǎn)品質(zhì)量評(píng)價(jià)與控制、環(huán) 境

2、檢測(cè)與控制、生命與健康、疾病診斷、各類 “組學(xué) ”的數(shù)據(jù)挖掘、復(fù)雜體系分析、智能分析 儀器及新產(chǎn)品開發(fā)等研究領(lǐng)域中均發(fā)揮了重要作用,為社會(huì)與經(jīng)濟(jì)的可持續(xù)發(fā)展奠定了理論 與技術(shù)基礎(chǔ)16-3,4。 例如,虛擬篩選 (VHTS)和定量構(gòu)效關(guān)系 (QSAR) 等化學(xué)信息學(xué)技術(shù)的引入 不僅明顯縮短了新藥研發(fā)周期而且大幅度降低了開發(fā)成本; “指紋圖譜 ”的提出與應(yīng)用為中草 藥的質(zhì)量評(píng)價(jià)與控制提供了關(guān)鍵技術(shù)。(二)近兩年化學(xué)信息學(xué)的研究進(jìn)展化學(xué)信息學(xué)在理論化學(xué)、分子模擬與設(shè)計(jì)、化學(xué)計(jì)量學(xué)、數(shù)據(jù)挖掘以及Internet 資源的利用等方面均取得了重要進(jìn)展16-5。分子模擬研究為藥物分子的篩選建立了快速的虛擬高通

3、 量篩選(VHTS) 方法16-6、為藥物的全新設(shè)計(jì) (de novo design) 提供了研究方法和手段16-7、為 蛋白質(zhì) -配體之間的相互作用研究建立了新的計(jì)算方法16-8、為小分子化合物的 ADME/Tox及其它理化性質(zhì)發(fā)展了理論預(yù)測(cè)方法16-9。理論化學(xué)計(jì)算與實(shí)驗(yàn)科學(xué)相互結(jié)合用于合成化學(xué) 和材料設(shè)計(jì),實(shí)驗(yàn)結(jié)果與計(jì)算結(jié)果得到了相互印證和補(bǔ)充16-10,11。分子動(dòng)力學(xué)、Monte Carlo 模擬在化學(xué)、生物、材料等領(lǐng)域得到應(yīng)用16-12,13。基于分子力學(xué)的優(yōu)化方法被廣泛關(guān)注,新 的優(yōu)化算法不斷涌現(xiàn)16-14。為了擴(kuò)展微觀的分子力學(xué)與分子動(dòng)力學(xué)方法的時(shí)空尺度,“粗?;绷?chǎng)的方法被

4、重視和發(fā)展,多尺度的模擬方法被關(guān)注16-15?;瘜W(xué)計(jì)量學(xué)在新方法和應(yīng)用研究方面均取得了豐碩成果16-16,小波變換16-17等方法為分析化學(xué)信號(hào)處理帶來了新的手 段,高維數(shù)據(jù)的解析方法為現(xiàn)代聯(lián)用儀器的數(shù)據(jù)處理提供了理論和技術(shù)基礎(chǔ)16-18,19,多元校正為復(fù)雜體系的分析提供了實(shí)用技術(shù)16-20,指紋圖譜為中草藥等產(chǎn)品的質(zhì)量評(píng)價(jià)與控制提供了有效手段16-21。計(jì)算系統(tǒng)生物學(xué) (Computational Systems Biology)16-22是近幾年發(fā)展起來的 新的研究課題,組學(xué)數(shù)據(jù)管理系統(tǒng) (PRISM)16-23以及基于 Matlab 的系統(tǒng)生物學(xué)定標(biāo)語言 (SBML)16-24已被報(bào)道

5、。作為新的計(jì)算技術(shù),量子計(jì)算和 DNA 計(jì)算在近幾年也取得重要進(jìn) 展。面向化學(xué)領(lǐng)域網(wǎng)絡(luò)數(shù)據(jù)和計(jì)算資源共享工具的研究發(fā)展迅速, 化學(xué)資源搜索引擎、 數(shù)據(jù) 集成及數(shù)據(jù)共享相關(guān)標(biāo)準(zhǔn)、數(shù)據(jù)與計(jì)算集成等得到了廣泛關(guān)注16-25。(三)我國(guó)化學(xué)信息學(xué)研究的地位與近期研究進(jìn)展近年來, 我國(guó)的化學(xué)信息學(xué)研究得到了快速發(fā)展, 在某些專題的研究方面達(dá)到了國(guó)際前171沿水平。表 1 列出了 2000 年以來某些研究專題的論文被Web of Scienee 數(shù)據(jù)庫的收錄情況以及國(guó)內(nèi)外論文數(shù)量的比較??梢钥闯觯诮诒容^熱門的 新藥研發(fā)”和相對(duì)比較傳統(tǒng)的 計(jì)算化學(xué)”研究專題方面,我國(guó)的論文發(fā)表情況仍比較落后;在“QSA

6、R/QSPR 及 化學(xué)計(jì)量學(xué)”研究方面,我國(guó)的論文發(fā)表數(shù)量名列第二,但與美國(guó)相比仍有一定差距;而在研究范圍較窄的研究專題 小波分析”研究方面,我國(guó)的論文發(fā)表數(shù)量則處于領(lǐng)先地位。表 1 1 2000-20062000-2006 年 WebWeb ofof ScienceScience 數(shù)據(jù)庫收錄的論文發(fā)表情況及國(guó)內(nèi)外論文篇數(shù)的比較關(guān)鍵詞論文總數(shù)中國(guó)美國(guó)數(shù)量名次百分?jǐn)?shù)數(shù)量名次百分?jǐn)?shù)Drug Discovery861124492.84538152.7Computati on* Chem*827937474.53483142.1(QSAR OR QSPR) AND Chem*1954244212.45

7、75129.4Chemometrics144814229.8316121.8Wavelet* AND Chemistry6928140.615221.7近年來,我國(guó)學(xué)者開展了MM/PBSA、GB/SA、MM/SASW A 及 MM/PBSA 等一系列方法研究,并對(duì)某些受體-配體之間結(jié)合自由能、蛋白質(zhì)的水合自由能等進(jìn)行了計(jì)算和預(yù)測(cè), 得到了與實(shí)驗(yàn)結(jié)果吻合的計(jì)算結(jié)果16-26。建立了生物利用度、溶解度、logP、pKa、caco-2穿透、腸吸收、血腦屏障穿透及化合物ADEMT 性質(zhì)預(yù)測(cè)16-27等多種模型,得到了良好的預(yù)測(cè)效果16-28。在 QSAR/QSPR 研究方面,通過引入投影尋蹤新技術(shù),找

8、到了烷烴、烯烴和 環(huán)烷烴色譜保留指數(shù)分布的內(nèi)在結(jié)構(gòu)關(guān)系和知識(shí)規(guī)律16-29;通過正交投影技術(shù)對(duì)不同拓?fù)渲笖?shù)所表征的結(jié)構(gòu)信息進(jìn)行比較,為找到更好的結(jié)構(gòu)描述子提供了理論基礎(chǔ)16-30;通過對(duì)模型評(píng)價(jià)、穩(wěn)健方法、分類建模等方法的研究,得到了比PLS 更優(yōu)秀的建模方法16-31?;衔锝Y(jié)構(gòu)特征提取是 QSAR/QSPR 研究的基本步驟和重要環(huán)節(jié),我國(guó)學(xué)者提出了廣義三角形法”、廣義二面角法”、結(jié)構(gòu)投影法”、投影邊界數(shù)學(xué)描述法”等一系列方法,得到了創(chuàng)新 性的研究結(jié)果16-32。從量子化學(xué)和統(tǒng)計(jì)力學(xué)的原理出發(fā),提出并建立了分子的親水-親脂勢(shì)(HMLP),并用于蛋白質(zhì)分子的折疊以及相互識(shí)別與作用等問題的研究1

9、6-33。粒子群算法的變量分 區(qū)方法、逐步超球建模方法以及支持向量機(jī)技術(shù)等也在QSAR 研究中得到應(yīng)用16-34,35。此外,利用 QSAR 研究方法對(duì)新材料的物理化學(xué)性質(zhì)與其原子結(jié)構(gòu)參數(shù)、化學(xué)配方、加工工藝等 的關(guān)系研究以及熔鹽相圖研究充分顯示了化學(xué)信息學(xué)的應(yīng)用潛力16-36,37。基于蛋白質(zhì)或基因的一級(jí)序列進(jìn)行相似性比對(duì)、結(jié)構(gòu)預(yù)測(cè)、功能預(yù)測(cè)以及編碼區(qū)域或活性位點(diǎn)的識(shí)別是化學(xué)信息學(xué)與生物信息學(xué)的交叉研究?jī)?nèi)容。我國(guó)學(xué)者對(duì)PDB 數(shù)據(jù)庫中的蛋白質(zhì)序列進(jìn)行了鄰位效應(yīng)和不對(duì)稱性分析、對(duì)人類基因組與病毒基因組序列的不相容性進(jìn)行了分析;傅立葉功率譜、小波變換、時(shí)頻分析、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法也被

10、用于基因或蛋白質(zhì)序列分析,得到了良好的結(jié)果,采用 Delaunay 三角算法、主成分分析方法等 進(jìn)行蛋白質(zhì)172的結(jié)構(gòu)預(yù)測(cè)也進(jìn)行了嘗試16-38,39。我國(guó)的化學(xué)計(jì)量學(xué)方法與應(yīng)用研究處于國(guó)際前沿水平, 近年來在高維數(shù)據(jù)的解析方面取 得了突出成績(jī)。提出了基于 PSO(粒子群優(yōu)化)的樣品加權(quán)和波長(zhǎng)加權(quán)PLS 回歸方法16-40,顯著改善了模型的準(zhǔn)確性和預(yù)測(cè)能力。 針對(duì)三維數(shù)據(jù)解析中存在的問題, 發(fā)展了交替三線性分 解(ATLD)算法,提出了交替懲罰三線性分解(APTLD)、交替不對(duì)稱三線性分解(AATLD)、交替擬合殘差 (AFR) 等交替迭代算法以及三線性漸進(jìn)因子分析法、頂點(diǎn)矢量順序投影法等非

11、迭代算法16-41,42,為三維數(shù)據(jù)分析算法在化學(xué)中的應(yīng)用注入了新的生機(jī),實(shí)現(xiàn)了在現(xiàn)代分析化學(xué)中實(shí)際復(fù)雜體系的直接快速定量分析。 此外, 針對(duì)化學(xué)數(shù)據(jù)的特點(diǎn), 非負(fù)矩陣分解和投 影圖旋轉(zhuǎn)法也得到了發(fā)展與應(yīng)用, 拓展了黑色體系分析的理論和方法16-43。小波變換是新興 的化學(xué)計(jì)量學(xué)方法,我國(guó)學(xué)者對(duì)其在化學(xué)領(lǐng)域中的應(yīng)用研究方面做出了突出成績(jī),在Acc.Chem. Res.上發(fā)表了綜述論文16-44,出版了 Chemometrics: from basics to wavelet transform 專著16-17。近兩年小波變換在分析信號(hào)的數(shù)據(jù)壓縮、 背景扣除與重疊信號(hào)分辨等方面的工作 仍在繼續(xù)1

12、6-45,小波變換用于化學(xué)振蕩信號(hào)分析, 也得到了滿意的結(jié)果16-46。多元校正是化 學(xué)計(jì)量學(xué)的特色研究?jī)?nèi)容, 為復(fù)雜體系的分析提供了有效工具。 在多元校正的建模方法研究 中,支持向量機(jī) (SVM) 、局部建模及多模型建模等一系列新的建模方法被成功用于NIR 光譜分析16-47,48。獨(dú)立成分分析等新技術(shù)化學(xué)計(jì)量學(xué)方法與 NIR 技術(shù)結(jié)合對(duì)中藥產(chǎn)品進(jìn)行質(zhì) 量鑒定與控制得到了系統(tǒng)研究16-49,50。 中藥指紋圖譜是目前國(guó)際公認(rèn)的控制中藥或天然藥物 質(zhì)量的最有效手段。我國(guó)學(xué)者開展了復(fù)雜體系解析的化學(xué)計(jì)量學(xué)方法與指紋圖譜分析技術(shù)相 結(jié)合的基礎(chǔ)研究,同時(shí)也進(jìn)行了在中藥、 香精香料、代謝組學(xué)等領(lǐng)域的應(yīng)

13、用研究, 為復(fù)雜體 系的定性定量分析、 中藥等復(fù)雜體系的質(zhì)量控制及在代謝組學(xué)中的應(yīng)用提供了新思路和新方法16-51。在計(jì)算化學(xué)和分子模擬 (包括量化計(jì)算、分子動(dòng)力學(xué)、 Monte Carlo 模擬、分子力學(xué)等 ) 研究方面,我國(guó)學(xué)者越來越注重實(shí)際體系的計(jì)算與模擬16-5254。分子動(dòng)力學(xué)在生物大分子結(jié) 構(gòu)功能動(dòng)態(tài)大規(guī)模模擬中的應(yīng)用研究處于世界先進(jìn)水平16-55。基于數(shù)據(jù)庫遺傳算法的靶標(biāo)集 中組合庫構(gòu)建方法發(fā)展及其在新藥發(fā)現(xiàn)中的應(yīng)用結(jié)果得到了國(guó)內(nèi)外同行的高度關(guān)注16-56。建立了快速退火演化算法(FAEA)、自適應(yīng)免疫優(yōu)化算法(AIOA)、動(dòng)態(tài)格點(diǎn)搜索(DLS)算法以及 基于建模的優(yōu)化算法等一系

14、列新算法并在團(tuán)簇的結(jié)構(gòu)優(yōu)化和主-客體系的模擬中得到應(yīng)用16-57,58。此外,在用分子模擬方法揭示高分子鏈的纏結(jié)現(xiàn)象對(duì)聚合物結(jié)晶過程的影響,以及 運(yùn)用耗散粒子動(dòng)力學(xué)方法探察材料表面拓?fù)浣Y(jié)構(gòu)圖案對(duì)表面疏水性的影響等研究中取得了一些新的進(jìn)展16-59,60。化學(xué)信息的組織、 管理與應(yīng)用是化學(xué)信息學(xué)的核心研究?jī)?nèi)容之一, 我國(guó)在化學(xué)數(shù)據(jù)庫的 研制和軟件開發(fā)方面開展了大量工作, 并逐步形成具有知識(shí)產(chǎn)權(quán)的產(chǎn)品, 其中中國(guó)科學(xué)院上 海有機(jī)化學(xué)研究所在化學(xué)結(jié)構(gòu)數(shù)據(jù)庫、 化學(xué)譜圖數(shù)據(jù)庫以及化學(xué)信息管理方面的研究工作已 獲得初步成功16-61,62。在Internet 資源的組織和利用方面,中國(guó)科學(xué)院過程工程研究

15、所對(duì)所建立的 ChIN(The Chemical Information Network)16-63不斷更新,訪問請(qǐng)求數(shù)已經(jīng)超過 1 億次; 并建成了一個(gè)化學(xué)專業(yè)搜索引擎的原型系統(tǒng)ChemEngine,索引頁面約 1000 萬頁。它采用機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)爬行器面向化學(xué)領(lǐng)域的定向爬行及按照化學(xué)學(xué)科的知識(shí)體系對(duì)檢索結(jié)果 進(jìn)行分類16-64,65。中國(guó)科學(xué)院上海藥物研究所開發(fā)出了通過互聯(lián)網(wǎng)面向世界各地用戶的靶標(biāo) 蛋白篩選方法和應(yīng)用173平臺(tái),擁有眾多用戶16-66。(四)化學(xué)信息學(xué)的研究熱點(diǎn)與展望化學(xué)信息學(xué)研究的發(fā)展方興未艾。藥物開發(fā)、 材料設(shè)計(jì)、 復(fù)雜體系分析、海量數(shù)據(jù)挖掘 與知識(shí)發(fā)現(xiàn)、 實(shí)際化學(xué)

16、體系的理論計(jì)算以及有關(guān)化學(xué)信息學(xué)新理論和新算法的研究仍然是本 學(xué)科關(guān)注的重點(diǎn)和熱點(diǎn)問題。計(jì)算系統(tǒng)生物學(xué)、網(wǎng)格計(jì)算以及基于Internet 的專業(yè)資源挖掘則是近期涌現(xiàn)的新興研究課題。徐光憲院士指出: “21 世紀(jì)的化學(xué)信息學(xué)將建立各種化學(xué)信息庫,然后分析信息的內(nèi)涵,總結(jié)出規(guī)律, 最大限度地挖掘、 開發(fā)和應(yīng)用信息寶庫, 使它們作為實(shí)驗(yàn)歸納法和理論演繹法 的橋梁,推動(dòng)化學(xué)和化工學(xué)科的發(fā)展,為國(guó)民經(jīng)濟(jì)服務(wù)?!?6-3隨著化學(xué)信息的不斷積累,化學(xué)信息學(xué)在化學(xué)及相關(guān)學(xué)科中必將發(fā)揮越來越重要的作用。同時(shí), 研究對(duì)象的復(fù)雜化, 如疾病的早期診斷、組學(xué)體系研究、系統(tǒng)生物學(xué)等,使化學(xué)信息學(xué)面臨更嚴(yán)峻的挑戰(zhàn)。因此, 實(shí)際復(fù)雜體系分析仍是化學(xué)信息學(xué)的主要方向之一; 加強(qiáng)面向?qū)嶋H問題的化學(xué)信息學(xué)應(yīng)用基 礎(chǔ)研究,以化學(xué)信息學(xué)手段解決化學(xué)、生命、 環(huán)境、 材料等學(xué)科中各種復(fù)雜的實(shí)際問題是該 學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論