化學模式識別在生藥鑒別和質量評價中的應用_第1頁
化學模式識別在生藥鑒別和質量評價中的應用_第2頁
化學模式識別在生藥鑒別和質量評價中的應用_第3頁
化學模式識別在生藥鑒別和質量評價中的應用_第4頁
化學模式識別在生藥鑒別和質量評價中的應用_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、化學模式識別在生藥鑒別和質量評價中的應用摘要:化學模式識別是物以類聚,同類或相似的樣本間的距離較近,不同類的/樣本間的距離應較遠。這樣可以根據(jù)各樣本的距離或距離的函數(shù)來判別、分類,并利用分類的結果預報未知。模式識別屬于多變量數(shù)值分析方法,它是借助于計算機來揭示隱含于事物內部規(guī)律的一種綜合技術,是用現(xiàn)代分離分析檢測方法對中藥材或藥品樣本中的有機或無機的藥用化學成分進行檢測,用化學計量學方法關聯(lián)檢測數(shù)據(jù)陣,確定可用于樣品質量控制的模式,通過上述方法進行整體分析、分類和描述來對未知樣本進行識別。關鍵詞:聚類分析法、主成分分析法、矩陣、空間模式識別(pattern recognition)是一門用機器

2、代替人對模式即所研究的事物進行分析、描述、判斷和識別的技術1。它的中心任務就是要識別出某個樣本與哪一種模式(樣本)相同或相近,即在一定的度量和觀測的基礎上把待識別的模式劃分到各自模式類中。模式識別可分為基于統(tǒng)計學習理論的統(tǒng)計模式識別和基于語法的結構模式識別。統(tǒng)計模式識別是目前最成熟也是應用最廣泛的方法。以完成識別過程的方式而論,模式識別又可分為兩個系統(tǒng):有監(jiān)督學習系統(tǒng)和無監(jiān)督學習系統(tǒng)。有監(jiān)督學習系統(tǒng)要運用一組已知其類別的樣本進行訓練(或學習)獲得分類準則,再利用準則來判別未知模式所屬的類別。常用的方法有: SIMCA法(Simple classification algorithm,簡單分類法

3、)、Bayes判別、逐步判別分析(Step-wise discriminate analysis, STEPDA)、人工神經(jīng)網(wǎng)絡(Artificial neural networks,ANN)等。而無監(jiān)督學習系統(tǒng)則是把模式劃分到目前為止仍然未知的類別中,即無須預先知道模式所屬的類別。其中最重要的一種就是聚類分析的方法。如系統(tǒng)聚類分析(Hierarchical clustering analysis)、模糊聚類分析(Fuzzy clustering analysis)等?;瘜W模式識別(chemical pattern recognition)最早出現(xiàn)在20世紀20年代,模式識別方法于60年代末被

4、引入化學領域。它建立于一個十分直觀的基本假設,即物以類聚,同類或相似的樣本間的距離較近,不同類的/樣本間的距離應較遠。這樣可以根據(jù)各樣本的距離或距離的函數(shù)來判別、分類,并利用分類的結果預報未知。模式識別屬于多變量數(shù)值分析方法,它是借助于計算機來揭示隱含于事物內部規(guī)律的一種綜合技術5。化學模式識別方法包括主成分分析(Principle component analysis,PCA)、聚類分析(Cluster analysis,CA)和判別分析(Discriminant analysis,DA)等方法。按照有沒有訓練可以劃分為有監(jiān)督的模式識別方法(Supervised classification

5、)和無監(jiān)督的模式識別方法(Unsupervised classification)。前者是事先規(guī)定分類的標準和種類的數(shù)目,通過大批已知樣本的信息處理(稱為/訓練或/學習)找出規(guī)律,再用計算機預報未知6。如貝葉斯(Bayes)線性判別法、Fisher判別法、線性學習機、最近鄰近(KNN)域判別法、SIMCA分類法等。后者與前者相比,其模式識別問題中存在更大的不確定性,一個主要原因就是在無監(jiān)督模式識別問題中,只有一大批樣本,事先沒有規(guī)定分類標準,也沒有規(guī)定分成幾類,卻要求通過信息處理找出合適的分類方法并實現(xiàn)分類。如聚類分析(clustering analysis)法、析因法(factor anal

6、ysis, FA)、圖形分類法等。化學模式識別是用現(xiàn)代分離分析檢測方法對中藥材或藥品樣本中的有機或無機的藥用化學成分進行檢測,用化學計量學方法關聯(lián)檢測數(shù)據(jù)陣,確定可用于樣品質量控制的模式,通過上述方法進行整體分析、分類和描述來對未知樣本進行識別。此方法綜合了中藥材或中藥制劑內各種化學成分的整體信息,能夠更準確、更全面、更科學的對中藥材及其制劑進行質量評價7,在對大批量樣品進行鑒別分類時,其快速、準確的特點尤為突出。目前化學模式識別方法所采用的原始數(shù)據(jù),主要來源于波譜分析、光譜分析和色譜分析所測得的各種數(shù)據(jù),常用的分析方法有:紫外光譜法(UV)、紅外光譜( IR)、薄層色譜法(TLC)、氣相色譜

7、法(GC)、高效液相色譜法(HPLC)、質譜分析法、氣相色譜/質譜(GC/MS)聯(lián)用技術、液相色譜/質譜(LC/MS)等,隨著研究的深入,核磁共振法、X射線衍射法、分子生物學方法(DNA指紋圖譜)和各種新型的聯(lián)用技術,如高效液相色譜/毛細管電泳-質譜/質譜(HPLC/CE-MS/MS)、等離子光譜-質譜(ICP-MS)等8也應用于中藥指紋圖譜的構建并可能為中藥的化學模式識別提供更多的信息。模式識別技術在中藥分類和質量評價中的應用聚類分析法(cluster analysis,CA)聚類分析是按物體以類聚的原則研究事物分類的一種多元統(tǒng)計分析方法。在用聚類分析解決實際問題時,我們根據(jù)每個分類對象(樣

8、品)的性質和分類的目的選定若干指標(變量),并測出所有的指標值,將得到的結果列為一個數(shù)據(jù)矩陣,這個樣本資料就是聚類分析的出發(fā)點9。聚類分析的基本思想是:根據(jù)相似程度大小把樣品歸類。聚類分析可分為系統(tǒng)聚類法和動態(tài)聚類法。系統(tǒng)聚類法是目前最流行的方法,一般用聚類圖表示出來。系統(tǒng)聚類法分類比較準確、客觀,在中藥質量的評價中,較為常用。但是當樣品個數(shù)大時,就比較費事,而動態(tài)聚類分析可解決這一問題。它主要采用迭代法的思想,先給一個粗糙的初始分類,然后用某種原則進行調整,直至分類比較合理化。最常用的聚類方法包括系統(tǒng)聚類方法(hierarchical clustering method, HCM)、k均值聚

9、類法、模糊聚類法、最優(yōu)分割法、圖論方法中的最小生成樹等方法10。其中系統(tǒng)聚類法和k均值聚類法是比較常用的方法。系統(tǒng)聚類法的基本思想是在各自成類樣本中,將距離最近的樣本并為一個新類,計算新類與其它類的距離,直到所有的樣本并為一類;k均值聚類法是一種動態(tài)聚類方法,其基本思想是假設一個分類數(shù)目k,任意選取k個點作為初始類聚點,逐個計算其它樣本與k個類重心之間的距離,選取距離最小者將其并人該類,再重新計算各類的重心,并以該重心為新的凝聚點,直到每個樣本都被歸類。聚類分析法在中藥的真?zhèn)舞b別和質量評價方面:有王文清11采用聚類分析法對不同產(chǎn)地的大青葉質量的化學模式研究研究,實驗采用RP-HPLC法定量分析

10、國內10個不同產(chǎn)地大青葉樣品中鄰氨基苯甲酸、丁香酸、腺苷,靛玉紅4種指標成分的量,用雷達圖評價指標成分平衡分布,按其質量等級劃分為5類。陳玲12采用HPLC對12個不同產(chǎn)地的厚樸進行了定量分析。以往的研究工作證明了厚樸酚與和厚樸酚是厚樸藥材的主要有效成分,試驗以厚樸酚、和厚樸酚為考察指標,用系統(tǒng)聚類分析對其進行化學模式識別研究,建立了對厚樸藥材辨識的新方法。分別精密吸取對照品溶液和供試品溶液各10LL,在上述色譜條件下,注入高效液相色譜儀,測定其峰面積,外標法計算厚樸酚與和厚樸酚的含量。所有樣品聚類分析結果和傳統(tǒng)分析結果一致,表明所選指標是合理的13。齊靜靜14利用電噴霧質譜(ESI-MS)法

11、建立龍膽質譜指紋圖譜,研究其中代表性裂環(huán)烯醚萜苷類成分的ESI-MS規(guī)律。采用甲醇超聲法提取龍膽中裂環(huán)烯醚萜苷類成分,在正離子方式檢測模式下直接進樣,應用一級全掃描質譜建立其特征圖譜。運用化學模式識別方法對圖譜數(shù)據(jù)進行分析,發(fā)現(xiàn)秋季龍膽樣品的聚集程度優(yōu)于春季龍膽樣品,根據(jù)春季、秋季藥材樣品的差異。裂環(huán)烯醚萜苷類成分在二級質譜中易發(fā)生脫水、乙?;?、葡萄糖基等。電噴霧質譜法的精密度、穩(wěn)定性、重現(xiàn)性均符合要求,且具有特征性強、分析速度快、樣品用量少等優(yōu)點。結果表明,質譜指紋圖譜可對春季、秋季藥材樣品不同采收期進行區(qū)分;利用多級串聯(lián)質譜技術對代表性裂環(huán)烯醚萜苷成分分析,歸納總結此類化合物的裂解規(guī)律。主

12、成分分析法主成分分析(Principal component analysis),PCA是對多變量數(shù)據(jù)進行統(tǒng)計處理的一種線性投影判別方法,是在不明顯減少有用信息的前提下,將高維空間壓縮到低維空間的模式分類方法15。PCA的基本思路是以一種最優(yōu)化方法濃縮量測數(shù)據(jù)信息,使數(shù)據(jù)矩陣簡化,降低維數(shù),尋找少數(shù)幾個由原始變量線性組合的主成分,以揭示數(shù)據(jù)結構特征,提取基本信息。就是最佳綜合簡化多變量的大量數(shù)據(jù)。實質是提取原始變量共性的信息。其基本含義為利用特征分析的數(shù)學方法從數(shù)據(jù)陣求取特征值和特征矢量。方法是轉換原變量,使少數(shù)新變量成為原變量的線性組合,同時新變量應盡量表征原變量的結構特征,而不丟失信息16

13、。以少數(shù)綜合變量取代原始的多數(shù)變量,提供有關數(shù)據(jù)結構的基本特征,可用坐標圖顯示其內在特性,有利于幫助學生解釋、理解、判別量測數(shù)據(jù)和聚類,提高分析的可靠性。主成分分析法按以下順序進行:(1)確定原始指標體系;(2)建立標準信息矩陣;(3)求相關矩陣、特征值;(4)求累積方差貢獻率并確定主成分數(shù);(5)計算主成分特征向量矩陣、因子載荷系數(shù)矩陣和標準化主成分得分;(6)計算各樣本對象在主成分上的得分;作出 Z1-Z2(第 1 和第 2 主成分)平面圖,分析主成分分析結果。主成分分析法通過薄層色譜分離、指紋圖譜等方式進行中藥品種分類和質量評價。周漩17等人以主成分分析法對人參皂苷在6種不同展開劑下的薄

14、層色譜保留行為進行分析,并由分析結果選擇色譜分離機理互補的兩展開劑,優(yōu)化人參皂苷的薄層色譜二維分離。趙宇18等人對不同產(chǎn)地的枳實進行化學模式識別分類研究。其方法為采用高效液相色譜獲得枳實樣品的色譜指紋圖譜,利用主成分分析投影顯示法對K-均值聚類分析所得的結果進行驗證,建立起了枳實的識別方法。赫炎19等人用主成分分析的方法建立虎掌南星飲片HPLC指紋圖譜的定量標識。通過主成分分析技術,在信息量最小的原則下對圖譜數(shù)據(jù)進行壓縮,獲得12個可以反映全部信息的綜合數(shù)據(jù),以定量表達。此法為飲片質量標準建立和炮制過程質量控制提供了依據(jù)。目前比較常用的方法是主成分分析法和聚類分析法連用,用于中藥質量評價中。李

15、士博等20采用高效液相色譜法測定不同品種、產(chǎn)地和規(guī)格大黃的蒽醌類、有機酸類的含量,應用主成分分析、聚類分析進行化學模式識別。從主成分分析可知,樣品排序時綜合了總蒽醌、有機酸類含量,排序在前位,總蒽醌、有機酸酸類含量高,排序在后位的總蒽醌、有機酸類含量降低。從聚類分析可見,也是根據(jù)總蒽醌、沒食子酸、兒茶素的含量進行歸屬,不難發(fā)現(xiàn),聚為同類的樣品在主成分分析中排序基本相近。傳統(tǒng)的質量評價主要按產(chǎn)地與道地性判別,采用化學模式識別的結果中,同品種、同產(chǎn)地的藥材樣品并沒有完全聚為一類,說明該方法與傳統(tǒng)的差異,該方法按活性成分為分類變量,同一產(chǎn)地的樣品可能存在質量差異,故化學模式識別的結果應該更為合理。羅

16、光明21等運用高效液相色譜指紋圖譜相似度評價法、系統(tǒng)聚類分析法和主成分分析法建立車前子藥材的綜合化學模式識別方法。以24 批藥材共有色譜峰峰面積為依據(jù),建立其系統(tǒng)聚類分析方法及主成分分析方法。結果表明指紋圖譜法可以區(qū)別不同品種及產(chǎn)地車前子,系統(tǒng)聚類分析法和主成分分析法分析結果基本一致,但稍有差異。劉會君等22建立了莪術藥材的閃蒸-氣相色譜法(FE-GC), 采用 FE-GC 測定了 3 個產(chǎn)地的 9 個莪術樣品。 0。4 mg 的粉末樣品,在 200 下閃蒸, 經(jīng)色譜分離, 基于閃蒸色譜圖上分離鑒定到的 35 個共有峰的相對強度, 結合化學模式識別即主成分分析和系統(tǒng)聚類分析法對莪術樣品進行了鑒

17、別分析3個產(chǎn)地的莪術樣品可以很好地得到區(qū)別。判別分析(Discriminant analysis DA) 判別分析是根據(jù)一批分類明確的的樣品(也叫參考組或訓練樣品),制定出一個分類標準以指導其后新樣品歸類的一種多元分析方法23。一般地,若已有給定的m個總體(即m個類別)的觀測資料,構造一個或多個判別函數(shù),能由該函數(shù)對新的未知其所屬總體的樣品作出判斷,從而決定其應屬于哪個總體,這就是判別分析問題。判別分析是在分類已知的條件下尋找客觀分類的判據(jù),以此對新的不知所屬的對象進行判別,而聚類分析一般是用在給定的樣品分類未知的情況下。一般來說,判別分析常和聚類分析聯(lián)合使用,效果更佳。人工神經(jīng)網(wǎng)絡(arti

18、ficialneural network,ANN)ANN23是一種全新的信息處理系統(tǒng),是真實神經(jīng)網(wǎng)絡的一種數(shù)學抽象.與其它模式識別技術相比,人工神經(jīng)網(wǎng)絡模擬人腦結構,具有自組織、自學習的能力,適于處理不正確的非線性過程測量數(shù)據(jù)和處理信息量大等特點.神經(jīng)網(wǎng)絡系統(tǒng)中包含著大量的基本信息處理單元,稱為神經(jīng)元(neu-rons)或節(jié)點(nodes).在中藥質量模式識別中的神經(jīng)元(節(jié)點)對應于測定樣本的各特征參數(shù),例如HPLC和GC-MS所測其峰、UV所測吸收值等經(jīng)過標準歸一化后所得到的特征值,神經(jīng)元之間具有十分復雜與豐富的相互聯(lián)接關系,這種聯(lián)接強度用一種可變的權值表示.ANN算法就是給網(wǎng)絡各種訓練樣本

19、,把網(wǎng)絡的實際輸出和正確的目標值相比較,然后根據(jù)偏差的情況修改各節(jié)點的連接權重,網(wǎng)絡不斷朝誤差減小的方向進行變化,直到輸出值與正確的目標值的偏差滿足工作所需要的精度.經(jīng)過訓練的網(wǎng)絡把系統(tǒng)規(guī)則、預測能力、變量轉化等都以權值的形式隱含在網(wǎng)絡之上然后向輸入層輸入信息,即可給出結果神經(jīng)網(wǎng)絡對于處理那些因果關系不明確、知識背景清楚、推理規(guī)則不確定的問題尤其具有獨到之處.在化學模式識別中用的最多的有誤差反向傳播法(Back Propagation network,簡稱BP法), PR-ANN和RBF-ANN法等。小結化學模式識別技術相對于傳統(tǒng)的中藥質量研究方法有了較大的完善和發(fā)展,在一定程度上對中藥的質量

20、評價提供了一種新的方法和思路。但是,要尋找到一個最適當?shù)姆椒ㄈ妗⒖陀^的反映中藥質量的真?zhèn)蝺?yōu)劣,給出完整的評價結果,目前還有一定的難度。中藥的品種繁多,成分復雜,單憑一種或兩種模式識別技術不能完全說明問題,要通過多種途徑,多種技術相互驗證。而且目前在模式識別研究中,對中藥的化學信息和藥理指標的聯(lián)系較少,不能反映中藥的成分和藥效間的關系。另外在中藥復方研究方面,化學模式識別技術的應用也剛剛起步,需要結合模糊數(shù)學和計算機技術深入研究參考文獻1陳玥娥 姚小華 中藥鑒定技術的發(fā)展概況J廣州中醫(yī)藥大學學報 2007.7 24-42戴云 葉艷青 化學模式識別在中藥質量控制中的應用J云南民族大學學報(自然科

21、學版) 2007.10 16-43朱曉勤 尹蓮 化學模式識別在中藥分類和質量評價中的應用J中華中醫(yī)藥學刊2007.10 25-104劉萬倉 孫磊 中藥指紋圖譜模式識別研究進展J國際藥學研究雜志2010.12 37-65李大東 模式識別在儀器分析教學中的應用J浙江海洋學院學報(自然科學版)2009.12 28-46陳武李凡修 理想點法在藥品質量綜合評價中的應用J數(shù)理醫(yī)藥學雜志2002 15-57劉學仁 張瑩 化學模式識別技術在藥物分析中的應用與研究進展J數(shù)理醫(yī)藥學雜志 2011 24-18胡育筑 計算藥物分析M北京:科學出版社,2006.9楊淑瑩 模式識別與智能計算M北京電子工業(yè)出版社 2008:1-15.10黃欣榮 復雜性科學的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論