生物信息學用于代謝網絡研究的進展與展望_第1頁
生物信息學用于代謝網絡研究的進展與展望_第2頁
生物信息學用于代謝網絡研究的進展與展望_第3頁
生物信息學用于代謝網絡研究的進展與展望_第4頁
生物信息學用于代謝網絡研究的進展與展望_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第55卷第10期化工學報Vol155l102004年10月Journal of Chemical Industr y and Engineer ing(ChinaOctober2004綜述與專論生物信息學用于代謝網絡研究的進展與展望何鋒1馬紅武1,2趙學明1元英進1曾安平1,2(1天津大學化工學院,天津300072;2G BF-German Research Center for Biotechnolog y,M ascheroder Weg1,38124Braunschweig,Germany摘要如何分析基因測序和高通量分析方法所獲得的海量數據和信息,及由此而得到的復雜生物網絡,是生物信息學

2、研究者所面臨的重要任務.本文綜述了基于基因組的大規(guī)模代謝網絡重建和分析的進展,論述了利用生物信息學方法分析代謝網絡結構的主要方法和結果;比較了現階段兩種最常用的代謝途徑分析方法,即基元模式和極端途徑的差異;列舉了這兩種方法在代謝網絡結構和功能分析、工程菌設計等多方面的重要應用;指出了現階段在途徑分析領域存在的問題和應對的策略.關鍵詞生物信息學基因組學代謝網絡代謝途徑基元模式極端途徑中圖分類號T Q92011Q81114文獻標識碼A文章編號0438-1157(200410-1593-09 PRO GRESS AN D PERSPECT IVE IN A PPL ICAT ION OF BIOIN

3、FORM AT ICS TO ANALY SIS OF M ET ABOL IC N ET WORKSH E Feng1,MA H ongw u1,2,ZHAO Xuem ing1,YUAN Yingjin1and ZENG Anping1,2(1School of Chemical Engineer ing and T echnology,T ianj in Univer sity,T ianj in300072,China;2GBF-Ger man Research Center f or Biotechnology,M ascheroder Weg1,38124Br aunschw ei

4、g,Ger many Abstract One of the challenges of contemporary bioinformatics is how to make use of the large volume of data and information from genome sequencing and hig h-throughput genomic studies for the analysis of large-scale metabolic networks1This article first briefly rev iew s the reconstructi

5、on of metabolic networks from genome information and the graphic methods for the analysis of these genome-based networks1T his is followed by a survey of the tw o most prom ising concepts for the analysis of network-based metabolic pathw ays,namely the elementary flux modes(EFMsand the extreme pathw

6、 ays(EPsand their applications that include the analysis of structure properties and functions of metabolic networks and the design and analysis of eng ineering strains. T he challenges and possible solutions to combining the genom ic information and the above mentioned pathw ay analysis methods for

7、 a genome-w ide understanding of metabolic pathw ays and their regulation are discussed. Keywords bioinform atics,g enom ics,metabolic network,metabolic pathw ay analysis,elem entary flux modes (EFMs,ex treme pathw ays(EPs2004-05-21收到初稿,2004-07-16收到修改稿.聯系人:曾安平.第一作者:何鋒,男,24歲,碩士研究生.基金項目:國家自然科學基金海外青年合作

8、基金項目(No120028607.Received date:2004-05-21.Corresponding author:ZENG Anping.E-mail:azegbf1deFoundation i tem:supported by the National Natural S cience Foundation of China(No120028607.引言同其他工程學科一樣,代謝工程也包括兩個明確的步驟:分析與合成.最初代謝工程主要集中在合成領域:如在各種宿主細胞中新基因的表達,內源酶的擴增,基因的缺失或酶活性的調節(jié),轉錄或者酶的解除調控等.實際上,在代謝工程的分析步驟中更能體現工

9、程特色和優(yōu)勢,例如:如何利用相關信息來闡明代謝網絡的控制機理,并為達到某一目的而對合理的靶標進行修飾;當進行了第一輪修飾后,為了更好地設計下一輪乃至多輪途徑修飾才能達到目的,人們如何進一步整體地1評價這些酶或者基因修飾造成的生物化學影響等2.而這些問題都和代謝工程研究的核心內容代謝網絡密切相關.如何利用基因組數據分析代謝途徑卻是一個難題.這主要是因為隨著基因測序和高通量測量技術的高速進展,已經能夠在系統水平上發(fā)掘、收集和綜合數據,并且能夠在分子水平上獲取有關信息3,4.特別是,利用DNA芯片技術能夠同時檢測大量基因的差別表達5,這使得能夠鑒別生物反應器中跟細胞生長和代謝狀況密切相關的基因表達指

10、紋圖譜6.利用二維凝膠電泳等技術能夠同時檢測和分析大量蛋白,甚至定量分析蛋白組7.最近利用NMR、LC-MS、IR等技術能夠同時檢測甚至定量分析代謝物組8.這些高通量技術高速發(fā)展產生的海量數據使得重建代謝網絡和調控網絡成為可能.但是如何從整體上理解和分析代謝網絡和調控網絡卻是研究者面臨的一個重要問題.這需要把生物學、化學工程、數學和計算機學等不同學科的研究方法綜合到一起來幫助解決這個問題.生物信息學初期主要研究對象是序列,通過序列分析來發(fā)現基因,確定基因功能,對蛋白結構進行分析預測等9.近幾年隨著完成測序的生物的迅速增加及對基因功能的更深入廣泛的了解,對生物網絡(包括代謝網絡,基因調控網絡,信

11、號轉導網絡等的研究在生物信息學中越來越受重視1013.這主要是人們認識到生物中各組成成分(基因,蛋白質,代謝物等的功能都是通過與其他部分的相互作用體現出來,因此,只有在系統水平上對所有相關成分進行整體分析才能對生物的生理功能有全面正確的了解4.各種生物網絡中,代謝網絡由于其信息的完備性和可靠性而成為生物信息學中一個重要研究對象1416.目前的研究主要集中在代謝網絡的重建及其結構功能分析方面1720.這與當前代謝工程研究的最新進展不謀而合,因此,結合二者的研究方法對于理解代謝網絡的組織設計原理并在其指導下對生物代謝網絡進行改進具有重要意義.本文針對直接從基因組重建的代謝網絡進行研究,討論了代謝途

12、徑的定義和新分析方法.這些新的代謝途徑的分析方法在工程菌的設計和分析、代謝網絡結構的屬性和功能分析等多方面都有重要的應用.并且分析了現階段在途徑分析領域存在的計算和生物應用方面的挑戰(zhàn),給出了其他研究者和本文作者的解決方法.1基于基因組的代謝網絡重建和結構分析由基因組數據重建針對特定生物的代謝網絡是對這些大規(guī)模代謝網絡進行結構和功能分析的前提.基于某一生物的基因組注釋信息結合相關的酶反應數據庫就可以確定其代謝網絡中存在哪些代謝反應.而在因特網上也存在著一些專門的代謝反應數據庫,包含了與代謝網絡中的酶及其在不同生物中的編碼基因相關的信息,如KEGG(http:/ w ww1genome1ad1jp

13、/keg g/,BioCyc(http:/ biocyc1org/等21,22.由這些因特網數據庫可以方便地檢索某一生物中有哪些代謝反應,但存在的問題是無法方便地得到一個包含特定生物代謝網絡中所有已知反應的反應列表,因而限制了對代謝網絡做進一步的數學分析.基于此,M a和Zeng17在KEGG代謝反應數據庫的基礎上進行修正補充后得到一個新的數據庫,其中包含了所有已完成測序的生物的代謝網絡的反應列表(目前有近150種生物,并可利用程序自動更新以包含新的測序生物和新的基因組注釋信息.此外,M a和Zeng17還增加了代謝物連接的相關信息以直接將代謝網絡用一有向圖來表示,為網絡可視化和結構分析奠定了

14、基礎.由基因組構建網絡及圖論表示過程如圖1所示.由基因組重建得到的代謝網絡具有較大的規(guī)模,常包含幾百甚至上千個反應和代謝物,這使得應用一些傳統代謝工程中的分析方法如途徑分析、代謝控制分析等對其進行分析非常困難,因此,采用圖論的方法對其整體結構進行分析成為基因組規(guī)#1594#化工學報2004年10月 F ig 11 Pro cedures of r econstruction of metabolic netw ork from genome模代謝網絡研究的主要方法之一.一般以代謝物作為圖中的節(jié)點,若二代謝物可在一反應中轉化則兩對應節(jié)點相連接(如圖1.基于該圖論表示,近幾年不同研究者對代謝網絡結

15、構的研究均表明代謝網絡具有典型的小世界網絡特征:即連接度分布符合冪次規(guī)則,具有較高的簇系數(cluster coefficient和較短的網絡平均途徑長度13,17.除了代謝網絡外,蛋白-蛋白相互作用網絡、食物鏈網絡及其他一些非生物網絡如計算機網絡、電網絡及社會網絡也都呈現出小世界網絡的特征,這表明該結構是這些大規(guī)模復雜網絡的一個共同特征2326.這一結構特點對于理解代謝網絡的演化過程及其基本設計原理具有重要意義.雖然如此,這一整體結構的發(fā)現對于不同生物代謝網絡的功能分析卻幫助不大,有必要作進一步深入研究以發(fā)現其中的精細組織結構.Ma 和Zeng 18通過對代謝網絡的連通結構分析發(fā)現代謝網絡具

16、有如圖2所示的蝴蝶結結構(bow -tie structure.其中強連接體(giant strong component,GSC中所有代謝物之間完全互連,底物子集(substrate subset,S中的代謝物均可以轉化成為GSC 中的代謝物但反之不行,而產物子集(product subset,P中代謝物均可以由GSC 中的代謝物經一系列反應轉化得到.此外還可以看出GSC 結構最為復雜.結構分析表明,GSC 保持了整體網絡的小世界結構特征,并且GSC 的平均途徑長度決定了整個網絡的平均途徑長度.這表明GSC 是整個網絡的核心,對代謝網絡中代謝流的調控主要通過GSC 中的代謝分支點進行.因此,

17、對代謝網絡的生物功能分析可以首先集中于GSC 部分.而GSC 中包含的反應和代謝物的數目都只有總網絡的三分之一左右,這使得對于規(guī)模不是很大的網絡就可以直接采用途徑分析、控制分析等進行分析.但對于更復雜的網絡,如圖2所示的大腸桿菌等的代謝網絡,即使其GSC 也包括約300個左右的反應和代謝物,有必要對其進一F ig 12 Bow -tie structure of E 1coli步細分以進行深入的生理功能分析.鑒于此,Ma 等27在該蝴蝶結結構的基礎上進一步提出了一種結合網絡全局結構特性和局部連通性的大規(guī)模代謝網絡的解耦方法并將其應用于大腸桿菌代謝網絡.各個模塊內部節(jié)點密切相關而與其他模塊的連接

18、較少,具有一定的結構獨立性.對模塊的功能分析表明,這些模塊中包含的反應確實是功能相關的,因此具有功能獨立性.各個模塊中的反應和代謝物數目都不過幾十個,可以非常方便地利用代謝工程研究中發(fā)展起來的一些方法,如代謝途徑分析法和代謝控制分析等對其生理功能和調控機理等進行深入分析.本文下面部分將對代謝途徑分析的概念及其在基因組規(guī)模的代謝網絡分析中的應用以及存在的問題展開討論.#1595# 第55卷第10期 何鋒等:生物信息學用于代謝網絡研究的進展與展望2 代謝途徑分析方法211 基于網絡的代謝途徑分析方法發(fā)展歷史代謝網絡重建使基于代謝網絡的代謝途徑分析成為可能.為了理解細胞網絡的復雜性,許多代謝途徑分析

19、方法被開發(fā)出來.在20世紀80年代末期Seressiotis 和Bailey 28開發(fā)了用數學理論形成代謝途徑的方法.然而該方法形成的代謝途徑只能有一個底物和一個產物,這對于實際復雜的代謝網絡并不適用.為克服這一困難,M avrovouniotios 等29開發(fā)出改進的算法.但是該方法在計算代謝途徑之前需要首先將代謝物分成四類,這樣明顯地限制了該方法的使用.為了得到更通用的方法,Fell 30和Reder 31應用線性代數理論計算代謝途徑.認為代謝網絡對應的計量系數矩陣的一組線性基(解是代謝網絡的一組途徑,該組途徑能夠線性組合形成代謝網絡的所有可能途徑.然而該方法存在兩個問題:一個問題是由于組

20、成系數矩陣零空間的線性基不是惟一的,因而對應的途徑組也不是惟一的;另外一個問題是由于這些線性基的方向可正可負,而有些反應是不可逆的,這樣就會導致有些線性基實際上不能作為途徑.考慮到一些反應的不可逆性并且為了得到惟一的一組系統途徑,凸分析(convex analysis方法被應用到代謝途徑的定義上.目前,存在著兩個非常接近的基于凸分析的途徑分析概念,這兩個概念在生物信息學領域被廣泛承認:一個是基元模式(elementary flux modes,EFM s3235,另外一個是極端途徑(extreme pathw ays,EPs36,37.212 兩個凸分析方法21211 基元模式(EFMs 基元

21、模式與基本反應模式38的概念很相似.基元模式可以簡單地定義為最少酶的集合,這些酶使得該模式能夠在穩(wěn)定的代謝通量分布狀況下朝一定方向進行.該定義包括3個基本條件:(1穩(wěn)定狀態(tài),這保證了內部代謝物沒有積累;(2可行性,這要求該基元模式中所有不可逆反應的速率必須大于零,即必須滿足反應的熱力學要求;(3不可分,即在該基元模式中不包含其他的基元模式. 由于把可逆反應分成兩個方向相反的不可逆反應將會增加被計算的基元模式數目,在計算過程中還需要費時消除沒有生物學意義的二元環(huán).基于此原因,基元模式概念規(guī)定,沒有必要把可逆反應分成兩個方向相反的不可逆反應.有兩個跟基元模式特別相關的概念:外部代謝物和內部代謝物,

22、這兩者必須在計算基元模式之前進行分類.外部代謝物(如圖3中Aex 、Cex 、Eex 、ATP 、ADP,其中AT P 、ADP 是流通代謝物是指有一定緩沖濃度的代謝物;而內部代謝物(如圖3中A 、B 、C 、D 、E是在擬穩(wěn)定狀態(tài)下達到平衡的代謝物,即生成該代謝物的速率和消耗速率相等.上述簡單定義是代謝物被分類為外(內部代謝物后的狀態(tài)描繪.實際上,外部代謝物和內部代謝物的分類主要由計算和分析代謝網絡的目的決定.F ig 13 Illustration of one elementary mode21212 極端途徑(EPs 極端途徑36,37與基元模式是很接近的概念.極端途徑除了滿足基元模式

23、定義之外,還有幾點與基元模式不一樣:(1具有系統獨立性;(2不區(qū)分內部代謝物和外部代謝物,而區(qū)分交換反應和內部反應;(3所有可逆的內部反應都必須被分解成兩個方向相反的不可逆反應,這樣規(guī)定是為了限制所有內部通量必須是非負的.這兩個概念很相似,但是還是存在一定的差別,下面將具體比較這兩個概念.213 兩種方法的比較盡管當網絡中所有與環(huán)境交換的反應都不可逆時,有生物學意義的基元模式集合和極端途徑集合是一致的,但是如果當一個網絡的交換反應中有可逆反應時,那么網絡中極端途徑集合是基元模式集合的子集39.由表1和表2可知,除了由反應R7f 和R7b 構成的二元環(huán)基元模式在網絡1中沒有之外,在網絡2中其他的

24、基元模式都和網絡1中一樣.但是該二元環(huán)基元模式是沒有生物學意義的.#1596#化 工 學 報 2004年10月如果比較網絡1的基元模式和網絡2的極端途徑,由于交換反應R2是可逆反應,可以發(fā)現EFM1、EFM2、EFM4這3條基元模式沒有對應的極端途徑,但是可以用等式EFM1=EP4+EP5, EFM2=EP3+EP5,EFM4=EP2+EP3組合得到,這說明極端途徑集合是基元模式集合的子集.在大規(guī)模網絡中,極端途徑和基元模式的數目很多主要是由于組合爆炸40所致.當網絡中有一部分與環(huán)境交換的反應可逆時,極端途徑集合是基元模式集合的子集.雖然這一事實通常被作為極端途徑的優(yōu)勢來強調,但是極端途徑減少

25、途徑數目的同時也減少了許多應用功能,例如:可以用基元模式來發(fā)現優(yōu)化途徑;還可以用基元模式來計算單個反應的相對重要性15;還可以用基元模式來分析途徑長度41(從表1可以發(fā)現由A產生P的最短的途徑是EFM2,而最長的途徑是EFM4,但是如果用極端途徑來分析,將會發(fā)現最短的途徑EFM2和最長的途徑EFM4都不存在,所以用極端途徑無法分析途徑長度39,42.由于在極端途徑集合中沒有一些重要的途徑,所以其應用受到一定限制.因而,很多研究采用基元模式.214兩種概念的應用基元模式和極端途徑的應用主要包括:預測最小底物組成、識別沒有被途徑利用的反應、識別酶子集、計算網絡的冗余性、預測優(yōu)化途徑和優(yōu)化生長速率、

26、預測基因修飾后結果、計算最小切割子集、簡單預測轉錄調控、計算最小反應子集、標注未知孤獨基因功能等.21411最小底物組成Schillling等用極端途徑分析了嗜血性流感桿菌(H aemop hilus inf luenz ae和幽門螺桿菌(H elicobacter p ylori最小底物需求43,44.通過計算得到的最小底物組成和試驗結果高度一致.最小底物組成預測對于培養(yǎng)基的選擇和優(yōu)化具有指導意義.#1597#第55卷第10期何鋒等:生物信息學用于代謝網絡研究的進展與展望# 1598 # 21412 沒有被途徑利用的反應 元模式 41 化 工 學 報 2004 年 10 月 Dandekar

27、 等用基 E1 coli 的 個 別 基 因 后 預 測 正 確 率 達 到 86% . Carlson 等 50 利用基元模式分析了釀酒酵母中間代 謝, 并且用基元模式研究了釀酒酵母重組菌插入有 關基 因 時 對于 產 生 聚 B 羥 基 丁 酸 酯 ( poly B Ã hydroxybutyrate, PH B 產率的影響. 發(fā)現當插入 AT P cit rate 裂解酶對應的反應時, 產生 PH B 的理 論產率可以從 0167 增加到 0183; 當插入轉氫酶對 應的反應時, 產生 PH B 的理論產率可以從 0167 增 加到 0171; 當把 這兩種 酶對應 的反 應都

28、加 入時, 產生 PH B 的理論產率可以從 0167 增加到 0184. 21417 最小切割 子集 最近, Klamt 和 Gilles 51 借助基元模式的概念引入了一個稱為最小切割子集 ( m inim al cut set , M CS 的概念. 最小切割子集指 在代謝網絡中一個最小的反應子集, 該反應子集的 所有反應失活后將會導致該代謝網絡中某一個功能 的失效. 通過使用最小切割子集的方法, 一系列潛 在的應用都能夠較容易地實現, 包括網絡證實、表 型預測、評價結構的靈活性、代謝網絡結構分析和 藥物靶點識別等應用. 21418 轉 錄調控 Stelling 等 用基元 模式計 算了

29、 E1 coli 核心代謝網絡在兩種不同底物 ( 乙酸/ 葡萄 糖, 甘 油/ 葡 萄糖 條件下的基因 理論轉錄 比例, 計 算 結 果 與 實 驗 結 果 一 致 15, 52 . Covert 和 Palsson 53 引入一些限制條件研究了極端途徑集合 的簡化. 環(huán)境限制條件和轉錄調控限制條件的加入 使具有活性的極端途徑的數量明顯減少. 這個方法 在一個假設的中心代謝網絡 ( 包括糖酵解途徑, 三 羧酸循環(huán)和呼吸途徑 中得到了證實. 該網絡中原 來有 80 條極端途徑, 當加入轉錄調控限制條件后, 具有活性的極端途 徑數目銳減到 最多只有 26 條, 最少只 有 2 條, 使簡 化 程

30、度分 別 達 到 6715% 和 9715% . 該研究工作提供了一種方法解釋調控機制 怎樣限制代謝網絡功能, 也提供了一種方法來解釋 調控機制怎樣從所有可能的代謝途徑中得到少量具 有活性的代謝途徑. 21419 最 小 反 應 子 集 和 標 注 孤 獨 基 因 功 能 Burg ard 等 54 分析了 E1 col i 分別在葡 萄糖和富營 養(yǎng)培 養(yǎng) 基 上 能 夠 維 持 生 長 的 最 小 反 應 子 集 ( m inim al react ion set s . 發(fā)現以葡萄糖為底物只需 要整個代謝網絡 31% 的反應就 可以維持生長, 在 完全培養(yǎng)基上僅僅只需要 17% 的反應.

31、除了上述 應用之外, F j rster 55 等還利用基元模式分析了釀 酒酵母核心代謝網絡的代謝數據, 標注了一些未知 識別了那些沒有被任何基元模式利用的 43, 44 反應, Schillling 等用極端途徑 識別了 那些沒 有被任何極端途徑利用的反應. 這些反應不被任何 代謝途徑利用的可能原因是: 這些反應存在于不完 整的途徑中或者還處于進化的中間狀態(tài); 與這些反 應相連的有些反應在生物體內存在但是在網絡模型 中不存在; 從其他生物類推得到的酶功能在該生物 體中可能不同; 基因標注可能出錯. 21413 酶子集 Pf eiffer 和 Papin 等分別用基 元模式和極端途徑分析了從基

32、因組重建的代謝網絡 酶子集 ( enzyme subset . 酶子集是指那些 在代謝 網絡中不得不在一起操作的, 并且在結構上彼此需 要的反應子集. 酶子集在極端途徑概念中稱之為系 統性相關的反應子集. 這些酶子集 ( 相關的反應子 集 在理解代謝網絡的調控結構上具有重要意義. 21414 冗余性 St elling 和 P rice 15 45 35 42 等分別用基元 模式和極端途徑研究了途徑的冗余性. 途徑的冗余 性是指利用某種底物或者產生 某種產物的途 徑數 量. 這是 網絡 結構靈 活性 的一 種定 量描 述方法. v an Dien 和 L idst rom 將基元模式應用到兼

33、性甲 基 營 養(yǎng) 型 生 物 ( f acult ative Methy lobacter ium ex t orquens AM 1 的研 究 上. 三 碳 化 合物 ( 丙 酮 酸, 烯醇式丙酮酸 和四碳化合物 ( 草酰乙酸, 蘋 果酸 之間的冗余轉化途徑通過分析一個局部代謝 網絡的基元模式來識別. 當三個對應的冗余基因在 實驗中被敲除后, 該菌株仍然能夠在所有的底物上 生長, 這就證實了這些途徑的冗余性. 21415 優(yōu)化預測 早在 1996 年, L iao 等 38 計算 E 1col i 的核心代謝網絡的基本反 應模式, 然 后利 用這些基本反應模式來分析用糖類生成芳香族氨基 酸前

34、體 ( 3 脫氧阿拉 伯庚酮糖 酸 7 磷 酸, DAHP -的最 優(yōu) 化 產 率 和 次 優(yōu) 化 產 率, 設 計 了 相 應 的 E 1col i 工程 菌并 且 與計 算預 測值 一致. Edw ards 等 基于極端途徑開發(fā)出一種分析基因型和表型 關系 的 方 法: 表 型 相 空 間 法 ( phenot ype phase plane . 利用該方法, Edw ards 48 預測了 E1 col i 分 別在乙酸、琥珀酸、蘋果酸和葡萄糖上生長的最大 生長速率, 計算和實驗結果一致. 因此, 可以利用 途徑分析方法在一定程度上指導工程菌的設計. 21416 基因修飾 43 47 4

35、6 Schilling 等預測了敲除 嗜血性 44 流感桿菌 和幽門螺桿菌 個別基因后的生長和 代 謝 情 況, 正 確 率 達 到 60% . Covert 49 敲 除 第 55 卷 第 10 期 何鋒等: 生物信息學 用于代謝網絡研究的進展與展望 # 1599 # 孤獨基因的功能. 物的數目 可能組合, 從而得到最小數量的基元模 式. 基于以上問 題, 本文提出了 如下可能 解決方 案: ( 1 從代謝網絡拓撲結構和代謝物在反應中的 生物功能角度出發(fā)定義外部代謝物; ( 2 把整個代 謝網絡劃分為幾個適宜規(guī)模的子網絡; ( 3 分別在 各個子網絡中計算其各自的基元模式; ( 4 把跨過

36、幾個子網絡的被切割開的基元模式組合成切割前的 存在于整個網絡中的基元模式 58 . 在第一步定義 外部代謝物的過程中, 首先從代謝網絡的拓撲結構 出發(fā), 把 4 種具有不同拓撲結構的代謝物和在該代 謝網絡中的所 有反應中都是流通代謝 物的代謝物 ( 像水、二氧化碳等 代謝物 定義 為外部代 謝物. 除此之外, 還從生物學意義的角度出發(fā), 根據代謝 物在不同反應中充當的角色不一樣 ( 有的代謝物在 有些反應中是主代謝物, 但是在有些反應中卻是流 通代謝物 來分別定義同一代謝物, 即先把同一代 謝物分別標記為流通代謝物和主代謝物, 然后把流 通代謝物定義為外部代謝物. 用這個方法計算肺炎 鏈球菌重

37、建代謝網絡 ( 199 個反應, 245 個代謝物 中的基元模式, 在左右子網絡中分別得到基元模式 180 條和 111429 條. 將跨過兩個子網絡的基元模 式組合后, 得到肺炎鏈球菌整個代謝網絡的基元模 43 3 面臨的問題和解決方法 雖然代謝網絡的很多結構屬性和功能特性被揭 示 ( 見 214 , 但是研究者僅僅只是分析了 整體代 謝網絡中的部分基元模式 ( 或極端途徑 , 要分析 生物體的整體特性就需要分析整個代謝網絡的基元 模式. 基元模式分析方法在計算上面臨的困難是: 計 算基于基因組的大規(guī)模代謝網絡的基元模式對于計 算機的速度和內存的要求都很高, 這主要是由于組 合爆炸導致的.

38、所以要想直接計算得到大規(guī)模網絡 的所有基元模式是很困難的. 到目前為止, 人們利 用基元模式計算和分析的最大代謝網絡是簡化后的 E 1col i 網絡模型 15 , 總共也只有 110 個反應, 89 個代謝物. Klamt 和 Gilles 51 計算該代謝網絡的最 小切割子集每次只是以某一產物作為輸出計算基元 模式. 在基因組規(guī)模的代謝網絡中, 即使作為基元 模式集合子集的極端途徑集合計算也面臨組合爆炸 的問題. 盡管 Price 等計算了幽門螺桿菌 45 ( 390 個反應 基因組規(guī)模代謝網絡的極端途徑, 但是每 次都只用了單個氨基酸作為產物進行計算, 并沒有 考慮多個產物組合的復雜情況

39、. 基 于 以 上 認 知, Schilling 和 Palsson 19 27 , 式 268343 條. 除了在計算上的挑戰(zhàn)之外, 還存在著生物學上 的挑戰(zhàn). 即使解決了計算問題能夠得到上百萬條的 代謝途徑, 如何分析上百萬條代謝途徑的生物學意 義又是將要面臨的巨大挑戰(zhàn). 如果僅僅分析其中的 一部分, 例如兩個代謝物之間轉化途徑的冗余性, 最優(yōu)或者次優(yōu)途徑等局部問題, 有關的基元模式或 極端途徑分析文章中都闡述過, 但是要分析生物體 的整體特性就需要定義新的參數和尋找新的方法. 除此之外, 盡管到目前為止, 已經有不少代謝網絡 的結構和功能被研究和分析過, 但是卻沒有人研究 不同的基元模式

40、對于一個穩(wěn)定狀態(tài)下的代謝通量分 布的貢獻值. 這些貢獻值代表了不同基元模式在一 個穩(wěn)定狀態(tài)下的代謝通量分布中是否發(fā)揮作用或者 發(fā)揮了多大的作用. 去 掉那些沒有發(fā) 揮作用的途 徑, 能夠進一步簡化代謝途徑分析; 從途徑發(fā)揮作 用的程度可以看出該途徑在該狀態(tài)下被調控的程度 ( 上調或者下調 , 從而為調控網絡分析提供便利. 最近, Wiback 等 59 利用極端途徑在這方面作了相 關研究. 他們利用線性優(yōu)化來給定一個特定極端途 Gag neur 和 Ma 等曾經從生物功能模塊的角度 把代謝網絡分成幾個子網絡, 但是那樣必然會致使 那些 橫 跨 幾 個 子 網 絡 的 途 徑 被 切 斷 而 丟

41、 失. Schust er 等 也曾提出一種代謝網絡的分解方法, 除了將那些底物和產物定義為外部代謝物外, 還定 義了其他高連接度代謝物作為外部代謝物, 從而把 代謝網絡分為幾個子網絡. 但顯然這個方法將會導 致許多基元模式的丟失, 因為在整個網絡中, 很多 基元模式由于那些代謝物被強行定義成外部代謝物 而無法平衡進而缺失. 這些基元模式的丟失將導致 無法描述某些生物功能, 所以要想評價生物體的整 體特征和功能, 要想得到所有的基元模式是一個棘 手的問題. 最近, Dandekar 等 57 從數學的角度出 發(fā), 把代謝物區(qū)分為內部代謝物和外部代謝物, 從 而得到最小數量的基元模式. 但是當應

42、用于大規(guī)模 網絡時, 也會面臨組合爆炸的問題. 盡管能夠得到 最小數量的基元模式, 但是在把代謝物劃分為外部 代謝物和內部代謝物時, 卻只是從數學的角度考慮 得到外部代謝物集合的 2 b 種 ( b 是分支節(jié)點代謝 56 # 1600 # 化 工 學 報 N et work. Science , 2001, 292: 929 934 8 2004 年 10 月 徑的權值范圍, 這就形成了所謂的 A譜范圍. A 譜 范圍定義了每條極端途徑能夠或者不能夠被包括在 一個穩(wěn)定狀態(tài)下的代謝通量分布的重建中, 并且還 定義了每條極端途徑對于重建的貢獻程度. 除此之 外, 如何把調控、膜滲透壓、電中性和熱力

43、學參數 等限 制 條件 都 整合 到 代謝 網絡 中 去 也是 一 個 挑 戰(zhàn) 60 . 雖然有人研究了調控對于代謝網絡途徑的 影響 15, 53 Johnson H E, Broadhurst D , K ell D B, T heodorou M K , M erry R J, Grif fit h G W1 High hroughput M et abolic Fingerprinting of -t Legume S ilage Ferm entations vi a Fourier T ransforms Infrared Spect roscopy and Chemomet ric

44、s. App l1 E nv iron1 M i crobiol 1 , 2004, 70 ( 3 : 1583 1592 9 Zhang Chunt ing ( 張春霆 . T he Current St at us and T he Prospect of Bioin form at ics. Worl d Sci 1 T ech1 Res1 De v1 ( 世界 科技 研 究與發(fā)展 , 2000, 22: 17 20 , 但是如何把它擴展到基于基因組的代 61 10 11 Alon U 1 Biological N etw orks: t he T ink erer as an Engi

45、neer1 Science , 2003, 301: 1866 1867 Barabasi A L , O lt vai Z N1 Netw ork Biology: U nderst anding t he Cell. s Functional Organization. N at1 Re v1 Genet1 , 2004, 5: 101 113 謝網絡研究也具有挑戰(zhàn)性. 最近, H errg rd 等 首 Û 次利用數據庫和有關實驗數據重建了大規(guī)模調控網 絡. 這些研究表明, 已經能夠在一定程度上重建調 控網絡, 但是調控網絡還是沒有和代謝網絡結合起 來. 有效地把調控網絡和基元

46、模式或者極端途徑分 析結合起來將會為更進一步系統詳細地分析細胞功 能帶來重大進展. 12 M ilo R , Itzkovit z S, K asht an N , Levitt R, Shen rr S , -O Ayzensht at I, Shef fer M , Alon U 1 Superf amilies of Evolved and Designed N et works1 S ci ence, 2004, 303: 1538 1542 13 Jeong H, Tombor B, A lbert R , O lt vai Z N , Barabasi A L1 The Large

47、 scale Organizat ion of M etabolic N et w orks. N atu re, 2000, 407: 651 654 14 Ravasz E, Somera A L, M ongru D A , Olt vai Z N , Barabasi A L1 Hierarchical O rganizat ion of M odularity in M et abolic Netw orks. Science , 2002, 297: 1551 1555 15 St elling J, K lamt S, Bet tenbrok K , S chust er S,

48、G illes E D1 M et abolic N et w ork 16 St ructure Det ermines K ey Aspects of Functionality and Regulat ion. N atu re, 2002, 420: 190 193 Famil i I, Forster J, N ielsen J , Palsson B O1 Saccharomyces Cerevisiae Phenotypes Can Be Predicted by U sing Const raint Based Analysis of a G enome -scale R ec

49、onst ruct ed M et abolic Netw ork. Proc N at l1 Acad1 Sci1 U1 S1 A1 , 2003, 100: 13134 1 13139 17 M a H W , Zeng A P1 R econstruct ion of M et abolic N et w ork from Genome Data and A nalysis of Their Global Struct ure for V arious Organisms. Bioi nf ormat ics, 2003, 19: 270 277 18 M a H W , Zeng A

50、P1 The Connectivity S truct ure, G iant S trong Component 19 and Cent rality in M et abolic Netw ork. Bi oi nf or mati cs, 2003, 19: 1423 1430 Gagneur J, Jackson D B , Casari G1 Hierarchical Analysis of Dependency in M et abolic N et works. Bioi nf ormat ics, 2003, 19: 1027 1034 20 F j rster J, Fami

51、li I, Fu P, Palsson B O , N ielsen J1 G enome Scale Reconst ruction of 21 t he S accharomyces cererv isiae M et abolic N et work1 G enome Res1 , 2003, 13: 244 253 K anehisa M , G ot o S, Kawashima S, N akaya A1 The KEG G Dat abases at GenomeNet1 N ucl1 A cids1 Res1 , 2002, 30: 42 46 22 23 Pet ri R ,

52、 S chmidt Dannert C1 BioCyc enom e and M et abolism1 -G Angew 1 Chem1 Int 1 Ed Engl1 , 2004, 43: 1908 Almaas E, K ovacs B, V icsek T , O lt vai Z N , Barabas i A L1 Global O rganizat ion of 24 25 26 M et abolic Fluxes in t he Bact erium Escheri chi a col i1 N at ure , 2004, 427: 839 843 Albert R , B

53、arabasi A L , Jeong H1 Pow er law D ist ribution of t he World W ide W eb 1 Scie nce , 2000, 287: 2115 Jeong H, M ason S P, Barabasi A L , O ltvai Z N1 Let hality and Cent rality in Prot ein N et works. N at ure , 2001, 411: 41 42 St rogatz S H1 Exploring Complex N etw orks1 N at ure , 2001, 4 結 論 代

54、謝途徑分析方法不僅在現有的生化工程研究 過程中發(fā)揮著越來越重要的作用, 而且在代謝網絡 模型和代謝工程研究、代謝網絡結構和功能分析, 以及生物假設的提出等過程中起著橋梁作用. 盡管 傳統的代謝途徑在生物研究和教學中發(fā)揮著重要的 作用, 但是從基因組重建得到代謝網絡的代謝途徑 分析方法將在未來的代謝工程及系統生物學研究中 發(fā)揮更加重要的作用. 發(fā)展方向是將代謝途徑分析 與調控網絡分析相結合. References 1 2 Chong L , Ray L B Whol e ist ic Biology1 S cience , 2002, 295: 1 1661 St ephanopoulos G

55、N , Arist idou A A, N ielsen J1 M et abolic Engineering Principles and M et at hodologies ( 代 謝 工 程 原 理與方法 . Zhao Xueming ( 趙學 明 , Bai D ongmei ( 白 冬梅 , t rans1 Beijing: Chemical Industry Press, 2003 3 K amimura R T, Bicciat o S, Shimizu H, Alf ord J, S tephanopoulos G . M ining of Biological D ata

56、I: Ident ifying D iscrim inating Features v ia M ean H ypot hesis Test ing. M etaboli c Engi neering , 4 5 6 2000, 2: 218 227 K itano H1 Systems Biology: A Brief O verview1 S cience , 2002, 295: 1662 1664 Xiang C C , C hen Y D1 cDN A M icroarray T echnology and It s A pplicat ions. Bi ot ech nology

57、Ad vances, 2000, 18: 35 46 O h M K , Liao J C1 D N A M icroarray Det ect ion of M et abolic R esponses t o Prot ein 7 Overproduct ion in E scherichi a col i . M et abol ic E ngineeri ng , 2000, 2: 201 209 T rey I, V est einn T , Jeff rey A R, Rowan C, Jeremy B, Jimmy K E, Roger B, David R G , Ruedi

58、A , Leroy H1 Int egrat ed G enomic and Prot eom ic A nalyses of a Systemat ically Perturbed M et abolic 第 55 卷 第 10 期 410: 268 276 27 何鋒等: 生物信息學 用于代謝網絡研究的進展與展望 266951 J1 Bact eri ol1, 2002, 184: 4582 4593 45 # 1601 # M a H W , Zhao X M , Y uan Y J , Zeng A P1 Decomposition of M etabolic Netw ork Bas

59、ed on th e Global Connect ivity St ruct ure of R eact ion G raph. Bi oi nf or mati cs, 2004, 20: 1870 1876 Price N D, Papin J A , Palsson B O1 D et erminat ion of Redundancy and Syst ems Propert ies of H el icobacter pylori . s M et abolic N et work U sing G enome -scale Extrem e Pat hway Analysis1 Genome Res1 , 2002, 1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論