




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、基因本體論(Gene Ontology)現(xiàn)今的生物學家們浪費了太多的時間和精力在搜尋生物信息上。這種情況歸結(jié)為生物學上定義混亂的原因:不光是精確的計算機難以搜尋到這些隨時間和人為多重因素而隨機改變的定義,即使是完全由人手動處理也無法完成。舉個例子來說,如果需要找到一個用于制抗生素的藥物靶點,你可能想找到所有的和細菌蛋白質(zhì)合成相關的基因產(chǎn)物,特別是那些和人中蛋白質(zhì)合成組分顯著不同的。但如果一個數(shù)據(jù)庫描述這些基因產(chǎn)物為“翻譯類”,而另一個描述其為“蛋白質(zhì)合成類”,那么這無疑對于計算機來說是難以區(qū)分這兩個在字面上相差甚遠卻在功能上相一致的定義。Gene Ontology (GO)項目正是為了能夠使對
2、各種數(shù)據(jù)庫中基因產(chǎn)物功能描述相一致的努力結(jié)果。這個項目最初是由1988年對三個模式生物數(shù)據(jù)庫的整合開始:FlyBase (果蠅數(shù)據(jù)庫Drosophila),tSaccharomyces Genome Database (酵母基因組數(shù)據(jù)庫 SGD) and the Mouse Genome Database (小鼠基 因組數(shù)據(jù)庫MGD)。從那開始,GO不斷發(fā)展擴大,現(xiàn)在已包含數(shù)十個動物、植物、微生物的數(shù)據(jù)庫。GO的定義法則已經(jīng)在多個合作的數(shù)據(jù)庫中使用,這使在這些數(shù)據(jù)庫中的查詢具有極高的一致性。這種定 義語言具有多重結(jié)構(gòu),因此在各種程度上都能進行查詢。舉例來說,GO可以被用來在小鼠基因組中查詢 和
3、信號轉(zhuǎn)導相關的基因產(chǎn)物,也可以進一步找到各種生物地受體酪氨酸激酶。這種結(jié)構(gòu)允許在各種水平添加對此基因產(chǎn)物特性的認識。GO發(fā)展了具有三級結(jié)構(gòu)的標準語言(ontologies),如表所示。根據(jù)基因產(chǎn)物的相關分子功能,生物學途徑,細胞學組件而給予定義,無物種相關性。本體論內(nèi)容分子功能本體論基因產(chǎn)物個體的功能,如與碳水化合物結(jié)合或ATP水解酶活性等生物學途徑本體論分子功能的有序組合,達成更廣的生物功能,如有絲分裂或嘌吟代謝等細胞組件本體論亞細胞結(jié)構(gòu)、位置和大分子復合物,如核仁、端粒和識別起始的復合物等基本來說,GO工作可分為三個不同的部分:第一,給予和維持定義;第二,將位于不同數(shù)據(jù)庫中的本體 論語言、
4、基因和基因產(chǎn)物進行聯(lián)系,形成網(wǎng)絡;第三,發(fā)展相關工具,使本體論的標準語言的產(chǎn)生和維持更為便捷。本體論(The ontologies)GO的結(jié)構(gòu)包括三個方面?D?D分子生物學上的功能、生物學途徑和在細胞中的組件作用。當然,它們可 能在每一個方面都有多種性質(zhì)。如細胞色素C,在分子功能上體現(xiàn)為電子傳遞活性,在生物學途徑中與氧化 磷酸化和細胞凋亡有關,在細胞中存在于線粒體質(zhì)中和線粒體內(nèi)膜上。下面,將進一步的分別說明GO的具體定義情況?;虍a(chǎn)物基因產(chǎn)物和其生物功能常常被我們混淆。例如,“乙醇脫氫酶”既可以指放在Eppendorf管里的基因產(chǎn)物, 也表明了它的功能。但是這之間其實是存在差別的?D?D 一個
5、基因產(chǎn)物可以擁有多種分子功能,多種基因 產(chǎn)物也可以行使同一種分子功能。比如還是“乙醇脫氫酶”,其實多種基因產(chǎn)物都具有這種功能,而并不是 所有的這些酶都是由乙醇脫氫酶基因編碼的。一個基因產(chǎn)物可以同時具有乙醇脫氫酶”和“乙醛歧化酶”兩種 功能,甚至更多。所以,在GO中,很重要的一點在于,當使用“乙醇脫氫酶活性”這種術語時,所指的是功能,并不是基因產(chǎn)物。許多基因產(chǎn)物會形成復合物后執(zhí)行功能。這些“基因復合物”有些非常簡單(如血紅蛋白由血紅蛋白基因產(chǎn) 物a一球蛋白、月一球蛋白和小分子的亞血紅素組成),有些非常復雜(如核糖體)?,F(xiàn)在,小分子的描述 還沒有包括在GO中。在未來,這個問題可望由和現(xiàn)在的Klot
6、ho和LIGAND等小分子數(shù)據(jù)庫聯(lián)合而解決。分子功能分子功能描述在分子生物學上的活性,如催化活性或結(jié)合活性。GO分子功能定義功能而不是整體分子,而且不特異性地指出這些功能具體的時空信息。分子功能大部分指的是單個基因產(chǎn)物的功能,還有一小部分是此基因產(chǎn)物形成的復合物的功能。定義功能的義項包括催化活性、轉(zhuǎn)運活性、結(jié)合活性等,更為狹窄的定義包括腺苷酸環(huán)化酶活性或鐘形受體結(jié)合活性等。生物學途徑生物學途徑是由分子功能有序地組成的,具有多個步驟的一個過程。舉例來說,較為寬泛的是細胞生長和維持、信號傳導。一些更為具體的例子包括嘧啶代謝或a一配糖基的運輸?shù)?。一個生物學途徑并不是完全和一條生物學通路相等。因此,G
7、O并不涉及到通路中復雜的機制和所依賴的因素。細胞組件細胞中的位置指基因產(chǎn)物位于何種細胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核或核糖體,蛋白酶體等)。GO的形式GO定義的術語有著直接非循環(huán)式(directed acyclic graphs (DAGs)的特點,而并非是傳統(tǒng)的等級制(hierarchy )定義方式(隨著代數(shù)增加,下一級比上一級更為具體)。舉個例子來說,生物學途徑中有一個定義是己糖合成,它的上一級為己糖代謝和單糖合成。當某個基因被注解為“己糖合成活性”后,它自動地獲得了己糖代謝和單糖合成地注解。因為在GO中,每個術語必須遵循“真途徑“法則,即如果下一代的術語可以用于描述此基因產(chǎn)物,其上一
8、代術語也可以適用。GO 的注釋(Annotation)那么,GO中的術語如何和相對應的基因產(chǎn)物相聯(lián)系的呢?這是由參與合作的數(shù)據(jù)庫來完成的,它們使用GO的定義方法,對它們所包含的基因產(chǎn)物進行注解,并且提供支持這種注解的參考和證據(jù)。每個基因或基因產(chǎn)物都會有一個列表,列出與之相關的GO術語。每個數(shù)據(jù)庫都會給出這些基因產(chǎn)物和GO術語的聯(lián)系數(shù)據(jù)庫,并且也可以在GO的ftp站點上和WEB方式查詢到。并且,GO聯(lián)合會提供了簡化的本體論術語(GO slim),這樣,可以在更高級的層面上研究基因組的功能。 比如,粗略地估計哪一部分的基因組與信號傳導、代謝合成或復制有關。GO對基因和蛋白的注釋闡明了基因產(chǎn)物和用于
9、定義他們的GO術語之間的關系?;虍a(chǎn)物指一個基因編 碼的RNA或蛋白產(chǎn)物。因為一個基因可能編碼多個具有很不相同性質(zhì)的產(chǎn)物,所以GO推薦的注釋是針 對基因產(chǎn)物的而不是基因的。一個基因是和所有適用于它的術語聯(lián)系在一起的。一個基因產(chǎn)物可以被一種本體論定義的多種分支或多種水平注釋。注釋需要反映在正常情況下此基因產(chǎn)物 的功能,生物途徑,定位等,而并不包括其在突變或病理狀態(tài)下的情況。GO聯(lián)合會的各個數(shù)據(jù)庫成員采 用手動或自動的方式生成注釋,這兩種方式共有的原理是:一所有的注釋都需要有來源,可以是文字、另一 個數(shù)據(jù)庫或是計算機分析結(jié)果;二.注釋必須提供支持這種基因產(chǎn)物和GO術語之間聯(lián)系的證據(jù)。GO文件格式G
10、O的所有數(shù)據(jù)都是免費獲得的。GO數(shù)據(jù)有三種格式:flat (每日更新)、XML(每月更新)和MySQL (每月更新)。這些數(shù)據(jù)格式都可以在GO ftp的站點上下載。XML和MySQL文件是被儲存于獨立的GO數(shù)據(jù)庫中。如果需要找到與某一個GO術語相關的基因或基因產(chǎn)物,可以找到一個相應表格,搜尋到這種注解的編號,并且可以鏈接到與之對應的位于不同數(shù)據(jù)庫的基因相關文件。GO瀏覽器和修改器(browser and editor)GO術語和注釋使用了多種不同的工具軟件它們都可以在web方式的“GO瀏覽器”下“GO software page”中找到。大多數(shù)GO瀏覽器都是web模式的,允許你直觀的看到術語和
11、其相關信息,如定義、同義詞和數(shù)據(jù)庫參考等。有些GO瀏覽器如AmiGO和QuickGO,可以看到每個術語的注釋。而可下載的DAG-Edit編輯器,一樣可以離線地顯示注釋和所有本體論定義的信息。對于每一個瀏覽器來說,都可以選擇最適用于你要求的工具軟件。常見的三種瀏覽器AmiGO from BDGP在AmiGO中,可以通過查詢一個GO術語而得到所有具有這個注釋的基因產(chǎn)物,或查詢一個基因產(chǎn)物而得到它所有的注釋關系。還可以瀏覽本體論,得到術語之間的關系和術語對應的基因產(chǎn)物數(shù)目。AmiGO直接連接GO下的MySQL。MGI GO Browser MGI GO的功能類似于AmiGO,所不同的在于它所得到的基
12、因為小鼠基因。MGI GO瀏覽器直接連接GO下的MGI數(shù)據(jù)庫。QuickGO at EBI QuickGO,整合在EBI下的InterPro中,可以通過查詢一個GO術語而得到它的定義與關系描述、在SWISS-PROT中的定位、在酶分類學(EC)和轉(zhuǎn)運分類學(TC)中的定位和InterPro中的定位等。其他還有一些特殊的瀏覽GO的瀏覽器,其中括號中為建立機構(gòu)和主要特色:EP GO Browser(EBI,基因表達情況),、GoFish (Harvard, Boolean 查詢、GenNav(NLM,圖像化展示)、GeneOntologyRZPD(RZPD,UniGene)、ProToGO(Heb
13、rew University,GO 的亞圖像化)、CGAPGO Browser (癌癥基因組解剖工程,癌癥)、GOBrowser (Illuminae,perl.、TAIR Keyword Browser(TAIR,擬南芥)、PANDORA (Hebrew University,非一致化蛋白)。修改器GO術語和本體論結(jié)構(gòu)可以由任何可以讀入GO平板文件的文本修改器進行編輯,但是這需要對平板文件非常熟悉。因此,DAG-Edit是被推薦使用的,它是為GO特別設計的,能夠保證文件的句法正確GO注釋可以被多種數(shù)據(jù)庫特異性的工具所編輯,如TIGR的Manatee和EBI的Talisman tool。但是G
14、O數(shù)據(jù)庫中寫入新的注釋是需要通過GO認證的管理員方可進行的,如果想提出新的注釋或?qū)Ρ倔w論的建議,可以聯(lián)系GO。主要修改器為DAG-Edit和COBrA。DAG-Edit基于Java語言,提供了能瀏覽、查詢、編輯具有DAG數(shù) 據(jù)格式的GO數(shù)據(jù)界面。在SourceForge可以免費下載,伴隨著幫助文件。COBrA能夠編輯和定位GO 和OBO本體論。它一次顯示兩個本體論,因此可以在不同的水平相應定位。(如組織和細胞類型水平) 優(yōu)點在于可以綜合幾種本體論,支持的文件格式多,包括GO平板文件、GO RDF和OWL格式等。如圖為DAG-Edit的界面,可以分為四個部分:1)定義編輯面板(term edit
15、or panel)顯示當下的本體論。也是主要的編輯本體論結(jié)構(gòu)的工具,可以通過點擊和拖動術語來修改本體論的從屬關系。2)文本編輯面板(text editor panel)修改術語中的內(nèi)容。在修改多個術語時,會出現(xiàn)一個選擇菜單,可以選中后逐個修改。3) DAG瀏覽器DAG瀏覽器是一個插件,能夠以圖形的方式展示具有復雜的從屬關系的術語。4)搜尋/屏蔽面板可搜尋術語、術語類型和術語間關系。可自定義屏蔽條件,限制得出的搜尋結(jié)果。GO數(shù)據(jù)庫的查找和瀏覽FAQ如何搜尋注釋?使用AmiGO瀏覽器,可以在所有參與的數(shù)據(jù)庫中搜尋一個特定的注解。AmiGO允許使用GO術語或基因產(chǎn)物的搜尋。搜尋結(jié)果包括GO對這個術語
16、的等級分級情況,定義和近義結(jié)構(gòu),外部鏈接,所有相聯(lián)系的基因產(chǎn)物和它的下一級術語。如何得到全部的GO注釋?在GO網(wǎng)站上,基因產(chǎn)物與GO聯(lián)系的組信息都有提供。這些文件儲存了基因/基因產(chǎn)物的ID和引用文獻等支持證據(jù)(如FlyBase基因ID, SWISS-PROT蛋白ID),在 ftp站點上都可以獲得。在一些模式生物中,一個基因通常有多個與之相關的核苷酸序列,如EST、蛋白序列等。要查詢到這些 序列,可以從該模式生物數(shù)據(jù)庫中通過基因聯(lián)系(gene association)查詢到基因獲得ID(gene accession ID),或是分別在Compugen中查詢大的轉(zhuǎn)錄產(chǎn)物(transcipt)和SW
17、ISS-PROT/TrEMBL中查詢蛋白。如何得到由GO術語注解的蛋白序列?在GO網(wǎng)頁上選擇能查詢到所有數(shù)據(jù)庫的Amig。瀏覽器,鍵入GO術語(如“線粒體”),在結(jié)果中顯示了 被注釋的基因。然后選擇你所需基因,在網(wǎng)頁的最低端把選項拖至“get fasta sequence區(qū)域,再確定即可。如何能夠找到所有和一個特定的GO術語相關的人類基因呢?GO術語是和SWISS-PROT/TrEMBL/InterPro and Ensembl中的蛋白序列無贅余地對應的。這些注釋在EBI上的GOA-Human文件中,GO的FTP站點上,Ensembl,EMBL-Bank上都可找到。6.可以直接使用GenBan
18、k的gi獲取碼在GO數(shù)據(jù)庫中進行查詢嗎?GO數(shù)據(jù)庫中除了 Compugen所提供的GenBank獲取碼之外,沒有包含其他GenBank獲取碼的信息,但是在EBI的GOA(GO Annotation)中,有一個綜合的對GenBank/EMBL/DDBJ進行查詢的方式,詳細請見: HYPERLINK ftp:/ftp.ebi.ac.uk/pub/databases/GO/goa/HUMAN/xrefs.goa ftp:/ftp.ebi.ac.uk/pub/databases/GO/goa/HUMAN/xrefs.goa.GO與其他分類系統(tǒng)的定位關系(Mapping to GO)GO并不只是希望為基
19、因組建立一個標準化的、結(jié)構(gòu)清晰的注釋語言。GO致力于各種基因組數(shù)據(jù)庫的標準化。GO為各種基因組分類系統(tǒng)和GO注釋之間的轉(zhuǎn)化提供了轉(zhuǎn)化表,見 HYPERLINK /GO.indices.html /GO.indices.html數(shù)據(jù)庫索引文件來源UniProt Knowledgebase spkw2go Evelyn Camon (Note: spkw2go used to be called swp2go, all filesremain the same.)Enzyme Commission ec2go Michael AshburnerEGAD egad2go Michael Ashbur
20、nerGenProtEC genprotec2go Heather Butler and Michael AshburnerTIGR role tigr2go Michael AshburnerTIGR Families tigrfams2go TIGR StaffInterPro interpro2go Nicola MulderMIPS Funcat mips2go Michael Ashburner and Midori HarrisMetaCyc Pathways metacyc2go Michael Ashburner and Midori HarrisMultiFun Classi
21、fications multifun2go Michael Ashburner, Jane Lomax and Margrethe Hauge SerresPfam Domains pfam2go Nicola MulderProdom Domains prodom2go Nicola MulderPrints Domains prints2go Nicola MulderProSite Domains prosite2go Nicola MulderSmart Domains smart2go Nicola MulderREADME需要注意的是,這些轉(zhuǎn)化不是完全而精確的。其中的一個原因可能是
22、GO有一套完整的定義系統(tǒng),而很多數(shù)據(jù)庫并不具有。GO的應用GO的局限性GO不是基因序列或基因產(chǎn)物數(shù)據(jù)庫,相反的,GO強調(diào)基因產(chǎn)物在細胞中的功能。GO不是整合數(shù)據(jù)庫的一種方式(如聯(lián)邦式整合數(shù)據(jù)庫),它并不能做到這點是因為:更新速度較慢由于每個人對數(shù)據(jù)定義的方式不同,標準難以達到一致。GO并不對生物學的每個方面進行描述。如功能域的結(jié)構(gòu)、3D結(jié)構(gòu)、進化等。GO是對基因功能的注解,但是有其局限性。比如說,GO不能反映此基因的表達情況,即是否在特定細胞中、特定組織中、特定發(fā)育階段或與某種疾病相關。GO雖然不涉及這些方面,但是支持其他的OBO(open biology ontologies)成員成立其他類
23、型的本體論數(shù)據(jù)庫(如發(fā)育本體學、蛋白組本體學、基因芯片本體學等)用于基因組分析基因組和全長cDNA序列工程通常會根據(jù)序列的相似性,推測基因與已注釋的基因功能類似?,F(xiàn)在最常用 的手段是在SWISS-PROT序列中設定一個相似性的域值,使用計算機化的方法來判斷。因此,根據(jù)這一 原理,也可以得到新的GO注釋(被標記為“根據(jù)電子注釋推測”)。一個GO的重要應用方面是對于一個 GO術語,能形成一個相聯(lián)系的基因產(chǎn)物組。舉例來說,某一基因產(chǎn)物可以被精確地注釋為在碳水化合物 代謝的一個特定的功能,如葡萄糖代謝,而在總結(jié)碳水化合物代謝時,所有這些基因產(chǎn)物都會聚集到一起。GO計劃為每一個高頻出現(xiàn)的術語建立文檔總匯
24、,現(xiàn)在有些已經(jīng)在“GO Slim ”中實現(xiàn)了。用于基因表達分析如在芯片數(shù)據(jù)中引入GO注釋,通??梢越沂境鰹槭裁匆粋€特定組的基因擁有相似的表達模式。共表達的 基因可能編碼在同一個生物過程中出現(xiàn)的基因產(chǎn)物,或定位于同一個細胞部位的。如果未知基因和一些已 被GO過程術語相似地注釋了的基因共表達,那么這個未知基因很有可能在同一個過程中發(fā)揮功能。分析和操作基因表達芯片數(shù)據(jù),并且又能結(jié)合GO注釋的軟件已產(chǎn)生。EBI提供的Expression Profiler,和EP:GO都具有此功能。GO可能的應用GO的應用前景很廣闊,不可能一一列出,現(xiàn)在已用到的包括:整合來自于不同生物的蛋白組信息。判定蛋白結(jié)構(gòu)域的功能
25、。找到在疾病/衰老中異常表達的基因的功能類似性。預測與一種疾病相關的基因分析在發(fā)育中同時表達的基因建立起自動的能從文獻中獲取基因功能信息的工具。GO規(guī)模如上所述,GO的三層結(jié)構(gòu)是分子功能、生化途徑和細胞組件。GO包含的大部分為平板格式文件(GO flat file),由每一種本體論中定義的文件為文本文件,而包含本體論和定義兩種格式的是OBO格式的平板文 件,XML作為可以用于三種本體論和所有定義的文件格式也有提供。這些文件都在每月的1日更新,GO每月將給出月份更新報告。GO的使用和引用GO的使用基因本體論聯(lián)合會是由國家人類基因組研究所(NHGRI)的R1撥款所贊助,此外還有歐盟RTD項目“生活
26、質(zhì)量和生活資源管理”撥款。Gene OntologyTM由AstraZeneca公司提供資金贊助,而SGD小組得到了IncyteGenomics 的贊助。GO數(shù)據(jù)庫中的術語、注釋等都屬于公共范疇。GO的資源是免費的,但是必須在以下三種情況下使用:必需引用基因本體論聯(lián)合會。所使用的GO文件必需標明GO的版本號和日期。(GO處于不斷更新中)GO文件的內(nèi)容和內(nèi)在的邏輯關系不得被更改。引用GO當使用GO資源時,請引用以下文獻:Gene Ontology: tool for the unification of biology. The Gene Ontology Consortium (2000) N
27、ature Genet. 25: 25-29.當引用亞數(shù)據(jù)庫資源時,請參考GO的publication list?!傍B槍法(shotgun)”定量蛋白質(zhì)組學技術默認分類2010-06-29 14:19:17閱讀172評論0 字號:大中小訂閱“鳥槍法(shotgun)”定量蛋白質(zhì)組學技術復雜的蛋白樣品首先經(jīng)過酶解形成肽段,再經(jīng)過廣泛分級,由自動化的串聯(lián)質(zhì)譜鑒定。這種方法可以 分析全細胞裂解樣品和組織抽提物,也可以分析亞細胞分級組分、分離的細胞器等其他亞蛋白質(zhì)組。如果 樣品已經(jīng)過穩(wěn)定同位素標記。根據(jù)不同標記的信號強度比例就可以精確確定化學上具有均一性的蛋白在不 同樣品中的相對豐度,這種多重分析可以
28、利用在譜圖上產(chǎn)生前后次序的質(zhì)量標記得以完成。質(zhì)譜分析以前 在樣品中加入同位素標記的某種質(zhì)量校準肽,通過對此肽的相對定量就可以獲得絕對定量的信息。實現(xiàn)目 的肽段的絕對定量,而這一性質(zhì)可以被充分應用以提供臨床診斷的標準值或閾值。差異蛋白質(zhì)的定量研究是基于肽段水平而非完整的蛋白質(zhì),成為該技術最大的技術特色,該技術實現(xiàn) 了樣品分離與鑒定直接聯(lián)合,完全自動化操作,可以用于各種蛋白質(zhì)混合物的蛋白質(zhì)組學分析,如血清、 組織、各種體液以及尿液等。分析目標尋找差異表達蛋白,并分析蛋白功能二、項目實驗方案針對液體或SDS條帶的復雜混合物樣品推出的質(zhì)譜鑒定新方法。該方法利用最新的LC-MS/MS質(zhì)譜儀可在線同時鑒定
29、成百上千中蛋白質(zhì)。三、項目分析方案1、差異基因篩選我們利用統(tǒng)計學方法篩選差異表達的蛋白。一般認為高豐度蛋白鑒定出多個肽段,低豐度蛋白鑒定出 較少肽段,因此檢定出來的肽段數(shù)可以直接反映蛋白的表達量。我們認為經(jīng)過檢驗校正的p-value: p0.01 的基因為差異表達基因。2、Gene ontology 分析GO數(shù)據(jù)庫包含了基因參與的生物過程,所處的細胞位置,發(fā)揮的分子功能三方面功能信息,并將概 念粗細不同的功能概念組織成DAG (有向無環(huán)圖)的結(jié)構(gòu)。Gene Ontology是一個使用有控制的詞匯表和 嚴格定義的概念關系,以有向無環(huán)圖的形式統(tǒng)一表示各物種的基因功能分類體系,從而較全面地概括了基
30、因的功能信息,糾正了傳統(tǒng)功能分類體系中常見的維度混淆問題。在基因表達譜分析中,GO常用于提供 基因功能分類標簽和基因功能研究的背景知識。利用GO的知識體系和結(jié)構(gòu)特點,旨在發(fā)掘與基因差異表 達現(xiàn)象關聯(lián)的單個特征基因功能類或多個特征功能類的組合。對于每一種表達趨勢的基因,選擇性的進gene ontology功能分析。對差異表達的所有基因向gene ontology數(shù)據(jù)庫的各節(jié)點映射。計算每個節(jié)點的基因數(shù)目,并結(jié)合整個數(shù)據(jù)庫的基因作為背景分部,對于 每個節(jié)點,得到一個2x2的表格,使用超幾何分布檢驗基因在每個GO節(jié)點的富集或貧乏程度。3、network 分析差異蛋白/基因之間相互網(wǎng)絡構(gòu)建:4、Pat
31、hway enrichment 分析找出差異表達基因在生物學通路中的位置,以闡明其生物學功能以及不同基因之間的相互作用。1)、把差異表達基因定位在生物學通路(Pathway)o2)、統(tǒng)計分析,確定差異基因可否可以代表某些生物學通路Pathway分析方法:我們將差異基因使用GenMAPP v2.1向KEGG pathway數(shù)據(jù)庫映射,并統(tǒng)計基因在每個pathway中 的富集程度(enrichment p-value)。Pathway分析結(jié)果:共找到 n 個相關的 pathway (其中 4 個 pathway p-value0.05):TermCountP-Valuemmu01430:Cell
32、Communication70.028703946mmu04115:p53 signaling pathway60.005735419mmu04010:MAPK signaling pathway100.034254577mmu04340:Hedgehog signaling pathway50.014277137mmu04512:ECM-receptor interaction 50.062388156以某一 pathway為例:差異蛋白的代謝通徑分析,其中紅色代表上調(diào)的基因/蛋白,綠色代表下調(diào)的基因/蛋白5、轉(zhuǎn)錄因子預測分析利用相關的轉(zhuǎn)錄因子(TF)數(shù)據(jù)庫,將差異基因的啟動子(基因第一個外顯子上游1000bp)提取出來。我們使用HsPD提供的啟動子序列。轉(zhuǎn)錄因子數(shù)據(jù)庫使用TRANSFAC 7.0 public轉(zhuǎn)錄因子結(jié)合位點預測 使用pwmatch程序,對每個轉(zhuǎn)錄因子分析其在上調(diào)基因和下調(diào)基因的分布情況,利用chi-square test尋 找有差異的轉(zhuǎn)錄因子。Gene Ontology 是什么?Ontology:哲學中稱為本體論/存在論,這里本質(zhì)是指一系列特定的文字可用來形 容一些特定的模式、元件或角色,因此在國外的華人生物信息學家中試譯為語義 (學)。Q最佳答案Ontology:哲學中稱為本體論/存在論,這里本質(zhì)是指一系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 借款投資合作合同范本
- 公司廠房抵押合同范本
- ktv經(jīng)營合同范本
- 與商戶合同范本
- 親戚之間租車合同范本
- 勞動合同范本 日語
- 2024年重慶市榮昌區(qū)人民醫(yī)院招聘筆試真題
- 中國監(jiān)理合同范本
- 中山餐飲合同范本
- 2024年河源市紫金縣藍塘鎮(zhèn)招聘考試真題
- 2025年不停電電源(UPS)項目合作計劃書
- 2025年國家林業(yè)和草原局直屬事業(yè)單位第一批招聘應屆畢業(yè)生96人歷年高頻重點模擬試卷提升(共500題附帶答案詳解)
- 2025年春季開學典禮校長講話稿-少年無畏凌云志扶搖直上入云蒼
- 2025年湖南食品藥品職業(yè)學院高職單招職業(yè)適應性測試近5年常考版參考題庫含答案解析
- 碳酸鈣脫硫劑項目可行性研究報告立項申請報告模板
- 山東省泰安市新泰市2024-2025學年(五四學制)九年級上學期1月期末道德與法治試題(含答案)
- 1《北京的春節(jié)》課后練習(含答案)
- (完整版)陸河客家請神書
- 2025年行業(yè)協(xié)會年度工作計劃
- DB3502T 160-2024 工業(yè)產(chǎn)品質(zhì)量技術幫扶和質(zhì)量安全監(jiān)管聯(lián)動工作規(guī)范
- 2025年學校教師政治理論學習計劃
評論
0/150
提交評論