基因芯片分析的理論與方法課件_第1頁
基因芯片分析的理論與方法課件_第2頁
基因芯片分析的理論與方法課件_第3頁
基因芯片分析的理論與方法課件_第4頁
基因芯片分析的理論與方法課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基因芯片分析的理論與方法基因芯片概論基因芯片分析的概念基因芯片分析的優(yōu)點快速高通量(104-106)自動化使用的試劑少低本錢基因芯片分析的應(yīng)用范圍AcademicresearchofgeneticdiseasesCancerPrenatalgenetics〔產(chǎn)前遺傳學(xué)研究〕GeneralgeneticdiseasesInfectiousdiseasesDrugdiscoveryAnimalfarming/veterinaryIndustrial(fermentation)Environmental開展的方向:從多角度研究揭示生命現(xiàn)象Stages:developmental,transformation,timeftertreatment,etc.Treatments(stimuli,drugs,nutrients,etc.)Physiologicalstates(stressed,fasting,etc.)Tissuedistribution(position,3D)基因芯片的開展是推動系統(tǒng)生物學(xué)開展的動力利用基因芯片研究生命現(xiàn)象的測略Factorsinvolved=>ComponentsOrderofevents=>PathwaysInteractions=>Circuit

KEGGGO基因芯片的分類根據(jù)用途分類

geneexpressionpatternBiologicalSampleFunctional

Information基因芯片的分類Oligonucleotidearray–Synthesizedonachip〔Affymetrix〕–Spotonasolidmatrix〔Compugen〕cDNAarray〔Incyte〕根據(jù)探針類型分類

expressiongenomicanalysiscDNA-Chip GenomicChip<2,000n>50,000n基因芯片分析試驗方法基因芯片分析的主要步驟cDNA基因芯片分析的主要步驟cDNA芯片分析的主要步驟SpotbyArrayspottercDNA芯片分析的主要步驟HybridizingbyAutomatichybridizationprocessorcDNA芯片分析的主要步驟LaserscannerOligonucleotidearray〔GeneChip〕LLLLLLLLcDNAAAAA總RNA的制備反轉(zhuǎn)錄體外轉(zhuǎn)錄生物素標(biāo)記的cRNA片段化處理帶標(biāo)記的cRNA片斷35-200bases0.5-2ug/ul起始用量5-10ug(IVT)操作流程〔以真核生物為例〕LLLLL標(biāo)記的cRNA片斷雜交混合液的制備EukaryoticHyb.ControlControlOligoB2雜交(16hour)數(shù)據(jù)分析掃描洗脫染色Oligonucleotidearray的特點1個平方厘米的面積至少可排列四十多萬個探針合成區(qū)〔“點〞〕基因2基因1cDNA基因2cDNA用于cDNA芯片的探針Oligoprobe基因1多個檢測結(jié)果可以參考Oligonucleotidearray的優(yōu)越性cDNA芯片Affy芯片優(yōu)勢芯片分析數(shù)據(jù)的標(biāo)準(zhǔn)化Quantitationdata-qualityassessments背景處理:圖像上各點的吸光度值包含了樣品和背景信號,在提取數(shù)據(jù)前必須將背景扣除雜交點質(zhì)量:由于點樣或膜變形等原因目前較多的軟件對雜交點的識別定位仍需要人為的調(diào)整數(shù)據(jù)的標(biāo)準(zhǔn)化:其目的是防止基因芯片實驗中因系統(tǒng)差異造成芯片間數(shù)據(jù)比較的困難。最常用的是“看家基因〞法,它預(yù)先選擇一組表達水平不變的看家基因,計算出這組基因平均ratio值為1時的標(biāo)準(zhǔn)化系數(shù),然后將其應(yīng)用于全部的數(shù)據(jù)以到達標(biāo)準(zhǔn)化的目的ScatterplotsforaCy5-liver/Cy3-livercontrolhubridizationACy5-ovariantumor/Cy3-normalovaryhubridizationThevalueofCy3andCy5hydridizationsignalsfromeachclonewereplotteddirectlyontotheplot〔卵巢癌〕DataAnalysis-RevealtheDifference基因芯片數(shù)據(jù)分析和信息挖掘方法一.聚類分析聚類分析聚類分析是模式識別中一種非常有吸引力的方法,特別適用于模式分類數(shù)不知道的情況。從機器學(xué)習(xí)的角度來看,有兩種根本的聚類分析:有教師聚類無教師聚類基因表達數(shù)據(jù)聚類分析一般包括以下幾個步驟:〔1〕確定基因表達的數(shù)據(jù)〔2〕計算相似性矩陣,各個矩陣元素代表兩個基因的表達是否相似〔3〕選擇算法進行聚類分析〔4〕顯示分析結(jié)果。對數(shù)據(jù)進行聚類分析之前,必須將包含在基因表達矩陣中的數(shù)據(jù)進行相似程度分析,并且對分析結(jié)果進行量化。通常情況下,相似往往被賦于一個較大的量化的值,而不相似那么由一個較小的量化的值來表示。在實際計算中,往往以距離代替相似的概念,相似性度量被轉(zhuǎn)化為兩個基因表達模式之間的距離。距離越小,表達模式越相近,反之,那么表達模式差異大。兩個表達模式之間的關(guān)系(a)相似(b)變化趨勢一致(c)兩個基因的調(diào)控結(jié)果不一樣或甚至相反聚類分析的目的可誘導(dǎo)基因是共表達的許多構(gòu)成性表達的基因不受調(diào)節(jié)根據(jù)表達相似形排列基因功能相似的基因被聚為不同的類可以揭示細胞的生理狀態(tài)可以幫助研究未知基因的功能聚類結(jié)果顯示:

Cluster,Clusterviewer二.基因調(diào)控網(wǎng)絡(luò)分析2.1基本理論定義一個基因網(wǎng)絡(luò)(pathway)由一組生物分子〔如基因、蛋白質(zhì)〕以及它們之間的相互作用構(gòu)成,這些生物分子共同完成一些特定的細胞功能任務(wù)在實際分析過程中,往往以圖這種數(shù)據(jù)結(jié)構(gòu)表示基因網(wǎng)絡(luò),圖中的節(jié)點代表基因或者蛋白質(zhì),而節(jié)點之間的連線代表基因、蛋白質(zhì)之間的相互作用。基因網(wǎng)絡(luò)描述了特定細胞或組織中的功能路徑,如代謝、基因調(diào)控,信號傳導(dǎo)等。原理基因表達實際上是細胞、組織、器官受遺傳和環(huán)境影響的結(jié)果。一個基因的轉(zhuǎn)錄和表達由細胞的生化狀態(tài)所決定,在一個基因的轉(zhuǎn)錄過程中,一組轉(zhuǎn)錄因子作用于該基因的啟動子區(qū)域,控制該基因轉(zhuǎn)錄,而這些轉(zhuǎn)錄因子本身又是其它基因的產(chǎn)物。當(dāng)一個基因通過轉(zhuǎn)錄、翻譯形成功能基因產(chǎn)物后,它將改變細胞的生化狀態(tài),從而直接或間接地影響其它基因的表達,甚至影響自身的表達。多個基因的表達不斷變化,使得細胞的生化狀態(tài)不斷地變化。一個基因的表達受其它基因的影響,而這個基因又會影響其它基因的表達,這種相互影響、相互制約關(guān)系構(gòu)成了復(fù)雜的基因表達調(diào)控網(wǎng)絡(luò)。基因表達數(shù)據(jù)之中隱含基因之間的相互作用關(guān)系,因而可以通過分析基因表達數(shù)據(jù),構(gòu)建基因調(diào)控網(wǎng)絡(luò)應(yīng)用BetterunderstandthephysiologyoftheorganismPredicttheeffectofadrug–PredicttheweaknessesorsideeffectsofadrugPredictgoodorbaddrugcombinationsUnderstanddiseaseprocessesGenefunctionassignmentMakea“perfect〞simulationofcellularfunctiontouseasanexperimentalmodelManytools“feed〞intothisunderstandingincludingmicroarrays2.2pathway數(shù)據(jù)庫介紹Pathway數(shù)據(jù)庫GOKEGGGENMAPPBIACARTAGeneNet細胞因子網(wǎng)絡(luò)數(shù)據(jù)庫自由基信號數(shù)據(jù)庫關(guān)于GOGO(geneontology)是基因本體論聯(lián)合會(GeneOntologyConsortium)所建立的數(shù)據(jù)庫,旨在建立一個適用于各種物種的,對基因和蛋白功能進行限定和描述的,并隨著研究的不斷深入而更新的語言詞匯標(biāo)準(zhǔn)。GO是多種生物學(xué)本體論語言中的一種,提供了三層結(jié)構(gòu)的系統(tǒng)定義方式,用于描述基因產(chǎn)物的功能。GO可以被用來在小鼠基因組中查詢和信號轉(zhuǎn)導(dǎo)相關(guān)的基因產(chǎn)物GO開展了具有三級結(jié)構(gòu)的標(biāo)準(zhǔn)語言〔ontologies〕。根據(jù)基因產(chǎn)物的相關(guān)分子功能,生物學(xué)途徑,細胞學(xué)組件而給予定義,無物種相關(guān)性。關(guān)于KEGGKEGG(KyotoEncyclopediaofGenesandGenomes)〔京都大學(xué)基因和基因組百科全書數(shù)據(jù)庫〕KEGG是系統(tǒng)分析基因功能的數(shù)據(jù)庫,將基因組的信息與基因功能聯(lián)系起來,旨在揭示生命現(xiàn)象的遺傳與化學(xué)藍圖數(shù)據(jù)庫KEGGPATHWAYDatabaseKEGGGENESDatabaseKEGGLIGANDDatabase用途搜尋pathway,產(chǎn)生可能的反響路徑搜尋類似的基因序列搜尋類似的基因組序列搜尋類似的復(fù)合物結(jié)構(gòu),類似的多糖結(jié)構(gòu)及類似的反響類別通路信息基因組信息化學(xué)信息KEGG中的通路分為五大類:

1.新陳代謝通路

2.遺傳信息處理通路

3.環(huán)境信息處理通路

4.細胞內(nèi)通路

5.人類病癥相關(guān)通路PATHWAY提供所選定通路的參考資料、涉及的反響和在其他生物中的通路情況。由GIF等平板文件類型圖示,方框顯示為涉及的酶EC名稱,圓滑框為反響類型,以實線和箭頭連接反響物和方向,虛線指向預(yù)測的反響類型。關(guān)于GenMapp關(guān)于BioCartaBioCarta:“Carta〞中文意思是〞地圖〞,BioCarta〞即用圖形來描述生物相關(guān)知識,形成生物學(xué)家所熟悉的生化調(diào)控通路(biochemicalpathways)。BioCarta公司為客戶免費提供通路繪制軟件,讓他們根據(jù)自己的研究領(lǐng)域發(fā)表通路,建成數(shù)據(jù)庫,通路中的蛋白都是按照HUGO的標(biāo)準(zhǔn)建立的.BioCarta已收集各物種共大約120,000基因及136個調(diào)控通路,數(shù)據(jù)庫載不斷增加,其信號傳導(dǎo)通路(signaltransductionpathways)是當(dāng)前最全的.GeneNet真核生物生理過程的調(diào)控網(wǎng)絡(luò)(GeneNet)GeneNet展示了協(xié)調(diào)方式下基因的整體功能,良好的調(diào)控功能和對外界刺激的反響。該基因網(wǎng)具有以下根本功能:(a)描述執(zhí)行特定生物功能時所涉及到的整體基因交互作用(b)描述基因的蛋白質(zhì)編碼(c)描述基因?qū)ν饨绱碳さ膫鞲型緩?d)通過一組反響自動地穩(wěn)定網(wǎng)絡(luò)參數(shù)或者使網(wǎng)絡(luò)轉(zhuǎn)換到新的功能狀態(tài)(e)利用外部信號、激素和代謝產(chǎn)物作為生理學(xué)參數(shù)激發(fā)基因網(wǎng)糾正其作用該基因網(wǎng)描述了四類實體:(a)細胞(組織,器官)(b)蛋白質(zhì)(c)基因(d)物質(zhì)該基因網(wǎng)還描述了實體間兩種關(guān)系:(a)反響〔reaction〕,即通過交互作用產(chǎn)生新的實體或過程(b)調(diào)控〔regulatory〕事件,特定反響對實體的作用。2.3功能富集分析功能富集分析定義功能富集分析(FunctionalEnrichmentAnalysis)

又稱功能聚類分析,借助于各種生物學(xué)信息數(shù)據(jù)庫〔如GO,KEGG,GENMAPP,BIACARTA,TRANSFAC,OMIM〕和分析工具〔如MAPPFinder,ArrayXPath〕進行統(tǒng)

計分析,挖掘同差異表達或共表達這組感興趣基因具有顯著差異的功能類別。功能富集分析的統(tǒng)計原理是用超幾何分布型來檢驗一組基因〔共表達或差異表達〕中某個功能類的顯著性,并結(jié)合多重假設(shè)檢驗判斷思想選擇同這組基因顯著相關(guān)功能類別

MAPPFinderMAPPFinderisatoolthatcreatesaglobalgene-expressionprofileacrossallareasofbiologybyintegratingtheannotationsoftheGeneOntology(GO)ProjectwiththefreesoftwarepackageGenMAPP://GenMAPP.org.可以整合GO定義,產(chǎn)生整體的基因表達譜.輸出可以搜索的瀏覽器,幫助用戶快速識別代表性的差異表達基因在GO的定義。工作方式Z值得計算GOminerGominer:最初Version在算法上雖亞于GenMAPP,在再建立可視關(guān)系上(tree-likestructure和‘directedacyclicgraph)有其獨特之處.今年對OriginalVersion進行較大改進,不僅可以富集significantGOcategories,還可以同時對多套芯片實驗數(shù)據(jù)批量分析,控制假發(fā)現(xiàn)率FDR,還整合轉(zhuǎn)錄因子結(jié)合位點信息.綜合而言,尤其適合TIME-COURSE功能富集分析需要建立當(dāng)?shù)豈ysql數(shù)據(jù)庫,建立JDB數(shù)據(jù)源PathwayExplorerPathwayExplorer:providescomprehensiveandeasilyaccessiblerepresentationsofexpressionprofilesontomajorregulatory,metabolicandcellularpathways.TheintegratedpathwayresourcesincludeKEGG,BioCartaandGenMAPP.LocusLinkwasagainusedasrootidentifier.TheLocusLinksarelinkedwiththeuser-definedgeneidentifiergroups(UniGene,GeneOntology,GenBankand/orRefSeq),whichareusedthentoalignthemappedgeneIDs.ArrayXPathaweb-basedserviceformappingandvisualizingmicroarraygene-expressiondataforintegratedbiologicalpathwayresourcesWhenoneinputsgene-expressionclusters,ArrayXPathproducesalistofthebestmatchingpathwaysforeachclusterappliedFisher'sexacttestandthefalsediscoveryrate(FDR)toevaluatethestatisticalsignificanceoftheassociationbetweenaclusterandapathwaywhilec

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論