芯片數(shù)據(jù)的基本處理和分析課件_第1頁
芯片數(shù)據(jù)的基本處理和分析課件_第2頁
芯片數(shù)據(jù)的基本處理和分析課件_第3頁
芯片數(shù)據(jù)的基本處理和分析課件_第4頁
芯片數(shù)據(jù)的基本處理和分析課件_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

實習(xí)三:

芯片數(shù)據(jù)的基本處理和分析

王丹阮陟胡望雄

浙江加州國際納米技術(shù)研究院(ZCNI)實習(xí)一基因組數(shù)據(jù)注釋和功能分析實習(xí)二核苷酸序列分析實習(xí)三芯片數(shù)據(jù)的基本處理和分析實習(xí)四蛋白質(zhì)結(jié)構(gòu)與功能分析實習(xí)五蛋白質(zhì)組學(xué)數(shù)據(jù)分析實習(xí)六系統(tǒng)生物學(xué)軟件實習(xí)課程內(nèi)容基因組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)系統(tǒng)生物學(xué)芯片數(shù)據(jù)分析的一般流程:芯片雜交實驗,芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理數(shù)據(jù)提交公共數(shù)據(jù)庫數(shù)據(jù)生物信息學(xué)分析

Cy3Cy5Cy5-cDNACy3-cDNARTRTcDNAarray樣本mRNA對照mRNATIF掃描圖常見的雙通道(dualchannel)實驗流程:對照基因(referencegene):綠色熒光標(biāo)記(G)樣本基因(samplegene):紅色熒光標(biāo)記(R)區(qū)塊(block)非飽和區(qū)域飽和區(qū)域信號雜交的一些概念背景探針區(qū)域ApackageofOpenSourcesoftwareprogramsforMicroarrayanalysis

芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理存儲整理芯片數(shù)據(jù)(數(shù)據(jù)庫)芯片數(shù)據(jù)分析結(jié)果的圖形顯示(

)TIGRTM4:Agilent格式(.txt):ExpressConverter:芯片數(shù)據(jù)的格式轉(zhuǎn)換下載地址:;下載后,解壓安裝即可?!伴_始”->“所有程序”處打開。需要先安裝Java,Java下載地址:;ExpressConverter使用方法:選擇“InputFormat→GenPix”,指定輸入的文件格式;

選擇“File→Selectinputfiles”,選定一個或多個需要轉(zhuǎn)換的文件;選擇“File→Startconverting”,格式開始轉(zhuǎn)換。待狀態(tài)欄顯示“Convertingissuccessful”后,格式轉(zhuǎn)換完成。此時在原genepix存放的文件夾中會出現(xiàn)文件名相同但擴展名不同的.mev和.ann的文件。

inputoutput程序運行前程序運行結(jié)果MEV文件:MEV格式的芯片數(shù)據(jù)MEV注釋文件(后綴名為.ann)MIDAS:數(shù)據(jù)基本處理下載地址是:此程序不用安裝下載后解壓就可以使用。(需要先安裝Java)進入文件夾,雙擊打開Midas.bat文件,會出現(xiàn)后臺運行窗口和圖形界面窗口。低質(zhì)量數(shù)據(jù)過濾根據(jù)Flag過濾根據(jù)信號和背景值過濾FlagsinMevfile:A–0non-saturatedpixelsinthespotB–0-50non-saturatedpixelsinthespotC–50ormorenon-saturatedpixelsinthespotX–spotisrejected,duetospotshapeandintensityrelativetobackgroundY–backgroundishigherthanspotintensityZ–spotnotdetectedbySpotfindergood由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡等因素,需對cy3和cy5的原始提取信號進行均衡和修正才能進一步分析實驗數(shù)據(jù),Normalization正是基于此種目的。芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization)芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization)AAMAplotInmanymicroarraygeneexpressionexperiments,thegeneralassumptionisthatmostofthegeneswouldnotseeanychangeintheirexpression.Thereforethemajorityofthepointsontheyaxis(M)wouldbelocatedat0,sincelog(1)is0.M=log2(R/G)A=log2√R*G區(qū)塊間均一化處理用MIDAS處理單張雙色芯片的基本流程芯片數(shù)據(jù)的讀入;低質(zhì)量數(shù)據(jù)的過濾;標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化);結(jié)果文件的輸出。Step1:芯片數(shù)據(jù)的讀入Step2:低質(zhì)量數(shù)據(jù)的過濾Step3:標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化)Step4:結(jié)果文件的輸出MIDAS統(tǒng)計作圖(MIDASInvestigation窗口查看)log-ratioshistogram(.his)Boxplot(.box)Intensityplot(.ity)R-I(.prc)Intensityplot(.lty)課堂練習(xí)使用MIDAS處理testdata.mev,并查看結(jié)果文件;MIDAS程序位置:C:\zcni\shiyan3\MIDAS2_19,雙擊Midas.bat打開程序;輸入文件testdata.mev由ExpressConverter產(chǎn)生,在C:\ProgramFiles\ExpressConverter\Samples\。芯片數(shù)據(jù)聚類分析和差異表達基因篩選基因表達研究中通常假設(shè)表達水平相似的基因可能參與相同或相似的生物學(xué)過程,因而它們具有相似的基因表達譜。例:在臨床或診斷學(xué)等領(lǐng)域中,為研究某些疾病的發(fā)生機制,通常對正常組織和腫瘤組織細胞間的基因表達情況作比較分析,從中篩選出具有顯著差異的表達基因。下載地址:

。此程序不用安裝下載后解壓就可以使用(需要先安裝Java)進入軟件所在的文件夾(免安裝),雙擊打開TMEV.bat文件,會出現(xiàn)后臺運行窗口和圖形界面窗口。MeV4.6.2支持的文件格式MIDASMEV,TAV格式表格格式GEO格式Affymetrix格式GPR格式Agilent格式MeV4.6.2程序主界面常用工具欄導(dǎo)航欄結(jié)果界面芯片數(shù)據(jù)聚類分析和差異表達基因篩選1表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化2系統(tǒng)聚類法對基因和樣本聚類3使用SAM(significanceanalysisformicroarrays)查找差異表達基因1表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化①1選擇“File→LoadData”彈出導(dǎo)入數(shù)據(jù)對話框②③④⑤⑥數(shù)據(jù)起始位置不同顏色表示相對表達量樣本名基因名Heatmap

View2系統(tǒng)聚類法對基因和樣本聚類①②聚類分析結(jié)果圖:存儲和注釋感興趣的分類:①單擊鼠標(biāo)左鍵選中目標(biāo)分類使其高亮化;②右鍵選擇菜單中的StoreCluster,并設(shè)置注釋的名稱和顏色等信息。3使用SAM查找差異表達基因①不同實驗類型樣本分組②③④⑤SAM結(jié)果:ExpressionImagesSAM結(jié)果:CentroidGraphsSAM結(jié)果:ExpressionGraphsSAM結(jié)果:TableViews課堂練習(xí)使用MeV處理TDMS_format_sample.txt

,并查看結(jié)果文件;MEV程序位置:C:\zcni\shiyan3\MeV_4_6,雙擊TMEV.bat打開程序;輸入文件TDMS_format_sample.txt位于:C:\zcni\shiyan3\MeV_4_3\data\。GenMAPP

一款將芯片數(shù)據(jù)和代謝途徑結(jié)合起來的圖形化顯示工具WhyPathwayAnalysis?IntuitivetoBiologistsProvideabiologicalcontextforresultsMoreefficientthansearchingdatabasesgene-by-geneIntuitivedatadisplayforsharingdataComputationonPathwayContentAnalyzeover-representationofchangedgenesonpathwaysandontologiesGenerateandcomparepathwaysignaturesbetweenmodels下載地址:;雙擊安裝文件安裝GenMAPP;打開GenMAPP程序,從菜單“Data→DownloadDatafromGenMAPP.org”下載自己感興趣物種的MAPP文件和GeneDatabase。

GenMAPP安裝和更新GenMAPP基本概念MAPP:描述了模式生物的代謝途徑圖。目前MAPP數(shù)據(jù)庫中包含了人(H.sapiens)、小鼠(M.musculus)、大鼠(R.norvegicus)、酵母(S.cerevisiae)、線蟲(C.elegans)、狗(C.familiaris)、雞(G.gallus)、牛(B.taurus)、果蠅(D.melanogaster)和斑馬魚(D.rerio)等模式生物。

SupportedSpeciesFruitflyHumanMouseRatWormYeastZebrafishChicken

DogCowMosquitoByrequest:AnyEnsemblspeciesDatabasesbyothergroups:FissionyeastE.coliSoon:Arabidopsis心肌炎患者數(shù)據(jù)------脂肪酸降解途徑GenMAPP基本概念Genedatabase:包含了上述物種所含基因的注釋及其基因標(biāo)識號(ID)。對于每個基因,GeneDatabase會建立它在各個geneIDsystem中的對應(yīng)關(guān)系。比如,Trp53基因在MGI(小鼠基因組數(shù)據(jù)庫)中的標(biāo)識號為MGI:98834,而在UniGene數(shù)據(jù)庫中標(biāo)識號為Mm.222,在Ensembl數(shù)據(jù)庫中標(biāo)識號為ENSMUSG。IDSystem(Species)SystemCodeAffymetrixProbeSetIDXPDBPdEMBLEmPfamPfEnsemblEnRefSeqQEntrezGeneLRGD(R.norvegicus)RFlyBase(D.melanogaster)FSGD(S.cerevisiae)DGeneOntologyTUniProt/TrEMBLSHUGOHUniGeneUInterProIWormBase(C.elegans)WMGI(M.musculus)MZFIN(D.rerio)ZOMIMOmOtherOStep1:打開“GenMAPP2”程序。選擇菜單“Data→ChooseGeneDatabase”按照實驗物種選擇合適的基因庫。Step2:從菜單“File→Open”打開相應(yīng)的MAPP文件。Step3:從菜單“Data→ChooseExpressionDataset”打開表達量文件(.gex)并選擇相應(yīng)的顏色集。Step4:點擊感興趣的基因查看注釋如何制作.gex表達量文件?將芯片數(shù)據(jù)用Excel按一定格式整理2.將Excel另存為文本文件(txt后綴名或csv后綴名),可在Data菜單“ExpressionDatasets→Newdataset”導(dǎo)入該文本文件。此時,程序會向用戶提問文件中的數(shù)據(jù)是數(shù)值型還是文本型,對文本文件要在圖示框中選勾,點擊“OK”即可,一般ControlAverage、TreatedAverage、FoldChange和p-value為數(shù)值型,其他為文本型。

如何制作顏色集(colorset)?在菜單“Data→ExpressionDatasetManager”界面下從菜單“Colorsets→new”新定義一個顏色集。

課堂練習(xí)在“開始”→“所有程序”處打開GenMAPP2程序;GeneDatabase文件位置:

C:\GenMAPP2Data\GeneDatabases\;MAPP文件位置:C:\GenMAPP2Data\MAPPs\;芯片表達量文件位置:

C:\GenMAPP2Data\ExpressionDatasets\;芯片數(shù)據(jù)庫介紹常用的芯片數(shù)據(jù)庫NCBIGEO:

EBIArrayExpress:[0]

StanfordMicroarrayDatabase:UCSCMicroarrayDatabase:GEO(Gene

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論