版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
實(shí)習(xí)三
芯片的基本數(shù)據(jù)處理和分析
阮陟馮曄陳歡樓小燕
實(shí)習(xí)一基因組數(shù)據(jù)注釋和功能分析實(shí)習(xí)二核苷酸序列分析實(shí)習(xí)三芯片的基本數(shù)據(jù)處理和分析實(shí)習(xí)四蛋白質(zhì)結(jié)構(gòu)與功能分析實(shí)習(xí)五蛋白質(zhì)組學(xué)數(shù)據(jù)分析實(shí)習(xí)六系統(tǒng)生物學(xué)軟件實(shí)習(xí)課程內(nèi)容基因組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)系統(tǒng)生物學(xué)實(shí)習(xí)內(nèi)容:TIGRTM4軟件的介紹和使用GenMAPP軟件的介紹和使用GEO數(shù)據(jù)庫的介紹芯片數(shù)據(jù)分析的一般流程:芯片雜交實(shí)驗(yàn),芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理數(shù)據(jù)提交公共數(shù)據(jù)庫數(shù)據(jù)生物信息學(xué)分析
ApackageofOpenSourcesoftwareprogramsforMicroarrayanalysis
芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理存儲整理芯片數(shù)據(jù)(數(shù)據(jù)庫)芯片數(shù)據(jù)分析結(jié)果的圖形顯示(
/)TIGRTM4:Cy3Cy5Cy5-cDNACy3-cDNARTRTcDNAarray樣本mRNA對照mRNATIF掃描圖常見的雙通道(dualchannel)實(shí)驗(yàn)流程:對照基因(referencegene):綠色熒光標(biāo)記(G)樣本基因(samplegene):紅色熒光標(biāo)記(R)什么是區(qū)塊(block)?非飽和區(qū)域飽和區(qū)域信號雜交的一些概念背景探針區(qū)域MEV文件:MEV格式的芯片數(shù)據(jù)UID: Uniqueidentifierforthisspot.IA: Integratedintensityforchannel1(Cy3).IB: Integratedintensityforchannel2(Cy5).R: Row(slide_row).C: Column(slidecolumn).MR: Meta-row(blockrow).MC: Meta-column(blockcolumn).SR: Sub-row(rowinblock).SC: Sub-column(columninblock).FlagA: TIGRSpotFinderflagvalueforchannel1.FlagB: TIGRSpotFinderflagvalueforchannel2.BkgA: Backgroundintensityforchannel1.BkgB: Backgroundintensityforchannel2.SAA: Spotareaforchannel1.SAB: Spotareaforchannel2.MedA: MedianIntensityforchannel1(Cy3).MedB: MedianIntensityforchannel2(Cy5).位置信號值FlagsinMevfile:A–0non-saturatedpixelsinthespotB–0-50non-saturatedpixelsinthespotC–50ormorenon-saturatedpixelsinthespotX–spotisrejected,duetospotshapeandintensityrelativetobackgroundY–backgroundishigherthanspotintensityZ–spotnotdetectedbySpotfindergoodMEV注釋文件(后綴名為.ann)GenePix格式(.gpr)Agilent格式(.txt):ExpressConverter:芯片數(shù)據(jù)的格式轉(zhuǎn)換下載地址:/programs/ExprConvt2_0.zip;下載后,解壓安裝即可?!伴_始”->“所有程序”處打開。需要先安裝Java,Java下載地址:;ExpressConverter主界面:ExpressConverter使用方法:選擇“InputFormat→GenPix”,指定輸入的文件格式;
選擇“File→Selectinputfiles”,選定一個(gè)或多個(gè)需要轉(zhuǎn)換的文件;選擇“File→Startconverting”,格式開始轉(zhuǎn)換。待狀態(tài)欄顯示“Convertingissuccessful”后,格式轉(zhuǎn)換完成。此時(shí)在原genepix存放的文件夾中會出現(xiàn)文件名相同但擴(kuò)展名不同的.mev和.ann的文件。
inputoutput課堂練習(xí)使用ExpressConverter將testdata.gpr轉(zhuǎn)換成testdata.mev和testdata.ann。用記事本查看testdata.gpr,testdata.mev和testdata.ann。ExpressConverter快捷方式:“開始”→“所有程序”testdata.gpr:C:\ProgramFiles\ExpressConverter\samples\MIDAS:數(shù)據(jù)基本處理下載地址是:/midas.html。此程序不用安裝下載后解壓就可以使用。(需要先安裝Java)進(jìn)入文件夾,雙擊打開Midas.bat文件,會出現(xiàn)后臺運(yùn)行窗口和圖形界面窗口。低質(zhì)量數(shù)據(jù)過濾根據(jù)Flag過濾根據(jù)信號和背景值過濾芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization)AAMAplotInmanymicroarraygeneexpressionexperiments,thegeneralassumptionisthatmostofthegeneswouldnotseeanychangeintheirexpression.Thereforethemajorityofthepointsontheyaxis(M)wouldbelocatedat0,sincelog(1)is0.區(qū)塊間均一化處理MIDAS程序界面MIDAS可選的數(shù)據(jù)處理方法
標(biāo)準(zhǔn)化處理方法TotalIntensitynormalization
低質(zhì)量數(shù)據(jù)過濾方法Invalid-intensitycheckingLOWESS(Locfit)normalizationIterativelinearregressionnormalizationIterativelogmeancenteringnormalizationRatioStatisticsnormalizationLowintensityfilterStandarddeviationregularizationSliceanalysis(non-statistical)In-slidereplicatesanalysisFlip-dyeconsistencycheckingRatioStatisticsconfidenceintervalcheckingSignal/NoisecheckingCross-file-trimSpotQCflagcheckingMA-ANOVACross-slidereplicatest-test(statistical)Cross-slideone-classSAM(statistical)
差異表達(dá)基因識別方法用MIDAS處理單張雙色芯片的基本流程芯片數(shù)據(jù)的讀入;低質(zhì)量數(shù)據(jù)的過濾;標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化);結(jié)果文件的輸出。Step1:芯片數(shù)據(jù)的讀入Step2:低質(zhì)量數(shù)據(jù)的過濾Step3:標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化)Step4:結(jié)果文件的輸出結(jié)果文件(夾)*_MDS.mevRawLow_intensity_filterLowessSd_regMIDAS統(tǒng)計(jì)作圖(MIDASInvestigation窗口查看)R-Iplot(.prc)Boxplot(.box)FlipDyeDiagnosticplot(.rrc)Intensityplot(.ity,.lty)Z-scoreDistributionplot(.his)SAMplot(.sam)課堂練習(xí)使用MIDAS處理testdata.mev,并查看結(jié)果文件;MIDAS程序位置:C:\zcni\shiyan3\MIDAS2_19,雙擊Midas.bat打開程序;輸入文件testdata.mev由ExpressConverter產(chǎn)生,在C:\ProgramFiles\ExpressConverter\example\。多樣本芯片實(shí)驗(yàn)實(shí)驗(yàn)適用范圍:分型,不同發(fā)育階段的表達(dá),不同劑量藥物下的表達(dá)等;使用共同的對照:采用標(biāo)準(zhǔn)對照,或?qū)⑺袠悠坊旌献鳛楣餐瑢φ?。多樣本?shí)驗(yàn)的兩種常用分析聚類分析差異表達(dá)基因的篩選下載地址:/mev.html
。此程序不用安裝下載后解壓就可以使用(需要先安裝Java)進(jìn)入軟件所在的文件夾(免安裝),雙擊打開TMEV.bat文件,會出現(xiàn)后臺運(yùn)行窗口和圖形界面窗口。MeV4.3程序主界面常用工具欄導(dǎo)航欄結(jié)果界面MeV4.3支持的文件格式MIDASMEV,TAV格式表格格式GEO格式Affymetrix格式GPR格式Agilent格式專題一表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化專題二系統(tǒng)聚類法對基因和樣本聚類專題三使用SAM查找差異表達(dá)基因?qū)n}一表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化①選擇“File→LoadData”彈出導(dǎo)入數(shù)據(jù)對話框②③④⑤⑥數(shù)據(jù)起始位置不同顏色表示相對表達(dá)量樣本名基因名Heatmap
View專題二系統(tǒng)聚類法對基因和樣本聚類①②聚類分析結(jié)果圖:存儲和注釋感興趣的分類:①單擊鼠標(biāo)左鍵選中目標(biāo)分類使其高亮化;②右鍵選擇菜單中的StoreCluster,并設(shè)置注釋的名稱和顏色等信息。專題三使用SAM查找差異表達(dá)基因①不同實(shí)驗(yàn)類型樣本分組②③④⑤Sam結(jié)果:ExpressionImagesSam結(jié)果:CentroidGraphsSam結(jié)果:ExpressionGraphsSam結(jié)果:TableViews如何進(jìn)一步學(xué)習(xí)使用MeV①在使用軟件的過程中隨時(shí)查閱即時(shí)幫助②查閱軟件的使用手冊(Manual)③前往TM4主頁查閱最新信息和軟件更新課堂練習(xí)使用MeV處理TDMS_format_sample.txt
,并查看結(jié)果文件;MEV程序位置:C:\zcni\shiyan3\MeV_4_3,雙擊TMEV.bat打開程序;輸入文件TDMS_format_sample.txt位于:C:\zcni\shiyan3\MeV_4_3\data\。GenMAPP
一款將芯片數(shù)據(jù)和代謝途徑結(jié)合起來的圖形化顯示工具下載地址:/download.asp;雙擊安裝文件安裝GenMAPP;打開GenMAPP程序,從菜單“Data→DownloadDatafromGenMAPP.org”下載自己感興趣物種的MAPP文件和GeneDatabase。
GenMAPP安裝和更新GenMAPP基本概念MAPP:描述了模式生物的代謝途徑圖。目前MAPP數(shù)據(jù)庫中包含了人(H.sapiens)、小鼠(M.musculus)、大鼠(R.norvegicus)、酵母(S.cerevisiae)、線蟲(C.elegans)、狗(C.familiaris)、雞(G.gallus)、牛(B.taurus)、果蠅(D.melanogaster)和斑馬魚(D.rerio)等模式生物。
Genedatabase:包含了上述物種所含基因的注釋及其基因標(biāo)識號(ID)。對于每個(gè)基因,GeneDatabase會建立它在各個(gè)geneIDsystem中的對應(yīng)關(guān)系。比如,Trp53基因在MGI(小鼠基因組數(shù)據(jù)庫)中的標(biāo)識號為MGI:98834,而在UniGene數(shù)據(jù)庫中標(biāo)識號為Mm.222,在Ensembl數(shù)據(jù)庫中標(biāo)識號為ENSMUSG00000059552。IDSystem(Species)SystemCodeAffymetrixProbeSetIDXPDBPdEMBLEmPfamPfEnsemblEnRefSeqQEntrezGeneLRGD(R.norvegicus)RFlyBase(D.melanogaster)FSGD(S.cerevisiae)DGeneOntologyTUniProt/TrEMBLSHUGOHUniGeneUInterProIWormBase(C.elegans)WMGI(M.musculus)MZFIN(D.rerio)ZOMIMOmOtherOStep1:打開“GenMAPP2”程序。選擇菜單“Data→ChooseGeneDatabase”按照實(shí)驗(yàn)物種選擇合適的基因庫。Step2:從菜單“File→Open”打開自己感興趣的MAPP文件。Step3:從菜單“Data→ChooseExpressionDataset”打開表達(dá)量文件(.gex)并選擇相應(yīng)的顏色集。Step4:點(diǎn)擊感興趣的基因查看注釋如何制作.gex表達(dá)量文件?將芯片數(shù)據(jù)用Excel中按一定格式整理2.將Excel另存為文本文件(txt后綴名或csv后綴名),可在Data菜單“ExpressionDatasets→Newdataset”導(dǎo)入該文本文件。此時(shí),程序會向用戶提問文件中的數(shù)據(jù)是數(shù)值型還是文本型,對文本文件要在圖示框中選勾,點(diǎn)擊“OK”即可,一般ControlAverage、TreatedAverage、FoldChange和p-value為數(shù)值型,其他為文本型。
如何制作顏色集(colorset)?在菜單“Data→ExpressionDatasetManager”界面下從菜單“Colorsets→new”新定義一個(gè)顏色集。
課堂練習(xí)在“開始”→“所有程序”處打開GenMAPP2程序;GeneDatabase文件位置:
C:\GenMAPP2Data\GeneDatabases\;MAPP文件位置:C:\GenMAPP2Data\MAPPs\;芯片表達(dá)量文件位置:
C:\GenMAPP2Data\ExpressionDatasets\;芯片數(shù)據(jù)的檢索和提交常用的芯片數(shù)據(jù)庫NCBIGEO:
/geo/EBIArrayExpress:http://www.ebi.ac.uk/microarray-as/aer/?#ae-main[0]
StanfordMicroarrayDatabase:/UCSCMicroarrayDatabase:/research/research_microarraydata.shtmlGEO(GeneExpressionOmnibus)主頁檢索入口提交入口也可這樣檢索:
NCBI主頁
Search“GEODatasets”以檢索人類癌癥相關(guān)的芯片實(shí)驗(yàn)為例,輸入“humanANDcancer”:每條記錄包含的信息:Platform: 芯片信息Sample:樣本信息Series:系列信息Platform信息:Platform_title:芯片名稱;Platform_technology:點(diǎn)制芯片探針的方法,例如ORF或cDNA的PCR產(chǎn)物(spottedDNA/cDNA)、原位雜交的寡核苷酸(insituoligonucleotide)和直接點(diǎn)樣的寡核苷酸(spottedoligonucleotide)等;Platform_distribution:注明是否屬于商品芯片(non-commercial,commercial,custom-commercial);Platform_organism:芯片適用的物種;Platform_manufacturer:芯片制作單位;Platform_manufacture_protocol:芯片制作的實(shí)驗(yàn)過程,例如探針合成方式和點(diǎn)樣方式等;platform_table:芯片中每一個(gè)點(diǎn)的探針的內(nèi)容。Sample信息:Sample_title:樣本名稱;Sample_supplementary_file:樣本附件的名稱。附件指的是芯片雜交后掃描的TIFF格式的圖像等文件。Sample_source_name_ch1:channel1樣本DNA/RNA材料的來源(來源于哪個(gè)組織,細(xì)胞等等);Sample_organism_ch1:channel1樣本DNA/RNA材料來源于哪個(gè)物種;Sample_characteristics_ch1:channel1樣本DNA/RNA材料的特點(diǎn);Sample_molecule_ch1:channel1樣本分子的特性(totalRNA,polyARNA,cytoplasmicRNA,nuclearRNA,genomicDNA,等等);Sample_extract_protocol_ch1:channel1樣本提取的步驟;Sample_label_ch1:channel1樣本標(biāo)記的染料(Cy3orCy5);Sample_label_protocol_ch1:channel1樣本標(biāo)記染料的步驟;Sample_source_name_ch2,Sample_organism_ch2,Sample_characteristics_ch2,Sample_gro
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 咸寧職業(yè)技術(shù)學(xué)院《自然地理學(xué)一》2023-2024學(xué)年第一學(xué)期期末試卷
- 武漢職業(yè)技術(shù)學(xué)院《土地統(tǒng)計(jì)與R語言》2023-2024學(xué)年第一學(xué)期期末試卷
- 武漢工貿(mào)職業(yè)學(xué)院《中級日語聽說》2023-2024學(xué)年第一學(xué)期期末試卷
- 新疆建設(shè)職業(yè)技術(shù)學(xué)院《環(huán)境微生物實(shí)驗(yàn)技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年跨境電商物流服務(wù)合同協(xié)議書
- 二零二五年度廠房安全檢查與整改合同模板3篇
- 2024我國電子商務(wù)平臺服務(wù)商合作協(xié)議依法簽訂3篇
- 2024物品寄售及電商合作運(yùn)營合同范本3篇
- 二零二五版果園廢棄物資源化利用與環(huán)保合作協(xié)議3篇
- 2024年高級人工智能語音識別技術(shù)轉(zhuǎn)讓合同
- 高速公路初步設(shè)計(jì)匯報(bào)課件
- 航空油料計(jì)量統(tǒng)計(jì)員(初級)理論考試復(fù)習(xí)題庫大全-上(單選題匯總)
- 申根簽證申請表模板
- 企業(yè)會計(jì)準(zhǔn)則、應(yīng)用指南及附錄2023年8月
- 2022年浙江省事業(yè)編制招聘考試《計(jì)算機(jī)專業(yè)基礎(chǔ)知識》真題試卷【1000題】
- 認(rèn)養(yǎng)一頭牛IPO上市招股書
- GB/T 3767-2016聲學(xué)聲壓法測定噪聲源聲功率級和聲能量級反射面上方近似自由場的工程法
- GB/T 23574-2009金屬切削機(jī)床油霧濃度的測量方法
- 動物生理學(xué)-全套課件(上)
- 河北省衡水市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細(xì)
- DB32-T 2665-2014機(jī)動車維修費(fèi)用結(jié)算規(guī)范-(高清現(xiàn)行)
評論
0/150
提交評論