基因表達(dá)數(shù)據(jù)庫_第1頁
基因表達(dá)數(shù)據(jù)庫_第2頁
基因表達(dá)數(shù)據(jù)庫_第3頁
基因表達(dá)數(shù)據(jù)庫_第4頁
基因表達(dá)數(shù)據(jù)庫_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

GEO:基因表達(dá)數(shù)據(jù)庫

(GeneExpressionOmnibus)1基因表達(dá)數(shù)據(jù)庫5/8/2024GEODatabase

1.基本概念及數(shù)據(jù)庫結(jié)構(gòu)GEO(GeneExpressionOmnibus)基因表達(dá)數(shù)據(jù)庫,是由美國生物技術(shù)信息中心(NCBI)在2000年開發(fā)的一個開放的基因表達(dá)豐度的數(shù)據(jù)庫,該數(shù)據(jù)庫不僅包括許多基于基因芯片的基因表達(dá)數(shù)據(jù)信息,同時還包括一些非芯片技術(shù)如SAGE和質(zhì)譜的基因表達(dá)豐度信息。至2014年1月,該數(shù)據(jù)庫已經(jīng)收錄了12422個不同平臺(Platform)上的2基因表達(dá)數(shù)據(jù)庫5/8/20241062513個樣品(Sample)的基因表達(dá)數(shù)據(jù)信息。數(shù)據(jù)提交遵循MIAME原則,并提供了供查詢和下載實驗及基因表達(dá)資料的工具。登陸網(wǎng)址為:/geo/。3基因表達(dá)數(shù)據(jù)庫5/8/20242.數(shù)據(jù)庫結(jié)構(gòu)提交給GEO的數(shù)據(jù)分為三種不同的實體,即平臺(platform)、樣本(sample)和系列(series)。平臺,關(guān)于以高通量方式(microarray,SAGE)檢查樣本的物理試劑的信息。一個平臺含有多個提交者提交的樣本。平臺的命名規(guī)則為“GPL+n(n代表數(shù)字)”。樣本,關(guān)于被檢查的mRNA樣本,實驗條件和實驗產(chǎn)生的基因表達(dá)測量數(shù)據(jù)信息。一個樣本必須涉及一個平臺,可能會包括在許多系列之中。樣本的命名規(guī)則為:“GSM+n”。4基因表達(dá)數(shù)據(jù)庫5/8/2024系列,樣本收集,樣本是如何相關(guān)的,如何排序的,分析是如何進(jìn)行的,和聚類數(shù)據(jù)是如何獲得的信息。系列含有數(shù)據(jù)的摘要信息。系列的命名規(guī)則為“GSE+n”。GEO的原始數(shù)據(jù)被放置在平臺,樣本和系列這三個數(shù)據(jù)庫中;根據(jù)原始數(shù)據(jù)觀測角度的不同,又將這些數(shù)據(jù)整理并分置兩個不同的數(shù)據(jù)庫中:數(shù)據(jù)集(datasets)和表達(dá)圖譜(profile);數(shù)據(jù)集以“實驗”的角度存儲了所有的元數(shù)據(jù),表達(dá)圖譜從“基因”的角度存儲了單個基因表達(dá)的數(shù)據(jù)資料。5基因表達(dá)數(shù)據(jù)庫5/8/20243.數(shù)據(jù)上傳與下載

在GEO中上傳數(shù)據(jù)前先要注冊賬號,注冊信息中的聯(lián)系方法會體現(xiàn)在GEO記錄中。數(shù)據(jù)上傳可以使用幾種不同的格式,如電子表格、純文本和XML格式。不管采用哪種上傳方式,最終的結(jié)果及包含的信息都相同。

6基因表達(dá)數(shù)據(jù)庫5/8/2024所有的GEO信息可以利用不同的工具下載不同格式的數(shù)據(jù):①查詢到的每一條記錄下均有下載連接,通過此鏈接下載以.gz或.tgz為后綴名的壓縮文件,通過WinZipor7-Zip即可打開;②所有的GEO記錄和原始數(shù)據(jù)文件都可以通過FTP(/pub/geo/)進(jìn)行大批量下載;③通過查詢頁面的“sendto→file”下載。7基因表達(dá)數(shù)據(jù)庫5/8/20244.GEO檢索及結(jié)果

GEO提供多種途徑檢索數(shù)據(jù),如以數(shù)據(jù)集“GDS3176”,平臺“GPL339”,系列“GSE9567”,樣本GSM241927”進(jìn)行檢索。如果已知序列號,可以直接采用這種方式搜索;否則,可以用關(guān)鍵詞、物種甚至作者姓名進(jìn)行搜索。同時,可通過Limits和AdvancedSearch對搜索結(jié)果進(jìn)行篩選。GEO數(shù)據(jù)集的搜索結(jié)果以“實驗”角度列示,內(nèi)容包括名稱、簡述、物種、平臺、提交者聯(lián)系方式、系列、樣本個數(shù)、數(shù)值類型和發(fā)表時間等,8基因表達(dá)數(shù)據(jù)庫5/8/2024同時提供向NCBI的其他數(shù)據(jù)庫的鏈接,如PubMed,Epigenomics、SRA和GEOProfiles等。GEO表達(dá)圖譜(profiles)的搜索結(jié)果以“基因”角度列示,用圖片的形式展現(xiàn)一個基因?qū)λ袠颖镜谋磉_(dá)水平,搜索結(jié)果中的實驗條件方便我們觀察一個基因在不同條件下表達(dá)水平的差異。搜索結(jié)果可利用“myNCBI→collection”進(jìn)行在線保存。9基因表達(dá)數(shù)據(jù)庫5/8/202410基因表達(dá)數(shù)據(jù)庫5/8/202411基因表達(dá)數(shù)據(jù)庫5/8/202412基因表達(dá)數(shù)據(jù)庫5/8/202413基因表達(dá)數(shù)據(jù)庫5/8/20245.數(shù)據(jù)分析“GEOdatasets”提供了四種數(shù)據(jù)分析工具,分別是“findgenes”

“compare2setsofsamples”

“cluster

heatmaps”

“experimentdesignandvaluedistribution”。“findgenes”通過輸入基因名稱或符號直接定位到“profiles”中的相關(guān)基因?!癱ompare2setsofsamples”用以區(qū)別存在顯著表達(dá)差異的兩組樣本,特別是比較屬于不同實驗的樣本?!癈lusterheatmaps”工具提供了分層和K-means聚類分析方法,可以選擇、擴(kuò)增、下載大量感興趣的簇,并制成線圖14基因表達(dá)數(shù)據(jù)庫5/8/2024或直接鏈接到EntrezGEO圖譜?!癳xpe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論