麥子陪你做作業(yè)二:KEGG通路數(shù)據(jù)庫的正確打開姿勢_第1頁
麥子陪你做作業(yè)二:KEGG通路數(shù)據(jù)庫的正確打開姿勢_第2頁
麥子陪你做作業(yè)二:KEGG通路數(shù)據(jù)庫的正確打開姿勢_第3頁
麥子陪你做作業(yè)二:KEGG通路數(shù)據(jù)庫的正確打開姿勢_第4頁
麥子陪你做作業(yè)二:KEGG通路數(shù)據(jù)庫的正確打開姿勢_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、麥子陪你做作業(yè)(二):KEGG通路數(shù)據(jù)庫的正確打開姿勢作者:麥子轉載請注明:解螺旋臨床醫(yī)生科研成長平臺 KEGG是通路數(shù)據(jù)庫中最龐大的,涵蓋基因組網絡信息,主 要注釋基因的功能和調控關系。當我們選到了合適的候選分 子,單變量研究也已做完,接著研究機制的時便可使用到它。 你需要了解你的分子目前已有哪些研究,跟其他分子是怎樣 的關系。當然可以從文獻中慢慢去了解,但KEGG繪制了已知的通路數(shù)據(jù),直觀呈現(xiàn),無疑是提升檢索效率好的辦法。KEGG的主要用途有:查詢通路信息、信號通路檢索,以及 非常推薦的分析工具 KEGG Mapper ,它可以根據(jù)前期篩選 得到的差異分子列表去構建分子調控網絡,得到清晰簡

2、明的 通路圖。咱們通過五個案例,來把這些功能用法櫓一遍。(好了我承認這是酸菜老師布置的作業(yè),我又陪大家做作業(yè) 來了)作業(yè)一請使用 KEGG檢索人類基因PTEN的信息并 查看其參與了哪些信號通路,查看其在p53信號通路中的位置。先找到網頁下方的 KEGG GENES 子數(shù)據(jù)庫。在彈由的頁面 中,三個檢索欄都可以用,不過推薦用第三個,比較準確簡 潔。不過注意格式,”物種:基因”接著就有個彈窗顯示該基 因的信息,包括其參與的信號通路,其中就有我們要找的p53 信號通路。點擊通路編號“ hsa04115”就可看到信號通路圖, 我們查詢的PTEN基因被紅色標注了由來。 如果要查找該通 路中的其他基因,也

3、可以在本頁面的搜索框中輸入相應關鍵 詞,同樣得到紅色高亮顯示。 作業(yè)二查看KEGG中參與信號 轉導的信號通路,并點擊mTOR信號通路,查看其關聯(lián)的信 號通路及調控的表型。在KEGG 首頁上選擇 KEGG PATHWAY 子數(shù)據(jù)庫。在點開 后的頁面往下拉到信號轉導通路,相當多了。找到 mTOR 信號通路,點進去。圓角矩形文本框中的就是其相關聯(lián)的信 號通路。我們可以看到,mTOR上游有AMPK、MAPK、Insulin、 PI3K-AKT等信號通路,各通路之間又有交互影響。mTOR通路可以影響微管組織、 脂解作用、脂類合成、自噬、 蛋白合成、細胞骨架、細胞存活等表型,其中自噬、甘油酯 代謝、act

4、in細胞骨架調控在本數(shù)據(jù)庫里有通路圖譜。作業(yè)三請分析以下分子(人源)參與了哪些信號通路,并在 信號通路中用粉紅色標記表達下調的分子,用黃色標記表達 上調的分子,給由基因匹配最多的信號通路圖。不同數(shù)據(jù)庫 對基因的識別碼不一樣,而KEGG只支持三個數(shù)據(jù)庫的識別 碼,即KEGG、NCBI、Uniprot ,所以要進行轉換?,F(xiàn)在有 26個基因,那么批量轉換比較便捷的方法是用Uniprot的在線工具。在 HYPERLINK / / 點 Retrieve/ID mapping 進入如F頁面,貼上自己的基因名,下方選擇輸入和需要輸生的識別碼類型,填好物種信息,就可點“Go”轉換。在彈由的頁面中選擇Revie

5、wed的結果,再選擇下載格式(Excel、非壓縮); 也可以點旁邊的Columns選擇我們需要的列名。Entry即 Uniprot編碼。下載好后,將 Entry貼到我們原來的表格中。 此處注意輸入的 THOA基因沒有檢索到 Uniprot ID ,舍去; 另又有兩個FAS ,得到了不一樣的 Entry ,那是因為輸入的 是基因縮寫,可能檢索到同縮寫的多個基因。這時本來需要 根據(jù)全稱確認哪個是我們需要的,不過這次題目中沒有說明, 就全都要了吧,表達值也算一樣的。接下來用Excel的篩選工具,對表達值一列篩選。先選由 0 者,填上yellow o注意顏色名稱都要小寫,否則KEGG識別不由來。然后到

6、 KEGG主頁,在最下方的分析工具里找到 KEGG Mapper :在新頁面中選擇 Search & Color Pathway : 然后填好物種、ID格式,把剛才的Entry和顏色貼進來,點 Exec查詢。搜由來一個相當長的列表,通路名后邊的小括 號內數(shù)字,就是該通路中含有我們查詢的基因的數(shù)量。按要 求選擇匹配最多的那個,點開就是我們需要的通路圖了,匹 配基因、上調下調一目了然。作業(yè)四根據(jù)所給的芯片結果數(shù)據(jù),分析差異變化從大到小排 列,前50個分子參與的信號通路,給由匹配度最高的信號 通路圖(要求用橙色orange標記上調基因,用青色cyan標記下調基因)我們從生信公司拿到了芯片數(shù)據(jù),要先做

7、個預處理。找到變 化倍數(shù)(Fold Change, FC )絕對值,按降序排列。再找到 EntrezGenelD ,排除空值。再在 Excel上方的“數(shù)據(jù)”菜單中 找到“刪除重復項,彈窗中選擇EntrezGenelD ,確認。把前 50個貼到另一個表里,僅留 EntrezGenelD 和Regulation 兩列,根據(jù)要求將上調下調的分別賦予顏色。然后按剛才查 詢通路的辦法再操作一遍就好了,不過注意這回的輸入格式 是NCBI-GeneID。然后點開匹配度最高的通路就是了。作業(yè)五在GEO數(shù)據(jù)庫中檢索到 GSE18842 ,并使用GEO在線 工具分析該數(shù)據(jù)集中tumor和control組間差異表達

8、的分子, 并用KEGG Mapper進行通路分析,給由匹配度第2的通路, 并用顏色標記:紅色標記上調倍數(shù)4, 0c粉紅色標記上調倍 數(shù)在(0, 4);藍色標記下調倍數(shù)(-4;青色標記下調倍數(shù)在 (-4, 0)。這里主要講講GEO數(shù)據(jù)庫的檢索和簡單分析,后邊的步驟 跟之前的差不多了。 GEO涵蓋很多疾病的高通量數(shù)據(jù),多 個學科的小伙伴都可以應用。打開我們熟悉的 Pubmed ,選擇GEO Dataset ,輸入關鍵字 GSE18842 , Search。進入相應的條目頁面后,拉到下方點Analyze with GEO2R 。進入分析后,要先按數(shù)據(jù)提供的信息分配組別。點開上方的Define gro

9、ups,分別輸入組名 Control 和 Tumor。然后按 Title排序,選中所有control樣本,再點一次 Control組名,即可 看到最左Group 一列填上了相應的組名。同樣的方法分配好 Tumor組。然后拉到下方點 Top 250,默認分析結果僅顯示 變化最明顯的250個分子(按p值排序)。我們也可以點Save all results ,后續(xù)再按變化倍數(shù)排序,自己篩選所需的數(shù)量。然后在新頁面中點 Select Columns ,彈窗里選上 Gene ID。此時若點開單個基因,可以看到它在各樣本中的表達情況。收起柱狀圖,把數(shù)據(jù)復制貼到 Excel表里。然后對 GeneID 一列去除重復值和空白值, 剩下的將logFC和GeneID復制 到一個新表格中。我們還會發(fā)現(xiàn)一種情況,即有些探針是指向一個分子組合,這些通常是一個家族中的不同成員,用“/ ”分涿EGG中需要一個分子單獨一行,所以也要處理一下。就手動把后 面的分子貼到新插入的一行吧變化倍數(shù)也復制下來,耐 心點。后邊篩選數(shù)值、標記顏色、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論