




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
PCA和單細(xì)胞分析簡介易生信(/Training)——最懂你的生信培訓(xùn),學(xué)習(xí)生信更容易學(xué)習(xí)方式提前預(yù)習(xí)仔細(xì)聽講先運(yùn)行再理解緊跟步伐,跟不上的及時(shí)在課堂提出或?qū)ふ抑汤蠋熃鉀Q課后復(fù)習(xí),基礎(chǔ)知識(shí)學(xué)習(xí)靠背和反復(fù)練書讀百變,其義自見碼敲十遍,不會(huì)也難2樣本聚類PCA分析主成分分析
(PCA,
principal
component
analysis)是一種數(shù)學(xué)降維方法,
利用正交變換把一系列可能線性相關(guān)的變量轉(zhuǎn)換為一組線性不相關(guān)的新變量,也稱為主成分,從而利用新變量在更小的維度下展示數(shù)據(jù)的特征。主成分是原有變量的線性組合,其數(shù)目不多于原始變量。組合之后,相當(dāng)于獲得了一批新的觀測(cè)數(shù)據(jù),這些數(shù)據(jù)的含義不同于原有數(shù)據(jù),但包含了之前數(shù)據(jù)的大部分特征,并且有著較低的維度,便于進(jìn)一步的分析。在空間上,PCA可以理解為把原始數(shù)據(jù)投射到一個(gè)新的坐標(biāo)系統(tǒng),第一主成分為第一坐標(biāo)軸,它的含義代表了原始數(shù)據(jù)中多個(gè)變量經(jīng)過某種變換得到的新變量的變化區(qū)間;第二成分為第二坐標(biāo)軸,代表了原始數(shù)據(jù)中多個(gè)變量經(jīng)過某種變換得到的第二個(gè)新變量的變化區(qū)間。這樣我們把利用原始數(shù)據(jù)解釋樣品的差異轉(zhuǎn)變?yōu)槔眯伦兞拷忉寴悠返牟町悺?/p>
3主成分分析的意義簡化運(yùn)算,降低冗余去除數(shù)據(jù)噪音,變化幅度小的噪音變化方便實(shí)現(xiàn)數(shù)據(jù)可視化
在表達(dá)譜分析中,假如有1個(gè)基因,可以在線性層面對(duì)樣本分類;如果有2個(gè)基因,可以在一個(gè)平面對(duì)樣本分類;如果有3個(gè)基因,可以在一個(gè)立體空間對(duì)樣本分類;如果有更多的基因,比如說n個(gè),那么每個(gè)樣品就是n維空間的一個(gè)點(diǎn),則很難在圖形上展示樣品的分類關(guān)系。利用PCA分析,我們可以選取貢獻(xiàn)最大的2個(gè)或3個(gè)主成分作為數(shù)據(jù)代表用以可視化。這比直接選取三個(gè)表達(dá)變化最大的基因更能反映樣品之間的差異。發(fā)現(xiàn)隱性相關(guān)變量4PCA實(shí)現(xiàn)原理PCA分析不是簡單地選取2個(gè)或3個(gè)變化最大的基因,而是先把原始的變量做一個(gè)評(píng)估,計(jì)算各個(gè)變量各自的變異度(方差)和兩兩變量的相關(guān)度(協(xié)方差),得到一個(gè)協(xié)方差矩陣。在這個(gè)協(xié)方差矩陣中,對(duì)角線的值為每一個(gè)變量的方差,其它值為每兩個(gè)變量的協(xié)方差。隨后對(duì)原變量的協(xié)方差矩陣對(duì)角化處理,即求解其特征值和特征向量。原變量與特征向量的乘積(對(duì)原始變量的線性組合)即為新變量(回顧下線性代數(shù)中的矩陣乘法);新變量的協(xié)方差矩陣為對(duì)角協(xié)方差矩陣且對(duì)角線上的方差由大到小排列;然后從新變量中選擇信息最豐富也就是方差最大的的前2個(gè)或前3個(gè)新變量也就是主成分用以可視化。5/2016/10/PCA/為什么要進(jìn)行中心化6更詳細(xì)解釋見
/2016/10/PCA/主成分分析類比示例7PCA結(jié)果展示8不同預(yù)處理對(duì)PCA結(jié)果的影響不同標(biāo)準(zhǔn)化的本質(zhì)在于研究者認(rèn)為是數(shù)值的量度本身重要還是數(shù)值的變化重要。數(shù)值的量度重要?jiǎng)t選擇原始數(shù)據(jù)或log轉(zhuǎn)換。數(shù)值的變化重要?jiǎng)t選擇scale。
9PCA結(jié)果展示
–
碎石圖,每個(gè)主成分的貢獻(xiàn)度10PCA結(jié)果展示
–
樣品分組加置信區(qū)間11PCA結(jié)果展示
–
展示部分變量與主成分的相關(guān)性12PCA結(jié)果展示
–
biplot同時(shí)展示樣品分組和關(guān)鍵基因13PCA繪制的輸入和輸出14標(biāo)準(zhǔn)化后的OTU豐度表,樣品分組信息/ImageGP/index.php/Home/Index/PCAplot.htmltSNE聚類結(jié)果t-Distributed
stochastic
neighborembedding
(t-SNE)
analysis
of60,000
single
cells
sampled
frommouse
cell
atlas
data.
Ninety-eightmaincelltypeclustersare
labeled
in
the
t-SNE
map.15Mapping
the
Mouse
Cell
Atlas
by
Microwell-Seqt-SNE展示特定基因表達(dá)圖譜t-Distributedstochasticneighborembedding(t-SNE)analysisof60,000
single
cells
sampled
frommouse
cell
atlas
data.
Ninety-eightmaincelltypeclustersarelabeledinthet-SNEmap.16Mapping
the
Mouse
Cell
Atlas
by
Microwell-SeqBeta多樣性
–
樣品或組間差異Beta多樣性是生態(tài)學(xué)概念,專指不同組或生態(tài)位間物種組成的差異在宏基因組領(lǐng)域,常用降維映射散點(diǎn)圖展示樣品組間的Beta多樣性。常用的分析方法有主成分分析
(PCA),主坐標(biāo)軸分析
(PCoA/MDS)和限制條件的主坐標(biāo)軸分析
(CCA/RDA)。PCA
、
PCoA
,
NMDS
,
CCA
,
RDA
,
LDA
在
本
質(zhì)
上
是
排
序(ordination)分析。排序的過程就是在一個(gè)可視化的低維空間(通常是二維)重新排列這些樣品,使得樣方之間的距離最大程度地反映出平面散點(diǎn)圖內(nèi)樣品間的關(guān)系信息。Constrained和Unconstrained區(qū)別:分組
vs
樣品。
17Beta多樣性PcOA分析
–
用于樣品聚類18不同顏色代表不同的取樣部位,不同形狀代表不同的生長城市。橫軸代表第一主坐標(biāo)軸,可以解釋樣品總差異的46.3%,縱軸代表第二主坐標(biāo)軸,可以解釋樣品差異的11.5%。從圖可以看出,橫軸上展示的是不同取樣部分的差異,縱軸是產(chǎn)地的差異。Edwards,
J.,
et
al.
(2015).
PNASBeta多樣性計(jì)算Beta多樣性表示樣品之間的物種差異度,
默認(rèn)有5種計(jì)算方式:bray_curtis,
euclidean,
jaccard,manhatten,
unifrac。在usearch中,beta多樣性是差異度量,而不是相似度度量,也就是說數(shù)值越大,樣品之間差別越大。具
體
見/usearch/manual/beta_metrics.html。19Beta多樣性距離矩陣樣式——Bray-Curtis20Beta多樣性結(jié)果PcoA展示21/ImageGP/index.php/Home/Index/PCoAplot.htmlBeta多樣性結(jié)果——Constrained
PcoA展示PCA,
PCoA是無監(jiān)督的聚類分析,不依賴于外部樣品分組信息。CPCoA,CCA是有監(jiān)督的聚類分析,用以解釋在給定條件下,各組差
異最大的映射平面。獲得的結(jié)果,樣品之間的分組更明顯,但解釋時(shí)
一定注明,這只解釋了原差異的一部分。
左邊圖以取樣部位為限制條件,右
邊圖以基因型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- c11h10o4的六元環(huán)化合物
- 深圳學(xué)??臻g施工方案
- 臺(tái)州混凝土破碎施工方案
- 2025年江蘇旅游職業(yè)學(xué)院單招職業(yè)傾向性測(cè)試題庫含答案
- 2025年河北科技學(xué)院單招職業(yè)適應(yīng)性測(cè)試題庫匯編
- 2025年重慶財(cái)經(jīng)職業(yè)學(xué)院單招職業(yè)技能測(cè)試題庫完整
- 2024新教材高中化學(xué) 第1章 第1節(jié) 走進(jìn)化學(xué)科學(xué)教學(xué)實(shí)錄 魯科版必修第一冊(cè)
- 在線教育平臺(tái)課程制作規(guī)范
- 農(nóng)業(yè)智慧農(nóng)場(chǎng)建設(shè)與管理方案
- 游戲行業(yè)產(chǎn)品測(cè)試與發(fā)布流程指南
- 2025年揚(yáng)州市職業(yè)大學(xué)單招職業(yè)技能測(cè)試題庫參考答案
- 虛擬現(xiàn)實(shí)環(huán)境中視覺體驗(yàn)優(yōu)化
- 班組長安全管理培訓(xùn)課件
- 2025年新疆生產(chǎn)建設(shè)兵團(tuán)興新職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 中考物理復(fù)習(xí)歐姆定律復(fù)習(xí)講解學(xué)習(xí)
- 2025年春新外研版(三起)英語三年級(jí)下冊(cè)課件 Unit5第1課時(shí)Startup
- 優(yōu)生五項(xiàng)臨床意義
- 2024年池州職業(yè)技術(shù)學(xué)院單招職業(yè)技能測(cè)試題庫標(biāo)準(zhǔn)卷
- 事故隱患內(nèi)部報(bào)告獎(jiǎng)勵(lì)機(jī)制實(shí)施細(xì)則
- 小學(xué)六年級(jí)數(shù)學(xué)學(xué)情分析及提升方案
- 事業(yè)單位考試(公共基礎(chǔ)知識(shí))3000題每日練習(xí)
評(píng)論
0/150
提交評(píng)論