生物芯片分析_第1頁(yè)
生物芯片分析_第2頁(yè)
生物芯片分析_第3頁(yè)
生物芯片分析_第4頁(yè)
生物芯片分析_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Bioinformatics, 2010-2011 Bioinformatics, 2010-2011 武漢大學(xué)生物醫(yī)學(xué)工程系武漢大學(xué)生物醫(yī)學(xué)工程系趙趙 旻旻Bioinformatics, 2010-2011Bioinformatics, 2010-2011r生物芯片簡(jiǎn)介與沿革r生物芯片的分類r基因芯片基本原理、流程與應(yīng)用r蛋白質(zhì)芯片及應(yīng)用r其它芯片技術(shù)Bioinformatics, 2010-2011Bioinformatics, 2010-2011什么是生物芯片? 生物芯片(Biochip)主要指通過(guò)平面微細(xì)加工技術(shù),在固體芯片表面等載體上的微型生物化學(xué)分析系統(tǒng),以實(shí)現(xiàn)對(duì)細(xì)胞、蛋白質(zhì)、核酸

2、以及其他生物組分的準(zhǔn)確、快速、大信息量的檢測(cè)。Bioinformatics, 2010-2011Bioinformatics, 2010-2011 芯片上每平方厘米可密集排列成千上萬(wàn)個(gè)生物分子(Microarray),能快速準(zhǔn)確地檢測(cè)細(xì)胞、蛋白質(zhì)、DNA及其他生物組分,并獲取樣品中的有關(guān)信息,其效率是傳統(tǒng)檢測(cè)方法的成百上千倍。Bioinformatics, 2010-2011Bioinformatics, 2010-2011試樣處理試樣處理點(diǎn)陣固定點(diǎn)陣固定反應(yīng)或雜交芯片制作標(biāo)記洗滌檢測(cè)掃描檢測(cè)掃描光刻合成微量點(diǎn)樣噴墨純化、標(biāo)記光化學(xué)檢測(cè)電化學(xué)檢測(cè)計(jì)算處理Bioinformatics, 2010

3、-2011Bioinformatics, 2010-2011r 1996年美國(guó)Affymetrix公司成功地制作出世界上首批用于藥物篩選和實(shí)驗(yàn)室試驗(yàn)用的生物芯片,并制作出相應(yīng)的芯片系統(tǒng)。此外,美國(guó)的Hyseq公司、Aurora公司、Nanogen公司、Incyte公司等也在積極開(kāi)展DNA芯片研究工作。近二年,摩托羅拉、惠普、IBM等跨國(guó)公司也相繼投以巨資加入生物芯片的研究開(kāi)發(fā)。Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 中國(guó)在生物芯片領(lǐng)域起步較晚,我國(guó)是從一九九七年才開(kāi)始對(duì)生物芯片研究,而國(guó)外從八十年代起就開(kāi)始研制生物芯片。 r 中國(guó)

4、醫(yī)藥生物技術(shù)協(xié)會(huì)生物芯片分會(huì)國(guó)際生物芯片領(lǐng)域的第一個(gè)行業(yè)性組織2006在北京成立。r 中國(guó)在北京、上海、陜西、天津、南京建立了五大生物芯片研發(fā)和產(chǎn)業(yè)化基地 。r 我國(guó)生物芯片產(chǎn)業(yè)尚未形成統(tǒng)一的技術(shù)標(biāo)準(zhǔn),不規(guī)范。在產(chǎn)品認(rèn)證認(rèn)可方面也存在與國(guó)際慣例不接軌的情況。Bioinformatics, 2010-2011 Bioinformatics, 2010-2011 Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 201

5、0-2011 Bioinformatics, 2010-2011 Bioinformatics, 2010-2011Bioinformatics, 2010-20111. 簡(jiǎn)介簡(jiǎn)介2. 圖像處理與數(shù)據(jù)標(biāo)準(zhǔn)化圖像處理與數(shù)據(jù)標(biāo)準(zhǔn)化3. 基因芯片的數(shù)據(jù)分析基因芯片的數(shù)據(jù)分析4. 芯片芯片工具工具&數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)Bioinformatics, 2010-2011Bioinformatics, 2010-2011基因芯片(Gene chip)技術(shù)是指通過(guò)微陣列(Microarray)技術(shù)將高密度DNA片段陣列通過(guò)高速機(jī)器人或原位合成方式以一定的順序或排列方式使其附著在如玻璃片等固相表面,以熒光標(biāo)記

6、的DNA探針,借助堿基互補(bǔ)雜交原理,進(jìn)行大量的基因表達(dá)及檢測(cè)等研究的技術(shù)。Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-20111. 根據(jù)免疫測(cè)定的根據(jù)免疫測(cè)定的 (immunoassay)的方法的方法 予以改進(jìn)予以改進(jìn)2. 高通量、點(diǎn)陣以及高通量、點(diǎn)陣以及Northern雜交雜交3. 同時(shí)測(cè)定細(xì)胞內(nèi)數(shù)千個(gè)基因的表達(dá)情況同時(shí)測(cè)定細(xì)胞內(nèi)數(shù)千個(gè)基因的表達(dá)情況4. 芯片的體積非常小:微量樣品的檢測(cè)芯片的體積非常?。何⒘繕悠返臋z測(cè)5. 基因表達(dá)情況的定量分析

7、基因表達(dá)情況的定量分析Bioinformatics, 2010-2011Bioinformatics, 2010-2011 依據(jù)雙螺旋原理,核酸分子雜交技術(shù),在靶標(biāo)樣品與探針之間進(jìn)行選擇性反應(yīng),將反應(yīng)一方(探針)固定在芯片上,另一方(熒光標(biāo)記,即制備好的cDNA,分別標(biāo)記綠色的Cy3和紅色的Cy5)通過(guò)流路或加至芯片上。Bioinformatics, 2010-2011Bioinformatics, 2010-2011RNADNA1DNA2ProbeSouthernhybridizationNorthernhybridizationJuang RH (2004) BCbasicsBioinfo

8、rmatics, 2010-2011Bioinformatics, 2010-2011將樣品中的將樣品中的DNA/RNA表上熒表上熒光標(biāo)記,則可以定量檢驗(yàn)基光標(biāo)記,則可以定量檢驗(yàn)基因的表達(dá)水平因的表達(dá)水平堿基互補(bǔ)堿基互補(bǔ)Bioinformatics, 2010-2011Bioinformatics, 2010-2011樣品制備樣品制備芯片制備芯片制備雜交雜交雜交信號(hào)檢測(cè)雜交信號(hào)檢測(cè)數(shù)據(jù)分析數(shù)據(jù)分析Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011

9、Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-20111. 發(fā)現(xiàn)在特定生長(zhǎng)時(shí)期,或者隨著環(huán)境變化,那些發(fā)現(xiàn)在特定生長(zhǎng)時(shí)期,或者隨著環(huán)境變化,那些基因的表達(dá)收到誘導(dǎo)或者抑制基因的表達(dá)收到誘導(dǎo)或者抑制2. 在相同條件下,上調(diào)或者下調(diào)變化規(guī)律相似的基在相同條件下,上調(diào)或者下調(diào)變化規(guī)律相似的基因,可能具有功能上的關(guān)聯(lián)因,可能具有功能上的關(guān)聯(lián)3. 可以從共表達(dá)的基因中尋找調(diào)控模體可以從共表達(dá)的基因中尋找調(diào)控模體4. 基因表達(dá)的模式可以用來(lái)表征異常的細(xì)胞調(diào)控,基

10、因表達(dá)的模式可以用來(lái)表征異常的細(xì)胞調(diào)控,例如,癌癥的診斷例如,癌癥的診斷Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 按芯片制備方法分類 原位合成芯片(synthetic genechip) DNA微陣列芯片(DNA microarray)r 按探針?lè)诸?寡核苷酸陣列(芯片) DNA陣列 基因芯片 cDNA芯片 RNA芯片Bioinformatics, 2010-2011Bioinformatics, 2010-2011 Sensitivity of DNA chip based assays is a function of:|Pro

11、be and target DNA/RNA (Complexity)|Chip surface (autofluorescence & non-spec. bkg)|Attachment chemistry/methodology (hyb. efficiency & crosshyb.)|Hybridization efficiency (lots of factors)|Detection technology (signal type, efficiency, noise)Bioinformatics, 2010-2011Bioinformatics, 2010-2011

12、按技術(shù)手段、探針類型分類按技術(shù)手段、探針類型分類1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein)3. Long oligo arrays (Agilent)4. Serial analysis of gene expression (SAGE)按實(shí)驗(yàn)要求分類按實(shí)驗(yàn)要求分類1. 單通道單通道 (Single Channel): 一次檢驗(yàn)一種狀態(tài)一次檢驗(yàn)一種狀態(tài) 2. 雙通道雙通道 (Dual Channel): 差異表達(dá)基因的篩選差異表達(dá)基因的篩選Bioinformatics, 2010-20

13、11Bioinformatics, 2010-20111 片上原位合成寡核苷酸點(diǎn)陣芯片(ONA)2 微量點(diǎn)樣技術(shù)制作的CDNA 點(diǎn)陣芯片(CDA)ONA特點(diǎn):(1)易尋址,利用組合化學(xué)的原理安排各寡核苷利用組合化學(xué)的原理安排各寡核苷酸的位點(diǎn),芯片反應(yīng)后易尋址;酸的位點(diǎn),芯片反應(yīng)后易尋址;(2)點(diǎn)位牢固,用表面化學(xué)方法處理基片用表面化學(xué)方法處理基片(玻璃、玻璃、硅片、尼龍片硅片、尼龍片),使核苷酸固定在基片上;,使核苷酸固定在基片上;(3)定點(diǎn)合成,光導(dǎo)向平板印刷技術(shù),芯片表面光導(dǎo)向平板印刷技術(shù),芯片表面可用屏蔽物屏蔽,光照選擇性脫保護(hù),有利于定可用屏蔽物屏蔽,光照選擇性脫保護(hù),有利于定點(diǎn)合成寡

14、核苷酸中的各個(gè)堿基;目前技術(shù):點(diǎn)合成寡核苷酸中的各個(gè)堿基;目前技術(shù):1.6cm2;40萬(wàn)個(gè)點(diǎn);萬(wàn)個(gè)點(diǎn);20個(gè)個(gè)核苷酸;核苷酸;Bioinformatics, 2010-2011Bioinformatics, 2010-20111. cDNA microarrays: 將將5005,000bp的的cDNA固固載到介質(zhì)上載到介質(zhì)上 (例如玻璃例如玻璃),Stanford開(kāi)發(fā)設(shè)計(jì),通開(kāi)發(fā)設(shè)計(jì),通常為雙通道常為雙通道2. DNA chips: 將寡核苷酸探針將寡核苷酸探針 (2080-mer) 合成合成到芯片上,到芯片上,Affymetrix開(kāi)發(fā)設(shè)計(jì),通常為單通道開(kāi)發(fā)設(shè)計(jì),通常為單通道Bioinfor

15、matics, 2010-2011Bioinformatics, 2010-2011cDNA clonesBioinformatics, 2010-2011Bioinformatics, 2010-2011Robot spotter普通的蓋玻片普通的蓋玻片Bioinformatics, 2010-2011Bioinformatics, 2010-2011Treatment / controlNormal / tumor tissueBrain / liverBioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 201

16、0-2011Bioinformatics, 2010-2011GenesmRNA samplesGene expression level of gene i in mRNA sample j=Log (Red intensity / Green intensity)Log(Avg. PM - Avg. MM)sample1 sample2 sample3 sample4 sample5 1 0.46 0.30 0.80 1.51 0.90.2-0.10 0.49 0.24 0.06 0.46.3 0.15 0.74 0.04 0.10 0.20.4-0.45-1.03-0.79-0.56-0

17、.32.5-0.06 1.06 1.35 1.09-1.09.Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 探針長(zhǎng)度:探針長(zhǎng)度:25 bpr 每個(gè)基因:每個(gè)基因:22-40個(gè)探針個(gè)探針r Perfect Match (PM) vs. MisMatch (MM) probesBioinformatics, 2010-2011Bioinform

18、atics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011單單通道基因芯片通道基因芯片 white (very high) red (high) Yellow (a little high) green (medium)blue (low) black (no)Bioinformatics, 2010-2011Bioinfo

19、rmatics, 2010-2011植根區(qū)域生長(zhǎng)法植根區(qū)域生長(zhǎng)法(SRG) Fixed Circle柵格化:確定點(diǎn)的位置柵格化:確定點(diǎn)的位置圖象分割圖象分割 (Segmentation):將點(diǎn)從背景中分離出來(lái)。:將點(diǎn)從背景中分離出來(lái)。抽提亮度:各個(gè)像素亮度的平均值抽提亮度:各個(gè)像素亮度的平均值 (mean)或中位數(shù)或中位數(shù) (median)背景校正:局部或全局背景校正:局部或全局Bioinformatics, 2010-2011Bioinformatics, 2010-2011對(duì)于每個(gè)點(diǎn),我們可以計(jì)算對(duì)于每個(gè)點(diǎn),我們可以計(jì)算 Red intensity = Rfg - Rbgfg = fore

20、ground, bg = background, and Green intensity = Gfg - Gbgand combine them in the log (base 2) ratio Log2( Red intensity / Green intensity) Green intensity (medium): 1Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 系統(tǒng)的系統(tǒng)的r 隨機(jī)的隨機(jī)的 log signal intensity log RNA abundanceBioinformatics, 2010-2011Bioin

21、formatics, 2010-20111. 圖像分析圖像分析2. 掃描掃描3. DNA雜交過(guò)程雜交過(guò)程, 溫度、時(shí)間、混合均勻程度等溫度、時(shí)間、混合均勻程度等4. 探針的標(biāo)記探針的標(biāo)記5. RNA的抽提的抽提6. 加樣加樣7. 其他其他Bioinformatics, 2010-2011Bioinformatics, 2010-2011Red/green 比值比值存在亮度的傾向存在亮度的傾向M = log2R/G = log2R - log2G= (log2R + log2G )/2Values should scatter about zero.Bioinformatics, 2010-20

22、11Bioinformatics, 2010-2011beforeafterBioinformatics, 2010-2011Bioinformatics, 2010-2011(1) 差異表達(dá)基因的分析差異表達(dá)基因的分析(2) 基因共表達(dá)分析基因共表達(dá)分析(3) 基因表達(dá)數(shù)據(jù)的聚類基因表達(dá)數(shù)據(jù)的聚類(4) 基因表達(dá)數(shù)據(jù)的分類基因表達(dá)數(shù)據(jù)的分類(5) Map to GO(6) Gene regulatory networkBioinformatics, 2010-2011Bioinformatics, 2010-20111.差異表達(dá)基因的分析差異表達(dá)基因的分析: 尋找處理前后表達(dá)上調(diào)或者尋找處理

23、前后表達(dá)上調(diào)或者下調(diào)的基因下調(diào)的基因2. Are the treatments different?3. 使用標(biāo)準(zhǔn)的統(tǒng)計(jì)學(xué)方法檢驗(yàn)使用標(biāo)準(zhǔn)的統(tǒng)計(jì)學(xué)方法檢驗(yàn) (t-test or f-test),發(fā),發(fā)現(xiàn)統(tǒng)計(jì)顯著性差異表達(dá)的基因,現(xiàn)統(tǒng)計(jì)顯著性差異表達(dá)的基因,4. 如果處理本身并不顯著,則結(jié)果無(wú)意義如果處理本身并不顯著,則結(jié)果無(wú)意義Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. Fold change, 一般一般2-fold increase or decrease (平行實(shí)驗(yàn)的樣本較少平行實(shí)驗(yàn)的樣本較少) r 2. p-value (

24、平行實(shí)驗(yàn)的樣本較多平行實(shí)驗(yàn)的樣本較多)under-expressedover-expressed/2/2Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. T-test: 學(xué)生分布學(xué)生分布r 2. Excel函數(shù):函數(shù):TTEST(array1,array2,tails,type)| Array1為第一個(gè)數(shù)據(jù)集為第一個(gè)數(shù)據(jù)集| Array2為第二個(gè)數(shù)據(jù)集為第二個(gè)數(shù)據(jù)集| Tails指示分布曲線的尾數(shù)。如果指示分布曲線的尾數(shù)。如果 tails = 1,函數(shù),函數(shù) TTEST 使用單尾分布。如果使用單尾分布。如果 tails = 2,函數(shù),

25、函數(shù) TTEST 使使用雙尾分布用雙尾分布| Type為為 t 檢驗(yàn)的類型檢驗(yàn)的類型1 成對(duì)成對(duì) 2 等方差雙樣本檢驗(yàn)等方差雙樣本檢驗(yàn) 3 異方差雙樣本檢驗(yàn)異方差雙樣本檢驗(yàn) Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 一般選擇雙尾分布一般選擇雙尾分布r 2. 異方差雙樣本檢驗(yàn)異方差雙樣本檢驗(yàn)r 3. Excel函數(shù):函數(shù):=TTEST(B2:D2,E2:G2,2,3) r 4. C:對(duì)照組;:對(duì)照組;T:實(shí)驗(yàn)組:實(shí)驗(yàn)組Bioinformatics, 2010-2011Bioinformatics, 2010-20111. 在基因

26、芯片的實(shí)驗(yàn)中,每一個(gè)基因在基因芯片的實(shí)驗(yàn)中,每一個(gè)基因/探針,都是一個(gè)探針,都是一個(gè)獨(dú)立的實(shí)驗(yàn)獨(dú)立的實(shí)驗(yàn)2. 基因芯片:高通量,基因芯片:高通量,1,000個(gè)基因個(gè)基因/探針探針3. 因此,無(wú)論怎么比較,總會(huì)有一些基因會(huì)是統(tǒng)計(jì)顯因此,無(wú)論怎么比較,總會(huì)有一些基因會(huì)是統(tǒng)計(jì)顯著性差異表的著性差異表的 可能是隨機(jī)產(chǎn)生的可能是隨機(jī)產(chǎn)生的4. 如何評(píng)估表達(dá)差異基因預(yù)測(cè)的有效性?如何評(píng)估表達(dá)差異基因預(yù)測(cè)的有效性?5. 例:例:1,000個(gè)探針的雙通道芯片,以個(gè)探針的雙通道芯片,以p-value 0.01為域值,發(fā)現(xiàn)為域值,發(fā)現(xiàn)7個(gè)上調(diào)基因,個(gè)上調(diào)基因,5個(gè)下調(diào)基因,分析結(jié)個(gè)下調(diào)基因,分析結(jié)果是否具有統(tǒng)計(jì)學(xué)

27、意義?果是否具有統(tǒng)計(jì)學(xué)意義?Bioinformatics, 2010-2011Bioinformatics, 2010-20111. False positive prediction: “Type 1 error or False Discovery2. False Discovey Rate (FDR) = p-value * No. of Genes上例:上例: FDR= 0.01* 1,000=10 (隨機(jī)隨機(jī))7個(gè)上調(diào)基因,個(gè)上調(diào)基因,5個(gè)下調(diào)基因個(gè)下調(diào)基因 10因此上例計(jì)算的結(jié)果無(wú)統(tǒng)計(jì)學(xué)意義因此上例計(jì)算的結(jié)果無(wú)統(tǒng)計(jì)學(xué)意義3. FDR必須遠(yuǎn)小于發(fā)現(xiàn)的差異表達(dá)基因數(shù)目必須遠(yuǎn)小于發(fā)現(xiàn)的差

28、異表達(dá)基因數(shù)目實(shí)驗(yàn)的有效性實(shí)驗(yàn)的有效性p-value的選擇的選擇Bioinformatics, 2010-2011Bioinformatics, 2010-20111. 在在N個(gè)不同的條件下個(gè)不同的條件下 (時(shí)間序列的芯片數(shù)據(jù)時(shí)間序列的芯片數(shù)據(jù)),考察,考察基因基因X和和Y的表達(dá)是否相似的表達(dá)是否相似2. Gene 1#是否與是否與Gene 2#、Gene 3#和和Gene 4#共表共表達(dá)?達(dá)?3. 共表達(dá):共表達(dá):正相關(guān):相似的表達(dá)譜,可能存在正關(guān)聯(lián)正相關(guān):相似的表達(dá)譜,可能存在正關(guān)聯(lián)負(fù)相關(guān):相反的表達(dá)譜,可能存在負(fù)調(diào)控負(fù)相關(guān):相反的表達(dá)譜,可能存在負(fù)調(diào)控Eisen MB, et al.,

29、(1998) PNAS 95:14863-14868Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. Spearman rank correlationr 2. Kendalls taur 3. Euclidean distancer 4. Pearson correlation coefficient: -1 1r Excel函數(shù):函數(shù):=PEARSON(array1,array2)Eisen MB, et al., (1998) P

30、NAS 95:14863-14868Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. r -1, 1| r 1,正相關(guān),正相關(guān)| r -1,負(fù)相關(guān),負(fù)相關(guān)r 結(jié)論:Gene 1#與Gene 2#表達(dá)正相關(guān),與Gene 3#表達(dá)負(fù)相關(guān),與Gene 4#無(wú)關(guān)聯(lián)Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 將表達(dá)譜相似的基因聚類在一起將表達(dá)譜相似的基因聚類在一起r 2. 無(wú)督導(dǎo)學(xué)習(xí)無(wú)督導(dǎo)學(xué)習(xí) (unsupervised learning)r 3. Pattern finding

31、: 發(fā)現(xiàn)新的模式發(fā)現(xiàn)新的模式r 4. 聚類方法:聚類方法:|A. Hierarchical clustering|B. K-means clusteringHierarchical ClusteringBioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 用樹(shù)狀結(jié)構(gòu)來(lái)表征基因表用樹(shù)狀結(jié)構(gòu)來(lái)表征基因表達(dá)之間的相似性達(dá)之間的相似性/相關(guān)性相關(guān)性r 2. 優(yōu)點(diǎn):不需要指定結(jié)果有優(yōu)點(diǎn):不需要指定結(jié)果有多少類多少類Distance matrixCluster Tree0123456DistancesOBJECT1OBJECT2OBJECT3OBJE

32、CT4OBJECT5Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 對(duì)數(shù)據(jù)進(jìn)行聚類對(duì)數(shù)據(jù)進(jìn)行聚類r 2. 必須給定結(jié)果分成必須給定結(jié)果分成多少類!多少類!r 3. 假設(shè),該例中,指假設(shè),該例中,指定為聚成定為聚成5類類Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 隨便選取隨便選取5個(gè)點(diǎn),個(gè)點(diǎn),作為每一個(gè)類的中作為每一個(gè)類的中心點(diǎn)心點(diǎn)Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 2. 計(jì)算其他點(diǎn)與這計(jì)算其他點(diǎn)與這5

33、個(gè)中心點(diǎn)的個(gè)中心點(diǎn)的距離距離r 距離:距離:| 歐氏距離歐氏距離| 馬氏距離馬氏距離| 皮爾孫相關(guān)系數(shù)皮爾孫相關(guān)系數(shù)r 點(diǎn)的歸類:離哪個(gè)中點(diǎn)的歸類:離哪個(gè)中心點(diǎn)近,歸哪個(gè)類心點(diǎn)近,歸哪個(gè)類Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 3. 針對(duì)每一類中的每針對(duì)每一類中的每一個(gè)點(diǎn),計(jì)算其與其一個(gè)點(diǎn),計(jì)算其與其他點(diǎn)的距離,加和,他點(diǎn)的距離,加和,除以該類點(diǎn)的數(shù)目;除以該類點(diǎn)的數(shù)目;r 找到新的中心點(diǎn),即找到新的中心點(diǎn),即改點(diǎn)到該類中其他點(diǎn)改點(diǎn)到該類中其他點(diǎn)的平均值最小;的平均值最??;r 確定新的確定新的5個(gè)中心點(diǎn)!個(gè)中心點(diǎn)!Bioinfor

34、matics, 2010-2011Bioinformatics, 2010-2011r 4. 重復(fù)重復(fù)2, 3,直到結(jié),直到結(jié)果收斂果收斂r 實(shí)際操作時(shí),因結(jié)果實(shí)際操作時(shí),因結(jié)果完全收斂時(shí)間過(guò)長(zhǎng),完全收斂時(shí)間過(guò)長(zhǎng),一般指定迭代的次數(shù),一般指定迭代的次數(shù),如如1,000次次Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 5. 最終結(jié)果:所有基最終結(jié)果:所有基因芯片數(shù)據(jù)被聚成因芯片數(shù)據(jù)被聚成5類類r 軟件:軟件:Cluster 3.0, Michael Eissen, StanfordBioinformatics, 2010-2011Bioi

35、nformatics, 2010-2011r 1. 根據(jù)基因表達(dá)的數(shù)據(jù)將樣本分成兩類或多類;根據(jù)基因表達(dá)的數(shù)據(jù)將樣本分成兩類或多類;r 2. 督導(dǎo)學(xué)習(xí)督導(dǎo)學(xué)習(xí) (supervised learning):根據(jù)發(fā)現(xiàn):根據(jù)發(fā)現(xiàn)的的pattern進(jìn)行預(yù)測(cè)進(jìn)行預(yù)測(cè)r 3. 應(yīng)用:應(yīng)用:| 癌癥癌癥 vs. 正常組織正常組織| 癌癥的亞型、不同階段癌癥的亞型、不同階段 (良性的良性的 vs. 惡性的惡性的) | 對(duì)藥物的敏感性對(duì)藥物的敏感性 (tamoxifen for breast cancer)Bioinformatics, 2010-2011Bioinformatics, 2010-20111.

36、通過(guò)聚類發(fā)現(xiàn)各種亞型之通過(guò)聚類發(fā)現(xiàn)各種亞型之間的關(guān)系間的關(guān)系2. 根據(jù)基因表達(dá)模式,能夠根據(jù)基因表達(dá)模式,能夠預(yù)測(cè)新的基因表達(dá)樣本預(yù)測(cè)新的基因表達(dá)樣本Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 通過(guò)基因芯片,找到了一批通過(guò)基因芯片,找到了一批“interesting” 的基因的基因r 2. 生物學(xué)功能上是否存在關(guān)聯(lián)?生物學(xué)功能上是否存在關(guān)聯(lián)?|某種功能是否顯著?某種功能是否顯著?r 3. Gene Ontology + 超幾何分布超幾何分布Bioinformatics, 2010-2011Bioinformatics, 2010

37、-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 1. 早期觀點(diǎn):表達(dá)譜相似的基因可能存在早期觀點(diǎn):表達(dá)譜相似的基因可能存在功能上的關(guān)聯(lián),可能相互作用功能上的關(guān)聯(lián),可能相互作用 (直接作用直接作用)r 2. 當(dāng)前的觀點(diǎn):表達(dá)譜相似的基因可能具當(dāng)前的觀點(diǎn):表達(dá)譜相似的基因可能具有共同的調(diào)控元件有共同的調(diào)控元件 (基因基因UTR區(qū)域存在共區(qū)域存在共同的同的Promotor), 能夠被同一個(gè)上游因子所能夠被同一個(gè)上游因子所調(diào)控調(diào)控Bioinformatics, 2010-2011Bioinformatics, 2010-2011ERL2

38、SKP1UnknownChS1Wild-typeMutantr 1. 與光合效率和氣孔發(fā)育相關(guān)的基因:與光合效率和氣孔發(fā)育相關(guān)的基因:ERL2| A. 在在Wild-type中與之顯著相關(guān),但在中與之顯著相關(guān),但在Mutant中顯著不中顯著不相關(guān)的基因相關(guān)的基因Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 201

39、0-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-2011Bioinformatics, 2010-20111 基因表達(dá)分析: 分析基因表達(dá)時(shí)空特征 檢測(cè)基因差異表達(dá) 發(fā)現(xiàn)新基因 大規(guī)模測(cè)序Bioinformatics, 2010-2011Bioinformatics, 2010-2011DNA序列測(cè)定: 雜交測(cè)序:sequencing by hybridization, SBH 建立在特定序列的DNA與特定長(zhǎng)度的寡核苷酸集合的雜交的基礎(chǔ)之上

40、。未知DNA序列可以通過(guò)鑒定與靶DNA序列形成完整的雙鏈體寡核苷酸的重疊區(qū)域來(lái)確定;65536個(gè)八核苷酸點(diǎn)陣可測(cè)定約200個(gè)核苷酸的序列;一百萬(wàn)個(gè)十二核苷酸點(diǎn)陣可測(cè)定約1000個(gè)堿基對(duì)。Bioinformatics, 2010-2011Bioinformatics, 2010-20112 基因型、基因突變和多態(tài)性分析 分析基因組中不同基因與性狀或疾病的關(guān)系 3 疾病的診斷與治療 遺傳病相關(guān)基因的定位:產(chǎn)前篩查與診斷 腫瘤診斷 感染性疾病的診斷 基因突變檢測(cè)與遺傳病和腫瘤診斷大量平行測(cè)定。Bioinformatics, 2010-2011Bioinformatics, 2010-2011 4.藥

41、物研究中的應(yīng)用 r 新藥開(kāi)發(fā) r 發(fā)現(xiàn)藥物的新功能 r 調(diào)查藥物處理細(xì)胞后基因的表達(dá)情況 r 對(duì)藥物進(jìn)行毒性評(píng)價(jià) r 在基因水平上尋找藥物靶標(biāo),毒性對(duì)基因的影響。Bioinformatics, 2010-2011Bioinformatics, 2010-2011其它:病原體的檢出腫瘤相關(guān)基因表達(dá)譜 位點(diǎn)突變 耐藥基因檢測(cè) 疾病的分子分型 HLA分型Bioinformatics, 2010-2011Bioinformatics, 2010-2011細(xì)胞凋亡PCR芯片細(xì)胞周期PCR芯片血管生成PCR芯片腫瘤轉(zhuǎn)移PCR芯片癌通路發(fā)現(xiàn)者PCR芯片DNA損傷信號(hào)通路PCR芯片氧化應(yīng)激與抗氧化PCR芯片應(yīng)

42、激和毒性通路發(fā)現(xiàn)者PCR芯片腫瘤藥物耐受和代謝PCR芯片細(xì)胞因子PCR芯片乳腺癌和雌激素受體信號(hào)通 路PCR芯片藥物代謝PCR芯片內(nèi)皮細(xì)胞生物學(xué)功能研PCR芯片骨再生PCR芯片干細(xì)胞PCR芯片動(dòng)脈粥樣硬化PCR芯片糖尿病PCR芯片趨化因子與受體PCR芯片Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 生長(zhǎng)因子PCR芯片r 炎癥細(xì)胞因子與受體PCR芯片r 干擾素及其受體PCR芯片r Th1-Th2-Th3PCR芯片r Toll樣蛋白受體信號(hào)轉(zhuǎn)導(dǎo)PCR芯片r 細(xì)胞外基質(zhì)與粘連分子PCR芯片r 神經(jīng)營(yíng)養(yǎng)素與受體PCR芯片r 低氧信號(hào)通路PCR芯

43、片Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 胰島素信號(hào)通路PCR芯片r JAK / STAT信號(hào)通路PCR芯片r MAPK信號(hào)轉(zhuǎn)導(dǎo)通路PCR芯片r NF-kB信號(hào)通路PCR芯片r 一氧化氮PCR芯片r Notch信號(hào)通路PCR芯片r 信號(hào)轉(zhuǎn)導(dǎo)通路發(fā)現(xiàn)者PCR芯片r TGFb / BMP信號(hào)通路PCR芯片r TNF配體及受體PCR芯片r Wnt信號(hào)通路PCR芯片r 管家PCR芯片Bioinformatics, 2010-2011 Bioinformatics, 2010-2011 Bioinformatics, 2010-2011Bi

44、oinformatics, 2010-2011r 蛋白質(zhì)芯片:又稱為蛋白質(zhì)陣列或蛋白質(zhì)微陣列(protein microarray) 蛋白質(zhì)芯片是指在固相支持物上有序排列的蛋白質(zhì)芯片是指在固相支持物上有序排列的各自獨(dú)立的多肽、蛋白或相應(yīng)配體,利用蛋白質(zhì)各自獨(dú)立的多肽、蛋白或相應(yīng)配體,利用蛋白質(zhì)與蛋白質(zhì)、蛋白質(zhì)與與蛋白質(zhì)、蛋白質(zhì)與DNADNA、蛋白質(zhì)與、蛋白質(zhì)與RNARNA,或與其,或與其它配體間的相互作用,同時(shí)平行分析大量蛋白質(zhì)它配體間的相互作用,同時(shí)平行分析大量蛋白質(zhì)的生物化學(xué)性質(zhì),在蛋白質(zhì)組學(xué)基礎(chǔ)研究以及臨的生物化學(xué)性質(zhì),在蛋白質(zhì)組學(xué)基礎(chǔ)研究以及臨床診斷、藥物研究、環(huán)境監(jiān)測(cè)、食品衛(wèi)生等方面

45、床診斷、藥物研究、環(huán)境監(jiān)測(cè)、食品衛(wèi)生等方面有廣闊的應(yīng)用前景。有廣闊的應(yīng)用前景。Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 是指以蛋白質(zhì)分子作為配基,將其有序地固定在固相載體的表面形成微陣列;用標(biāo)記了熒光的蛋白質(zhì)或其他它分子與之作用,洗去未結(jié)合的成分,經(jīng)熒光掃描等檢測(cè)方式測(cè)定芯片上各點(diǎn)的熒光強(qiáng)度,來(lái)分析蛋白之間或蛋白與其它分子之間的相互作用關(guān)系。Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 根據(jù)其固定生物分子的不同,可以分為受體配根據(jù)其固定生物分子的不同,可以分為受體配體檢測(cè)芯片

46、,抗原芯片,抗體芯片等。體檢測(cè)芯片,抗原芯片,抗體芯片等。r 根據(jù)芯片載體的不同,分為普通玻璃載玻片,根據(jù)芯片載體的不同,分為普通玻璃載玻片,多孔凝膠覆蓋芯片和微孔芯片多孔凝膠覆蓋芯片和微孔芯片3種主要形式。種主要形式。 應(yīng)用最普遍的是玻璃片,另外應(yīng)用最普遍的是玻璃片,另外PVDF膜,聚丙膜,聚丙烯酰氨凝膠,硝化纖維素膜,聚苯乙烯微珠,烯酰氨凝膠,硝化纖維素膜,聚苯乙烯微珠,磁性微珠等磁性微珠等 r 對(duì)最普遍應(yīng)用的玻璃片而言,用于制備蛋白質(zhì)芯片的方法主要有戊二醛修飾法、聚賴氨酸修飾法、巰基修飾法和多糖修飾法等。Bioinformatics, 2010-2011Bioinformatics, 2

47、010-2011Zhu et al. (2001)Science.293,2101Capture ArraysSAMPLE ARRAYSReverse Phase ScreenANTIBODY ARRAYSSample Labelling ApproachesANTIBODY ARRAYSMutiplexed Sandwich ELISAshighly parallelhigh sensitivityexpensive equipmentlabour intenseautomation difficult Reverse Phase Protein MicroarraysYYYYYYForwa

48、rd PhaseDetectionAntigenReverse PhaseDetectionCapture MoleculesImmobilized AntigenCapture MoleculesY Y Y YBioinformatics, 2010-2011Bioinformatics, 2010-2011r 蛋白質(zhì)芯片的核心技術(shù)是蛋白芯片的制備和反應(yīng)信號(hào)的檢測(cè)分析。因此蛋白質(zhì)的純度;蛋白質(zhì)的固定是蛋白質(zhì)芯片技術(shù)的重點(diǎn)和難點(diǎn)。r 由于蛋白質(zhì)分子的活性依賴于不同的折疊方式,因此對(duì)芯片的表面修飾至關(guān)重要,要保證被點(diǎn)在芯片上的蛋白質(zhì)不失活而又能牢固的固定在芯片上。Bioinformatics,

49、2010-2011Bioinformatics, 2010-2011蛋白質(zhì)芯片技術(shù)主要包括四個(gè)基本要點(diǎn)蛋白質(zhì)芯片技術(shù)主要包括四個(gè)基本要點(diǎn):r芯片陣列的構(gòu)建r樣品的制備r芯片生化反應(yīng)r信號(hào)檢測(cè)及分析Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 首先將蛋白按設(shè)計(jì)的陣列方式點(diǎn)印在介質(zhì)上,樣品蛋白質(zhì)與芯片反應(yīng),然后用經(jīng)過(guò)標(biāo)記的(可以是酶、熒光、同位素、生物素等)蛋白質(zhì)與芯片-蛋白質(zhì)復(fù)合物結(jié)合,通過(guò)激光共聚焦顯微鏡和CCD照相機(jī)對(duì)標(biāo)記信號(hào)進(jìn)行掃描分析。r 聯(lián)合應(yīng)用雙向凝膠電泳,表面增強(qiáng)激光解析離子化飛行時(shí)間質(zhì)譜(SELDI-TOF-MS)或串聯(lián)質(zhì)

50、譜(MS/MS)還可以對(duì)蛋白分 子進(jìn)行定量分析。Bioinformatics, 2010-2011Bioinformatics, 2010-2011提出生物學(xué)問(wèn)題提出生物學(xué)問(wèn)題(實(shí)驗(yàn)?zāi)康模▽?shí)驗(yàn)?zāi)康模悠奉A(yù)處理樣品預(yù)處理(重組蛋白,(重組蛋白,制備一、二級(jí)抗體,制備一、二級(jí)抗體,熒光標(biāo)記)熒光標(biāo)記)生化反應(yīng)生化反應(yīng)化學(xué)偶合,加底物,化學(xué)偶合,加底物,反應(yīng)溫度和時(shí)間,反應(yīng)溫度和時(shí)間,沖洗條件沖洗條件檢測(cè)檢測(cè)(熒光和比色掃描或(熒光和比色掃描或拍照,參數(shù)設(shè)置)拍照,參數(shù)設(shè)置)數(shù)據(jù)分析和建模數(shù)據(jù)分析和建模 圖象量化,標(biāo)準(zhǔn)化圖象量化,標(biāo)準(zhǔn)化建立模型)建立模型)1 12 23 34 45 5蛋白質(zhì)芯片制

51、備蛋白質(zhì)芯片制備6 6Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 蛋白質(zhì)檢測(cè)芯片r 蛋白質(zhì)功能芯片Bioinformatics, 2010-2011Bioinformatics, 2010-2011r 蛋白質(zhì)是基因表達(dá)的最終產(chǎn)物, 接近生命活動(dòng)的物質(zhì)層面; r 探針蛋白特異性高、親和力強(qiáng), 可簡(jiǎn)化樣品前處理,甚至可直接利用生物材料(血樣、尿樣、細(xì)胞及組織等)進(jìn)行檢測(cè);r 適合高通量篩選與靶蛋白作用的化合物;r 有助于了解藥物或毒物與其效應(yīng)相關(guān)蛋白質(zhì)的相互作用。Bioinformatics, 2010-2011Bioinformatic

52、s, 2010-2011r Diagnostic immunoassay simultaneous high-throughput analysis of known auto-antigens. r Protein-Protein Interaction. r DNA- Protein InteractionBioinformatics, 2010-2011Bioinformatics, 2010-2011r 微生物感染病原體抗原、抗體的檢測(cè)r 自身抗體的檢測(cè)r 特定蛋白的檢測(cè)r HLA分型r 過(guò)敏原檢測(cè)r 腫瘤標(biāo)志的檢出Bioinformatics, 2010-2011 Bioinform

53、atics, 2010-2011 v高通量高通量v多組織標(biāo)本多組織標(biāo)本v同時(shí)、平行分析同時(shí)、平行分析 v同時(shí)研究一個(gè)或多個(gè)基因或同時(shí)研究一個(gè)或多個(gè)基因或蛋白的研究工具蛋白的研究工具v高質(zhì)、高效,省材,操作便高質(zhì)、高效,省材,操作便捷捷v應(yīng)用廣泛應(yīng)用廣泛 FISH FISH(熒光原位分子雜交)(熒光原位分子雜交) mRNA ISHmRNA ISH(原位雜交)(原位雜交) IHCIHC(免疫組織化學(xué))(免疫組織化學(xué)) 成百甚至上千份成百甚至上千份 正常或處于疾病狀態(tài)正?;蛱幱诩膊顟B(tài) 疾病不同發(fā)展階段疾病不同發(fā)展階段基因、轉(zhuǎn)錄、表達(dá)水平三方面基因、轉(zhuǎn)錄、表達(dá)水平三方面組織芯片的優(yōu)點(diǎn)組織芯片的優(yōu)點(diǎn) v 高通量高通量短時(shí)(一次即獲大量信息短時(shí)(一次即獲大量信息 )、高效(成百成)、高效(成百成千倍地提高效率千倍地提高效率 ) 僅僅2CM2CM2 2 含數(shù)十甚至數(shù)百例組織樣本,含數(shù)十甚

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論