




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、張彥婷鄭州大學(xué)生命科學(xué)學(xué)院基因芯片數(shù)據(jù)處理基因芯片(gene chip),又稱DNA微陣列(DNA microarray),就是將大量已知DNA探針整齊、高密度地固定在一塊類似郵票大小的固體(如玻璃片、硅片或尼龍布等)支持物上;用標(biāo)記好的核酸樣品進(jìn)行雜交,進(jìn)而通過(guò)檢測(cè)雜交后標(biāo)記信號(hào)的強(qiáng)弱來(lái)判斷樣品中與探針對(duì)應(yīng)的靶序列是否存在,數(shù)量。基因芯片的基本原理: 堿基互補(bǔ)匹配?;蛐酒?因 芯 片 流 程樣品制備芯片制備雜交雜交信號(hào)檢測(cè)數(shù)據(jù)分析 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和歸一化差異表達(dá)基因分析芯片數(shù)據(jù)的可靠性分析基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因
2、芯 片 流 程 雜交反應(yīng)封閉:對(duì)芯片進(jìn)行封閉以降低雜交背景雜交:將已標(biāo)記的靶分子加樣到芯片上,使其在特定溫度下與互補(bǔ)序列退火洗滌:洗滌芯片除去未結(jié)合或微弱結(jié)合的雜交分子芯片雜交 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和歸一化 芯片數(shù)據(jù)的可靠性分析 差異表達(dá)基因分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程 數(shù)據(jù)獲取掃描信號(hào)點(diǎn)定位數(shù)據(jù)提取是指將與目標(biāo)靶分子反應(yīng)結(jié)合后的生物芯片上成千上萬(wàn)個(gè)點(diǎn)陣的生物反應(yīng)結(jié)果閱讀出來(lái),轉(zhuǎn)變成可供計(jì)算機(jī)處理的數(shù)據(jù),包括三個(gè)步驟:基因芯片圖像的獲取和處理Cy3和Cy5Cy3激發(fā)波長(zhǎng)532nmCy5激發(fā)波長(zhǎng)635nm基因芯
3、片圖像的獲取和處理芯片掃描儀與熒光標(biāo)記的目標(biāo)DNA雜交后,必須用掃讀裝置將芯片測(cè)定結(jié)果轉(zhuǎn)變成可供分析處理的圖象數(shù)據(jù)。目前商品化的芯片掃描儀有2類:激光共聚焦芯片掃描儀和CCD芯片掃描儀。根據(jù)芯片掃描儀采用的光電耦合器件可分為2類:光電倍增管型和CCD型。根據(jù)激發(fā)光源的不同還可分為:激光型和非激光型?;蛐酒瑘D像的獲取和處理激光共聚焦顯微鏡的原理, 是基于PMT(photomultiplier tube,光電倍增管)的檢測(cè)系統(tǒng);CCD(charge-coupled devices,電荷偶合裝置)攝像原理檢測(cè)光子。 前者檢測(cè)靈敏度、分辨率均較高,但掃描時(shí)間長(zhǎng);后者掃描時(shí)間短,但靈敏度和分辨率不如前
4、者?;蛐酒瑘D像的獲取和處理激光共聚焦芯片掃描儀以激光作為激發(fā)光源,以產(chǎn)生較高強(qiáng)度的發(fā)射熒光,可大大提高檢測(cè)的靈敏度,一般采用2種或2種以上不同波長(zhǎng)的激光器作為激發(fā)光源。用光電倍增管檢測(cè),有較高的靈敏度。Genetic microsystems 公司的GMS 418 Array Scanner. 價(jià)格820萬(wàn)美元。CCD采用高壓汞燈作為激發(fā)光源,結(jié)構(gòu)比較簡(jiǎn)單。Genemic Solutions 公司Gene Tac TM 1000等。價(jià)格比較便宜,在5萬(wàn)美元左右。CCD一次可成像很大面積的區(qū)域,而以PMT為基礎(chǔ)的熒光掃描儀則是以單束固定波長(zhǎng)的激光來(lái)掃描,因此或者需要激光頭,或者需要目的芯片的機(jī)
5、械運(yùn)動(dòng)來(lái)使激光掃到整個(gè)面積,這樣就需要耗費(fèi)較多的時(shí)間來(lái)掃描;但是CCD有其缺點(diǎn):目前性能最優(yōu)越的CCD數(shù)字相機(jī)的成像面積只有1612mm(像素為10m),因此要達(dá)到整個(gè)芯片的面積2060mm的話,需要數(shù)個(gè)數(shù)碼相機(jī)同時(shí)工作,或者也可以以降低分辨率為代價(jià)來(lái)獲得掃描精度不是很高的圖像。由于靈敏度和分辯率較低,比較適合臨床診斷用?;蛐酒瑘D像的獲取和處理LaserPMTDyeGlass SlideObjective LensDetector lensPinholeBeam-splitter光電倍增管/激光共聚焦掃描基因芯片圖像的獲取和處理激光共聚焦的光路原理基因芯片圖像的獲取和處理激光共聚焦的光探測(cè)器
6、檢測(cè)熒光光子,并把微弱的熒光信號(hào)轉(zhuǎn)變?yōu)槟M的電信號(hào)基因芯片圖像的獲取和處理CCD成像技術(shù):主要用于中、高密度基因芯片的檢測(cè)CCD掃描儀掃描儀的技術(shù)指標(biāo): 噪音與信噪比 靈敏度與動(dòng)態(tài)檢測(cè)范圍 像素與分辨率基因芯片圖像的獲取和處理 同時(shí)掃描與分次掃描一次掃描得到一種熒光圖像(單通道),掃描多次得到多個(gè)熒光圖像,叫作分次掃描。得到的圖像需要用軟件對(duì)幾種熒光圖像進(jìn)行重疊對(duì)準(zhǔn)處理,有時(shí)還需要操作者手工重疊對(duì)準(zhǔn)干預(yù)。一次掃描得到多個(gè)熒光圖像(多通道)叫作同時(shí)掃描。圖像重疊簡(jiǎn)單僅需用軟件將多個(gè)圖像疊加,不需要調(diào)準(zhǔn)值。 同時(shí)掃描需要硬件的增加?;蛐酒瑘D像的獲取和處理基因芯片圖像的獲取和處理 生物芯片掃描過(guò)程
7、中應(yīng)注意的問(wèn)題由于芯片掃描儀有極高的靈敏度和分辨率,在芯片制作、雜交和清洗過(guò)程中都應(yīng)該在潔凈的環(huán)境中進(jìn)行芯片完成雜交和清洗后應(yīng)盡可能立即掃描測(cè)定,防止熒光標(biāo)記靶分子降解儀器放置在平穩(wěn)堅(jiān)固的平臺(tái)上。基因芯片圖像的獲取和處理植根區(qū)域生長(zhǎng)法(SRG) Fixed Circle劃格或定位:圖像內(nèi)信號(hào)點(diǎn)的初步定位圖象分割 (Segmentation):將點(diǎn)從背景中分離出來(lái)在分割過(guò)程中將像素強(qiáng)度從界定區(qū)域提取出來(lái)信號(hào)點(diǎn)定位基因芯片圖像的獲取和處理基因芯片圖像的獲取和處理數(shù)據(jù)提取將芯片圖像中的各種數(shù)值量化,如信號(hào)值、背景值等每個(gè)像素的灰度值在0-65535之間 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處
8、理和歸一化 芯片數(shù)據(jù)的可靠性分析 差異表達(dá)基因分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程Tiff圖像文件是生物芯片實(shí)驗(yàn)數(shù)據(jù)的最初載體圖像處理分析軟件能讀取Tiff圖像文件,自動(dòng)定位并識(shí)別芯片上每個(gè)點(diǎn)。定量各點(diǎn)的背景,信號(hào)強(qiáng)度。計(jì)算點(diǎn)的質(zhì)量測(cè)定值,將圖像轉(zhuǎn)化為原始數(shù)據(jù)原始數(shù)據(jù)不能直接用于下游統(tǒng)計(jì)學(xué)分析和數(shù)據(jù)聚類分析需要經(jīng)過(guò)預(yù)處理 數(shù)據(jù)預(yù)處理芯片的預(yù)處理和歸一化原始數(shù)據(jù)的預(yù)處理可分為如下幾個(gè)步驟 : 背景校正; 缺失值處理; 數(shù)據(jù)過(guò)濾和標(biāo)記; 數(shù)據(jù)轉(zhuǎn)換 歸一化 芯片的預(yù)處理和歸一化1. 背景校正 背景校正用于雜交點(diǎn)相對(duì)于前景信號(hào)強(qiáng)度的背景噪音進(jìn)行調(diào)整 加
9、和性背景校正:通常,該點(diǎn)的相對(duì)信號(hào)強(qiáng)度即為其絕對(duì)表達(dá)值和相對(duì)背景值的差值芯片的預(yù)處理和歸一化芯片背景芯片的預(yù)處理和歸一化校正方法局部背景校正(local background correction)亞?wèn)鸥癖尘靶U╯ubgrid background correction)分組背景校正(group background correction)空白點(diǎn)背景校正(blank background correction)2. 缺失值處理 當(dāng)點(diǎn)為空點(diǎn)或相對(duì)背景強(qiáng)度高于絕對(duì)信號(hào)強(qiáng)度時(shí),該點(diǎn)的數(shù)據(jù)出現(xiàn)缺失 替代方案: 使用重復(fù)點(diǎn)數(shù)據(jù)填充利用基因間的相關(guān)性進(jìn)行填充K最近鄰法芯片的預(yù)處理和歸一化3. 數(shù)據(jù)過(guò)濾和
10、標(biāo)記數(shù)據(jù)標(biāo)記是對(duì)不可信或不可靠的數(shù)據(jù)作標(biāo)記有兩種方法處理標(biāo)記后的數(shù)據(jù): -過(guò)濾且去除 -標(biāo)記但不去除芯片的預(yù)處理和歸一化4. 數(shù)據(jù)轉(zhuǎn)換 圖像分析軟件提取的基本數(shù)據(jù)為像素的熒光強(qiáng)度值,而在后續(xù)的分析中通常使用熒光強(qiáng)度的對(duì)數(shù)值生物學(xué)上易于理解和解釋使數(shù)據(jù)的分布滿足對(duì)稱性和近似正態(tài)分布、滿足常用統(tǒng)計(jì)分析方法。使用的方便性芯片的預(yù)處理和歸一化5. 歸一化(normalization)處理由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡,需對(duì)cy3和cy5的原始提取信號(hào)進(jìn)行均衡和修正才能進(jìn)一步分析實(shí)驗(yàn)數(shù)據(jù),Normalization正是基于此種目的。測(cè)量到的Cy3和Cy5的熒光強(qiáng)度受許多因素的影響,造成測(cè)量值
11、的變異: - 隨機(jī)變異:無(wú)法控制 - 系統(tǒng)變異:歸一化芯片的預(yù)處理和歸一化微陣列中系統(tǒng)誤差的幾種圖形呈現(xiàn)方式1. log2R與log2G散點(diǎn)圖芯片的預(yù)處理和歸一化2. MA散點(diǎn)圖芯片的預(yù)處理和歸一化3. 分組盒式圖芯片的預(yù)處理和歸一化 歸一化的依據(jù)在特性相似的情況下。生物體內(nèi)表達(dá)水平改變的基因只占全基因組非常小的一部分,來(lái)自于每個(gè)樣本大約相等的被標(biāo)記分子雜交覆蓋了全基因組大部分基因的芯片,從而對(duì)每個(gè)樣本,所有雜交點(diǎn)的雜交強(qiáng)度總合應(yīng)該是相等的 - 芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化 (within slide normalization) - 芯片間的數(shù)據(jù)標(biāo)準(zhǔn)化 (Cross slide normalizati
12、on) 芯片的預(yù)處理和歸一化用于歸一化的非差異表達(dá)基因的選擇歸一化的第一步是選擇非差異表達(dá)基因或不變表達(dá)基因- 全部基因- 管家基因- 對(duì)照芯片的預(yù)處理和歸一化芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(within slide normalization)芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化,主要是去除每張芯片的系統(tǒng)誤差,這種誤差主要是由熒光染色差異,點(diǎn)樣機(jī)器,或者雜交試驗(yàn)所產(chǎn)生的,通過(guò)標(biāo)準(zhǔn)化,使每個(gè)基因的表達(dá)點(diǎn)都具有獨(dú)立性。芯片內(nèi)數(shù)據(jù)標(biāo)準(zhǔn)化的常用方法是局部加權(quán)回歸分析:Lowess (LocallyWeighted Linear Regression) normalization 。芯片的預(yù)處理和歸一化標(biāo)準(zhǔn)化前后的散點(diǎn)圖左圖是未標(biāo)
13、準(zhǔn)化處理的散點(diǎn)圖右圖是經(jīng)LOWESS處理的散點(diǎn)圖任何芯片數(shù)據(jù)進(jìn)行分析前,都必須進(jìn)行數(shù)據(jù)的校正芯片的預(yù)處理和歸一化Log GreenLog RedNormalizationA=(Log Green+Log Red)/2M=Log Red-Log GreenM vs. A Plot (45o rotation)(Log Green+Log Red)/2Log Red-Log GreenLoess FitNormalized (Log Green+Log Red)/2Normalized Log Red-Log GreenM vs. A after NormalizationNormalized L
14、og GreenNormalized Log RedNormalized Data在點(diǎn)的周圍,考慮背景及兩色染色差異,均一化后來(lái)消除這種差異 芯片間的數(shù)據(jù)標(biāo)準(zhǔn)化(Cross slide normalization)平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)尺度調(diào)整的標(biāo)準(zhǔn)化 ( Scale Normalization)分位數(shù)標(biāo)準(zhǔn)化 (Quantile Normalization) 芯片的預(yù)處理和歸一化Between slides normalization芯片的預(yù)處理和歸一化平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)由于
15、五種組織(seeding、tiller、root、panicle1、panicle2)是分別在五張芯片上作雜交試驗(yàn)的,所以第一步的標(biāo)準(zhǔn)化是將五張?jiān)囼?yàn)芯片的數(shù)據(jù)調(diào)整到同一水平,常用的方法是平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)。即:將五組實(shí)驗(yàn)的數(shù)據(jù)的log ratio 中位數(shù)或平均數(shù)調(diào)整為0。芯片的預(yù)處理和歸一化Slide 2Cy3 Cy5Slide 1Cy3 Cy5medianQ3=75th percentileQ1=25th percentileminimummaximum上圖中的一個(gè)箱式圖表示基因在一種染色下的強(qiáng)度的分布情況。所以每?jī)蓚€(gè)channe
16、l對(duì)應(yīng)一張芯片的數(shù)據(jù)。圖中共有12個(gè)channel,分別對(duì)應(yīng)6張芯片數(shù)據(jù),且每一張芯片中包含的基因是相同的。上圖是雙色數(shù)據(jù)在標(biāo)化前的分布情況。 芯片的預(yù)處理和歸一化Log Mean Signal Centered at 0 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和均一化 差異表達(dá)基因分析 芯片數(shù)據(jù)的可靠性分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程基因表達(dá)譜芯片的主要目的之一:發(fā)現(xiàn)兩個(gè)樣本差異表達(dá)基因差異表達(dá)基因也可稱為陽(yáng)性基因:包括上調(diào)表達(dá)基因和下調(diào)表達(dá)基因差異表達(dá)基因的挑選非重復(fù)實(shí)驗(yàn)倍數(shù)法Z值法重復(fù)實(shí)驗(yàn)T檢驗(yàn)P值差異表達(dá)基因分析 倍數(shù)法取
17、樣本基因和參照基因的比(R/G ratio),作為每個(gè)樣本基因的相對(duì)表達(dá)量(relative intensity)。選擇相對(duì)表達(dá)量,可以在一定程度上減少芯片之間,熒光染色,掃描所產(chǎn)生的系統(tǒng)偏差Ratio=Ri/Gi 2 up regulation 0.5 down regulation差異表達(dá)基因分析基因表達(dá)模式mRNA Cy5/Cy3 = rtime / h150_Start of experimentup-regulationinductiondown-regulationrepression差異表達(dá)基因分析Log2( Red intensity / Green intensity)Rat
18、io= log2 (R/G) 時(shí)間T基因表達(dá)情況原始的比值數(shù)據(jù)Log2對(duì)數(shù)轉(zhuǎn)換0基因的標(biāo)準(zhǔn)表達(dá)1.00.01相對(duì)標(biāo)準(zhǔn)表達(dá)無(wú)改變1.00.02兩倍上調(diào)表達(dá)2.01.03兩倍下調(diào)表達(dá)0.5-1.0差異表達(dá)基因分析差異表達(dá)基因分析cDNA 基因表達(dá)實(shí)例 Data on G genes for n samplesGenesmRNA samplesGene expression level of gene i in mRNA sample j=(normalized) Log( Red intensity / Green intensity)sample1sample2sample3sample4sample5 1 0.46 0.30 0.80 1.51 0.90.2-0.10 0.49 0.24 0.06 0.46.3 0.15 0.74 0.04 0.10
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度文化旅游地產(chǎn)項(xiàng)目房屋及土地所有權(quán)轉(zhuǎn)讓協(xié)議
- 二零二五年度高校畢業(yè)生就業(yè)安置與就業(yè)服務(wù)保障合同
- 二零二五年度車庫(kù)購(gòu)置與車位共享運(yùn)營(yíng)協(xié)議
- 二零二五年度玉米種植補(bǔ)貼收購(gòu)合同
- 二零二五年度廉潔合作協(xié)議:公共資源交易項(xiàng)目監(jiān)管合同
- 二零二五年度飼料行業(yè)風(fēng)險(xiǎn)評(píng)估與保險(xiǎn)合同
- 二零二五年度旅游度假區(qū)招商代理專項(xiàng)協(xié)議
- 二零二五年度少兒教育講師聘用合同
- 二零二五年度高校離退休教師兼職返聘協(xié)議
- 二零二五年度瑜伽教練職業(yè)培訓(xùn)聘用協(xié)議
- 沖壓外圈滾針軸承安裝及檢驗(yàn)方法
- IQC來(lái)料檢驗(yàn)指導(dǎo)書
- 機(jī)電系統(tǒng)單機(jī)調(diào)試及聯(lián)動(dòng)調(diào)試方案
- h型鋼力學(xué)性能計(jì)算表
- 自明排課使用說(shuō)明
- 醫(yī)院安全巡查制度醫(yī)院安全巡查制度
- 骨化膿性骨髓炎的影像學(xué)診斷
- 臺(tái)灣姓氏拼音對(duì)照
- 轎車驅(qū)動(dòng)橋設(shè)計(jì)課程設(shè)計(jì),過(guò)程以及計(jì)算
- 套管柱及其強(qiáng)度設(shè)計(jì)ppt課件
- 三年級(jí)語(yǔ)文家長(zhǎng)會(huì)(課堂PPT)
評(píng)論
0/150
提交評(píng)論