版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、張彥婷鄭州大學(xué)生命科學(xué)學(xué)院基因芯片數(shù)據(jù)處理基因芯片(gene chip),又稱DNA微陣列(DNA microarray),就是將大量已知DNA探針整齊、高密度地固定在一塊類似郵票大小的固體(如玻璃片、硅片或尼龍布等)支持物上;用標(biāo)記好的核酸樣品進(jìn)行雜交,進(jìn)而通過檢測雜交后標(biāo)記信號的強(qiáng)弱來判斷樣品中與探針對應(yīng)的靶序列是否存在,數(shù)量。基因芯片的基本原理: 堿基互補(bǔ)匹配?;蛐酒?因 芯 片 流 程樣品制備芯片制備雜交雜交信號檢測數(shù)據(jù)分析 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和歸一化差異表達(dá)基因分析芯片數(shù)據(jù)的可靠性分析基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因
2、芯 片 流 程 雜交反應(yīng)封閉:對芯片進(jìn)行封閉以降低雜交背景雜交:將已標(biāo)記的靶分子加樣到芯片上,使其在特定溫度下與互補(bǔ)序列退火洗滌:洗滌芯片除去未結(jié)合或微弱結(jié)合的雜交分子芯片雜交 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和歸一化 芯片數(shù)據(jù)的可靠性分析 差異表達(dá)基因分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程 數(shù)據(jù)獲取掃描信號點(diǎn)定位數(shù)據(jù)提取是指將與目標(biāo)靶分子反應(yīng)結(jié)合后的生物芯片上成千上萬個點(diǎn)陣的生物反應(yīng)結(jié)果閱讀出來,轉(zhuǎn)變成可供計(jì)算機(jī)處理的數(shù)據(jù),包括三個步驟:基因芯片圖像的獲取和處理Cy3和Cy5Cy3激發(fā)波長532nmCy5激發(fā)波長635nm基因芯
3、片圖像的獲取和處理芯片掃描儀與熒光標(biāo)記的目標(biāo)DNA雜交后,必須用掃讀裝置將芯片測定結(jié)果轉(zhuǎn)變成可供分析處理的圖象數(shù)據(jù)。目前商品化的芯片掃描儀有2類:激光共聚焦芯片掃描儀和CCD芯片掃描儀。根據(jù)芯片掃描儀采用的光電耦合器件可分為2類:光電倍增管型和CCD型。根據(jù)激發(fā)光源的不同還可分為:激光型和非激光型?;蛐酒瑘D像的獲取和處理激光共聚焦顯微鏡的原理, 是基于PMT(photomultiplier tube,光電倍增管)的檢測系統(tǒng);CCD(charge-coupled devices,電荷偶合裝置)攝像原理檢測光子。 前者檢測靈敏度、分辨率均較高,但掃描時間長;后者掃描時間短,但靈敏度和分辨率不如前
4、者。基因芯片圖像的獲取和處理激光共聚焦芯片掃描儀以激光作為激發(fā)光源,以產(chǎn)生較高強(qiáng)度的發(fā)射熒光,可大大提高檢測的靈敏度,一般采用2種或2種以上不同波長的激光器作為激發(fā)光源。用光電倍增管檢測,有較高的靈敏度。Genetic microsystems 公司的GMS 418 Array Scanner. 價(jià)格820萬美元。CCD采用高壓汞燈作為激發(fā)光源,結(jié)構(gòu)比較簡單。Genemic Solutions 公司Gene Tac TM 1000等。價(jià)格比較便宜,在5萬美元左右。CCD一次可成像很大面積的區(qū)域,而以PMT為基礎(chǔ)的熒光掃描儀則是以單束固定波長的激光來掃描,因此或者需要激光頭,或者需要目的芯片的機(jī)
5、械運(yùn)動來使激光掃到整個面積,這樣就需要耗費(fèi)較多的時間來掃描;但是CCD有其缺點(diǎn):目前性能最優(yōu)越的CCD數(shù)字相機(jī)的成像面積只有1612mm(像素為10m),因此要達(dá)到整個芯片的面積2060mm的話,需要數(shù)個數(shù)碼相機(jī)同時工作,或者也可以以降低分辨率為代價(jià)來獲得掃描精度不是很高的圖像。由于靈敏度和分辯率較低,比較適合臨床診斷用。基因芯片圖像的獲取和處理LaserPMTDyeGlass SlideObjective LensDetector lensPinholeBeam-splitter光電倍增管/激光共聚焦掃描基因芯片圖像的獲取和處理激光共聚焦的光路原理基因芯片圖像的獲取和處理激光共聚焦的光探測器
6、檢測熒光光子,并把微弱的熒光信號轉(zhuǎn)變?yōu)槟M的電信號基因芯片圖像的獲取和處理CCD成像技術(shù):主要用于中、高密度基因芯片的檢測CCD掃描儀掃描儀的技術(shù)指標(biāo): 噪音與信噪比 靈敏度與動態(tài)檢測范圍 像素與分辨率基因芯片圖像的獲取和處理 同時掃描與分次掃描一次掃描得到一種熒光圖像(單通道),掃描多次得到多個熒光圖像,叫作分次掃描。得到的圖像需要用軟件對幾種熒光圖像進(jìn)行重疊對準(zhǔn)處理,有時還需要操作者手工重疊對準(zhǔn)干預(yù)。一次掃描得到多個熒光圖像(多通道)叫作同時掃描。圖像重疊簡單僅需用軟件將多個圖像疊加,不需要調(diào)準(zhǔn)值。 同時掃描需要硬件的增加?;蛐酒瑘D像的獲取和處理基因芯片圖像的獲取和處理 生物芯片掃描過程
7、中應(yīng)注意的問題由于芯片掃描儀有極高的靈敏度和分辨率,在芯片制作、雜交和清洗過程中都應(yīng)該在潔凈的環(huán)境中進(jìn)行芯片完成雜交和清洗后應(yīng)盡可能立即掃描測定,防止熒光標(biāo)記靶分子降解儀器放置在平穩(wěn)堅(jiān)固的平臺上?;蛐酒瑘D像的獲取和處理植根區(qū)域生長法(SRG) Fixed Circle劃格或定位:圖像內(nèi)信號點(diǎn)的初步定位圖象分割 (Segmentation):將點(diǎn)從背景中分離出來在分割過程中將像素強(qiáng)度從界定區(qū)域提取出來信號點(diǎn)定位基因芯片圖像的獲取和處理基因芯片圖像的獲取和處理數(shù)據(jù)提取將芯片圖像中的各種數(shù)值量化,如信號值、背景值等每個像素的灰度值在0-65535之間 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處
8、理和歸一化 芯片數(shù)據(jù)的可靠性分析 差異表達(dá)基因分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程Tiff圖像文件是生物芯片實(shí)驗(yàn)數(shù)據(jù)的最初載體圖像處理分析軟件能讀取Tiff圖像文件,自動定位并識別芯片上每個點(diǎn)。定量各點(diǎn)的背景,信號強(qiáng)度。計(jì)算點(diǎn)的質(zhì)量測定值,將圖像轉(zhuǎn)化為原始數(shù)據(jù)原始數(shù)據(jù)不能直接用于下游統(tǒng)計(jì)學(xué)分析和數(shù)據(jù)聚類分析需要經(jīng)過預(yù)處理 數(shù)據(jù)預(yù)處理芯片的預(yù)處理和歸一化原始數(shù)據(jù)的預(yù)處理可分為如下幾個步驟 : 背景校正; 缺失值處理; 數(shù)據(jù)過濾和標(biāo)記; 數(shù)據(jù)轉(zhuǎn)換 歸一化 芯片的預(yù)處理和歸一化1. 背景校正 背景校正用于雜交點(diǎn)相對于前景信號強(qiáng)度的背景噪音進(jìn)行調(diào)整 加
9、和性背景校正:通常,該點(diǎn)的相對信號強(qiáng)度即為其絕對表達(dá)值和相對背景值的差值芯片的預(yù)處理和歸一化芯片背景芯片的預(yù)處理和歸一化校正方法局部背景校正(local background correction)亞柵格背景校正(subgrid background correction)分組背景校正(group background correction)空白點(diǎn)背景校正(blank background correction)2. 缺失值處理 當(dāng)點(diǎn)為空點(diǎn)或相對背景強(qiáng)度高于絕對信號強(qiáng)度時,該點(diǎn)的數(shù)據(jù)出現(xiàn)缺失 替代方案: 使用重復(fù)點(diǎn)數(shù)據(jù)填充利用基因間的相關(guān)性進(jìn)行填充K最近鄰法芯片的預(yù)處理和歸一化3. 數(shù)據(jù)過濾和
10、標(biāo)記數(shù)據(jù)標(biāo)記是對不可信或不可靠的數(shù)據(jù)作標(biāo)記有兩種方法處理標(biāo)記后的數(shù)據(jù): -過濾且去除 -標(biāo)記但不去除芯片的預(yù)處理和歸一化4. 數(shù)據(jù)轉(zhuǎn)換 圖像分析軟件提取的基本數(shù)據(jù)為像素的熒光強(qiáng)度值,而在后續(xù)的分析中通常使用熒光強(qiáng)度的對數(shù)值生物學(xué)上易于理解和解釋使數(shù)據(jù)的分布滿足對稱性和近似正態(tài)分布、滿足常用統(tǒng)計(jì)分析方法。使用的方便性芯片的預(yù)處理和歸一化5. 歸一化(normalization)處理由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡,需對cy3和cy5的原始提取信號進(jìn)行均衡和修正才能進(jìn)一步分析實(shí)驗(yàn)數(shù)據(jù),Normalization正是基于此種目的。測量到的Cy3和Cy5的熒光強(qiáng)度受許多因素的影響,造成測量值
11、的變異: - 隨機(jī)變異:無法控制 - 系統(tǒng)變異:歸一化芯片的預(yù)處理和歸一化微陣列中系統(tǒng)誤差的幾種圖形呈現(xiàn)方式1. log2R與log2G散點(diǎn)圖芯片的預(yù)處理和歸一化2. MA散點(diǎn)圖芯片的預(yù)處理和歸一化3. 分組盒式圖芯片的預(yù)處理和歸一化 歸一化的依據(jù)在特性相似的情況下。生物體內(nèi)表達(dá)水平改變的基因只占全基因組非常小的一部分,來自于每個樣本大約相等的被標(biāo)記分子雜交覆蓋了全基因組大部分基因的芯片,從而對每個樣本,所有雜交點(diǎn)的雜交強(qiáng)度總合應(yīng)該是相等的 - 芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化 (within slide normalization) - 芯片間的數(shù)據(jù)標(biāo)準(zhǔn)化 (Cross slide normalizati
12、on) 芯片的預(yù)處理和歸一化用于歸一化的非差異表達(dá)基因的選擇歸一化的第一步是選擇非差異表達(dá)基因或不變表達(dá)基因- 全部基因- 管家基因- 對照芯片的預(yù)處理和歸一化芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(within slide normalization)芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化,主要是去除每張芯片的系統(tǒng)誤差,這種誤差主要是由熒光染色差異,點(diǎn)樣機(jī)器,或者雜交試驗(yàn)所產(chǎn)生的,通過標(biāo)準(zhǔn)化,使每個基因的表達(dá)點(diǎn)都具有獨(dú)立性。芯片內(nèi)數(shù)據(jù)標(biāo)準(zhǔn)化的常用方法是局部加權(quán)回歸分析:Lowess (LocallyWeighted Linear Regression) normalization 。芯片的預(yù)處理和歸一化標(biāo)準(zhǔn)化前后的散點(diǎn)圖左圖是未標(biāo)
13、準(zhǔn)化處理的散點(diǎn)圖右圖是經(jīng)LOWESS處理的散點(diǎn)圖任何芯片數(shù)據(jù)進(jìn)行分析前,都必須進(jìn)行數(shù)據(jù)的校正芯片的預(yù)處理和歸一化Log GreenLog RedNormalizationA=(Log Green+Log Red)/2M=Log Red-Log GreenM vs. A Plot (45o rotation)(Log Green+Log Red)/2Log Red-Log GreenLoess FitNormalized (Log Green+Log Red)/2Normalized Log Red-Log GreenM vs. A after NormalizationNormalized L
14、og GreenNormalized Log RedNormalized Data在點(diǎn)的周圍,考慮背景及兩色染色差異,均一化后來消除這種差異 芯片間的數(shù)據(jù)標(biāo)準(zhǔn)化(Cross slide normalization)平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)尺度調(diào)整的標(biāo)準(zhǔn)化 ( Scale Normalization)分位數(shù)標(biāo)準(zhǔn)化 (Quantile Normalization) 芯片的預(yù)處理和歸一化Between slides normalization芯片的預(yù)處理和歸一化平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)由于
15、五種組織(seeding、tiller、root、panicle1、panicle2)是分別在五張芯片上作雜交試驗(yàn)的,所以第一步的標(biāo)準(zhǔn)化是將五張?jiān)囼?yàn)芯片的數(shù)據(jù)調(diào)整到同一水平,常用的方法是平均數(shù)、中位數(shù)標(biāo)準(zhǔn)化(mean or median normalization)。即:將五組實(shí)驗(yàn)的數(shù)據(jù)的log ratio 中位數(shù)或平均數(shù)調(diào)整為0。芯片的預(yù)處理和歸一化Slide 2Cy3 Cy5Slide 1Cy3 Cy5medianQ3=75th percentileQ1=25th percentileminimummaximum上圖中的一個箱式圖表示基因在一種染色下的強(qiáng)度的分布情況。所以每兩個channe
16、l對應(yīng)一張芯片的數(shù)據(jù)。圖中共有12個channel,分別對應(yīng)6張芯片數(shù)據(jù),且每一張芯片中包含的基因是相同的。上圖是雙色數(shù)據(jù)在標(biāo)化前的分布情況。 芯片的預(yù)處理和歸一化Log Mean Signal Centered at 0 芯片雜交 基因芯片圖像的獲取和處理 數(shù)據(jù)的預(yù)處理和均一化 差異表達(dá)基因分析 芯片數(shù)據(jù)的可靠性分析 基因聚類和可視化分析 基因注釋和功能分析 基因調(diào)控網(wǎng)絡(luò)分析基 因 芯 片 流 程基因表達(dá)譜芯片的主要目的之一:發(fā)現(xiàn)兩個樣本差異表達(dá)基因差異表達(dá)基因也可稱為陽性基因:包括上調(diào)表達(dá)基因和下調(diào)表達(dá)基因差異表達(dá)基因的挑選非重復(fù)實(shí)驗(yàn)倍數(shù)法Z值法重復(fù)實(shí)驗(yàn)T檢驗(yàn)P值差異表達(dá)基因分析 倍數(shù)法取
17、樣本基因和參照基因的比(R/G ratio),作為每個樣本基因的相對表達(dá)量(relative intensity)。選擇相對表達(dá)量,可以在一定程度上減少芯片之間,熒光染色,掃描所產(chǎn)生的系統(tǒng)偏差Ratio=Ri/Gi 2 up regulation 0.5 down regulation差異表達(dá)基因分析基因表達(dá)模式mRNA Cy5/Cy3 = rtime / h150_Start of experimentup-regulationinductiondown-regulationrepression差異表達(dá)基因分析Log2( Red intensity / Green intensity)Rat
18、io= log2 (R/G) 時間T基因表達(dá)情況原始的比值數(shù)據(jù)Log2對數(shù)轉(zhuǎn)換0基因的標(biāo)準(zhǔn)表達(dá)1.00.01相對標(biāo)準(zhǔn)表達(dá)無改變1.00.02兩倍上調(diào)表達(dá)2.01.03兩倍下調(diào)表達(dá)0.5-1.0差異表達(dá)基因分析差異表達(dá)基因分析cDNA 基因表達(dá)實(shí)例 Data on G genes for n samplesGenesmRNA samplesGene expression level of gene i in mRNA sample j=(normalized) Log( Red intensity / Green intensity)sample1sample2sample3sample4sample5 1 0.46 0.30 0.80 1.51 0.90.2-0.10 0.49 0.24 0.06 0.46.3 0.15 0.74 0.04 0.10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)營公司企業(yè)年度工作計(jì)劃
- 小學(xué)六年級期中考試復(fù)習(xí)計(jì)劃
- 加油站201年下半年工作計(jì)劃
- 防疫及衛(wèi)生協(xié)管工作計(jì)劃
- 教師信息技術(shù)校本研修工作計(jì)劃范文
- 2025學(xué)年數(shù)學(xué)備課組工作計(jì)劃
- 《水處理技術(shù)介紹》課件
- 《大吸收波長的計(jì)算》課件
- 《EXO成員總介紹》課件
- 《外盤期貨介紹》課件
- 2024年全國國家版圖知識競賽題庫及答案(中小學(xué)組)
- (正式版)JTT 1218.5-2024 城市軌道交通運(yùn)營設(shè)備維修與更新技術(shù)規(guī)范 第5部分:通信
- 元宇宙技術(shù)與應(yīng)用智慧樹知到期末考試答案章節(jié)答案2024年中國科學(xué)技術(shù)大學(xué)
- XX鄉(xiāng)村建設(shè)投資集團(tuán)有限公司組建方案
- 客運(yùn)車輛冬季安全培訓(xùn)
- 電大財(cái)務(wù)大數(shù)據(jù)分析編程作業(yè)4
- 新中國史智慧樹知到期末考試答案2024年
- 揭開人際吸引的奧秘 心理健康七年級全一冊
- 景觀生態(tài)學(xué)基礎(chǔ)智慧樹知到期末考試答案2024年
- 項(xiàng)目用地報(bào)批知識講座
- 2025屆高三英語一輪復(fù)習(xí)讀后續(xù)寫微技能之無靈主語
評論
0/150
提交評論