生物信息學(xué)在基因芯片中的應(yīng)用_第1頁
生物信息學(xué)在基因芯片中的應(yīng)用_第2頁
生物信息學(xué)在基因芯片中的應(yīng)用_第3頁
生物信息學(xué)在基因芯片中的應(yīng)用_第4頁
生物信息學(xué)在基因芯片中的應(yīng)用_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章第八章 生物信息學(xué)在基因芯片生物信息學(xué)在基因芯片中的應(yīng)用中的應(yīng)用 生物信息學(xué)和基因芯片是生命科學(xué)研究領(lǐng)域中的兩種新方法和新技術(shù),生物信息學(xué)與基因芯片密切相關(guān),生物信息學(xué)促進(jìn)了基因芯片的研究與應(yīng)用,而基因芯片則豐富了生物信息學(xué)的研究內(nèi)容 第一節(jié) 概述概述、基因芯片簡介()基因芯片的基本原理及生物信息學(xué)的作用 基因芯片(gene chip),又稱dna微陣列(microarray),是由大量dna或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是通過雜交檢測信息。 基因芯片把大量已知序列探針集成在同一個(gè)基片上,經(jīng)過標(biāo)記的若干靶核酸序列通過與芯片特定位置上的探針雜交,便可根據(jù)堿基互補(bǔ)匹

2、配的原理確定靶基因的序列。 根據(jù)探針的類型和長度,基因芯片可分為兩類。 其中一類是較長的dna探針(100mer)芯片 這類芯片的探針往往是pcr的產(chǎn)物,通過點(diǎn)樣方法將探針固定在芯片上,主要用于rna的表達(dá)分析。 另一類是短的寡核苷酸探針芯片 其探針長度為25 mer左右,一般通過在片(原位)合成方法得到,這類芯片既可用于rna的表達(dá)監(jiān)控,也可以用于核酸序列分析。原理原理 - - 通過雜交檢測信息通過雜交檢測信息一組寡核苷酸探針tatgcaatctagcgttagatacgttagaatacgttagatctacgttag由雜交位置確定的一組核酸探針序列g(shù)ttagatc雜交探針組tatgcaa

3、tctag重組的互補(bǔ)序列靶序列tacgttagacgttagaatacgttacgttagatgttagatc atacgtta基因芯片熒光標(biāo)記的樣品 共聚焦顯微鏡獲取熒光圖象雜交結(jié)果分析探 針 設(shè) 計(jì)雜交()基因芯片制備 基因芯片的制備主要有兩種基本方法: 一是在片合成法, 在片合成法是基于組合化學(xué)的合成原理,它通過一組定位模板來決定基片表面上不同化學(xué)單體的偶聯(lián)位點(diǎn)和次序。在片合成法制備dna芯片的關(guān)鍵是高空間分辨率的模板定位技術(shù)和固相合成化學(xué)技術(shù)的精巧結(jié)合。 另一種方法是點(diǎn)樣法。 基因芯片點(diǎn)樣法首先按常規(guī)方法制備cdna(或寡核苷酸)探針庫,然后通過特殊的針頭和微噴頭, 分別把不同的探針溶

4、液,逐點(diǎn)分配在玻璃、尼龍或者其它固相基底表面上不同位點(diǎn),并通過物理和化學(xué)的結(jié)合使探針被固定于芯片的相應(yīng)位點(diǎn)。 ()靶基因樣品的制備及芯片雜交 根據(jù)基因芯片的檢測目的不同,可以把樣品制備方法分為 用于表達(dá)譜測量的mrna樣品制備 用于多態(tài)性(或突變)研究的基因樣品的制備()雜交信號(hào)檢測 對于用熒光素標(biāo)記經(jīng)擴(kuò)增(也可用其他放大技術(shù))的序列或樣品,與芯片上的探針進(jìn)行雜交,然后沖洗,采集熒光圖像。 圖像的采集用落射熒光顯微鏡 或電荷偶聯(lián)裝置照相機(jī) 非共聚焦激光掃描儀等進(jìn)行。 、基因芯片對于生物分子信息檢測的作用和意義 在生命科學(xué)領(lǐng)域中,基因芯片為分子生物學(xué)、生物醫(yī)學(xué)等研究提供了強(qiáng)有力的手段。 利用基因

5、芯片技術(shù),可研究生命體系中不同部位、不同生長發(fā)育階段的基因表達(dá),比較不同個(gè)體或物種之間的基因表達(dá),比較正常和疾病狀態(tài)下基因及其表達(dá)的差異。 基因芯片技術(shù)也有助于研究不同層次的多基因協(xié)同作用的生命過程,發(fā)現(xiàn)新的基因功能,研究生物體在進(jìn)化、發(fā)育、遺傳過程中的規(guī)律。、基因芯片研究和應(yīng)用中所涉及到的生物信息學(xué)問題提取什么信息提取什么信息如何提取信息如何提取信息如何處理和利用信息如何處理和利用信息確定芯片檢測目標(biāo)確定芯片檢測目標(biāo)芯片設(shè)計(jì)芯片設(shè)計(jì)數(shù)據(jù)管理與分析數(shù)據(jù)管理與分析探針設(shè)計(jì)探針設(shè)計(jì)解決雜交條件一解決雜交條件一致性問題致性問題芯片優(yōu)化芯片優(yōu)化提高芯片制備效提高芯片制備效率率公共公共 數(shù)據(jù)庫數(shù)據(jù)庫專用

6、專用 數(shù)據(jù)庫數(shù)據(jù)庫確定目標(biāo)確定目標(biāo)選擇待檢測的選擇待檢測的目標(biāo)序列目標(biāo)序列數(shù)據(jù)分析數(shù)據(jù)分析分析雜交檢測結(jié)分析雜交檢測結(jié)果及可靠性果及可靠性基因芯片基因芯片 數(shù)據(jù)庫數(shù)據(jù)庫圖像處理圖像處理數(shù)數(shù) 據(jù)據(jù) 庫庫 查查 詢詢 序序 列列 分分 析析生生 物物 信信 息息 學(xué)學(xué) 數(shù)數(shù) 據(jù)據(jù) 挖挖 掘掘 數(shù)數(shù) 據(jù)據(jù) 可可 視視 化化雜交雜交檢測檢測圖像圖像基因芯片數(shù)據(jù)流圖基因芯片數(shù)據(jù)流圖()生物信息學(xué)在基因芯片中的應(yīng)用 生物信息學(xué)在基因芯片中的應(yīng)用主要體現(xiàn)在三個(gè)方面: 確定芯片檢測目標(biāo) 芯片設(shè)計(jì) 實(shí)驗(yàn)數(shù)據(jù)管理與分析()基因芯片研究與應(yīng)用中所要解決的信息學(xué)問題 在基因芯片信息學(xué)方面要解決以下幾個(gè)關(guān)鍵的問題: 第

7、一是芯片設(shè)計(jì)問題 第二是可靠性分析問題 第三是數(shù)據(jù)挖掘問題 第二節(jié)第二節(jié) 基因芯片設(shè)計(jì)基因芯片設(shè)計(jì)、基因芯片設(shè)計(jì)的一般性原則 基因芯片設(shè)計(jì)主要包括兩個(gè)方面: (1)探針的設(shè)計(jì) 指如何選擇芯片上的探針 (2)探針在芯片上的布局 指如何將探針排布在芯片上。 確定芯片所要檢測的目標(biāo)對象確定芯片所要檢測的目標(biāo)對象 查詢生物分子數(shù)據(jù)庫查詢生物分子數(shù)據(jù)庫取得相應(yīng)的取得相應(yīng)的dnadna序列數(shù)據(jù)序列數(shù)據(jù) 序列對比分析序列對比分析找出特征序列,作為芯片設(shè)計(jì)的參照序列。找出特征序列,作為芯片設(shè)計(jì)的參照序列。 數(shù)據(jù)庫搜索數(shù)據(jù)庫搜索得到關(guān)于序列突變的信息及其它信息。得到關(guān)于序列突變的信息及其它信息。 在進(jìn)行探針設(shè)計(jì)

8、和布局時(shí)必須考慮以下在進(jìn)行探針設(shè)計(jì)和布局時(shí)必須考慮以下幾個(gè)方面:幾個(gè)方面: (1)互補(bǔ)性 (2)敏感性和特異性 (3)容錯(cuò)性 (4)可靠性 (5)可控性 (6)可讀性 、dna變異檢測型芯片與基因表達(dá)型芯片的設(shè)計(jì) 對于dna序列變異分析,最基本的要求是能夠檢測出發(fā)生變異的位置,進(jìn)一步的要求是能夠發(fā)現(xiàn)發(fā)生了什么樣的變化。 從雜交的單堿基錯(cuò)配辨別能力來看,當(dāng)錯(cuò)配出現(xiàn)在探針中心時(shí),辨別能力強(qiáng),而當(dāng)錯(cuò)配出現(xiàn)在探針兩端時(shí),辨別能力非常弱。所以,在設(shè)計(jì)檢測dna序列變異的探針時(shí),檢測變化點(diǎn)應(yīng)該對應(yīng)于探針的中心,以得到最大的分辨率。、cdnacdna芯片與寡核苷酸芯芯片與寡核苷酸芯片的設(shè)計(jì)片的設(shè)計(jì) cdna

9、芯片設(shè)計(jì)的關(guān)鍵在于數(shù)據(jù)庫的建立和數(shù)據(jù)庫信息的利用以及各種文庫的建立。 cdna芯片制備方法一般采用點(diǎn)樣法,多用于基因表達(dá)的監(jiān)控和分析。 寡核苷酸芯片制備一般采用在片合成方法。優(yōu)化是寡核苷酸芯片設(shè)計(jì)的一個(gè)重要環(huán)節(jié),包括探針的優(yōu)化和整個(gè)芯片設(shè)計(jì)結(jié)果的優(yōu)化。 、寡核苷酸探針的優(yōu)化設(shè)計(jì)、基因芯片布局雜雜 交交 模模 式式探探 針針 布布 局局 圖圖target t c c g t t a g c t g a c t g cagcttg變異、基因芯片布局基于tm值梯度場的布局方法 凸點(diǎn)均勻分布布局方法(a) (b)凸點(diǎn)均勻分布優(yōu)化結(jié)果示意凸點(diǎn)均勻分布優(yōu)化結(jié)果示意(a)(a)優(yōu)化前;優(yōu)化前; (b)(b)

10、優(yōu)化后。優(yōu)化后。、基因芯片優(yōu)化 高密度寡核苷酸芯片設(shè)計(jì)的結(jié)果是形成芯片合成方案和步驟,產(chǎn)生制作掩膜板的cad文件。高密度基因芯片制備的一個(gè)關(guān)鍵是掩膜板技術(shù),利用掩膜板進(jìn)行定位并控制探針的在片合成,從而得到很高的探針密度。 但是制作掩膜板的代價(jià)較高,為了盡可能地提高基因芯片制備效率,需要對設(shè)計(jì)好的基因芯片進(jìn)行優(yōu)化,以減少制備芯片所需要的掩膜板個(gè)數(shù),同時(shí)也減少芯片探針循環(huán)合成次數(shù),這對于基因芯片應(yīng)用有著重要的意義。第三節(jié)第三節(jié) 基于芯片的序列分析基于芯片的序列分析、測定未知序列 早期基于芯片雜交的序列分析實(shí)驗(yàn)中,芯片上的探針是長度為k(一般為8)的所有寡核苷酸的組合。這是一種完備的探針集合,根據(jù)互

11、補(bǔ)關(guān)系,通過各個(gè)探針的雜交結(jié)果確定dna靶序列中存在的所有k長度片段,形成靶序列的k長度片段譜,然后根據(jù)這些片段重構(gòu)靶序列。 、直接檢測目標(biāo)序列 在同一塊芯片上設(shè)計(jì)多組探針,每一組探針分別檢測一條目標(biāo)序列,探針的長度在20到30之間。一般要求同一組探針之間相互獨(dú)立,盡可能不重疊或少重疊,以提高探針的敏感性和特異性。、dna序列突變檢測分析有兩種方法可以進(jìn)行已知突變點(diǎn)的分析: 一種方法是對于目標(biāo)序列上已知的突變點(diǎn),以該點(diǎn)為中心,從目標(biāo)序列選取一個(gè)片段,作為設(shè)計(jì)探針的參考序列。根據(jù)參考序列,分別設(shè)計(jì)四個(gè)高度特異的探針,這四個(gè)探針除中心位置外均相同并與參考序列互補(bǔ) 另一種方法是對于目標(biāo)序列上已知的突

12、變點(diǎn),分別設(shè)計(jì)四組探針,其中每一組探針分別檢測一種核苷酸替換。同一組中的各個(gè)探針長度相同,相互之間交疊,并且每個(gè)探針均覆蓋對應(yīng)的突變點(diǎn)。、基因型和多態(tài)性分析 在同一物種不同種群和個(gè)體之間,有著多種不同的基因型,這往往與個(gè)體的不同性狀和多種遺傳性疾病有著密切的關(guān)系。通過對大量具有不同性狀的個(gè)體的基因型進(jìn)行比較,就可以得出基因與性狀的關(guān)系。 為了進(jìn)行snps研究,發(fā)現(xiàn)目標(biāo)序列上可能出現(xiàn)的變化,最直接的方法就是根據(jù)已知的目標(biāo)序列設(shè)計(jì)一系列寡核苷酸探針,其中每一個(gè)探針用于檢測目標(biāo)序列特定位置上的核苷酸是否發(fā)生變化,探察位置位于探針的中心。這種方法又稱等長等覆蓋移位法 第二種方法為單核苷酸分析法。針對目

13、標(biāo)序列每第二種方法為單核苷酸分析法。針對目標(biāo)序列每個(gè)位置上所有可能出現(xiàn)的變化設(shè)計(jì)相應(yīng)的探針。個(gè)位置上所有可能出現(xiàn)的變化設(shè)計(jì)相應(yīng)的探針。 第四節(jié)第四節(jié) 基于芯片的基因功能基于芯片的基因功能分析分析、基因表達(dá)分析 基因表達(dá)是根據(jù)基因的dna模板進(jìn)行mrna和蛋白質(zhì)合成的過程,各種基因的表達(dá)存在差異,一種組織中基因表達(dá)水平的差異可達(dá)1萬倍。功能基因研究的一種重要的方法就是采用高通量基因表達(dá)檢測技術(shù),全面分析基因的表達(dá)水平,了解基因的功能。 、高密度基因表達(dá)芯片、基因表達(dá)圖譜 基于芯片的表達(dá)監(jiān)控實(shí)驗(yàn)產(chǎn)生大量的數(shù)據(jù),在這些數(shù)據(jù)背后隱藏著豐富的基因相互作用、基因功能信息,需要通過細(xì)致的數(shù)據(jù)分析揭示這些信息

14、,得到有益的結(jié)果 這種根據(jù)基因芯片獲得的新的表達(dá)圖譜有別于以前的物理圖和功能圖,它能夠更為直接地揭示基因組中各基因相互關(guān)系。、尋找基因功能 derisi等應(yīng)用酵母cdna基因芯片研究在有絲分裂和孢子狀態(tài)下基因轉(zhuǎn)錄和表達(dá)水平的差異。 affymetrix公司制備的酵母基因表達(dá)型芯片,包括酵母基因組開放讀碼框中的260 000個(gè)25mer探針陣列。wodicka 等采用這種基因芯片對不同生活狀態(tài)下酵母細(xì)胞的基因表達(dá)進(jìn)行了研究。 第五節(jié)第五節(jié) 基因芯片檢測結(jié)果的基因芯片檢測結(jié)果的分析分析、熒光檢測圖像處理 基因芯片與樣本雜交以后,用圖像掃描儀器捕獲芯片上的熒光圖像。在計(jì)算機(jī)中,一幅圖像由二維象素點(diǎn)所

15、組成,通常用一個(gè)8-bit的整數(shù)存貯象素點(diǎn)的灰度值,取值范圍為0,255,其中0代表“黑”,255代表“白”。 一個(gè)理想的基因芯片圖像具有以下幾個(gè)性質(zhì): (1)芯片單元的形狀和尺寸相同; (2)每個(gè)單元的中心位于象素點(diǎn)上; (3)無灰塵等引起的噪聲信號(hào); (4)最小和均勻的圖像背景強(qiáng)度。 圖象預(yù)處理圖象預(yù)處理網(wǎng)格定位網(wǎng)格定位背景濾除背景濾除熒光信號(hào)提取熒光信號(hào)提取歸一化處理歸一化處理網(wǎng)格定位結(jié)果1234gt010203040506070gcta背景區(qū)域背景濾除熒光信號(hào)提取、檢測結(jié)果分析 如果芯片檢測的目的是測定樣本序列,則需要根據(jù)芯片上每個(gè)探針的雜交結(jié)果判斷樣本中是否含有對應(yīng)的互補(bǔ)序列片段,并

16、利用生物信息學(xué)中的片段組裝算法連接各個(gè)片段,形成更長的目標(biāo)序列。 如果芯片檢測的目的是進(jìn)行序列變異分析,則要根據(jù)全匹配探針以及錯(cuò)配探針在基因芯片對應(yīng)位置上的熒光信號(hào)強(qiáng)度,給出序列變化的位點(diǎn),并指明發(fā)生什么變化。 如果芯片檢測的目的是進(jìn)行基因表達(dá)分析,則需要給出芯片上各個(gè)基因的表達(dá)圖譜,定量描述基因的表達(dá)水平,進(jìn)一步的分析還包括根據(jù)基因表達(dá)模式進(jìn)行聚類,尋找基因之間的相關(guān)性,發(fā)現(xiàn)協(xié)同工作的基因、檢測結(jié)果可靠性分析可靠性分析可以從兩個(gè)方面進(jìn)行: 一是根據(jù)實(shí)驗(yàn)統(tǒng)計(jì)誤差(如探針合成的錯(cuò)誤率、全匹配探針與錯(cuò)配探針的誤識(shí)率等),計(jì)算出基因芯片最終實(shí)驗(yàn)結(jié)果的可靠性。 二是對基因芯片與樣本序列雜交過程進(jìn)行分子動(dòng)力學(xué)研究,建立芯片雜交過程的計(jì)算機(jī)仿真實(shí)驗(yàn)?zāi)P?,以便在制作芯片之前分析所設(shè)計(jì)芯片的性能,預(yù)測芯片實(shí)驗(yàn)結(jié)果的可靠性。、數(shù)據(jù)分析 基因芯片數(shù)據(jù)分析包括實(shí)驗(yàn)數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)處理等 進(jìn)一步將基因芯片實(shí)驗(yàn)數(shù)據(jù)與公共數(shù)據(jù)庫中的信息相關(guān)聯(lián),利用數(shù)據(jù)挖掘方法進(jìn)行分析處理,揭示各種數(shù)據(jù)之間的關(guān)系,發(fā)現(xiàn)新的生物學(xué)知識(shí)。第六節(jié)第六節(jié) 基因芯片信息的管理基因芯片信息的管理和利用和利用、芯片信息管理 目

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論