




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1.什么是生物信息學(xué),如何理解其含義?答:生物信息學(xué)有三個方面的含義:1) 生物信息學(xué)是一個學(xué)科領(lǐng)域,包含著基因組信息的獲取、處理、存儲、分配 、分析和解釋的所有方面。2) 生物信息學(xué)是把基因組DNA序列信息分析作為源頭,破譯隱藏在DNA序列中的遺傳語言,特別是非編碼區(qū)的實質(zhì);同時在發(fā)現(xiàn)了新基因信息之后進行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測;其本質(zhì)是識別基因信號。3) 生物信息學(xué)的研究目標是揭示“基因組信息結(jié)構(gòu)的復(fù)雜性及遺傳語言的根本規(guī)律”。它是當今自然科學(xué)和技術(shù)科學(xué)領(lǐng)域中“基因組、“信息結(jié)構(gòu)”和“復(fù)雜性”這三個重大科學(xué)問題的有機結(jié)合。怎樣理解生物信息學(xué):生物信息學(xué)是把基因組DNA序列信息分析作為源頭,
2、找到基因組序列中代表蛋白質(zhì)和RNA基因的編碼區(qū);同時闡明基因組中大量存在的非編碼區(qū)的信息實質(zhì),破譯隱藏在DNA序列中的遺傳語言規(guī)律:在此基礎(chǔ)上,歸納、整理與基因組遺傳信息釋放及其調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白譜數(shù)據(jù),從而認識代謝、發(fā)育、分化、進化的規(guī)律。其還利用基因組中編碼區(qū)信息進行蛋白空間結(jié)構(gòu)模擬和蛋白功能預(yù)測,并將此類信息與生物體和生命過程中的生理生化信息結(jié)合,闡明其分子機制,最終進行蛋白、核酸分子設(shè)計、藥物設(shè)計、個體化醫(yī)療保健設(shè)計。2.如何利用數(shù)據(jù)庫信息發(fā)現(xiàn)新基因,基本原理?答:利用數(shù)據(jù)庫資源發(fā)現(xiàn)新基因,根據(jù)數(shù)據(jù)源不同,可分2種不同的查找方式:1) 從大規(guī)?;蚪M測序得到的數(shù)據(jù)出發(fā),經(jīng)過基因識別
3、發(fā)現(xiàn)新基因:利用大規(guī)模拼接好的基因組,使用不同數(shù)據(jù)方法,進行標識查找,并將找到的可能的新基因同數(shù)據(jù)庫中已有的基因?qū)Ρ龋瑥亩_定是否為新基因??煞譃椋夯谛盘?,如剪切位點、序列中的啟動子與終止子等?;诮M分,即基因家族、特殊序列間比較,Complexity analysis,Neural Network2) 利用EST數(shù)據(jù)庫發(fā)現(xiàn)新基因和新SNPs:數(shù)據(jù)來源于大量的序列小片段,EST較短,故關(guān)鍵在正確拼接。方法有基因組序列比對、拼接、組裝法等。經(jīng)常采用SiClone策略。其主要步驟有:構(gòu)建數(shù)據(jù)庫;將序列純化格式標準化;從種子庫中取序列和大庫序列比對;延長種子序列,至不能再延長;放入contig庫構(gòu)
4、建若干數(shù)據(jù)庫:總的純化的EST數(shù)據(jù)庫,種子數(shù)據(jù)庫,載體數(shù)據(jù)庫,雜質(zhì)、引物數(shù)據(jù)庫,蛋白數(shù)據(jù)庫,cDNA數(shù)據(jù)庫;用所用種子數(shù)據(jù)庫和雜質(zhì)、引物數(shù)據(jù)庫及載體數(shù)據(jù)庫比對,去除雜質(zhì);用種子和純化的EST數(shù)據(jù)庫比對用經(jīng)過一次比對得到的長的片段和蛋白數(shù)據(jù)庫、cDNA數(shù)據(jù)庫比較,判斷是否為已有序列,再利用該大片段與純化的EST數(shù)據(jù)庫比對,重復(fù)以上步驟,直到序列不能再延伸;判斷是否為全長cDNA序列。(利用EST數(shù)據(jù)庫:原理:當測序獲得一條EST序列時,它來自哪一個基因的哪個區(qū)域是未知的(隨機的),所以屬于同一個基因的不同EST序列之間常有交疊的區(qū)域。根據(jù)這種“交疊”現(xiàn)象,就能找出屬于同一個基因的所有EST序列,
5、進而將它們拼接成和完整基因相對應(yīng)的全長cDNA序列。而到目前為止,公共EST數(shù)據(jù)庫(dbEST)中已經(jīng)收集到約800萬條的人的EST序列。估計這些序列已覆蓋了人類全部基因的95%以上,平均起來每個基因有10倍以上的覆蓋率。)3.用蛋白或核酸序列數(shù)據(jù)庫研究生物演化的主要步驟是什么?當前的困難是什么,如何克服?答:構(gòu)建系統(tǒng)進化樹,其主要步驟如下:1) 序列相似性比較。就是將待研究序列與DNA或蛋白質(zhì)序列庫進行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等;2) 序列同源性分析。是將待研究序列加入
6、到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關(guān)鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等;3) 構(gòu)建系統(tǒng)進化樹。根據(jù)序列同源性分析的結(jié)果,重建反映物種間進化關(guān)系的進化樹。為完成這一工作已發(fā)展了多種軟件包,如PYLIP、MEGA等;4) 穩(wěn)定性檢驗。為了檢驗構(gòu)建好的進化樹的可靠性,需要進行統(tǒng)計可靠性檢驗,通常構(gòu)建過程要隨機地進行成百上千次,只有以大概率(70以上)出現(xiàn)的分支點才是可靠的。通用的方法使用 Bootstrap算法。當前的主要困難是發(fā)現(xiàn)了基因的橫向遷移(LGT)現(xiàn)象,即進化程度不同
7、的物種間存在著遺傳信息基因的傳遞,如果拿遷移的基因做進化分析就會出錯??朔﨤GT的方法:1) 選擇垂直進化而來的序列進行研究,即去除橫向遷移的數(shù)據(jù)庫,如COG數(shù)據(jù)庫;2) 使用全基因組數(shù)據(jù)庫進行基因組水平上的對比;利用生物體的蛋白質(zhì)組構(gòu)建進化樹。選取特征對比,不同長度的序列字符串進行對比后,對照其genome進行歸一化;ORF對比,將all predicted ORF采用COG的分類規(guī)則進行分類,再構(gòu)建進化樹4.什么是SNP,為什么SNP的研究是重要的,舉出23個SNP相關(guān)的網(wǎng)站。答:SNP是指單核苷酸多態(tài)性,代表了基因組水平上遺傳密碼的變異,由于這種變異很多以單堿基突變的形式出現(xiàn),因此稱為單
8、核苷酸多態(tài)性;因為SNP研究是基因組領(lǐng)域理論成果走向應(yīng)用的關(guān)鍵步驟,是聯(lián)系基因型和表現(xiàn)型之間關(guān)系的橋梁,是研究人類基因組計劃走向應(yīng)用的重要步驟。SNP相關(guān)的一些網(wǎng)站:1) SNP Consortium's database(/index.html)2) NCBI SNP database將這些數(shù)據(jù)進行整理,去掉冗余,使每個SNP都是唯一的。此時的SNP被稱為reference SNP或refSNP。((/SNP/overview.html) 3) The Human Genic Bi-Allelic
9、 Sequences Database(HGBASE) 這一數(shù)據(jù)庫收錄了人基因組中所有已知的序列變化,包括:SNPs、序列的插入和缺失(Indels)、簡單重復(fù)序列等。(http:/hgbase.cgr.ki.se/)4) The Human Gene Mutation Database(HGMD)(/) 5) The Protein Mutant Database(PMD),蛋白突變數(shù)據(jù)庫。收錄了蛋白質(zhì)特定位點的氨基酸突變信息,以及這些突變對蛋白質(zhì)結(jié)構(gòu)功能的影響。(http:/pmd.ddbj.nig.ac.jp/)6) The Allele Freque
10、ncy Database(ALFRED):人類群體等位基因頻率數(shù)據(jù)庫,/alfred/index.asp5. 什么是系統(tǒng)生物學(xué)?系統(tǒng)生物學(xué)對生命科學(xué)概念上的發(fā)展?答:系統(tǒng)生物學(xué)是指在系統(tǒng)的層面上研究生命活動。(研究一個生物系統(tǒng)中所有組成成分的構(gòu)成,以及特定條件下組分間互作關(guān)系。)包含三個相互銜接的組成:整合數(shù)據(jù),即整合所有各個層次(DNA水平,RNA水平,蛋白質(zhì)水平,蛋白質(zhì)相互作用水平)的信息數(shù)據(jù);系統(tǒng)建模,即用這些信息構(gòu)建描繪生命活動的數(shù)學(xué)模型;預(yù)測未知,即用這個模型預(yù)測生命未來的發(fā)展及外界干擾后系統(tǒng)的變異。概念上的發(fā)展主要有:1) 研究思路
11、的變化:傳統(tǒng)的分子生物學(xué)研究步驟一般為:DNA序列蛋白結(jié)構(gòu)蛋白功能(一維),而系統(tǒng)生物學(xué)是在二維的角度研究生命科學(xué),即:相互作用網(wǎng)絡(luò)功能,是由一組基因產(chǎn)生并相互作用共同實現(xiàn)的。2) 看待生命活動本質(zhì)的變化:因為沒有一個生命活動是靠一個基因完成的,生命活動是一組基因相互作用實現(xiàn)的,這種相互作用形成一個網(wǎng)絡(luò),既包括每個單元的結(jié)構(gòu),又包括單元與單元之間的相互作用。因此,系統(tǒng)生物學(xué)不僅考慮每個基因的活動,還描述了基因間的相互作用并導(dǎo)致了網(wǎng)絡(luò)的產(chǎn)生。6.(1)什么是非編碼序列,非編碼RNA,非編碼基因?(2)以人的基因組為例回答:在基因組中有多少非編碼序列,有多少存在轉(zhuǎn)錄本,舉23個非編碼核酸的生物學(xué)功
12、能?答:(1)非編碼序列是基因組中不編碼蛋白質(zhì)和多肽的序列;非編碼RNA是基因組中非編碼序列的轉(zhuǎn)錄產(chǎn)物/轉(zhuǎn)錄本;功能性的非編碼RNA對應(yīng)基因組上的位置稱為非編碼基因;(2)人類基因組中9798%的序列是非編碼序列,有70%80%存在轉(zhuǎn)錄本,非編碼核酸的生物學(xué)功能:1) Xist:X-inactivation(X染色體失活)是哺乳動物的一種劑量補償機制,其中一半拷貝轉(zhuǎn)錄被抑制從而失活,抑制轉(zhuǎn)錄是通過一個2kb的非編碼RNA(Xist RNA)實現(xiàn)的,xist RNA裝配在失活X染色體的外側(cè),引起結(jié)構(gòu)改變導(dǎo)致失活;2) Small RNA and RNAi: RNAi是由RNA(siRNA、mic
13、roRNA)導(dǎo)致的轉(zhuǎn)錄后基因沉默現(xiàn)象,如由雙鏈小RNA引起的干擾和轉(zhuǎn)錄后基因沉默現(xiàn)象,在植物病毒抗性和線蟲中的轉(zhuǎn)座子沉默;一些小核RNA調(diào)控基因轉(zhuǎn)錄。(單鏈易降解,但發(fā)現(xiàn)細胞中存在另一種pathway,雙鏈小RNA進入細胞后結(jié)合組蛋白形成復(fù)合體,該復(fù)合體和識別并降解target)3) piRNA(具有大量轉(zhuǎn)錄本,功能不詳)和Prions(生物復(fù)雜度到一定程度后會出現(xiàn)發(fā)病情況,可能和非編碼RNA有關(guān))等。1.芯片間標準化的方法:基本方法:芯片間標準化的目的是基于Gene1Gene5五個基因表達量理論的和應(yīng)該保持恒定,即S1S3三列每一列的和是相等的。但實際測定過程中不可能完全相等,因此將這種不等
14、歸結(jié)于每一組芯片自身的差異而進行芯片間標準化,基本步驟為通過排序取平均重新排序的方法消除芯片間誤差,從而可以得到每一組基因表達量的真實值。(老師給的這組芯片基因完全相同的情況下S3一列數(shù)據(jù)明顯偏高,通過這種標準化實現(xiàn)了芯片間差異的消除)。2. FDR控制假陽性的方法BenjaminiHochberg procedure基本方法:對于m個獨立的樣本,其p-value記為pi,i=1,2,3m;(1)對所有的p-value進行從小到大排序p(1)p(2) p(m);(2)對于一個給定的(此時的即為統(tǒng)計里的顯著水平,范圍01,通常取0.05),找到最大的k值,滿足p(k)km;(3)拒絕從p(1)p
15、(k)的無效假設(shè)H0(即表示p(1)p(k)表達量存在顯著差異)。計算方法1(=0.05):P(4)=0.03<0.05*4/6=0.033;P(5)=0.045>0.05*5/6=0.041;k=4. 即G2, G6, G5, G4差異表達,F(xiàn)DR<0.05計算方法2(q-value法):根據(jù)p(k)km可以推出p(k)mk因此直接計算并與進行對比即可:由于G3的q-value大于0.05,因此G2, G6, G5, G4差異表達。3. 轉(zhuǎn)錄本表達量的表示方法(RPKM:Reads Per Kilobase of transcript per Million mapped
16、reads):(1)RPKM的作用:RNA-seq是透過次世代定序的技術(shù)來偵測基因表現(xiàn)量的方法,在衡量基因表現(xiàn)量時,若是單純以map到的read數(shù)來計算基因的表現(xiàn)量,在統(tǒng)計上是一件相當不合理的事,因為在隨機抽樣的情況下,序列較長的基因被抽到的機率本來就會比序列短的基因較高,如此一來,序列長的基因永遠會被認為表現(xiàn)量較高,而錯估基因真正的表現(xiàn)量,所以Ali Mortazavi等人在2008年提出以RPKM在估計基因的表現(xiàn)量假設(shè)一個物種的基因組上只有兩個基因,基因G1的外顯子長8 Kb,基因G2的外顯子長2 Kb。對該物種的一個樣本做RNA-seq,共得到23 millions 的read,其中能夠
17、比對到G1的read 有16 million 個,能夠比對到G2的有4 million 個.計算G1和G2的RPKM。Total mapped reads=16 million+4 million=20 millionG1: total exon reads=16,000,000 exon length=8kb RPKM=16,000,000/(20*8)=100,000G2: total exon reads=4,000,000 exon length=2kb RPKM=4,000,000/(20*2)=100,000(2)FPKM與RPKM的區(qū)別:兩者基本相同。RPKM代表Reads Pe
18、r Kilobase of transcript per Million mapped reads,F(xiàn)PKM代表Fragments Per Kilobase of transcript per Million mapped reads。在RNA-Seq中,由于cDNA來源于RNA的逆轉(zhuǎn)錄,轉(zhuǎn)錄物的表達量與cDNA片段成比例。RNA-Seq配對末端實驗每個片段產(chǎn)生兩個reads,但這并不意味著兩個reads都可在圖上標注。例如,第二個read低品質(zhì)。如果我們對read計數(shù)而不是片段,我們可能對某些片段重復(fù)計數(shù),而對另一些只計一次,導(dǎo)致對表達量估計的偏差。因此FPKM以片段為單位計數(shù),而不是rea
19、ds數(shù)。(來源于網(wǎng)上,原網(wǎng)址:/faq.html#fpkm)預(yù)測:1.高通量測序數(shù)據(jù)分析總括:高通量測序數(shù)據(jù)庫程序讀出的reads數(shù)據(jù)及對應(yīng)的質(zhì)量分值以文件格式為fastq的格式保存。測序的原始數(shù)據(jù)為熒光信號,首先將熒光信號轉(zhuǎn)換為序列信息,即讀段數(shù)據(jù)及對應(yīng)的質(zhì)量分值;為了方便測序數(shù)據(jù)的發(fā)布和共享,一般需要對數(shù)據(jù)進行格式化轉(zhuǎn)換,最常用的數(shù)據(jù)格式為fastq格式;對得到的原始數(shù)據(jù)必須對其質(zhì)量進行評估,評估指標包括G、C含量,堿基質(zhì)量,插入分布等。方便過濾掉質(zhì)量較差的讀段;若數(shù)據(jù)質(zhì)量評估過關(guān),接著將原始讀長通過序列映射定位到基因組上;若無參考基
20、因組,則必須使用denovo的組裝方法;得到測序數(shù)據(jù)的組裝圖后,便可根據(jù)實驗?zāi)康膶M裝好的數(shù)據(jù)進行相關(guān)分析,如分析基因的剪接位點,SNP位點,變異位點還可以分析基因的差異化表達(RNA-Seq),轉(zhuǎn)錄因子結(jié)合位點(Chip-Seq),甲基化模式(MeDIP-Seq),同時還可利用此數(shù)據(jù)發(fā)現(xiàn)新的編碼基因和非編碼基因;使用可視化組件對分析結(jié)果進行可視化處理。2.表達譜數(shù)據(jù)分析流程IntensityExpression profileQuality controlNormalizationDifferential gene expression analysis基因芯片在一個顏色通道掃描后得到的原式
21、圖是色調(diào)單一,強度不同的亮點陳列圖;將原始的圖像數(shù)據(jù)轉(zhuǎn)換為基因表達矩陣;對得到的基因表達矩陣的數(shù)據(jù)質(zhì)量進行檢測,對得到的數(shù)據(jù)進行統(tǒng)計學(xué)分析,從而估計和校正試驗誤差,篩選出有效數(shù)據(jù)。標準化就是消除基因芯片實驗過程中系統(tǒng)變異對基因表達水平所帶來的影響。標準化包括芯片內(nèi)的標準化和芯片之間的數(shù)據(jù)標準化。芯片內(nèi)的標準化方法,如局部加權(quán)線性回歸標準化,參照點標準化,芯片之間的標準化方法如Quantile;前幾部都是對表達譜數(shù)據(jù)的預(yù)處理,后期的數(shù)據(jù)分析包括差異基因表達分析、聚類分析、判別分析等;a)差別基因表達分析可分析不同樣本中起關(guān)鍵作用的基因,為后續(xù)研究提供方向;b)聚類分析是基因表達譜最廣泛使用的統(tǒng)計
22、技術(shù),聚類分析的目的再與尋找可能標準化或關(guān)聯(lián)的基因,從而預(yù)測位置基因的功能信息或已知基因的未知功能;c)判別分析能夠依據(jù)樣本的某些特性,判別樣本的所屬類型,利用已有數(shù)據(jù)建立分類器,然后利用建立的分類器對未知樣本的功能或狀態(tài)進行預(yù)測。方法主要有SVM,貝葉斯分類和神經(jīng)網(wǎng)絡(luò)法等。3.無生物學(xué)重復(fù)和有生物學(xué)重復(fù)時如何進行差異表達分析?答:(1)無生物學(xué)重復(fù):方法:FC(Fold change倍數(shù)變化)描述數(shù)據(jù)初值與終值之間的差異(一般是兩個差別表達基因間或處理與對照之間),用標準化后的兩組數(shù)據(jù)相除得到的比例,一般2-fold表明兩組數(shù)據(jù)是有顯著差異的;這種計算方法可以得到一組相對值,而不是絕對值變化
23、,消除了系統(tǒng)誤差以便于統(tǒng)計學(xué)分析;一般得到的FC值與設(shè)定的閾值進行比較即可得到表達有差異的基因;(2)有生物學(xué)重復(fù):方法:假設(shè)檢驗a)具體步驟:提出實際問題;提出無效假設(shè)(H0)與備擇假設(shè)(H1);選擇顯著性水平(一般=0.05);選擇統(tǒng)計模型與相應(yīng)的統(tǒng)計量;根據(jù)實驗結(jié)果計算實驗統(tǒng)計量;判斷檢驗統(tǒng)計量的p-值 (表示事件發(fā)生的概率具有偶然性);將p值同選定的顯著性水平比較;拒絕或不拒絕H0;回答所提出的實際問題。b)假設(shè)檢驗根據(jù)數(shù)據(jù)類型(是否符合正態(tài)性)分為參數(shù)檢驗與非參數(shù)檢驗:參數(shù)檢驗:符合正態(tài)分布可使用,常用的方法主要有t檢驗法,配對t檢驗法、最小二乘法非參數(shù)檢驗:不符合正態(tài)分布可使用,常
24、用的方法有Wilcoxon秩和檢驗法,其基本方法是根據(jù)表達量排序并按照排列順序檢驗,檢驗結(jié)果較參數(shù)檢驗法更粗獷。4.全基因組測序的步驟?答:(1)第一期:基因組調(diào)研圖整體測序深度不低于20倍覆蓋度。進行初步的數(shù)據(jù)分析,對基因組大小,GC含量等做出初步評估,確定框架圖梯度文庫構(gòu)建具體策略;(2)第二期:基因組框架圖基因組覆蓋度達到90% 以上,基因區(qū)覆蓋度達到95% 以上,單堿基的錯誤率達到1萬分之一以內(nèi),整體測序覆蓋深度不低于60倍覆蓋度。同時對框架圖進行基本基因注釋和功能注釋,和簡單的比較基因組學(xué)分析。(3)第三期:基因組精細圖基因組覆蓋度達到95% 以上,基因區(qū)覆蓋度達到98% 以上,單堿
25、基的錯誤率達到10萬分之一以內(nèi),整體基因組覆蓋度不低于100倍,Scaffold N50大小不低于300Kb,對基因組精細圖進行詳細基因注釋,基因功能注釋,基因代謝途徑注釋和比較基因組學(xué)分析。5. 轉(zhuǎn)錄本測序,各數(shù)據(jù)分析工具的特點?轉(zhuǎn)錄本測序可分為Small RNA-seq和RNA-seq:Small RNA-seq主要用于檢測small RNA(主要是miRNA)的表達水平,發(fā)現(xiàn)新的small RNARNA-seq:Poly(A)用以檢測蛋白質(zhì)編碼基因的可變剪切體及表達水平;Total RNA(除rRNA)用于檢測mRNA及l(fā)ong noncoding RNA的表達水平并發(fā)現(xiàn)新的long n
26、oncoding RNA;數(shù)據(jù)分析工具主要有:Bowtie,TopHat,Cufflinks,具體作用如下:a)Bowtie是一個超級快速的,較為節(jié)省內(nèi)存的短序列拼接至模板基因組的工具。它在拼接35堿基長度的序列時,可以達到每小時2.5億次的拼接速度。Bowtie并不是一個簡單的拼接工具,它不同于Blast等。它適合的工作是將小序列比對至大基因組上去。它最長能讀取1024個堿基的片段。b)TopHat 是一個快速的將RNA-Seq 數(shù)據(jù)進行快速剪接映射的程序。它使用超快的高通量短讀比對程序,將RNA-Seq的信息比對到哺乳動物大小基因組上,然后分析映射結(jié)果來鑒別外顯子之間的剪接點。c)Cuff
27、links 利用Tophat比對的結(jié)果(alignments)來組裝轉(zhuǎn)錄本,估計這些轉(zhuǎn)錄本的豐度,并且檢測樣本間的差異表達及可變剪接調(diào)控。它通過接受線性的RNA-Seq reads并將線性片段組裝為一套最大簡約的(parsimonious)轉(zhuǎn)錄本。然后根據(jù)reads數(shù)估計估計相關(guān)轉(zhuǎn)錄本的豐度并將實驗室預(yù)設(shè)的偏差考慮在內(nèi)。6.轉(zhuǎn)錄本拼接最大簡約轉(zhuǎn)錄本的組裝方法:組裝一套轉(zhuǎn)錄本在鏈中找到最小的分割單元P找到最大的反義鏈在二分圖中找到最大匹配數(shù)找到最小點覆蓋二分圖:指頂點可以分成兩個不相交的集使得在同一個集內(nèi)的頂點不相鄰(沒有共同邊)的圖。設(shè)G=(V,E)是一個無向圖,如果頂點V可分割為兩個互不相交
28、的子集(U,V),并且圖中的每條邊(i,j)所關(guān)聯(lián)的兩個頂點i和j分別屬于這兩個不同的頂點集(i in U,j in V),則稱圖G為一個二分圖。最大匹配:給定一個二分圖G,在G的一個子圖M中,M的邊集中的任意兩條邊都不依附于同一個頂點,則稱M是一個匹配,選擇這樣的邊數(shù)最大的子集稱為圖的最大匹配。最小點覆蓋:給定一個二分圖G,在G的一個子圖N中,N的點集中的點與所有的邊都有關(guān)聯(lián)(把所有的邊都覆蓋),則稱N是一個點覆蓋,選擇這樣的點數(shù)最小的子集稱為圖的最小點覆蓋。7. Illumina測序原理在聚合反應(yīng)體系中加入修飾過的四種核苷酸,它們分別被標記上終止基團和熒光基團:3羥基上標記上疊氮基在延伸時起阻止聚合的作用,胞嘧啶上標記上熒光基團。每一種核苷酸標記的熒光分子是不一樣的。聚合終止,每次加入一個修飾核苷酸,鏈聚合就被終止了,如下圖用激發(fā)光照射,被修飾的堿基發(fā)出熒光,記錄熒光信號,則知這一步加入的是什么核苷酸。延伸回復(fù):加入二巰基丙醇去掉疊氮基;用TCEP(Tris (2-carboxyethyl) phosphine,三(2-羧乙基)膦)處理,去掉熒光基團。進入下一輪延伸,加入一個新的堿基。原理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 乙方商鋪租賃合同范本
- 出讓合同范本官網(wǎng)
- 個人催債合同范本
- 2025年遵義a2貨運從業(yè)資格證考試
- 借款合同和抵押合同范例
- 勞務(wù)合同范本保密條款
- 東營市勞動合同范本
- 低成本創(chuàng)業(yè)合同范本
- 個人室內(nèi)植物租賃合同范本
- 棄土場土方外運施工方案
- 《大模型原理與技術(shù)》全套教學(xué)課件
- 2024年青海省中考生物地理合卷試題(含答案解析)
- 2019譯林版高中英語全七冊單詞總表
- 2024年中鐵集裝箱運輸有限責任公司招聘筆試參考題庫附帶答案詳解
- 蘇少版小學(xué)一年級下冊綜合實踐活動單元備課
- 《園林生態(tài)學(xué)》課件
- 人教版三年級數(shù)學(xué)下冊 (認識東北、西北、東南、西南)位置與方向教育教學(xué)課件
- 《藥劑學(xué)》-阿昔洛韋軟膏的制備
- 畢業(yè)設(shè)計-膽囊結(jié)石患者的護理計劃
- 倒排工期計劃表
- 項目承包制實施方案
評論
0/150
提交評論