分子標(biāo)記遺傳圖譜的構(gòu)建_第1頁(yè)
分子標(biāo)記遺傳圖譜的構(gòu)建_第2頁(yè)
分子標(biāo)記遺傳圖譜的構(gòu)建_第3頁(yè)
分子標(biāo)記遺傳圖譜的構(gòu)建_第4頁(yè)
分子標(biāo)記遺傳圖譜的構(gòu)建_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、分子標(biāo)記遺傳圖譜的構(gòu)建檢測(cè)出的每個(gè)分子標(biāo)記反映的都是相應(yīng)染色體座位上的遺傳多態(tài)性狀態(tài)。為了有效地分析利用分子標(biāo)記所提供的遺傳信息,人們希望知道不同分子標(biāo)記在染色體上的相對(duì)位置或排列情況,也就是要構(gòu)建分子標(biāo)記的遺傳連鎖圖譜。利用DNA標(biāo)記構(gòu)建遺傳連鎖圖譜在原理上與傳統(tǒng)遺傳圖譜的構(gòu)建是一樣的。其基本步驟包括:選擇適合作圖的DNA標(biāo)記;根據(jù)遺傳材料之間的DNA多態(tài)性,選擇用于建立作圖群體的親本組合;建立具有大量DNA標(biāo)記處于分離狀態(tài)的分離群體或衍生系;測(cè)定作圖群體中不同個(gè)體或株系的標(biāo)記基因型;對(duì)標(biāo)記基因型數(shù)據(jù)進(jìn)行連鎖分析,構(gòu)建標(biāo)記連鎖圖。至今為止,已構(gòu)建了許多植物的高密度分子標(biāo)記連鎖圖。本章側(cè)重介紹

2、利用DNA標(biāo)記構(gòu)建分子遺傳連鎖圖譜的原理與方法。第一節(jié) 作圖群體的建立要構(gòu)建DNA標(biāo)記連鎖圖譜,必須建立作圖群體。建立作圖群體需要考慮的重要因素包括親本的選配、分離群體類(lèi)型的選擇及群體大小的確定等。一、親本的選配anksley實(shí)驗(yàn)室1988年發(fā)表的RFLP連鎖圖譜是以秈稻和爪哇稻之間的雜交組合為基礎(chǔ)構(gòu)建的(McCouch et al. 1988)。在作物育種實(shí)踐中,育種家常將野生種的優(yōu)良性狀轉(zhuǎn)育到栽培種中,這種親源關(guān)系較遠(yuǎn)的雜交轉(zhuǎn)育,DNA多態(tài)性非常豐富。第二,選擇親本時(shí)應(yīng)盡量選用純度高的材料,并進(jìn)一步通過(guò)自交進(jìn)行純化。第三,要考慮雜交后代的可育性。親本間的差異過(guò)大,雜種染色體之間的配對(duì)和重組

3、會(huì)受到抑制,導(dǎo)致連鎖座位間的重組率偏低,并導(dǎo)致嚴(yán)重的偏分離現(xiàn)象,降低所建圖譜的可信度和適用范圍;嚴(yán)重的還會(huì)降低雜種后代的結(jié)實(shí)率,甚至導(dǎo)致不育,影響分離群體的構(gòu)建。由于各種原因,僅用一對(duì)親本的分離群體建立的遺傳圖譜往往不能完全滿(mǎn)足基因組研究和各種育種目標(biāo)的要求,應(yīng)選用幾個(gè)不同的親本組合,分別進(jìn)行連鎖作圖,以達(dá)到相互彌補(bǔ)的目的。第四,選配親本時(shí)還應(yīng)對(duì)親本及其F1雜種進(jìn)行細(xì)胞學(xué)鑒定。若雙親間存在相互易位,或多倍體材料(如小麥)存在單體或部分染色體缺失等問(wèn)題,那末其后代就不宜用來(lái)構(gòu)建連鎖圖譜。二、分離群體類(lèi)型的選擇根據(jù)其遺傳穩(wěn)定性可將分離群體分成兩大類(lèi):一類(lèi)稱(chēng)為暫時(shí)性分離群體,如F2、F3、F4、BC

4、、三交群體等,這類(lèi)群體中分離單位是個(gè)體,一經(jīng)自交或近交其遺傳組成就會(huì)發(fā)生變化,無(wú)法永久使用。另一類(lèi)稱(chēng)為永久性分離群體,如RI、DH群體等,這類(lèi)群體中分離單位是株系,不同株系之間存在基因型的差異,而株系內(nèi)個(gè)體間的基因型是相同且純合的,是自交不分離的。這類(lèi)群體可通過(guò)自交或近交繁殖后代,而不會(huì)改變?nèi)后w的遺傳組成,可以永久使用。構(gòu)建DNA連鎖圖譜可以選用不同類(lèi)型的分離群體,它們各有其優(yōu)缺點(diǎn),因此應(yīng)結(jié)合具體情況選用。(一)F2代群體F2群體是常用的作圖群體,迄今大多數(shù)植物的DNA標(biāo)記連鎖圖譜都是用F2群體構(gòu)建的。不論是自花授粉植物,還是異花授粉植物,建立F2群體都是容易的,這是使用F2群體進(jìn)行遺傳作圖的

5、最大優(yōu)點(diǎn)。但F2群體的一個(gè)不足之處是存在雜合基因型。對(duì)于顯性標(biāo)記,將無(wú)法識(shí)別顯性純合基因型和雜合基因型。由于這種基因型信息簡(jiǎn)并現(xiàn)象的存在,會(huì)降低作圖的精度。而為了提高精度,減小誤差,則必須使用較大的群體,從而會(huì)增加DNA標(biāo)記分析的費(fèi)用。F2群體的另一個(gè)缺點(diǎn)是不易長(zhǎng)期保存,有性繁殖一代后,群體的遺傳結(jié)構(gòu)就會(huì)發(fā)生變化。為了延長(zhǎng)F2群體的使用時(shí)間,一種方法是對(duì)其進(jìn)行無(wú)性繁殖,如進(jìn)行組織培養(yǎng)擴(kuò)繁。但這種方法不是所有的植物都適用,且耗資費(fèi)工。另一種方法是使用F2單株的衍生系(F3株系或F4家系)。將衍生系內(nèi)多個(gè)單株混合提取DNA,則能代表原F2單株的DNA組成。為了保證這種代表性的真實(shí)可靠,衍生系中選取

6、的單株必須是隨機(jī)的,且數(shù)量要足夠多。這種方法對(duì)于那些繁殖系數(shù)較大的自花授粉植物(如水稻、小麥等)特別適用。(二)BC1群體BC1(回交一代)也是一種常用的作圖群體。BC1群體中每一分離的基因座只有兩種基因型,它直接反映了F1代配子的分離比例,因而B(niǎo)C1群體的作圖效率最高,這是它優(yōu)于F2群體的地方。BC1群體還有一個(gè)用途,就是可以用來(lái)檢驗(yàn)雌、雄配子在基因間的重組率上是否存在差異。其方法是比較正、反回交群體中基因的重組率是否不同。例如正回交群體為(A×B)×A,反回交群體為A×(A×B),則前者反映的是雌配子中的重組率,后者反映的是雄配子中的重組率。雖然BC

7、1群體是一種很好的作圖群體,但它也與F2群體一樣,存在不能長(zhǎng)期保存的問(wèn)題。可以用F2中使用的類(lèi)似方法來(lái)延長(zhǎng)BC1群體的使用時(shí)間。另外,對(duì)于一些人工雜交比較困難的植物,BC1群體也不太合適,因?yàn)橐皇请y以建立較大的BC1群體,二是容易出現(xiàn)假雜種,造成作圖的誤差。順便一提,對(duì)于一些自交不親和的材料,可以使用三交群體,即(A×B)×C。由于存在自交不親和性,這樣的三交群體中不存在假雜種現(xiàn)象。(三)RI群體RI(重組自交系)群體是雜種后代經(jīng)過(guò)多代自交而產(chǎn)生的一種作圖群體,通常從F2代開(kāi)始,采用單粒傳的方法來(lái)建立。由于自交的作用是使基因型純合化,因此,RI群體中每個(gè)株系都是純合的,因而

8、RI群體是一種可以長(zhǎng)期使用的永久性分離群體。理論上,建立一個(gè)無(wú)限大的RI群體,必須自交無(wú)窮多代才能達(dá)到完全純合;建立一個(gè)有限大小的RI群體則只需自交有限代。然而,即使是建立一個(gè)通常使用的包含100200個(gè)株系的RI群體,要達(dá)到完全純合,所需的自交代數(shù)也是相當(dāng)多的。據(jù)吳為人等(1997)從理論上推算,對(duì)一個(gè)擁有10條染色體的植物種,要建立完全純合的RI作圖群體,至少需要自交15代??梢?jiàn),建立RI群體是非常費(fèi)時(shí)的。在實(shí)際研究中,人們往往無(wú)法花費(fèi)那么多時(shí)間來(lái)建立一個(gè)真正的RI群體,所以常常使用自交67代的“準(zhǔn)”RI群體。從理論上推算,自交6代后,單個(gè)基因座的雜合率只有大約3%,已基本接近純合。然而,

9、由于構(gòu)建連鎖圖譜時(shí)涉及到大量的DNA標(biāo)記座位,因而雖然多數(shù)標(biāo)記座位已達(dá)到或接近完全純合,但仍有一些標(biāo)記座位存在較高的雜合率,有的高達(dá)20%以上(李維明等2000)。盡管如此,實(shí)踐證明,利用這樣的“準(zhǔn)”RI群體來(lái)構(gòu)建分子標(biāo)記連鎖圖譜仍是可行的。在RI群體中,每一分離座位上只存在兩種基因型,且比例為1:1。從這點(diǎn)看,RI群體的遺傳結(jié)構(gòu)與BC1相似,也反映了F1配子的分離比例。但值得注意的是,當(dāng)分析RI群體中兩個(gè)標(biāo)記座位之間的連鎖關(guān)系時(shí),算得的重組率比例并不等于F1配子中的重組率,這是因?yàn)樵诮I群體的過(guò)程中,兩標(biāo)記座位間每一代都會(huì)發(fā)生重組,所以RI群體中得到的重組率比例是多代重組頻率的積累。不過(guò)

10、,從理論上可以推算出,RI群體中的重組比例(R)與F1配子中的重組率(r)之間的關(guān)系為:R=2r/(1+2r)。因此,用RI群體仍然可以估計(jì)重組率,亦即RI群體仍然可以用于遺傳作圖。RI群體的優(yōu)點(diǎn)是可以長(zhǎng)期使用,可以進(jìn)行重復(fù)試驗(yàn)。因此它除了可用于構(gòu)建分子標(biāo)記連鎖圖外,特別適合于數(shù)量性狀基因座(QTL)的定位研究。但是,考慮到構(gòu)建RI群體要花費(fèi)很長(zhǎng)時(shí)間,如果僅是為了構(gòu)建分子標(biāo)記連鎖圖的話(huà),選用RI群體是不明智的。另外,異花授粉植物由于存在自交衰退和不結(jié)實(shí)現(xiàn)象,建立RI群體也比較困難。(四)DH群體高等植物的單倍體(Haploid)是含有配子染色體數(shù)的個(gè)體。單倍體經(jīng)過(guò)染色體加倍形成的二倍體稱(chēng)為加倍

11、單倍體或雙單倍體(DH)。DH群體產(chǎn)生的途徑很多,亦因物種不同而異,最常見(jiàn)的方法是通過(guò)花藥培養(yǎng),即取F1植株的花藥進(jìn)行離體培養(yǎng),誘導(dǎo)產(chǎn)生單倍體植株,然后對(duì)染色體進(jìn)行加倍產(chǎn)生DH植株。DH植株是純合的,自交后即產(chǎn)生純系,因此DH群體可以穩(wěn)定繁殖,長(zhǎng)期使用,是一種永久性群體。DH群體的遺傳結(jié)構(gòu)直接反映了F1配子中基因的分離和重組,因此DH群體與BC1群體一樣,作圖效率是最高的。另外,由于DH群體跟RI群體一樣,可以反復(fù)使用,重復(fù)試驗(yàn),因此也特別適合于QTL定位的研究。DH群體直接從F1花粉經(jīng)培養(yǎng)產(chǎn)生,因而建立DH群體所需時(shí)間不多。但是,產(chǎn)生DH植株有賴(lài)于花培技術(shù)。有些植物的花藥培養(yǎng)非常困難,就無(wú)法

12、通過(guò)花培來(lái)建立DH群體。另外,植物的花培能力跟基因型關(guān)系較大,因而花培過(guò)程會(huì)對(duì)不同基因型的花粉產(chǎn)生選擇效應(yīng),從而破壞DH群體的遺傳結(jié)構(gòu),造成較嚴(yán)重的偏分離現(xiàn)象,這會(huì)影響遺傳作圖的準(zhǔn)確性。因此,如果是以構(gòu)建分子標(biāo)記連鎖圖為主要目的的話(huà),DH群體不是一種理想的作圖群體。三、群體大小的確定遺傳圖譜的分辨率和精度,很大程度上取決于群體大小。群體越大,則作圖精度越高。但群體太大,不僅增大實(shí)驗(yàn)工作量,而且增加費(fèi)用。因此確定合適的群體大小是十分必要的。合適群體大小的確定與作圖的內(nèi)容有關(guān)。大量的作圖實(shí)踐表明,構(gòu)建DNA標(biāo)記連鎖圖譜所需的群體遠(yuǎn)比構(gòu)建形態(tài)性狀特別是數(shù)量性狀的遺傳圖譜要小,大部分已發(fā)表的分子標(biāo)記連

13、鎖圖譜所用的分離群體一般都不足100個(gè)單株或家系。而如果用這樣大小的群體去定位那些控制農(nóng)藝性狀尤其是數(shù)量性狀的基因,就會(huì)產(chǎn)生很大的試驗(yàn)誤差。從作圖效率考慮,作圖群體所需樣本容量的大小取決于以下兩個(gè)方面:一是從隨機(jī)分離結(jié)果可以辨別的最大圖距,二是兩個(gè)標(biāo)記間可以檢測(cè)到重組的最小圖距。因此,作圖群體的大小可根據(jù)研究的目標(biāo)來(lái)確定。作圖群體越大,則可以分辨的最小圖距就越小,而可以確定的最大圖距也越大。如果建圖的目的是用于基因組的序列分析或基因分離等工作,則需用較大的群體,以保證所建連鎖圖譜的精確性。在實(shí)際工作中,構(gòu)建分子標(biāo)記骨架連鎖圖可基于大群體中的一個(gè)隨機(jī)小群體(如150個(gè)單株或家系),當(dāng)需要精細(xì)地研

14、究某個(gè)連鎖區(qū)域時(shí),再有針對(duì)性地在骨架連鎖圖的基礎(chǔ)上擴(kuò)大群體。這種大小群體相結(jié)合的方法,既可達(dá)到研究的目的,又可減輕工作量。作圖群體大小還取決于所用群體的類(lèi)型。如常用的F2和BC1兩種群體,前者所需的群體就必須大些。這是因?yàn)?,F(xiàn)2群體中存在更多種類(lèi)的基因型,而為了保證每種基因型都有可能出現(xiàn),就必須有較大的群體。一般而言,F(xiàn)2群體的大小必須比BC1群體大約大一倍,才能達(dá)到與BC1相當(dāng)?shù)淖鲌D精度。所以說(shuō),BC1的作圖效率比F2高得多。在分子標(biāo)記連鎖圖的構(gòu)建中,DH群體的作圖效率在統(tǒng)計(jì)上與BC1相當(dāng),而RI群體則稍差些??偟恼f(shuō)來(lái),在分子標(biāo)記連鎖圖的構(gòu)建方面,為了達(dá)到彼此相當(dāng)?shù)淖鲌D精度,所需的群體大小的

15、順序?yàn)镕2>RI>BC1和DH。第二節(jié) 圖譜構(gòu)建的理論基礎(chǔ)一、染色體遺傳理論1903年W. S. Sutton和T. Boveri分別提出了遺傳因子位于染色體上的理論,他們將染色體看作是孟德?tīng)柣虻奈锢磔d體。該理論亦稱(chēng)為Sutton-Boveri染色體遺傳理論,其基本要點(diǎn)如下:(1)體細(xì)胞核內(nèi)的染色體成對(duì)存在,其中一條來(lái)自雌親,一條來(lái)自雄親,成對(duì)染色體的兩個(gè)成員是同源的。(2)每條染色體在個(gè)體的生命周期中均能保持其結(jié)構(gòu)上的恒定性和遺傳上的連續(xù)性,因而在個(gè)體的發(fā)育過(guò)程中起著一定的作用。(3)在減數(shù)分裂中,同源染色體的兩個(gè)成員相互配對(duì),隨后又發(fā)生分離,走向細(xì)胞的兩極,從而形成兩個(gè)單倍體

16、性細(xì)胞。二、基因重組和連鎖理論連鎖圖譜構(gòu)建的理論基礎(chǔ)是染色體的交換與重組。在細(xì)胞減數(shù)分裂時(shí),非同源染色體上的基因相互獨(dú)立、自由組合,同源染色體上的基因產(chǎn)生交換與重組,交換的頻率隨基因間距離的增加而增大。位于同一染色體上的基因在遺傳過(guò)程中一般傾向于維系在一起,而表現(xiàn)為基因連鎖。它們之間的重組是通過(guò)一對(duì)同源染色體的兩個(gè)非姊妹染色單體之間的交換來(lái)實(shí)現(xiàn)的。假設(shè)某一對(duì)同源染色體上存在A-a,B-b兩對(duì)連鎖基因,現(xiàn)有兩個(gè)親本P1 和P2,它們的基因型分別為AABB和aabb,兩親本雜交產(chǎn)生AaBb雙雜合體。F1在減數(shù)分裂過(guò)程中應(yīng)產(chǎn)生4種類(lèi)型的配子,其中兩種為親型配子AB和ab,兩種為重組型配子Ab和aB。

17、由于A-a和B-b位于同一染色體上,要產(chǎn)生重組型配子必須在這兩個(gè)基因的連鎖區(qū)段上發(fā)生交換。重組型配子所占的比例取決于減數(shù)分裂細(xì)胞中發(fā)生交換的頻率。交換頻率越高,則重組型配子的比例越大。重組型配子最大可能的比例是50%,這時(shí)在所有減數(shù)分裂的細(xì)胞中,在兩對(duì)基因的連鎖區(qū)段上都發(fā)生交換,相當(dāng)于這兩對(duì)基因間無(wú)連鎖,表現(xiàn)為獨(dú)立遺傳。重組型配子占總配子的比例稱(chēng)為重組率,用r表示。重組率的高低取決于交換的頻率,而兩對(duì)基因之間的交換頻率取決于它們之間的直線距離。重組率的值變化于完全連鎖時(shí)的0%到完全獨(dú)立時(shí)的50%之間。因此重組率可用來(lái)表示基因間的遺傳圖距,圖距單位用厘摩(centi-Morgan,cM)表示,1

18、cM的大小大致符合1%的重組率。三、圖譜制作的統(tǒng)計(jì)學(xué)原理(一)兩點(diǎn)測(cè)驗(yàn)如果兩個(gè)基因座位于同一染色體上且相距較近,則在分離后代中通常表現(xiàn)為連鎖遺傳。對(duì)兩個(gè)基因座之間的連鎖關(guān)系進(jìn)行檢測(cè),稱(chēng)為兩點(diǎn)測(cè)驗(yàn)。在進(jìn)行連鎖測(cè)驗(yàn)之前,必須了解各基因座位的等位基因分離是否符合孟德?tīng)柗蛛x比例,這是連鎖檢驗(yàn)的前提。在共顯性條件下,F(xiàn)2群體中一個(gè)座位上的基因型分離比例為1:2:1,而B(niǎo)C1和DH群體中分離比例均為1:1;在顯性條件下,F(xiàn)2群體中分離比例為3:1,而B(niǎo)C1和DH群體中分離比例仍為1:1。檢驗(yàn)DNA標(biāo)記的分離是否偏離孟德?tīng)柋壤?,一般采用c2檢驗(yàn)。只有當(dāng)待檢驗(yàn)的兩個(gè)基因座各自的分離比例正常時(shí),才可進(jìn)行這兩個(gè)座

19、位的連鎖分析。在DNA標(biāo)記連鎖圖譜的制作過(guò)程中,常常會(huì)遇到大量DNA標(biāo)記偏離孟德?tīng)柗蛛x比例的異常分離現(xiàn)象,這種異常分離在遠(yuǎn)緣雜交組合的分離群體及DH和RI群體中尤為明顯。目前在水稻中已發(fā)現(xiàn)了十余個(gè)與異常分離有關(guān)的基因座位,這些基因座位可能影響配子生活力和競(jìng)爭(zhēng)力,導(dǎo)致配子選擇,從而產(chǎn)生異常分離。異常分離會(huì)使連鎖的檢驗(yàn)受到影響,一些本來(lái)不存在連鎖的標(biāo)記由于各自的異常分離,可能誤導(dǎo)得出連鎖的結(jié)論,而另一些本來(lái)連鎖著的標(biāo)記也有可能由于異常分離而無(wú)法檢測(cè)到連鎖。發(fā)生嚴(yán)重異常分離的標(biāo)記一般不應(yīng)用于連鎖作圖。將分離比的檢驗(yàn)與連鎖檢驗(yàn)相結(jié)合,是實(shí)際分析過(guò)程中解決異常分離的常用方法。兩個(gè)連鎖座位不同基因型出現(xiàn)的

20、頻率是估算重組值的基礎(chǔ)。在一般的遺傳學(xué)教材中,重組值的估計(jì)是根據(jù)分離群體中重組型個(gè)體占總個(gè)體的比例來(lái)估計(jì)的。這種估計(jì)方法無(wú)法得到估計(jì)值的標(biāo)準(zhǔn)誤,因而無(wú)法對(duì)估值進(jìn)行顯著性檢驗(yàn)和置信區(qū)間估計(jì)。采用最大似然法進(jìn)行重組率的估計(jì)可解決這一問(wèn)題。最大似然法以滿(mǎn)足其估計(jì)值在觀察結(jié)果中出現(xiàn)的概率最大為條件。在人類(lèi)遺傳學(xué)研究中,由于通常不知道父母的基因型或父母中標(biāo)記基因的連鎖相是相斥還是相引,因而無(wú)法簡(jiǎn)單地通過(guò)計(jì)算重組體出現(xiàn)的頻率來(lái)進(jìn)行連鎖分析,而必須通過(guò)適當(dāng)?shù)慕y(tǒng)計(jì)模型來(lái)估算重組率,并采用似然比檢驗(yàn)的方法來(lái)推斷連鎖是否存在,即比較假設(shè)兩座位間存在連鎖(r < 0.5)的概率與假設(shè)沒(méi)有連鎖(r = 0.5)

21、的概率。這兩種概率之比可以用似然比統(tǒng)計(jì)量來(lái)表示,即L(r)/L(0.5),其中L()為似然函數(shù)。為了計(jì)算方便,常將L(r)/L(0.5)取以10為底的對(duì)數(shù),稱(chēng)為L(zhǎng)OD值。為了確定兩對(duì)基因之間存在連鎖,一般要求似然比大于1000:1,即LOD>3;而要否定連鎖的存在,則要求似然比小于100:1,即LOD<2。在其它生物遺傳圖譜的構(gòu)建中,似然比的概念也用來(lái)反映重組率估值的可靠性程度或作為連鎖是否真實(shí)存在的一種判斷尺度。(二)多點(diǎn)測(cè)驗(yàn)兩點(diǎn)測(cè)驗(yàn)是最簡(jiǎn)單,也是最常用的連鎖分析方法。然而,在構(gòu)建分子標(biāo)記連鎖圖中,每條染色體都涉及到許多標(biāo)記座位。遺傳作圖的目的就是要確定這些標(biāo)記座位在染色體上的正

22、確排列順序及彼此間的遺傳圖距。所以,這里涉及到一個(gè)同時(shí)分析多個(gè)基因座之間連鎖關(guān)系的問(wèn)題。這個(gè)問(wèn)題看似簡(jiǎn)單,其實(shí)挺復(fù)雜,因?yàn)閷?duì)于m個(gè)連鎖座位,就有m!/2種可能的排列順序。例如,若m = 10,則共有1,814,400種可能。要從這么多種可能中挑選出正確的順序,確實(shí)沒(méi)那么容易。這項(xiàng)工作用兩點(diǎn)測(cè)驗(yàn)方法是難以完成的,因?yàn)樗看沃荒芊治鰞蓚€(gè)座位間的連鎖關(guān)系。由于兩點(diǎn)測(cè)驗(yàn)估得的重組率存在誤差,因此,根據(jù)比較不同座位之間重組率大小來(lái)確定座位的排列順序是不可靠的,很可能存在錯(cuò)誤。為了解決這個(gè)問(wèn)題,就必須同時(shí)對(duì)多個(gè)座位進(jìn)行聯(lián)合分析,利用多個(gè)座位間的共分離信息來(lái)確定它們的排列順序,也就是進(jìn)行多點(diǎn)測(cè)驗(yàn)。在事先未知

23、各基因座位于哪條染色體的情況下,可先進(jìn)行兩點(diǎn)測(cè)驗(yàn),根據(jù)兩點(diǎn)測(cè)驗(yàn)的結(jié)果,將那些基因座分成不同的連鎖群,然后再對(duì)各連鎖群(染色體)上的座位進(jìn)行多點(diǎn)連鎖分析。與兩點(diǎn)測(cè)驗(yàn)一樣,多點(diǎn)測(cè)驗(yàn)通常也采用似然比檢驗(yàn)法。先對(duì)各種可能的基因排列順序進(jìn)行最大似然估計(jì),然后通過(guò)似然比檢驗(yàn)確定出可能性最大的順序。在每次多點(diǎn)測(cè)驗(yàn)中,不能包含太多的座位,否則可能的排列數(shù)會(huì)非常大,即使使用高速的計(jì)算機(jī),也要花費(fèi)很長(zhǎng)的時(shí)間。在一條染色體上,經(jīng)過(guò)多次多點(diǎn)測(cè)驗(yàn),就能確定出最佳的基因排列順序,并估計(jì)出相鄰基因間的遺傳圖距,從而構(gòu)建出相應(yīng)的連鎖圖。對(duì)于在兩點(diǎn)測(cè)驗(yàn)中沒(méi)能歸類(lèi)到某個(gè)連鎖群(染色體)的基因座,可在各連鎖群的連鎖圖初步建成之后,

24、再?lài)L試定位到某個(gè)連鎖群上。但在構(gòu)建分子標(biāo)記連鎖圖的實(shí)際研究中,往往總有一些標(biāo)記無(wú)法定位到染色體上。造成這種現(xiàn)象的原因,主要可能是在測(cè)定標(biāo)記基因型時(shí)存在錯(cuò)誤。(三)交換干擾與作圖函數(shù)隨著間距的增加,兩個(gè)基因座之間便可能在兩處同時(shí)發(fā)生遺傳物質(zhì)的交換,即雙交換。在染色體某區(qū)段上發(fā)生的雙交換,其實(shí)際頻率往往少于由單交換概率相乘所估得的理論值。這是因?yàn)橐粋€(gè)位置上所發(fā)生的交換會(huì)減少其周?chē)硪粋€(gè)單交換的發(fā)生,這種現(xiàn)象稱(chēng)為交叉干擾。干擾的程度可用符合系數(shù)C表示,符合系數(shù)C為實(shí)際雙交換值與理論雙交換值的比值。理論雙交換值是指兩個(gè)相鄰的單交換同時(shí)獨(dú)立發(fā)生的概率。C 實(shí)際雙交換值實(shí)際雙交換值理論雙交換值r1r2其中

25、r1和r2分別為兩個(gè)相鄰染色體區(qū)段發(fā)生單交換的概率。符合系數(shù)C的值變動(dòng)于01之間。當(dāng)C=0時(shí),表示完全干擾,沒(méi)有雙交換發(fā)生;當(dāng)C=1時(shí),表示沒(méi)有干擾,兩單交換獨(dú)立發(fā)生。一般而言,兩單交換的位置相距越遠(yuǎn),則彼此干擾的程度就越低,符合系數(shù)就越大。要計(jì)算兩個(gè)相距較遠(yuǎn)的基因座之間的圖距時(shí),如果中間沒(méi)有其它基因座可利用,則兩個(gè)基因座之間實(shí)際發(fā)生的雙交換就不能被鑒別出來(lái),因此,采用一些數(shù)學(xué)方法進(jìn)行矯正是必要的,否則,從重組率估計(jì)出的圖距就會(huì)比真實(shí)圖距小。這種矯正可通過(guò)作圖函數(shù)來(lái)實(shí)現(xiàn)。在C=1的假定下,圖距x與重組率r之間的關(guān)系服從Haldane作圖函數(shù):x=-(1/2)ln(1-2r)其中x以M為單位。這

26、里M讀作Morgan(摩爾根),它是用著名遺傳學(xué)家摩爾根的姓命名的,并取第一個(gè)字母表示。1M=100cM(厘摩),1cM為一個(gè)遺傳單位,即1%的重組率。根據(jù)Haldane作圖函數(shù),20%的重組率相當(dāng)于圖距為-(1/2)ln(1-2×0.20)= 0.255M,即25.5cM。Haldane作圖函數(shù)的不合理之處在于假定了完全沒(méi)有交叉干擾。為了將交叉干擾的因素考慮進(jìn)去,一種比較合理的假設(shè)是,雙交換符合系數(shù)與重組率之間存在線性關(guān)系,即C=2r。該式表示,C值隨r的增加而增加,干擾相應(yīng)減弱。當(dāng)r=0.5(即沒(méi)有連鎖)時(shí),C=1(即沒(méi)有干擾)。根據(jù)這一假設(shè)推導(dǎo)出了如下作圖函數(shù)(Kosambi作

27、圖函數(shù)):x=(1/4)ln1+2r12r根據(jù)上式可以算出,當(dāng)r=0.2時(shí),x=21.2cM??梢?jiàn)Kosambi作圖函數(shù)算出的圖距比Haldane作圖函數(shù)的小。由于Kosambi作圖函數(shù)比Haldane作圖函數(shù)更合理,因此它在遺傳學(xué)研究中得到了更廣泛的應(yīng)用。第三節(jié) DNA標(biāo)記分離數(shù)據(jù)的數(shù)學(xué)處理一、分離數(shù)據(jù)的收集與數(shù)字化從分離群體中收集分子標(biāo)記的分離數(shù)據(jù),獲得不同個(gè)體的DNA多態(tài)性信息,是進(jìn)行遺傳連鎖分析的第一步。通常各種DNA標(biāo)記基因型的表現(xiàn)形式是電泳帶型,將電泳帶型數(shù)字化是DNA標(biāo)記分離數(shù)據(jù)進(jìn)行數(shù)學(xué)處理的關(guān)鍵。下面以RFLP為例來(lái)說(shuō)明將DNA標(biāo)記帶型數(shù)字化的方法。假設(shè)某個(gè)RFLP座位在兩個(gè)親

28、本(P1,P2)中各顯示一條帶,由于RFLP是共顯性的,則F1個(gè)體中將表現(xiàn)出兩條帶,而F2群體中不同個(gè)體的帶型有三種,即P1型、P2型和F1(雜合體)型??梢愿鶕?jù)習(xí)慣或研究人員的喜好,任意選擇一組數(shù)字或符號(hào),來(lái)記錄F2個(gè)體的帶型。例如,將P1帶型記為1,P2帶型記為3,F(xiàn)1帶型記為2。如果帶型模糊不清或由于其它原因使數(shù)據(jù)缺失,則可記為0。假設(shè)全部試驗(yàn)共有120個(gè)F2單株,檢測(cè)了100個(gè)RFLP標(biāo)記,這樣可得到一個(gè)由100(行)×120(列)的、由簡(jiǎn)單數(shù)字組成的RFLP數(shù)據(jù)矩陣。進(jìn)行DNA標(biāo)記帶型數(shù)字化的基本原則是,必須區(qū)分所有可能的類(lèi)型和情況,并賦與相應(yīng)的數(shù)字或符號(hào)。比如在上例中,總

29、共有4種類(lèi)型,即P1型、F1型、P2型和缺失數(shù)據(jù),故可用4個(gè)數(shù)字1、2、3和0分別表示之。如果存在顯性標(biāo)記,則F2中還會(huì)出現(xiàn)兩種情況。一種是P1對(duì)P2顯性,于是P1型和F1型無(wú)法區(qū)分,這時(shí)應(yīng)將P1型和F1型作為一種類(lèi)型,記為4。另一種情況正好相反,P2對(duì)P1顯性,無(wú)法區(qū)分P2型和F1型,故應(yīng)將它們合為一種類(lèi)型,記為5。對(duì)于BC1、DH和RI群體,每個(gè)分離的基因座都只有兩種基因型,不論是共顯性標(biāo)記還是顯性標(biāo)記,兩種基因型都可以識(shí)別,加上缺失數(shù)據(jù)的情況,總共只有3種類(lèi)型。因而用3個(gè)數(shù)字就可以將標(biāo)記全部帶型數(shù)字化。在分析質(zhì)量性狀基因與遺傳標(biāo)記之間的連鎖關(guān)系時(shí),也必須將有關(guān)的表型數(shù)字化,其方法與標(biāo)記帶

30、型的數(shù)字化相似。例如,假設(shè)在DH群體中,有一個(gè)主基因控制株高,那么就可以將株系按植株的高度分為高稈和矮稈兩大類(lèi),然后根據(jù)親本的表現(xiàn)分別給高稈和矮稈株系賦值,如1和2。將質(zhì)量性狀經(jīng)過(guò)這樣的數(shù)字化處理,就可以與DNA標(biāo)記數(shù)據(jù)放在一起進(jìn)行連鎖分析。DNA標(biāo)記數(shù)據(jù)的收集和處理應(yīng)注意以下問(wèn)題:(1)應(yīng)避免利用沒(méi)有把握的數(shù)據(jù)。由于分子多態(tài)性分析涉及許多實(shí)驗(yàn)步驟,很難避免出現(xiàn)錯(cuò)誤,經(jīng)常會(huì)遇到所得試驗(yàn)結(jié)果(如X-光片)不清楚等問(wèn)題。如果硬性地利用這樣沒(méi)有把握的數(shù)據(jù),不僅會(huì)嚴(yán)重影響該標(biāo)記自身的定位,而且還會(huì)影響到其它標(biāo)記的定位。因此,應(yīng)刪除沒(méi)有把握的數(shù)據(jù),寧可將其作為缺失數(shù)據(jù)處理,或重做試驗(yàn)。(2)應(yīng)注意親本基

31、因型,對(duì)親本基因型的賦值(如P1型為1,P2型為2),在所有的標(biāo)記座位上必須統(tǒng)一,千萬(wàn)別混淆。如果已知某兩個(gè)座位是連鎖的,而所得結(jié)果表明二者是獨(dú)立分配的,這就有可能是把親本類(lèi)型弄錯(cuò)引起的。(3)當(dāng)兩親本出現(xiàn)多條帶的差異時(shí),應(yīng)通過(guò)共分離分析鑒別這些帶是屬于同一座位還是分別屬于不同座位。如屬于不同座位,應(yīng)逐帶記錄分離數(shù)據(jù)。二、遺傳圖距與物理距離對(duì)應(yīng)關(guān)系的估計(jì)不同生物的1cM圖距所對(duì)應(yīng)的實(shí)際物理距離(堿基對(duì)數(shù)量)存在很大差異。一般而言,生物越低等或越簡(jiǎn)單,1cM圖距平均對(duì)應(yīng)的堿基對(duì)數(shù)量就越少(表3.1)。表3.1中給出的各種生物中遺傳圖距與物理距離之間的對(duì)應(yīng)關(guān)系只是一個(gè)大約的平均值,實(shí)際上它變化很大

32、。在一條染色體上,由于不同區(qū)域上發(fā)生交換的頻率存在差異,因而遺傳圖距與物理距離之間的對(duì)應(yīng)關(guān)系可以有很大的變化。例如,在著絲粒附近,染色體交換受到抑制,因而所估計(jì)的遺傳圖距小于平均對(duì)應(yīng)的物理距離。在同一種生物中,兩個(gè)特定基因座之間的遺傳圖距會(huì)因遺傳背景的不同而改變,甚至有時(shí)由同一對(duì)親本所產(chǎn)生的遺傳背景相同的不同群體間也存在很大差異。表3.1不同生物中單位圖距所相當(dāng)?shù)钠骄锢砭嚯x物 種基因組大?。╧b)遺傳圖距(cM)kb / cM嗜菌體T41.6×1028000.2大腸桿菌4.2×1031,7502.4酵 母2.0×1044,2004.8真 菌2.7×10

33、41,00027.0線 蟲(chóng)8.0×104320250.0果 蠅1.4×105280500.0水 稻4.5×1051,500300.0小 鼠3.0×1061,7001,800.0人 類(lèi)3.3×1063,3001,000.0玉 米2.5×1062,5001,000.0三、構(gòu)建DNA標(biāo)記圖譜的計(jì)算機(jī)軟件遺傳圖譜的構(gòu)建需要對(duì)大量標(biāo)記之間的連鎖關(guān)系進(jìn)行統(tǒng)計(jì)分析。隨著標(biāo)記數(shù)目的增加,計(jì)算工作量常常呈指數(shù)形式增加,這是手工無(wú)法完成的。因此,必須借助計(jì)算機(jī)進(jìn)行分析和處理。許多學(xué)者為構(gòu)建遺傳圖譜設(shè)計(jì)了專(zhuān)用程序包,通過(guò)Internet網(wǎng)址可以獲得各種專(zhuān)用

34、程序的相關(guān)信息,如軟件的名稱(chēng)及簡(jiǎn)要介紹,源程序編碼語(yǔ)言、支持的操作系統(tǒng)、執(zhí)行程序的名稱(chēng)、參考文獻(xiàn)以及獲取軟件的網(wǎng)址等。應(yīng)用于植物遺傳連鎖分析和遺傳圖譜構(gòu)建的常用軟件有LINKAGE、MAPMAKER/EXP等。LINKAGE軟件可通過(guò) 獲得,該軟件是利用最大似然法估計(jì)兩座位或多座位間的重組率和LOD值;MAPMAKER/EXP可通過(guò)獲得,該軟件可以應(yīng)用于各種類(lèi)型的實(shí)驗(yàn)群體進(jìn)行遺傳作圖,是目前應(yīng)用最為廣泛的作圖軟件之一。第四節(jié) DNA標(biāo)記連鎖圖譜的完善一、DNA標(biāo)記連鎖群的染色體定位把分子標(biāo)記所建立的連鎖群與經(jīng)典遺傳圖譜聯(lián)系起來(lái),并將其歸屬到相應(yīng)的染色體上,是構(gòu)建了一個(gè)比較飽和的分子圖譜之后十分

35、重要的工作。通常根據(jù)分子標(biāo)記與已知染色體位置的形態(tài)標(biāo)記的連鎖關(guān)系來(lái)確定分子標(biāo)記連鎖群屬于哪條染色體。還可以利用非整倍體或染色體結(jié)構(gòu)變異材料,如水稻中利用三體、玉米中利用A/B易位系、小麥中利用缺體/四體染色體代換系等,將分子標(biāo)記連鎖群歸屬到相應(yīng)的染色體上。以水稻為例,目前已獲得全套12條染色體的初級(jí)三體(2n+1)。在水稻某種三體中,由于三體染色體有一式3份,其DNA含量為其它11條染色體的1.5倍。在DNA定量相當(dāng)準(zhǔn)確的條件下,用已知能檢測(cè)某一連鎖群的探針?lè)謩e與12種三體的總DNA雜交。根據(jù)劑量效應(yīng),雜交強(qiáng)弱與同源序列的含量成正比,雜交后對(duì)應(yīng)三體的DNA濾膜放射自顯影顯帶強(qiáng)度將明顯高于其它1

36、1種,由此可以判定該標(biāo)記所對(duì)應(yīng)的序列就在該三體染色體上。隨著技術(shù)的進(jìn)步,原位分子雜交的靈敏度已可以揭示單拷貝序列的雜交位點(diǎn),因此采用原位分子雜交可以容易地將連鎖群的分子標(biāo)記定位到染色體上。要得到一個(gè)完整的遺傳圖譜,必須知道染色體上的標(biāo)記與著絲粒之間的距離。一個(gè)完整的染色體具有以下幾個(gè)主要部分:著絲粒、縊痕、隨體及端粒,這些基本結(jié)構(gòu)在生物染色體的運(yùn)動(dòng)與復(fù)制等方面起著重要的作用,其結(jié)構(gòu)也是遺傳圖譜制作中不可忽視的重要部分。由于著絲粒并不是一個(gè)基因,不能從表型測(cè)知,因此采用常規(guī)的兩點(diǎn)、三點(diǎn)乃至多點(diǎn)分析方法是無(wú)法確定標(biāo)記與著絲粒之間的關(guān)系的。在經(jīng)典遺傳圖譜的構(gòu)建中,一般采用近端著絲粒染色體來(lái)對(duì)基因與著

37、絲之間的距離進(jìn)行定位。近端著絲粒染色體是正常染色體在著絲粒附近斷裂形成的異常染色體。目前已獲得小麥全部42條染色體的近端著絲粒染色體。利用染色體易位材料也可以判斷著絲粒在染色體上的位置。一般易位點(diǎn)和著絲粒所在部分的交換被抑制,因而推算位于著絲粒兩旁的易位點(diǎn)與標(biāo)記基因間的重組率時(shí)一般都偏小。利用這個(gè)現(xiàn)象可以推算連鎖圖上著絲粒的位置。在細(xì)胞學(xué)上,利用已知易位點(diǎn)的易位系統(tǒng)進(jìn)行基因分析也可知道著絲粒的位置。早在1945年,在玉米中就利用易位分析的結(jié)果推測(cè)了全部染色體的著絲粒位置。染色體上的端粒是指染色體的自然末端。在遺傳圖譜的構(gòu)建中,端粒位置的確定就意味著為染色體的全長(zhǎng)設(shè)定界標(biāo)。傳統(tǒng)的凝膠電泳方法由于

38、分辨能力有限,大多數(shù)情況下無(wú)法將具有多態(tài)性的端粒片段區(qū)分開(kāi)來(lái)。一般要借助具有高分辨率的脈沖場(chǎng)凝膠電泳(PFGE)才能將有差異的端粒片段分離開(kāi)來(lái)。利用PFGE與切割位點(diǎn)稀少的限制性酶相結(jié)合,Wu和Tanksley(1993)研究了水稻端粒結(jié)構(gòu)的特征,采用來(lái)自擬南芥的端粒探針,將三個(gè)水稻的端粒DNA電泳條帶分別定位在第8、9、11染色體上,并證實(shí)了多態(tài)性的端粒片段不僅在遺傳上而且在物理上與遺傳圖譜上最遠(yuǎn)端的RFLP標(biāo)記相連鎖。目前,在日本水稻基因組研究計(jì)劃所構(gòu)建的包含2275個(gè)標(biāo)記的水稻分子連鎖圖中,除第9染色體之外,其余11條染色體的著絲粒(區(qū))都已定位(Harushima et al. 199

39、8)。另外,該圖中的第5染色體短臂、第11染色體兩臂以及第12染色體短臂的端粒也已定位。二、飽和DNA標(biāo)記連鎖圖的制作遺傳圖譜飽和度是指單位長(zhǎng)度染色體上已定位的標(biāo)記數(shù)或標(biāo)記在染色體上的密度。一個(gè)基本的染色體連鎖框架圖大概要求在染色體上的標(biāo)記平均間隔不大于20cM。如果構(gòu)建連鎖圖譜的目的是為了進(jìn)行主基因的定位,其平均間隔要求在1020cM或更小。用于QTL定位的連鎖圖,其標(biāo)記的平均間隔要求在10cM以下。如果構(gòu)建的連鎖圖譜是為了進(jìn)行基因克隆,則要求目標(biāo)區(qū)域標(biāo)記的平均間隔在1cM以下。不同生物基因組大小有極大差異,因此滿(mǎn)足上述要求所需的標(biāo)記數(shù)是不同的。以人類(lèi)和水稻為例,它們的基因組全長(zhǎng)分別為3.3

40、×106kb和4.5×105kb,如果構(gòu)建一個(gè)平均圖距為0.5cM的分子圖譜,則所要定位的標(biāo)記數(shù)就要分別達(dá)到6600和3000個(gè)。幾種生物不同圖譜飽和度下所需定位的標(biāo)記數(shù)如表3.2所示。表3.2 遺傳圖譜達(dá)到特定飽和度所需的標(biāo)記數(shù)生物人類(lèi)水稻玉米擬南芥番茄基因組大小(kb)(cM)kb/cM3.3×106330010004.5×10515003002.5×106250010007.0×1045001407.1×1051500473圖譜飽和度20cM10cM5cM1cM0.5cM165330660330066007515030

41、01500300012525050025005000255010050010007515030015003000Tanksley等(1988)以假設(shè)擁有12條染色體,每條長(zhǎng)100cM,全長(zhǎng)1200cM的生物為例,研究了所需標(biāo)記數(shù)與圖譜飽和度之間的關(guān)系,發(fā)現(xiàn)影響所需標(biāo)記數(shù)的主要因素有兩個(gè)。一個(gè)是標(biāo)記間的平均距離,即圖譜總長(zhǎng)度除以定位的標(biāo)記數(shù),它反映了標(biāo)記圖譜的平均密度。對(duì)于染色體全長(zhǎng)1200cM的生物,如果定位了120個(gè)標(biāo)記,則標(biāo)記間的平均距離為10cM。另一個(gè)因素是標(biāo)記間的最大距離。標(biāo)記在基因組上的分布是不均勻的。即使在一張平均密度很高的圖譜上,仍然可能存在較大的間隙區(qū)。例如,據(jù)理論推算,如果

42、用于作圖的標(biāo)記是隨機(jī)選擇的,則當(dāng)標(biāo)記平均距離為1cM時(shí),仍有可能存在10cM的間距。而若要將最大可能間距從10cM減小到5cM,則需要另外增加1000個(gè)標(biāo)記。因此,通過(guò)提高圖譜平均密度的方法來(lái)縮小最大標(biāo)記間距是很困難的。在實(shí)際研究中,為了填補(bǔ)間隙,應(yīng)有針對(duì)性地在間隙區(qū)上尋找標(biāo)記,或?qū)ふ以撻g隙所在區(qū)域上有差異的親本構(gòu)建作圖群體。沒(méi)有一種標(biāo)記在基因組中分布是完全隨機(jī)的。如著絲粒區(qū)通常以重復(fù)序列為主,因而以單拷貝克隆為探針的RFLP標(biāo)記就不可能不覆蓋這些染色體區(qū)域。從這一點(diǎn)考慮,利用特性上互補(bǔ)的不同DNA標(biāo)記進(jìn)行遺傳作圖,將有助于提高遺傳圖譜的飽和度。三、DNA標(biāo)記連鎖圖與經(jīng)典遺傳連鎖圖的整合從1987年報(bào)道玉米和番茄的RFLP遺傳圖譜以來(lái),具有重要經(jīng)濟(jì)價(jià)值的栽培植物幾乎都已構(gòu)建了以RFLP為主的DNA標(biāo)記遺傳圖譜,其中水稻分子圖譜上所定位的RFLP標(biāo)記數(shù)已超過(guò)2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論