作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)
作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)
作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)
作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)
作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

作物分子身份證構(gòu)建軟件idanalysis的設(shè)計(jì)與實(shí)現(xiàn)

0總結(jié)【研究意義】黑龍江省是中國(guó)的主要大豆產(chǎn)區(qū)。1986年至2010年,共試驗(yàn)了275個(gè)大豆品種。1材料和方法1.1數(shù)據(jù)收集參試材料于2008年播種于黑龍江省農(nóng)墾科研育種中心基地,選擇40對(duì)引物對(duì)40個(gè)大豆品種進(jìn)行分析,參考陳慶山等1.2分子標(biāo)記多態(tài)度其中,行對(duì)應(yīng)的是n個(gè)材料,列對(duì)應(yīng)的是m個(gè)標(biāo)記,其中,a定義S定義V標(biāo)記多態(tài)度:在分子標(biāo)記中,單標(biāo)記或標(biāo)記組合的全部類型,叫作標(biāo)記多態(tài)型,標(biāo)記多態(tài)型的個(gè)數(shù),叫作標(biāo)記多態(tài)度,用d表示。1.3相鄰標(biāo)記區(qū)分度相關(guān)系數(shù)計(jì)算作物分子身份證理論及逐步擴(kuò)增法的算法由組陳慶山逐步擴(kuò)增法的具體過程(圖1):首先標(biāo)記按照等位基因多少進(jìn)行排序,計(jì)算相鄰標(biāo)記區(qū)分度相關(guān)系數(shù),淘汰相關(guān)系數(shù)過高的引物。然后選擇V在實(shí)際的執(zhí)行過程中,為了降低運(yùn)算量,每引入一個(gè)標(biāo)記,都要計(jì)算各材料對(duì)應(yīng)標(biāo)記組合的等位基因頻率,若頻率為1,則對(duì)該材料從計(jì)算數(shù)組中剔除,加快了計(jì)算速度。1.4作物種質(zhì)資源分子身份證編碼作物分子身份證是針對(duì)作物種質(zhì)資源或品種品系,基于作物分子標(biāo)記的多態(tài)性檢測(cè)手段,利用最簡(jiǎn)引物組合實(shí)現(xiàn)作物種質(zhì)資源最大區(qū)分,并以類似于身份證的等位基因編碼,作為標(biāo)識(shí)和圖形化的理論和技術(shù)?;诜肿由矸葑C的概念和構(gòu)建算法,結(jié)合實(shí)際應(yīng)用的需要,建立分子身份證的實(shí)現(xiàn)策略。策略共分4個(gè)部分:全庫(kù)構(gòu)建、部分構(gòu)建、選擇分析和分子身份證判定(ID判定)。1.4.1分子身份證的構(gòu)建全庫(kù)構(gòu)建是分子身份證構(gòu)建的基礎(chǔ),是基于數(shù)據(jù)庫(kù)中的全部材料和標(biāo)記信息,應(yīng)用1.2、1.3算法,對(duì)全部材料進(jìn)行分子身份證構(gòu)建的策略。全庫(kù)構(gòu)建的基本步驟如下:步驟1:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);步驟2:有效標(biāo)記數(shù)量判別。若標(biāo)記充足則轉(zhuǎn)入步驟3,否則轉(zhuǎn)入步驟4;步驟3:執(zhí)行算法,計(jì)算出材料(品種)分子身份證,包括標(biāo)出特異性條帶;步驟4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計(jì)算出材料的分子身份證。1.4.2分子身份證的計(jì)算在全庫(kù)構(gòu)建的基礎(chǔ)上,可選擇性地對(duì)部分材料進(jìn)行特異性引物條帶的篩選和分子身份證的構(gòu)建。部分構(gòu)建以全庫(kù)構(gòu)建的材料、標(biāo)記集為構(gòu)建背景,選擇部分材料以全部引物為標(biāo)記利用算法進(jìn)行分子身份證計(jì)算。部分構(gòu)建的基本步驟如下:步驟1:從全部材料中選擇部分材料集;步驟2:不符合標(biāo)記的剔除。剔除標(biāo)準(zhǔn)首先標(biāo)記的缺失太多(默認(rèn)不超過5%)其次是標(biāo)記間相似系數(shù)太高(默認(rèn)不高于0.8);步驟3:執(zhí)行算法,計(jì)算出部分材料分子身份證,包括標(biāo)出特異性條帶;步驟4:以標(biāo)記集能區(qū)分的材料數(shù)最多為依據(jù),計(jì)算出部分材料的分子身份證。1.4.3分子身份證編碼后部分標(biāo)記方法在全庫(kù)構(gòu)建的基礎(chǔ)上,可選擇部分標(biāo)記對(duì)材料進(jìn)行判別,主要用來考察部分標(biāo)記(受關(guān)注的)在分子多態(tài)水平上區(qū)分材料的能力。由于選定了部分標(biāo)記集,故算法上只需將供試材料的分子身份證編碼標(biāo)出即可。選擇分析的結(jié)果可能會(huì)鎖定唯一分子身份證的材料,也可能有多個(gè)共享一個(gè)分子身份證的材料,還可能由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。選擇分析的基本步驟如下:步驟1:從全部標(biāo)記中選擇部分標(biāo)記集;步驟3:將結(jié)果進(jìn)行分類顯示,唯一識(shí)別材料、分組識(shí)別材料和不確定材料。1.4.4基于庫(kù)的構(gòu)建在全庫(kù)構(gòu)建的基礎(chǔ)上,選擇幾個(gè)標(biāo)記,對(duì)待測(cè)材料進(jìn)行基于選定標(biāo)記的電泳試驗(yàn),將電泳帶型數(shù)字化,在全庫(kù)構(gòu)建的背景下,基于所選定標(biāo)記計(jì)算該待測(cè)材料與其他材料間的相似度,判別該材料的類別歸屬,從而達(dá)到品種識(shí)別和品種鑒定的目的。分子身份證判定分析步驟如下:步驟1:選定背景標(biāo)記集;步驟2:測(cè)定待測(cè)材料的帶型;步驟3:在該標(biāo)記集下,計(jì)算待測(cè)材料與數(shù)據(jù)庫(kù)中全材料的相似度,以判別該材料的歸屬。2結(jié)果2.1數(shù)據(jù)庫(kù)設(shè)計(jì)及軟件開發(fā)分子身份證軟件依據(jù)分子身份證的實(shí)現(xiàn)策略設(shè)計(jì)功能及界面(圖2),軟件功能包括:數(shù)據(jù)庫(kù)瀏覽及更新、全庫(kù)構(gòu)建、部分構(gòu)建、輸入構(gòu)建、選擇分析和ID判定等功能。2.1.1ows軟件環(huán)境分析分子身份證軟件應(yīng)用Microsoft公司VisualBasic6.0進(jìn)行程序開發(fā),軟件在開發(fā)時(shí)充分考慮到使用的兼容性問題,軟件可以在Windows9X/me/2000/XP/winVista/win7等大部份Windows的32位或64位操作系統(tǒng)下運(yùn)行,軟件的運(yùn)行對(duì)計(jì)算機(jī)硬件環(huán)境要求不高,Intel奔騰CPU/512M內(nèi)存/1G硬盤空間及以上機(jī)型都可運(yùn)行。如果構(gòu)建的標(biāo)記及材料數(shù)量過多時(shí),運(yùn)算時(shí)間會(huì)相應(yīng)增加,要想達(dá)到理想的運(yùn)算效率,計(jì)算機(jī)的硬件配置不應(yīng)過低。分子身份證軟件首發(fā)版本為IDAnalysis1.0,軟件登記號(hào):2007SR11870a,通過應(yīng)用完善了軟件的功能及操作界面,目前版本為IDAnalysis4.1,軟件具有功能豐富、界面友好(圖3)、操作簡(jiǎn)單等優(yōu)點(diǎn),一步即可達(dá)到以往需要多個(gè)軟件聯(lián)合使用才能完成的任務(wù)。軟件可以獲得方式:發(fā)送索取軟件的郵件給作者qshchen@126.com或訪問“大豆設(shè)計(jì)網(wǎng)”站進(jìn)行下載。2.1.2主栽大豆品種分子身份證編碼標(biāo)記統(tǒng)計(jì)是將電泳膠圖上的目標(biāo)條帶數(shù)字化的過程,具體原則是根據(jù)擴(kuò)增片段的分子量由大到小依次按1、2、3、4……N的順序進(jìn)行記錄。其中,0表示零等位基因(即該泳道由于基因片段丟失而無帶),-1表示該品種數(shù)據(jù)由于試驗(yàn)操作造成缺失,-2表示該泳道出現(xiàn)雜合帶型。圖3為黑龍江省主栽大豆品種分子身份證構(gòu)建試驗(yàn)中所獲得的一張比較理想的電泳圖,以此圖為例闡明標(biāo)記統(tǒng)計(jì)原則。利用40對(duì)SSR引物對(duì)40份大豆品種進(jìn)行電泳分析,共獲得1600個(gè)標(biāo)記數(shù)據(jù),將標(biāo)記整理成軟件可識(shí)別的文本文檔(圖4)。數(shù)據(jù)文本的第1行第1個(gè)位置表示數(shù)據(jù)矩陣大小,其中“40/40”表示該數(shù)據(jù)文本中的數(shù)據(jù)矩陣為40行40列,第一個(gè)40表示有40個(gè)材料,第二個(gè)40表示有40對(duì)引物。向右接著是引物信息,引物需要用加引號(hào),矩陣大小及引物間加一半角空格,以換行符結(jié)尾。例如“40/40”“Satt516”“Satt338”“Satt573”。從第2行開始每行表示1個(gè)材料,從左向右第1個(gè)位置表示材料名稱,中英文皆可,但要加用引號(hào),向右接著是該資源使用40對(duì)不同引物的電泳標(biāo)記數(shù)據(jù),資源名及帶型標(biāo)記間加一半角空格,以換行符結(jié)尾。例如:“合豐25”1133。2.1.3數(shù)據(jù)庫(kù)合并功能分子身份證構(gòu)建的基礎(chǔ)是數(shù)據(jù),數(shù)據(jù)是由引物和材料組成的二維標(biāo)記矩陣集。由于數(shù)據(jù)缺失、引物更新和材料的變化而導(dǎo)致標(biāo)記集數(shù)據(jù)的動(dòng)態(tài)變化,而數(shù)據(jù)的改變進(jìn)一步?jīng)Q定了分子身份證的構(gòu)建也是動(dòng)態(tài)可變的。因此軟件設(shè)計(jì)開始時(shí)就考慮到由于對(duì)缺失數(shù)據(jù)的補(bǔ)充、新品種材料的更新,高多態(tài)性引物的加入等問題而導(dǎo)致數(shù)據(jù)集更新的麻煩。為解決數(shù)據(jù)集更新的麻煩,軟件開發(fā)了數(shù)據(jù)庫(kù)合并功能(圖5)。可以根據(jù)引物和材料的列表對(duì)多個(gè)數(shù)據(jù)集進(jìn)行整合,并可以對(duì)其發(fā)生改變的等位基因進(jìn)行校驗(yàn)和提示,這樣有利于整合最新的研究結(jié)果,開發(fā)全部材料最合適的分子身份證。合并后的數(shù)據(jù)結(jié)果以文本形式輸出(圖5),由結(jié)果文件可知,合并后的新數(shù)據(jù)集是由6份材料及4對(duì)引物組成,其中合并前二個(gè)數(shù)據(jù)集有1個(gè)差異數(shù)據(jù),差異數(shù)據(jù)為“東農(nóng)46,Satt516”,在a集中標(biāo)記是1,在b集中標(biāo)記是3,結(jié)果還顯示了合并到新數(shù)據(jù)集中的材料、引物的數(shù)量及名稱。2.2軟件認(rèn)證2.2.1分子身份證構(gòu)建將40對(duì)引物對(duì)40份大豆品種的標(biāo)記數(shù)據(jù)導(dǎo)入軟件,具體如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第三個(gè)圖標(biāo)“全庫(kù)構(gòu)建”,即可打開全庫(kù)構(gòu)建窗口(圖6)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件,點(diǎn)擊“IDanalysis”按鈕即可完成分子身份證構(gòu)建。構(gòu)建完的數(shù)據(jù)會(huì)顯示在窗口的數(shù)據(jù)顯示區(qū),點(diǎn)擊窗口文件下拉菜單-輸出-瀏覽文件保存位置-命名文件名-保存,結(jié)果文件以文本形式保存。文件內(nèi)容共分4部分,第1部分指明分析時(shí)的參數(shù);第2部分指明不符合引物信息;第3部分指明特異引物信息;第4部分給出引物組合及每個(gè)材料的分子身份證的編號(hào)(圖6)。由分子身份證構(gòu)建結(jié)果可知,在40對(duì)引物對(duì)40個(gè)大豆品種的分子身份證構(gòu)建中:共有13對(duì)引物由于缺失過多,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Sat_111、Sat_218、Satt231、Satt685、Satt514、Satt551、Satt077、Satt358、Satt424、Satt100、Satt838、Satt893和Satt891。共有7對(duì)引物由于與其他引物相似系數(shù)過高,不符合標(biāo)準(zhǔn)被剔除,剔除引物為Satt253、Satt192、Satt417、Sat_229、Satt127和Satt496。在分析的40個(gè)品種中,共有5個(gè)品種具有7個(gè)特異等位基因,因此,可以通過這些特異等位基因直接確定需要鑒定的品種,通過計(jì)算僅需要7對(duì)引物即可區(qū)分40個(gè)大豆品種,引物組合為Satt398、Satt380、Satt453、Satt288、Satt244、Sat_092和Satt206,例如北豆3號(hào)在該引物組合下的分子身份證編號(hào)為2411343。2.2.2開-觀看數(shù)據(jù)文件部分構(gòu)建的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第四個(gè)圖標(biāo)“部分構(gòu)建”,即可打開部分構(gòu)建窗口(圖7)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。從材料欄里選擇一些材料到目標(biāo)材料欄內(nèi),點(diǎn)擊“IDanalysis”按鈕即可完成部分材料的分子身份證構(gòu)建。同時(shí)為了方便用戶使用,軟件還提供“輸入構(gòu)建”窗口,在該窗口中將材料的選擇方式變?yōu)槿斯ぽ斎?其他功能相同。構(gòu)建完的結(jié)果文件內(nèi)容共分3部分,第1部分指明不符合引物信息;第2部分指明特異引物信息;第3部分給出引物組合及被選擇的部分材料的分子身份證的編號(hào)(圖7)。2.2.3分子身份證號(hào)碼ID判定的具體操作如下:打開分子身份證軟件,點(diǎn)擊快捷工具欄的第七個(gè)圖標(biāo)“ID判定”,即可打開ID判定窗口(圖8)。點(diǎn)擊文件下拉菜單-打開-瀏覽到數(shù)據(jù)文件-打開,導(dǎo)入數(shù)據(jù)文件。在“引物及ID”欄內(nèi)輸入引物名稱及分子身份證編號(hào),其格式為“Satt338,Satt369,Satt453:314”,點(diǎn)擊“PossibleGP”按鈕即可計(jì)算出由引物組合以及身份證編號(hào)所確定的唯一材料名稱。有些時(shí)候可能需要考察部分受關(guān)注的引物在分子多態(tài)水平上區(qū)分材料的能力。此時(shí)可以使用“選擇分析”功能,其結(jié)果可能是被唯一區(qū)分的材料,也可能是多個(gè)共享一個(gè)分子身份證的材料,或是由于缺失導(dǎo)致的具有不完全身份證的材料等幾種可能。3討論3.1標(biāo)記多態(tài)性和材料容量縮減關(guān)于尋找最優(yōu)引物組合,可以采用貪婪算法,窮舉法等多種方法。貪婪算法關(guān)于標(biāo)記多態(tài)度排序,在計(jì)算中可以看出,調(diào)整標(biāo)記的順序會(huì)直接影響結(jié)果,因此,可根據(jù)單個(gè)標(biāo)記等位基因多態(tài)性大小進(jìn)行排序,使區(qū)分能力較強(qiáng)的標(biāo)記更早出現(xiàn),這樣就使標(biāo)記組合的區(qū)分度迅速增加,從而加快算法搜索速度。關(guān)于材料容量縮減,每次有新標(biāo)記引入都會(huì)重新計(jì)算當(dāng)前標(biāo)記多態(tài)型下的每個(gè)材料條帶碼頻數(shù),而有部分材料在新標(biāo)記入選前等位基因組合頻率已經(jīng)為1,達(dá)到了區(qū)分目的,沒有重新計(jì)算的必要。因此,可以將被區(qū)分開的材料從計(jì)算的數(shù)據(jù)集中刪除,逐步縮減材料容量,達(dá)到加快算法目的。3.2web應(yīng)用程序技術(shù)在作物上的應(yīng)用到目前該軟件已經(jīng)在大豆、水稻、花生、玉米、高粱、真菌、木耳等多種作物上得到廣泛應(yīng)用相比VB程序語(yǔ)言,Java技術(shù)具有簡(jiǎn)單、完全面向?qū)ο?、屬于解釋?zhí)行語(yǔ)言、安全性高、可移植性強(qiáng)、執(zhí)行性能高、多線程以及動(dòng)態(tài)性等優(yōu)點(diǎn)3.3分子身份證的開發(fā)分子身份證軟件構(gòu)建核心目標(biāo)是為了利用最優(yōu)引物對(duì)組合完成對(duì)目標(biāo)材料群體的唯一性區(qū)分,如果具有較為完善的品種資源數(shù)據(jù)庫(kù)系統(tǒng),便可以解決資源的鑒定,育種材料的分析和候選審定材料的創(chuàng)新性判定等很多現(xiàn)實(shí)存在的棘手問題。在軟件數(shù)據(jù)庫(kù)開發(fā)方面,可以基于研究對(duì)象特性開發(fā)的各類特殊分子標(biāo)記來構(gòu)建分子身份證。在標(biāo)記開發(fā)方面,可以針對(duì)研究資源的特性,設(shè)計(jì)獨(dú)特的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論