計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)_第1頁(yè)
計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)_第2頁(yè)
計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)_第3頁(yè)
計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)_第4頁(yè)
計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)應(yīng)用生物信息學(xué)作業(yè)姓名:李元元 學(xué)號(hào):021402129 年級(jí):2002級(jí) 專(zhuān)業(yè):生物技術(shù)系GenMapDB:一個(gè)已作圖的人類(lèi)細(xì)菌人工染色體克隆的數(shù)據(jù)庫(kù)文摘:GenMapDB(1)/genmapdb是已作圖的錨定到STS(序列標(biāo)簽位點(diǎn))標(biāo)記上的細(xì)菌人工染色體克隆的存儲(chǔ)庫(kù)。目前,GenMapDB包含已作圖的分布于共19條染色體上的300多個(gè)克隆,包括2、4、5號(hào)染色體,9-22,X和Y染色體。該DB提供了有關(guān)來(lái)自RPCI-11男性細(xì)菌人工染色體文庫(kù)的人類(lèi)細(xì)菌人工染色體克隆的位置信息。該DB還包括限制性片斷分析數(shù)據(jù)即克隆的末端序列。公眾

2、可免費(fèi)獲得GenMapDB。GenMapDB的主要目的在于規(guī)劃整合作圖數(shù)據(jù),以方便研究人員從中尋找可用于基因測(cè)序研究和染色體突變分析的細(xì)菌人工染色體克隆。前言:物理圖譜無(wú)論對(duì)基因作圖還是基因測(cè)序都十分重要,我們實(shí)驗(yàn)室正在對(duì)一組細(xì)菌人工染色體克隆進(jìn)行作圖和定性分析,每個(gè)克隆包含有1Mb大小的人類(lèi)基因組。為便于管理此項(xiàng)作圖課題中所得數(shù)據(jù),GenMapDB應(yīng)運(yùn)而生。GenMapDB要實(shí)現(xiàn)的兩個(gè)主要目標(biāo)是:(1)整合實(shí)驗(yàn)室數(shù)據(jù)庫(kù)資源,(2)便于公眾獲得分享我們的數(shù)據(jù)庫(kù)資源。不同于其他數(shù)據(jù)庫(kù)資源,我們對(duì)所有的細(xì)菌人工染色體克隆進(jìn)行了作圖和定性分析,并且所有的條目都有專(zhuān)業(yè)人員監(jiān)管。GenMapDB基于細(xì)菌

3、人工染色體克隆在染色體上的分布情況來(lái)對(duì)全部克隆組織分類(lèi)。針對(duì)每條染色體,我們列出用于作圖的STS(表達(dá)序列標(biāo)簽)標(biāo)記基因和與它們相關(guān)的細(xì)菌人工染色體克隆。另外,我們還可以通過(guò)限制性酶切型克隆,細(xì)菌人工染色體末端序列(插入末端的DNA序列)和細(xì)胞遺傳學(xué)定位。同時(shí)還可鏈接到其他基因組數(shù)據(jù)庫(kù),比如放射性雜交數(shù)據(jù)庫(kù)(2)RHdb,HTTP/www.ebi.ac.uk/RHdbGeneMap99(3)/genemapqq,以便于同這些數(shù)據(jù)庫(kù)中的數(shù)據(jù)整合。GenMapDB允許用戶可以從均勻分布于其中的長(zhǎng)約1Mb的人類(lèi)的基因組細(xì)菌人工染色體克隆中獲取大量信

4、息,也能滿足對(duì)特定基因組區(qū)段的BAC克隆的作圖感興趣的人們的要求。同樣地,研究腫瘤細(xì)胞基因重組的科學(xué)家可以獲得有關(guān)含有與在腫瘤細(xì)胞發(fā)生重組區(qū)段相應(yīng)的區(qū)域的克隆。數(shù)據(jù)庫(kù)結(jié)構(gòu):支持Access,服務(wù)界面由Apcache網(wǎng)站服務(wù)器支持,包括Perl CGI script程序編寫(xiě)語(yǔ)言和Perl 數(shù)據(jù)庫(kù)向?qū)謨?cè)。用戶可以利用Perl scripts程序設(shè)計(jì)語(yǔ)言輸入不同來(lái)源的數(shù)據(jù)。有些輸入的數(shù)據(jù)可采用html格式和CGI scripts,而像指紋和細(xì)菌人工染色體末端序列數(shù)據(jù)則是由圖片分析軟件產(chǎn)生。這樣的話,我們可通過(guò)從語(yǔ)法上分析輸入結(jié)果的純文本文件來(lái)獲得相關(guān)數(shù)據(jù)。ABI TracesMapping Dat

5、a excel sheetsGeneMapFootprints99 Auto PHREDGenMapDBBand sizeimageInterpolated RH MarkersAccession numberGenebankFasta sequenceFISH Mapping ResultsFramwork RH Markers physical distanceGeneMap99  Figure 1. GenMapDB結(jié)構(gòu)流程圖. 已作圖的細(xì)菌人工染色體克?。篏enMapDB收集并展示我們實(shí)驗(yàn)室已作圖的人類(lèi)細(xì)菌人工染色體克隆,核心依據(jù)在于細(xì)菌人工染色體克隆的基因組定位與GeneB

6、ridge4(GB4) RH圖譜中的STS標(biāo)記基因有關(guān)(每一個(gè)STS在全基因組中都是唯一的)。利用NCBI上的Greg schuler選取一些STS標(biāo)記基因作為細(xì)菌人工染色體克隆作圖的錨定位點(diǎn),然后利用標(biāo)記基因制作放射性標(biāo)記的探針,以便于通過(guò)雜交,結(jié)合到RPCI-11人類(lèi)男性細(xì)菌人工染色體文庫(kù)的高密度濾膜上。被證實(shí)含有STS標(biāo)記的細(xì)菌人工染色體克隆將被從基因文庫(kù)中釣出來(lái),并進(jìn)行單克隆培養(yǎng),然后利用這些單克隆培養(yǎng)物,通過(guò)二次雜交和PCR(聚合酶鏈?zhǔn)椒磻?yīng)),進(jìn)一步驗(yàn)證此細(xì)菌人工染色體克隆中所攜帶的STS的具體信息。STS一經(jīng)證實(shí),與STS標(biāo)記基因匹配的細(xì)菌人工染色體克隆就將被提交至GenMapDB

7、。另外,還可進(jìn)行很多分子特征的分析,包括Hind指紋分析和細(xì)菌人工染色體末端序列分析,以便于將我們基于STS作圖的圖譜同細(xì)胞遺傳學(xué)圖譜進(jìn)行整合。GenMapDB還可以提供細(xì)菌人工染色體克隆經(jīng)熒光原位雜交繪圖后得到的細(xì)胞遺傳學(xué)地址。內(nèi)容:該數(shù)據(jù)庫(kù)可分為:已作圖的細(xì)菌人工染色體克隆,Hind 指紋圖譜,細(xì)菌人工染色體末端分序列和細(xì)胞遺傳學(xué)圖譜定位。已作圖的細(xì)菌人工染色體克隆按照每個(gè)細(xì)菌人工染色體克隆在染色體上的分布,依次排列各個(gè)染色體,然后逐一顯示其上的克隆。每一個(gè)條目包括該克隆在CR500上的物理位置和其距染色體p端的距離(以Mb表示)。另外還包括其STS信息。以表示的物理距離是根據(jù)來(lái)自RH圖譜

8、中以差值發(fā)求的值來(lái)計(jì)算的距離框架標(biāo)記的距離。其精確性取決于RH圖譜的精確性,并因克隆在基因組中的位置的不同而異?;趯?duì)14號(hào)染色體和16號(hào)染色體上的120個(gè)克隆的FISH(熒光原位雜交)分析結(jié)果的初步預(yù)測(cè)顯示,其中有7個(gè)克?。?個(gè)位于14號(hào)染色上,3個(gè)位于16號(hào)染色體上)與RH圖譜上顯示的染色體不相匹配。大部分克隆所在的染色體是與RH圖譜和細(xì)胞遺傳學(xué)圖譜一致的,而位于14號(hào)染色體上的這4個(gè)克隆,RH圖譜卻顯示其位于不同的染色體位置上。 Figure 2. 輸出主頁(yè)面的一個(gè)例子。這里顯示l6號(hào)染色體克隆的搜索結(jié)果。數(shù)據(jù)包括STS標(biāo)記、物理位置和與之相對(duì)應(yīng)的細(xì)菌人工染色體克隆。我們給出每個(gè)標(biāo)記的兩

9、個(gè)名稱(chēng):RH數(shù)據(jù)庫(kù)中的識(shí)別號(hào)和每個(gè)標(biāo)記在GeneMap99中的名稱(chēng),可據(jù)此建立與RH數(shù)據(jù)庫(kù)和GeneMap99的鏈接。同時(shí)在內(nèi)部建立每一個(gè)克隆的名字與顯示該克隆詳細(xì)分子信息的頁(yè)面的鏈接。Hind 指紋分析我們繪制出每個(gè)克隆的Hind的限制酶切位點(diǎn)以提供其唯一的分子識(shí)別標(biāo)識(shí)。獲得的Hind指紋用Sanger中心(4)開(kāi)發(fā)的免費(fèi)軟件IMAGE來(lái)進(jìn)行分析。片段的大小以表格形式和電泳遷移重組圖來(lái)顯示出來(lái)。  Figure 3.已作圖的克隆圖譜主頁(yè)面。這里顯示了來(lái)自16號(hào)染色體上的細(xì)菌人工染色體RP11315L9克隆的相關(guān)信息。包括在染色體上的定位,物理地址和細(xì)胞遺傳學(xué)地址,Hind限制性酶切

10、類(lèi)型,經(jīng)Hind酶切后的片段大小和末端序列在Genebank中的獲取號(hào)。 細(xì)菌人工染色體末端序列我們通過(guò)對(duì)插入每個(gè)克隆的DNA片段末端序列進(jìn)行測(cè)序,根據(jù)重疊的片段排序,并同人類(lèi)基因組圖譜進(jìn)行比對(duì)(5)。細(xì)菌人工染色體末端序列通過(guò)利用Big-Dye末端化學(xué)轉(zhuǎn)移法(PE Biosystems,CA)循環(huán)測(cè)序,借助Auto PHRED軟件(6),這是一個(gè)由Perl script語(yǔ)言編寫(xiě)的堿基報(bào)告程序,來(lái)輸入代測(cè)序列。如果一段序列中包含的堿基的PHRED值大于20,表明堿基的錯(cuò)誤率小于1/100,結(jié)果就可以提交給Genebank。用戶可以通過(guò)GenMapDB上與Genebank的超鏈接獲取相關(guān)測(cè)序數(shù)據(jù)

11、。細(xì)胞遺傳學(xué)分析結(jié)果通過(guò)熒光原位雜交(FISH)技術(shù)作圖克隆,進(jìn)一步驗(yàn)證其序列的準(zhǔn)確性及其在染色體上分布情況是否符合實(shí)際情況。美國(guó)國(guó)立癌癥研究所(NCI)腫瘤基因組解剖計(jì)劃(CGAP)(7)中的一個(gè)子項(xiàng)目腫瘤染色體畸變計(jì)劃(CCAP)(8)/CCAP參與此項(xiàng)工作的進(jìn)行。腫瘤基因組測(cè)序的結(jié)果可從CCAP網(wǎng)站和GenMapDB中獲取。在Figure. 3中,我們顯示了經(jīng)熒光原位雜交后所得的細(xì)胞遺傳學(xué)圖譜條帶的文本形式的結(jié)果和圖形標(biāo)識(shí)。更多鏈接:同時(shí)建立與RHdb,GenMap99和Unigene(9)的超鏈接以便于用戶獲取更多信息,同時(shí)將我們的圖

12、譜與其他基因組圖譜進(jìn)行資源整合。用戶可以從中獲取更多關(guān)于作為圖譜繪制中錨定位點(diǎn)的STS標(biāo)記的信息,還有引物序列,PCR反應(yīng)條件和有關(guān)RH圖譜中 LOD值表達(dá)的標(biāo)記定位的定量檢測(cè)數(shù)據(jù)集合。與Unigene建立超鏈接,是我們注釋圖譜的第一步。與包含序列和圖譜信息的數(shù)據(jù)庫(kù)進(jìn)行資源整合至關(guān)重要。我們的目標(biāo)就是要提供一整套可被用于作為平均分布于人類(lèi)基因組上的標(biāo)識(shí)的克隆。獲取途徑:我們的數(shù)據(jù)庫(kù)對(duì)所有用戶免費(fèi)開(kāi)放。您可以通過(guò)檢索染色體和某一特定基因組區(qū)域來(lái)進(jìn)入相關(guān)數(shù)據(jù)庫(kù)。GenMapDB中的數(shù)據(jù)每月更新。為便于用戶快速檢索,我們采用450MHZ的奔騰型計(jì)算機(jī),其擁有128M RAM和6.4GB的存儲(chǔ)空間來(lái)存

13、儲(chǔ)數(shù)據(jù)。未來(lái)發(fā)展動(dòng)向:我們計(jì)劃在如下方面進(jìn)行改進(jìn),包括GenMapDB數(shù)據(jù)的整合,注釋和運(yùn)行處理的速度。目前,該數(shù)據(jù)庫(kù)共包括位于2,4,5,9-22,X和Y共19條染色體上的基因的克隆。到2001年初,我們將克隆下一步擴(kuò)大到覆蓋整個(gè)人類(lèi)基因組。隨著人類(lèi)基因組測(cè)序的完成,我們發(fā)展的目標(biāo)就是將我們已繪制的圖譜同其他公共資源,如TIGR(美國(guó)基因組研究所)細(xì)菌人工染色體末端序列數(shù)據(jù)庫(kù)(10) /tdb/humgen/bac_end_search/bac_end_intro.html,華盛頓大學(xué)的細(xì)菌人工染色體指紋數(shù)據(jù)庫(kù)資源(11)

14、/gsc/human/human_database.shtml,NCI CCAP(12)/CCAP/bac.cgi,Roswell Park 癌癥細(xì)菌人工染色體資源資源庫(kù)(/human/overview.html)和華盛頓大學(xué)的資源庫(kù)資源(/bacresource/index.shtml)整合。另外包括一些專(zhuān)門(mén)的已建立克隆圖譜的研究小組。這些資源庫(kù)提供了大量基于通過(guò)Hind指紋分析,細(xì)菌人工染色體末端序列分析和細(xì)胞遺傳學(xué)分析

15、來(lái)研究克隆特征的信息,我們的工作是定性并提供有關(guān)每個(gè)克隆體的Hind指紋分析,細(xì)菌人工染色體末端序列分析和細(xì)胞遺傳學(xué)分析數(shù)據(jù),彼此的工作是互補(bǔ)的。GenMapDB還建立了與其他資源的鏈接,用戶可根據(jù)不同需要從中獲取不同的信息。為了便于更好地解讀克隆所蘊(yùn)含的生物學(xué)意義,我們將通過(guò)定性其所包含的序列特征并同人類(lèi)基因組進(jìn)行比對(duì),來(lái)注釋我們獲得的細(xì)菌人工染色體末端序列。同時(shí)利用基因預(yù)測(cè)和比對(duì)軟件提高運(yùn)行處理速度,擴(kuò)展存儲(chǔ)空間。屆時(shí),我們還可以將數(shù)據(jù)庫(kù)運(yùn)行于其他數(shù)據(jù)庫(kù)服務(wù)器上,比如Oracle或與目前的Perl scripts 沒(méi)有很大差別的UNIX平臺(tái)。致謝:我們的工作得到Merck基因組研究中心,國(guó)

16、家健康中心和HG01880的大力支持,特此表示感謝。腳注:與我們聯(lián)系,您可以通過(guò)以下方式:Tel: +1 215 590 4950; Fax: +1 215 590 3709; Email: .原文參考文獻(xiàn):1 Morley,M. and Bruzel,A. (1999) A resource of mapped human bacterial artificial chromosome clones. Genome Res., 9, 989993. 2 Rodriguez-Tomé,P. and Lijnzaad,P. (2000)

17、 RHdb: the Radiation Hybrid database. Nucleic Acids Res., 28, 146147. Updated article in this issue: Nucleic Acids Res. (2001), 29, 165166. 3 Deloukas,P., Schuler,G.D., Gyapay,G., Beasley,E.M., Soderlund,C., Rodriguez-Tomé,P., Hui,L., Matise,T.C., MuKusick,K.B., Beckmann,J.S. et al. (1998) A ph

18、ysical map of 30 000 human genes. Science, 282, 744746. 4 Gyapay,G., Schmitt,K., Fizames,C., Jones,H., Vega-Czarny,N., Spillett,D., Muselet,D., PrudHomme,J.F., Dib,C., Auffray,C., Morissette,J., Weissenbach,J. and Goodfellow,P.N. (1996) A radiation hybrid map of the human genome. Hum. Mol. Genet., 5

19、, 339346. 5 Osoegawa,K., Woon,P.Y., Zhao,B., Frengen,E., Tateno,M., Catanese,J.J. and de Jong,P.J. (1998) An improved approach for construction of bacterial artificial chromosome libraries. Genomics, 52, 18. 6 Sulston,J., Mallet,F., Durbin,R. and Horsnell,T. (1989) Image analysis of restriction enzy

20、me fingerprint autoradiograms. Comput. Applic. Biosci., 5, 101106. 7 Ewing,B. and Green,P. (1998) Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Res., 8, 186194. 8 Ewing,B., Hillier,L., Wendl,M.C. and Green,P. (1998) Base-calling of automated sequencer traces

21、 using phred. I. Accuracy assessment. Genome Res., 8, 175185. 9 Kirsch,I.R., Green,E.D., Yonescu,R., Strausberg,R., Carter,N., Bentley,D., Leversha,M.A., Dunham,I., Braden,V.V., Hilgenfeld,E. et al. (2000) A systematic, high-resolution linkage of the cytogenetic and physical maps of the human g

22、enome. Nature Genet., 24, 339340. 10 Zhao,Z. (2000) Human BAC ends. Nucleic Acids Res., 28, 129132. Updated article in this issue: Nucleic Acids Res. (2001), 29, 141143. 11 Marra,M.A., Kucaba,T.A., Dietrich,N.L., Green,E.D., Brownstein,B., Wilson,R.K., McDonald,K.M., Hillier,L.W., McPherson,J.D. and

23、 Waterston,R.H. (1997) High throughput fingerprint analysis of large-insert clones. Genome Res., 7, 10721084. 附:翻譯相關(guān)說(shuō)明1 英文原文來(lái)源:Nucleic Acids Research, 2001, Vol. 29, No. 1 144-147 核酸研究© 2001 Oxford University Press 牛津大學(xué)出版社GenMapDB: a database of mapped human BAC clones Michael Morley, Melissa A

24、rcaro, Joshua Burdick, Raluca Yonescu1, Thomas Reid1, Ilan R. Kirsch1 and Vivian G. Cheung* Department of Pediatrics, University of Pennsylvania, The Childrens Hospital of Philadelphia, 3516 Civic Center Boulevard, ARC 516, Philadelphia, PA 19104, USA and 1Genetics Department, Medicine Branch, Natio

25、nal Cancer Institute, NIH, Bethesda, MD 20889, USA 2 本文系作者個(gè)人獨(dú)立翻譯完成,絕大部分是自己組織的語(yǔ)言,難免有不足之處,請(qǐng)老師指正。在基本翻譯完后,參考了一些書(shū)查閱相關(guān)專(zhuān)業(yè)術(shù)語(yǔ)的解釋?zhuān)f(shuō)明如下:2.1相關(guān)背景知識(shí)和名詞解釋?zhuān)?)GenMapDB V.CheungR-783實(shí)驗(yàn)室維護(hù)的一個(gè)人類(lèi)BAC圖譜數(shù)據(jù)庫(kù) 它包含一群已作圖的BAC克隆的信息。它以1Mb 的間距覆蓋了人類(lèi)第2、4、5 、9-22、X和Y共19條染色體上的BAC克隆,在1999年初總長(zhǎng)度達(dá)到1156Mbp。他們利用來(lái)自RPCI-11男性BAC文庫(kù)的人類(lèi)BAC克隆作為原材料,

26、通過(guò)濾膜雜交和STS-content PCR(Cheung et al, 1999)技術(shù)作圖。BAC克隆錨定到來(lái)自GeneBridge4 RH map或染色體特異YAC圖譜中的STS上,該圖譜中STS的間距大約為1Mb。(2)放射性雜交數(shù)據(jù)庫(kù)(RHdb)RHdb是收錄用于構(gòu)建放射性雜交圖譜的原始數(shù)據(jù)的數(shù)據(jù)庫(kù),包括STS數(shù)據(jù)、分值、實(shí)驗(yàn)條件和多方面的交叉參考數(shù)據(jù)。2001年1月公布的RHdb Release19.0版本包含約229個(gè)實(shí)驗(yàn)條件、92個(gè)圖譜的三個(gè)物種(包括人、小鼠和大鼠)的106,574個(gè)STSs。 放射性雜交圖譜是根據(jù)放射性雜交矢量分值算后構(gòu)建的染色體圖譜,是另一種遺傳圖譜。由于放

27、射性雜交圖譜可以包括非多態(tài)性標(biāo)記,對(duì)于遺傳圖譜的完善是不可缺少的補(bǔ)充,且可以對(duì)為澄清的多態(tài)性STS簇排序簡(jiǎn)單地說(shuō),兩個(gè)標(biāo)記的矢量越相似,他們?cè)谌旧w上的位置就越近。國(guó)際上的合作研究計(jì)劃產(chǎn)生了大量的人、小鼠和大鼠雜交數(shù)據(jù),這樣就可以構(gòu)建較準(zhǔn)確的STS圖譜。它對(duì)于研究人類(lèi)多因素遺傳疾病有重要價(jià)值。(3)GeneMap99GeneMap98提供了基因的位點(diǎn),位點(diǎn)由STS標(biāo)記并且每一個(gè)在全基因組中都是唯一的。由于當(dāng)時(shí)只有一小部分人類(lèi)基因組測(cè)序完成,只有3%的STSs序列對(duì)應(yīng)實(shí)際的基因。后來(lái),就從來(lái)源于ESTS中的STS序列中得到。提供了每條染色體基因大致的分布情況。在ESTS水平上比較了預(yù)期的基因密度

28、和檢測(cè)到的基因密度,所以可從中獲得關(guān)于基因的活性和基因計(jì)量效應(yīng)的相關(guān)信息。(4)Sanger中心Sanger中心是世界上最大的DNA測(cè)序中心之一。它承擔(dān)著人類(lèi)基因組計(jì)劃的1/3,即10億堿基對(duì)的測(cè)序任務(wù),以及一些其它物種的測(cè)序。人類(lèi)基因組測(cè)序集中在以下染色體:1、6、9、10、13、20、22和X。(5)把長(zhǎng)DNA打斷,用BAC增殖。以不同BAC的為對(duì)象,這個(gè)測(cè)定其兩端序列,確定之間的覆蓋關(guān)系,再把每個(gè)BAC打碎測(cè)序進(jìn)行拼接。這樣便于許多單位分工合作,平行作業(yè)。大量測(cè)序后用計(jì)算機(jī)組裝拼接。人類(lèi)基因組計(jì)劃就是按這種“分而治之”的策略進(jìn)行的。(6)Auto PHRED軟件PHRED測(cè)序程序,它實(shí)現(xiàn)

29、堿基識(shí)別和錯(cuò)誤率估算。(7)美國(guó)國(guó)立癌癥研究所腫瘤基因組解剖計(jì)劃(NCI-CGAP),包括其中一個(gè)子項(xiàng)目腫瘤染色體畸變計(jì)劃(CCAP)NCBI與CGAP緊密合作。CGAP旨在得到用于解碼腫瘤細(xì)胞分子解剖的信息和工具。其目的在于研究正常細(xì)胞、癌變前病變細(xì)胞和腫瘤細(xì)胞的基因表達(dá)圖譜,以便最終能夠促進(jìn)腫瘤病人的檢測(cè)、診斷和治療。CGAP目前正在制作跨度為1-2Mb的人染色體BAC克隆,這些克隆都是通過(guò)熒光原位雜交的方法定位的,這些已經(jīng)定位的克隆可以提供給其他研究組織。(8)Unigene 人類(lèi)基因序列集合EST稱(chēng)表達(dá)序列標(biāo)簽,是從cDNA克隆中隨機(jī)挑選出來(lái)進(jìn)行一次性測(cè)序的結(jié)果。一般長(zhǎng)約200-500

30、bp,通常作為基因的標(biāo)志。由于cDNA文庫(kù)的復(fù)雜性和測(cè)序的隨機(jī)性,有時(shí)多個(gè)代表同一基因或基因組。通過(guò)對(duì)EST的分析將其歸類(lèi)而形成EST簇,每一個(gè)EST簇代表著一個(gè)特定的基因,即Unigene。而Unigene數(shù)據(jù)庫(kù)收集了大量的EST簇,并與相關(guān)信息鏈接,如:表達(dá)的組織類(lèi)型、染色體作圖、表達(dá)的蛋白等。目前,用超過(guò)150萬(wàn)的構(gòu)建了83000個(gè)EST簇,代表了大部分的人類(lèi)基因。(9)cytogenetic map 細(xì)胞遺傳學(xué)圖在染色及顯微鏡的檢視下,染色體所呈現(xiàn)的形式。重要的地方在于稱(chēng)為亮帶和暗帶的區(qū)域,使得每條染色體獨(dú)一無(wú)二有別于其他條。這項(xiàng)特征在人類(lèi)的染色體臨床檢測(cè)上特別受到重視,稱(chēng)為核型(ka

31、ryotype),使科學(xué)家得以尋找染色體的變化。2.2參考書(shū)目:1 王哲 生物信息學(xué)概論 第四軍醫(yī)大學(xué)出版社 2002年4月 第一版2 郝柏林 張淑譽(yù) 生物信息學(xué)手冊(cè) 上??萍汲霭嫔?2000年10月 第一版3 加S.米塞諾 美S.A.克拉維茨 著 歐陽(yáng)紅生 阮承邁 李慎濤 等譯生物信息學(xué)方法指南(生命科學(xué)實(shí)驗(yàn)指南系列) 2005年2月 第一版3 統(tǒng)計(jì)信息正文頁(yè)數(shù) 5正文中文字?jǐn)?shù) 3303全文頁(yè)數(shù) 8全文字?jǐn)?shù) 6178還差700多字,我便又另外翻譯了一篇的兩小段。RefSeq和LocusLink:NCBI 基因核心資源摘要:目前,基因組測(cè)序的進(jìn)行使得大量基因的功能已經(jīng)得到確認(rèn)。大規(guī)模cDNA和基因組測(cè)序項(xiàng)目依據(jù)來(lái)自mRNA和比較基因組的信息和組建模型進(jìn)行更多基因的功能推測(cè)工作。這些,伴隨著科技文獻(xiàn)的大量涌現(xiàn),使得擁有一個(gè)全面綜合的基因和參考序列的向?qū)ё兊糜葹楸匾?。NCBI提供的LocusLink和RefSeq兩個(gè)資源數(shù)據(jù)庫(kù)可以滿足這些要求。LocusLink提供基因存儲(chǔ)中心組織人類(lèi)、小鼠、大鼠和斑馬魚(yú)基因的相關(guān)信息。RefSeq提供基因組,轉(zhuǎn)錄產(chǎn)物和蛋白質(zhì)的代表性參考序列。本文側(cè)重討論人類(lèi)、小鼠和大鼠及其對(duì)應(yīng)的蛋白質(zhì)數(shù)據(jù)信息。LocusLink和RefSeq共同提供非冗余的基因和其它位

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論