生物信息學(xué)生物信息數(shù)據(jù)庫(kù)和其信息檢索省公共課一等獎(jiǎng)全國(guó)賽課獲獎(jiǎng)?wù)n件_第1頁(yè)
生物信息學(xué)生物信息數(shù)據(jù)庫(kù)和其信息檢索省公共課一等獎(jiǎng)全國(guó)賽課獲獎(jiǎng)?wù)n件_第2頁(yè)
生物信息學(xué)生物信息數(shù)據(jù)庫(kù)和其信息檢索省公共課一等獎(jiǎng)全國(guó)賽課獲獎(jiǎng)?wù)n件_第3頁(yè)
生物信息學(xué)生物信息數(shù)據(jù)庫(kù)和其信息檢索省公共課一等獎(jiǎng)全國(guó)賽課獲獎(jiǎng)?wù)n件_第4頁(yè)
生物信息學(xué)生物信息數(shù)據(jù)庫(kù)和其信息檢索省公共課一等獎(jiǎng)全國(guó)賽課獲獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本章主要內(nèi)容生物信息學(xué)數(shù)據(jù)庫(kù)類型序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)

功效數(shù)據(jù)庫(kù)其它專業(yè)數(shù)據(jù)庫(kù)生物信息學(xué)數(shù)據(jù)庫(kù)檢索檢索方法概述檢索實(shí)踐和案例第1頁(yè)生物信息學(xué)數(shù)據(jù)庫(kù)地位和作用經(jīng)典生物醫(yī)學(xué)試驗(yàn)大量零碎數(shù)據(jù)數(shù)據(jù)搜集整理大規(guī)模組學(xué)試驗(yàn)海量組學(xué)數(shù)據(jù)數(shù)據(jù)存放、注釋數(shù)據(jù)庫(kù)生物醫(yī)學(xué)應(yīng)用理論分析檢索查詢生物學(xué)研究第2頁(yè)生物信息學(xué)數(shù)據(jù)庫(kù)類型核酸研究(NucleicAcidsResearch)雜志每年第一期為生物信息學(xué)數(shù)據(jù)庫(kù)??珍涀钪饕飳W(xué)相關(guān)數(shù)據(jù)庫(kù),歸類并展示在/nar/database/c/。核酸序列數(shù)據(jù)庫(kù)RNA序列數(shù)據(jù)庫(kù)蛋白質(zhì)序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)基因組數(shù)據(jù)庫(kù)(非脊椎動(dòng)物)代謝與信號(hào)通路數(shù)據(jù)庫(kù)人類與其它脊椎動(dòng)物基因組人類基因與疾病微陣列數(shù)據(jù)庫(kù)與其它基因表示數(shù)據(jù)庫(kù)蛋白質(zhì)組資源其它分子生物學(xué)數(shù)據(jù)庫(kù)細(xì)胞器數(shù)據(jù)庫(kù)植物數(shù)據(jù)庫(kù)免疫學(xué)數(shù)據(jù)庫(kù)細(xì)胞生物學(xué)數(shù)據(jù)庫(kù)第3頁(yè)生物信息學(xué)數(shù)據(jù)庫(kù)類型序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)功效數(shù)據(jù)庫(kù)其它專業(yè)數(shù)據(jù)庫(kù)第4頁(yè)GooglevsBaidu淺薄百姓工具他能夠更厲害!甚至超出windows、Linux或Mac等操作系統(tǒng)第5頁(yè)一、序列數(shù)據(jù)庫(kù)主要收錄核酸和蛋白質(zhì)序列數(shù)據(jù)庫(kù),包含由基因組計(jì)劃產(chǎn)生基因組及其表示序列,由基因組序列所推測(cè)編碼和非編碼核酸和蛋白質(zhì)序列,以及個(gè)別生物學(xué)試驗(yàn)中測(cè)序取得核酸和蛋白質(zhì)序列?;蚪M序列數(shù)據(jù)庫(kù):GenomeDatabase(GDB)數(shù)據(jù)庫(kù)(

/)包含人、鼠、斑馬魚(yú)和果蠅4種真核生物基因組注釋分析。由EMBL-EBI和Sanger研究所聯(lián)合開(kāi)發(fā)。UCSCGenomeBrowser(/)加州大學(xué)圣克魯茲分校建立,包含各種脊椎和無(wú)脊椎動(dòng)物,以及主要模式生物基因組數(shù)據(jù)。第6頁(yè)核酸序列數(shù)據(jù)庫(kù)GenBank(

/Genbank)EMBL(

http://www.ebi.ac.uk/embl/)DDBJ(

http://www.ddbj.nig.ac.jp/)三個(gè)數(shù)據(jù)庫(kù)天天相互交換數(shù)據(jù)GenBank可經(jīng)過(guò)NCBI檢索系統(tǒng)Entrez獲取,Entrez集成來(lái)自主要DNA和蛋白序列數(shù)據(jù)庫(kù)數(shù)據(jù),包含物種、基因組、定位、蛋白結(jié)構(gòu)和結(jié)構(gòu)域等信息其它各種專業(yè)核酸數(shù)據(jù)庫(kù)非冗余參考序列數(shù)據(jù)庫(kù)RefSeq密碼子使用數(shù)據(jù)庫(kù)CodonUsageDatabaseCUTG基因可變剪接數(shù)據(jù)庫(kù)ASDB轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)TRANSFAC第7頁(yè)NCBI(NationalCenterofBiotechnologyInformation)美國(guó)國(guó)立生物技術(shù)信息中心第8頁(yè)三大數(shù)據(jù)庫(kù)之間聯(lián)絡(luò)第9頁(yè)ATTGACTAPrimaryvs.DerivativeDatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCACGTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGACAA第10頁(yè)GenBank中測(cè)序最多20個(gè)物種第11頁(yè)humanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis模式生物與基因測(cè)序第12頁(yè)virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenomesizesinnucleotidepairs(base-pairs)10410810510610710111010109bonyfishamphibians第13頁(yè)蛋白質(zhì)序列數(shù)據(jù)庫(kù)UniProt()

由Swiss-Prot、TrEMBL和PIR蛋白質(zhì)數(shù)據(jù)庫(kù)聯(lián)合構(gòu)建,提供蛋白質(zhì)序列和功效注釋關(guān)鍵資源。由三個(gè)子庫(kù)組成:(1)UniProtKB,知識(shí)庫(kù)(2)UniRef:參考簇(3)UniParc,全部公開(kāi)蛋白質(zhì)序列,包含每個(gè)序列源數(shù)據(jù)庫(kù)追溯信息。IPI(http://www.ebi.ac.uk/IPI/)國(guó)際蛋白質(zhì)索引數(shù)據(jù)庫(kù),針對(duì)蛋白質(zhì)組研究中利用數(shù)據(jù)庫(kù)搜索判定蛋白策略而構(gòu)建參考數(shù)據(jù)庫(kù),月更新,整合國(guó)際上主要蛋白質(zhì)數(shù)據(jù)庫(kù)(SwissProt,Refseq,PIR,TrEMBL,RefSeq,Ensembl,H-InvDB翻譯蛋白數(shù)據(jù)),整合過(guò)程中,直接接收手工注釋結(jié)果。Nr(

/refseq/)NCBI構(gòu)建,非冗余蛋白質(zhì)數(shù)據(jù)庫(kù),為每個(gè)蛋白質(zhì)序列統(tǒng)計(jì)賦予一個(gè)唯一gi號(hào),并將序列完全一致非冗余蛋白質(zhì)合并成簇。第14頁(yè)二、結(jié)構(gòu)數(shù)據(jù)庫(kù)核酸和蛋白質(zhì)空間結(jié)構(gòu)數(shù)據(jù)庫(kù),普通經(jīng)過(guò)X射線衍射和核磁共振取得數(shù)據(jù),也有同源建模等計(jì)算方法取得。結(jié)構(gòu)數(shù)據(jù)庫(kù)(核酸)NDB核酸結(jié)構(gòu)數(shù)據(jù)庫(kù)(/)收錄核酸晶體結(jié)構(gòu)數(shù)據(jù),包含X射線衍射和核磁共振結(jié)果,可經(jīng)過(guò)ADIT(theAutoDepInputTool)同時(shí)將結(jié)構(gòu)存放到NDB和PDB中,提供序列號(hào)檢索功效,能夠用NDB或PDBID號(hào)檢索,結(jié)果包含核酸結(jié)構(gòu)簡(jiǎn)明信息和圖片Rfam數(shù)據(jù)庫(kù)(http://rfam.sanger.ac.uk/)RNA家族多重序列比對(duì),一致性二級(jí)結(jié)構(gòu)和協(xié)方差模型,基于多重序列比正確非編碼RNA家族變異模式第15頁(yè)結(jié)構(gòu)數(shù)據(jù)庫(kù)(蛋白質(zhì))PDB(/pdb/)RCSB(ResearchCollaboratoryforStructuralBioinformatics)專門用于處理和公布生物大分子三維結(jié)構(gòu)知識(shí)庫(kù),提供數(shù)據(jù)庫(kù)檢索和下載服務(wù),以及PDB數(shù)據(jù)文件格式和其它文檔說(shuō)明,使用軟件可對(duì)PDB數(shù)據(jù)庫(kù)統(tǒng)計(jì)用各種模式顯示生物大分子三維結(jié)構(gòu)。蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP(

http://scop.mrc-lmb.cam.ac.uk/scop/)包含從PDB數(shù)據(jù)庫(kù)中提取全部結(jié)構(gòu)域,并詳細(xì)描述已知蛋白質(zhì)結(jié)構(gòu)之間關(guān)系MMDBNCBI分子模型數(shù)據(jù)庫(kù)。NCBI蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)(/sites/entrez?db=structure/)包含由x射線衍射和核磁共振試驗(yàn)得到全部PDB生物分子三維結(jié)構(gòu),與原始PDB結(jié)構(gòu)相比,增加一些附加信息:經(jīng)程序驗(yàn)證顯性化學(xué)圖像信息、一致二級(jí)結(jié)構(gòu)衍生定義、與MEDLINE相匹配引用、基于源自生物實(shí)體蛋白質(zhì)或核酸鏈進(jìn)行分類分子匹配。第16頁(yè)三、功效數(shù)據(jù)庫(kù)收錄生物分子功效數(shù)據(jù),由ID號(hào)與序列和結(jié)構(gòu)數(shù)據(jù)鏈接組織表示譜和亞細(xì)胞定位依據(jù)不一樣組織中EST、SAGE或芯片雜交信號(hào),繪制出不一樣組織中表示基因圖譜:BodyMap(http://bodymap.ims.u-tokyo.ac.jp/)Unigene(/sites/entrez?db=unigene

)SAGEmap(/projects/SAGE/)GEO(/projects/geo/)StanfordMicroarrayDatabase(/microarray)第17頁(yè)亞細(xì)胞定位數(shù)據(jù)庫(kù)PSORTdb(/)DBSubLoc(/dbsubloc.html)膜蛋白質(zhì)數(shù)據(jù)庫(kù)TMPDB(http://bioinfo.si.hirosaki-u.ac.jp/~TMPDB/)

線粒體蛋白質(zhì)數(shù)據(jù)庫(kù)MitoP2(http://www.mitop.de:8080/mitop2/)蛋白翻譯后修飾dbPTM(.tw/)磷酸化、糖基化和硫修飾,也收錄和蛋白質(zhì)翻譯后修飾相關(guān)生物信息。O-GlycBase(http://www.cbs.dtu.dk/databases/OGLYCBASE/)只收錄O糖基化數(shù)據(jù)PhosphoBase(/)只收錄磷酸化位點(diǎn)數(shù)據(jù)RESID(http://www.ebi.ac.uk/RESID/)收錄蛋白質(zhì)修飾注釋和結(jié)構(gòu)數(shù)據(jù)第18頁(yè)蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)DIP(/)由試驗(yàn)驗(yàn)證蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù),包含蛋白質(zhì)信息、相互作用信息和檢測(cè)相互作用試驗(yàn)技術(shù)IntAct(http://www.ebi.ac.uk/intact)提供用于蛋白質(zhì)相互作用數(shù)據(jù)存放、展示和分析開(kāi)源數(shù)據(jù)庫(kù)和工具包,可對(duì)相互作用數(shù)據(jù)在網(wǎng)頁(yè)上進(jìn)行文本和圖像展示,允許用戶經(jīng)過(guò)GO注釋或InterPro結(jié)構(gòu)域注釋進(jìn)行網(wǎng)絡(luò)擴(kuò)充代謝網(wǎng)絡(luò)和信號(hào)路徑KEGG大百科(http://www.genome.ad.jp/kegg/)系統(tǒng)分析基因功效、聯(lián)絡(luò)基因組信息和功效信息知識(shí)庫(kù),GENES收錄完整和部分測(cè)序基因組序列;PATHWAY數(shù)據(jù)庫(kù)存放更高級(jí)功效信息,包含圖解細(xì)胞生化過(guò)程和同系保守子通路等信息;LIGAND數(shù)據(jù)庫(kù)收錄關(guān)于化學(xué)物質(zhì)、酶分子和酶反應(yīng)等信息。第19頁(yè)反應(yīng)通路(KEGG)glycolysispathway(糖酵解)京都基因與基因組百科全書(shū)(KyotoEncyclopediaofGenesandGenomes)第20頁(yè)全細(xì)胞通路第21頁(yè)四、其它專業(yè)數(shù)據(jù)庫(kù)人類基因和疾病數(shù)據(jù)庫(kù)OMIM(/sites/entrez?db=omim)收錄全部已知遺傳病、遺傳性狀和基因,除簡(jiǎn)略描述各種疾病臨床特征、診療、治療和預(yù)防外,還提供致病基因連鎖關(guān)系、染色體定位、組織結(jié)構(gòu)、動(dòng)物模型及其參考文件等信息dbSNP(/sites/entrez?db=SNP)收錄已經(jīng)識(shí)別SNPs數(shù)據(jù)庫(kù)HapMapProject()收錄了三大人群(非洲人,高加索人和亞洲人群)主要變異模式,所選擇SNPs含有相對(duì)代表性CGED(http://lifesciencedb.jp/cged/)收錄各種癌癥臨床和基因表示數(shù)據(jù),更新到年第22頁(yè)基于電泳和生物質(zhì)譜蛋白質(zhì)組數(shù)據(jù)庫(kù)SWISS-2DPAGE(/ch2d/)收錄各種雙向電泳或SDS電泳圖,并提供蛋白在電泳圖中位置及其信息PRIDE(http://www.ebi.ac.uk/pride/)數(shù)據(jù)庫(kù)搜集國(guó)際蛋白質(zhì)組計(jì)劃所產(chǎn)出判定結(jié)果數(shù)據(jù)PeptideAtlas(/)收錄大規(guī)模LC-MS/MS試驗(yàn)判定蛋白信息,并將信息匹配到Ensembl數(shù)據(jù)庫(kù)dbLEP()為肝臟蛋白質(zhì)組計(jì)劃設(shè)計(jì),提供判定結(jié)果及可追溯信息,包含可供評(píng)定結(jié)果質(zhì)量判定肽段數(shù)和質(zhì)譜圖譜等,同時(shí)還提供大量注釋信息,更新到年第23頁(yè)免疫學(xué)數(shù)據(jù)庫(kù)IMGT(http://imgt.cines.fr)關(guān)于免疫球蛋白、T細(xì)胞受體、主要組織相容性復(fù)合體以及人類和哺乳動(dòng)物免疫系統(tǒng)相關(guān)蛋白綜合數(shù)據(jù)庫(kù),由序列數(shù)據(jù)庫(kù)、基因組和結(jié)構(gòu)數(shù)據(jù)庫(kù)、網(wǎng)站資源數(shù)據(jù)庫(kù)和各種研究工具數(shù)據(jù)庫(kù)組成dbMHC(/mhc/)提供人類組織相容性抗原(HLA)序列數(shù)據(jù)和臨床上干細(xì)胞移植及風(fēng)濕性關(guān)節(jié)炎等數(shù)據(jù),也提供全世界90多個(gè)人群HLA位點(diǎn)、等位基因和單倍型頻率遺傳檢測(cè)工具第24頁(yè)Taxonomy分類學(xué)數(shù)據(jù)庫(kù)第25頁(yè)北京華大基因研究中心(中科院基因組研究所)楊煥明/國(guó)家人類基因組南方研究中心(上海)陳竺、趙國(guó)屏/國(guó)家人類基因組北方研究中心(北京)強(qiáng)伯勤/清華大學(xué)生物系生物信息研究室孫之榮/北京大學(xué)生物信息學(xué)中心羅靜初/chinese/復(fù)旦大學(xué)理論生物中心鐘揚(yáng)/我國(guó)一些主要研究中心和數(shù)據(jù)庫(kù)第26頁(yè)生物信息學(xué)數(shù)據(jù)庫(kù)檢索檢索方法概述檢索實(shí)踐和案例第27頁(yè)生物信息學(xué)數(shù)據(jù)庫(kù)檢索主要檢索系統(tǒng)和工具Entrez(NationalCenterforBiotechnologyInformation,NCBI)SRS(EuropeanBioinformaticsInstitute,EBI)ExPasyExpertProteinAnalysisSystem(SwissInstituteofBioinformatics,SIB)日本、歐洲、美國(guó)其它研究機(jī)構(gòu)工具平臺(tái)……第28頁(yè)復(fù)雜檢索1、限制字段類別慣用有:Author:BaoYM[au]Title:stress[ti]Tilte/Abstract:stress[title/abstract]Date:1999:[dp]2、布爾邏輯運(yùn)算:AND、OR、NOT必須大寫。邏輯符運(yùn)算次序是從左至右,括號(hào)內(nèi)檢索式可作為一個(gè)單元,優(yōu)先運(yùn)行。布爾邏輯檢索允許在檢索詞后面附加字段標(biāo)識(shí)比如:rice[ti]ANDBaoYM[au]AND:[dp]第29頁(yè)一樣存在限制字段:慣用有:Author:BaoYM[au]title:SNARE[ti]organism:rice[organism]或者直接輸入:Accession:AY077725[Accession]GeneName:ZFP15[GeneName]ProteinName:ZFP15[ProteinName]如:BaoYM[au]ANDSNARE[ti]ANDrice[organism]假如沒(méi)有限定,就是任意字段。怎樣獲取GenBank中序列?第30頁(yè)Entrez(NationalCenterforBiotechnologyInformation,NCBI)選擇數(shù)據(jù)庫(kù)當(dāng)沒(méi)有進(jìn)入號(hào)時(shí)輸入關(guān)鍵詞(英文和拉丁文)當(dāng)有進(jìn)入號(hào)時(shí)輸入進(jìn)入號(hào)可編譯第31頁(yè)NCBI主頁(yè)最下面區(qū)域,是NCBI快捷連接區(qū)域第32頁(yè)舉例:GAPDH或g3pdh是甘油醛-3-磷酸脫氫酶(glyceraldehyde-3-phosphatedehydrogenase)英文縮寫。該酶是糖酵解反應(yīng)中一個(gè)酶。該酶基因?yàn)楣芗遥╤ousekeeping)基因,幾乎在全部組織中都高水平表示,在同種細(xì)胞或者組織中蛋白質(zhì)表示量普通是恒定,且不受含有部分識(shí)別位點(diǎn)、佛波脂等誘導(dǎo)物質(zhì)影響而保持恒定,故被廣泛用作抽提t(yī)otalRNA,poly(A)+RNA,Westernblot等試驗(yàn)操作標(biāo)準(zhǔn)化內(nèi)參。GAPDH普通是由4個(gè)相同亞基組成四聚體,每個(gè)亞基均含有催化結(jié)構(gòu)域和輔酶結(jié)合域。GAPDH與輔酶煙酰胺腺嘌呤二核苷酸(

NAD+)組成全酶才含有催化活性。第33頁(yè)基因序列搜索第34頁(yè)第35頁(yè)第36頁(yè)STS序列標(biāo)簽位點(diǎn)(sequence-taggedsite),是已知核苷酸序列DNA片段,是基因組中任何單拷貝短DNA序列,長(zhǎng)度在100~500bp之間。任何DNA序列,只要知道它在基因組中位置,都能被用作STS標(biāo)簽。作為基因組中單拷貝序列,是新一代遺傳標(biāo)識(shí)系統(tǒng),其數(shù)目多,覆蓋密度較大,到達(dá)平均每1kb一個(gè)STS或更密集。這種序列在染色體上只出現(xiàn)一次,其位置和堿基次序都是已知。在PCR反應(yīng)中能夠檢測(cè)出STS來(lái),STS適宜于作為人類基因組一個(gè)地標(biāo),據(jù)此能夠判定DNA方向和特定序列相對(duì)位置。第37頁(yè)不能用任何其它特征關(guān)鍵詞表述含有生物學(xué)意義區(qū)域;新或少見(jiàn)特征第38頁(yè)第39頁(yè)蛋白序列搜索第40頁(yè)第41頁(yè)第42頁(yè)蛋白質(zhì)結(jié)構(gòu)搜索第43頁(yè)第44頁(yè)MMDBID:34532PDBID:1U8F第45頁(yè)Nicotinamide-Adenine-Dinucleotide煙酰胺腺嘌呤二核苷酸O、P、Q和R為GAPDH四個(gè)亞基蛋白鏈,其和1(煙酰胺腺嘌呤二核苷酸)相互作用關(guān)系第46頁(yè)課堂練習(xí):Homosapiensp53,人體抑癌基因,該基因編碼一個(gè)分子量為53kDa蛋白質(zhì),命名為P53。p53基因失活對(duì)腫瘤形成起主要作用。不過(guò)事物必定有它兩個(gè)方面,p53是一個(gè)主要抗癌基因使癌細(xì)胞自殺,預(yù)防癌變;還含有幫助細(xì)胞基因修復(fù)缺點(diǎn)功效?;蛐蛄兴阉鳎瑯?biāo)注(Searchthetargetgene,andannotatethegene)蛋白序列搜索,標(biāo)注(Searchthetargetprotein,andannotatetheprotein)蛋白質(zhì)結(jié)構(gòu)搜索,標(biāo)注(Searchthestructureofthetargetprotein,andannotateit)Question:從小鼠中查找Bao試驗(yàn)室公布p53蛋白相關(guān)DNA序列.第47頁(yè)一些生物信息學(xué)相關(guān)名詞和知識(shí)第48頁(yè)參考P74,關(guān)鍵字定義Attenuator:regionofDNAatwhichregulationofterminationoftranscriptionoccurs,whichcontrolstheexpressionofsomebacterialoperons,sequencesegmentlocatedbetweenthepromoterandthefirststructuralgenethatcausespartialterminationoftranscription.Enhancer:acis-actingsequencethatincreasestheutilizationofeukaryoticpromoters,andcanfunctionineitherorientationandinanylocation(upstreamordownstream)relativetothepromoter.

Promoter:regiononaDNAmoleculeinvolvedinRNApolymerasebindingtoinitiatetranscription.Terminator:sequenceofDNAlocatedeitherattheendofthetranscriptthatcausesRNApolymerasetoterminatetranscription.polyA-signal:recognitionregionnecessaryforendonucleasecleavageofanRNAtranscriptthatisfollowedbypolyadenylation,consensus=AATAAA.第49頁(yè)P(yáng)romoterEnhancerGeneTerminatorTranscriptionunit+1-1DownstreamsequenceUpstreamsequence-10TranscriptionstartsiteRegulatoryelement-2-3-4-5-6-7-8-9-11-12-13-14-16-17+2+3+4+5+6+7+8polyA-signalAttenuator調(diào)整基因阻遏子開(kāi)啟子操縱基因終止子lacZlacYlacAlac

操縱元AttenuatorAAAAAAAendonucleasecleavageendonuclease第50頁(yè)CAAT-signal:CAATbox,partofaconservedsequencelocatedabout75bpup-streamofthestarpointofeukaryotic

transcriptionunitswhichmaybeinvolvedinRNApolymerasebinding,consensus=GG(CorT)CAATCT.GC-signal:GCbox,aconservedGC-richregionlocatedupstreamofthestartpointofeukaryotictranscriptionunitswhichmayoccurinmultiplecopiesorineitherorientation,consensus=GGGCGG.TATA-signal:TATAbox,Goldberg-Hognessbox,aconservedAT-richseptamerfoundabout25bpbeforethestartpointofeacheukaryoticRNApolymeraseⅡtranscriptunitwhichmaybeinvolvedinpositioningtheenzymeforcorrectinitiation,consensus=TATA(AorT)A(AorT).-10-signal:pribnowbox,aconservedregionabout10bpupstreamofthestartpointofbacterialtranscriptionunitswhichmaybeinvolvedinbindingRNApolymerase,consensus=TAtAaT.-35-signal:aconservedhexamerabout35bpupstreamofthestartpointofbacterialtranscriptionunits,consensus=TTGACa第51頁(yè)+1-50Transcriptionstartsite-25-75-100HognessboxGCboxGCboxCAATbox+1-50Transcriptionstartsite-25-100-190CorepromoterGCboxGCboxUpstreamcontrolelementGCboxGCboxGCboxBasalpromoterUpstreamelementDownstreamelement+50Transcriptionstartsite+1HognessboxOctamermotifIntragenicpromoter+90PSEAboxCboxIEClassⅠpromoterClassⅡpromoterClassⅢpromotereukaryotic

transcriptionunits第52頁(yè)λPR:TTATTCCATGTCACACTTTTCGCATCTTTGTTATGCTATGGTTATTTCATACCAT+1Transcriptionstartsite-10Pribnowbox-35GACAboxGTGCGTGTTGACTATTTTACCTCTGGCGGTGATAATGGTTGCATGTACTAAGGAGGCGGTGTTGACATAAATACCACTGGCGGTGATACTGAGCACATCAGCAGGACGTGAGCTGTTGACAATTAATCATCGAACTAGTTAACTAGTACGCAAGTTCACGTAACCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATAATGTGTGGAATTGTGAGCGGTTTCCTCTTGTCAGGCCGGAATAACTCCCTATAATGCGCCACCACTGACACGGAATAAATGCTTGACTCTGTAGCGGGAAGGCGTATTATGCACACCTCGCGCCGCTGATCCATGTCACACTTTTCGCATCTTTGTTATGCTATGGTTATTTCATACCATAAGCCλPL:trp:lac:lacUV5:rrnA1:rrnA2:galP1:galP2:bacterialtranscriptionunits第53頁(yè)-35TTGACATATAAT′+20

+1-10原核生物RNA聚合酶全酶及其在轉(zhuǎn)錄起始區(qū)結(jié)合第54頁(yè)(1)開(kāi)放讀碼框是從一個(gè)起始密碼子開(kāi)始到一個(gè)終止密碼子結(jié)束一段序列;不是全部讀碼框都能被表示出蛋白產(chǎn)物,或者能表示出占有優(yōu)勢(shì)或者能產(chǎn)生生物學(xué)功效蛋白。(2)CDS,是編碼一段蛋白產(chǎn)物序列。(3)CDS可能是一個(gè)ORF,但也可能包含多個(gè)ORF。(4)反之,每個(gè)ORF不一定都是CDS。CDS:codingsequence,sequenceofnucleotidesthatcorrespondswiththesequenceofaminoacidsinaprotein(locationincludesstopcodon),featureincludesaminoacidconceptualtranslation.Openreadingframe(ORF):areadingframethatdoesnotcontainanucleotidetripletwhichstopstranslationbeforeformationofacompletepolypeptide.第55頁(yè)LTR:longterminalrepeat,asequencedirectlyrepeatedatbothendsofadefinedsequence,ofthesorttypicallyfoundinretroviruses.反轉(zhuǎn)錄病毒基因組兩端各有一個(gè)長(zhǎng)末端重復(fù)序列(5'LTR和3'LTR),不編碼蛋白質(zhì),但含有開(kāi)啟子,增強(qiáng)子等調(diào)控元件,病毒基因組內(nèi)LTR可轉(zhuǎn)移到細(xì)胞原癌基因鄰近處,使這些原癌基因在LTP強(qiáng)開(kāi)啟子和增強(qiáng)子作用下被激活,將正常細(xì)胞轉(zhuǎn)化為癌細(xì)胞。TheHIV-1LTRisapproximately640bpinlengthand,likeotherretroviralLTRs,issegmentedintotheU3,R,andU5regions.第56頁(yè)5`clip:5`-most

regionofaprecursortranscriptthatisclippedoffduringprocessing.3`clip:3`-mostregionofaprecursortranscriptthatisclippedoffduringprocessing.5`UTR:regionatthe5`endofamaturetranscript(precedingtheinitiationcodon)thatisnottranslatedintoaprotein.3`UTR:regionatthe3`endofamaturetranscript(followingthestopcodon)thatisnottranslatedintoaprotein.Prim-transcript:primary(initial,unprocessed)transcript,includes5`clip,5`UTR,CDS,exon,intron,3`UTR,and3`clip.5`clip3`clip5`UTR3`UTRexon1Exon2Exon3Prim-transcript第57頁(yè)Exon:regionofgenomethatcodesforportionofsplicedmRNA,rRNAandtRNA,maycontain5`UTR,allCDSsand3`UTR.Intron:asegmentof

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論