下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
DBEncRNA:細菌必需非編碼RNA數(shù)據(jù)庫【摘要】細菌非編碼RNA(non-codingRNA,ncRNA)是近年來在細菌基因組內(nèi)新發(fā)現(xiàn)的一類基因表達調(diào)控因子,與必需基因概念類似,有一部分ncRNA是生物體生存所必不可少的,稱之為"必需非編碼RNA”。因此,細菌的必需ncRNA可以作為藥物開發(fā)的潛在靶標,以降低致病菌的耐藥性。同時,必需ncRNA也成為最小基因組研究的重要對象之一。目前已經(jīng)通過濕實驗系統(tǒng)地確定了10余種細菌的必需ncRNA,然而還沒有一個專門的必需ncRNA數(shù)據(jù)庫,導(dǎo)致對必需ncRNA的研究遠遠跟不上科學(xué)研究和藥物設(shè)計的需要。因此,該研究構(gòu)建了一個專門的細菌必需ncRNA數(shù)據(jù)庫DBEncRNA,以幫助研究人員開發(fā)高效的必需ncRNA計算機識別方法,用于進一步研究抗菌藥物靶標發(fā)現(xiàn)和最小基因組。DBEncRNA數(shù)據(jù)庫可以通過關(guān)鍵詞抗菌藥物靶標;數(shù)據(jù)庫;必需非編碼RNA;最小基因組;致病菌DBEncRNA:DatabaseofBacterialEssentialncRNAAbstractBacterialnon-codingRNA(ncRNA)isaclassofgeneexpressionregulatorsinbacteriainrecentyears.Similartotheconceptofessentialgenes,apartofncRNAisindispensableforthesurvivaloforganisms,whichiscalledessentialncRNA.Therefore,thebacterialessentialncRNAscouldbeusedaspotentialtargetsfordrugdevelopmentinordertoreducedrugresistanceinpathogenicbacteria.TheessentialncRNAhasbecomeoneoftheimportantobjectsofminimalgenomeresearch.Atpresent,theessentialncRNAsofmorethanadozenbacteriahavebeensystematicallyidentifiedbyexperimentalmethod.However,thereisnospecializedessentialncRNAsdatabase.Andhence,theresearchonessentialncRNAsisfarbehindtheneedsofscientificresearchanddrugdesign.Inconsequence,inthisstudy,aspecialdatabaseofbacterialessentialncRNA(DBEncRNA)isproposedandconstructedtohelpresearchersdeveloptheefficientrecognitionmethodsforessentialncRNAinsilico,forfurtherstudiesincludingantimicrobialtargetdiscoveryandminimalgenomeresearch.TheDBEncRNAdatabasecanKeywordsantimicrobialdrugtargets;database;essentialnon-codingRNA;minimalgenomic;pathogenicbacterium細菌非編碼RNA(non-codingRNA,ncRNA)是近年來在細菌基因組內(nèi)新發(fā)現(xiàn)的一類基因表達調(diào)控因子,分子大小為40?500個核苷酸,在RNA的轉(zhuǎn)錄調(diào)節(jié)、染色體復(fù)制、RNA加工與修飾、mRNA翻譯與穩(wěn)定性、蛋白質(zhì)降解與轉(zhuǎn)運和細菌感染等生物過程中扮演著重要角色[1]o隨著被發(fā)現(xiàn)的細菌ncRNA數(shù)目迅速增加,及其在生物體內(nèi)的重要作用,細菌ncRNA已成為微生物的研究熱點之一[2]。由于ncRNA在生物體內(nèi)扮演重要角色,新ncRNA的識別具有重要的科學(xué)意義和極大的商業(yè)價值。在生物體所包含的ncRNA中,與必需基因概念類似,有一部分ncRNA是生物體生存所必不可少的,稱之為“必需非編碼RNA”(必需ncRNA,essentialncRNA)囪。雖然必需ncRNA不能像必需基因一樣編碼蛋白,但其在生物學(xué)上的研究地位與必需基因同等重要,具有重要的理論研究和實際應(yīng)用價值。如大部分抗生素以基本的細胞過程為靶標,而細菌的ncRNA在細菌生命活動中發(fā)揮著極為廣泛的作用,包括結(jié)構(gòu)調(diào)節(jié)到催化作用,影響各種加工過程,如細菌毒性、發(fā)育控制、mRNA穩(wěn)定性與蛋白質(zhì)降解等[4],因此細菌的必需ncRNA可以作為藥物開發(fā)的潛在靶標,以降低致病菌的耐藥性。同時,對必需ncRNA的理論研究有助于理解和確定最小基因組的構(gòu)成和功能作用,如文獻[5-6]認為一個完整的最小基因組除了編碼蛋白,還需包括調(diào)控和結(jié)構(gòu)原件,如5'-UTRs和ncRNA。文獻[7]報道了一個包含必需ncRNA的最小細胞。文獻[8]在構(gòu)建細菌最小基因集算法中也提出一個最小基因組,除了最小基因集,還應(yīng)包含最小非編碼RNA集。文獻[9-10]確定了一個新的miRNA為ncRNA,最早提出“必需ncRNA(essentialnon-codingRNA)”的概念。文獻[6]使用428735個Tn5轉(zhuǎn)座子插入測定新月柄桿菌(Caulobactercrescetus)的基因組時,除了確定480個必需基因外,還確定了29個必需tRNA和8個必需小ncRNA。在肺結(jié)核分支桿菌(Mycobacterumtuberculosis)中,文獻[11]使用36788個轉(zhuǎn)座子插入方法在確定必需基因的同時發(fā)現(xiàn)了25個必需基因組片段,包括10個tRNA和參與tRNA過程的RNaseP的RNA催化單元。文獻[12]用類似的方法在鼠傷寒沙門氏菌(Salmonellaentericaserovars)中發(fā)現(xiàn)了15個必需ncRNA。值得注意的是,RNaseP再次被確定為必需ncRNA,因此它可能是一個在細菌中普遍存在的必需ncRNA。文獻[13]測試了一些ncRNA對毒性效應(yīng)具有niche-specific的作用的假說,因為越來越多的證據(jù)表明ncRNA參與致病菌致病過程,該文獻首次用RNA-seq技術(shù)確定了一種肺炎病原體肺炎鏈球菌(Streptococcuspneumoniae)的全套ncRNA,包含89個ncRNA。文獻[14]重新確認了酵母的180個必需ncRNA。正是由于細菌ncRNA在細菌生長、侵染宿主和致病機理過程中發(fā)揮著極為廣泛的調(diào)控作用,對細菌ncRNA,特別是必需ncRNA的干擾會使其失去調(diào)控作用,從而影響到細菌的生長、侵染宿主的能力。在細菌耐藥性問題日益突出的今天,亟待積極研發(fā)新型抗菌靶點和藥物?;诩毦匦鑞cRNA為靶點的新型藥物開發(fā),有助于降低細菌耐藥性問題,所以亟需發(fā)展細菌必需ncRNA的高效識別、鑒定方法。ncRNA在合成生物學(xué)研究領(lǐng)域也具有不可或缺的地位。在現(xiàn)階段,定義一個能夠維持生物體存活的最小基因組是生物學(xué)的主要挑戰(zhàn)之一。目前大部分關(guān)于最小基因組的研究主要基于傳統(tǒng)的蛋白編碼基因,而忽略了ncRNA,這種基于不完整的注釋,導(dǎo)致最小基因組的準確性受到了限制[15]。針對這一問題,文獻[7]以注釋較為完整、本身具有較小基因組的細菌——肺炎支原體(含有694個ORF、311個ncRNA、43個編碼RNA)作為研究對象,首次獲得了一個既包含編碼基因,又包含ncRNA的最小細胞??偟膩碚f,研究基因組中的必需基因組元件,如必需ncRNA等,在生物學(xué)研究中具有重要的科學(xué)意義和應(yīng)用價值,包括從合成生物學(xué)到抗病原菌的藥物靶標確定。因此,必需ncRNA應(yīng)該如必需基因概念一樣,成為最小基因組研究的重要對象之一。為達到這一目標,亟需確定細菌的必需ncRNA,這就需要發(fā)展快速確定必需ncRNA的計算機識別算法,因此收集細菌的必需ncRNA作為算法開發(fā)數(shù)據(jù)集顯得及其重要和必要。目前,還沒有專門的必需ncRNA數(shù)據(jù)庫。天津大學(xué)生物信息中心構(gòu)建的必需基因數(shù)據(jù)中雖然收集了目前測序的必需ncRNA,但是該數(shù)據(jù)庫僅收集了必需ncRNA的序列信息[16-19],這對于開發(fā)高效的必需ncRNA計算機識別方法是不足的?;诖?,本研究構(gòu)建了專門的細菌必需ncRNA數(shù)據(jù)庫DBEncRNA(databaseofbacterialessentialncRNA),更便于進一步研究抗菌靶標發(fā)現(xiàn)和最小基因組。1材料與方法1.1微生物必需ncRNA數(shù)據(jù)來源目前在12種細菌中,必需ncRNA已經(jīng)被系統(tǒng)地實驗確定。雖然必需ncRNA的數(shù)據(jù)量相較必需基因要少很多,但沒有一個真正的必需ncRNA數(shù)據(jù)庫跟得上科學(xué)研究和藥物設(shè)計的需要。本研究收集測序的細菌基因組中包含了和人類疾病密切相關(guān)的細菌必需ncRNA。目前,DEG數(shù)據(jù)庫收錄了部分細菌的必需ncRNA數(shù)據(jù)[16],如表1所示。此外,為了使得構(gòu)建DBEncRNA數(shù)據(jù)庫包含的物種和序列更全面,除了上表所列數(shù)據(jù),本文還通過"essential”、"ncRNA”、“non-codingRNA”、“essentiality”、“microorganism”、“bacteria”
等關(guān)鍵字的組合在Google、Pubmed等數(shù)據(jù)庫上進行檢索,將檢索到的符合要求的序列作為DBEncRNA數(shù)據(jù)庫的來源。表1來源于DEG數(shù)據(jù)庫的細菌必需ncRNA數(shù)據(jù)物種必需序列數(shù)AcinetobacterbaumanniiATCC17978[20]59AcinetobacterbaumanniiATCC17978[20]1Agrobacteriumfabrumstr.C58[21]11Bacillussubtilis[22]2BrevundimonassubvibrioidesATCC15264[21]35Caulobactercrescentus[6]532MycobacteriumtuberculosisH37RvIII[11]35SalmonellaentericaserovarTyphiTy2[12]24SalmonellaentericaserovarTyphiSL1344[12]23SphingomonaswittichiiRW1[23]32SynechococcuselongatusPCC7942[24]34Streptococcuspneumoniae[}1]721.2必需ncRNA二級結(jié)構(gòu)數(shù)據(jù)來源必需ncRNA是從功能上來定義的,而功能與結(jié)構(gòu)是密切相關(guān)的R25],因此對RNA分子結(jié)構(gòu)的研究就成為分子生物學(xué)的一個重要領(lǐng)域,其中RNA二級結(jié)構(gòu)預(yù)測被作為研究RNA分子結(jié)構(gòu)的主要手段。因此為了方便用戶使用DBEncRNA數(shù)據(jù)庫,本文用RNAfold工具對每一個收集的必需ncRNA進行了二級結(jié)構(gòu)預(yù)測[26]o同時為了方便用戶直觀地觀察ncRNA的二級結(jié)構(gòu),本文調(diào)用了RNA二級結(jié)構(gòu)可視化工具Forna[27]o1.3序列比對在生物信息學(xué)中,通常認為序列相似則功能相似,為了幫助用戶挖掘其余未經(jīng)實驗確定的必需ncRNA,DBEncRNA數(shù)據(jù)庫引入BLAST序列比對功能,幫助使用者基于DBEncRNA數(shù)據(jù)庫通過同源序列比對發(fā)現(xiàn)其感興趣的ncRNA序列[28]o2結(jié)果與討論DBEncRNA數(shù)據(jù)庫內(nèi)容DBEncRNA數(shù)據(jù)庫的原始必需ncRNA數(shù)據(jù)來源于DEG6.5和關(guān)鍵字爬取,在獲得原始數(shù)據(jù)后進行以下處理:首先,因為DBEncRNA數(shù)據(jù)庫提供了必需ncRNA的二級結(jié)構(gòu)信息,因此剔除沒有核酸序列的ncRNA信息;其次,根據(jù)DBEncRNA數(shù)據(jù)庫的使用功能,篩選保留描述ncRNA的相關(guān)信息,如表2所示。最終獲得了一個含有20株細菌,共包含884條必需ncRNA序列及相關(guān)信息的數(shù)據(jù)庫,如表3所示。表3DBEncRNA數(shù)據(jù)庫數(shù)據(jù)統(tǒng)計信息物種名基因組編號培養(yǎng)條件必需表3DBEncRNA數(shù)據(jù)庫數(shù)據(jù)統(tǒng)計信息物種名基因組編號培養(yǎng)條件必需ncRNA數(shù)目/個CaulobactercrescentusNC_011916完全培養(yǎng)基532AcinetobacterbaumanniiATCC17978NC_009085完全培養(yǎng)基60EscherichiacoliO157:H7str.EDL933NZ_CP008957LB糖培養(yǎng)基37SynechococcuselongatusPCC7942NC_007604完全培養(yǎng)基34MycoplasmapneumoniaeM129NC_000912LB糖培養(yǎng)基34SphingomonaswittichiiRW1NC_009511完全培養(yǎng)基32BrevundimonassubvibrioidesATCC15264NC_014375完全培養(yǎng)基31MycobacteriumtuberculosisH37RvIIINC_000962完全培養(yǎng)基29ProvidenciastuartiistrainBE2467NZ_CP017054LB糖培養(yǎng)基25SalmonellaentericaserovarTyphiTy2NC_016810完全培養(yǎng)基24SalmonellaentericaserovarTyphimuriumSL1344NC_016810完全培養(yǎng)基23StreptococcusmutansUA159AE014133血培養(yǎng)基6Agrobacteriumfabrumstr.C58chromosomelinearNC_003063完全培養(yǎng)基6Agrobacteriumfabrumstr.C58chromosomecircularNC_003062完全培養(yǎng)基5MycobacteriumtuberculosisH42RvIIINC_000962完全培養(yǎng)基1MycobacteriumtuberculosisH38RvIIINC_000962完全培養(yǎng)基1MycobacteriumtuberculosisH39RvIIINC_000962完全培養(yǎng)基1MycobacteriumtuberculosisH41RvIIINC_000962完全培養(yǎng)基1MycobacteriumtuberculosisH40RvIIINC000962完全培養(yǎng)基1字段名具體信息AccessionNumberDBEncRNA數(shù)據(jù)庫編號RefSeq基因組在genbank的登錄號CategoryncRNA所屬類Condition培養(yǎng)條件Cross-Ref該序列在其他數(shù)據(jù)庫中登錄號Description功能描述Organism來源物種Reference參考文獻Date發(fā)表日期NucleotideSequence核酸序列
其中新月柄桿菌(Caulobactercrescentus)的必需ncRNA數(shù)目占數(shù)據(jù)庫總數(shù)的近61%,其次是鮑氏不動桿菌(AcinetobacterbaumanniiATCC17978)的必需ncRNA數(shù)目,占近7%。實驗確定必需ncRNA的培養(yǎng)條件總共有5種,其中主要以完全培養(yǎng)基(richmedium)條件為主,占75%,這是在充足生長條件下確定必需基因和必需ncRNA的常用培養(yǎng)條件。根據(jù)ncRNA所屬類別可將ncRNA分為10大類,如圖1所示,屬于啟動子類型的ncRNA將近一半,其次是屬于tRNA類型的ncRNA。ElseThrUtRNAoperon5SribosomalRNABacteria_small_SRPRNasesRNAIntergenic(IG)regionsNon-codingelementtRNAPromoter;regulatoryregion圖1DBEncRNA數(shù)據(jù)庫必需ncRNA類別分布圖ElseThrUtRNAoperon5SribosomalRNABacteria_small_SRPRNasesRNAIntergenic(IG)regionsNon-codingelementtRNAPromoter;regulatoryregionncRNA二級結(jié)構(gòu)為了方便用戶使用DBEncRNA數(shù)據(jù)庫,本文用RNAfold軟件數(shù)據(jù)庫收集的每個必需ncRNA進行二級結(jié)構(gòu)預(yù)測,對于每一條必需ncRNA,RNAfold采用兩種方法對其進行預(yù)測,分別是基于最小自由能的預(yù)測方法(minimumfreeenergy)和基于熱力學(xué)的預(yù)測方法(thermodynamicensemble),對于每一種預(yù)測的二級結(jié)構(gòu),均給出該結(jié)構(gòu)下的最小自由能等信息。將預(yù)測出的每種二級結(jié)構(gòu)以及對應(yīng)的分子結(jié)構(gòu)注釋信息導(dǎo)入到DBEncRNA數(shù)據(jù)庫,同時,引入可視化插件,使用人員可以按需查看其二級結(jié)構(gòu)。DBEncRNA數(shù)據(jù)庫構(gòu)建DBEncRNA的數(shù)據(jù)主要包括884個ncRNA及其預(yù)測的分子結(jié)構(gòu)和注釋信息,所有數(shù)據(jù)被整理并存儲在關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年在線工業(yè)制造平臺用戶注冊協(xié)議
- 2025年公用事業(yè)水電燃氣協(xié)議
- 2025年人力資源抵押合同
- 二零二五版7月:生物制藥研發(fā)成果轉(zhuǎn)讓及收益分成還款協(xié)議模板3篇
- 二零二五年度高檔實木地板定制安裝合同4篇
- 中銀個人購買寫字樓貸款合同(2024年版)
- 2025年度木地板生產(chǎn)工藝優(yōu)化與節(jié)能減排合同4篇
- 二零二五年度母子公司智能裝備制造合作協(xié)議4篇
- 臨時用電施工安全規(guī)范合同匯編版B版
- 2025年度鋼結(jié)構(gòu)承包項目安全風(fēng)險評估協(xié)議
- 9.2溶解度(第1課時飽和溶液不飽和溶液)+教學(xué)設(shè)計-2024-2025學(xué)年九年級化學(xué)人教版(2024)下冊
- 礦山隱蔽致災(zāi)普查治理報告
- 副總經(jīng)理招聘面試題與參考回答(某大型國企)2024年
- PDCA循環(huán)提高護士培訓(xùn)率
- 《獅子王》電影賞析
- 河北省保定市定州市2025屆高二數(shù)學(xué)第一學(xué)期期末監(jiān)測試題含解析
- 中醫(yī)護理人文
- 2024-2030年中國路亞用品市場銷售模式與競爭前景分析報告
- 貨物運輸安全培訓(xùn)課件
- 前端年終述職報告
- 市人民醫(yī)院關(guān)于開展“改善就醫(yī)感受提升患者體驗主題活動”2023-2025年實施方案及資料匯編
評論
0/150
提交評論