山東師范大學(xué)生科院生物信息學(xué)知識點_第1頁
山東師范大學(xué)生科院生物信息學(xué)知識點_第2頁
山東師范大學(xué)生科院生物信息學(xué)知識點_第3頁
山東師范大學(xué)生科院生物信息學(xué)知識點_第4頁
山東師范大學(xué)生科院生物信息學(xué)知識點_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、生物信息學(xué)名詞解釋:1、遺傳圖譜(geneticmap)2、物理圖譜(physicalmap)3、重疊群(Contig)4、同線性(synteny)5、序列圖譜6、轉(zhuǎn)錄圖譜7、進化信息8、ORF開放閱讀框9、序列比對(SequeneeAlignment)10、一致性(identity)11、相似性(Similarity)12、同源性(Homology)13、直系同源(Orthologous)14、旁系同源(Paralogous)15、空位罰分(GapPenalties)16、低復(fù)雜度區(qū)域(Low-ComplexityRegion,LCR)17、雙序列比對(PairwiseSequeneeAli

2、gnment)18、命中點(hit)19、密碼子偏好性(CodonUsagebias)20、同義密碼子21、目標肽(Targetpeptide)22、信號肽(signalpeptide)23、系統(tǒng)發(fā)生學(xué)(phylogenetics)24、分子系統(tǒng)發(fā)生學(xué)(molecularphylogenetics)25、系統(tǒng)發(fā)生樹(phylogenetictree)26、遺傳漂變(Geneticdrift)27、分子進化速率28、選擇壓力(Selectivepressure)29、異系同源物(Xenolog)30、密碼子使用的相對頻率(RelativeSynonymousCodonUsage,RSCU)31、

3、密碼子適應(yīng)指數(shù)(Codonadaptionindex,CAI)32、有效密碼子數(shù)(EfectiveNumberofCodon,Nc)一、知識點:英文字母簡稱及其代表含義:EST表達序列標簽(從cDNA文庫中獲得的短序列)SNP單核苷酸序列多態(tài)性SRA序列讀取片段,效率高錯誤率高RFLP限制性片段長度多態(tài)性VNTR可變串聯(lián)重復(fù)STR簡短串聯(lián)重復(fù)HGP序列標記位點STS(單拷貝)Contig重疊群(跨疊克隆群)CDS編碼區(qū)Basepair堿基對TSS轉(zhuǎn)錄起始ORF開放閱讀框UTR非編碼區(qū)RGP水稻基因組計劃HGP人類基因組計劃ENCODE:DNA元件百科全書計劃MSP:最大片段對,maximals

4、egmentpair第二章生物信息學(xué)引論1、遺傳圖譜、序列圖譜、Contig、同線性的概念理解2、人類基因組計劃的一些關(guān)鍵數(shù)字:1990年啟動、2001年發(fā)表草圖、2003年完成、2004年完成圖公布,預(yù)計15年時間(19902005)至少投入30億美元,完成人全部24(22+X+Y)條染色體中3.2X109個堿基對的序列測定。3、克雷格文特爾完成第一個自由生物體流感嗜血菌全基因組測序4、HGP選擇作為研究人類的四大“模式生物”5、序列圖譜、重疊群Contig的概念6、1970年Needleman和Wunsch提出了序列比對算法第三章生物信息學(xué)的生物學(xué)基礎(chǔ)1、主要模式生物拉丁文人Homosap

5、iens、小鼠Musmusculus、水稻Oryzasativa、噬菌體Bacteriophage、酵母Saccharomycescerevisiae、大腸桿菌Escherichiacoli、非洲爪蟾Xenopuslavias秀麗線蟲Caenorhabitidiselegans、斑馬魚Daniorerio、果蠅Drosophilamelanogaster、擬南芥Arabidopsisthaliana2、三主干六界說(有局限性,沒有病毒)3、四大“模式生物”4、核酸和蛋白質(zhì)至少攜帶三種信息:遺傳信息、結(jié)構(gòu)信息、進化信息5、生物信息數(shù)據(jù)庫中的核苷酸代碼6、FASTA格式中氨基酸表示方法7、ORF開

6、放閱讀框的概念第四章生物信息學(xué)數(shù)據(jù)庫資源1、序列數(shù)據(jù)庫(基因組、核酸和蛋白質(zhì))結(jié)構(gòu)數(shù)據(jù)庫(核酸、蛋白質(zhì))功能數(shù)據(jù)庫注:課件上列舉的各大數(shù)據(jù)庫類型2、GENBANK查詢檢索是Entrez檢索系統(tǒng)。3、EMBL查詢檢索可以通過網(wǎng)上的序列提取系統(tǒng)(SRS)服務(wù)完成。4、UniMES是專門為宏基因組學(xué)和環(huán)境數(shù)據(jù)開發(fā)了一個資料庫。5、PubMed限制字段類別有:authorAUTitleTIAbstractTIABdateDPJournalTA6、GenBank檢索結(jié)果的顯示有哪三種格式7、GenBank分類碼8、GenBank中特性關(guān)鍵詞(Featurekey)的含義promoter轉(zhuǎn)錄起始區(qū)prec

7、ursor_RNA前體RNAmRNA信使RNA5UTR5非翻譯區(qū)3UTR3非翻譯區(qū)exon外顯子CDS蛋白質(zhì)編碼序列intron內(nèi)含子polyA_siteRNA轉(zhuǎn)錄本的多聚腺苷酸化位點9、目前人類基因組拼接序列有五種,命名為hg(humangenome縮略名)后接編號,最新的數(shù)據(jù)是hg38,發(fā)布日期為2013年12月10、其他數(shù)據(jù)庫(用途)PBL及學(xué)習(xí)視頻中介紹的數(shù)據(jù)庫(1)MGI(MouseGenomesInformatics)同源性、等位基因、基因表達、定位(2)TCGA(TheCancerGenomeAtlas)腫瘤基因組圖譜(3)GEOProfiles基因表達(4)HomoloGene

8、:是一種用于檢測真核基因集之間的同源關(guān)系的數(shù)據(jù)庫。(5)Addgene數(shù)據(jù)庫:它作為一個公益性組織,負責(zé)保存和提供質(zhì)粒。(6)Unigene:自動地將GenBank中的序列聚類為面向基因的非冗余的數(shù)據(jù)集。(7)ENSEMBL:用于基因樹、mRNA剪接體、基因表達、啟動子查找(8)Uniprot:是一個集中收錄蛋白質(zhì)資源并能與其它資源相互聯(lián)系的數(shù)據(jù)庫。(9)PDB:蛋白質(zhì)晶體結(jié)構(gòu)資料數(shù)據(jù)庫(ProteinDataBank)。(10)GeneCard基因基本信息、基因調(diào)控信息、基因蛋白信息、蛋白質(zhì)互作(11)miRBase:是儲存miRNA信息最主要的數(shù)據(jù)庫之一(12)ExPASy:ExpertP

9、roteinAnalysisSystem蛋白質(zhì)組學(xué)分析平臺(13)KEGG:大型分子數(shù)據(jù)集生成的基因組測序和其他高通量實驗技術(shù)的實用程序數(shù)據(jù)庫資源第五章DNA與蛋白質(zhì)序列比對1、序列比對(SequeneeAlignment)、一致性(identity)、相似性milarity)、同源性(Homology)、直系同源(Orthologous)、旁系同源(Paralogous)、空位罰分(GapPenalties)、低復(fù)雜度區(qū)域(Low-ComplexityRegion,LCR)、雙序列比對(PairwiseSequeneeAlignment)、命中點(hit)的英文要認識、概念2、實際上在不同物

10、種間也叫旁源基因,eg同是起源于珠蛋白的小鼠的a球蛋白和雞的0球蛋白。3、轉(zhuǎn)換、顛換:環(huán)數(shù)改變:顛換,不易發(fā)生。環(huán)數(shù)不變:轉(zhuǎn)換,易發(fā)生。4、PAM矩陣(PointAcceptedMutation,可接受的點突變)5、BLOSUM矩陣(BloeksSubstitutionMatrix模塊替換矩陣)6、如何選擇合適的打分矩陣?一般來說,在局部相似性搜索上,BLOSUM矩陣較PAM要好當比較距離相近的蛋白時,應(yīng)選擇低的PAM或高的BLOSUM矩陣;當比較距離較遠的蛋白時,應(yīng)選擇高的PAM或低的BLOSUM矩陣對于數(shù)據(jù)庫搜索來說一般選擇BLOSUM62矩陣PAM矩陣可用于尋找蛋白質(zhì)的進化起源,BLOS

11、UM用于發(fā)現(xiàn)蛋白質(zhì)的保守域7、“矩陣作圖法”或“對角線作圖”1970年Gibbs首先提出8、點陣序列比較中:反向序列:反對角線出現(xiàn)一條線相同序列:對角線出現(xiàn)一條序列正向重復(fù):重復(fù)的平行于對角線連線,表示這兩條序列內(nèi)部含有重復(fù)片段9、全局規(guī)劃動態(tài)規(guī)劃算法、局部規(guī)劃動態(tài)規(guī)劃算法最優(yōu)路徑求解(大題)10、PSI-BLAST對于發(fā)現(xiàn)遠親物種的相似蛋白或某個蛋白家族的新成員非常有效11、Blast數(shù)據(jù)庫序列的列表:HighseoreslowEvalues12、BLAST搜索策略第六章序列特征分析1、GC含量的應(yīng)用:用于引物設(shè)計、雜交2、密碼子偏好性(CodonUsagebias)名詞解釋3、分析密碼子使

12、用偏好性的方法密碼子使用的相對頻率(RelativeSynonymousCodonUsage,RSCU)密碼子適應(yīng)指數(shù)(Codonadaptionindex,CAI)有效密碼子數(shù)(EfectiveNumberofCodon,Nc)4、蛋白質(zhì)磷酸化位點分析:蛋白質(zhì)磷酸化位點數(shù)據(jù)庫收集以用實驗證實的數(shù)據(jù)5、RNA的二級結(jié)構(gòu)元件(圖記住,英文要認識)發(fā)知F(Mflirpin單璉(Multi-branchedloop凸拜內(nèi)評(InteriorLcp)|P鷗ULakkH|第七章分子系統(tǒng)發(fā)生分析1、系統(tǒng)發(fā)生學(xué)(phylogenetics)、分子系統(tǒng)發(fā)生學(xué)(molecularphylogenetics)、系

13、統(tǒng)發(fā)生樹(phylogenetictree)、遺傳漂變(Geneticdrift)、分子進化速率、選擇壓力(Selectivepressure)、異系同源物(Xenolog)的概念、認識這些概念的英文2、幾個重要的理解a根據(jù)各個不同對物種計算出來的同源生物大分子的分子進化速率大致相等。b不同源分子不同,因為選擇壓力不同。c一個大分子內(nèi)部功能變化比較慢,功能越重要變化越慢d分子進化速率遠比表型進化速率穩(wěn)定。e一般認為,同義突變不受自然選擇,而非同義突變則受到自然選擇作用。f內(nèi)含子上的突變頻率很高3、構(gòu)建系統(tǒng)發(fā)生樹的原則(1)計算速度:距離法最大簡約法MP最大似然法ML如果模型合適,ML的效果較好

14、。近緣序列,可采用MP法,因為用的假設(shè)最少。(4)遠緣序列,一般用NJ或ML。4、MEGA建樹步驟二、習(xí)題選擇:1、獲得迄今最詳細的人類基因組分析數(shù)據(jù)的后基因組時代的計劃是(A),該計劃發(fā)現(xiàn)大約76%的基因組DNA都會被轉(zhuǎn)錄為一種或另一種RNA。A、ENCODEB、人類微生物組計劃C、國際千人基因組計劃D、國際腫瘤基因組計劃2、為繪制迄今為止最詳盡的、最有醫(yī)學(xué)應(yīng)用價值的人類基因組遺傳多態(tài)性圖譜,啟動了(B)A、ENCODEB、人類微生物組計劃C、國際千人基因組計劃D、國際腫瘤基因組計劃3、1995年,第一個自由生物體流感嗜血菌全基因組測序完成,這位科學(xué)家是(A)A、克雷格文特爾(CraigVe

15、nter)B、查爾斯德利思(CharlesDeLisi)C、WatsonD、國際腫瘤基因組計劃4、在(C)年Needleman和Wunsch提出了著名的序列比對算法,是生物信息學(xué)發(fā)展中最重要的貢獻。A、1990B、2001C、1970D、19885、進行基因調(diào)控信息分析研究的是(B)A、結(jié)構(gòu)基因組學(xué)B、功能基因組學(xué)C、比較基因組學(xué)D、以上都是6、ORF是(C)A、編碼區(qū)B、轉(zhuǎn)錄起始C、開放閱讀框D、非編碼區(qū)7、人類研究得最為詳盡的模式生物(D)A、酵母B、線蟲C、果蠅D、大腸桿菌8、UTR的含義是(B)A、編碼區(qū)B、非編碼區(qū)C、低復(fù)雜度區(qū)域D、開放閱讀框9、生物分子數(shù)據(jù)庫中二級數(shù)據(jù)庫相比于以及

16、數(shù)據(jù)庫(D)A、數(shù)據(jù)量大,更新速度快B、數(shù)據(jù)量小,更新速度快C、數(shù)據(jù)量大,更新速度慢D、數(shù)據(jù)量小,更新速度慢10、UniProt中專門為宏基因組學(xué)和環(huán)境數(shù)據(jù)開發(fā)的一個資料庫是(D)A、UniProtKBB、UniParcC、UniRefD、UniMES11、以下屬于基因組數(shù)據(jù)庫的是(A)A、EnsemblB、EMBLC、TrEMBLD、UniProt12、GenBank分類碼中ROD是(C)A、靈長類動物序列B、植物、真菌和藻類序列C、嚙齒類動物序列D、基因組測定序列13、Genbank中的145八177表示(A)A、145和177堿基之間的某個位點B、145和177堿基在內(nèi)的一段連續(xù)序列C、

17、145和177堿基D、145和177堿基之間的限制性酶切位點14、以下哪個數(shù)據(jù)庫可以專門提供質(zhì)粒(A)A、AddgeneB、TCGAC、GEOProfilesD、KEGG15、蛋白質(zhì)晶體結(jié)構(gòu)資料數(shù)據(jù)庫是(B)A、TCGAB、PDBC、UniProtD、ENSEMBL16、以下是研究蛋白質(zhì)組學(xué)分析的平臺是(A)A、ExPASyB、miRBaseC、AddgeneD、MGI17、同是起源于珠蛋白的小鼠的a珠蛋白與雞的0珠蛋白是(B)A、直系同源B、旁系同源C、垂直同源18、序列比對字符編輯操作中在第二條序列相應(yīng)的位置插入空白字符是以下哪種編輯形式(B)A、MatchB、DeleteC、Replac

18、eD、Insert19、多序列比對中,如果兩個序列長度差異很大,而且其中某一段區(qū)域相似時應(yīng)采用(A)A、局部序列比對B、全局序列比對C、遺傳算法D、基于一致性的方法20、ClustalW是目前最流行的基于全局比對算法中(C)的軟件A、基于一致性的方法B、動態(tài)規(guī)劃算法C、漸進的多序列比對D、迭代法21、以下有關(guān)GC含量錯誤的是(B)A、GC含量是指GC百分比含量B、在原核生物不同物種含量差異不大C、GC含量可以用于引物設(shè)計D、在真核生物、原核生物中差異大22、Tmpred是分析蛋白質(zhì)跨膜區(qū)的在線工具,得分大于(C)的跨膜螺旋才考慮是有意義的。TOC o 1-5 h zA、100B、300C、500D、70023、用于分子進化分析的序列必須是(A)才能真實反映進化過程?A、直系同源B、旁系同源C、異系同源物填空1、HGP最初計劃用年時間至少投入美元,實際上是于年啟動、年發(fā)表草圖、年完成、年公布完成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論