版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物信息學(xué)實驗講義目 錄實驗1. 計算機(jī)網(wǎng)上操作基本技能訓(xùn)練1實驗2. 常用分子生物學(xué)數(shù)據(jù)庫類型、文件格式及數(shù)據(jù)庫查詢2實驗3. 核酸序列分析3實驗4. 多重序列比對及系統(tǒng)發(fā)生樹的構(gòu)建5實驗5. PCR 引物設(shè)計及評價7實驗6. 蛋白質(zhì)序列分析和結(jié)構(gòu)預(yù)測9實驗一 計算機(jī)網(wǎng)上操作基本技能訓(xùn)練【實驗?zāi)康摹?、熟練掌握上網(wǎng)操作基本方法及技能。2、掌握利用網(wǎng)絡(luò)進(jìn)行資料搜集的多種方法【實驗內(nèi)容】1、熟悉Internet Exporer 的基本使用方法及相關(guān)技巧,熟悉Internet Exporer網(wǎng)絡(luò)配置。2、掌握免費電子郵箱的申請方法并且能收發(fā)電子郵件。3、掌握網(wǎng)上軟件下載及安裝方法。4、用IE或ne
2、tscape等瀏覽工具瀏覽、搜索各類信息5、運用FlashGet 或網(wǎng)絡(luò)螞蟻等下載工具進(jìn)行網(wǎng)絡(luò)資料的下載以及運用各種上傳工具上傳資料到網(wǎng)絡(luò)6、利用Winzip或Winrar等壓縮工具進(jìn)行文件的壓縮與解壓7、學(xué)習(xí)使用ftp8、在網(wǎng)上自主學(xué)習(xí)了解生物信息學(xué)知識【作業(yè)】1、在D盤建立一個以自己名字命名的文件夾。2、申請一個自已的免費電子郵箱,并發(fā)一封電子郵件到。3、從網(wǎng)絡(luò)上下載任意一個軟件,并安裝到計算機(jī)上。4、用FTP獲取一個蛋白質(zhì)結(jié)構(gòu)分析軟件比如rasmol,下載后保存到你的文件夾中,以便以后運用其進(jìn)行蛋白質(zhì)結(jié)構(gòu)分析。5、下載一個有關(guān)生物信息學(xué)的教程,并
3、保存到你的文件夾中,進(jìn)行參考學(xué)習(xí)。附表: 相關(guān)軟件及搜索工具網(wǎng)址搜索工具或軟件名稱參考網(wǎng)站地址Winrar /index.htmwinzip /index.htm網(wǎng)絡(luò)螞蟻Netants /index.htm FlashGet /index.htmrasmolftp:/ftp.dcs.ed.ac.ukGoogle 搜索引擎Yahoo搜索引擎http:/www.yah
4、新浪搜索引擎搜狐搜索引擎實驗二 常用數(shù)據(jù)庫類型、文件格式及數(shù)據(jù)庫查詢【實驗?zāi)康摹?、掌握序列檢索的操作方法;2、熟悉GenBank數(shù)據(jù)庫序列格式及其主要字段的含義;3、了解EBML數(shù)據(jù)庫序列格式及其主要字段的含義;4、熟悉GenBank數(shù)據(jù)庫序列格式的FASTA序列格式顯示與保存;5、熟悉分子生物學(xué)軟件的搜索與下載?!緦嶒瀮?nèi)容】1、使用Entrez信息查詢系統(tǒng)檢索核酸序列BC和NM_,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;2、GenBank數(shù)據(jù)庫序列格式的FASTA序列格式顯示與保存;3、使
5、用SRS信息查詢系統(tǒng)檢索核酸序列BC,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;4、使用搜索引擎搜索并下載DNAClub和BioEdit軟件?!咀鳂I(yè)】1、 寫出核酸序列BC 在GenBank數(shù)據(jù)庫的主要字段的含義;2、 寫出核酸序列NM_ 在EBML數(shù)據(jù)庫的主要字段的含義實驗三 核酸序列分析【實驗?zāi)康摹?、 掌握已知或未知序列接受號的核酸序列檢索的基本步驟;2、 掌握使用BioEdit軟件進(jìn)行核酸序列的基本分析;3、 熟悉基于核酸序列比對分析的真核基因結(jié)構(gòu)分析(內(nèi)含子/外顯子分析);4、 了解基因的電子表達(dá)譜分析。【實驗原理】針對核酸序列的分析就是在核酸序列中尋找基因,找出基因的位置
6、和功能位點的位置,以及標(biāo)記已知的序列模式等過程。在此過程中,確認(rèn)一段DNA序列是一個基因需要有多個證據(jù)的支持。一般而言,在重復(fù)片段頻繁出現(xiàn)的區(qū)域里,基因編碼區(qū)和調(diào)控區(qū)不太可能出現(xiàn);如果某段DNA片段的假想產(chǎn)物與某個已知的蛋白質(zhì)或其它基因的產(chǎn)物具有較高序列相似性的話,那么這個DNA片段就非??赡軐儆谕怙@子片段;在一段DNA序列上出現(xiàn)統(tǒng)計上的規(guī)律性,即所謂的“密碼子偏好性”,也是說明這段DNA是蛋白質(zhì)編碼區(qū)的有力證據(jù);其它的證據(jù)包括與“模板”序列的模式相匹配、簡單序列模式如TATA Box等相匹配等。一般而言,確定基因的位置和結(jié)構(gòu)需要多個方法綜合運用,而且需要遵循一定的規(guī)則:對于真核生物序列,在進(jìn)
7、行預(yù)測之前先要進(jìn)行重復(fù)序列分析,把重復(fù)序列標(biāo)記出來并除去;選用預(yù)測程序時要注意程序的物種特異性;要弄清程序適用的是基因組序列還是cDNA序列;很多程序?qū)π蛄虚L度也有要求,有的程序只適用于長序列,而對EST這類殘缺的序列則不適用。1. 重復(fù)序列分析 對于真核生物的核酸序列而言,在進(jìn)行基因辨識之前都應(yīng)該把簡單的大量的重復(fù)序列標(biāo)記出來并除去,因為很多情況下重復(fù)序列會對預(yù)測程序產(chǎn)生很大的擾亂,尤其是涉及數(shù)據(jù)庫搜索的程序。 2. 數(shù)據(jù)庫搜索 把未知核酸序列作為查詢序列,在數(shù)據(jù)庫里搜索與之相似的已有序列是序列分析預(yù)測的有效手段。在理論課中已經(jīng)專門介紹了序列比對和搜索的原理和技術(shù)。但值得注意的是,由相似性分
8、析作出的結(jié)論可能導(dǎo)致錯誤的流傳;有一定比例的序列很難在數(shù)據(jù)庫里找到合適的同源伙伴。對于EST序列而言,序列搜索將是非常有效的預(yù)測手段。 3. 編碼區(qū)統(tǒng)計特性分析 統(tǒng)計獲得的經(jīng)驗說明,DNA中密碼子的使用頻率不是平均分布的,某些密碼子會以較高的頻率使用而另一些則較少出現(xiàn)。這樣就使得編碼區(qū)的序列呈現(xiàn)出可察覺的統(tǒng)計特異性,即所謂的“密碼子偏好性”。利用這一特性對未知序列進(jìn)行統(tǒng)計學(xué)分析可以發(fā)現(xiàn)編碼區(qū)的粗略位置。這一類技術(shù)包括:雙密碼子計數(shù)(統(tǒng)計連續(xù)兩個密碼子的出現(xiàn)頻率);核苷酸周期性分析(分析同一個核苷酸在3,6,9,.位置上周期性出現(xiàn)的規(guī)律);均一/復(fù)雜性分析(長同聚物的統(tǒng)計計數(shù));開放可讀框架分析
9、等。 4. 啟動子分析 啟動子是基因表達(dá)所必需的重要序列信號,識別出啟動子對于基因辨識十分重要。有一些程序根據(jù)實驗獲得的轉(zhuǎn)錄因子結(jié)合特性來描述啟動子的序列特征,并依次作為啟動子預(yù)測的依據(jù),但實際的效果并不十分理想,遺漏和假陽性都比較嚴(yán)重??偟膩碚f,啟動子仍是值得繼續(xù)研究探索的難題。 5. 內(nèi)含子 / 外顯子剪接位點 剪接位點一般具有較明顯的序列特征,但是要注意可變剪接的問題。由于可變剪接在數(shù)據(jù)庫里的注釋非常不完整,因此很難評估剪接位點識別程序預(yù)測剪接位點的敏感性和精度。如果把剪接位點和兩側(cè)的編碼特性結(jié)合起來分析則有助于提供剪接位點的識別效果。 6. 翻譯起始位點 對于真核生物,如果已知轉(zhuǎn)錄起始
10、點,并且沒有內(nèi)含子打斷5非翻譯區(qū)的話,“Kozak規(guī)則”可以在大多數(shù)情況下定位起始密碼子。原核生物一般沒有剪接過程,但在開放閱讀框中找正確的起始密碼子仍很困難。這時由于多順反操縱子的存在,啟動子定位不象在真核生物中起關(guān)鍵作用。對于原核生物,關(guān)鍵是核糖體結(jié)合點的定位,可以由多個程序提供解決方案。 7. 翻譯終止信號 PolyA和翻譯終止信號不象起始信號那么重要,但也可以輔助劃分基因的范圍。 8. 其它綜合基因預(yù)測工具 除了上面提到的程序之外,還有許多用于基因預(yù)測的工具,它們大多把各個方面的分析綜合起來,對基因進(jìn)行整體的分析和預(yù)測。多種信息的綜合分析有助于提高預(yù)測的可靠性,但也有一些局限:物種適用
11、范圍的局限;對多基因或部分基因,有的預(yù)測出的基因結(jié)構(gòu)不可靠;預(yù)測的精度對許多新發(fā)現(xiàn)基因比較低;對序列中的錯誤很敏感;對可變剪接、重疊基因和啟動子等復(fù)雜基因語法效果不佳。 9. tRNA 基因識別 tRNA基因識別比編碼蛋白質(zhì)的基因識別簡單,目前基本已經(jīng)解決了用理論方法預(yù)測tRNA基因的問題。tRNAscan-SE工具中綜合了多個識別和分析程序,通過分析啟動子元件的保守序列模式、tRNA二級結(jié)構(gòu)的分析、轉(zhuǎn)錄控制元件分析和除去絕大多數(shù)假陽性的篩選過程,據(jù)稱能識別99%的真tRNA基因。 【實驗內(nèi)容】1、使用Entrez或SRS信息查詢系統(tǒng)檢索人瘦素 (leptin) 的mRNA、基因組DNA、外顯
12、子和5調(diào)控區(qū) (promoter) 等核酸序列,連接提取該序列內(nèi)容,閱讀序列格式的解釋,理解其含義;2、使用BioEdit軟件對上述核酸序列進(jìn)行分子質(zhì)量、堿基組成、堿基分布、序列變換以及限制性酶切分析等基本分析,并從BioEdit軟件的“help”欄了解該軟件的其它功能;3、使用BioEdit軟件對人瘦素 (leptin) 的mRNA序列進(jìn)行可讀框架分析;4、使用NCBI查詢系統(tǒng)進(jìn)行人瘦素 (leptin) 的基因組序列分析和基因的電子表達(dá)譜分析;5、使用Blast2進(jìn)行人瘦素 (leptin) mRNA序列與其外顯子或基因組序列的比對分析?!緦嶒灧椒ā?、調(diào)用Internet瀏覽器,并在其地
13、址欄輸入Entrez網(wǎng)址:/Entrez;2、在Search后的選擇欄中選擇nucleotide;3、在輸入欄輸入homo sapiens leptin;4、點擊go后顯示序列接受號及序列名稱等;5、查找人leptin (obesity homolog, mouse) mRNA序列(提示:NM_),點擊序列接受號后顯示序列詳細(xì)信息; 6、將序列轉(zhuǎn)為FASTA格式保存7、根據(jù)從NM_了解的基因定位信息查找人瘦素的基因組DNA (Contig) 的序列接受號及序列識別號,點擊序列接受號顯示序列詳細(xì)信息;8、在輸入欄輸入homo sapiens l
14、eptin exon查找人瘦素外顯子序列;9、在輸入欄輸入homo sapiens leptin promoter查找人瘦素5調(diào)控區(qū)序列;10、按上述步驟用SRS信息查詢系統(tǒng)檢索人瘦素 (leptin) 的mRNA、基因組DNA、外顯子和5調(diào)控區(qū) (promoter) 等核酸序列;11、將上述核酸序列輸入BioEdit和DNAClub軟件進(jìn)行序列基本分析;12、打開BioEdit軟件,點擊“help”欄,閱讀“contents”;13、將人瘦素 (leptin) 的mRNA序列輸入BioEdit軟件進(jìn)行可讀框架分析:打開BioEdit軟件將人瘦素 (leptin) mRNA的FASTA格式序列
15、輸入分析框點擊左側(cè)序列說明框中的序列說明點擊sequence欄選擇nucleic acid點擊find next ORF查看起始密碼位置和編碼區(qū)范圍(57557);14、參照教材使用NCBI查詢系統(tǒng)進(jìn)行人瘦素 (leptin) 的基因組序列分析和基因的電子表達(dá)譜分析;15、人瘦素 (leptin) mRNA序列與其外顯子或基因組序列的比對分析:調(diào)用Internet瀏覽器并在其地址欄輸入Blast2網(wǎng)址(/Entrezgorf/bl2/html) 將人瘦素 (leptin) mRNA和外顯子的FASTA格式序列分別輸入sequence2和seq
16、uence1分析框或?qū)⑷耸菟?(leptin) mRNA和基因組序列的GI版本號輸入sequence2和sequence1的GI版本號框點擊Align后顯示兩序列比對的詳細(xì)信息查找mRNA序列上各外顯子的位置?!咀鳂I(yè)】1、歸納對人瘦素 (leptin) 的核酸序列分析的結(jié)果,列出主要的分析結(jié)果;2、總結(jié)核酸序列分析的基本步驟,相互對比結(jié)果,指出應(yīng)注意的事項。實驗四 多重序列比對及系統(tǒng)發(fā)生樹的構(gòu)建【實驗?zāi)康摹?、熟悉構(gòu)建分子系統(tǒng)發(fā)生樹的基本過程,獲得使用不同建樹方法、建樹材料和建樹參數(shù)對建樹結(jié)果影響的正確認(rèn)識;2、掌握使用Clustalx進(jìn)行序列多重比對的操作方法;3、掌握使用Phylip軟件構(gòu)
17、建系統(tǒng)發(fā)生樹的操作方法?!緦嶒炘怼吭诂F(xiàn)代分子進(jìn)化研究中,根據(jù)現(xiàn)有生物基因或物種多樣性來重建生物的進(jìn)化史是一個非常重要的問題。一個可靠的系統(tǒng)發(fā)生的推斷,將揭示出有關(guān)生物進(jìn)化過程的順序,有助于我們了解生物進(jìn)化的歷史和進(jìn)化機(jī)制。對于一個完整的進(jìn)化樹分析需要以下幾個步驟: 要對所分析的多序列目標(biāo)進(jìn)行比對(alignment)。 要構(gòu)建一個進(jìn)化樹(phyligenetic tree)。構(gòu)建進(jìn)化樹的算法主要分為兩類:獨立元素法(discrete character methods)和距離依靠法(distance methods)。所謂獨立元素法是指進(jìn)化樹的拓?fù)湫螤钍怯尚蛄猩系拿總€堿基/氨基酸的狀態(tài)決定的
18、(例如:一個序列上可能包含很多的酶切位點,而每個酶切位點的存在與否是由幾個堿基的狀態(tài)決定的,也就是說一個序列堿基的狀態(tài)決定著它的酶切位點狀態(tài),當(dāng)多個序列進(jìn)行進(jìn)化樹分析時,進(jìn)化樹的拓?fù)湫螤钜簿陀蛇@些堿基的狀態(tài)決定了)。而距離依靠法是指進(jìn)化樹的拓?fù)湫螤钣蓛蓛尚蛄械倪M(jìn)化距離決定的。進(jìn)化樹枝條的長度代表著進(jìn)化距離。獨立元素法包括最大簡約性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods);距離依靠法包括除權(quán)配對法(UPGMAM)和鄰位相連法(Neighbor-joining)。 對進(jìn)化樹進(jìn)行評估,主要采用Bootstrapin
19、g法。進(jìn)化樹的構(gòu)建是一個統(tǒng)計學(xué)問題,我們所構(gòu)建出來的進(jìn)化樹只是對真實的進(jìn)化關(guān)系的評估或者模擬。如果我們采用了一個適當(dāng)?shù)姆椒?,那么所?gòu)建的進(jìn)化樹就會接近真實的“進(jìn)化樹”。模擬的進(jìn)化樹需要一種數(shù)學(xué)方法來對其進(jìn)行評估。不同的算法有不同的適用目標(biāo)。一般來說,最大簡約性法適用于符合以下條件的多序列:i 所要比較的序列的堿基差別小,ii 對于序列上的每一個堿基有近似相等的變異率,iii 沒有過多的顛換/轉(zhuǎn)換的傾向,iv 所檢驗的序列的堿基數(shù)目較多(大于幾千個堿基);用最大可能性法分析序列則不需以上的諸多條件,但是此種方法計算極其耗時。如果分析的序列較多,有可能要花上幾天的時間才能計算完畢。UPGMAM(U
20、nweighted pair group method with arithmetic mean)假設(shè)在進(jìn)化過程中所有核苷酸/氨基酸都有相同的變異率,也就是存在著一個分子鐘。這種算法得到的進(jìn)化樹相對來說不是很準(zhǔn)確,現(xiàn)在已經(jīng)很少使用。鄰位相連法是一個經(jīng)常被使用的算法,它構(gòu)建的進(jìn)化樹相對準(zhǔn)確,而且計算快捷。其缺點是序列上的所有位點都被同等對待,而且,所分析的序列的進(jìn)化距離不能太大。另外,需要特別指出的是對于一些特定多序列對象來說可能沒有任何一個現(xiàn)存算法非常適合它。 CLUSTALX和PHYLIP軟件能夠?qū)崿F(xiàn)上述的建樹步驟。CLUSTALX是Windows界面下的多重序列比對軟件。PHYLIP是多個
21、軟件的壓縮包,功能極其強大,主要包括五個方面的功能軟件:i,DNA和蛋白質(zhì)序列數(shù)據(jù)的分析軟件。ii,序列數(shù)據(jù)轉(zhuǎn)變成距離數(shù)據(jù)后,對距離數(shù)據(jù)分析的軟件。 iii,對基因頻率和連續(xù)的元素分析的軟件。iv,把序列的每個堿基/氨基酸獨立看待(堿基/氨基酸只有0和1的狀態(tài))時,對序列進(jìn)行分析的軟件。v,按照DOLLO簡約性算法對序列進(jìn)行分析的軟件。vi,繪制和修改進(jìn)化樹的軟件。【實驗內(nèi)容】1、使用CLUSTALX軟件對已知八條DNA序列(如下)進(jìn)行多重序列比對;M._mulatta AAGCTTTTCT GGCGCAACCA TCCTCATGAT TGCTCACGGA CTCACCTCTT M._fasc
22、icu AAGCTTCTCC GGCGCAACCA CCCTTATAAT CGCCCACGGG CTCACCTCTT M._sylvanu AAGCTTCTCC GGTGCAACTA TCCTTATAGT TGCCCATGGA CTCACCTCTT Homo_sapie AAGCTTCACC GGCGCAGTCA TTCTCATAAT CGCCCACGGG CTTACATCCT Gorilla AAGCTTCACC GGCGCAGTTG TTCTTATAAT TGCCCACGGA CTTACATCAT Pongo AAGCTTCACC GGCGCAACCA CCCTCATGAT TGCCCAT
23、GGA CTCACATCCT Saimiri_sc AAGCTTCACC GGCGCAATGA TCCTAATAAT CGCTCACGGG TTTACTTCGT Lemur_catt AAGCTTCATA GGAGCAACCA TTCTAATAAT CGCACATGGC CTTACATCAT2、使用PHYLIP 軟件包構(gòu)建上述DNA分子系統(tǒng)發(fā)生樹?!緦嶒灧椒ā恳?、用CLUSTALX軟件對已知DNA序列做多序列比對。操作步驟:1、以FASTA格式準(zhǔn)備8個DNA序列test.seq(或txt)文件。2、雙擊進(jìn)入CLUSTALX程序,點FILE進(jìn)入LOAD SEQUENCE,打開test.seq(或
24、txt)文件。3、點ALIGNMENT,在默認(rèn)alignment parameters下,點擊Do complete Alignment 。在新出現(xiàn)的窗口中點擊ALIGN進(jìn)行比對,這時輸出兩個文件(默認(rèn)輸出文件格式為Clustal格式):比對文件test.aln和向?qū)湮募est.dnd。4、點FILE進(jìn)入Save sequence as,在format 框中選PHYLIP,文件在PHYLIP軟件目錄下以test.phy存在,點擊OK。5、將PHYLIP軟件目錄下的test.phy文件拷貝到EXE文件夾中。用計事本方式打開的test.phy文件的部分序列如下: 二、用PHYLIP軟件推導(dǎo)進(jìn)化
25、樹。1、進(jìn)入EXE文件夾,點擊SEQBOOT軟件輸入test.phy文件名,回車。圖中的D、J、R、I、O、1、2代表可選擇的選項,鍵入這些字母,程序的條件就會發(fā)生改變。D選項無須改變。J選項有三種條件可以選擇,分別是Bootstrap、Jackknife和Permute。文章上面提到用Bootstraping法對進(jìn)化樹進(jìn)行評估,所謂Bootstraping法就是從整個序列的堿基(氨基酸)中任意選取一半,剩下的一半序列隨機(jī)補齊組成一個新的序列。這樣,一個序列就可以變成了許多序列。一個多序列組也就可以變成許多個多序列組。根據(jù)某種算法(最大簡約性法、最大可能性法、除權(quán)配對法或鄰位相連法)每個多序列
26、組都可以生成一個進(jìn)化樹。將生成的許多進(jìn)化樹進(jìn)行比較,按照多數(shù)規(guī)則(majority-rule)我們就會得到一個最“逼真”的進(jìn)化樹。Jackknife則是另外一種隨機(jī)選取序列的方法。它與Bootstrap法的區(qū)別是不將剩下的一半序列補齊,只生成一個縮短了一半的新序列。Permute是另外一種取樣方法,其目的與Bootstrap和Jackknife法不同,這里不再介紹。R選項讓使用者輸入republicate的數(shù)目。所謂republicate就是用Bootstrap法生成的一個多序列組。根據(jù)多序列中所含的序列的數(shù)目的不同可以選取不同的republicate,此處選200,輸入Y確認(rèn)參數(shù)并在Rand
27、om number seed (must be odd) ?的下面輸入一個奇數(shù)(比如3)。當(dāng)我們設(shè)置好條件后按回車,程序開始運行,并在EXE文件夾中產(chǎn)生一個文件outfile。2、 文件outfile改為infile。點擊DNADIST程序。選項M是輸入剛才設(shè)置的republicate的數(shù)目,輸入D選擇data sets,輸入200。設(shè)置好條件后,輸入Y確認(rèn)參數(shù)。程序開始運行,并在EXE文件夾中產(chǎn)生outfile,將outfile文件名改為infile,為避免與原先infile文件重復(fù),將 原先文件名改為infile1。3、EXE文件夾中選擇通過距離矩陣推測進(jìn)化樹的算法,點擊NEIGHBOR程
28、序。輸入M更改參數(shù),輸入D選擇data sets。輸入200。輸入奇數(shù)種子3。輸Y確認(rèn)參數(shù)。程序開始運行,并在EXE文件夾中產(chǎn)生outfile和outtree兩個結(jié)果輸出。outtree文件是一個樹文件,可以用treeview等軟件打開。outfile是一個分析結(jié)果的輸出報告,包括了樹和其他一些分析報告,可以用記事本直接打開。部分內(nèi)容如下:4、將outtree文件名改為intree,點擊DRAWTREE程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運行,并出現(xiàn)Tree Preview圖。5、點擊DRAWGRAM程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運行,并出
29、現(xiàn)Tree Preview圖。 6、將EXE文件夾中的outfile文件名改為outfile1,以避免被新生成的outfile 文件覆蓋。點擊CONSENSE程序。輸入Y確認(rèn)設(shè)置。EXE文件夾中新生成outfile和outtree。Outfile文件用記事本打開,7、將EXE文件夾中的intree文件名改為intree1,將outtree改intree。點擊DRAWTREE程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運行,并出現(xiàn)Tree Preview圖。 8、點擊DRAWGRAM程序,輸入font1文件名,作為參數(shù)。輸Y確認(rèn)參數(shù)。程序開始運行,并出現(xiàn)Tree Preview圖
30、?!咀鳂I(yè)】1、提交使用CLUSTALX及PHYLIP軟件進(jìn)行多重序列比對及構(gòu)建系統(tǒng)發(fā)生樹的結(jié)果;2、總結(jié)多重序列比對及構(gòu)建系統(tǒng)發(fā)生樹的關(guān)鍵事項。實驗五 PCR引物設(shè)計及評價【實驗?zāi)康摹?、掌握引物設(shè)計的基本要求,并熟悉使用Primer premier5.0軟件進(jìn)行引物搜索。2、掌握使用軟件oligo6.0對設(shè)計的引物進(jìn)行評價分析?!緦嶒炘怼恳弧⒁镌O(shè)計原則聚合梅鏈?zhǔn)椒磻?yīng)(polymerase chain reaction)即PCR技術(shù),是一種在體外快速擴(kuò)增特定基因或DNA 序列的方法,故又稱基因的體外擴(kuò)增法。PCR技術(shù)已成為分子生物學(xué)研究中使用最多,最廣泛的手段之一,而引物設(shè)計是PCR技術(shù)中
31、至關(guān)重要的一環(huán),使用不合適的PCR引物容易導(dǎo)致實驗失?。罕憩F(xiàn)為擴(kuò)增出目的帶之外的多條帶(如形成引物二聚體帶),不出帶或出帶很弱,等等?,F(xiàn)在PCR引物設(shè)計大都通過計算機(jī)軟件進(jìn)行,可以直接提交模板序列到特定網(wǎng)頁,得到設(shè)計好的引物,也可以在本地計算機(jī)上運行引物設(shè)計專業(yè)軟件。引物設(shè)計原則如下:1、引物應(yīng)在序列的保守區(qū)域設(shè)計并具有特異性。引物序列應(yīng)位于基因組DNA的高度保守區(qū),且與非擴(kuò)增區(qū)無同源序列。這樣可以減少引物與基因組的非特異結(jié)合,提高反應(yīng)的特異性;2、引物的長度一般為15-30 bp。常用的是18-27 bp,但不應(yīng)大于38,因為過長會導(dǎo)致其延伸溫度大于74,不適于Taq DNA聚合酶進(jìn)行反應(yīng);
32、3、引物不應(yīng)形成二級結(jié)構(gòu)。引物二聚體及發(fā)夾結(jié)構(gòu)的能值過高(超過4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶,并且降低引物有效濃度而使PCR反應(yīng)不能正常進(jìn)行;4、引物序列的GC含量一般為40-60%。過高或過低都不利于引發(fā)反應(yīng)。上下游引物的GC含量不能相差太大;5、引物所對應(yīng)模板位置序列的Tm值在72左右可使復(fù)性條件最佳。Tm值的計算有多種方法,如按公式Tm=4(G+C)+2(A+T);6、引物5端序列對PCR影響不太大,因此常用來引進(jìn)修飾位點或標(biāo)記物??筛鶕?jù)下一步實驗中要插入PCR產(chǎn)物的載體的相應(yīng)序列而確定。7、引物3端不可修飾。引物3端的末位堿基對Taq酶的DNA合成效率有較大的影響。不同
33、的末位堿基在錯配位置導(dǎo)致不同的擴(kuò)增效率,末位堿基為A的錯配效率明顯高于其他3個堿基,因此應(yīng)當(dāng)避免在引物的3端使用堿基A。8、引物序列自身或者引物之間不能在出現(xiàn)3個以上的連續(xù)堿基,如GGG或CCC,也會使錯誤引發(fā)機(jī)率增加;9、G值是指DNA雙鏈形成所需的自由能,該值反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對的相對穩(wěn)定性。應(yīng)當(dāng)選用3端 G值較低(絕對值不超過9),而5端和中間 G值相對較高的引物。引物的3端的 G值過高,容易在錯配位點形成雙鏈結(jié)構(gòu)并引發(fā)DNA聚合反應(yīng);值得一提的是,各種模板的引物設(shè)計難度不一。有的模板本身條件比較困難,例如GC含量偏高或偏低,導(dǎo)致找不到各種指標(biāo)都十分合適的引物;在用作克隆目的的PCR
34、因為產(chǎn)物序列相對固定,引物設(shè)計的選擇自由度較低,在這種情況只能退而求其次,盡量去滿足條件。二、引物設(shè)計軟件Primer premier5.0及oligo6.0“Premier”的主要功能分四大塊,其中有三種功能比較常用,即引物設(shè)計、限制性內(nèi)切酶位點分析和DNA 基元(motif)查找?!癙remier”還具有同源性分析功能,但并非其特長,在此略過。此外,該軟件還有一些特殊功能,其中最重要的是設(shè)計簡并引物,另外還有序列“朗讀”、DNA 與蛋白序列的互換、語音提示鍵盤輸入等等。有時需要根據(jù)一段氨基酸序列反推到DNA 來設(shè)計引物,由于大多數(shù)氨基酸(20 種常見結(jié)構(gòu)氨基酸中的18 種)的遺傳密碼不只一
35、種,因此,由氨基酸序列反推DNA 序列時,會遇到部分堿基的不確定性。這樣設(shè)計并合成的引物實際上是多個序列的混和物,它們的序列組成大部分相同,但在某些位點有所變化,稱之為簡并引物。遺傳密碼規(guī)則因物種或細(xì)胞亞結(jié)構(gòu)的不同而異,比如在線粒體內(nèi)的遺傳密碼與細(xì)胞核是不一樣的?!癙remier”可以針對模板DNA 的來源以相應(yīng)的遺傳密碼規(guī)則轉(zhuǎn)換DNA 和氨基酸序列。軟件共給出八種生物亞結(jié)構(gòu)的不同遺傳密碼規(guī)則供用戶選擇,有纖毛蟲大核(Ciliate Macronuclear)、無脊椎動物線粒體(Invertebrate Mitochondrion)、支原體(Mycoplasma)、植物線粒體(Plant Mi
36、tochondrion)、原生動物線粒體(Protozoan Mitochondrion)、一般標(biāo)準(zhǔn)(Standard)、脊椎動物線粒體(Vertebrate Mito-chondrion)和酵母線粒體(Yeast Mitochondrion)。 對引物進(jìn)行分析評價的的軟件中,“oligo” 是最著名的。它的使用并不十分復(fù)雜,Oligo 6.0的界面是三個圖,Tm圖、G圖和Frq圖?!癘ligo”的功能比“Premier”還要單一,就是引物設(shè)計。但它的引物分析功能如此強大以至于能風(fēng)靡全世界。所以引物設(shè)計的最佳搭配是“Premier”進(jìn)行引物搜索“Oligo” 對引物分析評價?!緦嶒瀮?nèi)容】1、使
37、用Primer premier5.0軟件進(jìn)行人瘦素 (leptin) mRNA引物的設(shè)計。2、使用oligo6.0對引物進(jìn)行評價分析?!緦嶒灧椒ā恳?、引物搜索1、打開Primer premier5.0軟件,調(diào)入人瘦素 (leptin) 基因序列:點擊“file” “open” “DNA sequence”;或者直接點擊“file” “new” “DNA sequence”,彈出一對話框如下圖,然后將序列人瘦素 (leptin) 基因復(fù)制在空白框。2、序列文件顯示如圖,點擊“Primer”;3、進(jìn)一步點擊“search” 按鈕,出現(xiàn)“search criteria”窗口,有多種參數(shù)可以調(diào)整。搜索
38、目的(Seach For)有三種選項,PCR引物(PCR Primers),測序引物(Sequencing Primers),雜交探針(Hybridization Probes)。搜索類型(Search Type)可選擇分別或同時查找上、下游引物(Sense/Anti-sense Primer,或Both),或者成對查找(Pairs),或者分別以適合上、下游引物為主(Compatible with Sense/Anti-sense Primer)。另外還可改變選擇區(qū)域(Search Ranges),引物長度(Primer Length),選擇方式(Search Mode),參數(shù)選擇(Searc
39、h Parameters)等等。使用者可根據(jù)自己的需要設(shè)定各項參數(shù)。我們將Product Size設(shè)置300350,其他參數(shù)使用默認(rèn)值。然后點擊“OK” ,隨之出現(xiàn)的Search Progress窗口中顯示Search Completed時,再點擊“OK”。 4、這時搜索結(jié)果以表格的形式出現(xiàn),有三種顯示方式,上游引物(Sense),下游引物(Anti-sense),成對顯示(Pairs)。默認(rèn)顯示為成對方式,并按優(yōu)劣次序(Rating)排列,滿分為100,即各指標(biāo)基本都能達(dá)標(biāo)(如下圖)。5、按照搜尋結(jié)果顯示,在主窗口中檢查該引物對的二級結(jié)構(gòu)情況,逐條分析,依次篩選。下面進(jìn)行序列篩選:點擊其中一
40、對引物,如第21#引物,在“Peimer Premier”主窗口,如圖所示:該圖分三部分,最上面是圖示PCR模板及產(chǎn)物位置,中間是所選的上下游引物的一些性質(zhì),最下面是四種重要指標(biāo)的分析,包括發(fā)夾結(jié)構(gòu)(Hairpin),二聚體(Dimer),錯誤引發(fā)情況(False Priming),及上下游引物之間二聚體形成情況(Cross Dimer)。當(dāng)所分析的引物有這四種結(jié)構(gòu)的形成可能時,按鈕由“None” 變成“Found” ,點擊該按鈕,在左下角的窗口中就會出現(xiàn)該結(jié)構(gòu)的形成情況。一對理想的引物應(yīng)當(dāng)不存在任何一種上述結(jié)構(gòu),因此最好的情況是最下面的分析欄沒有“Found”,只有“None” 。值得注意的
41、是中間一欄的末尾給出該引物的最佳退火溫度,可參考應(yīng)用。 二、引物分析1、打開oligo的頁面如下: 2、單擊file菜單再點open或點擊“打開”快捷圖標(biāo)或者用快捷鍵“CTrlO”可彈出一對話框,然后選擇序列人瘦素 (leptin) 基因。出現(xiàn)以下窗口。3、點擊“window”再點擊“Tile”,出現(xiàn)以下窗口,圖中顯示的三個指標(biāo)分別為Tm、G和Frq,因為分析要涉及多個指標(biāo),起動窗口的cascade排列方式不太方便,可從windows菜單改為tile方式。如果覺得太擁擠,可去掉一個指標(biāo)。G值反映了序列與模板的結(jié)合強度,最好引物的G值在5端和中間值比較高,而在3端相對低(如圖:)Tm值曲線以選取
42、72附近為佳,5到3的下降形狀也有利于引物引發(fā)聚合反應(yīng)。Frq曲線為“Oligo 6”新引進(jìn)的一個指標(biāo),揭示了序列片段存在的重復(fù)機(jī)率大小。選取引物時,宜選用3端Frq值相對較低的片段。4、在設(shè)計時,可依據(jù)圖上三種指標(biāo)的信息選取序列,如果覺得合適,可點擊Tm圖塊上左下角的Upper按鈕 ,選好上游引物,此時該按鈕變成紅色,表示上游引物已選取好。下游引物的選取步驟基本同上,只是按鈕變成Lower。5、當(dāng)上下游引物全選好以后,需要對引物進(jìn)行評價??梢杂谩癆nalyse”菜單分析你的引物:比如有無引物二聚體、發(fā)卡結(jié)構(gòu)等等。首先檢查引物二聚體尤其是3端二聚體形成的可能性。需要注意的是,引物二聚體有可能是
43、上游或下游引物自身形成,也有可能是在上下游引物之間形成(cross dimer)。二聚體形成的能值越高,越不符合要求。一般的檢測(非克?。┬訮CR,對引物位置、產(chǎn)物大小要求較低,因而應(yīng)盡可能選取不形成二聚體或其能值較低的引物。第二項檢查是發(fā)夾結(jié)構(gòu)(hairpin);與二聚體相同,發(fā)夾結(jié)構(gòu)的能值越低越好。一般來說,這兩項結(jié)構(gòu)的能值以不超過4.5為好。當(dāng)然,在設(shè)計克隆目的的PCR引物時,引物兩端一般都添加酶切位點,必然存在發(fā)夾結(jié)構(gòu),而且能值不會太低。這種PCR需要通過靈活調(diào)控退火溫度以達(dá)到最好效果,對引物的發(fā)夾結(jié)構(gòu)的檢測就不應(yīng)要求太高。第三項檢查為GC含量,以45-55為宜。有一些模板本身的GC含
44、量偏低或偏高,導(dǎo)致引物的GC含量不能被控制在上述范圍內(nèi),這時應(yīng)盡量使上下游引物的GC含量以及Tm值保持接近,以有利于退火溫度的選擇。當(dāng)我們結(jié)束以上三項檢測,按Alt+P鍵彈出PCR窗口,其中總結(jié)性地顯示該引物的位置、產(chǎn)物大小、Tm值等參數(shù),最有用的是還給出了推薦的最佳退火溫度和簡單的評價。 【作業(yè)】1、提交使用Primer premier5.0及oligo6.0軟件進(jìn)行人瘦素 (leptin) mRNA引物的設(shè)計結(jié)果;2、總結(jié)引物設(shè)計應(yīng)注意的關(guān)鍵事項。實驗六 蛋白質(zhì)序列分析和結(jié)構(gòu)預(yù)測【實驗?zāi)康摹?、掌握蛋白質(zhì)序列檢索的操作方法;2、熟悉蛋白質(zhì)基本性質(zhì)分析;3、熟悉基于序列同源性分析的蛋白質(zhì)功能預(yù)測,了解基于motif、 結(jié)構(gòu)位點、結(jié)構(gòu)功能域數(shù)據(jù)庫的蛋白質(zhì)功能預(yù)測;4、了解蛋白質(zhì)結(jié)構(gòu)預(yù)測?!緦嶒瀮?nèi)容】1、使用Entrez或SRS信息查詢系統(tǒng)檢索人脂聯(lián)素 (adiponectin)蛋白質(zhì)序列;2、使用BioEdit軟件對上述蛋白質(zhì)序列進(jìn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度醫(yī)院物業(yè)委托管理與維護(hù)合同4篇
- 2025年度個人向公司借款用于投資合作合同范本2篇
- 2025年度影視作品制作及版權(quán)運營合同3篇
- 2024版院長聘用合同
- 2024裝修樣板間保密協(xié)議
- 2025年度智能家居產(chǎn)品承包加工合同4篇
- 2025年度智慧社區(qū)車位出售及智能停車解決方案合同4篇
- 2025年度咖啡館股權(quán)置換及品牌輸出合同3篇
- 2025年復(fù)雜斷塊油田項目可行性研究報告
- 2025年度體育場館運營管理承包服務(wù)合同范本4篇
- 人教版(2025新版)七年級下冊英語:寒假課內(nèi)預(yù)習(xí)重點知識默寫練習(xí)
- 藝術(shù)品捐贈協(xié)議
- 【公開課】同一直線上二力的合成+課件+2024-2025學(xué)年+人教版(2024)初中物理八年級下冊+
- 高職組全國職業(yè)院校技能大賽(嬰幼兒照護(hù)賽項)備賽試題庫(含答案)
- 2024年公安部直屬事業(yè)單位招聘筆試參考題庫附帶答案詳解
- NB-T 47013.15-2021 承壓設(shè)備無損檢測 第15部分:相控陣超聲檢測
- 10KV供配電工程施工組織設(shè)計
- 終端攔截攻略
- 藥物外滲處理及預(yù)防【病房護(hù)士安全警示教育培訓(xùn)課件】--ppt課件
- 紙箱檢驗標(biāo)準(zhǔn)新
評論
0/150
提交評論