實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示_第1頁
實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示_第2頁
實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示_第3頁
實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示_第4頁
實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于實驗四蛋白質(zhì)序列結(jié)構(gòu)的獲取和顯示2實驗項目四:蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示

一、實驗?zāi)康暮鸵螅赫莆盏鞍踪|(zhì)序列數(shù)據(jù)庫Uniprot的查詢方法及格式特點掌握蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB的及格式特點掌握蛋白質(zhì)結(jié)構(gòu)顯示軟件Pymol的使用第2頁,共57頁,2024年2月25日,星期天3UniProt:UniversalProteinResource

收錄蛋白質(zhì)序列目錄最廣泛、功能注釋最全面的數(shù)據(jù)庫;包含三個子庫:UniProtKB(UniProtKnowledgebase)UniRef(UniProtReferenceClusters)UniParc(UniprotArchive)一UniProt數(shù)據(jù)庫1.簡介第3頁,共57頁,2024年2月25日,星期天42.數(shù)據(jù)來源EuropeanBioinformaticsInstitute(EMBL-EBI)SIBSwissInstituteofBioinformaticsProteinInformationResource(PIR)Swiss-ProtandTrEMBLProteinSequenceDatabase(PIR-PSD)第4頁,共57頁,2024年2月25日,星期天5UniProt的網(wǎng)址:/

第5頁,共57頁,2024年2月25日,星期天3.數(shù)據(jù)查詢

Uniprot檢索號,包括6個字符串,可由大寫字母A~Z和數(shù)字0~9組合而成。

也可以用關(guān)鍵詞檢索

第6頁,共57頁,2024年2月25日,星期天檢索演示例1:查詢草履蟲細胞周期蛋白依賴的蛋白激酶(CDK2)的結(jié)構(gòu)數(shù)據(jù)(1)登陸Uniprot網(wǎng)站/(2)在搜索欄選中“Proteinknowledgebase(UniProtKB)”,在文本框中輸入“ParameciumtetraureliaCDK2”,單擊SiteSearch按鈕,出現(xiàn)結(jié)果。第7頁,共57頁,2024年2月25日,星期天8第8頁,共57頁,2024年2月25日,星期天9第9頁,共57頁,2024年2月25日,星期天10第10頁,共57頁,2024年2月25日,星期天11第11頁,共57頁,2024年2月25日,星期天12第12頁,共57頁,2024年2月25日,星期天13與其他數(shù)據(jù)庫的鏈接第13頁,共57頁,2024年2月25日,星期天14第14頁,共57頁,2024年2月25日,星期天154.UniProt數(shù)據(jù)格式IDQ9XYV1_PARTEUnreviewed;301AA.ACQ9XYV1;DT01-NOV-1999,integratedintoUniProtKB/TrEMBL.DT01-NOV-1999,sequenceversion1.DT21-MAR-2012,entryversion71.DESubName:Full=Cyclin-dependentproteinkinaseCdk2;GNName=CDK2;OSParameciumtetraurelia.OCEukaryota;Alveolata;Ciliophora;Intramacronucleata;OCOligohymenophorea;Peniculida;Parameciidae;Paramecium.OXNCBI_TaxID=5888;頭部區(qū)序列名稱序列編號序列來源的物種名序列來源的物種學(xué)名和分類學(xué)位物種分類號序列簡單說明第15頁,共57頁,2024年2月25日,星期天16引文區(qū)RN[1]RPNUCLEOTIDESEQUENCE.RCSTRAIN=51S;RXMEDLINE=99448661;PubMed=10519216;RXDOI=10.1111/j.1550-7408.1999.tb06065.x;RAZhangH.,BergerJ.D.;RT"Anovelmemberofthecyclin-dependentkinasefamilyinParameciumRTtetraurelia.";RLJ.Eukaryot.Microbiol.46:482-491(1999).評論區(qū)CC-----------------------------------------------------------------------CCCopyrightedbytheUniProtConsortium,see/termsCCDistributedundertheCreativeCommonsAttribution-NoDerivsLicenseCC---------------------------------------------------------------------相關(guān)文獻編號或遞交序列的注冊信息序列注釋信息第16頁,共57頁,2024年2月25日,星期天17交叉引用數(shù)據(jù)庫區(qū)DREMBL;AF126147;AAD34354.1;-;Genomic_DNA.DRHSSP;P24941;1OIQ.DRProteinModelPortal;Q9XYV1;-.DRGO;GO:0005524;F:ATPbinding;IEA:UniProtKB-KW.DRGO;GO:0004674;F:proteinserine/threoninekinaseactivity;IEA:InterPro.DRInterPro;IPR011009;Kinase-like_dom.DRInterPro;IPR000719;Prot_kinase_cat_dom.DRInterPro;IPR017441;Protein_kinase_ATP_BS.DRInterPro;IPR002290;Ser/Thr_dual-sp_kinase_dom.DRInterPro;IPR008271;Ser/Thr_kinase_AS.DRPfam;PF00069;Pkinase;1.DRSMART;SM00220;S_TKc;1.DRSUPFAM;SSF56112;Kinase_like;1.DRPROSITE;PS00107;PROTEIN_KINASE_ATP;1.DRPROSITE;PS50011;PROTEIN_KINASE_DOM;1.DRPROSITE;PS00108;PROTEIN_KINASE_ST;1.第17頁,共57頁,2024年2月25日,星期天18序列區(qū)KWATP-binding;Cyclin;Kinase;Nucleotide-binding;Transferase.SQSEQUENCE301AA;34675MW;E839F1A5EA0D5CB5CRC64;

MDLAQSEERYQKLEKIGEGTYGLVYKARDNQTGDIVALKKIRMDHEDEGVPSTAIREISLLKEVQHPNIVPLKDVVYDESRLYLIFDFVDLDLKKYMESVPQLDRMQVKKFINQMIQALNYCHQNRVIHRDLKPQNILVDIKQQNTQIADFGLARAFGLPLKTYTHEVITLWYRAPEILLGQRQYSTPVDIWSLGCIFAEMAQKRPLFCGDSEIDQLFKIFKIMGTPKESTWPGVSTLPDFKSTFPRWPTPTNPAATLGKDITNLCPLGLDLLSKMITYDPYARITAEEALKHAYFDELNN//

與序列相關(guān)的關(guān)鍵詞氨基酸統(tǒng)計數(shù)第18頁,共57頁,2024年2月25日,星期天19DNA代碼氨基酸代碼第19頁,共57頁,2024年2月25日,星期天20FASTA文件格式>tr|Q9XYV1|Q9XYV1_PARTECyclin-dependentproteinkinaseCdk2OS=ParameciumtetraureliaGN=CDK2PE=4SV=1ID號名稱,基本性質(zhì)簡要說明第20頁,共57頁,2024年2月25日,星期天21在Uniprot中查詢擬南芥的光敏色素phyE編碼蛋白的詳細信息,閱讀序列格式的解釋,列出共包含哪幾個部分?標出頭部區(qū)主要字段的含義。在Uniprot中查詢(1)擬南芥油菜素內(nèi)酯受體gibberellinreceptor

GID1C、(2)水稻獨角金內(nèi)酯水解酶strigolactonehydrolaseD14的蛋白質(zhì)序列,這兩個蛋白包含多少個氨基酸?寫出它們所對應(yīng)的mRNA檢索號(類似于這樣的格式N*_*****)、GeneID號。作業(yè)第21頁,共57頁,2024年2月25日,星期天二蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDBProteinDataBank,美國Brookhaven國家實驗室管理生物大分子三維空間結(jié)構(gòu)原子坐標數(shù)據(jù)庫/pdb/

NCBISTRUCTURE:MMDB(MolecularModellingDataBase),包含了從PDB獲取的實驗確定的生物高聚物結(jié)構(gòu)分子模型數(shù)據(jù)庫。第22頁,共57頁,2024年2月25日,星期天PDB數(shù)據(jù)庫(proteindatabank)1.簡介

美國Brookhaven實驗室1971年建立的大分子結(jié)構(gòu)數(shù)據(jù)庫PDB蛋白質(zhì)晶體結(jié)構(gòu)資料數(shù)據(jù)庫

(ProteinDataBank)。

PDB數(shù)據(jù)庫的維護由結(jié)構(gòu)生物信息學(xué)研究合作組織(ResearchCollaborationforStructuralBioinformatics,RCSB)負責。第23頁,共57頁,2024年2月25日,星期天2.數(shù)據(jù)來源

通過實驗(X射線晶體衍射,核磁共振,電子顯微鏡方法等)測定的生物大分子的三維結(jié)構(gòu)。主要是蛋白質(zhì)的三維結(jié)構(gòu),還包括核酸、糖類、蛋白質(zhì)與核酸復(fù)合物的三維結(jié)構(gòu)。第24頁,共57頁,2024年2月25日,星期天3.數(shù)據(jù)統(tǒng)計截止2013年11月,PDB數(shù)據(jù)庫已含有95644個結(jié)構(gòu)數(shù)據(jù),其中約92.5%是蛋白質(zhì)的結(jié)構(gòu)。第25頁,共57頁,2024年2月25日,星期天第26頁,共57頁,2024年2月25日,星期天4.數(shù)據(jù)查詢

PDB中的記錄有唯一的PDB-ID,包括4個字符串,可由大寫字母A~Z和數(shù)字0~9組合而成。

PDB和它的鏡像站點提供每個PDB記錄的查詢,可按一些專門的查詢項目(如提交數(shù)據(jù)、作者姓名、結(jié)構(gòu)表達)進行檢索。

第27頁,共57頁,2024年2月25日,星期天檢索演示例1:查詢?nèi)祟悳I液載脂蛋白的結(jié)構(gòu)數(shù)據(jù)(1)登陸PDB網(wǎng)站/pdb/(2)在上方的搜索欄選中“Everything”,在文本框中輸入“HUMANTEARLIPOCALIN”,單擊SiteSearch按鈕,出現(xiàn)結(jié)果。第28頁,共57頁,2024年2月25日,星期天第一步:輸入關(guān)鍵字“HUMANTEARLIPOCALIN”也可輸入ID號

第29頁,共57頁,2024年2月25日,星期天第二步:選擇人類淚液載脂蛋白1XKI第30頁,共57頁,2024年2月25日,星期天數(shù)據(jù)查看:(3)分別單擊標簽3Dview,Sequence,Annotations,Seq.Similarity,3DSimilarity,Literature,Biol.&Chem.,Methods,Geometry觀察數(shù)據(jù)信息。(4)回到Summary標簽,在右側(cè)的BiologicalAssembly區(qū)域可以觀察蛋白的三維結(jié)構(gòu)。(5)單擊右側(cè)目錄中的DownloadFiles下載不同格式和內(nèi)容的文件;或下載FASTA序列文件;也可下載PDB文件(1XKI.pdb)。第31頁,共57頁,2024年2月25日,星期天第三步:觀察數(shù)據(jù)信息1XKI第32頁,共57頁,2024年2月25日,星期天第33頁,共57頁,2024年2月25日,星期天第四步:1XKI結(jié)構(gòu)展示圖

第34頁,共57頁,2024年2月25日,星期天第35頁,共57頁,2024年2月25日,星期天下載PDB結(jié)構(gòu)文件第36頁,共57頁,2024年2月25日,星期天5.數(shù)據(jù)結(jié)構(gòu)PDB中對于每一個結(jié)構(gòu)記錄,包含名稱、參考文獻、序列、一級結(jié)構(gòu)、二級結(jié)構(gòu)和原子坐標等信息。每條記錄有兩種序列信息,一種是顯式序列信息(explicitsequence),一種是隱式序列信息(implicitsequence)。第37頁,共57頁,2024年2月25日,星期天

在PDB文件中,以關(guān)鍵字SEQRES作為顯式序列標記,以該關(guān)鍵字打頭的每一行都是關(guān)于序列的信息;PDB的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個原子的名稱和原子的三維坐標。第38頁,共57頁,2024年2月25日,星期天PDB文本文件,用寫字板打開標題部分分子類別—轉(zhuǎn)運蛋白該文件的公布日期該化合物的pdb代碼該化合物的來源結(jié)構(gòu)測定者名字REMARK是此pdb文件的參考書目、最大分辨率、注解等第39頁,共57頁,2024年2月25日,星期天第40頁,共57頁,2024年2月25日,星期天一級結(jié)構(gòu)雜因子第41頁,共57頁,2024年2月25日,星期天二級結(jié)構(gòu)連接注釋晶胞特征及坐標變換第42頁,共57頁,2024年2月25日,星期天連通性部分

坐標部分1-6“ATOM或HETATM”7-11原子序列號13-16原子名稱18-20殘基名22鏈標識符23-26殘基序列號31-38X坐標39-46Y坐標47-54Z坐標55-60位置61-66溫度因子79-80原子帶的電荷77-78元素符號

第43頁,共57頁,2024年2月25日,星期天三

結(jié)構(gòu)顯示軟件-PyMOL簡介/All指所有的對象,3ODU指剛才打開的文件,(sele)是選擇的對象按鈕A:代表對這個對象的各種action,S:顯示這個對象的某種樣式,H:隱藏某種樣式,L:顯示某種label,C:顯示的顏色第44頁,共57頁,2024年2月25日,星期天點擊all中的H,選擇everything,隱藏所有點擊3ODU中的S,選擇cartoon,以cartoon形式顯示蛋白質(zhì)點擊3ODU中的C,選擇byss,以二級結(jié)構(gòu)分配顏色,選擇點擊右下角的S,窗口上面出現(xiàn)蛋白質(zhì)氨基酸序列,找到1164位ITD,是配體第45頁,共57頁,2024年2月25日,星期天點擊選擇ITD,此時sele中就包含ITD這個殘基,點擊(sele)行的A,選擇renameselection,窗口中出現(xiàn)更改sele為IDT,點擊(IDT)行的S選擇sticks,點擊C,選擇byelement,選擇,調(diào)整窗口使此分子清楚顯示。第46頁,共57頁,2024年2月25日,星期天IDT行點擊A選擇find,選擇polarcontacts,再根據(jù)需要選擇,這里選擇tootheratomsinobject,分子顯示窗口中出現(xiàn)幾個黃色的虛線,,這就是氫鍵的對象,點擊這一行的C,選擇red

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論