實驗四蛋白質序列結構的獲取和顯示_第1頁
實驗四蛋白質序列結構的獲取和顯示_第2頁
實驗四蛋白質序列結構的獲取和顯示_第3頁
實驗四蛋白質序列結構的獲取和顯示_第4頁
實驗四蛋白質序列結構的獲取和顯示_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、關于實驗四蛋白質序列結構的獲取和顯示第1頁,共57頁,2022年,5月20日,0點54分,星期四2實驗項目四:蛋白質序列、結構的獲取和顯示一、 實驗目的和要求: 掌握蛋白質序列數(shù)據(jù)庫Uniprot的查詢方法及格式特點掌握蛋白質結構數(shù)據(jù)庫PDB的及格式特點 掌握蛋白質結構顯示軟件Pymol的使用第2頁,共57頁,2022年,5月20日,0點54分,星期四3UniProt:Universal Protein Resource 收錄蛋白質序列目錄最廣泛、功能注釋最全面的數(shù)據(jù)庫;包含三個子庫:UniProtKB(UniProt Knowledgebase)UniRef(UniProt Referenc

2、e Clusters)UniParc(Uniprot Archive)一 UniProt數(shù)據(jù)庫1. 簡介第3頁,共57頁,2022年,5月20日,0點54分,星期四42. 數(shù)據(jù)來源European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)第4頁,共57頁,2022年,5月20日,0點54分,星期四5UniProt的

3、網(wǎng)址: / 第5頁,共57頁,2022年,5月20日,0點54分,星期四3.數(shù)據(jù)查詢 Uniprot檢索號,包括6個字符串,可由大寫字母AZ和數(shù)字09組合而成。 也可以用關鍵詞檢索 第6頁,共57頁,2022年,5月20日,0點54分,星期四檢索演示例1:查詢草履蟲細胞周期蛋白依賴的蛋白激酶(CDK2)的結構數(shù)據(jù)(1)登陸Uniprot網(wǎng)站 /(2)在搜索欄選中“Protein knowledgebase(UniProtKB)” ,在文本框中輸入“Paramecium tetraurelia CDK2”,單擊Site Search按鈕,出現(xiàn)結果。第7頁,共57頁,2022年,5月20日,0點5

4、4分,星期四8第8頁,共57頁,2022年,5月20日,0點54分,星期四9第9頁,共57頁,2022年,5月20日,0點54分,星期四10第10頁,共57頁,2022年,5月20日,0點54分,星期四11第11頁,共57頁,2022年,5月20日,0點54分,星期四12第12頁,共57頁,2022年,5月20日,0點54分,星期四13與其他數(shù)據(jù)庫的鏈接第13頁,共57頁,2022年,5月20日,0點54分,星期四14第14頁,共57頁,2022年,5月20日,0點54分,星期四154. UniProt數(shù)據(jù)格式ID Q9XYV1_PARTE Unreviewed; 301 AA.AC Q9XY

5、V1;DT 01-NOV-1999, integrated into UniProtKB/TrEMBL.DT 01-NOV-1999, sequence version 1.DT 21-MAR-2012, entry version 71.DE SubName: Full=Cyclin-dependent protein kinase Cdk2;GN Name=CDK2;OS Paramecium tetraurelia.OC Eukaryota; Alveolata; Ciliophora; Intramacronucleata;OC Oligohymenophorea; Peniculid

6、a; Parameciidae; Paramecium.OX NCBI_TaxID=5888;頭部區(qū)序列名稱序列編號序列來源的物種名序列來源的物種學名和分類學位物種分類號序列簡單說明第15頁,共57頁,2022年,5月20日,0點54分,星期四16引文區(qū)RN 1RP NUCLEOTIDE SEQUENCE.RC STRAIN=51S;RX MEDLINE=99448661; PubMed=10519216;RX DOI=10.1111/j.1550-7408.1999.tb06065.x;RA Zhang H., Berger J.D.;RT A novel member of the cyc

7、lin-dependent kinase family in ParameciumRT tetraurelia.;RL J. Eukaryot. Microbiol. 46:482-491(1999).評論區(qū)CC -CC Copyrighted by the UniProt Consortium, see /termsCC Distributed under the Creative Commons Attribution-NoDerivs LicenseCC -相關文獻編號或遞交序列的注冊信息序列注釋信息第16頁,共57頁,2022年,5月20日,0點54分,星期四17交叉引用數(shù)據(jù)庫區(qū)DR

8、EMBL; AF126147; AAD34354.1; -; Genomic_DNA.DR HSSP; P24941; 1OIQ.DR ProteinModelPortal; Q9XYV1; -.DR GO; GO:0005524; F:ATP binding; IEA:UniProtKB-KW.DR GO; GO:0004674; F:protein serine/threonine kinase activity; IEA:InterPro.DR InterPro; IPR011009; Kinase-like_dom.DR InterPro; IPR000719; Prot_kinase

9、_cat_dom.DR InterPro; IPR017441; Protein_kinase_ATP_BS.DR InterPro; IPR002290; Ser/Thr_dual-sp_kinase_dom.DR InterPro; IPR008271; Ser/Thr_kinase_AS.DR Pfam; PF00069; Pkinase; 1.DR SMART; SM00220; S_TKc; 1.DR SUPFAM; SSF56112; Kinase_like; 1.DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1.DR PROSITE; PS50

10、011; PROTEIN_KINASE_DOM; 1.DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1.第17頁,共57頁,2022年,5月20日,0點54分,星期四18序列區(qū)KW ATP-binding; Cyclin; Kinase; Nucleotide-binding; Transferase.SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV

11、PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTHEVIT LWYRAPEILL GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN N/與序列相關的關鍵詞氨基酸統(tǒng)計數(shù)第18頁,共57頁,2022年,5月20日,0點54分,星期

12、四19DNA代碼氨基酸代碼第19頁,共57頁,2022年,5月20日,0點54分,星期四20FASTA文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1ID 號名稱,基本性質簡要說明第20頁,共57頁,2022年,5月20日,0點54分,星期四21在Uniprot中查詢擬南芥的光敏色素phyE編碼蛋白的詳細信息,閱讀序列格式的解釋,列出共包含哪幾個部分?標出頭部區(qū)主要字段的含義。在Uniprot中查詢(1)擬南芥油菜素內(nèi)酯受體gib

13、berellin receptor GID1C 、 (2)水稻獨角金內(nèi)酯水解酶strigolactone hydrolase D14的蛋白質序列,這兩個蛋白包含多少個氨基酸?寫出它們所對應的mRNA檢索號(類似于這樣的格式N*_*)、GeneID號。作 業(yè)第21頁,共57頁,2022年,5月20日,0點54分,星期四二 蛋白質結構數(shù)據(jù)庫PDB Protein DataBank,美國Brookhaven國家實驗室管理生物大分子三維空間結構原子坐標數(shù)據(jù)庫 /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了從PDB獲取的實驗確定

14、的生物高聚物結構分子模型數(shù)據(jù)庫 。第22頁,共57頁,2022年,5月20日,0點54分,星期四PDB數(shù)據(jù)庫( protein data bank )1. 簡介 美國Brookhaven實驗室1971年建立的大分子結構數(shù)據(jù)庫PDB 蛋白質晶體結構資料數(shù)據(jù)庫 (Protein Data Bank)。 PDB數(shù)據(jù)庫的維護由結構生物信息學研究合作組織(Research Collaboration for Structural Bioinformatics, RCSB)負責。第23頁,共57頁,2022年,5月20日,0點54分,星期四2.數(shù)據(jù)來源 通過實驗(X射線晶體衍射,核磁共振,電子顯微鏡方法等

15、)測定的生物大分子的三維結構。 主要是蛋白質的三維結構,還包括核酸、糖類、蛋白質與核酸復合物的三維結構。 第24頁,共57頁,2022年,5月20日,0點54分,星期四3.數(shù)據(jù)統(tǒng)計 截止2013年11月,PDB數(shù)據(jù)庫已含有95644 個結構數(shù)據(jù),其中約92.5%是蛋白質的結構。 第25頁,共57頁,2022年,5月20日,0點54分,星期四第26頁,共57頁,2022年,5月20日,0點54分,星期四4.數(shù)據(jù)查詢 PDB中的記錄有唯一的PDB-ID,包括4個字符串,可由大寫字母AZ和數(shù)字09組合而成。 PDB和它的鏡像站點提供每個PDB記錄的查詢,可按一些專門的查詢項目(如提交數(shù)據(jù)、作者姓名、

16、結構表達)進行檢索。 第27頁,共57頁,2022年,5月20日,0點54分,星期四檢索演示例1:查詢?nèi)祟悳I液載脂蛋白的結構數(shù)據(jù)(1)登陸PDB網(wǎng)站 /pdb/(2)在上方的搜索欄選中“Everything” ,在文本框中輸入“HUMAN TEAR LIPOCALIN”,單擊Site Search按鈕,出現(xiàn)結果。第28頁,共57頁,2022年,5月20日,0點54分,星期四第一步: 輸入關鍵字“HUMAN TEAR LIPOCALIN” 也可輸入ID號 第29頁,共57頁,2022年,5月20日,0點54分,星期四第二步: 選擇人類淚液載脂蛋白1XKI 第30頁,共57頁,2022年,5月20

17、日,0點54分,星期四數(shù)據(jù)查看:(3)分別單擊標簽3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry觀察數(shù)據(jù)信息。(4)回到Summary標簽,在右側的Biological Assembly區(qū)域可以觀察蛋白的三維結構。(5)單擊右側目錄中的Download Files下載不同格式和內(nèi)容的文件;或下載FASTA序列文件;也可下載PDB文件(1XKI.pdb)。第31頁,共57頁,2022年,5月20日,0點54分,星期四第三步:觀察數(shù)據(jù)信息

18、1XKI第32頁,共57頁,2022年,5月20日,0點54分,星期四第33頁,共57頁,2022年,5月20日,0點54分,星期四第四步: 1XKI結構展示圖 第34頁,共57頁,2022年,5月20日,0點54分,星期四第35頁,共57頁,2022年,5月20日,0點54分,星期四下載PDB結構文件第36頁,共57頁,2022年,5月20日,0點54分,星期四5.數(shù)據(jù)結構PDB中對于每一個結構記錄,包含名稱、參考文獻、序列、一級結構、二級結構和原子坐標等信息。 每條記錄有兩種序列信息,一種是顯式序列信息(explicit sequence),一種是隱式序列信息(implicit seque

19、nce)。第37頁,共57頁,2022年,5月20日,0點54分,星期四 在PDB文件中,以關鍵字SEQRES作為顯式序列標記,以該關鍵字打頭的每一行都是關于序列的信息;PDB的隱式序列即為立體化學數(shù)據(jù),包括每個原子的名稱和原子的三維坐標。 第38頁,共57頁,2022年,5月20日,0點54分,星期四PDB文本文件, 用寫字板打開標題部分分子類別轉運蛋白 該文件的公布日期 該化合物的pdb代碼 該化合物的來源 結構測定者名字 REMARK是此pdb文件的參考書目、最大分辨率、注解等 第39頁,共57頁,2022年,5月20日,0點54分,星期四第40頁,共57頁,2022年,5月20日,0點

20、54分,星期四一級結構雜因子第41頁,共57頁,2022年,5月20日,0點54分,星期四二級結構連接注釋晶胞特征及坐標變換第42頁,共57頁,2022年,5月20日,0點54分,星期四連通性部分坐標部分1-6 “ATOM 或 HETATM”7-11 原子序列號13-16 原子名稱18-20 殘基名22 鏈標識符23-26 殘基序列號31-38 X坐標39-46 Y坐標47-54 Z坐標55-60 位置61-66 溫度因子79-80 原子帶的電荷77-78 元素符號 第43頁,共57頁,2022年,5月20日,0點54分,星期四三 結構顯示軟件-PyMOL簡介/All指所有的對象,3ODU指剛

21、才打開的文件,(sele)是選擇的對象按鈕A:代表對這個對象的各種action,S:顯示這個對象的某種樣式,H:隱藏某種樣式,L:顯示某種label,C:顯示的顏色第44頁,共57頁,2022年,5月20日,0點54分,星期四點擊all中的H,選擇everything,隱藏所有點擊3ODU中的S,選擇cartoon,以cartoon形式顯示蛋白質點擊3ODU 中的C , 選擇by ss , 以二級結構分配顏色, 選擇點擊右下角的S,窗口上面出現(xiàn)蛋白質氨基酸序列,找到1164位ITD,是配體第45頁,共57頁,2022年,5月20日,0點54分,星期四點擊選擇ITD ,此時sele中就包含ITD這個殘基,點擊(sele)行的A,選擇rename selection,窗口中出現(xiàn)更改sele為IDT,點擊(IDT)行的S選擇sticks,點擊C,選擇by element,選擇,調整窗口使此分子清楚顯示。第46頁,共57頁,2022年,5月20日,0點54分,星期四IDT行點擊A 選擇find,選擇polar contacts,再根據(jù)需要選擇,這里選擇to other atoms in object ,分子顯示窗口中出現(xiàn)幾個黃色的虛線,這就是氫鍵的對象,點擊這一行的C,選擇red,把氫鍵顯示為紅色。 第4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論