核苷酸和/或氨基酸序列表和序列表電子文件標準_第1頁
核苷酸和/或氨基酸序列表和序列表電子文件標準_第2頁
核苷酸和/或氨基酸序列表和序列表電子文件標準_第3頁
核苷酸和/或氨基酸序列表和序列表電子文件標準_第4頁
核苷酸和/或氨基酸序列表和序列表電子文件標準_第5頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 本文由rockyshmily09貢獻 doc文檔可能在WAP端瀏覽體驗不佳。建議您優(yōu)先選擇TXT,或下載源文件到本機查看。 核苷酸和 核苷酸和或氨基酸序列表和序列表電子文件標準 (2001 年 11 月 1 日國家知識產(chǎn)權局令第 15 號公布) 1 總則 根據(jù)專利法實施細則第 18 條第 4 款的規(guī)定,包含一個或多個核苷酸或者氨基酸序列的 發(fā)明專利申請, 說明書中應當包括符合國家知識產(chǎn)權局專利局規(guī)定的序列表, 并按照國家知 識產(chǎn)權局專利局的規(guī)定提交含有該序列表的計算機可讀形式的副本。 為了使提交的紙件形式的核苷酸和或氨基酸序列表及計算機可讀形式的含有該序列 表的電子文件規(guī)范化, 以利于申請人

2、提交; 也為了使序列表電子文件可以快捷地輸入國家知 識產(chǎn)權局專利局的計算機數(shù)據(jù)庫,并與其它的序列檢索數(shù)據(jù)庫交換數(shù)據(jù),以利于公眾檢索; 同時也利于專利局審查員加快審查,更好地為申請人服務;特制定本標準。 2 適用范圍 本標準適用于所有向國家知識產(chǎn)權局專利局提交的包含核苷酸和或氨基酸序列的發(fā) 明專利申請,具體地說,適用于該申請?zhí)峤坏募埣问降暮塑账岷突虬被嵝蛄斜恚约?含有核苷酸和或氨基酸序列表的計算機可讀形式的序列表電子文件。 3 術語和定義 在本標準中,采用下面術語和定義: (1)序列表:是指以紙件形式提交的專利申請說明書的一部分,它公開了核苷酸和 或氨基酸序列的詳細內容和其它有用信息。序列

3、表中的序列是不少于 10 個核苷酸的非支鏈 核苷酸序列,或者是不少于 4 個氨基酸的非支鏈氨基酸序列。所述的序列不包括支鏈序列; 不包括具有少于 4 個特別定義的核苷酸或氨基酸的序列; 也不包括含有列于附錄 1 之表 14 以外的核苷酸或氨基酸的序列。 (2)序列表電子文件:是指包含核苷酸和或氨基酸序列表的計算機可讀形式的純文 本文件。 (3)核苷酸:只包括附錄 1 之表 1 中列出的符號所表示的核苷酸。附錄 1 之表 2 中列(4)氨基酸:只包括列于附錄 1 之表 3 中的存在于天然蛋白質中的 L氨基酸,不包 括 D(5)序列標識符:對應于序列表中每個序列的序列標識號的唯一的正整數(shù)。 (6)

4、數(shù)字標識符:由尖括號括起來的代表特定內容數(shù)據(jù)項的三位數(shù)字。 4 序列表和序列表電子文件中的數(shù)字標識符、內容及其格式: 在核苷酸和或氨基酸序列表和序列表電子文件中,應當有本標準中指出的數(shù)字標識 符, 在數(shù)字標識符之后 (即在其之右, 必要時還包括在其下面的若干行) 是相應的具體內容, 它們應當符合本標準規(guī)定的格式。 附錄 2 給出了一個說明數(shù)字標識符、 其后內容及格式的序 列表樣例。 序列表和序列表電子文件中包括的數(shù)字標識符及相應內容和格式具體如下: 4.1、序列表和序列表電子文件中的著錄項目: 在數(shù)字標識符110之后,是該專利申請的所有申請人的姓名或名稱。 外國申請人還應當在中文譯名之后注明英

5、文姓名或名稱,并將其用圓括號括起來。 在數(shù)字標識符120之后,是該專利申請的發(fā)明名稱。 在數(shù)字標識符130之后,是該專利申請的案卷參考號;沒有案卷參考號的,無需包 括此項內容。 對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數(shù)字標識符 140之后,是該專利申請的申請?zhí)枴?對于首次提交的專利申請,無需包括此項內容;當補交或提交修改時,在數(shù)字標識符 141之后,是該專利申請的申請日,其格式為:YYYYMMDD,例如 20020118。 沒有優(yōu)先權的專利申請,無需包括此項內容;如果有優(yōu)先權的話,那么在數(shù)字標識符 150之后,是該專利申請的優(yōu)先權號,其格式為:世界知識產(chǎn)權組織(WIP

6、O)標準 3(ST 3) 的國家、地區(qū)和政府間組織代碼優(yōu)先權號,例如,CN93112388.7。 沒有優(yōu)先權的專利申請,無需包括此項內容;如果有優(yōu)先權的話,那么在數(shù)字標識符 151之后,是該專利申請的優(yōu)先權日,其格式為:YYYYMMDD,例如 20010920。 4.2、序列表電子文件的軟件版本信息:其數(shù)字標識符為170 當使用國家知識產(chǎn)權局專利局或其它專利組織 (例如歐洲專利局) 提供的軟件形成核苷 酸和或氨基酸序列表電子文件時,在數(shù)字標識符170之后,是該軟件的名稱與版本號; 未使用所述軟件時,可以不包含此項內容。 4.3、序列表中序列的個數(shù):其數(shù)字標識符為160。 在數(shù)字標識符160之后

7、,是序列的總數(shù),即與數(shù)值最大的序列標識符相對應的正整 數(shù)。 4.4、序列中的各項內容: 在序列表中, 每個序列應當有獨立的、 唯一的序列標識符, 它應當從 1 開始并逐一增加。 序列標識符表示每個序列在序列表中的序號。 在數(shù)字標識符210之后,是與一個序列相對應的序列標識符。 在序列表中有多個序列的情況下, 應當按照序列標識符數(shù)值從小到大的次序逐一填寫每 個序列的各項內容。 在數(shù)字標識符211之后,是以堿基或氨基酸的數(shù)目表示的該序列的長度。 在數(shù)字標識符212 之后, 應當指出該序列的分子類型, DNA、 有 RNA 或 PRT 三種類型。 如果核苷酸序列含有 DNA 和 RNA 片段的話,那

8、么其類型應該是 DNA;另外,對于 DNA/RNA 的 結合分子,應該在該序列的特征部分(數(shù)字標識符220223)進一步表述。 在數(shù)字標識符213之后,應當用中文和拉丁文(拉丁文應當放在中文之后并用圓括 號括起來,例如,草履蟲種(Paramecium sp.))注明該序列來源的生物名稱,即科學命名的 生物屬種;或者是“人工序列”或“未知”。 223 本節(jié)涉及到序列中與特征相關的內容的表述。 在核苷酸序列(數(shù)字標識符400)中含有“n”“Xaa”或修飾 的氨基酸或不常用的 L(4)項的內容。 在生物體(數(shù)字標識符213)是“人工序列”或“未知”的情況下,必須包括下面 (1)和(4)項的內容。 在

9、一個序列中有多個特征的情況下, 應當按照這些特征在序列中出現(xiàn)的先后次序逐一地 表述每個特征。 序列中特征部分的具體內容和數(shù)字標識符如下: (1)特征:其數(shù)字標識符為220。 在數(shù)字標識符220之后,應當是空白。 (2)名稱關鍵詞:其數(shù)字標識符為221。 在數(shù)字標識符221之后,是特征名稱或關鍵詞。使用關鍵詞表述特征時,只能使用 附錄 1 之表 5 或表 6 中列出的關鍵詞來表述。 (3)位置:其數(shù)字標識符為222。 在數(shù)字標識符222之后,應當標明特征的位置,標注的方式為:從特征中的第一個 堿基或氨基酸的編號到特征的最后一個堿基或氨基酸的編號, 編號圓括號括起來, 兩個編號 中間是“”,例如:

10、(279)(389);當序列中使用了多個“n”或“Xaa”時,應當標 明它們的所有位置,例如:(80,100,112)。參見附錄 2 的序列表樣例。 (4)其它信息:其數(shù)字標識符為223。 在數(shù)字標識符223之后,應當表述序列中與特征有關的其它相關信息。在表述修飾 的堿基或修飾的氨基酸時,應該用附錄 1 之表 2 或表 4 中給出的符號來表述。 312 出版公開信息是非強制性的內容, 在序列表和序列表電子文件中, 可以包含也可以不包 含這些內容。 (1)公開出版信息:其數(shù)字標識符為300 在數(shù)字標識符300之后,應當是空白。 (2)作者:其數(shù)字標識符為301 在數(shù)字標識符301之后,是該文獻作

11、者的姓名。 (3)題目:其數(shù)字標識符為302 在數(shù)字標識符302之后,是出版物中該文獻的題目。 (4)雜志名稱:其數(shù)字標識符為303 在數(shù)字標識符303之后,是公開出版物的雜志名稱。 (5)公開出版物的卷號:其數(shù)字標識符為304 在數(shù)字標識符304之后,是公開出版物的卷號。 (6)公開出版物的出版號:其數(shù)字標識符為305 在數(shù)字標識符305之后,是公開出版物的出版號。 (7)頁碼:其數(shù)字標識符為306 在數(shù)字標識符306之后,是該文獻的起始終止頁碼。 (8)出版日期:其數(shù)字標識符為307 在數(shù)字標識符307之后,是該公開出版物的出版日期,其格式為:YYYYMMDD, 例如 19990920。

12、(9)公開出版物的數(shù)據(jù)庫登記號:其數(shù)字標識符為308 如果該文獻被收入某個數(shù)據(jù)庫的話,那么在數(shù)字標識符308之后,是該文獻在該數(shù) 據(jù)庫中的登記號。 (10)錄入數(shù)據(jù)庫的日期:其數(shù)字標識符為309 如果該文獻被收入某個數(shù)據(jù)庫的話,那么在數(shù)字標識符309之后,是該文獻錄入該 數(shù)據(jù)庫的日期,其格式為:YYYYMMDD,例如 19990920。 (11)專利公開號:其數(shù)字標識符為310 如果該公開出版物是專利文獻的話,那么在數(shù)字標識符310之后,是該專利的公開 號,其格式為:世界知識產(chǎn)權組織(WIPO)標準 3(ST 3)的國家、地區(qū)和政府間組織代碼標 準 6(ST 6)的公開號標準 16(ST 16

13、)的文獻類型,例如 CN1183117A。 (12)專利申請日:其數(shù)字標識符為311 如果該公開出版物是專利文獻的話,那么在數(shù)字標識符311之后,是該專利的申請 日,其格式為:YYYYMMDD,例如 19990920。 (13)專利公開日:其數(shù)字標識符為312 如果該公開出版物是專利文獻的話,那么在數(shù)字標識符312之后,是該專利的公開 日,其格式為:YYYYMMDD,例如 19990920。 在數(shù)字標識符400之后,是該序列的序列標識符:從下一行開始是該核苷酸和或 氨基酸序列。 該序列可以是純核苷酸序列, 或者是純氨基酸序列, 或者是核苷酸序列和與它對應的氨 基酸序列。 (1)純核苷酸序列:

14、核苷酸序列應當只用單鏈表示,從左到右是 5'末端至 3'末端的方向,序列中不應 當出現(xiàn)術語 5'和 3'。 應當用單字母代碼表示核苷酸序列的堿基來表述核苷酸序列的特征; 只能使用與附錄 1 之表 1 中給出的符號相一致的小寫字母來表示。 在一個核苷酸序列中, 如果經(jīng)修飾的堿基是附錄 1 之表 2 中列出的之一, 那么在該序列 本身中,應當用未修飾的堿基或“n”來表示該經(jīng)修飾的堿基, 符號“n”等同于唯一的一個 未知的或經(jīng)修飾的核苷酸;但在該序列的特征部分(數(shù)字標識符220核苷酸序列中堿基的編號開始于序列中的第 1 個堿基,并從 5'到 3'方向連

15、續(xù)地計數(shù)。 該計數(shù)方法也用于構型為環(huán)狀的核苷酸序列, 在這種情況下, 申請人可任意指定序列的第一 個核苷酸。 來自大序列的一個或更多非鄰接區(qū)段或來自不同序列的區(qū)段組成的核苷酸序列, 應當作 為帶有單獨序列標識符的單獨序列來計數(shù)。 帶有一個缺口或多個缺口的序列應當作為帶有單 獨序列標識符的多個單獨序列來計數(shù),而單獨序列的數(shù)目與序列數(shù)據(jù)的連續(xù)序列的數(shù)目相 同。 核苷酸序列每行最多 60 個核苷酸堿基, 10 個核苷酸堿基后空一格。 每 該行的最后是該 行最后一個堿基的編號。 (2)純氨基酸序列: 對于氨基酸序列,蛋白質或肽序列中的氨基酸應當從左到右以氨基到羧基的方向列出; 序列中不應當出現(xiàn)氨基或羧

16、基基團。 氨基酸應當使用與附錄 1 之表 3 中的符號相一致的、 第一個字母大寫的三字母符號表示。 有空白或內部中止符號(例如“Ter”或“”或“·”)的氨基酸序列不應當表示為單個 氨基酸序列,而應當作為獨立的氨基酸序列分別列出。 在一個氨基酸序列中, 如果經(jīng)修飾的氨基酸是附錄 1 之表 4 中列出的氨基酸之一, 那么 在該序列本身中,應當用相應的未經(jīng)修飾的氨基酸或“Xaa”來表示該經(jīng)修飾的和不常用的 氨基酸,符號“Xaa”等同于唯一的一個未知的或經(jīng)修飾的氨基酸;但在該序列的特征部分 (數(shù)字標識符220氨基酸的編號開始于序列中的第 1 個氨基酸,以數(shù)字 1 表示并標注在該氨基酸的下面

17、; 以后每隔 5 個氨基酸在其下面標注上該氨基酸的編號。 當成熟蛋白質之前存在氨基酸時, 例 如對于前序列,原序列,前原序列和信號序列而言,可以任選地從與成熟蛋白第一 個氨基酸相鄰的氨基酸開始以負數(shù)往回編號。當氨基酸編號使用負數(shù)以區(qū)分成熟蛋白質時, 不得使用數(shù)字 0。上述氨基酸序列的計數(shù)方法也適用于環(huán)狀構型的氨基酸序列,申請人可以 任意指定第一個氨基酸。 來自大序列的一個或更多非鄰接區(qū)段或不同序列的區(qū)段組成的氨基酸序列, 應當作為具 有單獨序列標識符的單獨序列來計數(shù)。 具有一個缺口或多個缺口的序列應當作為具有單獨序 列標識符的多個單獨序列來計數(shù),單獨序列的數(shù)目與序列數(shù)據(jù)的連續(xù)序列的數(shù)目相同。

18、氨基酸序列每行最多 16 個氨基酸,每個氨基酸之間空一格。 (3)核苷酸序列和與它對應的氨基酸序列: 對于核苷酸序列和與它對應的氨基酸序列, 對應于其編碼的氨基酸的核苷酸序列的堿基 應當以“三聯(lián)體”密碼子列出, 每個密碼子之間應當空一格; 對應于核苷酸序列的編碼部分 的氨基酸可以直接列于相應密碼子的下方; 對于該氨基酸序列, 應當在第一個氨基酸的下面 標注上編號 1,然后每隔 5 個氨基酸在其下面標注上該氨基酸的編號。 對于這種核苷酸和其編碼的氨基酸序列的混合形式, 與核苷酸序列相對應的氨基酸序列 還應當以純氨基酸序列的形式另外給出。 4.5、數(shù)字標識符連同其后內容的排列格式 在本節(jié)中,“數(shù)字

19、標識符及內容”指的是數(shù)字標識符連同其后的相應內容。 數(shù)字標識符及內容應當按照數(shù)字標識符的數(shù)值從小到大的次序排列在序列表中。 每個數(shù)字標識符及內容之間應當空一行, 不過在前兩位數(shù)字相同的數(shù)字標識符及內容之 間,例如210到213之間和220到223之間,無需空一行,但對于一個序列中 有多個特征的情況,在表述每個特征時,每個數(shù)字標識符220之前應當空一行。 對于序列表中有多個序列的情況, 數(shù)字標識符及內容應當按照序列標識符的數(shù)值從小到 大的次序排列。 在每個序列中, 應當按照數(shù)字標識符數(shù)值從小到大的次序列出僅僅與該序列 有關的數(shù)字標識符及內容,即排列上從210到400的數(shù)字標識符及內容。 對于一個

20、序列中有多個特征的情況, 應當按照這些特征在序列中出現(xiàn)的先后次序逐一排 列從220到223的數(shù)字標識符及內容。 5 序列表電子文件的格式 5.1、序列表電子文件是一個包含上述第 4 部分的數(shù)字標識符和內容,并符合上述第 4 部分格式要求的純文本文件; 該文件應當使用中華人民共和國頒布的信息交換用漢字編碼字 符集標準。 5.2、序列表電子文件應當記錄在 CDROM 光盤或 3.5 英寸軟盤上提交,或者按照國家 知識產(chǎn)權局專利局規(guī)定的其它形式提交。 當記錄在 CDROM 光盤上時, CDROM 光盤應當 該 采用 ISO9660 標準刻錄;當記錄在 3.5 英寸軟盤上時,該軟盤應當符合 FAT 1

21、2 格式。該光 盤或軟盤的目錄結構如下:在根目錄下,有且僅有一個后綴名為“.SEQ”的純文本文件。 6 其它事項 6.1、申請人應當保證提交的計算機可讀形式的序列表電子文件中的內容與紙件形式的 序列表完全相同。 6.2、申請人在形成符合本標準的序列表電子文件時,可以使用國家知識產(chǎn)權局專利局 提供的序列表編輯軟件來形成; 也可以使用其它專利組織提供的軟件 (例如歐洲專利局提供 的 Patentin)來形成;還可以使用任何純文本文件編輯軟件來形成。無論使用何種軟件, 所形成的電子文件都必須符合本標準的規(guī)定。 6.3、當申請人以光盤或軟盤的形式提交序列表電子文件時,應當在提交的光盤或軟盤 上貼有永久

22、性標記, 注明申請人姓名或名稱、 發(fā)明名稱、 光盤或軟盤中的文件名和提交日期; 申請人委托了代理人的, 也可以任選地標注上代理機構給該申請的案卷號。 對于申請人補交 或提交修改的情況,應當注明申請?zhí)柌⒆⒚鳌把a交”或“修改”。 注明申請人姓名或名稱等項內容時, 應當使用本標準中的數(shù)字標識符, 即應當標注上數(shù) 字標識符,并在其后注明具體內容,例如:110××基因開發(fā)有限公司。注明提交日期 的格式為:YYYYMMDD。 當序列表電子文件的字節(jié)數(shù)太大不能記錄在一張軟盤上時, 應當將序列表電子文件記錄 在一張光盤上提交。 7 頒布和實施 本標準由中華人民共和國國家知識產(chǎn)權局頒布,自

23、2001 年 11 月 1 日起實施。 中華人民共和國國家知識產(chǎn)權局 二一年十一月一日 附錄 1 核苷酸和氨基酸符號和特征關鍵詞表 表 1 核苷酸表 符號 含義 名稱的來源 a a 腺嘌呤 g g 鳥嘌呤 c c 胞嘧啶 t t 胸腺嘧啶 r g 或 a 嘌呤 y t/u 或 c 嘧啶 m a 或 c 氨基 k g 或 t/u 酮基 s g 或 c 弱作用 3H 鍵 w a 或 t/u 強作用 2H 鍵 b g 或 c 或 t/u 非 a d a 或 g 或 t/u 非 c h a 或 c 或 t/u 非 g v a 或 g 或 c 非 t,非 u n a 或 g 或 c 或 t/u,未知,或

24、其它任何 表 2 經(jīng)修飾的核苷酸表 符號 含義 ac4c 4-乙酰胞苷 chm5u 5-(羧羥甲基)尿苷 cm 2'-0-甲基胞苷 cmnm5s2u 5-羧甲基氨甲基-2-硫代尿苷 cmnm5u 5-羧甲基氨甲基尿苷 d 二氫尿苷 fm 2'-0-甲基假尿苷 gal q ,D-半乳糖 Q 核苷 gm 2'-0-甲基鳥苷 i 肌苷 i6a N6-異戊烯基腺苷 mla 1-甲基腺苷 mlf 1-甲基假尿苷 mlg 1-甲基腺苷 mli 1-甲基肌苷 m22g 2'2-二甲基腺苷 m2a 2-甲基腺苷 m2g 2-甲基鳥苷 m3c 3-甲基胞苷 m5c 5-甲基胞苷

25、m6a N6-甲基腺苷 m7g 7-甲基鳥苷 mam5u 5-甲基氨基甲基尿苷 mam5s2u 5-甲氧基氨基甲基-2-硫代尿苷 man q ,D-甘露糖 Q 核苷 mcm5s2u 5-甲氧基羰基甲基-2-硫代尿苷 mcm5u 5-甲氧基羰基甲基尿苷 mo5u 5-甲氧基尿苷 ms2i6a 2-硫代甲基-N6-異戊烯基腺苷 ms2t6a N-(9-D-呋喃核糖基-2-硫代甲基嘌呤-6-Y1)氨基甲酰)蘇氨 酸 mt6a N-(9-D-呋喃核糖嘌呤-6-y1)N-甲基氨基甲酰)蘇氨酸 mv 尿苷-5-氧化乙酸-甲基酯 o5u 尿苷-5-氧化乙酸 osyw wybutoxosine p 假尿苷 q

26、 Q 核苷 s2c 2-硫代胞苷 s2t 5-甲基-2 硫代尿苷 s2u 2-硫代尿苷 s4u 4-硫代尿苷 t 5-甲基尿苷 t6a N-(9-D-呋喃核糖嘌呤-6-基)-氨基甲酰)蘇氨酸 tm 2'-O-甲基-5-甲基尿苷 um 2'-O-甲基尿苷 yw Wybutosine x 3-(3-氨基-3-羧基-丙其)尿苷,(acp3)u 表 3 三字母表示的氨基酸表 符號 含義 丙氨酸 Ala 半胱氨酸 Cys 天冬氨酸 Asp 谷氨酸 Glu 苯丙氨酸 Phe 甘氨酸 Gly 組氨酸 His 異亮氨酸 Ile 賴氨酸 Lys 亮氨酸 Leu 蛋氨酸 Met 天冬酰酸 Asn

27、脯氨酸 Pro Gln 谷氨酰胺 精氨酸 Arg 絲氨酸 Ser 蘇氨酸 Thr 纈氨酸 Val 色氨酸 Trp 酪氨酸 Tyr 天冬氨酸或天冬酰胺 Asx 谷氨酸或谷氨酰胺 Glx 未知或其它 Xaa 表 4 經(jīng)修飾的和不常用的氨基酸表 符號 含義 Aad 2-氨基已二酸 bAad 3-氨基已二酸 bAla -丙氨酸,-氨基丙酸 Abu 2-氨基丁酸 4Abu 4-氨基丁酸,哌啶酸 Acp 6-氨基已酸 Ahe 2-氨基庚酸 Aib 2-氨基異丁酸 bAib 3-氨基異丁酸 Apm 2-氨基庚二酸 Dbu 2,4 二氨基丁酸 Des 賴氨素 Dpm 2,2'-二氨基庚二酸 Dpr 2

28、,3-二氨基丙酸 EtGly N-乙基甘氨酸 EtAsn N-乙基天冬氨酸 Hyl 羥基賴氨酸 aHyl 別-羥基賴氨酸 3Hyp 3-羥基脯氨酸 4Hyp 4-羥基脯氨酸 Ide 異賴氨素 aIle 別-異亮氨酸 MeGly N-甲基甘氨酸,肌氨酸 MeIle N-甲基異亮氨酸 MeLys 6-N-甲基賴氨酸 MeVal N-甲基纈氨酸 Nva 正纈氨酸 Nle 正亮氨酸 Orn 鳥氨酸 表 5 與核苷酸序列相關的特征關鍵詞表 關鍵詞 說明 allele 相關的個體或菌株含有相同基因的穩(wěn)定的其它形式,該形式區(qū)別 于這一位置的現(xiàn)有的序列(和或許其它序列) attenuator (1)存在調節(jié)轉

29、錄的終止的 DNA 區(qū)域,它控制了一些細菌操縱子的 表達; (2)位于啟動子和第一個結構基因之間,引起轉錄的部分終止的 序列區(qū)段 C_region 免疫球蛋白輕和重鏈的恒定區(qū),和 T細胞受體 ,和 鏈 ;根據(jù)特定的鏈可包括一個或多個外顯子 CAAT_signal CAAT 盒;位于可能參與 RNA 聚合酶結合的真核生物轉錄單位的起 始點的 75bp 上游的保守序列的一部分;共有序列=GG(C 或 T)CAA TCT CDS 編碼序列;對應于蛋白質中的氨基酸序列的核苷酸的序列(位置 包括終止密碼子);特征包括氨基酸概念上的翻譯 Conflict 在這一位點或區(qū)域,單獨確定的“相同”序列有所不同

30、D_loop 置換環(huán);線粒體 DNA 內的一個區(qū)域,其中 RNA 的短的序列與 DNA 的 一條鏈配對,代替了這一區(qū)域的原始配對 DNA 鏈;也用于說明在 R ecA 蛋白質催化的反應中,侵入的單鏈替代雙鏈 DNA 的一條鏈的區(qū) 域 D_segment 免疫球蛋白重鏈的多變區(qū),和 T-細胞受體的 鏈 Enhancer 順式-作用序列,它增強了(一些)真核生物啟動子的作用,并 能在任一方向和與啟動子相關的任何位置處(上游或下游)起作 用 Exon 編碼剪接 mRNA 部分的基因組區(qū)域;可以含有 5'UTR,所有 CDS,和 3'UTR GC_signal GC 盒;位于真核生物轉

31、錄單位起始點上游的保守的富含 GC 區(qū)域, 可以以多重拷貝或任一方向存在;共有序列=GGGCGG gene 鑒定為基因的生物學意義的區(qū)域,并已經(jīng)指定名稱 iDNA 間插 DNA;通過幾種重組中的任何一種能被消除的 DNA intron 被轉錄的 DNA 區(qū)段,但通過同時剪接位于其兩側的序列(外顯子 )即可從轉錄本內部將其除去 J_segment 免疫球蛋白輕鏈和重鏈的連接區(qū)段,和 T-細胞受體 , 和 鏈 LTR 長的末端重復,在確定序列的兩端直接重復的序列,類型典型地 見于逆轉錄病毒中 mat_peptide 成熟的肽或蛋白質的編碼序列;翻譯后修飾之后成熟的或最終的 肽或蛋白質產(chǎn)物的編碼序列

32、;位置不包括終止密碼子(與相應的 CDS 不同) misc_binding 不能用任何其它 Binding 關鍵詞(primer_bind 或 protein_bind) 表述的與另一個組成成分共價或非-共價結合的核酸中的位點 misc_differe 特征序列與記載中存在的有所不同,并且不能用任何其它不同關 nce 鍵詞(conflict,unsure,old_sequence,mutation,variatio n,allele 或 modified_base)表述 misc_feature 不能用任何其它的特征關鍵詞表述的具有生物學意義的區(qū)域;新 的或少見的特征 misc_recomb

33、任何一般性的,位點特異性的或復制的重組事件的位點,該位點 中有不能用其它重組關鍵詞(iDNA 和 virion)或來源關鍵詞的修 飾詞(/transposon,/proviral)表述的雙螺旋 DNA 的斷裂和愈合 misc_RNA 不能用其他 RNA 關鍵詞(prim_transcript,precursor_RNA,mRNA ,5'clip,3'clip,5'UTR,3'UTR,exon,CDS,sig_peptide, transit_ _peptide,mat_peptide,intron,polyA_site,rR NA,tRNA,scRNA 和 sn

34、RNA)限定的任何轉錄本或 RNA 產(chǎn)物 misc_signal 含有控制或改變基因功能或表達之信號的任何區(qū)域,所述信號不 能用其他 Signal 關鍵詞(promoter,CAAT_signal,TATA_signal ,-35_signal,10_signal,GC_signal,RBS,polyA_signal,e nhancer,attenuator,terminator,和 rep_origin)表述 misc_structu 不能用其他 Structure 關鍵詞(stem_loop 和 D-loop)表述的任何 re 二級或三級結構或構象 modified_bas 被指示的核苷酸

35、是經(jīng)修飾的核苷酸,并應由被指示的分子(在 mo e d_base 修飾詞意義中給出)所取代 mRNA 信使 RNA;包括 5'非翻譯區(qū)(5'UTR),編碼序列(CDS,外顯子) 和 3'非翻譯區(qū)(3'UTR) mutation 在此位置處,相關品系的序列中具有突然的,可遺傳的變化 N_region 在重排的免疫球蛋白區(qū)段之間插入的額外的核苷酸 Old_sequence 在此位置處,所表述的序列修改了此序列以前的版本 PolyA_signal 聚腺苷酸化之后內切核酸酶裂解 RNA 轉錄本所必需的識別區(qū)域; 共有序列=AATAAA PolyA_site RNA 轉錄

36、本上的位點,通過轉錄后聚腺苷酸化該位點將被加上腺 嘌呤殘基 Precursor_RN 仍不是成熟的 RNA 產(chǎn)物的任何 RNA 種類;可包括 5'剪切區(qū)(5'clip) A 5'非翻譯區(qū)(5'UTR),編碼序列(CDS,外顯子),間插序列(內 含子),3'非翻譯區(qū)(3'UTR),和 3'剪切區(qū)(3'clip) prim_transcr 初級(最初的,未加工的)轉錄本;包括 5'剪切區(qū)(5'clip),5 ipt '非翻譯區(qū)(5'UTR),編碼序列(CDS,外顯子),間插序列(內 含子),3'

37、非翻譯區(qū)(3'UTR)和 3'剪切區(qū)(3'clip) prim_bind 起始復制,轉錄或逆轉錄的非共價的引物結合位點;包括合成 的例如 PCR 引物元件的位點 Promoter 參與 RNA 聚合酶的結合以啟動轉錄的 DNA 分子區(qū)域 protein_bind 核酸上非共價的蛋白質結合位點 RBS 核糖體結合位點 repeat_regio 含有重復單位的基因組區(qū)域 n repeat_unit 單個重復元件 rep_origin 復制起點;復制核酸以得到兩個相同拷貝的起始位點 RRNA 成熟的核糖體 RNA;將氨基酸裝配成蛋白質的核糖核蛋白顆粒( 核糖體)中的 RNA

38、成份 S_region 免疫球蛋白重鏈的開關區(qū);它參與重鏈 DNA 的重排,導致來自相 同 B細胞的不同免疫球蛋白類的表達 Satellite 短的基本重復單位的很多串聯(lián)重復(相同或相關的);大多數(shù)具 有的堿基組成或其它性質與基因組的一般水平不同,這使得它們 與大部分(主帶)的基因組 DNA 分離開來 ScRNA 小的細胞質 RNA;幾個小的細胞質分子中的任何一個存在 于真核生物的細胞質和(有時)核中 sig_peptide 信號肽編碼序列;被分泌的蛋白質的 N末端結構域的編碼序列 ;此結構域涉及新生多肽與膜的結合;前導序列 SnRNA 小的核 RNA;很多小的 RNA 種類中的任何一個都被局

39、限于核中;幾 個 snRNA 參與剪接或其它 RNA 加工反應 鑒定序列中特定范圍的生物來源;此關鍵詞是強制性的;每一項 source 至少要有一個跨越整個序列的單一來源關鍵詞;每個序列可允許 有一個以上的來源關鍵詞 stem_loop 發(fā)卡結構;由 RNA 或 DNA 單鏈的相鄰(反向)互補序列之間的堿基 一配對形成的雙螺旋區(qū)域 STS 序列標記位點:表述基因組上作圖界標并能通過 PCR 檢測的短的 ,單拷貝 DNA 序列;通過測定 STS 系列的次序即可作出圖譜的基因 組區(qū)域 TATA_signal TATA 盒;GoldbergHogness 盒;在每個真核生物 RNA 聚合酶轉 錄單位

40、起點前約 25bp 處發(fā)現(xiàn)的保守的富含 AT 的七聚體,它可能涉 及使酶定位以正確地起始;共有序列=TATA(A 或 T)A(A 或 T) terminator 或者位于轉錄本的末端或者與啟動子區(qū)域相鄰的 DNA 序列,該序 列可導致 RNA 聚合酶終止轉錄;也可以是阻抑蛋白的結合位點 transit_pept 轉運肽編碼序列;核編碼的細胞器蛋白質 N末端結構域的編碼 ide 序列;此結構域參與將蛋白質翻譯后運送到細胞器中 tRNA 成熟的轉移 RNA,小的 RNA 分子(7585 個堿基長),介導核酸序 列翻譯成氨基酸序列 unsure 作者不能確定此區(qū)域的準確序列 V_region 免疫球

41、蛋白輕鏈和重鏈的可變區(qū),和 T細胞受體 , 和 鏈 ;編碼可變的氨基末端部分;可由 V_segment,D_segment,N_re gion 和 J_segment 組成 V_segment 免疫球蛋白輕鏈和重鏈的可變區(qū)段,和 T細胞受體 , 和 鏈;編碼大多數(shù)可變區(qū)(v_region)和前導肽的最后幾個氨基酸 variation 含有來自相同基因的穩(wěn)定突變的相關系列(例如 RFLP,多態(tài)性等 ),在此(和可能其它)位置處所述相同基因與被表述的不同 3'c1ip 在加工過程中被切下的前體轉錄本 3'端大部分區(qū)域 3'UTP 不被翻譯成蛋白質的成熟轉錄本的 3'末端區(qū)域(終止密碼子之后 ) 5'clip 在加工過程中被切下的前體轉錄本 5'端大部分區(qū)域 5'UTP 不被翻譯成蛋白質的成熟轉錄本的 5'末端區(qū)域(起始密碼子之前 ) _10_signal Pribnow 盒;細菌轉錄單位起點上游約 10bp 處的保守區(qū)域,它可 能參與結合 RNA 聚合酶;共有序列=TatA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論