數(shù)據(jù)庫基本概念在專利檢索中的運用_第1頁
數(shù)據(jù)庫基本概念在專利檢索中的運用_第2頁
數(shù)據(jù)庫基本概念在專利檢索中的運用_第3頁
數(shù)據(jù)庫基本概念在專利檢索中的運用_第4頁
數(shù)據(jù)庫基本概念在專利檢索中的運用_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1 數(shù)據(jù)庫基本概念在專利檢索中數(shù)據(jù)庫基本概念在專利檢索中 的運用的運用 陳衛(wèi)明 許瑛 姚文 閆小蘇 2007.7.23 2 目錄目錄 n1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n3 3、關(guān)系型數(shù)據(jù)庫的三種操作、關(guān)系型數(shù)據(jù)庫的三種操作 n4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n5 5、三種字段類型、三種字段類型 3 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.1、三個世界 n按照數(shù)據(jù)庫理論,有現(xiàn)實世界、信息世界、計 算機世界等三個世界。 n現(xiàn)實世界的“客觀事物”(事實、事件)在信 息世界中抽象為“實體”,并定

2、義了各種“屬 性”來描述“實體”。 n“實體”在計算機世界被描述成一條“記錄”。 n客觀事物-實體-記錄 4 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.2、數(shù)據(jù)(data)是一些符號,用來描 述客觀事物的特征。 n這些符號可以是數(shù)字形式、文字形式 (以及圖形、圖像和聲音等)。 n例如學(xué)生成績、飛機班次、測量溫度、 (CPRS中的)發(fā)明人姓名、發(fā)明名稱、 文摘、優(yōu)先權(quán)項、文獻(xiàn)號、申請?zhí)枴⒎?類號、申請日、公開日等。 5 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.3、信息(information) n信息是經(jīng)過加工(記載、分類、組織、關(guān)聯(lián)、 解釋、提煉、消化理解)而

3、具有使用價值的數(shù) 據(jù)。(信息=數(shù)據(jù)+數(shù)據(jù)處理) n有的信息由一個數(shù)據(jù)構(gòu)成,比如分類號;有的 信息由幾個數(shù)據(jù)構(gòu)成,比如優(yōu)先權(quán)項、CPRS中 的一條記錄。 n數(shù)據(jù)和信息在形式上往往并無區(qū)別,尤其是那 些由一個數(shù)據(jù)構(gòu)成的信息。例如分類號。 6 一、數(shù)據(jù)、信息和數(shù)據(jù)處理一、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.4、數(shù)據(jù)和信息的關(guān)系 n(信息是數(shù)據(jù)的內(nèi)涵、二者是形與質(zhì)的關(guān)系。) n(數(shù)據(jù)是信息的載體,信息的表現(xiàn)形式仍是數(shù)據(jù)。) n(信息是經(jīng)過加工而具有使用價值的數(shù)據(jù),信息=數(shù)據(jù) +數(shù)據(jù)處理。) n數(shù)據(jù)只是把客觀事物記錄下來,并沒有特定目的;而 信息是有針對性的(某一問題、某一論點、某一特定 目的)來收集、處理數(shù)據(jù)

4、,用來作為決策或參考的依 據(jù)。所以兩者的差別在于是否存在某一特定目的特定目的。 7 1 1、數(shù)據(jù)、信息和數(shù)據(jù)處理、數(shù)據(jù)、信息和數(shù)據(jù)處理 n1.5、數(shù)據(jù)處理 n數(shù)據(jù)處理是指對各種類型的數(shù)據(jù)進(jìn)行加工 (收集、存儲、分類、計算、檢索、傳輸) 的過程。 n數(shù)據(jù)處理的目的使之成為信息。 n數(shù)據(jù)處理通常也稱為信息處理。 8 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.1、數(shù)據(jù)庫(Datebase,DB) n長期存放在外部存儲設(shè)備(外存儲器、 外存介質(zhì))上、可以以各種方式進(jìn)行組 織、可以共享的數(shù)據(jù)(包括這些數(shù)據(jù)之 間的聯(lián)系)集合。 n(這些數(shù)據(jù)與應(yīng)用程序例如VB相互獨 立) 9 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)

5、據(jù)庫系統(tǒng)概述 n2.2、數(shù)據(jù)庫系統(tǒng)(Database System,DBS) n數(shù)據(jù)庫不能獨立存在,是數(shù)據(jù)庫系統(tǒng)的一部 分。 n在實際應(yīng)用中,人們所面對的其實是數(shù)據(jù)庫 系統(tǒng)。 n數(shù)據(jù)庫系統(tǒng)具有管理和控制數(shù)據(jù)庫的能力 (輸入、輸出、組織數(shù)據(jù))。 10 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 數(shù)據(jù)庫系統(tǒng)包括: n 硬件(計算機) n數(shù)據(jù)庫(DB) n數(shù)據(jù)庫管理系統(tǒng)(DBMS,常用的數(shù)據(jù)庫管理系 統(tǒng)有FoxPro、Oracle、SYBASE、INFORMIX等, 用來建立、管理、控制數(shù)據(jù)庫) n數(shù)據(jù)庫管理員 n用戶和應(yīng)用程序 11 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.3、信息世界的術(shù)語 n

6、實體(Entity) 對應(yīng)于現(xiàn)實世界中的“客觀事物”。實體 可以指代具體事物,如一個學(xué)生,一本 書(一件專利文獻(xiàn));也可以指代抽象 事件,如一場足球比賽。 12 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n屬性(attribute) n屬性用來描述實體的特性。 n如學(xué)生實體可以用若干屬性(學(xué)號、姓名、年 齡、性別、出生日期、班級)來描述。 n屬性的具體值稱為屬性值,如CN2745142Y (授權(quán)公告號)、馬林(申請專利權(quán)人)、 2004年9月16日2004.9.16(申請日)是屬性 值。 13 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.4、計算機世界的術(shù)語 n記錄(record)、元組 對應(yīng)

7、于信息世界的“實體”,二維表中的一行。 n 字段(field) 對應(yīng)于信息世界的“屬性”,二維表中的一列。每個字 段有字段名(標(biāo)頭),例如“發(fā)明人”、“申請?zhí)枴?等等。 n字段值(value)、數(shù)據(jù)項 對應(yīng)于信息世界的“屬性值”,二維表中的一格。 n關(guān)系(relation)、數(shù)據(jù)庫文件 14 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n一個關(guān)系就是一個二維表,每個關(guān)系有 一個關(guān)系名。一個關(guān)系可以存儲為一個 數(shù)據(jù)庫文件。 n例如某專利文獻(xiàn)數(shù)據(jù)庫可以有專利號的 表,發(fā)明名稱的表,專利權(quán)人的表等。 n下面是一個模擬數(shù)據(jù)庫,該表是由一個 以上的表(關(guān)系)通過“關(guān)聯(lián)”而成。 15 PN(PN(字段名字段名

8、) )TIPAICPDPD 5000000 (5000000) carG&MB60j31/0 0 10/25/1998(一行表示 一條記錄) (5000001) computerIBMG06f3/0001/02/2000 模擬數(shù)據(jù)庫(不是真的) (一列表示一 個屬性) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 16 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.5、關(guān)系的三種類型 n一對一的關(guān)系(例如一個學(xué)生只有一個學(xué)號; 再例如一件專利只有一個申請?zhí)枺?n一對多的關(guān)系(例如某班主任老師可以有多個 學(xué)生,再例如一個發(fā)明人可以有多件專利) n多對多的關(guān)系(例如一個學(xué)生可以選修多門課, 一門課可以供

9、多名學(xué)生選修;再例如一個分類 號之下可以有多件專利文獻(xiàn),一件專利也可以 有多個分類號) 17 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n2.6、數(shù)據(jù)庫的三種類型 n數(shù)據(jù)模型是數(shù)據(jù)庫結(jié)構(gòu)的組織形式,目前數(shù)據(jù) 庫系統(tǒng)中常用的數(shù)據(jù)模型有三種: n層次模型(Hierarchical Model):用樹形結(jié) 構(gòu)表示數(shù)據(jù)及其聯(lián)系的數(shù)據(jù)模型,樹形結(jié)構(gòu)只 能表示一對多聯(lián)系: 18 班主任(微 機871班) 王小艷李峰張勇 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 19 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n網(wǎng)狀模型(Network Model):用網(wǎng)絡(luò)結(jié) 構(gòu)表示數(shù)據(jù)及其聯(lián)系的數(shù)據(jù)模型。 n網(wǎng)狀模型可以直接表

10、示多對多聯(lián)系,但 其中的結(jié)點間連線或指針更加復(fù)雜,因 而數(shù)據(jù)結(jié)構(gòu)更加復(fù)雜: 20 dl001(刑法) 王小艷李峰張勇 dl002(聲樂)dl003(繪畫) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 21 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 n關(guān)系模型(Relational Model):用關(guān) 系表示的數(shù)據(jù)模型。 n關(guān)系是指由行與列構(gòu)成的二維表,關(guān)系 不但可以表示實體間一對多的聯(lián)系,通 過關(guān)系間的連接,也可以表示多對多的 聯(lián)系(見連接): 22 學(xué)號姓名年齡性別班級 870101王小艷18女微機871 870102李峰18男微機871 870103張勇19男微機871 微機871班學(xué)生表(A)

11、 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 23 學(xué)號課程編號課程編號 870101(王)dl001(刑) 870101(王)dl002(聲) 870102(李)dl001(刑) 870102(李)Dl002(聲) 870103(張)Dl002(聲) 870103(張)dl003(畫) 選修表(B) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 24 課程編號課程編號課程名授課教師授課地點 dl001刑法周火主樓102教室 dl002聲樂劉琴主樓102教室 dl003繪畫任安主樓504教室 課程表(C) 2 2、數(shù)據(jù)庫系統(tǒng)概述、數(shù)據(jù)庫系統(tǒng)概述 25 3 3、關(guān)系型數(shù)據(jù)庫的三種操作、關(guān)系型數(shù)據(jù)庫的三種操

12、作 n3.1、選擇:從關(guān)系中找出滿足給定條件的記 錄(元組),即在二維表中選行。(例(例如: 對表A中李峰的選擇) n3.2、投影:從關(guān)系中找出若干字段(屬性) 組成新的關(guān)系,即在二維表中選列。(例如: 對表B課程編號的投影) n3.3、連接:將兩個關(guān)系按某種條件提取部分 (或全部)記錄及部分(或全部)字段組合成 新的關(guān)系。(例如:表B、表C按照課程編號 關(guān)鍵字連接) 26 課程編課程編 號號 課程 名 授課教師授課地點學(xué)號 dl001刑法周火主樓102教室8 7 0 1 0 1 、 870102 dl002聲樂劉琴主樓102教室8 7 0 1 0 1 、 8 7 0 1 0 2 、 8701

13、03 dl003繪畫任安主樓504教室870103 連接而成的新表(D) 3 3、關(guān)系型數(shù)據(jù)庫的三種操作、關(guān)系型數(shù)據(jù)庫的三種操作 27 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.1、并(或、or)(AB) nA集合和B集合所有元組合并,再刪去重復(fù)的元組,這種運算稱為 “并”(或);所組成新的C集合,稱為A、B的并集 n4.2、差(非、not)(A-B) nA集合中刪去(A集合中)與B集合相同(重復(fù))的元組,這種運算 稱為“差”(非);所組成新的C集合稱為A、B的差集 n4.3、交(與、and)(AB) n既屬于A集合又屬于B集合的元組,這種運算稱為“交”(與); 所組成

14、新的C集合,稱為A、B的交集 28 交(交(,與,與,andand) n屬于集合A且屬于集合B 的元素組成的集合C,叫 做A,B的交集(屬于A 又屬于B的元素組成的集 合,A and B=C) n例:A-汽車,B- 發(fā)動機, C-即有汽車也有 發(fā)動機的記錄集 ncaps中兩詞間空格, “and”, “+” 集合B 集合A 集合C 29 并(并(,或,或,oror) n屬于集合A或?qū)儆诩螧 的元素組成的集合C,叫 做A,B的并集(A,B所 有元素合并,刪除重復(fù) 元素組成的集合,A or B=C)。 n例:A-汽車,B-發(fā)動機,C-僅 有汽車的記錄集,僅有 發(fā)動機的記錄集,即有 汽車也有發(fā)動機的

15、 記錄集。 ncaps中用“or”,“,” 集合A集合B 集合C 30 差(差(- -,非,非,NOTNOT,與非,與非,ANDNOTANDNOT) n屬于集合A而不屬于集合 B的元素組成的集合C, 叫做A,B的差集(在A 中排除屬于B的元素后組 成的集合,A not B=C) n例:A-汽車,B-發(fā)動機, C-從所有含汽車的 記錄集中去掉含發(fā)動 機的記錄集 ncaps中用“without”, “not”,“#” 集合A 集合B 集合C 31 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.4、差并(ornot、或非) n從總集合排除B,再與A集合合并。 n三種情況 n4.4

16、.1、A集合的所有元素都是B集合的元素時, 還要考慮A集合與B集合哪個更大: n4.4.1.1、如果A集合更大,或非結(jié)果=總集合; n4.4.1.2、如果B集合更大,總集合被挖去部分 B只填入了局部,有“空區(qū)”) 32 4 4、布爾邏輯運算(集合運算)、布爾邏輯運算(集合運算) n4.4.2、A集合的所有元素都不是B集合的 元素,或非結(jié)果=總集合 not B n4.4.3、A集合的部分元素是B集合的元素, 總集合被挖去部分B只填入局部,有 “空區(qū)”) 33 總 B A 或非(4.1.1.1、A所有元素都是B的元 素,且AB) 34 總 或非(4.1.1.1、A所有元素都是B的元 素,且AB)

17、35 或非(4.1.1.2、A所有元素都是B的元 素,且AB) 總 B A 36 總 或非(4.1.1.2、A所有元素都是B的元 素,且A”; 必須輸入完整的年月日(YYMMDDYYMMDD), 例如:850101020831;可用YYYY和YY;年月 日格式;連續(xù)輸入時可用“+” 79 5 5、三種字段類型、三種字段類型 n情形3:USPTO的“patent search”(ISD授權(quán)日PD公 開日/APD申請日/PRIR優(yōu)先權(quán)日),輸入值間不能用or, “日”可用“$”,時間區(qū)間用“-”。授權(quán)專利數(shù)據(jù) 庫日期型輸入值有多種輸入格式:20030403、4-30- 2003(月日年)、4/30/2003(月日年)、20030327- 20030403(時間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論