中國專利數(shù)據(jù)庫標(biāo)引質(zhì)量測評_第1頁
中國專利數(shù)據(jù)庫標(biāo)引質(zhì)量測評_第2頁
中國專利數(shù)據(jù)庫標(biāo)引質(zhì)量測評_第3頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、中國專利數(shù)據(jù)庫標(biāo)引質(zhì)量測評D01:10.3969/j.issn.l00808 21.2010.12.016Evaluation on China Patent Databases Indexing QualityLi Hongfang Zou Xiaozhu(Institute of Scientific Technology Information Nanjing University of Aeronautics and Astronautics ,Nanjing 210016 , China )AbstractPate nt in formati on resourcesconstruc

2、tion plays an important role on the construction of innovative country.The indexing of patent database plays a fundamental role on the intelligence mining of patent information.Though analysing the related subject retrieval of data,discussing the depth of the patent indexing,keywords,average word lo

3、ng,consistency and relatively equal ratio,assessing patent databases indexing status,providing standard for China patent databases construction.Keywords pate nt database;indexing;retrieval;quality隨著現(xiàn)代信息技術(shù)的迅速發(fā)展, 網(wǎng)絡(luò)信息的日益膨脹, 專利 對保護(hù)自主知識產(chǎn)權(quán)方面起著重要的作用, 專利信息也是首選的 競爭情報(bào)源,是取之不盡、用之不竭的寶庫。對專利信息進(jìn)行分 析,是科研機(jī)構(gòu)進(jìn)行科學(xué)研究,企業(yè)

4、進(jìn)行發(fā)展決策、國家進(jìn)行戰(zhàn) 略決策的重要參考依據(jù)。 當(dāng)各種專利數(shù)據(jù)庫不斷涌現(xiàn)時(shí), 其中出 現(xiàn)的問題也不斷暴露, 如專利數(shù)據(jù)庫的標(biāo)引問題。 專利標(biāo)引是建 立專利數(shù)據(jù)庫系統(tǒng), 進(jìn)行專利檢索的重要環(huán)節(jié), 是進(jìn)行專利信息 分析獲取競爭情報(bào)的基礎(chǔ)和關(guān)鍵, 專利數(shù)據(jù)庫的標(biāo)引質(zhì)量日益成 為值得研究的課題。1我國專利數(shù)據(jù)庫標(biāo)引概況1. 1我國專利數(shù)據(jù)庫簡介我國專利數(shù)據(jù)庫眾多, 為了對專利標(biāo)引問題進(jìn)行研究, 主要 選取其中較權(quán)威的 3個(gè)專利數(shù)據(jù)庫: 國家知識產(chǎn)權(quán)局專利檢索系 統(tǒng)、中國專利信息中心、中國知識產(chǎn)權(quán)網(wǎng)進(jìn)行比較6。中國專利信息中心,建于 1988 年 5 月,可檢索國內(nèi)外專利 數(shù)據(jù)庫,使用該系統(tǒng)前應(yīng)先行注

5、冊,分為免費(fèi)和交會員費(fèi)用戶。 收錄了我國自 1985 年出版專利文獻(xiàn)以來的發(fā)明專利信息和實(shí)用 新型專利信息。 可瀏覽或保存專利的主附圖、 公開說明書以及授 權(quán)說明書的信息圖片( tif 文件),需下載瀏覽器插件。中國知識產(chǎn)權(quán)網(wǎng)是中外專利數(shù)據(jù)庫服務(wù)平臺, 主要提供對中 國專利和國外(美國、日本、英國、德國、法國、歐洲專利局、 WIPO瑞士)專利檢索。收錄 1985年以來的全部發(fā)明專利、實(shí) 用新型專利、外觀設(shè)計(jì)專利??梢钥闯?,在 3個(gè)數(shù)據(jù)庫中, 國家知識產(chǎn)權(quán)局和中國知識產(chǎn) 權(quán)網(wǎng)均不需注冊, 即可免費(fèi)查找和檢索全部專利信息, 而中國專 利信息中心則需進(jìn)行注冊,會員還需交費(fèi)。此外,中國專利信息 中心并

6、不涉及外觀設(shè)計(jì)專利。1 . 2我國專利數(shù)據(jù)庫標(biāo)引加工現(xiàn)狀情報(bào)檢索語言的全面性和專指性對情報(bào)檢索效率有著重要 影響,同樣,專利檢索語言對專利數(shù)據(jù)庫的檢索效率也有著重要 影響。情報(bào)檢索語言按其結(jié)構(gòu)原理,可分為分類檢索語言、主題 檢索語言、代碼檢索語言三大類型3。其中常用的主要是分 類和主題檢索語言, 分析 3 個(gè)數(shù)據(jù)的檢索字段可得到其標(biāo)引現(xiàn)狀 如表1所示:表1 3 個(gè)專利數(shù)據(jù)庫標(biāo)引現(xiàn)狀2 標(biāo)引數(shù)據(jù)獲取與分析2 . 1 標(biāo)引數(shù)據(jù)獲取方法筆者采用定量與定性相結(jié)合的方法對專利數(shù)據(jù)庫的標(biāo)引工 作進(jìn)行了研究,文中采用的 63 個(gè)以“傳動(dòng)”為主題的專利數(shù)據(jù) 是通過對中國知識產(chǎn)權(quán)局、 專利信息中心和知識產(chǎn)權(quán)網(wǎng)

7、3 個(gè)專利 數(shù)據(jù)庫進(jìn)行多字段綜合檢索, 與行業(yè)專家溝通, 按“傳動(dòng)特點(diǎn)” 篩選出 63 個(gè)密切相關(guān)的專利。同時(shí),采用的其他專利數(shù)據(jù),也 是對專利數(shù)據(jù)庫進(jìn)行綜合檢索的結(jié)果。2 . 2 專利標(biāo)引質(zhì)量分析從專利數(shù)據(jù)庫檢索和標(biāo)引兩個(gè)角度對我國專利標(biāo)引質(zhì)量的 若干問題進(jìn)行測評。2 . 2 . 1標(biāo)引深度專利標(biāo)引深度是指一個(gè)專利中所論述的主題概念被確認(rèn)并 轉(zhuǎn)化為檢索標(biāo)識的完備程度, 是根據(jù)專利主題概念內(nèi)容揭示的廣 度衡量標(biāo)引質(zhì)量的一個(gè)因素。 專利標(biāo)引深度的選取對用戶檢索的 查全率和查準(zhǔn)率有著重要的影響。國家知識產(chǎn)權(quán)局專利檢索系統(tǒng)、 中國專利信息中心和中國知 識產(chǎn)權(quán)網(wǎng)都對專利數(shù)據(jù)進(jìn)行了不同的標(biāo)引, 但仍存在

8、標(biāo)引深度不 夠的問題。如:專利名稱為“行星齒輪箱”的 4個(gè)不同專利, 均是發(fā)明 專利,專利號分別為“ 03119913.5”、“200480031236.6”、 “200480030916.6”、“200580004698.3”, 但是簡單地從其標(biāo) 引項(xiàng)中并不能對其專利進(jìn)行區(qū)分, 必須對這 4 個(gè)專利說明書進(jìn)行 主題分析、深度挖掘才能區(qū)分。如通過對專利內(nèi)容進(jìn)行分析: “03119913.5”專利實(shí)現(xiàn)了傳動(dòng)大速比, 應(yīng)用了圓柱齒輪, 而且 主要應(yīng)用于印刷機(jī)方面; “200480031236.6”專利在潤滑發(fā)明進(jìn) 行了改進(jìn);“ 200480030916.6”專利采用了滑動(dòng)套筒、定心束, 實(shí)現(xiàn)了微振

9、動(dòng); “200580004698.3”使用了間隙調(diào)整件, 實(shí)現(xiàn)了 4 個(gè)專利的區(qū)分。筆者結(jié)合漢語主題詞表和航天科學(xué)技術(shù)敘詞表,分 別對主題為“傳動(dòng)”的專利進(jìn)行深度標(biāo)引,每個(gè)專圖1 手工標(biāo) 引流程利選取510個(gè)主題詞。設(shè)第i個(gè)專利的主題詞個(gè)數(shù)為ai, n個(gè)專利的平均標(biāo)引深度為?A疲岐? i/n ? B ?則本主題平 均標(biāo)引深度為 6.1 ,無疑如果進(jìn)行這樣的標(biāo)引將大大提高標(biāo)引深 度。2 . 2 . 3相對先組度復(fù)合概念可以由一個(gè)或多個(gè)單元詞進(jìn)行組配, 也可以用一個(gè) 先組詞(復(fù)合詞)進(jìn)行組配。先組度是指先組詞在主題表中所占 比例。因?yàn)闈h語中分詞很困難, 所以采用“相對先組度”進(jìn)行計(jì) 算。即相對先組

10、度=主題詞所包含單元詞的個(gè)數(shù)/主題詞總數(shù)。筆者對有關(guān)“傳動(dòng)”的 63 個(gè)專利的主題詞進(jìn)行先組度計(jì) 算,結(jié)果見表3:表3 相對先組度詞 長個(gè) 數(shù)詞 長個(gè) 數(shù) 11539255683159714125平均詞長3.19由表3可知, 主題詞主要集中在詞長為 3和 4的詞中, 通過 先組度,可以測量專利標(biāo)引的質(zhì)量。 在標(biāo)引工作中, 先組度越高, 專利的專指度越高,從而提供的檢索入口越多,檢準(zhǔn)率越高。2. 2 . 4標(biāo)引的一致性 專利標(biāo)引的一致性是指對相同主題的專利賦予檢索標(biāo)識的 一致性程度。既可以指不同標(biāo)引人員標(biāo)引同一主題專利的一致 性,也可以指相同標(biāo)引人員先后標(biāo)引同一主題的一致性。 專利數(shù) 據(jù)庫標(biāo)引的

11、一致性程度越高,檢索出的專利集中程度越高。筆者對“傳動(dòng)”為主題的 63 個(gè)專利的分類標(biāo)引數(shù)據(jù)進(jìn)行統(tǒng)計(jì),其中分類號統(tǒng)計(jì)見表4,范疇分類號統(tǒng)計(jì)見表5,通過兩個(gè) 表看我國專利數(shù)據(jù)庫的相同主題的專利集中程度, 以此來判斷專利標(biāo)引質(zhì)量的一致性程度。表4 分類號統(tǒng)計(jì) 分類號統(tǒng) 計(jì)分類號統(tǒng) 計(jì)B24B4F02N2B41F1F03D12B63H4F16C3B64C1F16D2E02F1F16H85E21D1H02K2表5 范疇分類號統(tǒng)計(jì) 范疇分類號統(tǒng) 計(jì)范疇分類號統(tǒng) 計(jì)27D5117J126E132E132G137A136A129B126F228C428B237B122A138B126D127B1從上面兩個(gè)表

12、可以看出, 專利的分類號標(biāo)引和范疇標(biāo)引一致性較好,集中程度較高,分別集中在“ F16H和“ 27D,即主 要集中在傳動(dòng)裝置方面。下面對“傳動(dòng)”主題的主要主題標(biāo)引詞進(jìn)行統(tǒng)計(jì), 結(jié)果見表6:表6 主題詞統(tǒng)計(jì)主題詞個(gè) 數(shù)主題詞個(gè) 數(shù)傳動(dòng) 60變速 1 6行星齒輪 58風(fēng)力發(fā)電 14功率 33承載力 8減速器 28扭矩 6太陽輪 18由表6可以看出, 通過主題標(biāo)引, 可以明顯的揭示專利的主題,以“傳動(dòng)”為中心,集中度較高,一致性較好。同時(shí)可以得到專利所使用的技術(shù), 實(shí)現(xiàn)的功能等方面的信息, 為專利信息的采集與利用打下了基礎(chǔ),也為專利數(shù)據(jù)分析節(jié)省了人力和時(shí)間。在專利信息分析中, 進(jìn)行分類號和主題詞的分析, 可以研究 專利的技術(shù)領(lǐng)域、 核心技術(shù), 分析出某個(gè)國家或地區(qū)的技術(shù)競爭 優(yōu)勢等,取得學(xué)習(xí)和借鑒,進(jìn)行技術(shù)創(chuàng)新。從表4、5、6三個(gè) 統(tǒng)計(jì)結(jié)果可以看出, 我國專利數(shù)據(jù)庫的分類號、 范疇分類號的標(biāo) 引一致性較好, 但是對于主題標(biāo)引工作有所欠缺, 由于分類標(biāo)引 與主題標(biāo)引作用的不同,應(yīng)該加強(qiáng)主題標(biāo)引。2 . 2 . 5相對等同率相對等同率是指相同主題的專利標(biāo)引詞中, 非標(biāo)準(zhǔn)主題詞與 標(biāo)準(zhǔn)主題詞

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論