國(guó)外專利挖掘可視化工具分析_第1頁(yè)
國(guó)外專利挖掘可視化工具分析_第2頁(yè)
國(guó)外專利挖掘可視化工具分析_第3頁(yè)
國(guó)外專利挖掘可視化工具分析_第4頁(yè)
國(guó)外專利挖掘可視化工具分析_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、國(guó)外專利挖掘-可視化工具分析摘要:本文首先簡(jiǎn)要介紹專利信息分析概念以及開(kāi)展專利信息分析的一般流程,其次概述專利分析工具可實(shí)現(xiàn)的主要功能;然后根據(jù)專利分析軟件可分析的數(shù)據(jù)源,將分析工具分為非結(jié)構(gòu)化數(shù)據(jù)分析工具、結(jié)構(gòu)化數(shù)據(jù)分析工具和混合型數(shù)據(jù)分析工具三大類,進(jìn)而對(duì)國(guó)外常用的13種專利文本挖掘可視化分析工具進(jìn)行系統(tǒng)介紹和比較;最后對(duì)專利分析工具應(yīng)用及其發(fā)展提出建議。關(guān)鍵詞:文本挖掘 可視化工具 專利分析 競(jìng)爭(zhēng)情報(bào) Foreign Text mining and data visualization tools in patent information analysisWang min, Li Ha

2、icun, Xu PeiyangAbstract: This article starts with an introduction of the definition of patent information analysis and its process, and then summarizes the main function of patent analysis tools. The main part in this article is to provide a detailed overview and comparison of thirteen foreign text

3、 mining and data visualization tools in patent information analysis, which can be classified into structured analysis tools, unstructured analysis tools and hybrid analysis tools according to different types of data sources. Finally, the article gives some suggestions as to the application and devel

4、opment of patent information analysis tools.Keywords: text mining; data visualization tools; patent information analysis; Competitive intelligence隨著知識(shí)經(jīng)濟(jì)全球化進(jìn)程的加快,專利文獻(xiàn)作為反映科技發(fā)展,特別是技術(shù)發(fā)展態(tài)勢(shì)的重要情報(bào)來(lái)源,在科技戰(zhàn)略制定中發(fā)揮著日益重要的作用。如何對(duì)其開(kāi)展有效的分析,輔助政府部門、科研機(jī)構(gòu)、高新企業(yè)進(jìn)行專利戰(zhàn)略布局和專利技術(shù)研發(fā),成為情報(bào)機(jī)構(gòu)開(kāi)展情報(bào)分析、戰(zhàn)略決策的重要方向。專利信息分析離不開(kāi)高效分析工具的支持,專利信息

5、分析方法、分析工具的合理使用是決定信息分析水平、效率以及信息分析質(zhì)量和效益的重要因素。本文首先對(duì)專利信息分析進(jìn)行簡(jiǎn)要概述,其次重點(diǎn)對(duì)國(guó)外常用的專利分析工具進(jìn)行系統(tǒng)調(diào)研,以期為國(guó)內(nèi)開(kāi)展專利信息分析工作提供借鑒。1專利信息分析概述專利信息分析是是競(jìng)爭(zhēng)情報(bào)分析的重要形式,是在對(duì)專利文獻(xiàn)進(jìn)行篩選、鑒定、整理基礎(chǔ)上,利用文獻(xiàn)計(jì)量學(xué)方法,對(duì)其所含的各種信息要素進(jìn)行統(tǒng)計(jì)、排序、對(duì)比、分析和研究,從而揭示專利文獻(xiàn)的深層動(dòng)態(tài)特征,了解技術(shù)、經(jīng)濟(jì)發(fā)展的歷史及現(xiàn)狀,進(jìn)行技術(shù)評(píng)價(jià)和技術(shù)預(yù)測(cè)1。專利信息分析內(nèi)容主要包括專利信息分析流程、專利信息分析方法等。在此重點(diǎn)介紹專利信息分析流程,專利信息分析方法將在2.2中闡述。

6、工作小組建立確定分析目標(biāo)研究背景資料選定分析工具選擇專利信息源分析期確定專業(yè)領(lǐng)域擬定檢索策略分析數(shù)據(jù)集關(guān)鍵詞分類號(hào)應(yīng)用期準(zhǔn)備期檢 索數(shù)據(jù)采集數(shù)據(jù)分析數(shù)據(jù)清洗/規(guī)范數(shù)據(jù)分析撰寫(xiě)分析報(bào)告管理層面技術(shù)層面權(quán)利層面分析結(jié)果分析報(bào)告評(píng)估專利戰(zhàn)略制定專利戰(zhàn)略實(shí)施圖1 專利信息分析流程專利信息分析流程一般分為準(zhǔn)備期、分析期和應(yīng)用期三個(gè)階段。準(zhǔn)備期是保證專利信息分析達(dá)到目標(biāo)的基礎(chǔ)。分析期是專利信息分析工作的主體,主要包括數(shù)據(jù)采集和數(shù)據(jù)分析兩個(gè)階段。應(yīng)用期是分析工作的延伸,是專利信息分析的價(jià)值體現(xiàn)。各階段具體包括的內(nèi)容見(jiàn)圖12。2 專利分析工具的主要功能隨著信息技術(shù)的飛速發(fā)展,文本挖掘、信息可視化技術(shù)已被應(yīng)用到

7、專利分析領(lǐng)域,眾多專利分析工具應(yīng)運(yùn)而生。盡管不同分析工具各有專長(zhǎng),但是總的來(lái)說(shuō),專利分析工具的作用主要體現(xiàn)在為分析期提供準(zhǔn)確的數(shù)據(jù),從不同層面對(duì)專利文獻(xiàn)進(jìn)行科學(xué)的分析以及分析結(jié)果的可視化顯示。2.1 數(shù)據(jù)清洗數(shù)據(jù)清洗又稱數(shù)據(jù)規(guī)范、數(shù)據(jù)預(yù)處理,是影響專利信息分析效果至關(guān)重要的一步,其作用是為專利分析提供準(zhǔn)確的數(shù)據(jù),主要包括:(1)對(duì)檢索到的專利文獻(xiàn)進(jìn)行相關(guān)性篩選,將符合條件的專利文獻(xiàn)納入分析數(shù)據(jù)集。(2)同一概念不同寫(xiě)法進(jìn)行規(guī)范,以消除同一概念、同一事物不同寫(xiě)法造成的分析誤差。2.2 分析方法實(shí)現(xiàn)及其結(jié)果可視化顯示專利信息分析方法通常分為定性分析、定量分析和擬定量分析,目前信息分析工具可實(shí)現(xiàn)的方

8、法歸納起來(lái)主要包括基本統(tǒng)計(jì)分析、共現(xiàn)分析、聚類分析和引證分析四大類?;窘y(tǒng)計(jì)分析:即簡(jiǎn)單的定量統(tǒng)計(jì)分析,是指依據(jù)專利文獻(xiàn)固有的標(biāo)引項(xiàng),對(duì)專利申請(qǐng)時(shí)間、申請(qǐng)人、申請(qǐng)機(jī)構(gòu)、申請(qǐng)國(guó)家、同族專利量等指標(biāo)分別進(jìn)行統(tǒng)計(jì),用于把握專利文獻(xiàn)的分布狀況及其發(fā)展態(tài)勢(shì)。分析結(jié)果通常以列表、直方圖表形式展現(xiàn)。共現(xiàn)分析:是指相同或不同類型特征項(xiàng)信息共同出現(xiàn)的現(xiàn)象。通過(guò)對(duì)專利統(tǒng)計(jì)中專利分類號(hào)、專利權(quán)人、專利申請(qǐng)時(shí)間、專利申請(qǐng)國(guó)、專利技術(shù)焦點(diǎn)等進(jìn)行組配統(tǒng)計(jì)3,用于揭示專利信息的內(nèi)容關(guān)聯(lián)和特征項(xiàng)所隱含的知識(shí)。分析結(jié)果顯示方式主要有共現(xiàn)矩陣和曲線圖。聚類分析:是指利用聚類技術(shù)將同一數(shù)據(jù)集中的專利,按照技術(shù)分類聚成不同的子類,以

9、揭示該特定技術(shù)領(lǐng)域內(nèi)各個(gè)子領(lǐng)域的分布情況,分析各主要競(jìng)爭(zhēng)對(duì)手在各子領(lǐng)域內(nèi)的專利分布情況。目前專利聚類主要是按主題進(jìn)行聚類,呈現(xiàn)結(jié)果可以按競(jìng)爭(zhēng)對(duì)手和時(shí)間順序進(jìn)行瀏覽4。聚類分析的結(jié)果展示方式主要有聚類地圖、結(jié)構(gòu)化數(shù)據(jù)聚類和非結(jié)構(gòu)化數(shù)據(jù)聚類5。引證分析:是指對(duì)目標(biāo)專利的引用和被引用的情況進(jìn)行分析。通過(guò)研究專利之間的引用關(guān)系及規(guī)律,探求技術(shù)之間的聯(lián)系和發(fā)展規(guī)律,跟蹤對(duì)應(yīng)于不同技術(shù)的專利網(wǎng)絡(luò),反映特定技術(shù)領(lǐng)域的生命周期,以及競(jìng)爭(zhēng)對(duì)手之間技術(shù)相互依賴關(guān)系。分析結(jié)果呈現(xiàn)主要有引證表、引證樹(shù)和引證地圖4。3 國(guó)外常用專利分析工具前面總結(jié)了專利分析工具可實(shí)現(xiàn)的主要功能,本部分將重點(diǎn)列舉國(guó)外常用的專利分析工具,

10、并依據(jù)專利分析工具可分析的數(shù)據(jù)源,將其分為非結(jié)構(gòu)化數(shù)據(jù)分析工具、結(jié)構(gòu)化數(shù)據(jù)分析工具和混合型數(shù)據(jù)分析工具三大類6。3.1 非結(jié)構(gòu)化數(shù)據(jù)分析工具非結(jié)構(gòu)化數(shù)據(jù)分析工具是指擅長(zhǎng)分析專利全文、期刊論文、網(wǎng)頁(yè)內(nèi)容等非結(jié)構(gòu)化數(shù)據(jù)的軟件,主要包括ClearForest, Goldfire Innovator, OminiViz和TEMIS。 ClearForestClearForest是美國(guó)Thomoson Reuters公司開(kāi)發(fā)的具有強(qiáng)大功能的文本分析解決方案,包括先進(jìn)的文本標(biāo)記抽取平臺(tái)、分析平臺(tái)以及開(kāi)發(fā)環(huán)境。ClearForest最具特色的功能是可以將非結(jié)構(gòu)化數(shù)據(jù)庫(kù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),如從論文、網(wǎng)頁(yè)等非結(jié)構(gòu)

11、化文本中抽取相關(guān)詞語(yǔ)生成結(jié)構(gòu)化數(shù)據(jù),進(jìn)而利用其分析功能對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行文本挖掘,如分類、聚類,生成列表、共現(xiàn)矩陣、聚類圖等。此外該工具還提供了文本分析可視化功能,用于挖掘類間隱含關(guān)系和發(fā)現(xiàn)新知識(shí)。7-8 Goldfire InnovatorGoldfire Innovator是由美國(guó)Invention Machine公司開(kāi)發(fā)的一款文本挖掘分析工具,由創(chuàng)新工作平臺(tái)(Innovator's Workbench)、“研究者”(Researcher)和 Goldfire 智囊?guī)欤℅oldfire Intelligence)三部分組成。創(chuàng)新工作平臺(tái)提供了一個(gè)解決問(wèn)題的環(huán)境,可以利用多種分析工具、

12、方法輔助對(duì)問(wèn)題的理解;“研究者”是其知識(shí)搜取和創(chuàng)新趨勢(shì)分析模塊,利用復(fù)雜的語(yǔ)義分析技術(shù)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可檢索的語(yǔ)義索引進(jìn)行專利分析,幫助用戶發(fā)現(xiàn)核心技術(shù)、發(fā)明人及其合作伙伴和競(jìng)爭(zhēng)對(duì)手;Goldfire 智囊?guī)欤℅oldfire Intelligence)涵蓋全球1500多萬(wàn)件專利、3000個(gè)專業(yè)技術(shù)網(wǎng)站和8000多種科技期刊,用于輔助其專利分析決策。以上三大功能模塊構(gòu)筑了Goldfire Innovator強(qiáng)大的分析功能。93.1.3 OminiVizOminiViz是英國(guó)BioWisdom公司開(kāi)發(fā)的一款先進(jìn)的可視化單機(jī)版數(shù)據(jù)分析軟件。該軟件有兩大特色:一是分析數(shù)據(jù)類型廣泛,可以對(duì)數(shù)值數(shù)據(jù)

13、、分類數(shù)據(jù)、基因序列、化學(xué)結(jié)構(gòu)以及專利、論文等多種數(shù)據(jù)類型進(jìn)行分析;二是整合復(fù)雜的統(tǒng)計(jì)算法、文本算法對(duì)大規(guī)模數(shù)據(jù)進(jìn)行分析生成強(qiáng)大的可視化圖譜輔助用戶對(duì)數(shù)據(jù)的理解,可視化圖譜主要有Galaxy圖、CoMet圖、ThemeMap和聚類圖等。103.1.4 TEMISTEMIS是美國(guó)TEMIS公司開(kāi)發(fā)的一款用于商業(yè)智能的文本挖掘工具。TEMIS依靠其強(qiáng)大的數(shù)據(jù)算法、語(yǔ)言學(xué)算法,將多種文本類型的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,生成列表、聚類圖等11。但是TEMIS在結(jié)果可視化展示方面還存在較大不足,因此限制了其應(yīng)用范圍。3.2 結(jié)構(gòu)化數(shù)據(jù)分析工具結(jié)構(gòu)化數(shù)據(jù)分析軟件主要用于對(duì)數(shù)據(jù)庫(kù)

14、中的專利信息、文獻(xiàn)題錄信息進(jìn)行分析,主要包括Thomson Data Analyzer,VantagePoint,Quosa, RefViz, STN AnaVist和Vxinsight。3.2.1 Thomson Data Analyzer Thomson Data Analyzer美國(guó)Thomson Reuters公司與Search Technology公司聯(lián)合推出的數(shù)據(jù)挖掘和可視化分析工具。由美國(guó)Search Technology公司的VantagePoint引擎提供技術(shù)支持,具有VantagePoint的大部分功能。TDA除支持德溫特世界專利索引、Web of Science和Pubm

15、ed等常用數(shù)據(jù)庫(kù)外,還支持MS Excel數(shù)據(jù)的導(dǎo)入。TDA軟件提供強(qiáng)大的數(shù)據(jù)清洗功能保證了數(shù)據(jù)分析的準(zhǔn)確性,在分析功能方面支持基本統(tǒng)計(jì)、共現(xiàn)分析、聚類分析,但不支持專利引文分析功能,結(jié)果顯示方面可自動(dòng)生成列表、矩陣、聚類圖、報(bào)告等功能。12VantagePoint軟件與Thomson Data Analyzer軟件功能基本類似,在此不再贅述。3.2.2 QuosaQuosa是美國(guó)Quosa公司開(kāi)發(fā)的一款集文獻(xiàn)檢索、全文下載、文獻(xiàn)管理及文獻(xiàn)分析于一體的單機(jī)版文本挖掘工具。該軟件支持 Ovid、PubMed、Google Scholar、USPTO 等的直接搜索,并將PDF全文下載到本地進(jìn)行組織

16、管理,并可對(duì)文獻(xiàn)進(jìn)行概念提取和聚類。其文獻(xiàn)全文自動(dòng)下載、最新進(jìn)展追蹤、PDF 文獻(xiàn)信息自動(dòng)識(shí)別以及全文分析功能是同類文獻(xiàn)管理軟件所不具備的13,但其分析功能與專業(yè)類文獻(xiàn)分析軟件相比功能還較少。3.2.3 RefVizRefViz 是美國(guó)Thomson Reuters公司開(kāi)發(fā)的用于文獻(xiàn)信息分析可視化的單機(jī)版軟件。該軟件主要特色是其統(tǒng)計(jì)、語(yǔ)義分析功能,但是RefViz只能分析結(jié)構(gòu)化數(shù)據(jù),如來(lái)自文獻(xiàn)數(shù)據(jù)庫(kù)或文獻(xiàn)管理軟件的文獻(xiàn)題名、摘要、主題詞等信息,不能分析非結(jié)構(gòu)化數(shù)。此外,在數(shù)據(jù)分析時(shí)可利用其詞庫(kù)工具(thesaurus tools)對(duì)數(shù)據(jù)進(jìn)行清洗以確保數(shù)據(jù)分析的準(zhǔn)確性。文獻(xiàn)分析結(jié)果顯示可生成Ga

17、laxy視圖和二維矩陣視圖。143.2.4 STN AnaVistSTN AnaVist是美國(guó)化學(xué)協(xié)會(huì) (ACS) 分支機(jī)構(gòu)化學(xué)文摘服務(wù)社 (CAS) 與 FIZ Karlsruhe共同開(kāi)發(fā)的一款科技文獻(xiàn)、專利文獻(xiàn)文本分析可視化軟件。支持化學(xué)文摘、德溫特世界專利索引、歐洲專利數(shù)據(jù)庫(kù)和美國(guó)全文專利數(shù)據(jù)庫(kù)等多個(gè)數(shù)據(jù)庫(kù)的內(nèi)容。此外,STN AnaVist可利用CAS詞表對(duì)機(jī)構(gòu)、技術(shù)術(shù)語(yǔ)進(jìn)行數(shù)據(jù)規(guī)范以提高數(shù)據(jù)分析的質(zhì)量。文獻(xiàn)分析結(jié)果顯示可生在圖表,以及采用聚類技術(shù)生在成的研究景觀圖。15 VxinsightVxinsight是由美國(guó)能源部桑地亞(Sandia)國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)的一款單機(jī)版免費(fèi)的文本分析可

18、視化軟件。該軟件的主要特色是采用三維虛擬地圖的形式來(lái)模擬聚類信息,以揭示科技文獻(xiàn)、專利、蛋白、基因間的相關(guān)性。16,173.3 混合型數(shù)據(jù)分析工具混合型數(shù)據(jù)分析軟件是一類即可以分析結(jié)構(gòu)化數(shù)據(jù)又可以分析非結(jié)構(gòu)化數(shù)據(jù)的軟件,主要包括:Aureka, M-CAM Doors, Wisdomain和PatAnalyst,這些工具都整合了專利數(shù)據(jù)庫(kù)檢索功能。 AurekaAureka是美國(guó)Thomson Reuters公司開(kāi)發(fā)的一個(gè)在線的知識(shí)產(chǎn)權(quán)管理和分析平臺(tái),提供強(qiáng)大的專利檢索、管理、分析(包括專利引證分析,專利地圖分析等)預(yù)警等功能。在專利分析方面,通過(guò)ThemeScape提供聚類分析生成專利地圖,

19、通過(guò)Aureka Citation Tree提供引文分析生成引證樹(shù),揭示專利信息間的相互關(guān)聯(lián),為用戶技術(shù)研發(fā)與自主創(chuàng)新、專利評(píng)價(jià)與評(píng)估、專利權(quán)保護(hù)、企業(yè)聯(lián)營(yíng)與合作或兼并等的生產(chǎn)經(jīng)營(yíng)決策活動(dòng)提供幫助。Aureka軟件在數(shù)據(jù)清洗方面功能較弱是該軟件的主要不足。183.3.2 WisdomainWisdomain是美國(guó)Wisdomain公司開(kāi)發(fā)的一個(gè)專利分析解決方案,整合FOCUST、PatentMagnet、PatentFamilyTree、PatentLab-II四個(gè)工具,支持美國(guó)、歐洲、中國(guó)、日本、韓國(guó)和世界PCT專利檢索,提供基本統(tǒng)計(jì)、共現(xiàn)分析和引證分析功能,分析結(jié)果可以列表、聚類圖、引文圖

20、形式顯示。193.3.3 Delphion專利信息平臺(tái)Delphion是美國(guó)Thomson Reuters公司開(kāi)發(fā)的專利信息服務(wù)平臺(tái),集成 Snapshot、Corporate Tree、PatentLab-II、Text Clustering、Citation Link五個(gè)工具,分別提供在線分析、公司名稱規(guī)范、列表和直方圖等圖表生成、文檔聚類、引文分析功能。Delphion專利信息平臺(tái)收錄專利范圍廣、整合分析工具多是其主要特色,但其按服務(wù)項(xiàng)目、專利下載數(shù)量收費(fèi)的服務(wù)模式,使得一般用戶難以承受其高昂的費(fèi)用。203.4 專利分析工具比較以上對(duì)國(guó)外常用的非結(jié)構(gòu)化數(shù)據(jù)分析工具、結(jié)構(gòu)化數(shù)據(jù)分析工具、混

21、合型數(shù)據(jù)分析工具進(jìn)行了簡(jiǎn)單介紹,下面將從分析工具類型、分析數(shù)據(jù)源、主要功能、結(jié)果呈現(xiàn)、用戶群五個(gè)方面,對(duì)13個(gè)分析軟件進(jìn)行比較6,見(jiàn)表2。非結(jié)構(gòu)化數(shù)據(jù)分析工具,主要基于其強(qiáng)大的語(yǔ)義分析技術(shù),將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),進(jìn)而利用其強(qiáng)大的分析功能對(duì)其進(jìn)行分析。這四個(gè)軟件中,ClearForest,Goldfire Innovator,TEMIS價(jià)格昂貴,限制了其在國(guó)內(nèi)的應(yīng)用;Ominiviz為單機(jī)版軟件,除具有文本挖掘功能外還具有強(qiáng)大可視化功能,其可視化功能在眾多軟件中尤為出眾。結(jié)構(gòu)化數(shù)據(jù)分析工具,目前國(guó)內(nèi)在科技文獻(xiàn)、專利文獻(xiàn)分析應(yīng)用較多的主要是Thomson Data Analyzer,該軟

22、件支持20多種文獻(xiàn)數(shù)據(jù)源(期刊文獻(xiàn)和專利文獻(xiàn)),是目前已知文獻(xiàn)信息分析工具中支持?jǐn)?shù)據(jù)最為廣泛的軟件,且支持MS Excel文件(含中文)的導(dǎo)入;此外該軟件還具有強(qiáng)大的數(shù)據(jù)清洗功能、自動(dòng)生成專利報(bào)告的功能,這些功能是其軟件無(wú)法與之媲美的;但是Thomson Data Analyzer在專利地圖制作、文獻(xiàn)結(jié)果可視化方面還存在不足,限制了其在專利分析中的應(yīng)用。Quosa和Refviz主要用于期刊文獻(xiàn)的管理和分析,支持?jǐn)?shù)據(jù)源較少;STN AnaVist自帶技術(shù)術(shù)語(yǔ)、機(jī)構(gòu)分析詞表可用于專利文獻(xiàn)數(shù)據(jù)清洗,但對(duì)大規(guī)模數(shù)據(jù)庫(kù)的清洗仍是該軟件面臨的巨大挑戰(zhàn)。Vxinsight是本文介紹的分析工具中唯一一款免費(fèi)的

23、軟件,主要特色是可以生成二維、三維聚類地圖用于揭示專利、文獻(xiàn)間的關(guān)系,但該軟件在專利分析應(yīng)用方面功能較弱?;旌闲蛿?shù)據(jù)分析工具,除提供專利分析功能外,還提供專利文獻(xiàn)檢索、數(shù)據(jù)下載功能,文中提到的三個(gè)分析工具分析功能完備,均具有數(shù)據(jù)清洗功能,提供基本統(tǒng)計(jì)、共現(xiàn)分析、聚類分析、引文分析(僅對(duì)US專利進(jìn)行分析),并可對(duì)分析結(jié)果進(jìn)行可視化顯示。但這三個(gè)工具在專利分析方面各有其優(yōu)勢(shì)與不足,如Aureka可采用聚類分析生成主題(詞匯)地形圖,用于專利技術(shù)主題分布研究,而在專利國(guó)家、機(jī)構(gòu)分析分析方面由于缺乏數(shù)據(jù)清洗功能,分析結(jié)果準(zhǔn)確性不足;Wisdomain僅能分析自帶數(shù)據(jù)庫(kù)檢索結(jié)果,不具有數(shù)據(jù)導(dǎo)入功能;De

24、lphion主要用于專利數(shù)據(jù)檢索,在數(shù)據(jù)分析方面相比Aureka和Wisdomain功能較弱。4小結(jié)專利信息分析工具是順利開(kāi)展專利信息分析的重要保障,專利分析工具的好壞將直接影響到專利分析的效率和結(jié)果的準(zhǔn)確性,在應(yīng)用專利分析工具開(kāi)展分析時(shí),還應(yīng)注意以下幾點(diǎn):(1)融會(huì)信息分析思維,選擇恰當(dāng)分析工具。目前國(guó)外專利分析工具眾多,在開(kāi)展專利信息分析工作時(shí),應(yīng)根據(jù)不同的分析目的、擬解決的問(wèn)題,結(jié)合不同分析工具的主要功能,選擇恰當(dāng)?shù)姆治龉ぞ摺?(2)結(jié)合人工干預(yù),提高分析質(zhì)量。高質(zhì)量專利分析報(bào)告的完成離不開(kāi)對(duì)專利文獻(xiàn)的文本挖掘,但是僅有文本挖掘工具或信息技術(shù)專家是不夠的,還需要具有專業(yè)知識(shí)背景專家的干預(yù)

25、。在專利分析工具使用過(guò)程中,從數(shù)據(jù)檢索、數(shù)據(jù)規(guī)范、數(shù)據(jù)分析以及結(jié)果的解釋都離不開(kāi)人工的干預(yù)以及專家的支持。(3)分析工具尚不完善,分析功能有待進(jìn)一步提升。隨著文本挖掘和信息可視化技術(shù)在專利分析工具中的應(yīng)用,分析工具有了較大的提升,但仍存在一些不足,如多數(shù)據(jù)源融合度低、數(shù)據(jù)清洗功能弱、知識(shí)挖掘程度淺等,因此隨著自然語(yǔ)言處理、人工智能創(chuàng)新技術(shù)的不斷進(jìn)步,分析工具功能將不斷完善。表2 國(guó)外13種專利文本挖掘可視化工具比較工具名稱工具類型分析數(shù)據(jù)源主 要 功 能用戶群數(shù)據(jù)清洗分析方法結(jié)果呈現(xiàn)基本統(tǒng)計(jì)共現(xiàn)分析聚類分析引證分析非結(jié)構(gòu)化數(shù)據(jù)分析工具ClearForest文本挖掘結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)有無(wú)有

26、有無(wú)列表、矩陣、聚類圖商業(yè)智能Goldfire Innovator文本挖掘非結(jié)構(gòu)化數(shù)據(jù)無(wú)有不詳不詳有分類圖、趨勢(shì)圖研發(fā)人員OminiViz文本挖掘/可視化結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(數(shù)值數(shù)據(jù)、分類數(shù)據(jù)、基因序列、化學(xué)結(jié)構(gòu))有有有有無(wú)交互式可視化圖譜(Galaxy圖、CoMet圖、ThemeMap和聚類圖等)研發(fā)人員TEMIS文本挖掘結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)無(wú)有不詳有無(wú)列表、聚類圖研發(fā)人員/商業(yè)智能結(jié)構(gòu)化數(shù)據(jù)分析工具Quosa文本挖掘/文獻(xiàn)管理結(jié)構(gòu)化數(shù)據(jù)(PubMed,Ovid,Google Scholar,USPTO等)無(wú)無(wú)無(wú)有無(wú)數(shù)據(jù)分組和注釋研發(fā)人員RefViz文本挖掘/可視化結(jié)構(gòu)化數(shù)據(jù)(We

27、b of Science,PubMed,OCLC等)和來(lái)自參考文獻(xiàn)管理軟件的數(shù)據(jù)有有有有無(wú)Galaxy圖和矩陣圖研發(fā)人員/信息管理人員STN AnaVist文本挖掘/數(shù)據(jù)庫(kù)檢索結(jié)構(gòu)化數(shù)據(jù)(CA plus, US,PCT,DWPI)有有有有無(wú)列表、圖表、研究景觀圖(research landscape)信息管理人員/商業(yè)智能/研發(fā)人員Thomson Data Analyzer 文本挖掘結(jié)構(gòu)化數(shù)據(jù)(Web of Science,PubMed,DWPI等)及MS Excel格式數(shù)據(jù)有有有有無(wú)列表、圖表、矩陣、聚類圖、專利報(bào)告信息管理人員/商業(yè)智能Vxinsight文本挖掘/可視化結(jié)構(gòu)化數(shù)據(jù)(ODBC

28、方式存取的多種數(shù)據(jù)類型)無(wú)有聚類圖(二維、三維)研發(fā)人員/信息管理混合型數(shù)據(jù)分析工具Aureka文本挖掘/可視化/數(shù)據(jù)庫(kù)檢索US,DE,EP,GB,JP(僅文摘)和PCT專利有有有有有ThemeMap、引文樹(shù)、聚類圖、專利報(bào)告研發(fā)人員/信息管理人員/決策人員/商業(yè)智能Wisdomain文本挖掘/數(shù)據(jù)庫(kù)檢索US,DE,EP,JP,PCT,中國(guó),韓國(guó),INPADOC有有有有有列表、圖表、系統(tǒng)樹(shù)、引文圖研發(fā)人員/信息管理Delphion專利信息平臺(tái)文本挖掘/數(shù)據(jù)庫(kù)檢索US,DE,EP,JP,PCT,INPADOC,DWPI有有無(wú)有有列表、引文樹(shù)、聚類圖研發(fā)人員/信息管理/商業(yè)智能參考文獻(xiàn):1 駱云中,陳蔚杰,徐曉琳.專利情報(bào)分析與利用M.上海:華東理工大學(xué)出版社,2007:1302 陳燕,黃迎燕,方建國(guó),等編著.專利信息采集與分析M.北京:清華大學(xué)出版社,2006:67.3 暴海龍,朱東華.專利情報(bào)分析方法綜述.北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)J. 2002,4(S1):91-934 張靜,劉細(xì)文,柯賢能,等.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論