基于CiteSpace_的植物科學知識圖譜可視化分析.pdf_第1頁
基于CiteSpace_的植物科學知識圖譜可視化分析.pdf_第2頁
基于CiteSpace_的植物科學知識圖譜可視化分析.pdf_第3頁
基于CiteSpace_的植物科學知識圖譜可視化分析.pdf_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

收稿日期 2013 04 08 作者簡介 劉玉博 1983 男 博士 館員 0引言 隨著社會信息化的推進和網(wǎng)絡(luò)應(yīng)用的日益廣 泛 信息源越來越龐大 人們對于大型數(shù)據(jù)甚至海量 數(shù)據(jù)的存儲 傳輸 檢索及分類等需求日益迫切 在 激增的數(shù)據(jù)背后 隱藏著許多重要的信息 人們希望 能夠?qū)ζ溥M行更高層次的分析 以便更好地利用這 些數(shù)據(jù) 對科學學科本身進行可視化研究屬于科學 計量學的一個重要研究范疇 科學計量學的研究方 法是對科學學科進行定量研究的最基本 最成熟的 方法 1 科學知識圖譜是在信息技術(shù)的推動下 新近 發(fā)展起來的一個新領(lǐng)域 當前已經(jīng)成為科學計量學 的一個新熱點 借助科學知識圖譜 人們可以透視龐 大的知識體系中各個領(lǐng)域的結(jié)構(gòu) 理順當代知識大 爆炸形成的復雜知識網(wǎng)絡(luò) 預測科學技術(shù)知識前沿 發(fā)展的最新態(tài)勢 2 植物科學是一門基礎(chǔ)理論學科 它的任務(wù)是研 究植物客觀存在的自然規(guī)律 早在17世紀初期對植 物的研究就已經(jīng)形成了比較系統(tǒng)的理論與學說 20 世紀特別是50年代以來 植物科學又有了飛速發(fā) 展 主要是植物生理學 生物化學和遺傳學等的成 就 使植物科學在經(jīng)濟上更為重要 成為農(nóng)業(yè) 園藝 學和環(huán)境科學的重要理論基礎(chǔ) 美國的 植物細胞 The Plant Cell 雜志是由美 國植物生物學家學會出版的生命科學領(lǐng)域著名學術(shù) 刊物 在SCI植物類非評論性雜志中排名第一 植 物細胞 創(chuàng)刊于1989年 其文章主要集中在植物激 素 植物抗逆 植物發(fā)育及信號轉(zhuǎn)導等方面 引領(lǐng)著 植物分子生物學的研究方向 本文利用科學可視化圖譜分析軟件CiteSpace II對 植物細胞 雜志歷年來發(fā)表的文獻進行處理和 分析 繪制出知識圖譜 并對知識圖譜所顯示的演化 路徑和研究前沿進行解讀 旨在全面把握植物科學 領(lǐng)域發(fā)展的動態(tài)過程 特點和規(guī)律 1研究方法及數(shù)據(jù)來源 1 1研究方法 知識圖譜 Mapping Knowledge Domain 是一種 新近興起的 將科學計量學 統(tǒng)計學 機器學習 計算 機圖形學等綜合起來的科學研究方法 它把科學文 獻之間的關(guān)系建立在統(tǒng)計學基礎(chǔ)之上 然后以可視 化的圖形直觀地反映出來 對于發(fā)現(xiàn)和解釋科學文 獻中潛在的和隱藏的規(guī)律或?qū)W科演化路徑發(fā)揮了重 要作用 3 基于 CiteSpace II 的植物科學 知識圖譜可視化分析 劉玉博 山東農(nóng)業(yè)大學圖書館山東泰安271018 摘要 以Web of Science數(shù)據(jù)庫中 植物細胞 雜志自1989年創(chuàng)刊號到2012年底的所有文獻作為研究對象 運用CiteS pace II軟件進行文獻共引分析和共詞分析 以知識可視化圖譜方式展現(xiàn)20多年來植物科學領(lǐng)域的研究機構(gòu) 知識基礎(chǔ) 研究熱 點及研究前沿 關(guān)鍵詞 植物細胞 科學知識圖譜 可視化分析 CiteSpace II 中圖分類號 G250 252文獻標識碼 Adoi 10 3969 j issn 1005 8095 2013 11 005 CiteSpace II based Visualized Analysis on Knowledge Mapping of Plant Science Liu Yubo Library of Shandong Agricultural University Tai an Shandong 271018 Abstract The paper takes all documents in the magazine of the Plant Cell in Web of Science database from the initial issue in 1989 to the end of 2012 as the research object and uses CiteSpace II to do co citation analysis and co word analysis to show the re search institutions knowledge foundation research hotspots and frontiers in the fields of biology and plant science in recent over 20 years with knowledge visualization mapping Keywords the Plant Cell scientific knowledge mapping visualized analysis CiteSpace II 2013年11月 NOV 2013 情報探索 Information Research 第11期 總193期 No 11 Serial No 193 17 知識圖譜由兩個基本且相互關(guān)聯(lián)的方面組成 結(jié)構(gòu)化的建模和圖形化的表示 根據(jù)不同的原理 有 多種方法可以繪制出科學知識圖譜 美籍華裔學者 陳超美博士設(shè)計免費的CiteSpace II軟件是眾多知 識圖譜繪制軟件中的一種 它把科學文獻作為數(shù)據(jù) 來源 將其轉(zhuǎn)換為幾何問題和統(tǒng)計學問題 從而使用 幾何圖形直觀的方法和立足數(shù)學的角度 研究其內(nèi) 在的聯(lián)系 用來評測某種學科或領(lǐng)域的研究前沿和 研究模式 4 6 1 2數(shù)據(jù)來源 數(shù)據(jù)來源為Web of Science http webofknowl Citation Index Expanded SCI EXPANDED 數(shù)據(jù)庫 時間跨度 選擇所有年份 輸入檢索式 SO PLANT CELL 進 行檢索 檢索出該雜志從1989年創(chuàng)刊到2012年12 月15日共發(fā)表文獻5477篇 將所有記錄每次選擇 500條進行輸出 全紀錄格式并包含引用的參考文 獻 另存為純文本文檔 文件命名為download 01 txt download 11 txt備用 下載的數(shù)據(jù)包括如下字段 author title source citedreferences keywords docu ment type abstract等 2結(jié)果與分析 2 1年載文量和影響因子分析 期刊載文量是描述期刊生產(chǎn)能力的基本指標之 一 其定義為在給定時間內(nèi) 期刊發(fā)表的全部論文數(shù) 量 從圖1可以看出 植物細胞 雜志自創(chuàng)刊以來 刊登的文章量總體趨勢是持續(xù)增長的 從創(chuàng)刊時 1989年的131篇 到20世紀90年代的200篇左 右 再到2010年的300篇左右 近2年的載文量增 長更快 2012年已經(jīng)接近370篇 這說明植物科學 領(lǐng)域高水平的研究結(jié)果越來越多 影響因子是美國ISI 科學信息研究所 的JCR 期刊引證報告 中的一項指標 是一個國際上通行 的期刊評價指標 即某期刊前2年發(fā)表的論文在統(tǒng) 計當年的被引用總次數(shù)除以該期刊在前2年內(nèi)發(fā)表 的論文總數(shù) 植物細胞 雜志在1990年獲得了其第 一個影響因子6 734 這對一個創(chuàng)刊僅2年的雜志來 說是非常令人欣慰的 因為 植物細胞 雜志自創(chuàng)刊 伊始 就要求文章必須具有創(chuàng)新性和系統(tǒng)性 審稿人 也異常嚴謹 之后 植物細胞 的影響因子曲折攀升 1998年達到了最高的11 757 載文量和影響因子同 步上升 這是雜志飛速發(fā)展的時期 1999 2005年雜 志的影響因子相對穩(wěn)定 2006年開始出現(xiàn)下降趨 勢 這可能與2004年后載文量明顯增加有關(guān) 2 2國家和研究機構(gòu)發(fā)文量分析 安裝好Java運行環(huán)境 啟動并運行CiteSpace II 軟件 版本號v 2 2 R7 設(shè)置好相應(yīng)的數(shù)據(jù)來源目錄 和項目目錄 CiteSpace II可將各國發(fā)表的論文數(shù)量 及時間以圓圈的大小和顏色直觀展示出來 在 CiteSpace II軟件界面 網(wǎng)絡(luò)節(jié)點選擇國家 Country 和機構(gòu) Institution 主題詞來源選擇文獻標題 Ti tle 摘要 Abstract 關(guān)鍵詞 Descriptor 和標識符 I dentifiers 數(shù)據(jù)抽取對象為Top 30 設(shè)置時間切片 Years per slice 的值為2 即將1989 2012年分成 12個時段進行處理 運行CiteSpace II 得到 植物細 胞 雜志的國家分布圖譜 點擊 find cluster 按鈕對 國家與研究機構(gòu)進行聚類分析 圖2所示 其中 一 篇 圖1載文量和影響因子情況 年份 2013年11月情報探索第11期 總193期 18 個圓圈代表一個節(jié)點 也就是一個國家或機構(gòu) 圓圈 面積代表發(fā)文量 細線表示國家或機構(gòu)間的合作關(guān) 系 上方圖示不同顏色的色塊代表相應(yīng)的年份 2年 為一個時間切片 從圖2各個節(jié)點的發(fā)文總量來看 美國的文獻 貢獻率最大 遠高于其他國家 占到了總發(fā)文量的4 成 其次是德國 英國 日本 法國等 中國排在第6 位 美國發(fā)文量如此之高 這與美國雄厚的經(jīng)濟實 力 巨大的科研投入以及高水平的科研人員是分不 開的 其次 歐洲經(jīng)濟發(fā)達國家在這一領(lǐng)域的投入和 產(chǎn)出上也是毫不遜色的 盡管中國的產(chǎn)出相對比較 靠前 但是還要繼續(xù)加強前沿領(lǐng)域的投入 圖2中共產(chǎn)生節(jié)點100個 連線僅有64條 雖 然生物學的研究近年來合作交流已經(jīng)非常頻繁 但 從整個網(wǎng)絡(luò)和整個時間跨度來看 美國和德國之間 的連線密切 也就是說兩國的合作比較頻繁 而其他 國家或研究機構(gòu)間連線較少 說明絕大部分的Top 30文章都是由同一個國家的作者之間合作完成的 從發(fā)文突發(fā)性來看 美國和中國是非常突出的 突發(fā)性分別達到44 44和41 42 進一步挖掘數(shù)據(jù)發(fā) 現(xiàn) 美國的發(fā)文量突增出現(xiàn)在1989 1993年 這是因 為 植物細胞 雜志是由美國植物生物學家學會出版 發(fā)行的 雜志創(chuàng)刊初期主要刊載的是美國作者的文 章 而我國的發(fā)文突增出現(xiàn)在2007 2012年 說明我 國近5年來在頂尖雜志的發(fā)文量出現(xiàn)了迅猛增長 我國的植物科學領(lǐng)域經(jīng)過一段時間的模仿 學習和 積累后 日前已經(jīng)進入迅速發(fā)展的時期 以同樣的方法統(tǒng)計發(fā)文機構(gòu) 由于CiteSpace II 無法識別機構(gòu)的大小寫 對相同機構(gòu)大小寫的數(shù)據(jù) 進行了手動合并后進行排序 美國的科研機構(gòu)占了 前10名中的7席 而且全是大學 這說明美國大學 是植物科學研究領(lǐng)域的嚆矢 例如加利福尼亞大學 普渡大學 康奈爾大學等 其他國家英國 中國和法 國各占1席 且都為研究機構(gòu) 約翰 英納斯植物科 學研究中心 中國科學院和法國農(nóng)業(yè)科學研究院 中國發(fā)文量排在前列的科研機構(gòu)還有北京大學和中 國農(nóng)業(yè)大學 2 3關(guān)鍵文獻分析 共引分析是引文分析的一個重要內(nèi)容 受到國 內(nèi)外學者的廣泛關(guān)注 計算機可視化信息處理軟件 是通過直觀的動態(tài)圖像信息處理的方式 顯示出專 業(yè)領(lǐng)域中出現(xiàn)的交叉學科的復雜現(xiàn)象 從而獲得詳 盡的前沿科學信息分析結(jié)果 這些信息分析的結(jié)果 將有助科學家在最短的時間里了解和預測前沿科技 研究動態(tài) 有助于在復雜的科研信息中開辟新的未 知領(lǐng)域 提供快速獨立科學判斷的客觀依據(jù) 7 繪制共引網(wǎng)絡(luò)圖譜是CiteSpace II展示學科知 識基礎(chǔ)與研究前沿的一個重要方法 網(wǎng)絡(luò)節(jié)點選擇 文獻引用 Cited Reference 其他選擇策略不變 運 行CiteSpace II 得到文獻共引聚類的合并網(wǎng)絡(luò) 如 圖3所示 點擊時間序列 Timeline 按鈕并確認 得 到文獻的文獻時間序列圖譜 如圖4所示 其中共 有節(jié)點178個 連線406條 同時將數(shù)據(jù)導出 統(tǒng)計 植物細胞 雜志24年來的共引頻次 從中可以分析 植物科學領(lǐng)域整個過程中起到關(guān)鍵作用的文獻 植物細胞 雜志歷年來引用次數(shù)最多的文獻是 Clough SJ和Bent AF發(fā)表在1998年 植物雜志 Plant Journal 上題為 Floral dip a simplified method for Agrobacterium mediated transformation of Ara bidopsis thaliana 的文章 共引用達到696次之多 圖2國家與科研機構(gòu)的聚類圖譜 圖3文獻共引聚類圖譜 圖4文獻時間序列圖譜 第11期 總193期 劉玉博 基于CiteSpace II的植物科學知識圖譜可視化分析2013年11月 19 這篇文獻開創(chuàng)了用農(nóng)桿菌介導的擬南芥花序浸染法 進行轉(zhuǎn)基因的方法 擬南芥是典型的模式植物 廣泛 用于植物遺傳學 發(fā)育生物學和分子生物學的研究 花序浸染法通過擬南芥的花器官進行轉(zhuǎn)化 通過抗 性篩選可以直接獲得轉(zhuǎn)基因種子 不需要經(jīng)過組織 培養(yǎng)的過程 其優(yōu)點是育種周期短 操作簡單和轉(zhuǎn)化 率高 花序浸染法的發(fā)明大大加快了植物分子生物 學的發(fā)展 這篇文獻可以說是現(xiàn)代植物生物學的奠 基之作 引用頻次居次位的是Murashige T和Skoog F 于1962年發(fā)表在 植物生理學 Physiol Plantarum 雜志上的題為 A revised medium for rapid growth and bioassays with tobacco cultures 的文章 共引用了 567次 MS培養(yǎng)基是為煙草細胞培養(yǎng)設(shè)計的 是較 穩(wěn)定的離子平衡溶液 而且養(yǎng)分的數(shù)量和比例合適 能滿足植物細胞的營養(yǎng)和生理需要 因而適用范圍 比較廣 后來多數(shù)植物組織培養(yǎng)快速繁殖用它作為 基本培養(yǎng)基 基于此 這種培養(yǎng)基就用他們倆名字的 首字母組合來命名了 引用434次的是一本題為 Molecular Cloning A Laboratory Manual 的實驗手冊 由Sambrook J和 Russell DW于1989年合作出版 書中系統(tǒng)介紹了分 子克隆的是實驗方法和步驟 以其無可匹敵的聲譽 在近20年的時間里一直被作為分子生物學實驗的 經(jīng)典參考書 該書具有先進性 實用性 權(quán)威性的特 點 是生命科學實驗室內(nèi)當之無愧的 圣經(jīng) Jefferson RA Kavanagh TA和Bevan MW合 作 發(fā)表在1987年 歐洲分子生物學學會雜志 EMBO Journal 上的題為 GUS fusions beta glucuronidase as a sensitive and versatile gene fusion marker in higher plants 的文章 被引用了343次 文中介紹了GUS 基因標記技術(shù) 其具有簡便 實用 快速 準確 原位 直觀的特點 后來被廣泛地應(yīng)用于分析高等植物的 基因表達情況 是現(xiàn)代植物生物學的又一篇奠基文 獻 2003年發(fā)表在國際頂級雜志 科學 Science 上的文章 Genome Wide Insertional Mutagenesis of Arabidopsis thaliana 在短短不到10年的時間里就 被引用了326次 此文由包括Alonso JM在內(nèi)的近 40名作者共同完成 運用T DNA插入突變技術(shù)獲 得了模式植物擬南芥的超過225 000種突變體 也 就是大名鼎鼎的SALK突變體庫 并無償提供給全球 的研究者使用 無數(shù)擬南芥的基因功能因此被發(fā)現(xiàn) Laemmli UK于1970年發(fā)表在國際頂級雜志 自然 Nature 上的文章 Cleavage of Structural Pro teins during the Assembly of the Head of Bacterio phage T4 被引用了297次 文章用凝膠電泳的方 法分離了T4噬菌體頭部的蛋白質(zhì)組成 后來這種方 法被廣泛用于分子生物學 遺傳學和生物化學等領(lǐng) 域 并為蛋白質(zhì)組學的發(fā)展奠定了基礎(chǔ) 2 4前沿文獻分析 CiteSpace II可以生成強調(diào)研究前沿和其知識 基礎(chǔ)間的順時模式時區(qū)視圖 時區(qū)視圖是由一系列 表示時區(qū)的條形區(qū)域組成 時區(qū)按時間順序從左到 右排列 因而研究前沿指向知識基礎(chǔ) 圖5右上角顯示的是由一組最新熱點研究文獻 構(gòu)成的研究前沿 它代表著一個研究領(lǐng)域的思想現(xiàn) 狀 從該圖可以看到圖書館學最近幾年的發(fā)展脈絡(luò) 以及研究前沿與知識基礎(chǔ)之間千絲萬縷的聯(lián)系 這 些構(gòu)成植物科學領(lǐng)域研究前沿的文獻節(jié)中 最突出 的就是前面介紹過的2003年Alonso JM等人發(fā)表 在 自然 上關(guān)于擬南芥插入突變體的文章 正是由 于該文的發(fā)表 突變體被大量用于擬南芥基因功能 的研究 并獲得了很多突破性的研究進展 另一篇突 出的前沿節(jié)點文獻是由Birnbaum K等人發(fā)表在 科 學 上 題為 A gene expression map of the Arabidop sis root 的文章 被引用了51次 文章用基因芯片的 方法分析了擬南芥根部超過22 000個基因的表達 情況 并發(fā)現(xiàn)基因的表達模式突破了傳統(tǒng)的生理區(qū) 域而呈現(xiàn)對多種激素的響應(yīng) 另一篇文獻是Zim mermann P等人發(fā)表在2004年 植物生理學 Plant Physiology 上的 GENEVESTIGATOR Arabidopsis Microarray Database and Analysis Toolbox 被引用了 115次 文章介紹了一種集合了大量基因芯片數(shù)據(jù) 的數(shù)據(jù)庫 并且允許用戶在數(shù)據(jù)庫中檢索基因在特 定條件下的表達情況 不難發(fā)現(xiàn) 這3篇前沿節(jié)點文 獻都是與基因組學相關(guān)的 基因的表達情況被大量 的分析 并為后來的研究者提供了基礎(chǔ)和便利 成為 近10年來被引用最頻繁的節(jié)點文獻 2 5研究熱點及前沿分析 圖5研究前沿的時區(qū)視圖 2013年11月情報探索第11期 總193期 20 利用文獻題錄中的關(guān)鍵詞 并借助CiteSpace II 軟件 來確定文獻計量學研究的熱點領(lǐng)域 關(guān)鍵詞是 作者對于文章核心的概括和精煉 是一篇文章的精 髓 因此對文章的關(guān)鍵詞進行分析 頻次高的關(guān)鍵詞 常被用來確定一個研究領(lǐng)域的熱點問題 網(wǎng)絡(luò)節(jié)點 僅選擇關(guān)鍵詞 Keyword 其他策略不變 CiteSpace II可以通過時區(qū)視圖來呈現(xiàn)關(guān)鍵詞隨時間的變化 以此來分析研究熱點的變遷 如圖6所示 結(jié)合統(tǒng)計數(shù)據(jù)可以看出 植物細胞 雜志中使 用最多的關(guān)鍵詞是 擬南芥 在整個網(wǎng)絡(luò)中出現(xiàn)頻 次是850次 突發(fā)性也是最高的 足見擬南芥作為 模式植物 對整個植物生物學的巨大貢獻 其次是 分別被使用605次和457次的 基因表達 和 蛋白 質(zhì) 基因和蛋白質(zhì)水平的研究是現(xiàn)代植物學 也就 是植物分子生物學 的核心 基因和蛋白質(zhì)的功能揭 示了植物發(fā)育的本質(zhì) 轉(zhuǎn)錄因子 作為關(guān)鍵詞的使 用也是十分頻繁的 突發(fā)性也比較高 轉(zhuǎn)錄因子與蛋 白質(zhì)調(diào)控基因的表達相關(guān) 是前面兩個關(guān)鍵詞的延 續(xù) 信號轉(zhuǎn)導 涉及植物生長發(fā)育的各個階段 近年 來也逐漸成為研究的熱點 轉(zhuǎn)基因植物和野生型作 為一對密切相關(guān)的關(guān)鍵詞 通過轉(zhuǎn)基因植物和野生 型的對照發(fā)現(xiàn)基因的功能是植物生物學中最常用的 研究手段 從圖6中可以看出 2005年以后 植物細胞 雜 志中許多關(guān)鍵詞變得很突出 例如植物發(fā)育 轉(zhuǎn)錄因 子 基因家族 功能分析 體外 分化等 說明與這些 關(guān)鍵詞相關(guān)的研究領(lǐng)域變得越來越熱門 也是植物 生物學的研究前沿 CiteSpace II軟件中提供的突發(fā)詞探測 burst detection 技術(shù)和算法 通過考察詞頻的時間分布 將 其中頻次變化率高的詞 burst term 從大量的主題詞 中探測出來 依靠詞頻的變動趨勢 而不僅僅是頻次 的高低 來確定文獻計量學的前沿領(lǐng)域和發(fā)展趨勢 在CiteSpace II中選擇名詞短語 no

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論