《文獻(xiàn)信息檢索實(shí)教程·第4版》 課件-模塊7 文獻(xiàn)信息分析工具_(dá)第1頁(yè)
《文獻(xiàn)信息檢索實(shí)教程·第4版》 課件-模塊7 文獻(xiàn)信息分析工具_(dá)第2頁(yè)
《文獻(xiàn)信息檢索實(shí)教程·第4版》 課件-模塊7 文獻(xiàn)信息分析工具_(dá)第3頁(yè)
《文獻(xiàn)信息檢索實(shí)教程·第4版》 課件-模塊7 文獻(xiàn)信息分析工具_(dá)第4頁(yè)
《文獻(xiàn)信息檢索實(shí)教程·第4版》 課件-模塊7 文獻(xiàn)信息分析工具_(dá)第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025.5模塊七

文獻(xiàn)信息分析工具單元一

文獻(xiàn)信息分析工具概述文獻(xiàn)分析工具概述1文獻(xiàn)信息分析步驟3文獻(xiàn)信息分析方法2文獻(xiàn)分析工具概述單擊此處添加文檔副標(biāo)題內(nèi)容0120世紀(jì)90年代末,學(xué)術(shù)搜索引擎雖多,但缺乏全面的學(xué)術(shù)文獻(xiàn)索引和引用分析工具。早期檢索問題SteveLawrence團(tuán)隊(duì)開發(fā)CiteSeer,提供廣泛學(xué)術(shù)文獻(xiàn)索引和引用分析,逐漸成為學(xué)術(shù)界重要工具。CiteSeer誕生文獻(xiàn)分析工具誕生背景理解文獻(xiàn)分析概念和重要性,熟悉文獻(xiàn)引用和引用網(wǎng)絡(luò)分析方法。培養(yǎng)批判性思維和信息素養(yǎng),提升學(xué)術(shù)研究質(zhì)量和效率。能使用文獻(xiàn)分析工具分析評(píng)估學(xué)術(shù)文獻(xiàn)質(zhì)量和可靠性,揭示影響力和合作關(guān)系。知識(shí)目標(biāo)能力目標(biāo)素質(zhì)目標(biāo)文獻(xiàn)分析工具培養(yǎng)目標(biāo)文獻(xiàn)信息分析方法單擊此處添加文檔副標(biāo)題內(nèi)容02頻次排序通過對(duì)文獻(xiàn)中出現(xiàn)的關(guān)鍵詞、主題等進(jìn)行頻次統(tǒng)計(jì)和排序,揭示出文獻(xiàn)中的高頻詞匯和主題。這種方法簡(jiǎn)單直觀,能夠幫助研究者快速了解領(lǐng)域內(nèi)的熱點(diǎn)和重點(diǎn)。共現(xiàn)分析研究文獻(xiàn)中不同元素(如關(guān)鍵詞、作者、機(jī)構(gòu)等)之間的共現(xiàn)關(guān)系。通過挖掘這些元素之間的關(guān)聯(lián)和共現(xiàn)模式,共現(xiàn)分析能夠揭示出領(lǐng)域內(nèi)的知識(shí)結(jié)構(gòu)、合作網(wǎng)絡(luò)等重要信息。聚類分析是一種將相似對(duì)象歸為一類的分析方法,在文獻(xiàn)信息分析中主要用于對(duì)文獻(xiàn)的自動(dòng)分類和主題識(shí)別。通過聚類分析,研究者可以將大量的文獻(xiàn)按照主題、研究方法等進(jìn)行分類,從而更好地理解和組織領(lǐng)域內(nèi)的知識(shí)。基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)利用計(jì)算機(jī)技術(shù)和人工智能算法對(duì)文獻(xiàn)進(jìn)行深度挖掘和分析。通過識(shí)別文獻(xiàn)中的隱含關(guān)系、預(yù)測(cè)未來趨勢(shì)等,基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)能夠幫助研究者發(fā)現(xiàn)新的研究問題、提出新的假設(shè)和理論。頻次排序共現(xiàn)分析聚類分析基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)文獻(xiàn)信息分析方法頻次排序方法介紹對(duì)文獻(xiàn)中關(guān)鍵詞、主題頻次統(tǒng)計(jì)排序,幫助研究者了解領(lǐng)域熱點(diǎn)。應(yīng)用價(jià)值簡(jiǎn)單直觀,為深入研究提供方向。共現(xiàn)分析方法介紹研究文獻(xiàn)中不同元素(關(guān)鍵詞、作者、機(jī)構(gòu)等)共現(xiàn)關(guān)系。應(yīng)用價(jià)值揭示知識(shí)結(jié)構(gòu)、合作網(wǎng)絡(luò),對(duì)學(xué)科交叉、研究合作有獨(dú)特優(yōu)勢(shì)。聚類分析將相似對(duì)象歸為一類,應(yīng)用于文獻(xiàn)自動(dòng)分類和主題識(shí)別。方法介紹發(fā)現(xiàn)研究群體和主題聚類,提供系統(tǒng)研究視角。應(yīng)用價(jià)值基于文獻(xiàn)的知識(shí)發(fā)現(xiàn)方法介紹利用計(jì)算機(jī)技術(shù)和人工智能算法對(duì)文獻(xiàn)深度挖掘分析。應(yīng)用價(jià)值發(fā)現(xiàn)新研究問題、提出新假設(shè)和理論,推動(dòng)科學(xué)創(chuàng)新。文獻(xiàn)信息分析步驟單擊此處添加文檔副標(biāo)題內(nèi)容03統(tǒng)計(jì)高頻指標(biāo)共現(xiàn)頻次統(tǒng)計(jì)這些高頻指標(biāo)在同一個(gè)文獻(xiàn)記錄中共同出現(xiàn)的頻次,形成共現(xiàn)矩陣。對(duì)形成的類別進(jìn)行內(nèi)容分析,以此說明該領(lǐng)域的科學(xué)研究活動(dòng)的基本狀況,如研究熱點(diǎn)、核心期刊等。內(nèi)容分析抽取相關(guān)指標(biāo)(如期刊、作者、引文等)進(jìn)行頻次統(tǒng)計(jì)。抽取相關(guān)指標(biāo)確定研究主題的范圍,檢索相關(guān)文獻(xiàn)的記錄,下載相關(guān)文獻(xiàn)記錄。確定研究主題的范圍統(tǒng)計(jì)指標(biāo)排序?qū)⒔y(tǒng)計(jì)指標(biāo)按照出現(xiàn)頻次由高到低排列,截取其中高于某個(gè)閾值的部分,作為進(jìn)一步分析的樣本。利用統(tǒng)計(jì)分析軟件,根據(jù)共現(xiàn)矩陣,采用聚類分析、引文分析、社會(huì)網(wǎng)絡(luò)分析等方法對(duì)相關(guān)指標(biāo)進(jìn)行分類。分類分析文獻(xiàn)信息分析的基本步驟檢索相關(guān)文獻(xiàn)記錄,下載文獻(xiàn)記錄。檢索相關(guān)文獻(xiàn)01抽取期刊、作者、引文等指標(biāo)進(jìn)行頻次統(tǒng)計(jì)。抽取相關(guān)指標(biāo)02確定研究主題范圍截取高于閾值的高頻主題詞、期刊、作者等作為樣本。統(tǒng)計(jì)高頻指標(biāo)在文獻(xiàn)記錄中共同出現(xiàn)頻次,形成共現(xiàn)矩陣。高頻指標(biāo)選取共現(xiàn)頻次統(tǒng)計(jì)共現(xiàn)矩陣形成分類分析利用統(tǒng)計(jì)分析軟件,采用聚類分析等方法對(duì)指標(biāo)分類。內(nèi)容分析對(duì)類別進(jìn)行內(nèi)容分析,說明科學(xué)研究活動(dòng)基本狀況。分類與內(nèi)容分析活動(dòng)與訓(xùn)練活動(dòng)與訓(xùn)練文獻(xiàn)信息檢索實(shí)用教程·第4版成都航空職業(yè)技術(shù)學(xué)院模塊七文獻(xiàn)信息分析工具單元二MATLAB軟件MATLAB概述1MATLAB工具箱可視化分析應(yīng)用案例3MATLAB語(yǔ)法介紹2目錄MATLAB概述MATLAB發(fā)展歷程MATLAB特點(diǎn)及主要功能MATLAB界面PART01MATLAB發(fā)展歷程20世紀(jì)70年代,美國(guó)新墨西哥大學(xué)計(jì)算機(jī)科學(xué)系主任CleveMoler用FORTRAN語(yǔ)言編寫了最早的MATLAB。1984年Little、Moler、SteveBangert合作成立了MathWorks公司,向市場(chǎng)發(fā)布MATLAB第一個(gè)商業(yè)版本1.0版;2004年,推出了歷史性的MATLAB7.0版;2006年以后每年推出當(dāng)年更新的a版本和b版本。

在MATLAB命令行窗口輸入:ver,即可查看當(dāng)前軟件和工具箱的版本信息。強(qiáng)大計(jì)算能力:提供線性代數(shù)、微分方程、統(tǒng)計(jì)分析等多種計(jì)算工具,滿足復(fù)雜數(shù)學(xué)運(yùn)算需求,是科研和工程計(jì)算的得力助手。完備圖示能力:支持繪制二維、三維圖形,支持點(diǎn)、線、面、立體和動(dòng)畫的可視化。豐富的工具箱:涵蓋優(yōu)化、統(tǒng)計(jì)、信號(hào)、圖像、財(cái)政等多領(lǐng)域,不斷迭代更新,助力專業(yè)問題解決,提升工作效率。MATLAB特點(diǎn)及主要功能有主頁(yè)、繪圖和APP模塊組成。工具欄MATLAB工作的主要載體。命令行窗口顯示內(nèi)存中的變量名和變量類型等信息。工作區(qū)顯示當(dāng)前文件夾下的文件名、文件類型、最后修改時(shí)間等信息。當(dāng)前文件夾MATLAB界面歷史命令記錄記錄MATLAB每次開啟的時(shí)間和執(zhí)行的所有命令行。MATLAB界面MATLAB語(yǔ)法介紹常見命令運(yùn)算符變量M文件矩陣函數(shù)PART02常見命令clear:清除內(nèi)存。clearall:清除所有內(nèi)存。clear+變量名:清除指定變量名的內(nèi)存。clc:清除屏幕,但不清除內(nèi)存。%:注釋符號(hào),注釋代碼的含義,注釋里可以寫中文?!涸诿钚写翱谇脫翩I盤↑↓,可以回看命令行。語(yǔ)句后有分號(hào),表示不顯示這行語(yǔ)句的執(zhí)行結(jié)果。點(diǎn)擊主頁(yè)工具欄的幫助按鈕“?”,或者在命令行窗口輸入:help,都可以打開幫助瀏覽器。變量MATLAB運(yùn)行代碼的最基本單位是變量,變量可通過賦值或聲明的形式被系統(tǒng)識(shí)別。變量命名規(guī)則(1)區(qū)分大小寫,如Apple與apple表示兩個(gè)不同的變量。(2)變量名可以包含英文字母、下劃線和數(shù)字,變量名的首字符必須是英文。(3)變量名長(zhǎng)度限于63個(gè)字符。>>a=3%賦值變量,系統(tǒng)能識(shí)別>>symsb%未賦值變量但聲明變量為符號(hào)變量,系統(tǒng)能識(shí)別>>c-1%未賦值變量也未聲明變量,系統(tǒng)不能識(shí)別函數(shù)或變量‘c'無法識(shí)別。MATLAB利用syms創(chuàng)建符號(hào)變量,達(dá)到聲明變量的目的。變量

預(yù)定義變量:不需要賦值或符號(hào)變量聲明就可以被系統(tǒng)識(shí)別,是為特定常數(shù)保留的名稱。用戶定義的變量應(yīng)避免與系統(tǒng)預(yù)定義變量重復(fù),以免改變預(yù)定義變量的值。>>pi-1%未賦值變量也未聲明變量,但預(yù)定義變量系統(tǒng)能識(shí)別ans=2.1416eps:MATLAB定義的正的極小值2.2204e-16pi:內(nèi)建的π值inf:∞值,正無窮大NaN:不定值i或j:虛數(shù)單位變量

數(shù)據(jù)類型:MATLAB的數(shù)據(jù)類型有浮點(diǎn)、整形、字符、邏輯、日期等15種,變量定義時(shí)默認(rèn)為浮點(diǎn)型。在程序執(zhí)行過程中,數(shù)值的顯示格式也有短格式(formatshort)、長(zhǎng)格式(formatlong)、指數(shù)格式(formatshort/longe)、有理數(shù)格式(formatrat)等多種顯示格式,MATLAB數(shù)值默認(rèn)為短格式。>>pi%默認(rèn)短格式ans=3.1416>>formatlong%長(zhǎng)格式>>pians=3.141592653589793>>formatshorte%指數(shù)格式,3.1416e+00=3.1416*100>>pians=3.1416e+00矩陣MATLAB的基本單元是矩陣,矩陣運(yùn)算是MATLAB的重要優(yōu)勢(shì)。(1)直接輸入。>>a=[1,3,5,7,9]或>>a=[13579]%元素間以逗號(hào)或空格隔開矩陣的規(guī)模為n×m,即n行m列,當(dāng)矩陣的規(guī)模為1×m,也可理解為1維數(shù)組,當(dāng)矩陣的規(guī)模為2×m,也可理解為2維數(shù)組。一般地,數(shù)組創(chuàng)建方式有以下幾種:(2)x=初始值:步長(zhǎng):終止值。>>a=1:2:9a=13579%初始值為1,步長(zhǎng)為2,終止值為9(3)x=linspace(初始值,終止值,個(gè)數(shù))。>>a=linspace(1,9,5)%初始值為1,終止值為9,均分5個(gè)a=13579(4)拼接數(shù)組。>>a=[1,3,5,7,9];>>b=[a,4,2]%在數(shù)組a的基礎(chǔ)上拼接元素4,2b=1357942矩陣MATLAB的所有運(yùn)算幾乎都以矩陣的操作為基礎(chǔ),一般地,矩陣創(chuàng)建方式有以下幾種:(1)直接輸入。>>a=[1,2,3;4,5,6]%行間以分號(hào)隔開,元素間以逗號(hào)或空格隔開a=123456(2)特殊矩陣。zeros:產(chǎn)生全0矩陣(零矩陣)。ones:產(chǎn)生全1矩陣(幺矩陣)。eye:產(chǎn)生單位矩陣。rand:產(chǎn)生0~1間均勻分布的隨機(jī)矩陣。magic:其功能是生成一個(gè)n階魔方陣。>>ones(2,3)%產(chǎn)生2*3的全1矩陣ans=111111>>magic(3)%產(chǎn)生3階魔法陣,也就是9宮格。ans=816357492矩陣(3)拼接矩陣。>>a=[1,2,3];b=[4,5,6];>>c=[a,b]%矩陣a,b按列拼接c=123456>>d=[a;b]%矩陣a,b按行拼接d=123456數(shù)組或矩陣的元素提取可以是單個(gè)元素,也可以是某一行(列)。>>a=[1,2,3,4;3,4,5,6;5,6,7,8;7,8,9,0];>>a(5)%矩陣a按列排序的第5個(gè)元素ans=2>>a(1,2)%矩陣a的第1行,第2列元素ans=2>>a(1,:)%矩陣a第1行所有元素ans=1234>>a(:,1)%矩陣a第1列所有元素ans=1357運(yùn)算符算術(shù)運(yùn)算是MATLAB最基本的運(yùn)算,分為矩陣運(yùn)算和數(shù)組運(yùn)算。矩陣運(yùn)算的運(yùn)算規(guī)則遵循線性代數(shù)中矩陣的運(yùn)算要求,數(shù)組運(yùn)算則以對(duì)應(yīng)元素作運(yùn)算。矩陣運(yùn)算符數(shù)組運(yùn)算符功能++加--減*.*乘/./左除\.\右除^.^次方>>a=[1,2,3,4,5];b=[1,3,5,7,9];>>a.*b%矩陣a,b對(duì)應(yīng)位置相乘ans=16152845>>a*b%矩陣a,b按照矩陣乘法運(yùn)算,由于矩陣維度不匹配,報(bào)錯(cuò)錯(cuò)誤使用*用于矩陣乘法的維度不正確。請(qǐng)檢查并確保第一個(gè)矩陣中的列數(shù)與第二個(gè)矩陣中的行數(shù)匹配。要單獨(dú)對(duì)矩陣的每個(gè)元素進(jìn)行運(yùn)算,請(qǐng)使用TIMES(.*)執(zhí)行按元素相乘。運(yùn)算符比較變量間的大小或不等關(guān)系時(shí),使用關(guān)系運(yùn)算符,對(duì)變量進(jìn)行邏輯運(yùn)算時(shí),使用邏輯運(yùn)算符,它們的返回值為0(False)或1(True)。此外,在邏輯運(yùn)算中把輸入的不為零的數(shù)值都視為真(True)而為零的數(shù)值則視為否(False)。>>a=[1,2,3];b=[2,3,4];>>a>bans=000>>~aans=1×3logical數(shù)組

000關(guān)系運(yùn)算符

功能關(guān)系運(yùn)算符

功能<

小于>

大于<=小于等于>=大于等于==等于~=不等于邏輯運(yùn)算符

功能邏輯運(yùn)算符功能邏輯運(yùn)算符功能邏輯運(yùn)算符功能&與|或~非xor(a,b)異或運(yùn)算M文件在MATLAB中,M文件是包含MATLAB代碼的文本文件,擴(kuò)展名為.m。M文件分為兩種類型:命令文件(Script)和函數(shù)文件(Function)。在主頁(yè)工具欄點(diǎn)擊“新建腳本”按鈕,即可新建一個(gè)M文件編輯腳本。M文件命令文件沒有參數(shù)的輸入輸出,可直接在腳本窗口點(diǎn)擊“運(yùn)行”執(zhí)行腳本,也可在命令行窗口中鍵入文件名運(yùn)行腳本。在腳本編輯器中輸入命令文件內(nèi)容:clear;f=input('輸入溫度:');c=5*(f-32)/9以文件名wendu.m存盤,調(diào)用方法:在命令行窗口輸入文件名。>>wendu輸入溫度:41c=5M文件函數(shù)文件的關(guān)鍵詞是function,且這條語(yǔ)句之前不能有任何語(yǔ)句,函數(shù)文件有參數(shù)的輸入輸出,一般的格式為:function[返回參數(shù)1,返回參數(shù)2]=函數(shù)名(輸入?yún)?shù)1,輸入?yún)?shù)2)。在腳本編輯器中輸入命令文件內(nèi)容:functionc=wd(f)c=5*(f-32)/9以文件名wd.m存盤,調(diào)用方法:在命令行窗口輸入文件名,并給出參數(shù)。>>wd(41)c=5函數(shù)MATLAB中的函數(shù)可以分為兩大類:預(yù)定義函數(shù)和自定義函數(shù)。函數(shù)在調(diào)用時(shí),一般的格式為:函數(shù)名+(變量名)。預(yù)定義函數(shù)是指系統(tǒng)把常見的函數(shù)內(nèi)置于軟件,這些函數(shù)可以直接調(diào)用。常見的預(yù)定義函數(shù)有sin(x)、cos(x)、tan(x)、cot(x)、log(x)、exp(x)、sqrt(x)、abs(x)、max(x)等。>>sin(pi/2)%sin是系統(tǒng)預(yù)定義函數(shù),可以直接調(diào)用ans=1自定義函數(shù)是指用戶編寫的函數(shù),一般通過M文件函數(shù)、匿名函數(shù)和內(nèi)聯(lián)函數(shù)實(shí)現(xiàn)。>>f=@(x,y)x+y%定義一個(gè)匿名函數(shù),表達(dá)式為x+yf=包含以下值的function_handle:@(x,y)x+y>>f(2,3)ans=5>>z=inline('x+y')%定義一個(gè)內(nèi)聯(lián)函數(shù),表達(dá)式為x+yz=內(nèi)聯(lián)函數(shù):z(x,y)=x+y>>z(2,3)ans=5MATLAB工具箱可視化分析應(yīng)用案例活動(dòng)描述活動(dòng)分析活動(dòng)演練PART03活動(dòng)反思活動(dòng)描述某生化系學(xué)生為研究嘌呤霉素在某項(xiàng)酶促反應(yīng)中反應(yīng)速度與底物濃度之間的關(guān)系,設(shè)計(jì)了一個(gè)實(shí)驗(yàn),所得的實(shí)驗(yàn)數(shù)據(jù)見表。已知底物濃度與反應(yīng)速度之間可能滿足以下式子:

(有理函數(shù))或(指數(shù)函數(shù))根據(jù)問題的背景和數(shù)據(jù)確立一個(gè)合適的數(shù)學(xué)模型,來反映這項(xiàng)酶促反應(yīng)的速度與底物濃度之間的關(guān)系。底物濃度x(ms)0.020.020.060.060.110.110.220.220.560.561.11.1反應(yīng)速度y(ppm)764797107123139159152191201207200底物濃度-反應(yīng)速度活動(dòng)分析本題的函數(shù)關(guān)系是已知的,只需要找到函數(shù)的系數(shù)即可,這是一個(gè)曲線擬合問題。曲線擬合是一種把現(xiàn)有數(shù)據(jù)透過數(shù)學(xué)方法來代入一個(gè)函數(shù)(曲線)的表示方式??茖W(xué)和工程問題可以通過諸如采樣、實(shí)驗(yàn)等方法獲得若干離散的數(shù)據(jù),根據(jù)這些數(shù)據(jù),構(gòu)造一個(gè)連續(xù)的函數(shù)(曲線)與已知數(shù)據(jù)相吻合,這過程就叫做擬合(fitting),主要使用最小二乘法原理。曲線擬合問題可以使用MATLAB曲線擬合器解決。第一步:在MATLAB命令行窗口輸入底物濃度x和反應(yīng)速度y;第二步:在MATLAB曲線擬合器中分別用有理函數(shù)和指數(shù)函數(shù)擬合問題,得到擬合參數(shù);第三步:比較兩個(gè)擬合函數(shù)的擬合參數(shù),找出最優(yōu)函數(shù)?;顒?dòng)演練有理函數(shù)擬合過程:在主窗口點(diǎn)擊曲線擬合器,在曲線擬合器中點(diǎn)擊“選擇數(shù)據(jù)”,擬合名稱中輸入“有理函數(shù)”,X數(shù)據(jù)選擇x,Y數(shù)據(jù)選擇y。再點(diǎn)擊“擬合類型”窗口中的“有理數(shù)”,分子次數(shù)和分母次數(shù)均選擇1次。數(shù)據(jù)準(zhǔn)備:在MATLAB命令行窗口輸入底物濃度x和反應(yīng)速度y。clear;x=[0.020.020.060.060.110.110.220.220.560.561.101.10];y=[764797107123139159152191201207200];活動(dòng)演練指數(shù)函數(shù)擬合過程:在曲線擬合器中依次點(diǎn)擊“新建”和“新建擬合”,在曲線擬合器中點(diǎn)擊“選擇數(shù)據(jù)”,擬合名稱中輸入“指數(shù)函數(shù)”,X數(shù)據(jù)選擇x,Y數(shù)據(jù)選擇y。再點(diǎn)擊“擬合類型”窗口中的“自定義方程”,輸入“a*(1-exp(b*x))“?;顒?dòng)演練擬合結(jié)果分析:有理函數(shù)的擬合優(yōu)度R2為0.9741,指數(shù)函數(shù)的擬合優(yōu)度R2為0.9014,有理函數(shù)擬合更好,且有理函數(shù)擬合的其他參數(shù)(SSE、RMSE和調(diào)整R2)也更好。因此,反應(yīng)速度與底物濃度之間的關(guān)系為活動(dòng)反思MATLAB曲線擬合器可以解決2維和3維的數(shù)據(jù)擬合問題,超過3維的數(shù)據(jù)擬合問題需要利用擬合工具箱函數(shù)實(shí)現(xiàn)。擬合前需明確待擬合函數(shù),擬合結(jié)果主要看R2,其值接近1越好,另外SSE和RMSE越小越好。除了曲線擬合器,MATLAB還提供了分類學(xué)習(xí)器、回歸學(xué)習(xí)器、深度網(wǎng)絡(luò)設(shè)計(jì)器等APP工具,這些工具可以極大簡(jiǎn)化數(shù)據(jù)分析與模型構(gòu)建流程。本節(jié)課到此結(jié)束成都航空職業(yè)技術(shù)學(xué)院文獻(xiàn)信息檢索實(shí)用教程·第4版成都航空職業(yè)技術(shù)學(xué)院模塊七文獻(xiàn)信息分析工具單元三SPSS軟件SPSS軟件介紹1SPSS分析方法應(yīng)用案例3SPSS基本操作2目錄SPSS軟件介紹SPSS發(fā)展歷程SPSS特點(diǎn)及主要功能SPSS界面PART01SPSS發(fā)展歷程20世紀(jì)70年代,美國(guó)斯坦福大學(xué)的三位研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent研發(fā)了SPSS,最早取名為“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”;2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”;2009年公司被IBM收購(gòu),SPSS更名為IBMSPSS,一般每年更新一個(gè)版本,于當(dāng)年的8月發(fā)布。SPSS旗下主要有4個(gè)產(chǎn)品,IBMSPSSStatistics:統(tǒng)計(jì)分析產(chǎn)品,IBMSPSSModeler:數(shù)據(jù)挖掘產(chǎn)品,IBMSPSSDataCollection:數(shù)據(jù)采集產(chǎn)品,IBMSPSSDecisionManagement:企業(yè)應(yīng)用服務(wù),人們常說的SPSS,指的是IBMSPSSStatistics。功能強(qiáng)大。SPSS全面涵蓋了數(shù)據(jù)分析的主要操作流程,提供了數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展示等數(shù)據(jù)分析操作,內(nèi)置了各種統(tǒng)計(jì)方法與模型,從簡(jiǎn)單的描述統(tǒng)計(jì)分析方法到復(fù)雜的多因素統(tǒng)計(jì)分析方法。兼容性強(qiáng)。SPSS可導(dǎo)入Txt、Excel、SAS、Stata等數(shù)據(jù)文件,可實(shí)現(xiàn)R語(yǔ)言、Python語(yǔ)言的互聯(lián)互通,調(diào)用最新統(tǒng)計(jì)方法,增加SPSS的擴(kuò)展性。圖形并茂。SPSS制圖功能強(qiáng)大,操作簡(jiǎn)便,圖形美觀,圖形可再編輯,也可多種格式保存,能滿足大多數(shù)應(yīng)用要求。SPSS特點(diǎn)及主要功能簡(jiǎn)單易學(xué)。SPSS軟件大多數(shù)操作可通過菜單和對(duì)話框來完成,無需學(xué)習(xí)繁雜的語(yǔ)法,也不需要通曉統(tǒng)計(jì)分析的具體算法,操作便捷,界面友好,輕松易懂。SPSS界面界面總體上有三大功能區(qū):數(shù)據(jù)編輯窗口,語(yǔ)法編輯窗口,結(jié)果查看窗口。SPSS界面數(shù)據(jù)編輯窗口:?jiǎn)?dòng)SPSS后看到的第一個(gè)窗口便是數(shù)據(jù)編輯窗口。數(shù)據(jù)編輯窗口是SPSS的基本界面,可以進(jìn)行數(shù)據(jù)的錄入、編輯和分析。主要由以下幾部分構(gòu)成:標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、觀測(cè)序號(hào)、窗口切換標(biāo)簽、狀態(tài)欄。語(yǔ)法編輯窗口:依次點(diǎn)擊數(shù)據(jù)編輯窗口中的“文件”→“新建”→“語(yǔ)法”,打開語(yǔ)法編輯窗口。按照SPSS軟件的語(yǔ)法規(guī)則編寫命令程序,以.sps為文件擴(kuò)展名保存。結(jié)果查看窗口:SPSS的大多數(shù)統(tǒng)計(jì)分析結(jié)果以表和圖的形式在結(jié)果查看窗口中顯示。窗口左邊是導(dǎo)航窗口,用來顯示輸出結(jié)果的目錄,可以通過單擊目錄來展開右邊窗口中的統(tǒng)計(jì)分析結(jié)果。窗口右邊顯示統(tǒng)計(jì)分析結(jié)果,可以復(fù)制或者導(dǎo)出,輸出結(jié)果可以.spo為文件擴(kuò)展名保存。SPSS基本操作數(shù)據(jù)錄入數(shù)據(jù)編輯數(shù)據(jù)分析PART02數(shù)據(jù)錄入SPSS數(shù)據(jù)錄入是以變量定個(gè)案,在錄入數(shù)據(jù)時(shí),需要明確變量名和變量類型。一般地,SPSS數(shù)據(jù)錄入有兩種方式:文件錄入和直接錄入。文件錄入:SPSS軟件可讀取的數(shù)據(jù)格式有sav、excel、sas、txt等等,常用的是sav和excel格式,點(diǎn)擊“文件”→“打開”→“數(shù)據(jù)”,選擇文件路徑即可。數(shù)據(jù)錄入直接錄入:在數(shù)據(jù)編輯窗口的變量視圖下定義變量名、變量類型、變量標(biāo)簽等變量信息,定義一個(gè)變量至少要定義它的兩個(gè)屬性,即變量名和變量類型,其他屬性可以暫時(shí)采用系統(tǒng)默認(rèn)值。變量名必須以字母、漢字或字符@開頭,其后可以是任何字母、數(shù)字或!、?、#、$等符號(hào),變量名不區(qū)分大小寫也不能含有空格,也不能與SPSS保留字相同,例如變量不能命名為all、and、not、or等。確定變量后在數(shù)據(jù)視圖下錄入個(gè)案信息。數(shù)據(jù)編輯數(shù)據(jù)編輯主要通過菜單欄中的“數(shù)據(jù)”和“轉(zhuǎn)換”進(jìn)行編輯加工,可以做文件級(jí)別的數(shù)據(jù)管理和變量級(jí)別的數(shù)據(jù)管理。常用的有個(gè)案排序、變量排序、選擇個(gè)案、加權(quán)個(gè)案、計(jì)算變量、重新編碼等操作。數(shù)據(jù)分析數(shù)據(jù)分析主要通過菜單欄中的“分析”實(shí)現(xiàn)。在數(shù)據(jù)分析前,需要明確數(shù)據(jù)的類型,是計(jì)量數(shù)據(jù)還是計(jì)數(shù)數(shù)據(jù)。計(jì)量數(shù)據(jù)一般是連續(xù)的,是計(jì)量器具經(jīng)檢測(cè)而出具的數(shù)據(jù),比如身高、體重等;計(jì)數(shù)數(shù)據(jù)一般是離散的,是觀察單位按其性質(zhì)或類別分組,然后清點(diǎn)各組觀察單位個(gè)數(shù)所得的數(shù)據(jù),比如性別、水果等級(jí)等。計(jì)量數(shù)據(jù)與計(jì)數(shù)數(shù)據(jù)選擇的統(tǒng)計(jì)分析方法完全不同。

常用的統(tǒng)計(jì)分析方法有正態(tài)性檢驗(yàn)、配對(duì)樣本T檢驗(yàn)、獨(dú)立樣本T檢驗(yàn)、卡方檢驗(yàn)、秩和檢驗(yàn)、方差分析、回歸分析、相關(guān)性分析、時(shí)間序列分析、聚類分析、主成分分析、因子分析等數(shù)據(jù)分析方法等等。SPSS分析方法應(yīng)用案例活動(dòng)描述活動(dòng)分析活動(dòng)演練PART03活動(dòng)反思活動(dòng)描述為研究孿生兄弟的出生體重與出生順序的關(guān)系,收集了15對(duì)孿生兄弟的出生體重?cái)?shù)據(jù),見下表,利用SPSS軟件做兩配對(duì)樣本T檢驗(yàn),以檢驗(yàn)出生體重與出生順序是否有顯著性差異。編號(hào)123456789101112131415先出生者體重(kg)2.793.062.343.413.483.232.272.483.033.073.612.693.092.982.65后出生者體重(kg)2.692.892.243.373.52.932.242.552.823.053.582.663.22.922.615對(duì)孿生兄弟的體重?cái)?shù)據(jù)表活動(dòng)分析在生活中,常常需要比較成對(duì)的樣本,比如用藥前用藥后的比較,兩種不同藥物治療效果的比較,兩種種子產(chǎn)量的比較等。配對(duì)樣本T檢驗(yàn):適用于檢驗(yàn)兩個(gè)配對(duì)樣本的均值是否存在顯著性差異。其檢驗(yàn)思路為兩個(gè)配對(duì)樣本做差值,轉(zhuǎn)化為單樣本,再檢驗(yàn)差值序列的總體均值是否與0有顯著性差異,假設(shè)檢驗(yàn)的原假設(shè)是沒有顯著性差異。另外,在配對(duì)樣本T檢驗(yàn)之前必須要求差值序列通過正態(tài)性檢驗(yàn)?;顒?dòng)演練數(shù)據(jù)準(zhǔn)備:在SPSS變量視圖中定義兩個(gè)變量:先出生和后出生,在數(shù)據(jù)視圖中錄入相應(yīng)的數(shù)據(jù)。計(jì)算差值序列:點(diǎn)擊“轉(zhuǎn)換”→“計(jì)算變量”,在目標(biāo)變量下輸入“差值”,在數(shù)字表達(dá)式中點(diǎn)擊輸入“先出生-后出生”,計(jì)算前出生者體重減去后生者體重得到差值序列?;顒?dòng)演練正態(tài)性檢驗(yàn):點(diǎn)擊“分析”→“描述統(tǒng)計(jì)”→“探索”,把差值選入因變量列表,點(diǎn)擊“繪制”,勾選“帶檢驗(yàn)的正態(tài)圖”對(duì)差值做正態(tài)性檢驗(yàn),可以看到Kolmogorov-Smirnov檢驗(yàn)和Shapiro-Wilk檢驗(yàn),一般大樣本看Kolmogorov-Smirnov檢驗(yàn),小樣本看Shapiro-Wilk檢驗(yàn),本題的Shapiro-Wilk檢驗(yàn)p值為0.433>0.05,差值通過了正態(tài)性檢驗(yàn)。活動(dòng)演練配對(duì)樣本T檢驗(yàn):點(diǎn)擊“分析”→“比較均值”→“配對(duì)樣本T檢驗(yàn)”,將“先出生者體重”和“后出生者體重”選入右側(cè)“成對(duì)變量”列表框,單擊“選項(xiàng)”對(duì)話框,置信區(qū)間一般設(shè)為95%?;氐健芭鋵?duì)樣本T檢驗(yàn)”對(duì)話框,點(diǎn)擊確定,執(zhí)行?;顒?dòng)演練結(jié)果解讀:成對(duì)樣本相關(guān)系數(shù)中相關(guān)系數(shù)為0.967,p值為0.000<0.05,故認(rèn)為先出生者體重和后出生者體重存在明顯的線性關(guān)系。成對(duì)樣本檢驗(yàn)中先出生者體重-后出生者體重均值為0.06267kg,雙尾檢驗(yàn)p值0.035<0.05,故拒絕原假設(shè),認(rèn)為孿生兄弟的出生體重與出生先后順序有顯著性差異,先出生者體重比后出生者體重更高?;顒?dòng)反思配對(duì)樣本T檢驗(yàn)適用于2組配對(duì)數(shù)據(jù)的差異性比較,使用前要求差值序列通過正態(tài)分布檢驗(yàn)。若差值序列未通過正態(tài)分布檢驗(yàn),應(yīng)采用兩相關(guān)樣本的秩和檢驗(yàn)。若2組獨(dú)立樣本做差異性比較,應(yīng)采用獨(dú)立樣本T檢驗(yàn)。除了配對(duì)樣本T檢驗(yàn),SPSS還有獨(dú)立樣本T檢驗(yàn)、方差分析、回歸分析、因子分析、聚類分析等,適用于多樣本差異、變量關(guān)聯(lián)、數(shù)據(jù)降維與分類等數(shù)據(jù)分析。本節(jié)課到此結(jié)束成都航空職業(yè)技術(shù)學(xué)院2025.5主講教師:陳萍秀模塊七

文獻(xiàn)信息分析工具單元四

常用文獻(xiàn)信息分析工具常用文獻(xiàn)信息分析軟件單擊此處添加文檔副標(biāo)題內(nèi)容01CONTENTS常用文獻(xiàn)分析軟件1常用分析工具總結(jié)3文獻(xiàn)分析工具應(yīng)用案例2SPSS,SAS,Excel等。基于統(tǒng)計(jì)的分析工具HistCite,CiteSpace,Bibexcel,Inspire,ColPalRed,SATI,Leydesdorff系列軟件,Bicomb,SCI2,NetworkWorkbenchTool,Vantage-point,Vosviewer,Citnetexplorer,Refviz,SciMAT等。基于文獻(xiàn)計(jì)量的分析工具Pajek,Ucinet等。基于社會(huì)網(wǎng)絡(luò)的分析工具GOpubmed,PubMedplus,本地PubMed,PubMedFocus等?;赑ubmed的分析工具常用文獻(xiàn)信息分析軟件01SPSS功能強(qiáng)大,適用于數(shù)據(jù)準(zhǔn)備、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘等。02數(shù)據(jù)處理和分析能力強(qiáng),廣泛應(yīng)用于各行業(yè)。SAS基于統(tǒng)計(jì)的分析工具HistCite引文編年可視化軟件,能快速定位重要文獻(xiàn)和明星科學(xué)家。CiteSpace開源知識(shí)圖譜軟件,可視化展現(xiàn)文獻(xiàn)關(guān)系,幫助梳理研究軌跡。基于文獻(xiàn)計(jì)量的分析工具Pajek用于社會(huì)網(wǎng)絡(luò)分析。Ucinet用于社會(huì)網(wǎng)絡(luò)分析。0102基于社會(huì)網(wǎng)絡(luò)的分析工具GOPubMed用于PubMed數(shù)據(jù)分析。PubFocus用于PubMed數(shù)據(jù)分析?;赑ubMed的分析工具文獻(xiàn)分析工具應(yīng)用案例單擊此處添加文檔副標(biāo)題內(nèi)容02CiteSpace是一款優(yōu)秀的文獻(xiàn)計(jì)量學(xué)軟件,通過科學(xué)知識(shí)圖譜的方式可視化展現(xiàn)文獻(xiàn)關(guān)系,幫助梳理研究軌跡并預(yù)見未來研究前景。CiteSpace簡(jiǎn)介01高效處理:CiteSpace軟件可直接處理原始數(shù)據(jù),無須轉(zhuǎn)化為矩陣格式,支持WOS等數(shù)據(jù)庫(kù)數(shù)據(jù)直接導(dǎo)入。映射分析:軟件將研究領(lǐng)域視為研究前沿與知識(shí)基礎(chǔ)的映射,通過突變探測(cè)、中介中心性和異質(zhì)網(wǎng)絡(luò)揭示研究趨勢(shì)和關(guān)鍵點(diǎn)。多角度展示:同一數(shù)據(jù)樣本可生成多種圖譜,多角度呈現(xiàn)數(shù)據(jù)演變。時(shí)間脈絡(luò)清晰:節(jié)點(diǎn)和連線的顏色編碼展示文獻(xiàn)數(shù)據(jù)的時(shí)間變化。引證情況可視化:節(jié)點(diǎn)的彩色年輪表示法直觀展示不同時(shí)間段的引證情況。連線共引頻次標(biāo)識(shí):連線顏色代表共引頻次達(dá)到閾值的時(shí)間。CiteSpace基本特點(diǎn)02優(yōu)點(diǎn):簡(jiǎn)單易用,具有很好的普適性。缺點(diǎn):沒有數(shù)據(jù)清洗功能;讀圖問題;生成圖的主觀性。CiteSpace優(yōu)缺點(diǎn)03通過引文網(wǎng)絡(luò)分析,找出學(xué)科領(lǐng)域演進(jìn)的關(guān)鍵路徑。找出學(xué)科領(lǐng)域演進(jìn)的關(guān)鍵點(diǎn)文獻(xiàn)(知識(shí)拐點(diǎn))。分析學(xué)科演進(jìn)的潛在動(dòng)力機(jī)制。分析學(xué)科熱點(diǎn)和前沿。CiteSpace基本功能04CiteSpace概述通過共被引網(wǎng)絡(luò)分析,獲取研究主題的知識(shí)基礎(chǔ)。知識(shí)基礎(chǔ)獲取01使用關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),展示數(shù)據(jù)全集的學(xué)科結(jié)構(gòu)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論