中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)課件_第1頁(yè)
中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)課件_第2頁(yè)
中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)課件_第3頁(yè)
中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)課件_第4頁(yè)
中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩157頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

黃艷娟Huangyanjuan@中文數(shù)據(jù)庫(kù)檢索——

信息檢索技術(shù)與過(guò)程黃艷娟中文數(shù)據(jù)庫(kù)檢索——

信息檢索信息檢索技術(shù)與策略CNKI檢索維普檢索萬(wàn)方檢索信息檢索技術(shù)與策略CNKI檢索維普檢索萬(wàn)方檢索CNKI檢索CNKI資源總體介紹1數(shù)據(jù)庫(kù)檢索與使用方法2CNKI檢索CNKI資源總體介CNKI資源總體介紹1我校購(gòu)買的資源包括:CNKI資源總體介紹1我校購(gòu)買的資源包括:CNKI資源總體介紹1該庫(kù)收錄1915年至今國(guó)內(nèi)出版的近7000種學(xué)術(shù)期刊,其中核心期刊、重要評(píng)價(jià)性數(shù)據(jù)庫(kù)來(lái)源期刊近2600種。內(nèi)容覆蓋自然科學(xué)、工程技術(shù)、農(nóng)業(yè)、哲學(xué)、醫(yī)學(xué)、人文社會(huì)科學(xué)等各個(gè)領(lǐng)域,全文文獻(xiàn)總量2200多萬(wàn)篇。該庫(kù)收錄1999年至今全國(guó)420家博士培養(yǎng)單位的博士學(xué)位論文。累積出版博士學(xué)位論文全文文獻(xiàn)6萬(wàn)多篇。該庫(kù)收錄1999年至今全國(guó)652家碩士培養(yǎng)單位的優(yōu)秀碩士學(xué)位論文。累積出版碩士學(xué)位論文全文文獻(xiàn)44萬(wàn)多篇。收錄2000年以來(lái)國(guó)家二級(jí)以上學(xué)會(huì)、協(xié)會(huì)、高等院校、科研院所、學(xué)術(shù)機(jī)構(gòu)等單位的論文集,年更新約10萬(wàn)篇論文。累積出版會(huì)議論文全文文獻(xiàn)73萬(wàn)篇。CNKI資源總體介紹1該庫(kù)收錄1915年至今國(guó)內(nèi)出版的近70CNKI數(shù)據(jù)庫(kù)登錄CNKI使用指南數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄CNKI數(shù)據(jù)庫(kù)登錄需要注意的是:偶爾會(huì)提示輸入用戶名和密碼。請(qǐng)記?。河脩裘篋X0437密碼:hrbgc需要注意的是:偶爾會(huì)提示輸入用戶名和密碼。請(qǐng)記?。篊NKI數(shù)據(jù)庫(kù)登錄CNKI使用指南數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄數(shù)據(jù)庫(kù)檢索與使用方法2CNKI使用指南:CNKI使用指南:認(rèn)識(shí)CNKI檢索平臺(tái)利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)認(rèn)識(shí)CNKI檢索平臺(tái)認(rèn)識(shí)

檢索平臺(tái)A通用菜單在各個(gè)總庫(kù)平臺(tái)首頁(yè)和檢索結(jié)果頁(yè)都提供了通用菜單B統(tǒng)一檢索平臺(tái)可進(jìn)行跨庫(kù)檢索C總庫(kù)文獻(xiàn)出版報(bào)表D文獻(xiàn)資源統(tǒng)一導(dǎo)航認(rèn)識(shí)

檢索平臺(tái)A通用菜單B統(tǒng)一檢索平臺(tái)C總庫(kù)文獻(xiàn)D文利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)CNKI的檢索方式:跨庫(kù)檢索還是進(jìn)入單庫(kù)檢索?利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)CNKI的檢索方式如何選擇,這就需要分析檢索人的需求跨庫(kù):可以同時(shí)檢索多個(gè)子庫(kù),獲取更多更全面的結(jié)果,而且省時(shí)省力單庫(kù):一次只檢索一個(gè)類型的文獻(xiàn),避免結(jié)果過(guò)多造成的困擾檢索人的需求是什么?是為了獲取關(guān)于某一內(nèi)容的系統(tǒng)的全面的信息,還是只是想搜索特定類型的文獻(xiàn)信息?如何選擇,這就需要分析檢索人的需求跨庫(kù):可以同時(shí)檢索多個(gè)子庫(kù)跨庫(kù)檢索跨庫(kù)檢索檢索字段檢索詞機(jī)械手布爾邏輯算符自由度檢索字段檢索詞機(jī)械手布爾邏輯算符自由度檢索結(jié)果檢索結(jié)果檢索字段——信息檢索途徑檢索途徑是用戶根據(jù)需要,以文獻(xiàn)信息的外部特征和內(nèi)容特征來(lái)確定的檢索入口。根據(jù)信息的外部特征:

題名途徑、著者途徑、序號(hào)途徑根據(jù)信息的內(nèi)容特征:

分類途徑、主題途徑檢索字段——信息檢索途徑檢索途徑是用戶根據(jù)需要,以文獻(xiàn)信息的

信息檢索途徑(檢索字段)責(zé)任者途徑題名途徑分類途徑主題途徑序號(hào)途徑引文途徑信息檢索途徑(檢索字段)責(zé)任者途徑信息檢索途徑1題名(題目、標(biāo)題等)途徑2責(zé)任者(作者、編者等)途徑3序號(hào)(ISBN號(hào)等)途徑4分類途徑5主題途徑(主題詞)6關(guān)鍵詞途徑ISBN是國(guó)際標(biāo)準(zhǔn)書號(hào)(InternationalStandardBookNumber)的簡(jiǎn)稱,是國(guó)際通用的圖書或獨(dú)立的出版物(除定期出版的期刊)代碼。出版社可以通過(guò)國(guó)際標(biāo)準(zhǔn)書號(hào)清晰的辨認(rèn)所有非期刊書籍。一個(gè)國(guó)際標(biāo)準(zhǔn)書號(hào)只有一個(gè)或一份相應(yīng)的出版物與之對(duì)應(yīng)。

ISSN(國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào),InternationalStandardSerialNumber)是根據(jù)國(guó)際標(biāo)準(zhǔn)ISO3297制定的連續(xù)出版物國(guó)際標(biāo)準(zhǔn)編碼,其目的是使世界上每一種不同題名、不同版本的連續(xù)出版物都有一個(gè)國(guó)際性的唯一代碼標(biāo)識(shí)。

信息檢索途徑1題名(題目、標(biāo)題等)途徑2責(zé)任者(作者、編

信息檢索技術(shù)布爾邏輯檢索位置算符檢索截詞檢索與詞根檢索精確檢索與模糊檢索信息檢索技術(shù)布爾邏輯檢索布爾邏輯檢索——最常用的信息檢索技術(shù)布爾邏輯檢索(Booleanlogical)就是利用布爾邏輯算符進(jìn)行檢索項(xiàng)的邏輯組配,用以表達(dá)檢索者的提問(wèn)概念。

布爾邏輯(臺(tái)灣譯布林邏輯)得名于喬治·布爾,他是愛爾蘭科克的皇后學(xué)院的英國(guó)數(shù)學(xué)家,他在十九世紀(jì)中葉首次定義了邏輯的代數(shù)系統(tǒng)?,F(xiàn)在,布爾邏輯在電子學(xué)、計(jì)算機(jī)硬件和軟件中有很多應(yīng)用。使用集合代數(shù)作為介紹布爾邏輯的一種方式。還使用文氏圖來(lái)展示各種布爾邏輯陳述所描述的集合聯(lián)系。布爾邏輯檢索——最常用的信息檢索技術(shù)布爾邏輯檢索(Boole布爾邏輯檢索邏輯“與”邏輯“或”

邏輯“非”邏輯“與”:用“AND”或“*”表示。用于連接概念交叉和限定關(guān)系的檢索詞。功能:以縮小檢索范圍,有利于提高查準(zhǔn)率。

邏輯“或”:用“OR”或“+”表示。用于連接并列關(guān)系的檢索詞,功能:以擴(kuò)大檢索范圍,防止漏檢,有利于提高查全率。邏輯“非”用“NOT”或“-”號(hào)表示,用于連接排除關(guān)系的檢索詞,功能:即排除不需要的和影響檢索結(jié)果的概念,以提高查準(zhǔn)率。布爾邏輯檢索邏輯“與”邏輯“或”邏輯“非”邏輯“邏輯與檢索式構(gòu)造舉例如:查找“胰島素治療糖尿病”的檢索式為:

insulin(胰島素)anddiabetes(糖尿?。┻壿嬇c檢索式構(gòu)造舉例如:查找“胰島素治療糖尿病”的檢索式為:邏輯或檢索式構(gòu)造舉例如:查找“腫瘤”的檢索式為:

cancer(癌)

ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)邏輯或檢索式構(gòu)造舉例如:查找“腫瘤”的檢索式為:邏輯非檢索式構(gòu)造舉例如:查找“動(dòng)物的乙肝病毒(不要人的)”的文獻(xiàn)的檢索式為:hepatitisBvirus(乙肝病毒)nothuman(人類)。邏輯非檢索式構(gòu)造舉例如:查找“動(dòng)物的乙肝病毒(不要人的)”的2位置算符檢索位置檢索也叫鄰近檢索。位置算符檢索是用一些特定的算符(位置算符)來(lái)表達(dá)檢索詞與檢索詞之間的鄰近關(guān)系。表示兩詞之間的位置鄰近關(guān)系,常用到的位置算符有(W)(nW)(N)nN)等。2位置算符檢索位置檢索也叫鄰近檢索。位置算符檢索是用一些特W算符

W算符是word或with的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,而且所連接的詞之間除了有一個(gè)空格或一個(gè)標(biāo)點(diǎn)外不得夾有其他的單詞或字母。

information2Wmanagement

可包括

Informationtechnologiesandmanagement和

Informationmanagement

W算符W算符是word或with的縮寫,表示在此算符兩側(cè)的N算符N算符是near的縮寫,表示在此算符兩側(cè)的檢索詞必須緊密相連,詞序可顛倒。nN表示兩檢索詞之間最多可以插入n個(gè)單詞,且詞序可顛倒。

informationNretrievalinformation2NretrievalN算符N算符是near的縮寫,表示在此算符兩側(cè)的檢索詞必3截詞檢索截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡滿足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。按截?cái)嗟奈恢脕?lái)分,截詞可有后截?cái)?、前截?cái)?、中截?cái)嗳N類型。不同的系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。分為有限截詞(即一個(gè)截詞符只代表一個(gè)字符)和無(wú)限截詞(一個(gè)截詞符可代表多個(gè)字符)。3截詞檢索截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)(1)后截?cái)?,前方一致。如:comput?表示computer,computers,computing等。(2)前截?cái)啵蠓揭恢?。如:?computer表示minicomputer,microcomputers等。(3)中截?cái)啵琤as?s=basisbasescolo?r包含colour(英)和color(美)(1)后截?cái)?,前方一致。如:comput?表示compute模糊檢索與精確檢索模糊檢索(fuzzysearch)是與“精準(zhǔn)檢索”相對(duì)應(yīng)的一個(gè)概念,是指搜索系統(tǒng)自動(dòng)按照用戶輸入關(guān)鍵詞的同義詞進(jìn)行模糊檢索,從而得出較多的檢索結(jié)果。同義詞由系統(tǒng)的管理界面配置。如配置了“電腦”與“computer”為同義詞后,檢索“電腦”,則包含“computer”的網(wǎng)頁(yè)也會(huì)出現(xiàn)在檢索結(jié)果中。模糊檢索也就是同義詞檢索,用戶在檢索頁(yè)面中輸入同義詞中任何一個(gè)詞檢索時(shí),只要選中“模糊檢索”復(fù)選框,則該關(guān)鍵詞的所有同義詞信息也都被檢索出來(lái)。模糊檢索與精確檢索模糊檢索(fuzzysearch)是與“精確檢索精確檢索是指檢索詞與檢索字符串完全相等。如檢索作者馬智,僅檢索出作者為馬智的文獻(xiàn),作者為“馬智勇”的就不會(huì)被檢索出來(lái)。精確檢索精確檢索是指檢索詞與檢索字符串完全相等。模糊檢索模糊檢索結(jié)果模糊模糊檢索結(jié)果精確檢索精確進(jìn)入單庫(kù)檢索請(qǐng)看檢索舉例視頻進(jìn)入單庫(kù)檢索請(qǐng)看檢索舉例視頻期刊導(dǎo)航期刊導(dǎo)航使用CAJ閱讀器和PDF閱讀器使用2022/12/939同方知網(wǎng)(北京)技術(shù)有限公司2022/12/739同方知網(wǎng)(北京)技術(shù)有限公司瀏覽器下載瀏覽器下載點(diǎn)擊文章篇名,進(jìn)入知網(wǎng)節(jié)頁(yè)面:CAJ下載的優(yōu)勢(shì):占用空間小下載速度快內(nèi)嵌專業(yè)詞典即時(shí)工具書釋義個(gè)性化編輯文獻(xiàn)文檔定位功能打開大部分PDF文檔并進(jìn)行個(gè)性化編輯……2022/12/9點(diǎn)擊文章篇名,進(jìn)入知網(wǎng)節(jié)頁(yè)面:CAJ下載的優(yōu)勢(shì):2022/1中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)2022/12/92022/12/7中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)機(jī)械手機(jī)械手以“學(xué)術(shù)趨勢(shì)”為例:2022/12/9以“學(xué)術(shù)趨勢(shì)”為例:2022/12/72022/12/92022/12/7信息檢索過(guò)程分析需求確定檢索詞選擇信息源確定檢索途徑和方法1234實(shí)施檢索獲取原始文獻(xiàn)信息檢索過(guò)程是從確立檢索需求到信息需求得到滿足的全過(guò)程。信息檢索過(guò)程分析需求選擇信息源確定檢索途徑和方法12過(guò)程一:分析需求,確定檢索詞1明確檢索目的

*需要關(guān)于某方面的系統(tǒng)詳盡的信息

*需要關(guān)于某方面的最新信息

*了解一些片段信息,解決一些具體問(wèn)題2明確課題的主題或主要內(nèi)容要形成若干個(gè)既能代表信息需求又具有檢索意義的關(guān)鍵詞(檢索詞),確定檢索詞之間的關(guān)系3

涉及的學(xué)科范圍4所需信息的數(shù)量、語(yǔ)種、年代范圍等過(guò)程一:分析需求,確定檢索詞1明確檢索目的需求分析:課題一:“赟”這個(gè)字的讀音課題二:中西關(guān)系發(fā)展綜述課題三:機(jī)械手的定義課題四:近2年氣動(dòng)機(jī)械手的新技術(shù)研究課題五:新中國(guó)60年城鎮(zhèn)化發(fā)展綜述北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式及近3年發(fā)文情況需求分析:課題一:“赟”這個(gè)字的讀音北大政府管理學(xué)院老師燕過(guò)程一:檢索詞的確定信息檢索語(yǔ)言分析課題的概念隱含概念的分析核心概念的選取選取檢索詞應(yīng)注意問(wèn)題過(guò)程一:檢索詞的確定信息檢索語(yǔ)言主題檢索語(yǔ)言常用的就是關(guān)鍵詞關(guān)鍵詞:從文獻(xiàn)的題目、正文或摘要中抽出的能表達(dá)文獻(xiàn)主題內(nèi)容的具有實(shí)質(zhì)意義的語(yǔ)詞。確定關(guān)鍵詞的步驟:

a.分析課題,提取概念

b.整理概念,擴(kuò)充同義詞匯

c.運(yùn)用分析所得詞匯試查,確定課題適用的關(guān)鍵詞主題檢索語(yǔ)言常用的就是關(guān)鍵詞主題檢索語(yǔ)言敘詞:又稱主題詞語(yǔ)言,是指從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)?!皽a(chǎn)腳踏車”“上?!薄ⅰ白孕熊嚒弊匀徽Z(yǔ)言主題詞主題檢索語(yǔ)言敘詞:又稱主題詞語(yǔ)言,是指從自然語(yǔ)言中優(yōu)選出來(lái)并

確定檢索詞分析課題的概念隱含概念的分析核心概念的選取選取檢索詞應(yīng)注意問(wèn)題確定檢索詞分析課題的概念分析課題的概念選擇所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析各概念之間的上、下、左、右關(guān)系,以便制定檢索策略。如課題“政策與行政學(xué)的關(guān)系”可選“政策”、“行政學(xué)”作為關(guān)鍵詞。分析課題的概念選擇所涉及的主要概念,并找出能代表這些概念的若隱含概念的分析有些課題的實(shí)質(zhì)性內(nèi)容很難從課題的名稱上反映出來(lái),其隱含的概念和相關(guān)內(nèi)容需從專業(yè)的角度做深入的分析,才能提煉出確切反映課題內(nèi)容的檢索概念。如“知識(shí)產(chǎn)權(quán)保護(hù)”概念中的“知識(shí)產(chǎn)權(quán)”一詞隱含著“著作權(quán)”和“版權(quán)”、“工業(yè)產(chǎn)權(quán)”等概念。隱含概念的分析有些課題的實(shí)質(zhì)性內(nèi)容很難從課題的名稱上反映出來(lái)核心概念的選取有些檢索詞概念已體現(xiàn)在所使用的數(shù)據(jù)庫(kù)中,這些概念應(yīng)予以排除。如WorldTextiles中“世界”一詞應(yīng)排除。另外有些比較泛指、檢索意義不大的檢索概念,如“發(fā)展”“現(xiàn)狀”“趨勢(shì)”等在不是專門檢索綜述類信息時(shí)也應(yīng)予以排除。核心概念的選取有些檢索詞概念已體現(xiàn)在所使用的數(shù)據(jù)庫(kù)中,這些概檢索詞選取時(shí)應(yīng)注意的幾個(gè)問(wèn)題。①檢索詞的選取應(yīng)適當(dāng),具有專指性,涵蓋主要主題概念,意義明確。一般應(yīng)優(yōu)先選擇規(guī)范化主題詞做檢索詞,但為了檢索的專指性也可選用關(guān)鍵詞配合檢索。②盡可能地考慮其相關(guān)的同義詞、近義詞作為檢索詞,以保證查全率。如同一概念的幾種表達(dá)方式,同一名詞的單、復(fù)數(shù),動(dòng)名詞、過(guò)去分詞形式,上位概念詞與下位概念詞,化學(xué)物質(zhì)的名稱、元素符號(hào),植物和動(dòng)物名的英文、拉丁名等。檢索詞選取時(shí)應(yīng)注意的幾個(gè)問(wèn)題。①檢索詞的選取應(yīng)適當(dāng),具有專指過(guò)程二:選擇信息源明確了信息需求之后,信息源的選擇尤為重要,它直接影響著檢索的效率。工欲善其事,必先“選”其器,信息源選擇得當(dāng),就會(huì)給人以愉悅的搜索體驗(yàn),能夠收到事半功倍的效果。

過(guò)程二:選擇信息源明確了信息需求之后,信息源的選擇尤為重要,一北京大學(xué)政府管理學(xué)院碩士招生信息二該院導(dǎo)師三某一導(dǎo)師的姓名、聯(lián)系方式四該導(dǎo)師的發(fā)文情況,近3年第一項(xiàng)可以選擇搜索引擎查找二三項(xiàng)可以進(jìn)入北大政府學(xué)院網(wǎng)站查找第四項(xiàng)需要使用CNKI等數(shù)據(jù)庫(kù)一北京大學(xué)政府管理學(xué)院碩士招生信息第一項(xiàng)可以選擇搜索引擎查過(guò)程三:選擇檢索途徑和方法檢索途徑信息檢索技術(shù)檢索式的構(gòu)造與調(diào)整過(guò)程三:選擇檢索途徑和方法檢索途徑

信息檢索途徑(檢索字段)責(zé)任者途徑題名途徑分類途徑主題途徑序號(hào)途徑引文途徑信息檢索途徑(檢索字段)責(zé)任者途徑檢索式的構(gòu)造與調(diào)整檢索式:是檢索策略的邏輯表達(dá)式,是用來(lái)表達(dá)用戶檢索提問(wèn)的,由基于檢索概念產(chǎn)生的檢索詞和各種組配算符構(gòu)成。

(篇名=聚氯乙烯orPVC)and年代=2005-2009檢索式的構(gòu)造與調(diào)整檢索式:是檢索策略的邏輯表達(dá)式,是用來(lái)表達(dá)過(guò)程四:實(shí)施檢索獲取原始文獻(xiàn)

問(wèn)題:北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式及近3年發(fā)文情況可分為2個(gè)問(wèn)題:A北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式B北大政府管理學(xué)院燕繼榮近3年發(fā)文情況過(guò)程四:實(shí)施檢索獲取原始文獻(xiàn)

問(wèn)題:北大政府管理學(xué)院老師燕繼A北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式利用搜索引擎找到北大政府管理學(xué)院網(wǎng)頁(yè)瀏覽找到燕繼榮的聯(lián)系方式A北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式利用搜索引擎找到北大政北大政府管理學(xué)院燕繼榮近3年發(fā)文情況檢索式:作者=燕繼榮AND單位=北京大學(xué)政府管理學(xué)院AND(時(shí)間=2007-2009)北大政府管理學(xué)院燕繼榮近3年發(fā)文情況檢索式:中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)檢索結(jié)果的評(píng)價(jià)查全率:從數(shù)據(jù)庫(kù)中檢出的相關(guān)文獻(xiàn)量與數(shù)據(jù)庫(kù)中總文獻(xiàn)量的比率。查準(zhǔn)率:指數(shù)據(jù)庫(kù)中檢出的相關(guān)文獻(xiàn)量與檢出的文獻(xiàn)總量的比率。檢索結(jié)果的評(píng)價(jià)查全率:從數(shù)據(jù)庫(kù)中檢出的相關(guān)文獻(xiàn)量與數(shù)據(jù)庫(kù)中總查全率=a/a+c×100%查準(zhǔn)率=a/a+b×1000%查全率=檢出的相關(guān)文獻(xiàn)數(shù)系統(tǒng)中的相關(guān)文獻(xiàn)總數(shù)查準(zhǔn)率=檢出的相關(guān)文獻(xiàn)數(shù)檢出的文獻(xiàn)總數(shù)查全率=a/a+c×100%查全率=檢出的相關(guān)文獻(xiàn)數(shù)系統(tǒng)中的例題:如CNKI數(shù)據(jù)庫(kù)中共有“企業(yè)管理”方面的相關(guān)文獻(xiàn)280篇,而小李同學(xué)在CNKI數(shù)據(jù)庫(kù)中只檢索出160篇,而且其檢索出的結(jié)果中還有28篇是不相關(guān)的,那么小李這次檢索的查全率和查準(zhǔn)率各是多少?例題:如CNKI數(shù)據(jù)庫(kù)中共有“企業(yè)管理”KEY查全率47.1%查準(zhǔn)率82.5%KEY查全率47.1%超星電子圖書數(shù)據(jù)庫(kù)中的圖書可以下載嗎?答案:是超星電子圖書數(shù)據(jù)庫(kù)中的圖書可以下載嗎?方正電子圖書在線瀏覽的時(shí)間是15分鐘嗎?

答案:否是20分鐘方正電子圖書在線瀏覽的時(shí)間是15分鐘嗎?三個(gè)中文電子圖書數(shù)據(jù)庫(kù)包括超星、金圖和方正嗎?答案:否超星、方正和書生之家三個(gè)中文電子圖書數(shù)據(jù)庫(kù)包括超星、金圖和方正嗎?三個(gè)中文電子圖書數(shù)據(jù)庫(kù)中閱讀效果最清晰的是書生之家嗎?答案:是三個(gè)中文電子圖書數(shù)據(jù)庫(kù)中閱讀效果最清晰的是書生之家嗎?三個(gè)中文電子圖書數(shù)據(jù)庫(kù)的閱讀需要專門的閱讀器嗎?是三個(gè)中文電子圖書數(shù)據(jù)庫(kù)的閱讀需要專門的閱讀器嗎?超星電子圖書下載之后可以換機(jī)器閱讀嗎?是超星電子圖書下載之后可以換機(jī)器閱讀嗎?超星圖書安裝了閱讀器就一定能正常閱讀嗎?否超星圖書安裝了閱讀器就一定能正常閱讀嗎?超星電子圖書在不打開閱讀器的情況下也可以下載否超星電子圖書在不打開閱讀器的情況下也可以下載黃艷娟Huangyanjuan@中文數(shù)據(jù)庫(kù)檢索——

信息檢索技術(shù)與過(guò)程黃艷娟中文數(shù)據(jù)庫(kù)檢索——

信息檢索信息檢索技術(shù)與策略CNKI檢索維普檢索萬(wàn)方檢索信息檢索技術(shù)與策略CNKI檢索維普檢索萬(wàn)方檢索CNKI檢索CNKI資源總體介紹1數(shù)據(jù)庫(kù)檢索與使用方法2CNKI檢索CNKI資源總體介CNKI資源總體介紹1我校購(gòu)買的資源包括:CNKI資源總體介紹1我校購(gòu)買的資源包括:CNKI資源總體介紹1該庫(kù)收錄1915年至今國(guó)內(nèi)出版的近7000種學(xué)術(shù)期刊,其中核心期刊、重要評(píng)價(jià)性數(shù)據(jù)庫(kù)來(lái)源期刊近2600種。內(nèi)容覆蓋自然科學(xué)、工程技術(shù)、農(nóng)業(yè)、哲學(xué)、醫(yī)學(xué)、人文社會(huì)科學(xué)等各個(gè)領(lǐng)域,全文文獻(xiàn)總量2200多萬(wàn)篇。該庫(kù)收錄1999年至今全國(guó)420家博士培養(yǎng)單位的博士學(xué)位論文。累積出版博士學(xué)位論文全文文獻(xiàn)6萬(wàn)多篇。該庫(kù)收錄1999年至今全國(guó)652家碩士培養(yǎng)單位的優(yōu)秀碩士學(xué)位論文。累積出版碩士學(xué)位論文全文文獻(xiàn)44萬(wàn)多篇。收錄2000年以來(lái)國(guó)家二級(jí)以上學(xué)會(huì)、協(xié)會(huì)、高等院校、科研院所、學(xué)術(shù)機(jī)構(gòu)等單位的論文集,年更新約10萬(wàn)篇論文。累積出版會(huì)議論文全文文獻(xiàn)73萬(wàn)篇。CNKI資源總體介紹1該庫(kù)收錄1915年至今國(guó)內(nèi)出版的近70CNKI數(shù)據(jù)庫(kù)登錄CNKI使用指南數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄CNKI數(shù)據(jù)庫(kù)登錄需要注意的是:偶爾會(huì)提示輸入用戶名和密碼。請(qǐng)記?。河脩裘篋X0437密碼:hrbgc需要注意的是:偶爾會(huì)提示輸入用戶名和密碼。請(qǐng)記?。篊NKI數(shù)據(jù)庫(kù)登錄CNKI使用指南數(shù)據(jù)庫(kù)檢索與使用方法2CNKI數(shù)據(jù)庫(kù)登錄數(shù)據(jù)庫(kù)檢索與使用方法2CNKI使用指南:CNKI使用指南:認(rèn)識(shí)CNKI檢索平臺(tái)利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)認(rèn)識(shí)CNKI檢索平臺(tái)認(rèn)識(shí)

檢索平臺(tái)A通用菜單在各個(gè)總庫(kù)平臺(tái)首頁(yè)和檢索結(jié)果頁(yè)都提供了通用菜單B統(tǒng)一檢索平臺(tái)可進(jìn)行跨庫(kù)檢索C總庫(kù)文獻(xiàn)出版報(bào)表D文獻(xiàn)資源統(tǒng)一導(dǎo)航認(rèn)識(shí)

檢索平臺(tái)A通用菜單B統(tǒng)一檢索平臺(tái)C總庫(kù)文獻(xiàn)D文利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)CNKI的檢索方式:跨庫(kù)檢索還是進(jìn)入單庫(kù)檢索?利用CNKI查找有關(guān)“機(jī)械手自由度”的文獻(xiàn)CNKI的檢索方式如何選擇,這就需要分析檢索人的需求跨庫(kù):可以同時(shí)檢索多個(gè)子庫(kù),獲取更多更全面的結(jié)果,而且省時(shí)省力單庫(kù):一次只檢索一個(gè)類型的文獻(xiàn),避免結(jié)果過(guò)多造成的困擾檢索人的需求是什么?是為了獲取關(guān)于某一內(nèi)容的系統(tǒng)的全面的信息,還是只是想搜索特定類型的文獻(xiàn)信息?如何選擇,這就需要分析檢索人的需求跨庫(kù):可以同時(shí)檢索多個(gè)子庫(kù)跨庫(kù)檢索跨庫(kù)檢索檢索字段檢索詞機(jī)械手布爾邏輯算符自由度檢索字段檢索詞機(jī)械手布爾邏輯算符自由度檢索結(jié)果檢索結(jié)果檢索字段——信息檢索途徑檢索途徑是用戶根據(jù)需要,以文獻(xiàn)信息的外部特征和內(nèi)容特征來(lái)確定的檢索入口。根據(jù)信息的外部特征:

題名途徑、著者途徑、序號(hào)途徑根據(jù)信息的內(nèi)容特征:

分類途徑、主題途徑檢索字段——信息檢索途徑檢索途徑是用戶根據(jù)需要,以文獻(xiàn)信息的

信息檢索途徑(檢索字段)責(zé)任者途徑題名途徑分類途徑主題途徑序號(hào)途徑引文途徑信息檢索途徑(檢索字段)責(zé)任者途徑信息檢索途徑1題名(題目、標(biāo)題等)途徑2責(zé)任者(作者、編者等)途徑3序號(hào)(ISBN號(hào)等)途徑4分類途徑5主題途徑(主題詞)6關(guān)鍵詞途徑ISBN是國(guó)際標(biāo)準(zhǔn)書號(hào)(InternationalStandardBookNumber)的簡(jiǎn)稱,是國(guó)際通用的圖書或獨(dú)立的出版物(除定期出版的期刊)代碼。出版社可以通過(guò)國(guó)際標(biāo)準(zhǔn)書號(hào)清晰的辨認(rèn)所有非期刊書籍。一個(gè)國(guó)際標(biāo)準(zhǔn)書號(hào)只有一個(gè)或一份相應(yīng)的出版物與之對(duì)應(yīng)。

ISSN(國(guó)際標(biāo)準(zhǔn)連續(xù)出版物編號(hào),InternationalStandardSerialNumber)是根據(jù)國(guó)際標(biāo)準(zhǔn)ISO3297制定的連續(xù)出版物國(guó)際標(biāo)準(zhǔn)編碼,其目的是使世界上每一種不同題名、不同版本的連續(xù)出版物都有一個(gè)國(guó)際性的唯一代碼標(biāo)識(shí)。

信息檢索途徑1題名(題目、標(biāo)題等)途徑2責(zé)任者(作者、編

信息檢索技術(shù)布爾邏輯檢索位置算符檢索截詞檢索與詞根檢索精確檢索與模糊檢索信息檢索技術(shù)布爾邏輯檢索布爾邏輯檢索——最常用的信息檢索技術(shù)布爾邏輯檢索(Booleanlogical)就是利用布爾邏輯算符進(jìn)行檢索項(xiàng)的邏輯組配,用以表達(dá)檢索者的提問(wèn)概念。

布爾邏輯(臺(tái)灣譯布林邏輯)得名于喬治·布爾,他是愛爾蘭科克的皇后學(xué)院的英國(guó)數(shù)學(xué)家,他在十九世紀(jì)中葉首次定義了邏輯的代數(shù)系統(tǒng)?,F(xiàn)在,布爾邏輯在電子學(xué)、計(jì)算機(jī)硬件和軟件中有很多應(yīng)用。使用集合代數(shù)作為介紹布爾邏輯的一種方式。還使用文氏圖來(lái)展示各種布爾邏輯陳述所描述的集合聯(lián)系。布爾邏輯檢索——最常用的信息檢索技術(shù)布爾邏輯檢索(Boole布爾邏輯檢索邏輯“與”邏輯“或”

邏輯“非”邏輯“與”:用“AND”或“*”表示。用于連接概念交叉和限定關(guān)系的檢索詞。功能:以縮小檢索范圍,有利于提高查準(zhǔn)率。

邏輯“或”:用“OR”或“+”表示。用于連接并列關(guān)系的檢索詞,功能:以擴(kuò)大檢索范圍,防止漏檢,有利于提高查全率。邏輯“非”用“NOT”或“-”號(hào)表示,用于連接排除關(guān)系的檢索詞,功能:即排除不需要的和影響檢索結(jié)果的概念,以提高查準(zhǔn)率。布爾邏輯檢索邏輯“與”邏輯“或”邏輯“非”邏輯“邏輯與檢索式構(gòu)造舉例如:查找“胰島素治療糖尿病”的檢索式為:

insulin(胰島素)anddiabetes(糖尿?。┻壿嬇c檢索式構(gòu)造舉例如:查找“胰島素治療糖尿病”的檢索式為:邏輯或檢索式構(gòu)造舉例如:查找“腫瘤”的檢索式為:

cancer(癌)

ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)邏輯或檢索式構(gòu)造舉例如:查找“腫瘤”的檢索式為:邏輯非檢索式構(gòu)造舉例如:查找“動(dòng)物的乙肝病毒(不要人的)”的文獻(xiàn)的檢索式為:hepatitisBvirus(乙肝病毒)nothuman(人類)。邏輯非檢索式構(gòu)造舉例如:查找“動(dòng)物的乙肝病毒(不要人的)”的2位置算符檢索位置檢索也叫鄰近檢索。位置算符檢索是用一些特定的算符(位置算符)來(lái)表達(dá)檢索詞與檢索詞之間的鄰近關(guān)系。表示兩詞之間的位置鄰近關(guān)系,常用到的位置算符有(W)(nW)(N)nN)等。2位置算符檢索位置檢索也叫鄰近檢索。位置算符檢索是用一些特W算符

W算符是word或with的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,而且所連接的詞之間除了有一個(gè)空格或一個(gè)標(biāo)點(diǎn)外不得夾有其他的單詞或字母。

information2Wmanagement

可包括

Informationtechnologiesandmanagement和

Informationmanagement

W算符W算符是word或with的縮寫,表示在此算符兩側(cè)的N算符N算符是near的縮寫,表示在此算符兩側(cè)的檢索詞必須緊密相連,詞序可顛倒。nN表示兩檢索詞之間最多可以插入n個(gè)單詞,且詞序可顛倒。

informationNretrievalinformation2NretrievalN算符N算符是near的縮寫,表示在此算符兩側(cè)的檢索詞必3截詞檢索截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡滿足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。按截?cái)嗟奈恢脕?lái)分,截詞可有后截?cái)?、前截?cái)唷⒅薪財(cái)嗳N類型。不同的系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。分為有限截詞(即一個(gè)截詞符只代表一個(gè)字符)和無(wú)限截詞(一個(gè)截詞符可代表多個(gè)字符)。3截詞檢索截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)(1)后截?cái)啵胺揭恢?。如:comput?表示computer,computers,computing等。(2)前截?cái)?,后方一致。如:?computer表示minicomputer,microcomputers等。(3)中截?cái)啵琤as?s=basisbasescolo?r包含colour(英)和color(美)(1)后截?cái)?,前方一致。如:comput?表示compute模糊檢索與精確檢索模糊檢索(fuzzysearch)是與“精準(zhǔn)檢索”相對(duì)應(yīng)的一個(gè)概念,是指搜索系統(tǒng)自動(dòng)按照用戶輸入關(guān)鍵詞的同義詞進(jìn)行模糊檢索,從而得出較多的檢索結(jié)果。同義詞由系統(tǒng)的管理界面配置。如配置了“電腦”與“computer”為同義詞后,檢索“電腦”,則包含“computer”的網(wǎng)頁(yè)也會(huì)出現(xiàn)在檢索結(jié)果中。模糊檢索也就是同義詞檢索,用戶在檢索頁(yè)面中輸入同義詞中任何一個(gè)詞檢索時(shí),只要選中“模糊檢索”復(fù)選框,則該關(guān)鍵詞的所有同義詞信息也都被檢索出來(lái)。模糊檢索與精確檢索模糊檢索(fuzzysearch)是與“精確檢索精確檢索是指檢索詞與檢索字符串完全相等。如檢索作者馬智,僅檢索出作者為馬智的文獻(xiàn),作者為“馬智勇”的就不會(huì)被檢索出來(lái)。精確檢索精確檢索是指檢索詞與檢索字符串完全相等。模糊檢索模糊檢索結(jié)果模糊模糊檢索結(jié)果精確檢索精確進(jìn)入單庫(kù)檢索請(qǐng)看檢索舉例視頻進(jìn)入單庫(kù)檢索請(qǐng)看檢索舉例視頻期刊導(dǎo)航期刊導(dǎo)航使用CAJ閱讀器和PDF閱讀器使用2022/12/9120同方知網(wǎng)(北京)技術(shù)有限公司2022/12/739同方知網(wǎng)(北京)技術(shù)有限公司瀏覽器下載瀏覽器下載點(diǎn)擊文章篇名,進(jìn)入知網(wǎng)節(jié)頁(yè)面:CAJ下載的優(yōu)勢(shì):占用空間小下載速度快內(nèi)嵌專業(yè)詞典即時(shí)工具書釋義個(gè)性化編輯文獻(xiàn)文檔定位功能打開大部分PDF文檔并進(jìn)行個(gè)性化編輯……2022/12/9點(diǎn)擊文章篇名,進(jìn)入知網(wǎng)節(jié)頁(yè)面:CAJ下載的優(yōu)勢(shì):2022/1中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)2022/12/92022/12/7中文數(shù)據(jù)庫(kù)及信息檢索技術(shù)機(jī)械手機(jī)械手以“學(xué)術(shù)趨勢(shì)”為例:2022/12/9以“學(xué)術(shù)趨勢(shì)”為例:2022/12/72022/12/92022/12/7信息檢索過(guò)程分析需求確定檢索詞選擇信息源確定檢索途徑和方法1234實(shí)施檢索獲取原始文獻(xiàn)信息檢索過(guò)程是從確立檢索需求到信息需求得到滿足的全過(guò)程。信息檢索過(guò)程分析需求選擇信息源確定檢索途徑和方法12過(guò)程一:分析需求,確定檢索詞1明確檢索目的

*需要關(guān)于某方面的系統(tǒng)詳盡的信息

*需要關(guān)于某方面的最新信息

*了解一些片段信息,解決一些具體問(wèn)題2明確課題的主題或主要內(nèi)容要形成若干個(gè)既能代表信息需求又具有檢索意義的關(guān)鍵詞(檢索詞),確定檢索詞之間的關(guān)系3

涉及的學(xué)科范圍4所需信息的數(shù)量、語(yǔ)種、年代范圍等過(guò)程一:分析需求,確定檢索詞1明確檢索目的需求分析:課題一:“赟”這個(gè)字的讀音課題二:中西關(guān)系發(fā)展綜述課題三:機(jī)械手的定義課題四:近2年氣動(dòng)機(jī)械手的新技術(shù)研究課題五:新中國(guó)60年城鎮(zhèn)化發(fā)展綜述北大政府管理學(xué)院老師燕繼榮的聯(lián)系方式及近3年發(fā)文情況需求分析:課題一:“赟”這個(gè)字的讀音北大政府管理學(xué)院老師燕過(guò)程一:檢索詞的確定信息檢索語(yǔ)言分析課題的概念隱含概念的分析核心概念的選取選取檢索詞應(yīng)注意問(wèn)題過(guò)程一:檢索詞的確定信息檢索語(yǔ)言主題檢索語(yǔ)言常用的就是關(guān)鍵詞關(guān)鍵詞:從文獻(xiàn)的題目、正文或摘要中抽出的能表達(dá)文獻(xiàn)主題內(nèi)容的具有實(shí)質(zhì)意義的語(yǔ)詞。確定關(guān)鍵詞的步驟:

a.分析課題,提取概念

b.整理概念,擴(kuò)充同義詞匯

c.運(yùn)用分析所得詞匯試查,確定課題適用的關(guān)鍵詞主題檢索語(yǔ)言常用的就是關(guān)鍵詞主題檢索語(yǔ)言敘詞:又稱主題詞語(yǔ)言,是指從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)?!皽a(chǎn)腳踏車”“上?!薄ⅰ白孕熊嚒弊匀徽Z(yǔ)言主題詞主題檢索語(yǔ)言敘詞:又稱主題詞語(yǔ)言,是指從自然語(yǔ)言中優(yōu)選出來(lái)并

確定檢索詞分析課題的概念隱含概念的分析核心概念的選取選取檢索詞應(yīng)注意問(wèn)題確定檢索詞分析課題的概念分析課題的概念選擇所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析各概念之間的上、下、左、右關(guān)系,以便制定檢索策略。如課題“政策與行政學(xué)的關(guān)系”可選“政策”、“行政學(xué)”作為關(guān)鍵詞。分析課題的概念選擇所涉及的主要概念,并找出能代表這些概念的若隱含概念的分析有些課題的實(shí)質(zhì)性內(nèi)容很難從課題的名稱上反映出來(lái),其隱含的概念和相關(guān)內(nèi)容需從專業(yè)的角度做深入的分析,才能提煉出確切反映課題內(nèi)容的檢索概念。如“知識(shí)產(chǎn)權(quán)保護(hù)”概念中的“知識(shí)產(chǎn)權(quán)”一詞隱含著“著作權(quán)”和“版權(quán)”、“工業(yè)產(chǎn)權(quán)”等概念。隱含概念的分析有些課題的實(shí)質(zhì)性內(nèi)容很難從課題的名稱上反映出來(lái)核心概念的選取有些檢索詞概念已體現(xiàn)在所使用的數(shù)據(jù)庫(kù)中,這些概念應(yīng)予以排除。如WorldTextiles中“世界”一詞應(yīng)排除。另外有些比較泛指、檢索意義不大的檢索概念,如“發(fā)展”“現(xiàn)狀”“趨勢(shì)”等在不是專門檢索綜述類信息時(shí)也應(yīng)予以排除。核心概念的選取有些檢索詞概念已體現(xiàn)在所使用的數(shù)據(jù)庫(kù)中,這些概檢索詞選取時(shí)應(yīng)注意的幾個(gè)問(wèn)題。①檢索詞的選取應(yīng)適當(dāng),具有專指性,涵蓋主要主題概念,意義明確。一般應(yīng)優(yōu)先選擇規(guī)范化主題詞做檢索詞,但為了檢索的專指性也可選用關(guān)鍵詞配合檢索。②盡可能地考慮其相關(guān)的同義詞、近義詞作為檢索詞,以保證查全率。如同一概念的幾種表達(dá)方式,同一名詞的單、復(fù)數(shù),動(dòng)名詞、過(guò)去分詞形式,上位概念詞與下位概念詞,化學(xué)物質(zhì)的名稱、元素符號(hào),植物和動(dòng)物名的英文、拉丁名等。檢索詞選取時(shí)應(yīng)注意的幾個(gè)問(wèn)題。①檢索詞的選取應(yīng)適當(dāng),具有專指過(guò)程二:選擇信息源明確了信息需求之后,信息源的選擇尤為重要,它直接影響著檢索的效率。工欲善其事,必先“選”其器,信息源選擇得當(dāng),就會(huì)給人以愉悅的搜索體驗(yàn),能夠收到事半功倍的效果。

過(guò)程

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論