




已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究 基金項目國家社會科學(xué)基金重大項目“人文社科專題數(shù)據(jù)庫建設(shè)規(guī)范化管理研究”(項目編號)。 作者簡介劉雨農(nóng)(),男,博士研究生,研究方向智慧城市、社會網(wǎng)絡(luò)。 吳柯燁(),男,碩士研究生,研究方向自然語言處理。 權(quán)昭瑄(),男,碩士研究生,研究方向金融大數(shù)據(jù)。 專題人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究劉雨農(nóng)吳柯燁權(quán)昭瑄(南京大學(xué)信息管理學(xué)院,江蘇南京)摘要目的意義探索一種融入數(shù)據(jù)驅(qū)動思維的人文社科專題數(shù)據(jù)庫建設(shè)主題選擇方法,為相關(guān)主體在建庫主題的遴選、比較和確定等工作提供決策參考。 方法過程從政策、用戶兩個維度出發(fā),提出基于政策文本與檢索數(shù)據(jù)的人文社科專題數(shù)據(jù)庫主題篩選框架。 以平臺為例,基于政策文本主題分類建模和檢索數(shù)據(jù)的詞頻統(tǒng)計歸類,確定專題數(shù)據(jù)庫建設(shè)備選主題,最后通過比對篩選將主題進行分類。 結(jié)果結(jié)論本文構(gòu)建的主題選擇框架,能夠有效提升相關(guān)主題選擇工作的全面性、準(zhǔn)確性、科學(xué)性,為人文社科專題數(shù)據(jù)庫建設(shè)的項目規(guī)劃等提供了良好的思路。 關(guān)鍵詞人文社科;專題數(shù)據(jù)庫;主題選擇;?()(,),?,;專題數(shù)據(jù)庫是針對用戶信息需求,對某一專題的信息進行收集、分析、處理、存儲并按一定的標(biāo)準(zhǔn)和規(guī)范將其數(shù)字化的信息資源庫。 在人文社科領(lǐng)域,專題數(shù)據(jù)庫已成為各學(xué)科數(shù)字化轉(zhuǎn)型的基礎(chǔ)性工作,在數(shù)據(jù)資源開發(fā)、科研內(nèi)容創(chuàng)新、科研方法支持等方面提供了有力支持。 近年來,在國家政策支持和現(xiàn)實需求的雙重作用下,我國建成了一系列人文社科專題數(shù)據(jù)庫,涉及哲學(xué)、歷史、藝術(shù)、文化等眾多科學(xué)領(lǐng)域,有力地促進了人文遺產(chǎn)和社會記錄的保存與傳播,也有效支持了相關(guān)學(xué)科的研究工作。 主題的選擇與論證是專題數(shù)據(jù)庫建設(shè)的起點和年月第卷第期現(xiàn)代情報,?開始,決定了專題數(shù)據(jù)庫的建設(shè)方向和建設(shè)效果。 然而,過去人文社科專題數(shù)據(jù)庫的主題選擇方式主要依靠建庫主體的資源優(yōu)勢和決策者的經(jīng)驗判斷,難以全面回應(yīng)多方面的需求,進而限制了專題數(shù)據(jù)庫的功能實現(xiàn)以及進一步的服務(wù)延伸。 為此,本文提出了一種新的主題選擇框架,通過對客觀文本和行為數(shù)據(jù)的科學(xué)分析支持人文社科專題數(shù)據(jù)庫建設(shè),以期避免主觀性、單一化決策帶來的弊端,提高專題數(shù)據(jù)庫主題選擇的全面性、準(zhǔn)確性與科學(xué)性。 文獻綜述隨著數(shù)字人文和社會計算的推進,人文社科領(lǐng)域?qū)π畔①Y源保障提出了更高的要求,專題數(shù)據(jù)庫建設(shè)的理論和方法成為信息管理及相關(guān)人文社科學(xué)科的重要研究話題。 目前,雖然針對主題選擇的專門性研究仍不多見,但在數(shù)據(jù)庫建設(shè)的綜合性研究中已被大量提及,主要涉及以下個方面?專題數(shù)據(jù)庫主題分布描述經(jīng)過多年發(fā)展,國內(nèi)外建立起大量人文社科專題數(shù)據(jù)庫,主題涵蓋了歷史、經(jīng)濟、文化等眾多學(xué)科。 部分學(xué)者對現(xiàn)有數(shù)據(jù)庫主體分布進行了調(diào)查研究,如劉青等以州為單位,調(diào)查了美國特色數(shù)據(jù)庫建設(shè)狀況,并將其主題歸納為政治與政策、軍事和戰(zhàn)爭、法律和法規(guī)、經(jīng)濟與就業(yè)等個方面,同時指出,文化娛樂類專題數(shù)據(jù)庫在全美州立圖書館中占比最大。 何小月等將專題數(shù)據(jù)庫主題內(nèi)容劃分為學(xué)科專業(yè)、地域特色、名人特藏等個方面,同時選擇了中美所高校的自建數(shù)據(jù)庫進行橫向?qū)Ρ?,指出guo內(nèi)高校在學(xué)科專業(yè)和地域特色類數(shù)據(jù)庫建設(shè)存在短板。 鄂麗君將調(diào)查樣本擴展至我國所有“工程”高校后得出了相反結(jié)論,認為學(xué)科特色和學(xué)校特色資源項目占總數(shù)比超過。 此外,陳欽明等同樣針對不同性質(zhì)的專題數(shù)據(jù)庫主題分布進行了歸納。 這些研究盡管在專題數(shù)據(jù)庫主題劃分視角和劃分粒度上存在差別,但是有助于明確人文社科專題數(shù)據(jù)庫的建設(shè)現(xiàn)狀和定位,能夠為其他專題數(shù)據(jù)庫建設(shè)主題選擇提供參考。 ?專題數(shù)據(jù)庫主題選擇基本原則對于人文社科專題數(shù)據(jù)庫在實際建庫過程中產(chǎn)生的各類問題,部分學(xué)者從建庫流程的角度進行探討,認為主題選擇的不科學(xué)、不合理是這些問題產(chǎn)生的重要原因之一,并以此提出了一系列主題選擇原則。 王昶認為,專題數(shù)據(jù)庫建設(shè)是一項長期工作,主題選擇應(yīng)注重長期規(guī)劃性和可持續(xù)性,以長遠眼光和思路,根據(jù)現(xiàn)有條件選擇符合實際狀況的、成體系的特色主題。 劉青等提出主題內(nèi)容廣博化原則,認為專題數(shù)據(jù)庫主題劃分和內(nèi)容深度上盡管存在差異,但應(yīng)通過統(tǒng)一平臺的整合,為用戶提供全方位多系統(tǒng)的資源和信息服務(wù)。 徐大平等認為地方特色專題數(shù)據(jù)庫的主題選擇重點在于突出地方文化特色、體現(xiàn)地方文獻特色,并提出了成系列小主題選擇、科學(xué)性和實用性個原則。 總體來說,這些原則可歸納為點第一,以需求為導(dǎo)向,能夠切實滿足用戶長時期的信息資源需求;第二,突出特色性,力求避免在內(nèi)容上同其他數(shù)據(jù)庫的交叉和重復(fù);第三,具有可操作性,根據(jù)信息資源體量和人力、資金等實際情況確定主題選擇粒度,保證數(shù)據(jù)庫質(zhì)量。 ?專題數(shù)據(jù)庫主題選擇方法與過程相對于專題數(shù)據(jù)庫主題選擇原則,已有研究很少涉及具體的主題選擇方法。 王昶提出了專題數(shù)據(jù)庫主題選擇策劃工作的步流程第一,開展廣泛的調(diào)查研究,初定主題選擇方向;第二,開展專家評議和讀者調(diào)研,確定主題選擇的可行性;第三,考察建庫資源與技術(shù)水平,明確主題選擇內(nèi)容。 任航等對長春市若干高等院校的在校藝術(shù)生進行了問卷調(diào)查,通過需求情況確定數(shù)據(jù)庫主題選擇。 可以看到,當(dāng)前專題數(shù)據(jù)庫的主題選擇方法依然以專家論證和問卷調(diào)查等方式為主,最終決策仍然依賴于決策者的經(jīng)驗判斷。 綜上所述,已有研究充分重視了主題選擇對專題數(shù)據(jù)庫建設(shè)的重要作用,為專題數(shù)據(jù)庫主題選擇明確了原則和方向,提供了良好的思路和方法。 然而,現(xiàn)有研究成果依然存在一定不足第一,研究大多集中于宏觀層面的原則性方針,在數(shù)據(jù)庫建設(shè)的實際過程中很難轉(zhuǎn)化為直接的、具體的行動方案,可操作性存在一定限制;第二,方法上依然以用戶調(diào)查和專家咨詢?yōu)橹鳎瑤в休^強的主觀性,難以保證決策的科學(xué)性;第三,并未考慮不同性質(zhì)的主體在數(shù)據(jù)庫建設(shè)中的動機差異。 在大數(shù)據(jù)、智慧年月第卷第期人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究,?數(shù)據(jù)的背景下,面對高速增長的數(shù)據(jù)存量和復(fù)雜化的信息需求,應(yīng)在原則性、經(jīng)驗性探索的基礎(chǔ)上,充分發(fā)揮數(shù)據(jù)分析等技術(shù)和方法的重要作用,為數(shù)據(jù)庫建設(shè)主體的建庫決策提供支持和參考。 人文社科專題數(shù)據(jù)庫建設(shè)主題選擇模型構(gòu)建本文通過前期多地、多主體訪談?wù){(diào)研,確定了專題數(shù)據(jù)庫國家需求和用戶需求的主方向,并以客觀數(shù)據(jù)為基礎(chǔ),構(gòu)建人文社科專題數(shù)據(jù)庫主題選擇框架,以期為相關(guān)決策提供支持。 模型建構(gòu)路線如圖所示第一,從政務(wù)公開平臺中,獲取國家相關(guān)部門政策文本全文,并進行文本預(yù)處理。 同時從信息服務(wù)商檢索系統(tǒng)后臺獲取特定時間段的用戶檢索數(shù)據(jù),篩選有效檢索語句;第二,提取政策文本中的實意性名詞,并進行主題建模,形成若干備選主題;第三,將采集到的檢索語句分別提取關(guān)鍵詞,利用算法同機構(gòu)已有文獻資源進行匹配,通過排序和歸納篩選出備選主題詞;第四,綜合比對結(jié)果,對結(jié)果進行分類。 圖人文社科專題數(shù)據(jù)庫建設(shè)主題選擇框架?需求調(diào)研與分析滿足不同層面、不同對象的信息需求是數(shù)據(jù)庫長期建設(shè)運營和持續(xù)發(fā)展的核心動力。 對于對象群體復(fù)雜、數(shù)據(jù)形式多樣的人文社科領(lǐng)域,專題數(shù)據(jù)庫的主題選擇更應(yīng)以需求為導(dǎo)向。 不同性質(zhì)的建庫主體由于機構(gòu)職能、服務(wù)對象等方面存在差異,專題數(shù)據(jù)庫產(chǎn)品的需求內(nèi)容和重心也存在顯著區(qū)分。 如公共機構(gòu)建設(shè)的專題數(shù)據(jù)庫普遍重視公共需求,為國家發(fā)展戰(zhàn)略和公益事業(yè)提供支持;而商業(yè)性專題數(shù)據(jù)庫則更加側(cè)重于通過滿足用戶使用需求來擴大市場,實現(xiàn)自身盈利和發(fā)展。 對此,本文將人文社科專題數(shù)據(jù)庫需求歸納為兩個層面第一,宏觀層面的國家社會需求。 人文社科專題數(shù)據(jù)庫通常需要承擔(dān)部分國家、社會層面的宏觀需求,如為國家重大戰(zhàn)略部署提供數(shù)據(jù)支撐、對非物質(zhì)文化遺產(chǎn)進行保護與搶救、弘揚優(yōu)秀歷史文化傳統(tǒng)、紀(jì)念特殊事件等。 尤其是對于公共性質(zhì)的建庫主體,更應(yīng)在宏觀戰(zhàn)略需求的背景下,有針對性地規(guī)劃專題數(shù)據(jù)庫建設(shè),為相關(guān)政策提供有效支持。 政策文本是政府相關(guān)部門為了實現(xiàn)特定要求,以權(quán)威形式頒布的文件,是國家、社會需求最直觀的表達和體現(xiàn)。 在政府政務(wù)全面公開、自然語言處理技術(shù)快速發(fā)展的背景下,大批量政策文本的開放獲取和深度挖掘已具備可行性。 對此,本文通過挖掘政策文本內(nèi)容,實現(xiàn)宏觀需求的分析。 第二,微觀層面的用戶使用需求。 作為人文社科專題數(shù)據(jù)庫的直接使用者,用戶的需求相對具體和明確。 如科研人員對特定專題領(lǐng)域資料的集中需求,公眾對某一主題知識的學(xué)習(xí)興趣等。 但由于不同用戶使用動機、需求粒度、表達方式等存在差異,此類需求較為多元,調(diào)查和識別的難度較高。 對于用戶使用需求,過去一般采取問卷、訪談等方式,在調(diào)查對象規(guī)模和代表性上存在一定限制。 當(dāng)前,由于人文社科領(lǐng)域的信息爆炸式增長和碎片化分布加深了信息的獲取難度,搜索引擎逐步成為用戶對于信息搜尋的主要工具。 對此,本文以搜索引擎中的檢索記錄衡量用戶的實際需求。 ?基于的政策主題生成(,隱含狄利克雷函數(shù))模型是一種文檔生成模型,即包含詞、主題、文檔三層結(jié)構(gòu)的貝葉斯模型。 該模型通過將文檔詞匯矩陣轉(zhuǎn)化為文檔主題矩陣和主題詞匯矩陣來實現(xiàn)主題的識別與生成。 作為一種非監(jiān)督的機器學(xué)習(xí)方法,在大規(guī)模文檔中能夠有效實現(xiàn)主題識別任務(wù)。 簡要來說,主題生年月第卷第期現(xiàn)代情報,?成過程可分為個步驟,首先對語料庫中的每一篇文檔,從主題分布中抽取一個主題,其次對所抽取主題中所對應(yīng)的詞分布中抽取一個詞語,最后充分闡述過程直至實現(xiàn)所有文檔和所有單詞的遍歷。 如圖表示。 圖模型示意圖?基于算法的資源匹配特定主題的人文社科專題數(shù)據(jù)庫建設(shè)必須以充足的信息資源作為基礎(chǔ)保障。 尤其是對于檢索關(guān)鍵詞,必須同資源儲備進行匹配,判斷其是否具備專題開發(fā)條件。 本文基于算法,通過計算、排序每個檢索詞的得分,實現(xiàn)主題關(guān)鍵詞進行二次篩選。 是二元獨立模型的拓展形式之一。 作為一種相關(guān)性排序函數(shù),模型根據(jù)計算給定檢索詞與文檔的相關(guān)性得分并累加,進而對匹配文檔進行排序。 該模型由于算法設(shè)計較為靈活,被廣泛應(yīng)用于搜索引擎當(dāng)中。 范晨熙等通過將模型與開源搜索框架結(jié)合,建立了相關(guān)度搜索模型,何喜軍等利用該模型,構(gòu)建了專利轉(zhuǎn)讓索引庫。 本文基于理論框架,對該模型進行了拓展與應(yīng)用。 首先,對提取到的關(guān)鍵詞進行語素解析,產(chǎn)生語素。 對于所有館藏資源的摘要文檔,計算每個語素與的相關(guān)性評分。 最后,將相對于的相關(guān)性得分加權(quán)并求和,最終得到與的相關(guān)性得分。 評分公式為(,)()()?其中,、為調(diào)節(jié)因子,是關(guān)鍵詞中出現(xiàn)的次數(shù),是的長度,是資源庫中全部文檔的平均長度。 此外,公式如下()()?()?其中,為貯藏文獻的所有文檔數(shù)量,()為包含了語素的文檔數(shù)。 根據(jù)公式,包含的文檔數(shù)越多,其權(quán)重越低。 實證研究?數(shù)據(jù)與實驗環(huán)境本文從可測量角度出發(fā),以福建省為例,通過政策文本衡量國家需求,通過檢索數(shù)據(jù)反應(yīng)用戶需求。 由于國家各級政策發(fā)布機關(guān)單位數(shù)量龐大,內(nèi)容寬泛,本文僅選取國家文化與旅游部、福建省文化與旅游廳近年發(fā)布的各類政策文本作為實證樣本,通過爬蟲工具獲取原始文本后,手工剔除人事變動、財務(wù)審計等管理類文件,得到有效政策文本條。 檢索數(shù)據(jù)從(福建省高校數(shù)字圖書館)平臺后臺獲取,按照檢索排行降序順序,選擇人文社科相關(guān)的檢索條目,共計條,部分記錄如表。 平臺包含福建省所成員館,擁有完善的在線系統(tǒng)和穩(wěn)定的訪問流量,檢索數(shù)據(jù)能夠反映出省域內(nèi)用戶的一般需求。 表部分檢索詞序號檢索類型檢索詞匹配方式資料類型檢索結(jié)果條數(shù)訪問訪問時間題名國際法中的歷史性權(quán)利研究前向匹配全部?題名吶喊前向匹配全部?題名金融工程前向匹配全部?年月第卷第期人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究,?表(續(xù))序號檢索類型檢索詞匹配方式資料類型檢索結(jié)果條數(shù)訪問訪問時間題名自然保護地管理分類應(yīng)用指南前向匹配全部?題名自然保護地管理分類應(yīng)用指南前向匹配全部?題名英語口語前向匹配全部?題名國際工程投融資前向匹配全部?題名戚繼光前向匹配全部?題名蘭登模糊匹配全部?題名牛津階模糊匹配全部?本文實驗環(huán)境為、?、線程,內(nèi)容容量的機,家用標(biāo)準(zhǔn)版位操作系統(tǒng)。 集成開發(fā)環(huán)境為,部分功能基于語言編程,所用工具包包括、等。 ?政策文本數(shù)據(jù)處理模型需要對分類數(shù)量進行預(yù)先設(shè)定。 該數(shù)值一般采用困惑度確定,計算公式如下()()()()其中、分別指訓(xùn)練過的主題和測試集的各篇文檔。 分母是測試集中出現(xiàn)的所有詞。 一般來說,困惑度隨主題數(shù)增加而下降。 如圖所示,通過計算,當(dāng)值取時,困惑度曲線下降趨勢趨近于穩(wěn)定,此時的取值為最佳數(shù)量。 圖困惑度曲線構(gòu)建模型以分析每一篇文章的話題分布,利用訓(xùn)練完的模型將政策文本轉(zhuǎn)化為話題分布函數(shù),并將文本主題向量與原文本合并,部分結(jié)果如圖所示。 最后,根據(jù)以上結(jié)果,輸出每個主題的前若干關(guān)鍵詞,并以窗口形式展示。 最終結(jié)果如圖所示。 圖文本話題概率分布(部分)年月第卷第期現(xiàn)代情報,?圖主題分類輸出結(jié)果圖主題分類輸出結(jié)果?檢索記錄數(shù)據(jù)處理通過后臺,選擇年檢索記錄,將輸出結(jié)果按照詞頻排序,選擇檢索次數(shù)大于的關(guān)鍵詞,并將非人文社科范疇的詞語剔除。 最后,將檢索詞與資源庫各類文本文檔進行匹配,篩選出命中詞匯。 部分結(jié)果如表所示。 年月第卷第期人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究,?圖主題分類輸出結(jié)果圖主題分類輸出結(jié)果不同于文本語料,檢索記錄多以單個檢索詞的形式表示,缺乏上下文語境,難以利用技術(shù)進行主題識別。 由于數(shù)據(jù)總量相對較少,因此本文選擇人工方式判斷檢索詞語義,并進行主題歸納。 ?備選主題分類比對上述兩類主題分類結(jié)果,進行匯總、比對年月第卷第期現(xiàn)代情報,?表上半年人文社科檢索詞排行(部分)排名檢索詞排名檢索詞排名檢索詞排名檢索詞信息檢索百年孤獨追風(fēng)箏的人紅樓夢平凡的世界微觀經(jīng)濟學(xué)考研英語三體小王子張愛玲心理學(xué)英語口語經(jīng)濟學(xué)原理運籌學(xué)管理學(xué)活著牛津白夜行東野圭吾宏觀經(jīng)濟學(xué)計量經(jīng)濟學(xué)雅思圍城公務(wù)員大數(shù)據(jù)英語經(jīng)濟學(xué)挪威的森林和分類,最終形成類備選主題。 )理想型主題選擇教育、互聯(lián)網(wǎng)與大數(shù)據(jù)通過比對,此類主題選擇內(nèi)容同時出現(xiàn)在政策主題和檢索主題分類中。 意味著在現(xiàn)有資源的基礎(chǔ)上,能夠同時響應(yīng)國家和用戶需求,建議優(yōu)先作為專題數(shù)據(jù)庫建設(shè)主題。 教育學(xué)與教育事業(yè)是人文社科領(lǐng)域的重要話題,大量職能部門均對教育事業(yè)發(fā)展進行了專門性部署,尤其是紅色教育、傳統(tǒng)文化教育、人文素養(yǎng)教育等方面近年來獲得了極大關(guān)注。 在用戶層面,由于以高校圖書館聯(lián)盟為實證對象,用戶以高校學(xué)生為主,因此,數(shù)據(jù)庫建設(shè)主要回應(yīng)以備考或個人發(fā)展為目的的需求。 顯然,各類人文社科教育需要大量專門性文獻資料為支撐,因此專門性數(shù)據(jù)庫建設(shè)勢在必行。 近年來,互聯(lián)網(wǎng)與大數(shù)據(jù)為人文社科領(lǐng)域帶來了巨大的變革,尤其是網(wǎng)絡(luò)安全、電子政務(wù)、數(shù)據(jù)資產(chǎn)等議題正在引起相關(guān)部門的高度重視。 此外,大數(shù)據(jù)更是為人文社科領(lǐng)域的研究提供了新的契機和方法,從檢索數(shù)據(jù)來看,人文社科對于數(shù)據(jù)科學(xué)、編程語言、計算工具等方面的資料存在大量需求。 )政策導(dǎo)向型非物質(zhì)文化遺產(chǎn)、旅游此類主題選擇通常側(cè)重于公共性建庫主體,能夠有效回應(yīng)國家政策要求,有助于發(fā)揮其公共文化服務(wù)等方面的職能。 非物質(zhì)文化遺產(chǎn)和旅游是人文社科專題數(shù)據(jù)庫的傳統(tǒng)主題選擇,從研究結(jié)果來看,非遺資源保護和旅游產(chǎn)業(yè)發(fā)展依然是當(dāng)前文化及相關(guān)部門的工作重心,從中央到地方均有大量政策部署。 在數(shù)據(jù)庫建設(shè)過程中,建庫主體可圍繞本地資源,進行針對性的數(shù)據(jù)采集與加工,著力打造出具有地方特色的文化品牌。 同時,不斷拓展數(shù)據(jù)庫的開放程度,并開展宣傳推廣工作,進而服務(wù)于地方旅游產(chǎn)業(yè)。 )用戶導(dǎo)向型文學(xué)、經(jīng)濟學(xué)、語言此類主題選擇能夠反映用戶的現(xiàn)實需求,具有良好的市場前景,一般來說更加符合商業(yè)性的建庫主體性質(zhì),而對于高校、科研院所等實際科研需求也能做到有效回應(yīng)。 與政策導(dǎo)向不同,用戶需求更為多元,其影響因素也更加復(fù)雜。 在本文的實證研究中,用戶需求更多地集中于在文學(xué)、經(jīng)濟學(xué)和語言類。 其中文學(xué)作品相對于其他人文社科學(xué)術(shù)性資源來說,學(xué)科門檻較低,受眾面更廣。 而經(jīng)濟學(xué)原理和方法對包括社會學(xué)、管理學(xué)、國際關(guān)系在內(nèi)的多種學(xué)科同樣實用,因此存在大量記錄。 而語言方面的需求則以英語學(xué)習(xí)材料和工具書為主,這是由高校用戶對于等級考試、外文學(xué)術(shù)資源等硬性需求決定的。 結(jié)語本文構(gòu)建了一種人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇模型,為專題數(shù)據(jù)庫的主題選擇提供了一種全新的思路和方法。 相較于以經(jīng)驗性判斷為主的常見模式,本文通過對政策文本和用戶訪問記錄進行深入挖掘和匹配,有助于進一步提(下轉(zhuǎn)第頁)年月第卷第期人文社科專題數(shù)據(jù)庫建設(shè)的主題選擇研究,?沈志宏,張曉林關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述現(xiàn)代圖書情報技術(shù),()沈志宏,黎建輝,張曉林關(guān)聯(lián)數(shù)據(jù)互聯(lián)技術(shù)研究綜述應(yīng)用、方法與框架圖書情報工作,()夏翠娟,劉煒,趙亮,等關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)及其實現(xiàn)以為例中國圖書館學(xué)報,()歐石燕,唐振貴面向圖書館關(guān)聯(lián)數(shù)據(jù)的自動問答技術(shù)研究中國圖書館學(xué)報,()陳濤,夏翠娟,劉煒,等關(guān)聯(lián)數(shù)據(jù)的可視化技術(shù)研究與實現(xiàn)圖書情報工作,()劉美杏,徐芳古道線性文化遺產(chǎn)信息資源關(guān)聯(lián)數(shù)據(jù)模型構(gòu)建及其實證研究圖書館學(xué)研究,()張樂,常娥基于的民國建筑知識庫關(guān)聯(lián)數(shù)據(jù)的組織與發(fā)布研究圖書館學(xué)研究,()董坤,謝守美基于關(guān)聯(lián)數(shù)據(jù)的資源語義化組織與聚合研究情報雜志,()夏翠娟,劉煒,陳濤,等家譜關(guān)聯(lián)數(shù)據(jù)服務(wù)平臺的開發(fā)實踐中國圖書館學(xué)報,()許鑫,張悅悅非遺數(shù)字資源的元數(shù)據(jù)規(guī)范與應(yīng)用研究圖書情報工作,(),劉煒,李大玲,夏翠娟元數(shù)據(jù)與知識本體圖書館雜志,(),()歐石燕面向關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字圖書館資源描述與組織框架設(shè)計與實現(xiàn)中國圖書館學(xué)報,()(陳媛)?(上接第頁)高專題數(shù)據(jù)庫建設(shè)決策的科學(xué)性、實時性和前瞻性。 需要注意的是,本模型面向人
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 非稠環(huán)受體分子及其在柔性有機光伏中的應(yīng)用
- 2025至2030中國兒童涼鞋市場銷售狀況及競爭策略研究報告
- 2025至2030中國專用作業(yè)車行業(yè)需求趨勢及投資效益研究報告
- 2025-2030麥芽糖漿行業(yè)市場發(fā)展現(xiàn)狀及競爭格局與投資研究報告
- 2025-2030風(fēng)險投資行業(yè)市場深度調(diào)研及前景趨勢與投資研究報告
- 2025-2030防曬霜行業(yè)風(fēng)險投資發(fā)展分析及運作模式與投融資研究報告
- 2025-2030鋁合金電纜產(chǎn)業(yè)市場發(fā)展分析及前景趨勢與投資管理研究報告
- 2025-2030金屬包裝制品行業(yè)市場發(fā)展分析及投資前景研究報告
- 2025-2030透氣蓋膜包裝行業(yè)市場現(xiàn)狀供需分析及重點企業(yè)投資評估規(guī)劃分析研究報告
- 2025-2030節(jié)能環(huán)保裝備行業(yè)市場發(fā)展分析及投資前景研究報告
- 2024年個人勞務(wù)承包合同書
- 2024年人力資源招聘服務(wù)合同范本
- 重慶市(六校聯(lián)考)2025屆九年級物理第一學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 2024遼寧省各市農(nóng)村電力服務(wù)限公司聯(lián)合招聘220人重點基礎(chǔ)提升難、易點模擬試題(共500題)附帶答案詳解
- ISO15614-1 2017 金屬材料焊接工藝規(guī)程及評定(中文版)
- MOOC 一生的健康鍛煉-西南交通大學(xué) 中國大學(xué)慕課答案
- 《中國潰瘍性結(jié)腸炎診治指南(2023年)》解讀
- 護理文獻分享的課件
- 重慶十八中學(xué)2024屆八年級下冊數(shù)學(xué)期末教學(xué)質(zhì)量檢測試題含解析
- 企業(yè)周年慶蛋糕定制協(xié)議
- 量子計算芯片技術(shù)
評論
0/150
提交評論