2024圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告V0-WN8正式版_第1頁
2024圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告V0-WN8正式版_第2頁
2024圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告V0-WN8正式版_第3頁
2024圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告V0-WN8正式版_第4頁
2024圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告V0-WN8正式版_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

圖書館領(lǐng)域大模型創(chuàng)新應(yīng)用需求調(diào)研報(bào)告(征求意見稿V0.9)上海圖書館(上海科學(xué)技術(shù)情報(bào)研究所)智慧圖書館技術(shù)應(yīng)用聯(lián)盟2024年5月說明科學(xué)技術(shù)情報(bào)研究所)、智慧圖書館技術(shù)應(yīng)用聯(lián)盟。開分享這些寶貴的學(xué)習(xí)資源。很多方面如大模漏與不足之處,因此我們對此表示歉意,并希望您提供寶貴的反饋建議。報(bào)告各章編輯:第一章前言(嵇婷)第二章大模型行業(yè)應(yīng)用研(許磊)第三章大模型對書館的影響(嵇婷、周綱、許磊)第四章智慧圖大模型應(yīng)用(嵇婷、周綱、許磊)第五章圖書館典型大模型應(yīng)用需求及場景舉例(嵇婷、周綱、許磊、劉倩倩、姚馨、劉貝玲、徐凡、呂思詩、張春景)第六章總結(jié)與展望(嵇婷)聯(lián)系方式:如對報(bào)告有任何建議,歡迎將反饋意見發(fā)送:calsp@。目錄第一章1

第二章大模型行業(yè)應(yīng)用調(diào)研3

2.1大模型行業(yè)應(yīng)用價(jià)值3

2.2大模型行業(yè)應(yīng)用服務(wù)4

2.3大模型行業(yè)應(yīng)用技術(shù)方案.6

2.3.1提示詞工程.6

2.3.2檢索生成增強(qiáng)2.3.3智能體2.3.4型微調(diào)2.4大模型行業(yè)應(yīng)用案例2.4.1醫(yī)藥健康.4.2金融保險(xiǎn)2.4.3文化教育第三章大模型對圖書館的影響3.1圖書館大模型影響分析3.2圖書館大模型應(yīng)用策略...........................................................23

3.3圖書館大模型應(yīng)用路徑圖書館大模型應(yīng)用范式圖書館大模型技術(shù)架構(gòu)第四章智慧圖書館中的大模型應(yīng)用智慧服務(wù)中的大模型應(yīng)用智慧業(yè)務(wù)中的大模型應(yīng)用智慧管理中的大模型用智慧空間中的大模型應(yīng)用第五章圖書館典型型應(yīng)用需求及場景舉例5.1智慧咨詢5.1.15.1.2場景舉例5.1.3已有案例2智慧資源發(fā)現(xiàn)5.2.1需求分析5.2.2場景舉例5.2.3已有案例5.3智慧閱讀推廣5.3.1需求分析5.3.2場景舉例5.3.3已有案例5.4智慧知識服務(wù)5.4.1需求分析5.4.2場景舉例15.4.3已有案例5.5智能采編輔助5.5.1需求分析5.5.2場景舉例5.5.3已有案例5.6數(shù)字資源智能加工5.6.1需求分析5.6.2場景舉例5.6.3已有案例5.7數(shù)字人文智慧研究與服務(wù)35.7.1需求分析5.7.2場景舉例5.7.3已有案例5.8館員智慧助手5.8.1需求分析8.2場景舉例5.8.3已有案例第六章總結(jié)與展望附:云瀚應(yīng)用商店AI應(yīng)用列表2第一章前AI量。在時(shí)代浪潮的推動下,以大模型技術(shù)為代表的生成式人工智能已經(jīng)成為推動科技進(jìn)步和產(chǎn)業(yè)變革的重2023年7索優(yōu)化應(yīng)用場景,構(gòu)建應(yīng)用生態(tài)體系。2024年,政府工作報(bào)告中明確提出深化人工智能研發(fā)應(yīng)用,開展“人工智能+”行動。國家鼓勵(lì)人工智能技術(shù)與經(jīng)濟(jì)社各領(lǐng)域深度融合,以推動各行業(yè)應(yīng)用創(chuàng)新,賦能百業(yè)智能化轉(zhuǎn)型升。伴隨著新一代技術(shù)的興起,圖書館界也迎來了重要的契機(jī),步入了對將融入運(yùn)營與服務(wù)中的復(fù)雜挑戰(zhàn)。為了有效應(yīng)對變革,上海圖書館(上海科學(xué)技術(shù)情報(bào)研究所)聯(lián)合上海人工智能研究院、智慧圖書館技術(shù)應(yīng)用聯(lián)盟于2023年9月發(fā)布了《圖書館大規(guī)模模型創(chuàng)新與應(yīng)用白皮書》。白皮書從宏觀層AI2.0踐、生態(tài)建設(shè)提出了方向性、建設(shè)性的參考與建議。大模型技術(shù)在圖模型應(yīng)用的總體架圖書館中的應(yīng)用潛力與可能性,提供圖書館在探索大模型技術(shù)新應(yīng)用的參考,以助圖書館更好地把握人工智能發(fā)展所帶來的機(jī)遇。第三章在詳細(xì)分析了大模型對據(jù)當(dāng)前技術(shù)發(fā)展和落地現(xiàn)狀,梳理了圖書館在智慧服務(wù)、智慧業(yè)務(wù)、智慧管理、智慧空間四個(gè)領(lǐng)域中,當(dāng)前可實(shí)、實(shí)施或展望的應(yīng)用,并進(jìn)行總結(jié)。第五1資源發(fā)現(xiàn)、閱讀推廣、學(xué)術(shù)服務(wù)、采編輔助、資源加工、數(shù)字人文和管理決策,通過對這些關(guān)鍵領(lǐng)域的詳細(xì)討論域在大模型技術(shù)的開發(fā)應(yīng)用和產(chǎn)品設(shè)計(jì)方面的思考與實(shí)踐。誠摯邀各界人士進(jìn)行批評指正,我們將借助各方經(jīng)驗(yàn)對報(bào)進(jìn)行修改和完善,從而為智慧圖書館大模型創(chuàng)新應(yīng)用提供有益參考。2第二章大模型行業(yè)應(yīng)用調(diào)研2.1大模型行業(yè)應(yīng)用價(jià)值2022年月上線的生成式人工智(AIGC,AI-GeneratedContent)應(yīng)用ChatGPT大模型+大數(shù)據(jù)+力”科的任務(wù)處理能力,是人工智能技術(shù)極為關(guān)鍵的發(fā)展節(jié)點(diǎn)。ChatGPT的橫空出LanguageModel,LLM大模型”NaturalLanguageProcessingNLP)領(lǐng)域以小模型為主導(dǎo)的傳統(tǒng)發(fā)得到的超大型深度學(xué)習(xí)模型,參數(shù)通常從數(shù)十億到超千億。底層基于Trmer深度神經(jīng)量數(shù)據(jù)訓(xùn)練架構(gòu)使得大語言模型具有了被稱為“涌現(xiàn)”的泛化推理能力,使其具AGI體信息結(jié)合語言數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練和指令微調(diào)的超大型深度學(xué)習(xí)模型也是大語言模型的一種發(fā)展,通常稱為多模態(tài)大模型。也可以將上述兩者并稱為大模型”。大模型的涌現(xiàn)能力”不僅可以實(shí)和科學(xué)的再創(chuàng)造。大模型的大規(guī)模”和預(yù)訓(xùn)練”屬性,決定了其具有能力泛化、技術(shù)融合、應(yīng)用大核心作用。(1)能力泛方面,大模型預(yù)先在海量通用數(shù)據(jù)上訓(xùn)練使其具備了通用任“大規(guī)模預(yù)訓(xùn)練﹢調(diào)的范式,可以很好地適應(yīng)不同下游任務(wù),展現(xiàn)出它強(qiáng)大的通用性。(2)技術(shù)融合方面,文本大模型融合語言、視覺、聽覺等多模態(tài)信息,通1中國人工智能學(xué)會.中國人工智能系列白皮書——大模型3版)s=/home/article/detail/id/3172.html,2023.2趙鑫,李軍毅,周昆,唐天一,文繼榮.大語言模型,https://llmbook-zh.github.io/,2024.3龍志勇,黃雯.大模型時(shí)代:ChatGPT開啟通用人工智能浪潮[M].中譯出版社,2023.4海通國際.MaaSModelasaService模即服務(wù),/pdf/H3_AP2023020815828853752023.3索引擎、代碼執(zhí)行、工具調(diào)用等技術(shù),或者與小型融合,從而實(shí)現(xiàn)優(yōu)勢互補(bǔ),性能上實(shí)現(xiàn)“1+1>2”的效果,顯著提升模型的功能豐富性和性能優(yōu)越性、。(3能力的重要體現(xiàn)是復(fù)雜任務(wù)推理為構(gòu)建大量應(yīng)用程序提供了機(jī)會,從而使大模型有機(jī)會成為下一代計(jì)算平臺/操作系統(tǒng),有效支撐智能終端、系統(tǒng)、平臺等產(chǎn)品應(yīng)用落地,解決傳統(tǒng)應(yīng)用過程中存在的壁壘多、部署難問題。模型做商業(yè)應(yīng)用的適配“AI+”行業(yè)中將承擔(dān)基礎(chǔ)設(shè)施代之后,將進(jìn)入基于大模型的時(shí)代。在未來,基于大模型,人工智能將如供水供電一般流向終端,流向用戶和企業(yè)。2.2大模型行業(yè)應(yīng)用服務(wù)。(1AIGC技術(shù)基礎(chǔ)設(shè)施層預(yù)訓(xùn)練模型的高成本和技術(shù)投入,具有較高的進(jìn)入門檻,不在本文討論范圍。(2)第二層,為中間層,即垂直化、場景化、個(gè)性化的模型和應(yīng)用工具。預(yù)訓(xùn)時(shí)兼具按需使用、高效經(jīng)濟(jì)的優(yōu)勢。隨著兼具模型和多模態(tài)的模型加速成為新的技術(shù)平臺,模型即服務(wù)(Modelce,MaaS)開始成為現(xiàn)實(shí)。OpenAI創(chuàng)始人山姆·奧特曼(SamAltman)“認(rèn)為中間那一層會創(chuàng)造很多價(jià)值。5騰訊研究院.AIGC發(fā)展趨勢報(bào)告2023,/report?id=AJJ,2023.4夠做的關(guān)于數(shù)據(jù)飛輪的事。”(3)第三層,為應(yīng)用層,即面向端用戶的文字、圖片、音視頻等內(nèi)容生成服務(wù)。在應(yīng)用層,側(cè)重滿足戶的需求,將模型和用戶的需求無能夠被分為四大基礎(chǔ)模態(tài),包括文本、音頻、圖像、視頻,每一種模態(tài)技術(shù)都有著獨(dú)特的應(yīng)用場景和特點(diǎn)?!龈鼮樨S富多彩的生成內(nèi)容。2023周靖人表“MaaS應(yīng)用開發(fā)的整個(gè)鏈路都基于這一理念來做MaaS用戶可以直接通過API調(diào)用基礎(chǔ)大模型,為不同的業(yè)務(wù)場景,來構(gòu)建、訓(xùn)練和部署專屬模型。云平臺提供從數(shù)據(jù)、模型到應(yīng)用服務(wù)的全周期管理和工具。產(chǎn)業(yè)的場景落地一直面臨碎片化、長尾場景數(shù)據(jù)較少導(dǎo)致模型訓(xùn)練精度不夠等行業(yè)痛點(diǎn)。傳統(tǒng)“小模型”范式的應(yīng)用開發(fā)流程一般針對單一場景,獨(dú)此,應(yīng)用在定制化需求、長尾求下的開發(fā)效率較低,且模型精度、性能、可擴(kuò)展性等指標(biāo)質(zhì)量也會受到影響。隨著大模型的出現(xiàn),應(yīng)用開發(fā)流程轉(zhuǎn)變?yōu)?,調(diào)用通用流程、結(jié)合行業(yè)經(jīng)驗(yàn)、解決實(shí)際問題。服務(wù)商設(shè)施與PaaS平臺架構(gòu),為下提供以大模型為核心的數(shù)據(jù)處理、模型托管、模型訓(xùn)練、夠順利平臺服務(wù)獲得應(yīng)用的開、優(yōu)化及部署,將能力應(yīng)用滲透到各行各業(yè)的場景業(yè)務(wù)中。6橫琴粵澳深度合作區(qū)數(shù)鏈數(shù)字金融研究院,亞洲數(shù)據(jù)集能行業(yè)智能時(shí)代的生產(chǎn)力變革:AIGC產(chǎn)業(yè)應(yīng)用實(shí)踐,06/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E8%A1%8C%E4%B8%9A%E6%99%BA%E8%83%BDE6%97%B6%E4%BB%A3%E7%9A%84%E7%94%9F%E4%BA%A7%E5%8A%9B%E5%8F%98%E9%9D%A9%EF%BC%9AAIGC%E4%BA%A7%E4%B8%9A%E5%BA%94%E7%94%A8%E5%AE%9E%E8%B7%B5-DAFRI2023.7艾瑞咨詢.2023年中國AIGC產(chǎn)業(yè)全景報(bào)告,/report/202308/4227.shtml,2023.5圖2.2:MaaS行業(yè)應(yīng)用服務(wù)模式8Azure大廠,都已經(jīng)推出了服務(wù)。以微軟云的AzureOpenAI服務(wù)為例,就支持開發(fā)者調(diào)用OpenAI、、Codex和DALL-E等模型的API,來構(gòu)建、微調(diào)模型,為應(yīng)用提供支持。騰訊云從產(chǎn)業(yè)客戶需求場景出發(fā),依托騰訊云TI平臺打造模型精選商店。騰訊云已聯(lián)合行業(yè)頭部企業(yè),為十大行業(yè)輸出了超過50個(gè)解決方案,提供一整套模型服務(wù)工具鏈。傳統(tǒng)企業(yè)軟件服務(wù)商金蝶利用百企業(yè)管理產(chǎn)品金蒼穹GPT。2.3大模型行業(yè)術(shù)方案大語言模型在語言生成、知識利用、復(fù)雜推理等基礎(chǔ)能力上存在諸多問題,典型如幻覺、知識時(shí)效性、專業(yè)化生成能力較弱、推理不一致等問題應(yīng)用和技術(shù)方案提升大模型的穩(wěn)定性與一致性。2.3.1提示詞工程簡單來說,現(xiàn)階段基于架大模型,是根據(jù)輸入預(yù)測下8艾瑞咨詢.2023年中國AIGC產(chǎn)業(yè)全景報(bào)告,/report/202308/4227.shtml,2023.9/news/news_f4b252-cc8b-406d-98f7-05fbe1b48c22趙鑫,李軍毅,周昆,唐天一,文繼榮.大語言模型,https://llmbook-zh.github.io/,2024.6Promptengineering在很大程度上影響了大模型在下優(yōu)化的方法來生成合適的任務(wù)提示。提示格式。(1)清晰地表達(dá)任務(wù)目標(biāo)。在使用大模型時(shí)需要給出清明確的指令。具體來說一個(gè)清晰詳盡的任務(wù)描述中應(yīng)當(dāng)包含任務(wù)的各種要素輸入輸出數(shù)據(jù)和回復(fù)限制。(2)分解為簡單且詳細(xì)的子任務(wù)。將一個(gè)復(fù)雜任務(wù)分解為若干個(gè)相對獨(dú)立一定的順序處理這些子任務(wù),模型能夠逐步獲得最終的答案。(3)提供少樣本示例。在提中加入少量目標(biāo)任務(wù)的輸入輸出作為任務(wù)示間的語義映射關(guān)系,提升大模型解決復(fù)雜任務(wù)的能力。(4因此可以從數(shù)據(jù)可以幫助我們更有效地使用大模型完成特定任務(wù)。如Markdown語法、XML標(biāo)簽等。理任務(wù)時(shí),則需要更高級的提示策略。其中被廣泛應(yīng)的就是思維鏈(ChainofThought,)。為增強(qiáng)大模型在各類復(fù)雜推理任務(wù)上的等人設(shè)計(jì)了思維鏈的提趙鑫,李軍毅,周昆,唐天一,文繼榮.大語言模型,https://llmbook-zh.github.io/,2024X,Schuurmansal.in-of-ThoughtPromptingElicitsLanguageModels[J].2022.7了中間的推理步驟來指導(dǎo)從輸入到輸出的推理過程,即“輸入,推理步輸出”形式,也可稱為少樣本思維鏈提示(Few-ShotCoTthinkstepbystep.”之類的誘導(dǎo)性指令,讓大模型先生成思維鏈再回答問題來提高準(zhǔn)確Zero-ShotCoTSelf-Consistency(LeastMostpromptinLtM)提示策略可閱讀相關(guān)綜述。圖2.3.1:思維鏈提示樣例常用的提示工具有:PromptPerfect15、prompttools、promptfoo、FlowGPT等,更多相關(guān)工具見LearnPrompting。KojimaSM,al.LanguageModelsareners[J].2022.SahooSinghAK,al.ASurveyofPEngineeringLanguageModels:andApplications[J].2024.https://promptperfect.jina.ai///docs/intro82.3.2檢索生成增強(qiáng)供更多的專業(yè)知識作為上下文背成技術(shù)(Retrieval-AugmentedGeneration,RAG)通過整合外部數(shù)據(jù)庫的知識,成為一種高效的解決方案。RAG通過傳統(tǒng)的檢索方法,用外部來源的最新信息補(bǔ)充大模型的訓(xùn)練數(shù),確的回復(fù)。一個(gè)典型的RAG系統(tǒng)流程分為索引、檢索和生成:(1)索引:索引首先從不同格式的文件中提取原始數(shù)據(jù)將其轉(zhuǎn)換為統(tǒng)一的純文模型編碼為矢量表示,并存儲到矢量數(shù)據(jù)庫中。(2)檢索:檢索時(shí),系統(tǒng)將用戶查詢轉(zhuǎn)換為向量表示。然后進(jìn)行語義相似性檢索與問題最相關(guān)的前k個(gè)塊。(3)生成:將原始問題和檢索到的信息塊被合并為提示,一并輸入大模型生成最終答案。具體來講,RAG系統(tǒng)涉及多不同的組件,每個(gè)組件都需要精心設(shè)計(jì)和優(yōu)的選擇,RAG可3種類型則可以根據(jù)業(yè)務(wù)需求在原生RAG基礎(chǔ)上合理選擇擴(kuò)展組件和優(yōu)化策略。R類工具有JinaReaderScrapegraph-aiCrawl4AI等專門為大模型優(yōu)LewisE,Piktusal.tionknowledge-intensiveAdvancesProcessing2020,33:GaoXiongGaoX,al.LanguageModels:ASurvey[J].2023./jina-ai/reader/VinciGit00/Scrapegrapi9Unstructured、OpenParse濾等功能的RAG檢索API;有專用數(shù)據(jù)框架LlamaIndex和語義檢索的Haystack文檔理解構(gòu)建的RAG引擎RAG,也有用于RAG程序搭建的;綜合開發(fā)框架LangChain33及其衍生低代碼平臺Langflow34、Flowise35等;Cohere更推出了專為RAG微調(diào)優(yōu)化的大模型CommandR和RAG開發(fā)工具包。2.3.3智能體智能體(Agent)簡單來說可看作能感知環(huán)境及需求、進(jìn)行決策和執(zhí)行動Agent主要依賴于規(guī)則或強(qiáng)化學(xué)習(xí)的方法實(shí)現(xiàn)。前者容的Ant的核心思想是利用大模型的邏輯推理、工具應(yīng)用指令遵循等核心列執(zhí)行動作(Action)的解決方案,進(jìn)而簡化任務(wù)難度,執(zhí)行復(fù)雜推理任務(wù),豐富大模型在實(shí)際業(yè)務(wù)中的應(yīng)用場景。2023年3月,微軟發(fā)布Microsoft365Copilot,4月開源項(xiàng)目AutoGPT38發(fā)布,6月Lilian發(fā)布PoweredAutonomousAgents”,基于大模型的Agent的重要性逐漸成為業(yè)界共識、、/Unstructure/open-parsec/trieve/ruma/llama_index/infiniflow/ragflow/langchain-ai/langchain:///logspace-ai/langflow/FlowiseAI/FlowiseHuangX,LiuX,al.planningAsurvey[J].arXiv:2402.02716,2024.LilianLLMAutonomoushttps://lilianweng.github.io/posts/2023-06-23-agent/01/1091979/sam-altman-says-helpful-agents-are-poised-to-become-ais-killer-function/10。從技術(shù)角度Agent利用特定功能的工具,甚至評身的表現(xiàn)。核心組件一般包括記憶模塊(Memory)、規(guī)劃模塊(Planning)和執(zhí)行模塊(Execution)。(1)記憶模塊主要用于存儲智能體與環(huán)境的歷史交互記錄,包括短期記憶和長期記憶。短期記憶相當(dāng)于架構(gòu)約束下的上下文窗口內(nèi)的輸入信息。長期記憶類似于可以根據(jù)需要迅速查詢和檢索的外部向量存儲。(2)規(guī)劃模塊賦予智能體類似于人類的解決復(fù)雜任務(wù)的能力,即將復(fù)雜任收反饋影響未來行為,分為無反饋規(guī)劃和有反饋規(guī)劃。類規(guī)劃器基于高效的搜索算法,提供更可靠的規(guī)劃能力。ReAct的推理行動在環(huán)中”人類的價(jià)值和偏評估和改進(jìn),引入自我完善機(jī)制,通過迭代反饋和改進(jìn)來提高模型的輸出效果。)執(zhí)行模塊的目標(biāo)是將智能體的決策轉(zhuǎn)化為具體結(jié)果。它直接與環(huán)境互在行動決策過程中執(zhí)行https://www.deeplearning.ai/the-batch/issue-241/L,MaC,X,al.Asurveyolanguagemodelautonomousagents[J].ofComputerScience,2024,18(6):1-26.11API方模型、大模型自身的內(nèi)部知識等。最為知名的開發(fā)框架是LangChain其他框架包括BabyAGIAgentGPT等;多智能體框架AutoGen46、Met7等;輕量級框架有crewAI48、Agently49、phidata等;可視化工具有Flowi、Dify、Bisheng、FastGPT、coze等。更多相關(guān)內(nèi)容可見awesome-ai-agents。補(bǔ)齊了大模型短板的Agent更具備實(shí)用性,將是大模型重要落地方向。入R行的落地方案之一57。如摩根大通推出的FlowMind生成系統(tǒng),工作流分成2個(gè)階段第一階段為大模型設(shè)置上下文、描述等背景信,第二階段則是大模型識別用戶查詢意圖調(diào)用相應(yīng)的工具生成并執(zhí)行代碼。微軟Copilot則開放測試調(diào)用PowerAutomate,與本地系統(tǒng)集成執(zhí)行更加復(fù)雜的自動化任務(wù)Agent的工作流程將推動人工智能巨大的進(jìn)步——甚至可能超過下一代基礎(chǔ)模型”。/yoheinakajima/babyagiGPT/MetaGPT/M/phidatahq/phidata/FlowiseAI/Flowises:///langgenius/dify/dataelement/bisheng:///labring/FastGPTon/Z,Choal.FlowMind:AutomaticwithLLMs[C]//ProceedingsofACMInternationalonFinance.2023:73-81.with-power-automate-promising-to-banish-bog-tasks-thanks-to-aihttps://www.deeplearning.ai/the-batch/issue-41/122.3.4模型微調(diào)如2.3.2所述,大模型雖然在通用任務(wù)上有出色的表現(xiàn),但在一些細(xì)分專業(yè)一般進(jìn)行參數(shù)高效微調(diào)(Fine-tuning)。這種方法通過只訓(xùn)練型的微調(diào)方案有LoRa、適配器微調(diào)、前綴微調(diào)、提示微調(diào)等。測試與估等。基礎(chǔ)模型選擇可參考各大模型評測榜,如OpenLeaderboard61,ChatbotLeaderboard62,OpenCompass司南大模型評測等。訓(xùn)練數(shù)據(jù)集的構(gòu)建則是微調(diào)的重要一環(huán)。格式化數(shù)據(jù)集構(gòu)建主要有以下三種方法:(1)基于現(xiàn)有的證的任務(wù)數(shù)據(jù)集,如機(jī)器翻譯、情感分析、文本分類等。這些數(shù)據(jù)集通常有明確的標(biāo)注和結(jié)構(gòu),可以直接用于微調(diào)模型。這種方法的優(yōu)點(diǎn)是數(shù)據(jù)質(zhì)量高,標(biāo)注準(zhǔn)確,能夠快速驗(yàn)證模型在特定任務(wù)上的性能。(2)基于日常對話數(shù)據(jù)構(gòu)建。這類方法使用來源于實(shí)際對話的數(shù)據(jù),如社模型適應(yīng)更廣泛過濾敏感信息以及標(biāo)準(zhǔn)化對話格式。)基于合成數(shù)據(jù)構(gòu)建。合成數(shù)據(jù)是通過生成模型或規(guī)則程序生成的。這據(jù)可以通過數(shù)據(jù)增強(qiáng)技術(shù)、文本生成模型(如GPT)或者基于規(guī)則的法(如模板生成)來創(chuàng)建。盡https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard/home趙鑫,李軍毅,周昆,唐天一,文繼榮.大語言模型,https://llmbook-zh.github.io/,202413題,并且可以根據(jù)需要生成特定類型的數(shù)據(jù),具很高的靈活性。RAG和微調(diào)都是一種基礎(chǔ)大模型RAG在動態(tài)環(huán)境過擬合,泛化能力較弱。RAG最典型的應(yīng)用場景是類的智能客服,而微調(diào)域應(yīng)用選擇RAG還是微調(diào),取決于應(yīng)用環(huán)境中對數(shù)據(jù)動定制和計(jì)算能力的具體需求。更重要的一點(diǎn)是,提示詞工程、RAG、智能體和微調(diào)并不相互排型的能力。各個(gè)技術(shù)方案的綜合應(yīng)用是實(shí)現(xiàn)貼合場景的高性能業(yè)務(wù)應(yīng)用的最佳方法。圖2.3.4:與微調(diào)的方案選擇2.4大模型行業(yè)應(yīng)用案例雖然目前生成式人工智能主要應(yīng)用于面向業(yè)工作流程增加情景感知和類似于人類的決并徹底改變我們的商業(yè)模式。例如,谷歌的客服中心人工智能(CCAI)旨在幫助實(shí)現(xiàn)采用自然語言進(jìn)行客戶GaoXiongGaoX,al.LanguageModels:ASurvey[J].2023.14服務(wù)交互,而的BioNeMo則可以加速新藥的研發(fā)。華為盤古氣象大模型也已應(yīng)用于歐洲中期天氣預(yù)報(bào)中心。隨著生成人工智能的不斷推廣和應(yīng)用,其產(chǎn)生的深遠(yuǎn)影響和潛在價(jià)值正在加推動從實(shí)驗(yàn)到消費(fèi)者領(lǐng)域再到企業(yè)領(lǐng)域的應(yīng)用。據(jù)多樣性強(qiáng)的行業(yè)能夠?yàn)榇竽P吞峁┏渥愕挠?xùn)練和微調(diào)的數(shù)據(jù),而技術(shù)需求、創(chuàng)新能力強(qiáng)、競爭激烈的行業(yè)自身就有著擁抱新技術(shù)的熱情,這些因素決定下大模型在各國、各行業(yè)的成熟度并不一致,在各個(gè)應(yīng)用落地的表現(xiàn)也有所不同。交通等領(lǐng)域落地應(yīng)用,行業(yè)滲透率來看,金融業(yè)的滲透率最高,已達(dá)78%在微軟、金山辦業(yè)的滲透率較低。圖2.3大模型垂直應(yīng)用行業(yè)用成熟度67StripeBloom鈦媒體.2023中美大模型應(yīng)用比較研報(bào)告,/news/newsdetail/68671,2023.鈦媒體.2023中美大模型應(yīng)用比較研究報(bào)告,/news/newsdetail/68671,2023.15科學(xué)領(lǐng)域如Profluent、absci;能源行業(yè)如C3i開始將生成式應(yīng)用到內(nèi)容創(chuàng)建、知識發(fā)現(xiàn)、智能客服等場景,引領(lǐng)了行業(yè)企采用新一代的風(fēng)潮。大模型在垂直領(lǐng)域應(yīng)用的案例不斷涌現(xiàn),業(yè)應(yīng)用可見相關(guān)文獻(xiàn)、、、、7、、。2.4.1醫(yī)藥健康醫(yī)學(xué)方面,ChatDoctor是一個(gè)在LLaMA上微調(diào)的醫(yī)學(xué)領(lǐng)域大模型。在相關(guān)研究中,研究團(tuán)隊(duì)從在線醫(yī)療咨詢網(wǎng)站“HealthCareMagic”收集了約10萬條真從在線醫(yī)療咨詢網(wǎng)站iCliniq2收集了大約1萬條醫(yī)患對話用于評估模型的性能。中包括大約700種疾病ChatDoctor可以檢索相應(yīng)的知識和當(dāng)?shù)膒rompt讓ChatDoctor“靈心”的心理陪伴機(jī)器人,研究團(tuán)隊(duì)構(gòu)建了超過15萬規(guī)模的單輪長文本心理咨騰訊研究院.向而行共筑新質(zhì)生產(chǎn)力行大模型調(diào)研報(bào)告,/news/newsdetail/68815,2024.IDC&亞馬遜云科技.2024生成白皮書,/document/731681598/Idc-%E4%BA%9A%E9%A9%AC%E9%80%8A%E4%BA%91%E7%A7%91%E6%8A%80-2024%E7%94%9F%E6%88%90%E5%BC%8Fai%E7%99%BD%E7%9A%%B9%A6,2024.人民網(wǎng)財(cái)經(jīng)研究國AI大模型產(chǎn)業(yè)發(fā)展報(bào)告,/jiankang/nineteepdf,2024深圳市人工智能行業(yè)協(xié)會.2024人工智能發(fā)展白皮書,/?d=hld&type=f&time=1716431584387&id=7026569&name=%E3%80%8A2024%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%8F%9E5%B1%95%E7%99%BD%E7%9A%AE%E4%B9%A6%E3%80%8B.pdf,2024.北京學(xué)技術(shù)委員會等.北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)cn/ywdgzdt/202311/t20231129_3321720.html,2023量子位智庫.2024中國AIGCs/5R1Y3M5DsFuWuv_bFH821Q,2024.https://www.blog.aiport.tech/p/the-first-truly-global-gene2024TheBusinessImpact,UseCases,tps://blazpregelj.si/2024-hampton-ai-business-report-uses-tools-and-business-impact/,2024趙鑫,李軍毅,周昆,唐天一,文繼榮.大語言模型,https://llmbook-zh.github.io/,2024.LiLiZ,ZhangK,al.Chatdoctor:medicalchatmodelfine-tunedonalargelanguagemodelmeta-ai(llama)medicaldomainknowlede[J].2023,15(6).16詢指令與答案,回答數(shù)量超過50萬(指令數(shù)是當(dāng)前的常見的心理咨詢數(shù)據(jù)集PsyQA的6.7ChatGPT與GPT4100萬輪次的多輪回SoulChatCorpus-multi_turnChatGLM-6B作為初始化模型,提供合理建議的能力2024年5月,Google發(fā)布了基于Gemini模型家族的多模態(tài)醫(yī)學(xué)模型Med-Gemini,通過自訓(xùn)練微調(diào)和網(wǎng)絡(luò)搜索集成進(jìn)行高級推理,通過微調(diào)和自定義編碼器提高多模態(tài)理解,使用推理鏈進(jìn)行長文本處理有可以直接比較的基準(zhǔn)測試中都超過了系列模型。諸多醫(yī)藥公司將人智能視為核心戰(zhàn)略,如制藥巨頭禮來公司(EliLillyandCompany)宣布一系列人工智能藥物發(fā)現(xiàn)合作伙伴關(guān)系;諾和諾德(NoNonordisk)視作加速藥物開發(fā)2022年以來一直與微軟合作構(gòu)建現(xiàn)來指導(dǎo)心血管疾病治療靶基因的開發(fā)。2.4.2金融保險(xiǎn)用OpenAI規(guī)模2024年5Chase)發(fā)布了生成主題投資籃子的人工智能工具IndexGPT。IndexGPT使用OpenAI的不僅分析新聞文析復(fù)雜的金融、展投資視野至非傳統(tǒng)企業(yè),制定多樣化的主題投資策略和萬事兩家金融服務(wù)企業(yè)均將最新的人工智能技術(shù)應(yīng)用于欺詐檢測方面,預(yù)測交易是否合法。保險(xiǎn)業(yè)聯(lián)合健康(UnitedHealthGroup)正在使用人工智能和自然語言處理來/scutcyr/SoulChatSaabK,WH,al.CapabilitiesofGeminMedicine[J].arXivpreprintarXiv:2404.18416,2024./s/l30sz3-fMmL8gnF4-fMA_A.8283igence/2024/jpmorgan-chase-unveils-ai-powered-tool-thematic-i17式加強(qiáng)人工智能最新技術(shù)在企業(yè)內(nèi)的應(yīng)用。2.4.3文化教育文化教育領(lǐng)域中,Legible將Open的ChatGPT集成到其專有的電子書店搜索引擎中,提供一個(gè)全新的方式來訪問其目錄中的兩百萬本電子書。LibrarianAI可用任何語言流利地交談,提供快速、友好、全面地響應(yīng)和建議以及有關(guān)圖書內(nèi)容的信息Storybird102023年9月28日動“清華大學(xué)人工智能能教學(xué)試點(diǎn)課程工作方案”,智能助教系統(tǒng)使用模型為技術(shù)底座,通過學(xué)科專業(yè)資料搭建垂直模型,并輔助知識庫,支持個(gè)性化學(xué)習(xí)支持、智能評估和反饋,輔助學(xué)生進(jìn)行深入思考。北京郵電大學(xué)于2024年初發(fā)布基于訊飛科技文獻(xiàn)領(lǐng)域大模型的科研助手,幫助科研人員進(jìn)行深入的科研成果調(diào)研并進(jìn)行智能分析,通過對話方式深入探索文獻(xiàn)內(nèi)容,生成研究文獻(xiàn)綜述。國內(nèi)外數(shù)據(jù)庫產(chǎn)商或?qū)W術(shù)搜索服務(wù)商也都推出了各類應(yīng)用助手,如Scopus88、ElsevierSciBiteChat89、CNI學(xué)術(shù)研究助手90、SciSpace91、Elicit92、AminerReadPaper等。此外,中國科學(xué)院文獻(xiàn)情報(bào)中心與科大訊飛合作研發(fā)”三大功能的星火科研。同方知網(wǎng)則與華為共同打造了全棧自主可控的中華知識/s/l30sz3-fMmL8gnF4-fMA_As://beta.legible.ai/auth/signin:///a/ziyuan/dianziziyuan/AIkeyanzhushou//https://typeset.io///news/fwcx/202311/t2023110_6915220.html18大模型——。電子書閱讀APP微信讀書和得到則在2024年上半年灰度上線了功能。前者遺產(chǎn)方面,字節(jié)跳動和北京大學(xué)推出的識典古籍于2024年3月上線了基于云雀大語言模型開發(fā)的古籍智能助手”“助手助手”Livdeo的MultilingualAudioChatbotsfMuseumsandulturalInstitutions利用和藝術(shù)名人進(jìn)行多語種的對話,為參觀者提供獨(dú)特的互動體驗(yàn)//the-ai-revolutiohits-museums-how-chatbots-are-transforming-the-visitor-experience-e054df5b992f19第三章大模型對圖館的影響3.1圖書館大模型影響分析生成式人工智能的發(fā)展可能對圖書館產(chǎn)生廣泛而深刻”模型技術(shù)的能力與影響,有助圖書館中應(yīng)用最新的技術(shù),為智慧圖書館建設(shè)提供新的技術(shù)路徑和賦能支撐。人工智能特別興趣小組在2023年月20告特別提到了人工智能技術(shù)在圖書館中的應(yīng)用,包括館藏資源的規(guī)?;枋觥⒌膬?yōu)化,以及提升公眾素養(yǎng)等方面,對圖書館系統(tǒng)、用戶、館藏、、元數(shù)據(jù)、設(shè)施、推廣、培訓(xùn)、策劃團(tuán)隊(duì)都有重要影響。大模型被廣泛考慮作為多種任務(wù)的通用工具,這歸功于大模型的核心能力,報(bào)告從大模型的核心能力出發(fā),考慮對圖書館行業(yè)主要業(yè)務(wù)具體影響。著的自動化和智動了人工智能技術(shù)廣泛應(yīng)用和持續(xù)創(chuàng)新。表3.1從大模型典型任務(wù)能力出發(fā),分析其在圖書館中的作用和影響。通過的創(chuàng)和發(fā)展。作用影響的圖書館領(lǐng)域包含了參考咨詢、資源發(fā)現(xiàn)、學(xué)術(shù)服務(wù)、/g/ai/developing-a-library-strategic-response-to-artificial-intelligence/上海圖書館(上??茖W(xué)技術(shù)情報(bào)研究所)等智慧圖書館大模型創(chuàng)新與應(yīng)用白皮書,/do20的效果與能力。表3.1任務(wù)功能對圖書館的作用影響大模型典型任務(wù)功能作用與影響影響領(lǐng)域舉例自動生成各類文檔、報(bào)告、新聞稿等,文本生成輔助圖書館內(nèi)容創(chuàng)作和信息發(fā)布??捎脤W(xué)術(shù)研究、閱讀推廣等于創(chuàng)作、學(xué)習(xí)與開發(fā)。理解用戶查詢的深層含義,提供更精準(zhǔn)語義理解的咨詢回復(fù)、搜索結(jié)果等信息服務(wù)??尚畔z索、交互問答用于問答式交互。信息抽取可探索對話式發(fā)現(xiàn),改變圖書館資源檢索、資源推薦模式。檢索推薦、資源發(fā)現(xiàn)等任務(wù)推理理解并執(zhí)行復(fù)雜的用戶指令,自動化完成特定的圖書館服務(wù)任務(wù)。圖書館服務(wù)平臺、后端系統(tǒng)AI升級、機(jī)器流程自動化等機(jī)器翻譯將不同語言的文獻(xiàn)資料進(jìn)行互譯,擴(kuò)大服務(wù)范圍和讀者群體??捎糜谡Z言文獻(xiàn)服務(wù)、跨語言閱讀。讀者服務(wù)、文獻(xiàn)服務(wù)、學(xué)術(shù)研究等識別分類對圖書館資源進(jìn)行自分類、自動標(biāo)注、元數(shù)據(jù)創(chuàng)建,優(yōu)化源組織和檢索效率。采編、數(shù)字資源加工與開發(fā)、數(shù)字人文研究等總結(jié)摘要自動生成文獻(xiàn)或報(bào)告的摘要,幫助用戶快握核心內(nèi)容。資源發(fā)現(xiàn)、學(xué)術(shù)研究等息轉(zhuǎn)換為圖像或視頻,增強(qiáng)信模態(tài)轉(zhuǎn)換息可訪問性和表達(dá)力。可用于多媒體檔案保存、內(nèi)容制作、信息可視化、閱閱讀推廣、數(shù)字人文等讀障礙支持。數(shù)據(jù)分析可進(jìn)行數(shù)據(jù)處理、格式轉(zhuǎn)換、報(bào)表分析、指標(biāo)分析、數(shù)據(jù)挖掘??稍趫D書館數(shù)據(jù)系統(tǒng)、數(shù)據(jù)中臺基礎(chǔ)上,構(gòu)建AI數(shù)據(jù)業(yè)務(wù)分析、用戶行為分析、決策支持等分析能力,提升運(yùn)營效率。知識圖譜構(gòu)可構(gòu)建和維護(hù)知識圖譜,增強(qiáng)圖書數(shù)字人文、知識管理、學(xué)術(shù)研建知識管理和服務(wù)能力。究、學(xué)科服務(wù)等21大模型技術(shù)對圖書館的影響,主要源于生成式變革了技術(shù)服務(wù)模式和內(nèi)容生產(chǎn)方式,從而帶來了三點(diǎn)重要改進(jìn)。一是人機(jī)交互界面的革新推動了圖式變革了用戶與圖書館服務(wù)動方式,實(shí)現(xiàn)了用戶界面的突破,使得用戶型能準(zhǔn)確理解用戶需求,轉(zhuǎn)化為任務(wù),調(diào)度資源,最終清晰呈現(xiàn)結(jié)果。成式能夠?qū)崿F(xiàn)精準(zhǔn)的語義理解和復(fù)雜的文本分析,自動化地生成和豐富元內(nèi)容處理,加之其趨勢預(yù)測與模式識別功能,極大地提升了圖館在知識組織、知識管理與服務(wù)。的強(qiáng)大的內(nèi)容生成和處理能力,圖書館能夠自動化執(zhí)行繁瑣的任務(wù),從而釋放人力資源,提升工作效率和服務(wù)質(zhì)量。生成式技術(shù)實(shí)現(xiàn)了知識的高效模式現(xiàn)有數(shù)據(jù)知識生成豐富多樣的內(nèi)容,包括多模態(tài)內(nèi)容。性。(1面向?qū)υ捠浇换サ膮⒖甲稍儭⑽墨I(xiàn)檢索與知識服務(wù)。(2)變知識集成方式。大模型技術(shù)通過自動化生成元數(shù)據(jù)、跨語言處理、知度、互聯(lián)互通的知識網(wǎng)絡(luò),從而促進(jìn)了知識的現(xiàn)和創(chuàng)新。(3自動標(biāo)注與分類、自動摘要總結(jié)、知識圖譜構(gòu)建等,提高了圖書資源加工效率,22模式轉(zhuǎn)變,進(jìn)一步提高圖書館資源加工的效率和質(zhì)量。(4特色資源等歷史文化特色館藏資源進(jìn)行開發(fā)、挖掘、利用,充分發(fā)揮語料價(jià)值,文化,激發(fā)這些資源的文化影響力。(5)提升圖書館管理決策能力。大模型應(yīng)用可以更好地對圖書館的各項(xiàng)業(yè)務(wù)數(shù)理決策更加科學(xué)、合理和有效。圖3.1大模型技術(shù)對圖書館的影響3.2書館大模型應(yīng)用策略在入思考圖書館大模型應(yīng)用之前,有必要探討生成式的應(yīng)用策略及應(yīng)用方式。國際圖聯(lián)(IFLA)在其《圖書館對人工智能戰(zhàn)略響應(yīng)》中,提出了三項(xiàng)策略建議,旨在指導(dǎo)圖書館如何有效利用I技術(shù),提升服務(wù)效能,同時(shí)確保其應(yīng)用的倫理性和可解釋性。三項(xiàng)策略分用圖書館的能力構(gòu)建負(fù)責(zé)任且可解釋的描述性應(yīng)用;利用圖書館員的數(shù)據(jù)能力增強(qiáng)組織的能力;23推廣人工智能素養(yǎng)以提升組織和社會的能力。此外,美國國會圖書館(LibraryofCongress系統(tǒng)中數(shù)據(jù)、模型和人員三個(gè)要素的重要性,并提出了理解、實(shí)驗(yàn)和實(shí)施”分階段的方法論,以實(shí)現(xiàn)負(fù)責(zé)任的實(shí)踐。圖書館可在上述權(quán)威性應(yīng)用策略的指導(dǎo)下進(jìn)行實(shí)踐,本報(bào)告歸納了如下的策略要點(diǎn)供圖書館進(jìn)行參考:(1)考慮館藏與數(shù)據(jù)價(jià)值籍和特藏,明確可以優(yōu)先應(yīng)用技術(shù)的數(shù)據(jù)。高度重視數(shù)據(jù)治理,包括數(shù)據(jù)清操作性(2)進(jìn)行概念驗(yàn)證與服務(wù)轉(zhuǎn)化實(shí)施小規(guī)模的概念驗(yàn)證項(xiàng)目,以測試生成式技術(shù)在圖書館服務(wù)中的可行性。對于技術(shù)挑戰(zhàn)(例如圖像分類等)開發(fā)或整合高效的算法,提升處理的精確度。成功的概念驗(yàn)證項(xiàng)目應(yīng)轉(zhuǎn)化為可持續(xù)的服務(wù),以實(shí)現(xiàn)技術(shù)的長期價(jià)值。(3)持續(xù)監(jiān)控與質(zhì)量保證建立監(jiān)控機(jī)制,根據(jù)反饋持續(xù)改進(jìn)服務(wù),確保服務(wù)質(zhì)量??紤]使用數(shù)據(jù)為中心的評估方法,通過科學(xué)地評估和測試,確保系統(tǒng)的穩(wěn)定性和可靠性。(4)積極培訓(xùn)與參與提升圖書館用戶的素養(yǎng),并通過社區(qū)反饋優(yōu)化服務(wù)。支持并參與來自不同機(jī)構(gòu)的獨(dú)特資源和專業(yè)知識。(5)好經(jīng)濟(jì)性與工具評估對技術(shù)應(yīng)用進(jìn)行成本效益分析,確保所選工具解決方案在預(yù)算內(nèi)提供能夠最大化投資回報(bào)率的工具。(6)關(guān)注法律與倫理框架確保應(yīng)用遵守所有相關(guān)的法律法規(guī),特別是在數(shù)據(jù)保護(hù)、版權(quán)和知識產(chǎn)/g/ai/developing-a-liry-strategic-response-to-artificial-intelligence//thesignal/2023/11/introucing-the-lc-labs-artificial-intelligence-planning-framework/24權(quán)方面。建立倫理審查流程,確保應(yīng)用不會侵犯個(gè)人隱私,避免算法偏見和歧視。3.3圖書館大模型應(yīng)用路徑技術(shù)應(yīng)用于智慧圖書館中,以實(shí)現(xiàn)圖書館服務(wù)業(yè)務(wù)的智能化升級。本報(bào)告歸納了圖書館整合和應(yīng)用生成式技術(shù)的六種方式路徑。(1)無需開發(fā)集成的服務(wù):圖書館無需進(jìn)行任何開發(fā)工作,重點(diǎn)放在素養(yǎng)、而是側(cè)重于通過館員組織培訓(xùn)、活動等方式向用戶和社會提供I服務(wù)。該路徑無需系開發(fā)、無需數(shù)據(jù)處理。(2直接集成第三方提供的產(chǎn)品的性能和適用性,為圖書館直接所用。例如不少圖書館上線資源商開發(fā)的學(xué)術(shù)助手開發(fā)量低、幾乎無需數(shù)據(jù)處理。(3產(chǎn)品的對接。該應(yīng)用方式下,圖書館需要對運(yùn)營數(shù)據(jù)、服務(wù)數(shù)據(jù)、資源數(shù)據(jù)等進(jìn)行一定程度的適配和優(yōu)化,以確保產(chǎn)品與圖書館平臺服務(wù)無縫集成。例如基于圖書館資的數(shù)據(jù)處理任務(wù)。4和系服務(wù)數(shù)據(jù)、資源數(shù)據(jù)進(jìn)行分析、處理,提供支持的果展現(xiàn)、建議決策等。服務(wù)平臺(LSP)副駕駛等。該方式面臨著發(fā)工作和數(shù)據(jù)處理任務(wù)。(5/聯(lián)合開發(fā)的原生應(yīng)用:圖書館利用自身館藏?cái)?shù)據(jù)、用戶數(shù)據(jù),投入資源,開發(fā)新型前后端的原生應(yīng)用。此類應(yīng)用需要對圖書館資源數(shù)據(jù)進(jìn)25路徑開發(fā)工作量大,數(shù)據(jù)處理任務(wù)重。(6求。該路徑需要深度的數(shù)據(jù)準(zhǔn)備和技術(shù)研發(fā)能力。圖3.3圖書館模型應(yīng)用的六種路徑舉例方式來應(yīng)用人工智。對于路徑1,在推廣人工智能素養(yǎng)方面發(fā)揮領(lǐng)導(dǎo)作用,是當(dāng)前最符合現(xiàn)有圖書館實(shí)踐和圖書館員身份的策略。對于路徑2-5,在實(shí)施負(fù)責(zé)任的應(yīng)用時(shí),建議多數(shù)圖書館基于MasS行應(yīng)用。對于路徑6,要求圖書館具備一定的資源能力、技術(shù)能力或研究能力。語模型提供服務(wù)/blog/2023/01/23/sweden-library-ai-open-source/26源和知識服務(wù)智能化。資源的最優(yōu)配置和利用效率的最大化。對于技術(shù)基礎(chǔ)較弱或希望快速實(shí)現(xiàn)服務(wù)的圖書館,可以考慮從集成第三方服務(wù)開始,逐步積累經(jīng)驗(yàn)和技術(shù)能力。對于具有較強(qiáng)技術(shù)實(shí)力和研究背景的圖書館,可以考慮自主研發(fā)或聯(lián)合開發(fā)A保應(yīng)用能夠切實(shí)解決問題、提升服務(wù)體驗(yàn)的前提。此外,險(xiǎn)評估與管理是保障應(yīng)用穩(wěn)健性的重要環(huán)節(jié),圖書館需制定相應(yīng)的風(fēng)險(xiǎn)管策略,以應(yīng)對潛在的技術(shù)風(fēng)險(xiǎn)和道德挑戰(zhàn)。為了適應(yīng)技術(shù)的快速發(fā)展,圖書館還需制定長期的技術(shù)發(fā)展規(guī)劃,以保持其服務(wù)的前瞻性和競爭力。3.4圖書館大模型應(yīng)用范式圖書館通過上述六種實(shí)施路徑,在應(yīng)用策略方針的指導(dǎo)下,成功地運(yùn)用并實(shí)施生成式技術(shù),以此深入慧圖書館的轉(zhuǎn)型。這一轉(zhuǎn)型主要體現(xiàn)在兩種成技術(shù)進(jìn)行重塑,提高了服務(wù)質(zhì)量和流程效率;另一方面,圖書館開創(chuàng)開發(fā)原生應(yīng)用,推書館服務(wù)智能化跨越式發(fā)展。這正對應(yīng)了《智慧圖書館大模型創(chuàng)新與應(yīng)用智慧圖書館+智慧圖書館”兩種不同的應(yīng)用范式。統(tǒng)應(yīng)用的技術(shù)得到增強(qiáng)輔助的采編流程、數(shù)字資源的加工與開發(fā)等,通過化現(xiàn)有工作流程,提升型的智能化能力實(shí)現(xiàn)服務(wù)和效率的雙重提升大模型”的應(yīng)用范式。/rmydb/202310/t20231017_512798.html上海圖書館(上海科學(xué)技術(shù)情報(bào)研究所)等智慧圖書館大模型創(chuàng)新與應(yīng)用白皮書,/do27開發(fā)原生應(yīng)用:關(guān)于原生應(yīng)用這一概念并沒有準(zhǔn)確的定義,仍存在不同支撐的應(yīng)用。這一類應(yīng)用直接根植于生成式技術(shù)最核心的能力,如提供個(gè)性化服務(wù)和內(nèi)容創(chuàng)新創(chuàng)造。典型的應(yīng)用例如智能聊天機(jī)器人、寫作助手、原生應(yīng)用如:研究助手、個(gè)性化學(xué)術(shù)教練等,為用戶提供定制化的信息和5聯(lián)合開發(fā)的圖書館個(gè)體的特色性。隨著技術(shù)的不斷發(fā)展,越來越多的原生應(yīng)用將被開應(yīng)用,智慧圖書館中的大模型應(yīng)用則逐漸由“+大模型”向“大模型+”范式轉(zhuǎn)變。當(dāng)然,原生應(yīng)用中還包括了智未觸及的應(yīng)用領(lǐng)域。盡當(dāng)前尚未廣泛實(shí)程自動化、具身智能應(yīng)用以及高智能員工等概念。這些潛在應(yīng)用有望進(jìn)一步發(fā)展機(jī)遇。圖3.4圖書館“+大模型”+”應(yīng)用范式283.5圖書館大模型技術(shù)架構(gòu)高度擴(kuò)展性和集成性,以滿足圖的發(fā)展和創(chuàng)新需求。足圖書館的發(fā)展和創(chuàng)新需求。圖3.5圖書館大模型技術(shù)架構(gòu)(1)底座層:硬件方面要考慮GPU或CPU設(shè)備,還要關(guān)注最新的硬件進(jìn)展。例如,的TensorRT是一個(gè)為深度學(xué)習(xí)推理優(yōu)化的軟件庫,而Intel的VINO則提供了跨不同硬件的推理優(yōu)化。在選擇云端本地部署時(shí),AzureAWS提供的容器務(wù)和(K8S于實(shí)現(xiàn)資源的彈性伸縮和智能調(diào)度。(2MaaS)的兼容性。模式涉及模型的全生命周期管理,從數(shù)據(jù)處理到特征工程,再29到模型訓(xùn)練、調(diào)優(yōu)和部署。此外,模型服務(wù)還包括API和開發(fā)工具,以便于開的管理辦法,如《生成式人工智務(wù)管理暫行辦法》。(3)平臺層:平臺層的設(shè)計(jì)應(yīng)支持與現(xiàn)有圖書館服務(wù)平臺、數(shù)字人文平臺等的集成,并能夠通過API網(wǎng)關(guān)與各類信息化應(yīng)用對接。模塊化的大模型應(yīng)用框架,如Langchain、Dify和FastGPT,提供了易于擴(kuò)展和定制的能力。運(yùn)維工具如LangSmith和PromptLayer,監(jiān)控工具如arize、fiddler和Helicone,以及防火墻如arthur,都是平臺層的重要組成部分,確保大模型應(yīng)用的穩(wěn)定性和安全性。(4應(yīng)用層:應(yīng)用層的設(shè)計(jì)應(yīng)包含應(yīng)用框架和數(shù)據(jù)管理提供應(yīng)用級的基LangChain提供了一個(gè)用于構(gòu)建和部署大模型應(yīng)用的框架。數(shù)據(jù)管理工具如LlamaIndex和MindsDB,可以幫助組織和檢索大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。向量數(shù)據(jù)庫如chroma、Milvus和Weaviate,對于處理和索引大規(guī)模的向量數(shù)據(jù)尤其重要。此外,應(yīng)用和工作流工具如Retool、Streamlit和gradio,可以用于快速開發(fā)和部署基于大模型的應(yīng)用程序。本內(nèi)容生成、圖多媒體處理、數(shù)據(jù)處理與分析,以及工作流編排和管理等。通過構(gòu)建這些功活性和管理效率,以滿足不斷演化的圖書館服務(wù)需求。30第四章智慧圖書館中大模型應(yīng)用圖書館應(yīng)積極關(guān)注并推動生成式的創(chuàng)新應(yīng)用和場景落地,尤其要關(guān)注大模型技術(shù)如何有效提升服務(wù)成效和服務(wù)量。雖然大型模型技術(shù)仍在持續(xù)迭代,生成式技術(shù)也在不斷發(fā)展之但圖書館可以積極思考挖掘大模型技術(shù)在智展的主動權(quán)。發(fā)展現(xiàn)狀,下文重點(diǎn)梳理智慧圖書館建設(shè)中,那些當(dāng)前可實(shí)驗(yàn)、施或展望的應(yīng)用。圖智慧圖書館中的可實(shí)驗(yàn)、實(shí)施或展望的大模型應(yīng)用上海圖書館(上??茖W(xué)技術(shù)情報(bào)研究所)等智慧圖書館大模型創(chuàng)新與應(yīng)用白皮書,/do314.1智慧服務(wù)中的大模型應(yīng)用在智慧服務(wù)中主要集中在增強(qiáng)客戶體驗(yàn),體現(xiàn)在如下幾個(gè)領(lǐng)域:一是智慧讀者服務(wù)的智能升級。通過自然語言處理技術(shù)提供智能問答服務(wù)、個(gè)性化推薦等,帶來讀者服務(wù)中的咨詢問答、檢索發(fā)現(xiàn)、資源推薦的智能升級。這些應(yīng)用已經(jīng)開始由圖書館廠商開發(fā)并逐步推向市場。與學(xué)科“學(xué)術(shù)助手”“AI助教”為典型的應(yīng)用也已在市場推出。三是驅(qū)動圖書館創(chuàng)新服務(wù)。通過激活自有數(shù)據(jù)價(jià)值,結(jié)合元宇宙等新技術(shù),領(lǐng)域開辟新的前沿。這類應(yīng)用目前主要體現(xiàn)在結(jié)合特藏的數(shù)字館員服務(wù)、閱讀產(chǎn)品創(chuàng)新體驗(yàn)、知識服務(wù)等領(lǐng)域。下。(1)傳統(tǒng)服務(wù)賦能領(lǐng)域1:智慧咨詢服務(wù)目標(biāo):使用大模讀者提供準(zhǔn)確、實(shí)時(shí)的信息咨詢服務(wù)。模型能力:問答、搜索/信息抽取等館咨詢詢、動咨詢、用戶使用咨詢、使用故障解決等。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域2:智能檢索與發(fā)現(xiàn)注:本章中所呈現(xiàn)的目標(biāo)設(shè)定、應(yīng)用建、模型能力、技術(shù)方案、應(yīng)用路徑旨在提供參考,并非唯一確定的解決方案。32目標(biāo):運(yùn)用大模型幫助讀者快速、準(zhǔn)確地發(fā)現(xiàn)和檢索到他們所需的信息和資源。模型能力:問答對話、搜索/信息抽取等發(fā)現(xiàn)。引入智慧增強(qiáng)功能,優(yōu)化過程,借助自然語言處理和多輪對話系統(tǒng),使讀者能夠以更直觀、更高效的方式來發(fā)現(xiàn)館藏的紙質(zhì)和數(shù)字資源。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域3:個(gè)性化智能推薦目標(biāo):通過大模型技術(shù),為讀者提供全新智能化的書籍和資源薦。模型能:問答對話、搜索/信息抽取、數(shù)據(jù)分析等據(jù)庫推薦知識庫。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域4:智慧學(xué)術(shù)模型能力:問答對話、搜索/信息抽取、文本理解、機(jī)器翻譯、數(shù)據(jù)挖掘、數(shù)據(jù)分析、文本生成等建議源,發(fā)現(xiàn)潛在的研究方向和創(chuàng)新點(diǎn),幫助實(shí)現(xiàn)個(gè)人文管理與知識研究智能化,據(jù)庫供應(yīng)商是否提供相關(guān)功能。改進(jìn)圖領(lǐng)域的特色專題服務(wù),提供基于學(xué)科領(lǐng)域的數(shù)據(jù)分析、知識圖譜問答服務(wù)。技術(shù)方案:提示詞工程、RAG、智能體33應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域5:智慧情報(bào)服務(wù)目標(biāo):運(yùn)用大模型提供更加豐富慧的情報(bào)服務(wù)產(chǎn)品。模型能力:問答對話、搜索/信息抽取、文本理解、機(jī)器翻譯、數(shù)據(jù)挖掘、數(shù)據(jù)分析、文本生成等服務(wù)效。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域6:智慧教學(xué)與學(xué)科服務(wù)服務(wù)的智能化水平,以實(shí)現(xiàn)個(gè)性化學(xué)習(xí)和研究支持。模型能力:問答對話、搜索/信息抽取、文本理解、機(jī)器翻譯、數(shù)據(jù)分析、文本生成等建議:提供學(xué)手,增強(qiáng)個(gè)性化學(xué)習(xí)路徑規(guī)劃、互動式學(xué)習(xí)體驗(yàn)、學(xué)習(xí)效學(xué)方法改進(jìn)提供決策支持。技術(shù)案:提示詞工程、RAG、智能體、模型微調(diào)應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)產(chǎn)品與服務(wù)、集成定制開發(fā)的后端流程、自主/聯(lián)合開發(fā)的生應(yīng)用(2)創(chuàng)新服務(wù)驅(qū)動領(lǐng)域7:虛擬人、數(shù)字人、數(shù)字館員34用戶體驗(yàn)感。模型能力:問答對話、搜索/信息抽取語音識別與合成等建議:利用虛擬人和數(shù)字館員實(shí)4/7在線咨詢服務(wù),提供及時(shí)且準(zhǔn)確的信息Agent數(shù)字館員升級。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)與服務(wù)領(lǐng)域8:智慧創(chuàng)新閱讀與體驗(yàn)?zāi)繕?biāo):利用大模型為廣大讀者提供新穎、智慧的新型閱讀體驗(yàn)服務(wù)。模型能力:問答對話、搜索/信息抽取、文本生成、圖像與語音識別、多模態(tài)創(chuàng)作等建議:需要開拓創(chuàng)新。除了引入閱讀工具輔助文獻(xiàn)閱讀外,可重點(diǎn)結(jié)合閱讀推廣服務(wù),開發(fā)創(chuàng)新型閱讀體驗(yàn),例如基于特色館藏的AIChatbot,融入增強(qiáng)元宇宙沉浸式閱讀的互動性等。技術(shù)方案:提示程、RAG、智能體應(yīng)用路徑:直接用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)品與服務(wù)、自主/聯(lián)合開發(fā)的原生應(yīng)用領(lǐng)域數(shù)據(jù)與知識服務(wù)產(chǎn)品目標(biāo):發(fā)揮圖書館專有數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)設(shè)施優(yōu)勢,構(gòu)全新數(shù)據(jù)服務(wù)、知識服務(wù)、模型語料提供等,提高知識的傳遞能力模型能力:問答對話、搜索/信息抽取、文本別、知識圖譜理解與構(gòu)建、內(nèi)容生成等35間層和應(yīng)用層產(chǎn)品,通過跨界合資源整合、服務(wù)對象拓展,提供基于的人文知識服務(wù)、深度解析服務(wù)、藝術(shù)及文學(xué)作品溯源服務(wù),提供諸如古籍解讀、碑帖識別、歷史人/物識別、人文創(chuàng)作體驗(yàn)服務(wù)等。技術(shù)方案:提示詞工程、RAG、智能體、模型微調(diào)應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)、自主/聯(lián)合開發(fā)的原生應(yīng)用、參與研發(fā)行業(yè)基礎(chǔ)大模型4.2智慧業(yè)務(wù)中的大模型應(yīng)用隨著技術(shù)的持續(xù)進(jìn)步,智慧圖書館的業(yè)務(wù)流程中,將越來越多地體現(xiàn)人機(jī)共存和人機(jī)互補(bǔ)的理念,這將成為圖書館智慧業(yè)務(wù)中大模型應(yīng)用的重要趨勢。執(zhí)行采編、資源加工、知識組織等核心業(yè)務(wù)流程。這不僅包括自動分類和編目,圖書館的運(yùn)營效率和服務(wù)質(zhì)量。和文獻(xiàn)進(jìn)行高效的數(shù)字化處理,包括保存、修復(fù)、識別、評估、分類、開發(fā)等。通過結(jié)合各類技承提供豐富的原和深度分析。絡(luò)構(gòu)化的知識體系,為專業(yè)研究提供更為豐富和深入的學(xué)環(huán)境。領(lǐng)域10:智能采編目標(biāo):利用大模型提高圖書館采訪和編目的效率和質(zhì)量。36據(jù)分析等據(jù)比較和分析,解放館員的重復(fù)工作。技術(shù)方案:提示詞工程、RAG、智能體、模型微調(diào)應(yīng)用路徑:集成定制開發(fā)的后端流程、自主/聯(lián)合開發(fā)的原生應(yīng)用領(lǐng)域11:智能數(shù)字資源加工源的高效管理和知識的持續(xù)傳承。元數(shù)據(jù)生成、格式遷移、數(shù)字恢復(fù)、數(shù)據(jù)分析挖掘等換、機(jī)器翻譯等。采用進(jìn)行數(shù)內(nèi)容的格式遷移和規(guī)范化,以適應(yīng)數(shù)字保存像的自動標(biāo)引、和物體識別技術(shù)視覺材料的元數(shù)據(jù)標(biāo)記,提升檢索效率。采用先進(jìn)的體內(nèi)容的質(zhì)量。技術(shù)案:提示詞工程、RAG、智能體、模型微調(diào)應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)、集成定制開的后端流程、自主/聯(lián)合開發(fā)的原生應(yīng)用領(lǐng)域12:古籍與數(shù)字人文智慧研究/news/webinar-ai-andthe-future-of-digital-preservation-call-for-proposals/37字人文研究和服務(wù)的質(zhì)量與效率。模型能力:語義分析、機(jī)器翻譯、文字識別、圖像識別與處理、知識圖譜構(gòu)建、問答對話、搜索信息抽取、數(shù)等情感分析、時(shí)空分析、圖像修復(fù)、古籍修復(fù)等。嵌入數(shù)據(jù)分析工具、可視外部基礎(chǔ)數(shù)據(jù),構(gòu)建、開發(fā)圖書館特色的歷史人文專題特色資源知識庫的知識服務(wù)應(yīng)用與產(chǎn)品。技術(shù)方:提示詞工程、RAG、智能體、模型微調(diào)應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)、集成定制開發(fā)的后端流程、自主/聯(lián)合開發(fā)的原生應(yīng)用、參與研發(fā)行業(yè)基礎(chǔ)大模型領(lǐng)域13:智慧學(xué)術(shù)研究、情報(bào)研究目標(biāo):借助大模型協(xié)助館員進(jìn)行學(xué)術(shù)學(xué)科研究、情報(bào)分析,提供一個(gè)集成功能工具的知識研究助手或研究環(huán)境。模型能力:文本分析與理解、搜索/信息抽取、信息整合、機(jī)器翻譯、數(shù)據(jù)分析與挖掘、知識圖譜構(gòu)建等服務(wù)館員、情報(bào)服務(wù)館員建立智慧的專業(yè)研究環(huán)境。技術(shù)案:提示詞工程、RAG、智能體制開發(fā)的后端流程、自主/聯(lián)合開發(fā)的原應(yīng)用4.3智慧管理中的大模型應(yīng)用38支持,包括:館員間高效的知識共享和業(yè)務(wù)溝通。面的能力,提升圖書館智能決策水平。而提升作效率。作效率。領(lǐng)域14:館員知識庫升級溝通,提高處理業(yè)務(wù)的效率和準(zhǔn)確性。模型能力:文本分析與理解、搜索/信息抽取、問答對話等相關(guān)的咨詢和問整合API調(diào)用現(xiàn)有應(yīng)用系統(tǒng)的能力,能夠?qū)⒎祷氐慕Y(jié)果融入到回答中為館員提供全方位且精準(zhǔn)的信息支持,確保信息的準(zhǔn)確性和可靠性。技術(shù)案:提示詞工程、RAG應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、集成定制開的后端流程領(lǐng)域15:智慧分析與智能決策務(wù)質(zhì)量與管理效率。39展示等遷移、自動報(bào)表、智能問答等功以支撐圖書館在數(shù)據(jù)驅(qū)動決策方面的需求。數(shù)據(jù)中臺的中臺。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、集成定制開發(fā)的后流程領(lǐng)域16:圖書館平臺管理副駕駛(Copilot)強(qiáng)決策支持能力。據(jù)的深入分析和的核心組成部分。技術(shù)案:提示詞工程、RAG、智能體應(yīng)用路徑:集成定制開發(fā)的后端流程、自主/聯(lián)合開發(fā)的原生應(yīng)用領(lǐng)域17:智慧辦公與運(yùn)營協(xié)助目標(biāo):為圖書館員工在宣傳、推廣、人事、財(cái)務(wù)等各自日常工作領(lǐng)域中提供效率工具。40器翻譯、數(shù)據(jù)處理、數(shù)據(jù)分析等制作和編輯圖像與視頻內(nèi)容;提供支持的培訓(xùn)、財(cái)務(wù)、后勤。通過技術(shù)促進(jìn)員工工作效率和工作質(zhì)量的提升。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、集成定制開發(fā)的后端流程4.4智慧空間中的大模型應(yīng)用的應(yīng)用,當(dāng)前可嘗試領(lǐng)域的包括:無障礙服務(wù)、空間預(yù)約等,全面提升了圖書館空間的運(yùn)營效率和用戶服務(wù)體驗(yàn),推動了圖書館服務(wù)的智能化轉(zhuǎn)型。二是利用技術(shù)拓展虛擬空間服務(wù)。通過虛擬助手、數(shù)字人、元宇宙交互服務(wù),增強(qiáng)用戶性和體驗(yàn)感。領(lǐng)域18:智慧預(yù)務(wù)目標(biāo):整合大模型技術(shù),實(shí)現(xiàn)圖書館空間和資源的智能預(yù)約管理。模型能力:任務(wù)理解、資源優(yōu)化分配、自動化工作流程等建議提供自動化的確認(rèn)和提醒服務(wù),減少人工干預(yù),提高預(yù)約流程的效率用戶便利性。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)、集成定制開發(fā)的后端流程劉煒,趙冬梅.圖書館智慧空間建設(shè):概念、演變、評價(jià)與設(shè)計(jì)[J].圖書情報(bào)工作,2022(01):122-13041領(lǐng)域19:實(shí)體機(jī)器人常運(yùn)營和服務(wù)。模型能力:語音識別、問答對話、搜索/信息抽取等行自然語言交流,提供信息咨詢、導(dǎo)覽、導(dǎo)航和輔助服務(wù)。具備知識檢索能,OCR識別結(jié)果,補(bǔ)全漏字,準(zhǔn)確分類圖書信息等。技術(shù)方:提示詞工程、RAG、智能體應(yīng)用路徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域20:無障礙智慧服務(wù)目標(biāo):通過大模型技術(shù)為視障讀者提供無障礙的圖書館服務(wù)。模型能力:語音識別、自然語言處理、文本到語音轉(zhuǎn)換、圖像識別與描述等幫助視障用戶理書館內(nèi)自由移動所有用戶,包括視障人士,提供更加便捷和貼心的服務(wù)。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用徑:直接集成應(yīng)用的產(chǎn)品工具、需整合開發(fā)的產(chǎn)品與服務(wù)領(lǐng)域21:元宇宙空間智慧服務(wù)目標(biāo):利用生成式技術(shù),在元宇宙空間提供沉浸式和互動性的虛擬圖書館體驗(yàn)。模型能力:自然語言交互、個(gè)性化推薦、情境感知、圖像與語音生成等42建議:將生成式融入虛實(shí)融合的元宇宙空間服務(wù)中。在圖書館的虛擬鏡像或使得系統(tǒng)能夠根據(jù)用戶的行為和反應(yīng)實(shí)時(shí)調(diào)。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:需整合開發(fā)的產(chǎn)品與服務(wù)、自主/聯(lián)合開發(fā)的原生應(yīng)用領(lǐng)域22其他(樓宇控制、安防等)模型能力:圖像分析、行為分析、預(yù)測分析、情感識別、智能決策支持等于數(shù)據(jù)的資源優(yōu)化和策略制定,確保圖書館長期穩(wěn)定運(yùn)行。技術(shù)方案:提示詞工程、RAG、智能體應(yīng)用路徑:集成開發(fā)的后端流程43第五章圖書館典型大模型應(yīng)用需求及場景舉例圖書館通過融入并持續(xù)驅(qū)動服務(wù)模式迭代更新。根據(jù)騰研究院2024年5月份發(fā)布的《行業(yè)大在各行業(yè)中的應(yīng)用仍處于探索孵化期和實(shí)驗(yàn)熟期關(guān)產(chǎn)品,探索性成果和研究成果陸續(xù)發(fā)布。當(dāng)前,圖書館行業(yè)大模型應(yīng)用落地顯示出一定的特征:1,在圖書館服務(wù)端,大模型技術(shù)的應(yīng)用實(shí)施顯示出較為迅速的進(jìn)展。當(dāng)前主要集中在提升用戶體驗(yàn)(如智能數(shù)字館員)和增強(qiáng)學(xué)術(shù)服(如學(xué)術(shù)助手)。嘗試通過增強(qiáng)用戶互動和個(gè)性化服務(wù),來提升服務(wù)質(zhì)量。2,與服務(wù)端相比,后端業(yè)務(wù)生產(chǎn)流程的大模型技術(shù)應(yīng)用落地進(jìn)程較慢。行業(yè)當(dāng)前正積極探索和嘗試如何通過大模型技術(shù)提高后端操作的自動化和智能化水平,以提高生產(chǎn)流程如采編、資源加工等環(huán)節(jié)的效率。3,圖書館正積極推進(jìn)基于大模型技術(shù)的智能化工具助手,部分產(chǎn)品已達(dá)試用階段。通過開發(fā)如圖書館平臺副駕駛、館員助手等應(yīng)用,圖書館旨在提升館員的后臺工作效率,實(shí)現(xiàn)管理流程的優(yōu)化。參考咨詢、資源發(fā)現(xiàn)、閱讀推廣、學(xué)術(shù)服務(wù)、采編輔助、資源加工、數(shù)字人文、管理決策。通過析這些領(lǐng)域的需求要素、潛在應(yīng)用場景、當(dāng)前案例情況,本章旨在展示相關(guān)館界大模型應(yīng)用提供參考。騰訊研究院.向而行共筑新質(zhì)生產(chǎn)力行業(yè)大模型調(diào)研報(bào)告,/news/newsdetail/68815,2024.44圖5.0圖書館大模型典型應(yīng)用場景5.1智慧咨詢服務(wù)5.1.1需求分析務(wù)熟練度也會影響問答的準(zhǔn)確性,且回答風(fēng)格缺乏統(tǒng)一標(biāo)準(zhǔn)。需求建議:以最新大模型技術(shù)級面向讀者的智慧參考咨詢服務(wù),讀者可以123)4故障排解;(5)合數(shù)字人、機(jī)器人技術(shù),進(jìn)行交互體驗(yàn)服務(wù)。5.1.2場景舉例場景1:問答式參考咨詢服務(wù)圖如何參觀預(yù)約上東館?”新活動于故障處理,當(dāng)讀者提問后,用自然語言引導(dǎo)讀者進(jìn)一步告知具體的故障現(xiàn)象,45一部分簡單的故障,若不能處理則流轉(zhuǎn)至人工。場景2:智慧數(shù)字館員服務(wù)不限于圖書館開放時(shí)間、借閱規(guī)則、館藏資源位置等。利用自然語言處理技術(shù),移動終導(dǎo)用戶進(jìn)行自助圖書館服務(wù)中不可或缺的一部分。場景3:智慧機(jī)器人館員服務(wù)器和人工智能算障讀者使用圖書館設(shè)施時(shí)遇到的技術(shù)難題,如自助打印機(jī)操作、電子資源訪等。5.1.3已有案例1.國家圖書館推出問答系統(tǒng),46國家圖書館智能問答系統(tǒng)以文心大模型”數(shù)字閱讀體驗(yàn),可進(jìn)行語音問答、書籍查找,游戲互動等體驗(yàn)。2.臺灣公共資訊圖書館打造了A館員——曉書臺灣公共資訊圖書館與東海大學(xué)合作開發(fā)了一款名為“曉書”的生成式智ChatGPTDigital夠全面解答讀者關(guān)于圖書、閱讀以及圖書館內(nèi)部設(shè)施的各類咨詢。3.云瀚應(yīng)用海恒小海豚數(shù)字館員”務(wù)辦理等多種服務(wù)。能提供個(gè)性化主動式服務(wù),將流程引擎和模型進(jìn)行結(jié)合,能推進(jìn)程,并進(jìn)行流程節(jié)點(diǎn)的判斷。4.云瀚應(yīng)用-ChatBK博看智慧咨詢書館自行對私有知識進(jìn)行上傳、編輯及預(yù)訓(xùn)練學(xué)習(xí)。5.2智慧資源發(fā)現(xiàn)5.2.1需求分析和個(gè)性化推薦,眾多的資源和數(shù),往往缺乏必要的了解和選擇指導(dǎo)。資源航助手,幫助用戶推薦最適合的數(shù)據(jù)庫。5.2.2場景舉例場景4:啟發(fā)式資源檢索服務(wù)/read/amp/story/7009/784121306fbFm3w47啟發(fā)式文獻(xiàn)檢索服務(wù)區(qū)別于圖書館傳統(tǒng)基于關(guān)鍵詞搜索模式的文獻(xiàn)檢索模術(shù)數(shù)據(jù)庫進(jìn)行搜索。例如讀者可出以下問題:關(guān)于大模型、人工智能領(lǐng)域近1年的文章有多少篇?”“智慧圖書館研究最有影響力的文章是哪幾篇?”“轉(zhuǎn)基因技術(shù)對于農(nóng)業(yè)生產(chǎn)的幫助是什么?系統(tǒng)為讀者提供簡明且可信賴的研究主題相關(guān)的啟發(fā)式追問,來啟發(fā)用戶多輪提問。路功能綜述報(bào)告功能是根據(jù)檢索結(jié)果的論文,自動分析總、生成研究綜述。定量的高被引論文進(jìn)行分析。告訴讀者該主題的相關(guān)論文主要集中在哪些年份,文分析內(nèi)容生成綜述報(bào)告。檢索結(jié)果可視化功能是對搜索結(jié)果進(jìn)行可視化展示,界面,內(nèi)置相似文章推薦,并提示有待進(jìn)一步探索的問題。場景5:跨資源智能館藏檢索與推薦化的資源代理檢源中,為讀者推的文獻(xiàn)資源。讀者可能的提問方式包括:請幫我推薦可以了解最新進(jìn)展的數(shù)據(jù)庫”“圖書館有沒有時(shí)間簡史這本書?”“Nature期刊的最新發(fā)文有哪些?讀者不同的問題需要查找的圖書館文獻(xiàn)資源可能是不同的,提問的實(shí)現(xiàn)依賴于大語言模型API的調(diào)48示。如由機(jī)器人服務(wù),可以繼續(xù)進(jìn)行導(dǎo)航指引。此外,在進(jìn)行館藏資源推薦時(shí),以在獲得讀者信息的基礎(chǔ)上,根據(jù)讀者的歷史行為畫像,進(jìn)一步分析做準(zhǔn)推薦。大模型能列出推薦的書單和理由,針對推薦等資源,可提供總結(jié)。讀者如不滿意,可以追加描述,直到定位到滿意的書單。5.2.3已有案例1.日本橫濱市立圖書館推出借書檢索服務(wù)日本橫濱市立圖書館推出圖書檢索服務(wù),用戶通過關(guān)詞或描述性句子即可獲激發(fā)讀者閱讀興趣。2.清華大學(xué)圖書館上線導(dǎo)航助手導(dǎo)航助手能根據(jù)提問,提供精準(zhǔn)的數(shù)據(jù)庫資源介紹,并在每次問答之后,推薦3個(gè)相關(guān)數(shù)據(jù)庫鏈接供直接訪問。3.盧森堡國家圖書館針對數(shù)字化的期刊和報(bào)紙進(jìn)行館藏語義搜索展語義搜索,從而實(shí)現(xiàn)對館藏內(nèi)容的深入理解和高效檢索。5.3智慧閱讀推廣5.3.1需求分析書本位”向“本位”的轉(zhuǎn)型。閱讀推廣部門承擔(dān)著圖書及資源的策略性推薦、營銷傳播,以及系統(tǒng)性的閱讀要通過新媒體渠道進(jìn)行多媒體制作與互動傳播等一系列復(fù)雜任務(wù)。讀推廣工作中,淺閱讀”https://libraryview.me/2024/01/22/16742/#more-16742gT65LjOQA49方合作。需求建議:充分利用大模型、生成式等新技術(shù)手段,為讀者提供智能化、個(gè)性化、1技術(shù)的智能閱讀陪伴或推薦系統(tǒng),源推薦,提高推廣的針對性和吸引力。(2)建立閱推知識庫語料庫,為推薦提3浸式的虛擬閱讀場景,激發(fā)閱讀興趣。(4)通過技術(shù),輔助館員高效生力,減輕館員工作負(fù)擔(dān)。5.3.2場景舉例場景6:智能閱讀伙伴服務(wù)這項(xiàng)創(chuàng)新服為讀者提供基于圖書館資源的個(gè)性化閱讀推薦和智能化閱讀輔助。圖書于自身豐富的資源,結(jié)合生成式技術(shù),打造圖書館品解讀者的閱歸還圖書,并推薦附近圖書館的相關(guān)資源。還能根據(jù)讀者的興趣愛好,50可通過算法,根據(jù)讀者的閱讀興趣、偏好、水平等因素,自動將具有相似閱讀愛好的讀者組織到同一個(gè)虛擬閱讀社區(qū)中。場景7:元宇宙虛擬館員服務(wù)在圖書館的元宇宙虛擬空間中,驅(qū)動的智能虛擬館員將全程陪伴和引導(dǎo)讀典作品的情節(jié)與人物,發(fā)讀者的思考與共鳴。此外,虛擬館員還可以擔(dān)任動策劃員的角色,味性和參與感。通過虛擬館員的引導(dǎo),讀者能夠在元宇宙中獲得全新的沉浸場景8:館員閱讀推廣工作站提供館員閱讀推廣工作站,館員可利用工具進(jìn)行閱讀推廣活動與內(nèi)容的創(chuàng)作與開的推廣結(jié)合數(shù)字人物與虛擬環(huán)境,館員還能夠制作出引人入勝的音視頻材料。這些技術(shù)的應(yīng)用將極大地減輕館員在視頻拍攝和制作方面工作負(fù)擔(dān)。此外,還可以輔助館員進(jìn)行內(nèi)容加工與管理??梢詣訕?biāo)記和歸檔視頻、文檔,標(biāo)館員可以將形成的視頻資源庫、文案素材、活動資料等,發(fā)展為專題庫,為未來的閱讀推廣提供素材支撐。5.3.3已有案例511.新加坡國家圖書館管理局推出書籍聊天機(jī)器人ChatBookChatBook“辯論買或借閱書籍的推薦,以鼓勵(lì)深索在線資源。2.新加坡國家圖書館推出StoryGen人工智能圖像生成服務(wù)StoryGen驗(yàn)。用戶可依據(jù)書籍中的角色、類型、故事等關(guān)鍵詞,創(chuàng)意性地生成相應(yīng)圖,打造出屬于自己的故事世界,為用戶帶來一場沉浸式的閱讀體驗(yàn)。3.上海圖書館進(jìn)行虛擬人閱讀推廣,以及推廣視頻制作上海圖書館閱讀推廣部在閱讀日歷”項(xiàng)目中,使用GPT-SoTS和Heygen等軟件音或數(shù)字人口播視頻。通過runway、suno等工具嘗試視頻、音樂創(chuàng)作用于閱讀推廣。4.嘉興圖書館、上海圖書館利用生成式為少兒讀者提供活動服務(wù)、嘉興市圖書館利用StableDiffusion模型開發(fā)了適合未成年讀者的繪圖系統(tǒng)——AI繪夢大師,并同步開展關(guān)培訓(xùn)課程與活動。上海圖書館員工利用StableDiffusion模型打造文生圖模型應(yīng)用,少兒讀者可以在館員的指導(dǎo)下,體驗(yàn)用生成式創(chuàng)作作圖,并將設(shè)計(jì)的圖片進(jìn)行個(gè)性化印刷,完成自創(chuàng)繪本制作。5.帕洛阿爾托市圖書館ChatGPT高級數(shù)據(jù)分析實(shí)驗(yàn)通過優(yōu)化mmons的分類體系以更精準(zhǔn)地匹配讀者的興趣,旨在增強(qiáng)個(gè)性化推薦功能性,進(jìn)而提升用戶在網(wǎng)頁端的閱讀體驗(yàn)。5.4慧知識服務(wù)5.4.1求分析.sg/main/about-us/press-room-and-publions/media-releases/2023/2024-Year-in-Previewns/media-releases/2023/2024-Year-in-Preview/s/I3nXhVNZ1UhLNTCrHj3fIQ/s/izpIBoWF7aqNSC-7jjeg/articles/1786752的支持和服務(wù)還不夠完善和高效水平有待提升;用戶信息素養(yǎng)和媒介素養(yǎng)教育需求增長的挑戰(zhàn)。需求建議:(1Personalknowledgeenvironment簡稱PKE),成為學(xué)者的研究助手。該環(huán)境能建立在圖書書館或多個(gè)數(shù)據(jù)商的智能學(xué)術(shù)研究工具,提供智能研究環(huán)境。(2)增強(qiáng)智慧教學(xué)與學(xué)科服務(wù),通過學(xué)習(xí)助手為師生提供個(gè)性化和智能化的學(xué)習(xí)支持,包括個(gè)性化學(xué)習(xí)路徑規(guī)劃、互動學(xué)習(xí)體驗(yàn)及學(xué)術(shù)研究輔助。助手的應(yīng)用深化了教學(xué)和學(xué)習(xí)的互動3平臺和虛擬環(huán)境提高學(xué)生、館員、公眾的信息素養(yǎng)和技術(shù)使用能力。5.4.2場景舉例場景9:個(gè)人知識研究環(huán)境(PKE)服務(wù)場景圖書館可建立一個(gè)最大限度整合的學(xué)術(shù)資源的個(gè)人知識研究環(huán)境(PKE),為用戶提供一個(gè)生成研究大綱,以及內(nèi)容生成、審稿檢查等功能,覆蓋個(gè)人知識研究的全流程。(1)PDF題、解釋學(xué)術(shù)概念,支持交互式問答,生成概念知識譜。(2)選題與學(xué)習(xí)路徑建議:根據(jù)研究領(lǐng)域或問題,生成選題建議,提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論