大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織

上傳人：熊*** IP屬地：山東上傳時(shí)間：2024-10-12 格式：PPTX 頁(yè)數(shù)：22 大小：229.87KB 積分：25 舉報(bào) 版權(quán)申訴

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織_第2頁(yè)

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織_第3頁(yè)

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織_第4頁(yè)

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織_第5頁(yè)

已閱讀5頁(yè)，還剩17頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大語(yǔ)言模型通識(shí)微課

開(kāi)發(fā)流程與數(shù)據(jù)組織大語(yǔ)言模型如此重要，是因?yàn)椋海?）高準(zhǔn)確性：隨著模型參數(shù)的增加，模型通常能更好地學(xué)習(xí)和適應(yīng)各種數(shù)據(jù)，從而提高其預(yù)測(cè)和生成的準(zhǔn)確性。（2）多功能性：大模型通常更為通用，能夠處理更多種類的任務(wù)，而不僅限于特定領(lǐng)域。（3）持續(xù)學(xué)習(xí)：大模型的巨大容量使其更適合從持續(xù)的數(shù)據(jù)流中學(xué)習(xí)和適應(yīng)新知識(shí)。微課6.1開(kāi)發(fā)流程與數(shù)據(jù)組織所謂大模型開(kāi)發(fā)，是指建設(shè)以大模型為功能核心、通過(guò)其強(qiáng)大的理解能力和生成能力、結(jié)合特殊的數(shù)據(jù)或業(yè)務(wù)邏輯來(lái)提供獨(dú)特功能的應(yīng)用。開(kāi)發(fā)大模型相關(guān)應(yīng)用，其技術(shù)核心雖然在大模型上，但一般通過(guò)調(diào)用API或開(kāi)源模型來(lái)實(shí)現(xiàn)理解與生成，通過(guò)提示工程來(lái)實(shí)現(xiàn)大模型控制，因此，大模型開(kāi)發(fā)更多的是一個(gè)工程問(wèn)題。圖6-2大模型開(kāi)發(fā)要素6.1.1什么是大模型開(kāi)發(fā)大模型開(kāi)發(fā)，是將大模型作為一個(gè)調(diào)用工具，通過(guò)提示工程、數(shù)據(jù)工程、業(yè)務(wù)邏輯分解等手段來(lái)充分發(fā)揮大模型能力，適配應(yīng)用任務(wù)。因此，初學(xué)者并不需要深入研究大模型內(nèi)部原理，而更需要掌握使用大模型的實(shí)踐技巧。在大模型開(kāi)發(fā)中，嘗試用提示工程來(lái)替代子模型的訓(xùn)練調(diào)優(yōu)，通過(guò)提示鏈路組合來(lái)實(shí)現(xiàn)業(yè)務(wù)邏輯，用一個(gè)通用大模型+若干業(yè)務(wù)提示來(lái)完成任務(wù)，從而將傳統(tǒng)的模型訓(xùn)練調(diào)優(yōu)轉(zhuǎn)變成了更簡(jiǎn)單、輕松、低成本的提示設(shè)計(jì)調(diào)優(yōu)。6.1.1什么是大模型開(kāi)發(fā)同時(shí)，在評(píng)估思路上，大模型開(kāi)發(fā)與傳統(tǒng)人工智能開(kāi)發(fā)有質(zhì)的差異。

傳統(tǒng)AI評(píng)估

LLM評(píng)估圖6-3大模型開(kāi)發(fā)與傳統(tǒng)人工智能開(kāi)發(fā)的不同6.1.1什么是大模型開(kāi)發(fā)通常將大模型開(kāi)發(fā)分解為以下幾個(gè)流程。

圖6-4大模型開(kāi)發(fā)流程6.1.2大模型開(kāi)發(fā)流程（1）確定目標(biāo)。開(kāi)發(fā)目標(biāo)即應(yīng)用場(chǎng)景、目標(biāo)人群、核心價(jià)值。對(duì)于小型團(tuán)隊(duì)，應(yīng)先設(shè)定最小化目標(biāo)，從構(gòu)建最小產(chǎn)品開(kāi)始，逐步完善和優(yōu)化。（2）設(shè)計(jì)功能。設(shè)計(jì)應(yīng)用所要提供的功能以及每一個(gè)功能的大體實(shí)現(xiàn)邏輯。越清晰、深入的業(yè)務(wù)邏輯理解往往能帶來(lái)更好的提示效果。對(duì)于小型團(tuán)隊(duì)來(lái)說(shuō)，應(yīng)先確定應(yīng)用的核心功能，然后延展其上下游功能。（3）搭建整體架構(gòu)。需要針對(duì)所設(shè)計(jì)的功能，搭建項(xiàng)目的整體架構(gòu)，實(shí)現(xiàn)從用戶輸入到應(yīng)用輸出的全流程貫通?？梢曰贚angChain進(jìn)行個(gè)性化定制，實(shí)現(xiàn)從用戶輸入到數(shù)據(jù)庫(kù)再到大模型最后輸出的整體架構(gòu)連接。6.1.2大模型開(kāi)發(fā)流程（4）搭建數(shù)據(jù)庫(kù)。需要收集數(shù)據(jù)并進(jìn)行預(yù)處理，再向量化存儲(chǔ)到數(shù)據(jù)庫(kù)中。數(shù)據(jù)預(yù)處理包括從多種格式向純文本的轉(zhuǎn)化，以及對(duì)錯(cuò)誤數(shù)據(jù)、異常數(shù)據(jù)、臟數(shù)據(jù)進(jìn)行清洗。（5）提示工程。優(yōu)質(zhì)的提示對(duì)大模型能力具有極大影響。首先明確提示設(shè)計(jì)的一般原則及技巧，構(gòu)建出一個(gè)源于實(shí)際業(yè)務(wù)的小型驗(yàn)證集，以此來(lái)滿足基本要求、具備基本能力的提示。（6）驗(yàn)證迭代。通過(guò)不斷發(fā)現(xiàn)壞的情況并針對(duì)性改進(jìn)提示工程來(lái)提升系統(tǒng)效果、應(yīng)對(duì)邊界情況，從而不斷迭代優(yōu)化，基本實(shí)現(xiàn)目標(biāo)的提示版本。6.1.2大模型開(kāi)發(fā)流程（7）前后端搭建。接下來(lái)，設(shè)計(jì)產(chǎn)品頁(yè)面，讓?xiě)?yīng)用上線成為產(chǎn)品。前后端開(kāi)發(fā)是非常經(jīng)典且成熟的領(lǐng)域，有兩種快速開(kāi)發(fā)演示的框架。（8）體驗(yàn)優(yōu)化。接下來(lái)需要進(jìn)行長(zhǎng)期的用戶體驗(yàn)跟蹤，記錄壞情況，與用戶負(fù)反饋，再針對(duì)性進(jìn)行優(yōu)化即可。6.1.2大模型開(kāi)發(fā)流程在設(shè)計(jì)、研發(fā)、運(yùn)行的過(guò)程中，大模型面臨的主要挑戰(zhàn)如下。（1）計(jì)算資源：訓(xùn)練和運(yùn)行大模型需要大量的計(jì)算資源，這可能限制了許多機(jī)構(gòu)和研究者使用它的能力。（2）環(huán)境影響：大規(guī)模模型的訓(xùn)練對(duì)能源的需求是巨大的，可能會(huì)對(duì)環(huán)境造成負(fù)面影響。（3）偏見(jiàn)和公正性：由于大模型通常從大量的互聯(lián)網(wǎng)文本中學(xué)習(xí)，它們可能會(huì)吸收并再現(xiàn)存在于這些數(shù)據(jù)中的偏見(jiàn)。大模型的研發(fā)流程涵蓋了從數(shù)據(jù)采集到模型訓(xùn)練的多個(gè)步驟。6.1.3大模型的數(shù)據(jù)組織（1）數(shù)據(jù)采集：是大模型項(xiàng)目的起點(diǎn)，根據(jù)訓(xùn)練需求收集大量數(shù)據(jù)。這些數(shù)據(jù)可以有多種來(lái)源，如公開(kāi)的數(shù)據(jù)集、公司內(nèi)部的數(shù)據(jù)庫(kù)、用戶生成的數(shù)據(jù)、傳感器數(shù)據(jù)等。數(shù)據(jù)的類型可以多樣，包括圖像、文本、聲音、視頻等。主要內(nèi)容包括：定義數(shù)據(jù)需求、找到數(shù)據(jù)源、數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、檢查數(shù)據(jù)質(zhì)量、數(shù)據(jù)整理。這是一個(gè)持續(xù)的過(guò)程。在整個(gè)數(shù)據(jù)采集過(guò)程中，需要關(guān)注數(shù)據(jù)的質(zhì)量和一致性，同時(shí)也要注意遵守?cái)?shù)據(jù)隱私和安全的相關(guān)規(guī)定。6.1.3大模型的數(shù)據(jù)組織（2）數(shù)據(jù)清洗和預(yù)處理。原始數(shù)據(jù)可能含有噪聲、缺失值、錯(cuò)誤數(shù)據(jù)等，所以進(jìn)行清洗。清洗后的數(shù)據(jù)要進(jìn)行一系列預(yù)處理操作，如歸一化、編碼轉(zhuǎn)換等，使其適合輸入到模型中。主要內(nèi)容包括：數(shù)據(jù)質(zhì)量檢查、處理缺失值、處理重復(fù)值、處理異常值、數(shù)據(jù)轉(zhuǎn)換。進(jìn)行數(shù)據(jù)清洗和預(yù)處理時(shí)，需要對(duì)數(shù)據(jù)有深入的理解，以便做出最好的決策。6.1.3大模型的數(shù)據(jù)組織（3）數(shù)據(jù)標(biāo)注：主要用于監(jiān)督學(xué)習(xí)任務(wù)，是一項(xiàng)為原始數(shù)據(jù)添加元信息的工作，以幫助大模型更好地理解和學(xué)習(xí)數(shù)據(jù)。主要內(nèi)容包括：制定標(biāo)注規(guī)范、選擇或開(kāi)發(fā)標(biāo)注工具、進(jìn)行數(shù)據(jù)標(biāo)注、質(zhì)量檢查、反饋和修正。高質(zhì)量標(biāo)注數(shù)據(jù)對(duì)訓(xùn)練出高性能的機(jī)器學(xué)習(xí)模型至關(guān)重要。因此，盡管這是一個(gè)復(fù)雜和耗時(shí)的過(guò)程，但投入在這個(gè)過(guò)程中的努力會(huì)得到回報(bào)。6.1.3大模型的數(shù)據(jù)組織（4）數(shù)據(jù)集劃分：數(shù)據(jù)通常被劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。這是大模型項(xiàng)目中的一個(gè)重要步驟，可以幫助更好地理解模型的性能。主要內(nèi)容包括：確定劃分策略、隨機(jī)劃分、分層抽樣、時(shí)間序列數(shù)據(jù)的劃分、分割數(shù)據(jù)、保存數(shù)據(jù)、。這個(gè)流程可能根據(jù)數(shù)據(jù)的類型和任務(wù)的需求有所不同。無(wú)論如何，正確的數(shù)據(jù)劃分策略對(duì)于避免過(guò)擬合，以及準(zhǔn)確評(píng)估模型的性能至關(guān)重要。6.1.3大模型的數(shù)據(jù)組織（5）模型設(shè)計(jì)：是大模型項(xiàng)目的關(guān)鍵環(huán)節(jié)，需要結(jié)合項(xiàng)目目標(biāo)、數(shù)據(jù)特性以及算法理論選擇或設(shè)計(jì)適合任務(wù)的模型架構(gòu)?？赡軙?huì)使用復(fù)雜的深度學(xué)習(xí)架構(gòu)，如Transformer等。主要內(nèi)容包括：理解問(wèn)題、選擇算法、設(shè)計(jì)模型架構(gòu)、設(shè)置超參數(shù)、正則化和優(yōu)化策略、定義評(píng)估指標(biāo)。這個(gè)流程需要根據(jù)具體的項(xiàng)目和需求進(jìn)行迭代和調(diào)整，它需要技術(shù)知識(shí)、經(jīng)驗(yàn)以及實(shí)驗(yàn)驗(yàn)證。在設(shè)計(jì)模型時(shí)，需要保持對(duì)模型復(fù)雜性和泛化能力之間平衡的認(rèn)識(shí)，并始終以實(shí)現(xiàn)業(yè)務(wù)目標(biāo)為導(dǎo)向。6.1.3大模型的數(shù)據(jù)組織（6）模型初始化：是大模型項(xiàng)目中的一個(gè)重要步驟。在訓(xùn)練開(kāi)始前，需要初始化模型的參數(shù)，這一般通過(guò)隨機(jī)方式進(jìn)行。正確的初始化策略可以幫助模型更快地收斂，并減少訓(xùn)練過(guò)程中可能出現(xiàn)的問(wèn)題。主要內(nèi)容包括：選擇初始化策略、初始化權(quán)重、初始化偏置、設(shè)置初始化參數(shù)、執(zhí)行初始化。這是一個(gè)比較技術(shù)性的主題，正確的初始化策略可能對(duì)模型的訓(xùn)練速度和性能有很大的影響。應(yīng)該了解不同的初始化策略，以便根據(jù)模型進(jìn)行選擇。6.1.3大模型的數(shù)據(jù)組織（7）模型訓(xùn)練：是大模型項(xiàng)目中的關(guān)鍵步驟，其中包含了多個(gè)環(huán)節(jié)。主要內(nèi)容包括：設(shè)置訓(xùn)練參數(shù)、準(zhǔn)備訓(xùn)練數(shù)據(jù)、前向傳播、反向傳播、驗(yàn)證和調(diào)整、重復(fù)上述步驟、模型測(cè)試。實(shí)際操作中可能需要根據(jù)特定任務(wù)或特定模型進(jìn)行相應(yīng)的調(diào)整。6.2.7模型訓(xùn)練（8）模型驗(yàn)證：是大模型項(xiàng)目中非常關(guān)鍵的一步，目的是在訓(xùn)練過(guò)程中，評(píng)估模型的性能，定期在驗(yàn)證集上測(cè)試模型的性能，監(jiān)控過(guò)擬合，根據(jù)測(cè)試和監(jiān)控結(jié)果調(diào)整模型的超參數(shù)。主要內(nèi)容包括：準(zhǔn)備驗(yàn)證集、進(jìn)行模型預(yù)測(cè)、計(jì)算評(píng)估指標(biāo)、比較性能、早停法、調(diào)整超參數(shù)。驗(yàn)證集應(yīng)保持獨(dú)立，不能用于訓(xùn)練模型，否則就可能導(dǎo)致模型的性能評(píng)估不準(zhǔn)確，無(wú)法真實(shí)反映模型在未見(jiàn)過(guò)的數(shù)據(jù)上的性能。6.2.8模型驗(yàn)證（9）模型保存：是大模型項(xiàng)目的重要一步，讓我們能夠?qū)⒂?xùn)練好的模型存儲(chǔ)起來(lái)，以便于后續(xù)的測(cè)試、部署或進(jìn)一步訓(xùn)練或分享。主要內(nèi)容包括：選擇保存格式、保存模型參數(shù)、保存模型架構(gòu)、保存訓(xùn)練配置、執(zhí)行保存操作、驗(yàn)證保存的模型。這個(gè)流程可能會(huì)根據(jù)具體需求和所使用的工具或框架進(jìn)行一些調(diào)整。6.2.9模型保存（10）模型測(cè)試：是大模型部署前的最后一步，目的是在測(cè)試集上評(píng)估模型的最終性能。主要內(nèi)容包括：準(zhǔn)備測(cè)試集、進(jìn)行模型預(yù)測(cè)、計(jì)算評(píng)估指標(biāo)、分析結(jié)果、記錄和報(bào)告。測(cè)試集應(yīng)當(dāng)保持獨(dú)立和未知，不能用于訓(xùn)練或驗(yàn)證模型，以確保測(cè)試結(jié)果能夠真實(shí)反映模型在實(shí)際環(huán)境中的表現(xiàn)。6.2.10模型測(cè)試（11）模型部署：是將訓(xùn)練好的大模型應(yīng)

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

大語(yǔ)言模型通識(shí)微課課件：開(kāi)發(fā)流程與數(shù)據(jù)組織

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔