2024開(kāi)源大模型應(yīng)用指南1.0(風(fēng)險(xiǎn)治理篇)-云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟_第1頁(yè)
2024開(kāi)源大模型應(yīng)用指南1.0(風(fēng)險(xiǎn)治理篇)-云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟_第2頁(yè)
2024開(kāi)源大模型應(yīng)用指南1.0(風(fēng)險(xiǎn)治理篇)-云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟_第3頁(yè)
2024開(kāi)源大模型應(yīng)用指南1.0(風(fēng)險(xiǎn)治理篇)-云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟_第4頁(yè)
2024開(kāi)源大模型應(yīng)用指南1.0(風(fēng)險(xiǎn)治理篇)-云計(jì)算開(kāi)源產(chǎn)業(yè)聯(lián)盟_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.0(風(fēng)險(xiǎn)治理篇)目 錄一、開(kāi)源大模型發(fā)展態(tài)勢(shì) 1(一)從軟件到大模型,開(kāi)源的變”與不變” 1(二)從壟斷到開(kāi)放,開(kāi)源重塑AI生態(tài) 3(三)從個(gè)人到國(guó)家,開(kāi)源釋放AI效能 6二、開(kāi)源大模型創(chuàng)新趨勢(shì) 8(一)開(kāi)源語(yǔ)言大模型開(kāi)啟百家爭(zhēng)鳴新紀(jì)元 8(二)開(kāi)源多模態(tài)大模型注入AI生態(tài)新活力 11(三)開(kāi)源AGENT引領(lǐng)人工智能發(fā)展新方向 14三、開(kāi)源大模型風(fēng)險(xiǎn)挑戰(zhàn) 16(一)開(kāi)源大模型應(yīng)用或?qū)е掳踩L(fēng)險(xiǎn)升級(jí) 17(二)開(kāi)源大模型應(yīng)用或面臨多重規(guī)制要求 20(三)開(kāi)源模式或加劇大模型技術(shù)濫用風(fēng)險(xiǎn) 28四、開(kāi)源大模型治理全球動(dòng)態(tài) 29(一)國(guó)際組織高度重視開(kāi)源大模型發(fā)展,積極探索全球人工智能治理方案..............................................................30(二)歐盟立法謀求人工智能監(jiān)管主導(dǎo)權(quán),開(kāi)源大模型得有條件義務(wù)豁免................................................................31(三)美國(guó)人工智能監(jiān)管增強(qiáng)化趨勢(shì)明顯,國(guó)防領(lǐng)域率先探索開(kāi)源大模型影響............................................................33(四)............................................................34五、企業(yè)應(yīng)用開(kāi)源大模型風(fēng)險(xiǎn)治理實(shí)操要點(diǎn) 46(一)開(kāi)源大模型治理體系構(gòu)建 47(二)開(kāi)源大模型風(fēng)險(xiǎn)防控建議 49六、國(guó)內(nèi)開(kāi)源大模型應(yīng)用生態(tài)完善方向 77圖 目 錄圖1大模型的開(kāi)放訪(fǎng)問(wèn)等級(jí) 3圖2人工智能大模型許可協(xié)議合規(guī)流程 53圖3HuggingFaceModel格式Markdown截圖 71圖4HuggingFaceLLaMA-3.1README.md截圖 72圖5LLaMA-3.1CycloneDX模型組件轉(zhuǎn)換信息截圖 73圖6CycloneDXLLaMA-3.1模型卡片信息截圖 74圖7CycloneDXLLaMA-3.1數(shù)據(jù)集信息演示截圖 74圖8LLaMA-3.1CycloneDX文件子組件表示信息截圖 76表 目 錄表1經(jīng)典開(kāi)源語(yǔ)言大模型解析 9表2經(jīng)典開(kāi)源多模態(tài)大模型解析 12表3經(jīng)典開(kāi)源Agent解析 15表4國(guó)內(nèi)外典型大模型許可協(xié)議類(lèi)型表 21表5地方政府開(kāi)源人工智能相關(guān)規(guī)范文件 35表6常見(jiàn)人工智能開(kāi)源許可協(xié)議合規(guī)要點(diǎn)解讀 54表7AI/MLBOM示例 70一、開(kāi)源大模型發(fā)展態(tài)勢(shì)(一)從軟件到大模型,開(kāi)源的“變”與“不變”開(kāi)源思想興起于軟件開(kāi)發(fā)領(lǐng)域,軟件開(kāi)源核心在于源代碼開(kāi)放。開(kāi)源(OpnSouc概念根植于上世紀(jì)五十年代以來(lái)自由開(kāi)放的計(jì)算機(jī)文化,并隨著開(kāi)源軟件促進(jìn)會(huì)(OpenSourceInitiative96%77%源軟件。12024https:///zh-cn/software-integrity/resources/analyst-reports/open-source-security-risk-analysis.html,最后訪(fǎng)問(wèn)日期:202410日。但單一元素的公開(kāi)和可獲取可能并不足以支持使用者復(fù)現(xiàn)模型效果,實(shí)現(xiàn)開(kāi)源授之以漁”的根本目的。發(fā)者假借開(kāi)源之名,行限制技術(shù)共享之實(shí),OSIAIAI模型是否開(kāi)源的概3開(kāi)源大模型可開(kāi)放的內(nèi)容包TheOpenSourceAIDefinition1.0,網(wǎng)絡(luò)地址:/ai/open-source-ai-definition,最后訪(fǎng)問(wèn)日期:202413日。3M.A.PetersandP.Roberts,Virtuesofopenness:Education,science,andscholarshipinthedigitalage.OSI組織的相關(guān)定義4OSI認(rèn)證的許可協(xié)議或條款下向公眾公開(kāi)適重和參數(shù),訓(xùn)練和運(yùn)行AI系統(tǒng)的全部源代碼,以及有關(guān)訓(xùn)練數(shù)據(jù)的研究中心發(fā)布的AI多種開(kāi)放選項(xiàng)(見(jiàn)圖1和革新。

圖1大模型的開(kāi)放訪(fǎng)問(wèn)等級(jí)5(二)從壟斷到開(kāi)放,開(kāi)源重塑AI生態(tài)4TheOpenSourceAIDefinition-1.0,網(wǎng)絡(luò)地址:/ai/open-source-ai-definition,最后訪(fǎng)問(wèn)日期:2024年11月13日。5RishiBommasanietal.,“ConsiderationsforGoverningOpenFoundationModels”,網(wǎng)絡(luò)地址:/issue-brief-considerations-governing-open-foundation-models,最后訪(fǎng)問(wèn)日期:2024年開(kāi)源是打破AI技術(shù)壟斷的破破船”。智能技術(shù)廠商利用先發(fā)優(yōu)勢(shì)封閉技術(shù)、壟斷市場(chǎng)。如Meta開(kāi)源大模型LLaMA2,有力打破了大語(yǔ)言模型長(zhǎng)期被OpenAI、谷歌開(kāi)源大模型是AI應(yīng)用觸達(dá)的破加速器。開(kāi)源開(kāi)放顯著降低了大LLaMA的行業(yè)模QiZhenGPTChatMedBenTsao,法律領(lǐng)域的Qwen1.5開(kāi)源是AI科技創(chuàng)新的破催化劑。圍繞成熟的開(kāi)源大模型項(xiàng)目,8月29日。大模型的產(chǎn)品體驗(yàn)。6開(kāi)源社區(qū)不僅有益于積累技術(shù)經(jīng)驗(yàn)和推進(jìn)模型Transformer算法在索RNN算法的優(yōu)化和改進(jìn)方向,以期在該領(lǐng)域?qū)崿F(xiàn)技術(shù)突破。開(kāi)源是AI開(kāi)源大模型的開(kāi)放性和靈活性基本形成了開(kāi)源和閉源相結(jié)合的商業(yè)模式。其中,Meta、百川智能、360等企業(yè)傾向于借助開(kāi)源社區(qū)以提升模型質(zhì)量并快速打造自己的產(chǎn)OpenAI、百度、華為等具有先發(fā)優(yōu)勢(shì)的企業(yè)雖采取閉昇求的增加,開(kāi)源大模型研發(fā)企業(yè)逐漸從以產(chǎn)品”為賣(mài)點(diǎn)轉(zhuǎn)向以服企業(yè)可吸引第三方開(kāi)發(fā)者和企業(yè)圍繞其開(kāi)源產(chǎn)品構(gòu)建應(yīng)用程序和服2021年第2期,第84-102頁(yè)。https:///insight/article/3ky83uwLO5JS,最后訪(fǎng)問(wèn)日期:2024年8月30日。出售相關(guān)培訓(xùn)等方式拓展盈利渠道。開(kāi)源是AIClearviewAI從互聯(lián)網(wǎng)上收集了數(shù)十億AI系統(tǒng),后該公司便因未經(jīng)同意收集和使用個(gè)員和開(kāi)發(fā)者可對(duì)代碼進(jìn)行充分審查以識(shí)別其潛在安全漏洞和算法瑕尊重不同文化群體的需求和價(jià)值觀。(三)從個(gè)人到國(guó)家,開(kāi)源釋放AI效能88極客公園:《開(kāi)源大模型領(lǐng)域最重要的玩家們,在關(guān)心/擔(dān)心什么》,網(wǎng)絡(luò)地址:/article/1845767.html,最后訪(fǎng)問(wèn)日期:2024年8月30日。大模型實(shí)現(xiàn)高度個(gè)性化的AI應(yīng)用,以作為個(gè)人自我表達(dá)的延伸。例如,藝術(shù)家和設(shè)計(jì)師可將個(gè)人作品作為輸入,對(duì)開(kāi)源模型如StableDiffusion開(kāi)源降低AI大模型技術(shù)效果的實(shí)現(xiàn)高度依賴(lài)海量數(shù)據(jù)和充足的算力資AI開(kāi)源大模型形成的成熟商業(yè)模式也將反哺開(kāi)源大模型社區(qū)和技術(shù)的演進(jìn),全面提升國(guó)家在前沿科技和智能產(chǎn)業(yè)方面的競(jìng)爭(zhēng)力。二、開(kāi)源大模型創(chuàng)新趨勢(shì)Agent且開(kāi)源模式也在持續(xù)推動(dòng)大模型技術(shù)的迭代創(chuàng)新和應(yīng)用落地。(一)開(kāi)源語(yǔ)言大模型開(kāi)啟百家爭(zhēng)鳴新紀(jì)元能強(qiáng)大的語(yǔ)言大模型僅能通過(guò)付費(fèi)API言大模型包括GPT-NeoX-20B、開(kāi)源預(yù)訓(xùn)練語(yǔ)言模型以及BLOOMLLaMA等高質(zhì)量開(kāi)源預(yù)訓(xùn)練語(yǔ)言大模型的發(fā)布OpenAIGPT、MistralAIMixtral、MicrosoftPhi、GoogleLaMDAGemini、DeepMindGopher、xAIGrok、Meta的LLaMAAIGLM、阿里巴巴的通義千問(wèn)、科大訊飛的星火、零一萬(wàn)物的Yi等得到快速發(fā)展和廣泛應(yīng)用。表1經(jīng)典開(kāi)源語(yǔ)言大模型解析專(zhuān)欄1經(jīng)典開(kāi)源語(yǔ)言大模型解析1.通義千問(wèn)Qwen模型簡(jiǎn)介QwenQwenQWenLMHeadModel模型架構(gòu)研發(fā)的大語(yǔ)言模型和大型多模態(tài)模型系列,目前已升級(jí)至Qwen2.5關(guān)鍵技術(shù)原理通義千問(wèn)的模型架構(gòu)基于增強(qiáng)的TransformerRMSNormFlashAttentionSwiGLU激活函數(shù)以提高模型的性能。軟硬件依賴(lài)LinuxMacOSWindows操作系統(tǒng),運(yùn)行前需安裝transformers(4.40.0+)、Python(3.8+)、PyTorch(2.2+)OLLaMA等模型部署框架快速在本地安裝。(當(dāng)前以中文和英文為主tokenQwen2-0.5B、Qwen2-1.5B、Qwen2-7B16GB顯存的GPUV100P100T4等,對(duì)于更大規(guī)模的模型如Qwen2-72B,則需要使用具有80GB顯存以上的A100GPU。2.LLaMA模型簡(jiǎn)介L(zhǎng)anguageModelMetaMetaAI發(fā)布的開(kāi)7B13B33B億)四種版本。LLaMA系列開(kāi)源大模型的訓(xùn)練數(shù)據(jù)集皆來(lái)源于公開(kāi)數(shù)LLaMA3.1版本。關(guān)鍵技術(shù)原理LLaMA3Decoder-onlyTransformer架構(gòu),與LLaMA2類(lèi)似,但進(jìn)行了一些改進(jìn),如使用RoPE(旋轉(zhuǎn)嵌入)作為位置編碼方案,以及分組查詢(xún)注意力(GroupedQueryAttention,GQA)機(jī)制來(lái)提高推理速度。軟硬件依賴(lài)軟件:LLaMA3Linux、MacOS、WindowsOLLaMA等模型部署框架快速在本地安裝,運(yùn)行前需安裝transformers(4.40.0+)、Python(3.7+)、PyTorch(2.2+)等必要關(guān)聯(lián)組件。8CPU進(jìn)行高效后端操70BGPUCUDA架構(gòu)的NvidiaGPU,如30008B16GBRAM,70B32GB或更多才能滿(mǎn)足基本運(yùn)行需求。70BTB級(jí)的SSD(二)開(kāi)源多模態(tài)大模型注入AI生態(tài)新活力Transformer開(kāi)源模型大力推動(dòng)多模態(tài)模型發(fā)展,開(kāi)源多模態(tài)大模型漸成生態(tài)。多模態(tài)模型,也稱(chēng)作跨模態(tài)模型,21開(kāi)源模型顯著推動(dòng)了多模態(tài)模型的快極大地促進(jìn)了AITransformer為基礎(chǔ),該框架通過(guò)自注意力機(jī)制(SfAtnonMhnm、多頭注意力(Multi-HeadAttention)等技術(shù)實(shí)現(xiàn)了對(duì)于全局信息的高效捕獲,顯2019好地理解和處理與圖像、視頻等其他模態(tài)相關(guān)的文本信息。同時(shí),CLIPDALL-EFlamingoVLMo、Ernie-ViLGmPLUG表2經(jīng)典開(kāi)源多模態(tài)大模型解析專(zhuān)欄2經(jīng)典開(kāi)源多模態(tài)大模型解析1.CLIP(ContrastiveLanguage-ImagePretraining)?模型簡(jiǎn)介CLIPOpenAI推出的一款多模態(tài)大模型,可理解和關(guān)聯(lián)圖CLIP生成高效的圖像和文本表示,用于多種下游任務(wù)。9上堵吟:《探索多模態(tài)大語(yǔ)言模型》,網(wǎng)絡(luò)地址:/s/hc6iYR0PSKmPXEfeFfPnYQ,最后訪(fǎng)問(wèn)日期:2024年10月6日。關(guān)鍵技術(shù)原理對(duì)比學(xué)習(xí):CLIP通過(guò)增強(qiáng)正確圖像-文本配對(duì)之間的相似度并降低錯(cuò)誤配對(duì)之間的相似度,實(shí)現(xiàn)了精準(zhǔn)的語(yǔ)義匹配。Transformer架構(gòu)CLIPTransformer模型,ResNet換將兩者的輸出映射至同一空間。軟硬件依賴(lài)軟件依賴(lài)CLIP基于框架,兼容大多數(shù)深度學(xué)習(xí)庫(kù)和工具。硬件依賴(lài)CLIPGPU支持,尤其是在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練時(shí),建議使用高性能GPU(如NVDAA1002.Flamingo模型簡(jiǎn)介Flamingo是由DeepMind發(fā)布的多模態(tài)模型,能夠處理文本、理,并具有強(qiáng)大的視頻處理能力。關(guān)鍵技術(shù)原理:Transformer架構(gòu):FlamingoTransformer編碼器處理Transformer實(shí)現(xiàn)。多模態(tài)聯(lián)合學(xué)習(xí):Flamingo通過(guò)聯(lián)合訓(xùn)練不同模態(tài)的數(shù)據(jù),使其在不同模態(tài)之間共享表示其在不同模態(tài)之間共享表示,進(jìn)行跨模態(tài)推理。? 軟硬件依賴(lài)軟件依賴(lài)Flamingo基于TensorFlow或JAX硬件依賴(lài):FlamingoGPUTPU的依賴(lài)較大,特別是在視頻處理任務(wù)中。(三)開(kāi)源Agent引領(lǐng)人工智能發(fā)展新方向AgentAgent創(chuàng)新應(yīng)用。智能體Agent的發(fā)展歷經(jīng)符號(hào)規(guī)則、統(tǒng)計(jì)學(xué)習(xí)、深度Agent的進(jìn)的自然語(yǔ)言理解技術(shù)賦予了AgentAgent10與其他人工智能領(lǐng)域技術(shù)相似,開(kāi)源模式同樣在極大程102024Igent行業(yè)報(bào)告》——大模型時(shí)代的“絡(luò)地址:ttp:/mp.eixin.qqcom//nv5C-xvIgt_qWL0g2024106度上促進(jìn)了Agent技術(shù)的創(chuàng)新發(fā)展和應(yīng)用觸達(dá),LangChain、TaskMatrix.AICogViewAutoGPTOpenAssistant等開(kāi)源Agent相Agent的研究和應(yīng)用門(mén)檻,推動(dòng)其發(fā)展和應(yīng)用。表3經(jīng)典開(kāi)源Agent解析專(zhuān)欄3經(jīng)典開(kāi)源Agent解析1.LangChain簡(jiǎn)介L(zhǎng)angChain是一個(gè)用于構(gòu)建可編程Agent的開(kāi)源框架,LangChain的架構(gòu)設(shè)計(jì)高度模塊化,開(kāi)發(fā)者可以根據(jù)需求靈活選擇和組合不同組件。此外,LangChain還支持與多個(gè)開(kāi)源語(yǔ)言模型的Agent的理想選擇。LangChain的核心動(dòng)化。此外,LangChain開(kāi)源項(xiàng)目十分活躍,有大量插件和擴(kuò)展可供使用。關(guān)鍵技術(shù)原理語(yǔ)言模型與工具集成LangChain通過(guò)結(jié)合大型語(yǔ)言模型(如等(Agent的多功能化。任務(wù)規(guī)劃與執(zhí)行:Agent能夠根據(jù)用戶(hù)輸入進(jìn)行任務(wù)規(guī)劃,調(diào)用適當(dāng)?shù)墓ぞ咄瓿扇蝿?wù)。軟硬件依賴(lài)軟件依賴(lài)軟件依賴(lài)LangChainPython,兼容大多數(shù)深度學(xué)習(xí)框架和工具。硬件依賴(lài):LangChain對(duì)硬件要求不高,常用于輕量級(jí)任務(wù)的自動(dòng)化執(zhí)行。2.TaskMatrix.AITaskMatrix.AI是由微軟亞洲研究院推出的一個(gè)多模態(tài)任務(wù)關(guān)鍵技術(shù)原理多模態(tài)融合:TaskMatrix.AI強(qiáng)化學(xué)習(xí):TaskMatrix.AI通過(guò)強(qiáng)化學(xué)習(xí),可在多步任務(wù)中不斷優(yōu)化決策,提高任務(wù)執(zhí)行的效率和準(zhǔn)確性。軟硬件依賴(lài)軟件依賴(lài):TaskMatrix.AI基于微軟的深度學(xué)習(xí)框架,集成了多種API和工具。硬件依賴(lài):TaskMatrix.AI需要較高性能的GPU支持,特別是在多模態(tài)任務(wù)中。三、開(kāi)源大模型風(fēng)險(xiǎn)挑戰(zhàn)的可得性還可能加劇人工智能技術(shù)的濫用風(fēng)險(xiǎn)。(一)開(kāi)源大模型應(yīng)用或?qū)е掳踩L(fēng)險(xiǎn)升級(jí)算法缺陷所誘發(fā)的新型安全風(fēng)險(xiǎn)。型,閉源大模型的保密性限制了外部審查,AI系統(tǒng)安全漏洞難以被二是開(kāi)源大模型系統(tǒng)安全問(wèn)題處理面臨兼容性和社區(qū)支持等不源社區(qū)缺乏足夠的開(kāi)發(fā)維護(hù)人員,開(kāi)源大模型項(xiàng)目將在較長(zhǎng)時(shí)間內(nèi)保持脆弱狀態(tài),存在嚴(yán)重安全隱患。360TensorFlow、PyTorch等11,如此可能導(dǎo)致輸出結(jié)果難以預(yù)測(cè)和確切歸因,如有異常難以快速修正和溯源追責(zé)。FlagEval11/p/687649249,最后訪(fǎng)問(wèn)時(shí)間2024年10月6日。性評(píng)測(cè)和格式擾動(dòng)魯棒性評(píng)測(cè)中,開(kāi)源大模型LLaMA-2-7B的擾動(dòng)后總平均準(zhǔn)確率不到40%。攻擊者可通一方12。此外,當(dāng)12參見(jiàn)張玉宏,秦志光,肖樂(lè):《大數(shù)據(jù)算法歧視的本質(zhì)》,載《自然辯證法研究》,2017年第33卷第5期,第81-86頁(yè)。反饋循環(huán)被不斷復(fù)制和放大,進(jìn)而加劇現(xiàn)有的社會(huì)歧視13。根據(jù)聯(lián)合LLaMA2生成的內(nèi)容中,4(二)開(kāi)源大模型應(yīng)用或面臨多重規(guī)制要求開(kāi)HuggingFace知識(shí)共享許可協(xié)議、新型人工智能許可協(xié)議。1)寬松型開(kāi)源軟件許可協(xié)議如Apache-2.0MIT13新傳碩博芝士站:《算法偏見(jiàn)(AlgorithmicBias)》,網(wǎng)絡(luò)地址:/p/668254492,最后訪(fǎng)問(wèn)日期:2024年10月6日。(或源代碼和二進(jìn)制代碼的開(kāi)源大模型項(xiàng)目可能存在一定風(fēng)險(xiǎn)問(wèn)題。2)知識(shí)共享系列許可協(xié)大模型或潛藏較高專(zhuān)利風(fēng)險(xiǎn)。3)新型人工智能許可協(xié)議主要包括RAIL(ResponsibleAIPubsLicenses)系列許可協(xié)議及Meta的LLAMA2StabilityAIOSI的經(jīng)能略有差異。

表4國(guó)內(nèi)外典型大模型許可協(xié)議類(lèi)型表序號(hào)名稱(chēng)模型類(lèi)型大模型許可協(xié)議備注1阿里云通義千問(wèn)預(yù)訓(xùn)練以Qwen/Qwen2-72B為代表TongyiQianwenLICENSEAGREEMENTTongyiQianwenReleaseDate:August3,2023MetaLLaMA協(xié)議有相似之處2阿里云通義千問(wèn)對(duì)話(huà)以Qwen/Qwen2-72B-Instruct為代表3零壹萬(wàn)物預(yù)訓(xùn)練以01-ai/Yi-1.5-34B-32K為代表Apache2.0Apache2.0許可協(xié)議是Apache基金會(huì)制序號(hào)名稱(chēng)模型類(lèi)型大模型許可協(xié)議備注4零壹萬(wàn)物對(duì)話(huà)01-ai/Yi-為代表定的被廣泛采用的開(kāi)源許可協(xié)議5幻方/深度求索預(yù)訓(xùn)練以deepseek-ai/deepseek-llm-7b-base為代表DEEPSEEKLICENSEAGREEMENTVersion1.0,23October2023自定義許可協(xié)議,與OpenRAIL可協(xié)議有相似之處6幻方/深度求索對(duì)話(huà)以DeepSeek-V2-Chat代表7上海AI實(shí)驗(yàn)室/書(shū)生浦語(yǔ)預(yù)訓(xùn)練internlm2_5-20bApache2.0Apache2.0許可協(xié)議是Apache基金會(huì)制定的被廣泛采用的開(kāi)源許可協(xié)議8上海AI實(shí)驗(yàn)室/書(shū)生浦語(yǔ)對(duì)話(huà)internlm2_5-20b-chat9騰訊預(yù)訓(xùn)練LLaMA-Pro-8BLLAMA2LICENSEAGREEMENTMetaLLaMA協(xié)議10騰訊對(duì)話(huà)LLaMA-Pro-8B-Instruct11百川預(yù)訓(xùn)練Baichuan2-13B-BaseBaichuan2模型社區(qū)許可協(xié)議自定義許可協(xié)議12百川對(duì)話(huà)Baichuan2-13B-Chat13Meta/LLaMA預(yù)訓(xùn)練meta-70BMETALLAMA3COMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿(mào)易管制法律法規(guī)14Meta/LLaMA對(duì)話(huà)meta-70B-Instruct序號(hào)名稱(chēng)模型類(lèi)型大模型許可協(xié)議備注15MistralAI_預(yù)訓(xùn)練mistralai/Mixtral-8x22B-v0.1Apache2.0Apache2.0許可協(xié)議是Apache基金會(huì)制定的被廣泛采用的開(kāi)源許可協(xié)議16谷歌預(yù)訓(xùn)練google/gemma-2-9bGemmaTermsofUse未特別定義貿(mào)易管制條款17谷歌對(duì)話(huà)google/gemma-2-9b-itGemmaTermsofUse未特別定義貿(mào)易管制條款18微軟預(yù)訓(xùn)練microsoft/phi-2MIT被廣泛采用的寬松開(kāi)源許可協(xié)議19微軟對(duì)話(huà)microsoft/Phi-3-medium-4k-instructMIT被廣泛采用的寬松開(kāi)源許可協(xié)議20Stability預(yù)訓(xùn)練stabilityai/stablelm-2-12bSTABILITYAICOMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿(mào)易管制法律法規(guī)21Stability對(duì)話(huà)stabilityai/stablelm-2-12b-chatSTABILITYAICOMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿(mào)易管制法律法規(guī)22TII預(yù)訓(xùn)練tiiuae/falcon-40BTermsandConditionsFalcon211BTIILicenseVersion1.0基于Apache2.0許可協(xié)議的自定義許可協(xié)議23TII對(duì)話(huà)tiiuae/falcon-40B-instruct24OpenAI-Community預(yù)訓(xùn)練openai-community/gpt2MIT被廣泛采用的寬松開(kāi)源許可協(xié)議25Princeton普林斯頓預(yù)訓(xùn)練princeton-nlp/Sheared-Apache2.0Apache2.0許可協(xié)議是Apache基金會(huì)制定的被廣泛采用的開(kāi)源許可協(xié)議序號(hào)名稱(chēng)模型類(lèi)型大模型許可協(xié)議備注26Facebook預(yù)訓(xùn)練facebook/opt-30bOPT-175BLICENSEAGREEMENT自定義許可協(xié)議。未對(duì)貿(mào)易管制法律法規(guī)的遵從做出特別規(guī)定27BigScience預(yù)訓(xùn)練bigscience/bloom-3bbigscience-bloom-rail-1.0自定義許可協(xié)議。未對(duì)貿(mào)易管制法律法規(guī)的遵從做出特別規(guī)定LLaMA3.12明確活躍用戶(hù)達(dá)到閾值需另行申請(qǐng)商業(yè)許可、LLaMA2許可協(xié)議包含用于訓(xùn)練其他大模型的限制、LLaMA3.1明確了衍生大模型命名的限制、RAILLLaMA3.1可GPL-3.014因此,使用開(kāi)閉源大模型訓(xùn)據(jù)來(lái)源合法。1)對(duì)于開(kāi)放數(shù)據(jù)集而言,使用開(kāi)放數(shù)據(jù)集不僅需遵循其開(kāi)源許可協(xié)議義務(wù)要求,還需考察其許可協(xié)議的傳染性和兼容性,LLaMABooks3中包含大量未授權(quán)書(shū)籍,在部分國(guó)家訓(xùn)練和應(yīng)用可能引發(fā)侵權(quán)糾紛。2)自采(robot協(xié)議14參見(jiàn)辜凌云:《以許可協(xié)議為核心的開(kāi)源社區(qū)治理邏輯》,載《知識(shí)產(chǎn)權(quán)》2024年第6期,第57-58頁(yè)。爭(zhēng)等法律問(wèn)題,情節(jié)嚴(yán)重者還可能觸犯刑法。3)商采數(shù)據(jù)需謹(jǐn)慎關(guān)注數(shù)據(jù)來(lái)源合法性以及數(shù)據(jù)可交易性,以避免發(fā)生合規(guī)風(fēng)險(xiǎn)。4)應(yīng)可能導(dǎo)致對(duì)于使用者知識(shí)產(chǎn)權(quán)、商業(yè)秘密以及個(gè)人隱私的侵犯。5)LLaMA2許若訓(xùn)練數(shù)據(jù)中包含個(gè)人訓(xùn)練數(shù)據(jù)本身或在帶來(lái)法律及倫理上的風(fēng)險(xiǎn)。生成物在數(shù)15內(nèi)容輸出階段主要涉及三方面侵(學(xué)學(xué)報(bào)》2024327頁(yè)。將可能侵犯著作權(quán)人的信息網(wǎng)絡(luò)傳播權(quán)。16此外,大模型生成物還可ScarlettJohansson對(duì)OpenAI提出指控,控訴OpenAI人工智能編碼工具Copilot的用戶(hù)面臨的侵權(quán)索賠進(jìn)行賠償。而開(kāi)源AI202432-5頁(yè)。生成物侵權(quán)責(zé)任承擔(dān)方,因此相關(guān)風(fēng)險(xiǎn)發(fā)生時(shí),可能面臨責(zé)任歸屬不明的情況。(三)開(kāi)源模式或加劇大模型技術(shù)濫用風(fēng)險(xiǎn)開(kāi)源大模型不當(dāng)應(yīng)用或加深信息繭房、固化認(rèn)知偏見(jiàn)。早在20桑斯坦便基于對(duì)互聯(lián)網(wǎng)信息傳播的考察提出表性不足的“小眾”全面認(rèn)知。GPS導(dǎo)航和智能手機(jī)讓人類(lèi)更容易遺忘地址和電話(huà)號(hào)碼,ChatGPT能技術(shù)及服務(wù)的過(guò)度應(yīng)用還可能逐漸改變?nèi)祟?lèi)的交流方式和情感體開(kāi)源加速人工智能如基于開(kāi)源語(yǔ)言大模型構(gòu)建,并去除安全和道德限制的非法大模型FraudGPT支持自動(dòng)化編寫(xiě)欺騙性短信、釣魚(yú)郵件和釣魚(yú)網(wǎng)站代碼,F(xiàn)raudGPT的用戶(hù)數(shù)在短短數(shù)月內(nèi)便超過(guò)了先進(jìn)的國(guó)家網(wǎng)絡(luò)戰(zhàn)部隊(duì)黑客數(shù)量。17四、開(kāi)源大模型治理全球動(dòng)態(tài)為避免人工智能技術(shù)發(fā)展陷入科林格里奇困境18,平衡風(fēng)險(xiǎn)治理17REEBraudThttps:///news/375547.html,最后訪(fǎng)問(wèn)時(shí)間2024年10月6日。18注:科林格里奇困境(Collingridge'sDilemma)是英國(guó)技術(shù)哲學(xué)家大衛(wèi)·(1980)中指出,一項(xiàng)技術(shù)如果因?yàn)閾?dān)心不良后果而過(guò)早實(shí)施控制,那么技術(shù)很可能就難以爆發(fā)。反之(一)國(guó)際組織高度重視開(kāi)源大模型發(fā)展,積極探索全球人工智能治理方案聯(lián)合國(guó)政策助力凝聚開(kāi)源大模型發(fā)展共識(shí)。20206月,聯(lián)合國(guó)秘書(shū)長(zhǎng)安東尼斯193個(gè)會(huì)員國(guó)一該建議書(shū)結(jié)合人工智能系統(tǒng)全生命周期倫理影響和各會(huì)員國(guó)發(fā)展差年92024710建多元化AI生態(tài)系統(tǒng)。經(jīng)合組織呼吁構(gòu)建負(fù)責(zé)任人工智能系統(tǒng)。經(jīng)20195月通過(guò)全球首個(gè)人工智能主題政府間20245月進(jìn)行了修訂。該修訂版以創(chuàng)新、可信和人權(quán)企業(yè)的人工智能發(fā)展環(huán)境。20239月,77國(guó)集團(tuán)和中國(guó)發(fā)布《關(guān)于當(dāng)前發(fā)展挑戰(zhàn):科學(xué)、接入和使用。(二)歐盟立法謀求人工智能監(jiān)管主導(dǎo)權(quán),開(kāi)源大模型得有條件義務(wù)豁免歐盟建立全球首部人工智能監(jiān)管立法,平衡AI創(chuàng)新保護(hù)。202481中免費(fèi)或用于科學(xué)研究和開(kāi)發(fā)目的而投入使用的開(kāi)源AI系統(tǒng)可豁免部分合規(guī)義務(wù)。19同時(shí),該法案對(duì)于開(kāi)源大模型的定義門(mén)檻較低,在要求注明來(lái)源并遵循類(lèi)似分發(fā)條款的前提下開(kāi)放共享模型代碼及相192AI組件I系統(tǒng)或是第二編(I)或第四編()I3(3AI。場(chǎng),以最大程度保護(hù)開(kāi)源創(chuàng)新與研究。(三)美國(guó)人工智能監(jiān)管增強(qiáng)化趨勢(shì)明顯,國(guó)防領(lǐng)域率先探索開(kāi)源大模型影響2019AI研發(fā)及相關(guān)領(lǐng)域主要依靠區(qū)域性監(jiān)管和行業(yè)自律等方式開(kāi)展人工智能治理工作布局。20202310月,拜登政府簽署行政令《安全、可靠和可信開(kāi)發(fā)和使202431個(gè)地方政府通過(guò)相關(guān)決議20248月,加利福尼亞州通過(guò)了《前沿人工智能模型202024457頁(yè)。(四)中國(guó)人工智能治理規(guī)則由“軟”及“硬”,開(kāi)源大模型或得包容性監(jiān)管人2017新保護(hù)。自2022年底至今,各地方政府陸續(xù)出臺(tái)開(kāi)源與大模型、開(kāi)2024510日,國(guó)務(wù)院公布2024(學(xué)者建議稿》和《人工智能示范法專(zhuān)家建議稿提供者的責(zé)任減免規(guī)則。表5地方政府開(kāi)源人工智能相關(guān)規(guī)范文件名稱(chēng)地方發(fā)布日期實(shí)施日期發(fā)布機(jī)構(gòu)條款《廣東省新一代人工智能創(chuàng)新發(fā)展行動(dòng)計(jì)劃(年》廣東省2022.12.222022.12.22廣東省科學(xué)技術(shù)廳,廣東省工業(yè)和信息化廳3.加強(qiáng)人工智能操作系統(tǒng)有自主知識(shí)產(chǎn)權(quán)的通用人端人工智能操作系統(tǒng)和源基礎(chǔ)軟件加強(qiáng)人工智能領(lǐng)域開(kāi)源軟件生態(tài)建設(shè)實(shí)人工智能發(fā)展的軟件基礎(chǔ)。整合全球人訓(xùn)練和終端執(zhí)行的開(kāi)發(fā)框放技術(shù)網(wǎng)絡(luò)和開(kāi)源社區(qū)建開(kāi)源軟件生態(tài)。研究機(jī)器視覺(jué)、語(yǔ)音識(shí)別、機(jī)器翻譯、智能交互、知識(shí)處理、控制決策等人工智能基礎(chǔ)解決方案,支持面向無(wú)人駕駛、智能機(jī)器人、無(wú)人機(jī)等人工智能應(yīng)用領(lǐng)域構(gòu)建基于開(kāi)源開(kāi)放技術(shù)的公共數(shù)據(jù)資源庫(kù)、標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)庫(kù)、云服務(wù)平臺(tái)等各類(lèi)通用開(kāi)源軟件和開(kāi)放技術(shù)平臺(tái)。克無(wú)人系統(tǒng)核心智能芯片業(yè)鏈上下游企業(yè)開(kāi)放核心IP以及關(guān)鍵傳感器的新型傳感器數(shù)據(jù)集開(kāi)源共生態(tài)。業(yè)共性平臺(tái)技術(shù)和醫(yī)療共享資源庫(kù),推動(dòng)上下游企業(yè)、科研院所、行業(yè)協(xié)會(huì)、推動(dòng)醫(yī)療數(shù)據(jù)資源和平臺(tái)開(kāi)源共享。持人工智能優(yōu)勢(shì)企業(yè)和科研院所建設(shè)面向行業(yè)共性自主核心軟硬件開(kāi)源開(kāi)放共享源開(kāi)放與保護(hù)政策體系和進(jìn)重點(diǎn)領(lǐng)域數(shù)據(jù)信息依法業(yè)健康可持續(xù)發(fā)展。推動(dòng)人工智能龍頭企業(yè)基于人工智能操作系統(tǒng)、芯片、傳感器等自主核心軟硬件提供開(kāi)源開(kāi)放共享服務(wù)業(yè)聯(lián)盟聯(lián)合研發(fā)基于國(guó)產(chǎn)開(kāi)源學(xué)習(xí)框架自主建設(shè)技術(shù)開(kāi)源和開(kāi)放的共享平臺(tái)立人工智能安全性測(cè)試模同,建設(shè)綜合測(cè)試驗(yàn)證環(huán)境?!赌暇﹪?guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)建設(shè)實(shí)施方案》寧政發(fā)(2022)133號(hào)南京2022.12.122022.12.12南京市人民政府18自主可控人工智能計(jì)算中練平臺(tái),在科研大模型研試的過(guò)程中為人工智能企企業(yè)建設(shè)線(xiàn)上數(shù)據(jù)集交易平臺(tái),實(shí)現(xiàn)數(shù)據(jù)安全匯聚,逐步形成高質(zhì)量的行業(yè)公共開(kāi)放數(shù)據(jù)集。通過(guò)算法開(kāi)源和數(shù)據(jù)開(kāi)放,打造創(chuàng)新型開(kāi)發(fā)者社區(qū),匯聚海量算法、模型、產(chǎn)品、應(yīng)用與服務(wù)。《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃》北京2023.05.192023.05.19北京市經(jīng)濟(jì)和信息化局,北京市科學(xué)技術(shù)委員會(huì),北京市發(fā)展和改革委員會(huì)(七)培育軟件開(kāi)發(fā)新范AI重以開(kāi)源聚合創(chuàng)加強(qiáng)工業(yè)軟件與大模型融模型互聯(lián)網(wǎng)新軟件新服務(wù)?!侗本┦屑涌旖ㄔO(shè)具有全球影響力的人工智能創(chuàng)新策源(2023-2025》京政發(fā)〔2023〕14號(hào)北京2023.05.212023.05.21北京市人民政府2.引領(lǐng)人工智能關(guān)鍵核心技術(shù)創(chuàng)新。支持創(chuàng)新主體重點(diǎn)突破分布式高效深度學(xué)習(xí)框架、大模型新型基礎(chǔ)架構(gòu)、深度超大規(guī)模圖計(jì)算、超大規(guī)模模擬計(jì)算等基礎(chǔ)平臺(tái)技術(shù)。支持?jǐn)?shù)據(jù)與知識(shí)深度聯(lián)合學(xué)習(xí)、高維空間多模態(tài)語(yǔ)義對(duì)齊、大規(guī)模認(rèn)知與推理、可控內(nèi)容生成、高效低成本訓(xùn)練與推理等關(guān)鍵算法研發(fā),著力推動(dòng)大模型相關(guān)技術(shù)創(chuàng)新。鼓勵(lì)相關(guān)技術(shù)和算法開(kāi)源開(kāi)放。5.加強(qiáng)自主開(kāi)源深度學(xué)習(xí)框架研發(fā)攻關(guān)。針對(duì)分布式計(jì)算需求,研發(fā)動(dòng)靜統(tǒng)一編程、多維自動(dòng)并行技術(shù),提升深度學(xué)習(xí)框架在超大規(guī)模模型訓(xùn)練和多端多平臺(tái)推理部署等方面的核心能力,研發(fā)多類(lèi)型模型開(kāi)發(fā)、訓(xùn)練、壓縮、推理全流程工具,支持自主深度學(xué)習(xí)框架與人工智能芯片開(kāi)展廣泛適配和融合優(yōu)化,實(shí)現(xiàn)人工智能?chē)?guó)產(chǎn)軟硬件技術(shù)的深度協(xié)同。8.構(gòu)建高效協(xié)同的大模型技術(shù)產(chǎn)業(yè)生態(tài)。建設(shè)大模型算法及工具開(kāi)源開(kāi)放平臺(tái),構(gòu)建完整大模型技術(shù)創(chuàng)新體系,積極爭(zhēng)取成為國(guó)家人工智能開(kāi)放生態(tài)技術(shù)創(chuàng)新中心。組建全棧國(guó)產(chǎn)化人工智能創(chuàng)新聯(lián)合體,搭建基于國(guó)產(chǎn)軟硬件的人工智能訓(xùn)練和服務(wù)基礎(chǔ)設(shè)施,研發(fā)全棧國(guó)產(chǎn)化的生成式大模型,逐步形成自主可控的人工智能技術(shù)體系和產(chǎn)業(yè)生態(tài)?!侗本┦写龠M(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》京政辦202315北京2023.05.232023.05.23北京市人民政府辦公廳圍繞模型構(gòu)建、訓(xùn)練、調(diào)優(yōu)對(duì)齊、推理部署等環(huán)節(jié),積極探索基礎(chǔ)模型架構(gòu)創(chuàng)新,研究大模型高效并行訓(xùn)練技術(shù)和認(rèn)知推理、指令學(xué)習(xí)、人類(lèi)意圖對(duì)齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓縮和端側(cè)部署技術(shù),形成完整高效的技術(shù)體系,鼓勵(lì)開(kāi)源技術(shù)生態(tài)建設(shè)?!渡钲谑屑涌焱苿?dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2024年》深圳2023.05.312023.05.31中共深圳市委員會(huì)辦公廳,深圳市人民政府辦公廳(四)器人、智能網(wǎng)聯(lián)汽車(chē)等領(lǐng)造基于國(guó)內(nèi)外芯片和算法的開(kāi)源通用大模型點(diǎn)企業(yè)持續(xù)研發(fā)和迭代商具身智能機(jī)器人的研發(fā)和與企業(yè)共建5家以上人工廣東省人形機(jī)器人制造業(yè)創(chuàng)新中心?!逗贾菔腥嗣裾k公廳關(guān)于加快推進(jìn)人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施〔2023〕55號(hào)杭州2023.07.242023.08.25杭州市人民政府辦公廳(二構(gòu)建高效協(xié)同模型創(chuàng)新生態(tài)。推進(jìn)MaaS新模態(tài)通用大模型關(guān)鍵技術(shù)攻術(shù)和算法開(kāi)源開(kāi)放,形成“1+N+X”(二)展多模態(tài)通用大模型研發(fā)并向中小企業(yè)開(kāi)放模型應(yīng)權(quán)威第三方評(píng)測(cè)機(jī)構(gòu)評(píng)測(cè)性能達(dá)到國(guó)內(nèi)領(lǐng)先的通用5000萬(wàn)元。支持10個(gè)性能先進(jìn)并在杭成功落地的優(yōu)秀專(zhuān)用模型,按照不超過(guò)研發(fā)成本30%的標(biāo)準(zhǔn)給予牽頭研發(fā)500高校院所和第三方機(jī)構(gòu)圍繞模型開(kāi)發(fā)搭建開(kāi)源開(kāi)放平臺(tái)(社區(qū),構(gòu)建基于開(kāi)數(shù)據(jù)、應(yīng)用協(xié)同的產(chǎn)業(yè)生態(tài)市級(jí)開(kāi)源開(kāi)放示范平臺(tái)共數(shù)據(jù)集支持?!洞龠M(jìn)人工智能創(chuàng)新發(fā)展政寧夏2023.08.132023.09.15寧夏回族自治區(qū)人(七)鼓勵(lì)模型創(chuàng)新。支持落地企業(yè)開(kāi)展大模型訓(xùn)練,20238號(hào)民政府辦公廳極探索基礎(chǔ)模型架構(gòu)創(chuàng)新,研究大模型高效并行訓(xùn)練技術(shù)和認(rèn)知推理、指令學(xué)推理的高效壓縮技術(shù)和端生態(tài)建設(shè)給予不超過(guò)項(xiàng)目總研發(fā)投30%1000金支持。(八支持放、協(xié)同共享的人工智能數(shù)據(jù)歸集放及檢驗(yàn)檢測(cè)的創(chuàng)新服務(wù)平臺(tái),參考平臺(tái)軟硬件投入、人工智能企業(yè)用戶(hù)數(shù)、服務(wù)成果等方面,擇優(yōu)給予綜合貢獻(xiàn)度較高的開(kāi)放平500《武漢市人民政府辦公廳關(guān)于印發(fā)武漢建武漢2023.08.302023.08.30武漢市人民政府動(dòng)頭部企業(yè)聯(lián)合多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟組建創(chuàng)新設(shè)國(guó)家人工智聯(lián)合體,創(chuàng)建人工智能方向能創(chuàng)新應(yīng)用先導(dǎo)區(qū)實(shí)施方案(2023-2025年2023號(hào)開(kāi)展大模型創(chuàng)新算法開(kāi)發(fā)與開(kāi)源開(kāi)放“紫東太初”多模態(tài)大模型訓(xùn)練模型架構(gòu)設(shè)計(jì)與優(yōu)化模態(tài)大模型通用人工智能企業(yè)在漢布局垂直領(lǐng)域模具有影響力的垂直行業(yè)模10個(gè)以上,培育一批垂直行業(yè)模型解決方案服務(wù)智能產(chǎn)業(yè)實(shí)現(xiàn)應(yīng)用?!渡虾J写龠M(jìn)智能機(jī)器人產(chǎn)業(yè)高質(zhì)量創(chuàng)新發(fā)展行動(dòng)方案(2023-2025年》滬經(jīng)信制〔2023〕915號(hào)上海2023.10.192023.10.19上海市經(jīng)濟(jì)和信息化委員會(huì),上海市發(fā)展和改革委員會(huì),上海市科學(xué)技術(shù)委員會(huì),上海市財(cái)政局,上海市統(tǒng)計(jì)局4、重點(diǎn)攻關(guān)具身智能等先化學(xué)習(xí)訓(xùn)練構(gòu)建機(jī)器人運(yùn)知識(shí)庫(kù)和數(shù)據(jù)采集平臺(tái)的器人運(yùn)行環(huán)境與機(jī)器人感現(xiàn)人形機(jī)器人面向場(chǎng)景應(yīng)能等前沿技術(shù)與機(jī)器人融平?!渡虾J型苿?dòng)人工智能大模型創(chuàng)新發(fā)展若干措施(2023-2025年2023號(hào)上海2023.10.202023.10.20上海市經(jīng)濟(jì)和信息化委員會(huì),上海市發(fā)展和改革委員會(huì)上海市科學(xué)技術(shù)委員會(huì)中共上9.推進(jìn)大模型應(yīng)用生態(tài)建型開(kāi)源社區(qū)和協(xié)作平臺(tái)建設(shè)開(kāi)放協(xié)同產(chǎn)業(yè)生態(tài)。海市委網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室,上海市財(cái)政局《推動(dòng)區(qū)塊鏈、上2023.10.252023.10.25上海市經(jīng)結(jié)合支持生產(chǎn)性互聯(lián)網(wǎng)服大模型技術(shù)賦能生產(chǎn)性互聯(lián)網(wǎng)服務(wù)平臺(tái)發(fā)海濟(jì)和信息化委員會(huì),上海市商鏈城市數(shù)字基礎(chǔ)設(shè)施體系開(kāi)源大模型行業(yè)應(yīng)用展實(shí)施方案》滬經(jīng)信生〔2023〕936號(hào)務(wù)委員會(huì)創(chuàng)新生態(tài)空間等重點(diǎn)工作,推動(dòng)區(qū)塊鏈、大模型賦能各類(lèi)平臺(tái)發(fā)展。3.夯實(shí)通用大模型基礎(chǔ)能具有國(guó)際競(jìng)爭(zhēng)力的通用大施建設(shè)。推動(dòng)大模型語(yǔ)料數(shù)據(jù)聯(lián)盟持續(xù)開(kāi)源高質(zhì)量數(shù)據(jù)集大模型產(chǎn)業(yè)健康發(fā)展。(三)強(qiáng)化政策保障。通過(guò)市促進(jìn)產(chǎn)業(yè)高質(zhì)量發(fā)展、商務(wù)高質(zhì)量發(fā)展等專(zhuān)項(xiàng)資金,對(duì)標(biāo)桿性企業(yè)、應(yīng)用場(chǎng)景進(jìn)建設(shè)開(kāi)源大模型行業(yè)應(yīng)用創(chuàng)新生態(tài)空對(duì)入駐的企業(yè)和團(tuán)隊(duì)給網(wǎng)服務(wù)平臺(tái)領(lǐng)域的大模型相關(guān)應(yīng)用及解決方案納入符合條件的專(zhuān)業(yè)人才予以套支持政策?!墩憬∪嗣裾?023.12.072023.12.07浙江省人(二推動(dòng)大模型技術(shù)開(kāi)源政府辦公廳關(guān)于加快人工智江省民政府辦公廳型領(lǐng)域自主可控開(kāi)源社區(qū)能產(chǎn)業(yè)發(fā)展的和開(kāi)放創(chuàng)新平臺(tái)建設(shè),打造2023號(hào)模型即服務(wù)(MaaS)新范支持自主開(kāi)源深度學(xué)習(xí)框架研發(fā)攻關(guān)和代碼托管鏡像平臺(tái)建設(shè)制定推廣開(kāi)源領(lǐng)域相關(guān)標(biāo)準(zhǔn)和協(xié)議進(jìn)人工智能領(lǐng)域開(kāi)源軟件的國(guó)際規(guī)則互認(rèn)。研發(fā)多類(lèi)者群體,繁榮開(kāi)源生態(tài)。AI服務(wù)機(jī)器人產(chǎn)業(yè)集群高質(zhì)量發(fā)展行動(dòng)計(jì)劃(2023—2027年》渝經(jīng)信通202310重慶2023.12.152023.12.15重慶市經(jīng)濟(jì)和信息化委員會(huì)研院所前瞻布局人形機(jī)器人通用原型機(jī)研發(fā)、AI通靈巧臂—手建模和控制技深導(dǎo)航技術(shù)等領(lǐng)域,推動(dòng)人形機(jī)器人技能提升和智能AI大AI大模型評(píng)測(cè)體系和生態(tài),AI和人形機(jī)器人融合發(fā)展。《中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)臨港新片區(qū)上海2024.03.042024.09.01中國(guó)(上海)2.支持建設(shè)人工智能開(kāi)源平臺(tái)集聚發(fā)展人工區(qū)臨港新鼓勵(lì)構(gòu)建高效協(xié)同的大模智能產(chǎn)業(yè)若干2024號(hào)片區(qū)管理委員會(huì)打造開(kāi)源通用大模型生成式人工智能產(chǎn)業(yè),重點(diǎn)支持分布式高效深度學(xué)習(xí)開(kāi)發(fā)搭建自主可控的人工智能開(kāi)源平臺(tái)億參數(shù)以上且落地三個(gè)及以上實(shí)際應(yīng)用場(chǎng)景的深度研發(fā)費(fèi)用的10%-30%比例10%比例給予支持,年度支持金額不超過(guò)100萬(wàn)元,資助周期不超過(guò)3年?!秾幭幕刈遄灾螀^(qū)工業(yè)和信息化廳寧夏回族自治區(qū)財(cái)政廳關(guān)于征集2024年大數(shù)據(jù)產(chǎn)業(yè)試點(diǎn)示范項(xiàng)目的通知》寧夏2024.03.042024.03.04寧夏回族自治區(qū)工業(yè)和信息化廳,寧夏回族自治區(qū)財(cái)政廳2.智能通用大模型和行業(yè)應(yīng)設(shè)人工智能大模型領(lǐng)域自主可控開(kāi)源社區(qū)和創(chuàng)新平臺(tái)署、語(yǔ)料數(shù)據(jù)等大模型服務(wù)。《石景山區(qū)促進(jìn)人工智能大模型產(chǎn)業(yè)發(fā)展行動(dòng)計(jì)劃(2024—2025年》石政辦發(fā)〔2024〕4號(hào)北京2024.03.262024.03.26北京市石景山區(qū)人民政府辦公室7.整合資源協(xié)同發(fā)展。發(fā)揮科研院所等技術(shù)資源優(yōu)勢(shì),聯(lián)合頭部企業(yè)開(kāi)展大模型研發(fā)應(yīng)用,鼓勵(lì)相關(guān)技術(shù)和算法開(kāi)源開(kāi)放,提升大模型產(chǎn)品研發(fā)水平和行業(yè)賦能能力。建設(shè)人工智能大模型產(chǎn)業(yè)標(biāo)桿型孵化器,梯次培育一批人工智能大模型垂直行業(yè)代表企業(yè)?!侗本┙?jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)關(guān)于加快打造AI原生產(chǎn)業(yè)創(chuàng)新高地的若干政策》京技管發(fā)〔2024〕10號(hào)北京2024.03.282024.03.28北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)管理委員會(huì)13.打造人工智能公共服務(wù)硬件協(xié)同創(chuàng)新與適配驗(yàn)證能軟硬件行業(yè)解決方案測(cè)建設(shè)人工智能開(kāi)源開(kāi)放平臺(tái)鼓勵(lì)大模型領(lǐng)域自主可控開(kāi)源社區(qū)發(fā)展支持自主開(kāi)源深度學(xué)習(xí)框架研發(fā)攻關(guān)和代碼托管鏡像平臺(tái)建開(kāi)源社區(qū)注冊(cè)用戶(hù)活躍度業(yè)最高500萬(wàn)元補(bǔ)貼?!稄V東省人民政府辦公廳印發(fā)廣東省關(guān)于人工智能賦能千行百業(yè)若干措施的通知》粵辦函〔2024〕88號(hào)廣東省2024.05.262024.05.26廣東省人民政府辦公廳7.建設(shè)大模型開(kāi)源社區(qū)。建設(shè)原創(chuàng)性基礎(chǔ)大模型資源池支持大模型及其衍生2027年,示人工智能的開(kāi)源服務(wù)體系?!侗本┦型苿?dòng)“人工智能+”行動(dòng)計(jì)劃(2024-2025》京發(fā)改〔20241081號(hào)北京2024.07.182024.07.18北京市發(fā)展和改革委員會(huì),北京市經(jīng)濟(jì)和信息化局,北京市科學(xué)技術(shù)委員會(huì),中關(guān)村科技園區(qū)管理委員會(huì)建設(shè)運(yùn)營(yíng)北京算力互聯(lián)互開(kāi)放并匯聚高價(jià)值行業(yè)數(shù)大模型訓(xùn)練提供算力、數(shù)資源持基礎(chǔ)大模型在各行業(yè)領(lǐng)控的基礎(chǔ)大模型為底座加速訓(xùn)練細(xì)分行業(yè)垂類(lèi)大模型,完善大模型應(yīng)用工具控基礎(chǔ)大模型型和數(shù)據(jù)集托管云服務(wù)平臺(tái),促進(jìn)開(kāi)發(fā)者分享和協(xié)作。五、企業(yè)應(yīng)用開(kāi)源大模型風(fēng)險(xiǎn)治理實(shí)操要點(diǎn)統(tǒng)籌開(kāi)展開(kāi)源大模型風(fēng)險(xiǎn)防控工作。(一)開(kāi)源大模型治理體系構(gòu)建治理委員會(huì)負(fù)責(zé)制定開(kāi)源大模型的調(diào)整企業(yè)的合規(guī)策略。相關(guān)角色將在各自的領(lǐng)域內(nèi)為開(kāi)源大模型的治理和應(yīng)用提供支持。企業(yè)面向開(kāi)源大模型的治理機(jī)制明確了開(kāi)源大模型治理的規(guī)則企業(yè)應(yīng)制定明確的開(kāi)且不違反相關(guān)法律法規(guī)和企業(yè)內(nèi)部規(guī)定。二是構(gòu)建風(fēng)險(xiǎn)管理機(jī)制。在安全風(fēng)險(xiǎn)管理方面,企業(yè)需對(duì)開(kāi)源大業(yè)應(yīng)實(shí)施CI/CD并根據(jù)實(shí)際情況進(jìn)行優(yōu)化調(diào)整。(二)開(kāi)源大模型風(fēng)險(xiǎn)防控建議的更新頻率和社區(qū)活躍度是評(píng)估其生命力和持續(xù)發(fā)展能力的重要指開(kāi)源大模型項(xiàng)目的成功很大企業(yè)可從開(kāi)源大模型應(yīng)用全生命周期進(jìn)行開(kāi)源大模型安全風(fēng)險(xiǎn)防控。企業(yè)在開(kāi)源大模型引入階段應(yīng)做好安全準(zhǔn)備源大模型選型時(shí),企業(yè)應(yīng)評(píng)估項(xiàng)目是否存在已知的安全隱患和漏洞,——模型部署/21在算法優(yōu)化——模型再發(fā)布/對(duì)外提供服務(wù)階段:企業(yè)在利用開(kāi)源大模型提在許可協(xié)議合規(guī)方面,企業(yè)使用開(kāi)源大模型的合規(guī)流程一般包含212024/s/ucJDZf03jru7IB5maCi5zg20246日。以下環(huán)節(jié)。

圖2人工智能大模型許可協(xié)議合規(guī)流程結(jié)合未來(lái)使用方式和使用場(chǎng)景判斷擬引入開(kāi)源大模型是否滿(mǎn)足公司——模型部署/優(yōu)化階段:企業(yè)開(kāi)放人員應(yīng)在專(zhuān)業(yè)合規(guī)人員的協(xié)用方式和使用場(chǎng)景綜合確定待履行義務(wù),并準(zhǔn)備義務(wù)履行材料?!P驮侔l(fā)布/對(duì)外提供服務(wù)階段:企業(yè)應(yīng)根據(jù)許可協(xié)議要求履行對(duì)應(yīng)聲明義務(wù)和/或衍生作品再開(kāi)源義務(wù),并進(jìn)行義務(wù)符合性審查,以確保完全符合大模型許可協(xié)議的相關(guān)要求。表6常見(jiàn)人工智能開(kāi)源許可協(xié)議合規(guī)要點(diǎn)解讀專(zhuān)欄4常見(jiàn)人工智能許可協(xié)議合規(guī)要點(diǎn)解讀1.AIPUBSRAIL系列許可協(xié)議合規(guī)要點(diǎn)AIPUBSRAILLICENSES系列許可協(xié)議的制定參考了開(kāi)源Apache2.0的內(nèi)容,二者存在類(lèi)似條款,因此參照Apache許可協(xié)議合規(guī)實(shí)務(wù),可提出如下開(kāi)源大模型AIPUBSRAILLICENSES系列許可協(xié)議合規(guī)要點(diǎn):AIPUBSRAILLICENSES許可協(xié)議具體版本大模型許可協(xié)議合規(guī)項(xiàng)目工作的第一步是判斷大模型適用許(即模型所適用(即源代碼而根據(jù)相應(yīng)的許可協(xié)議內(nèi)容確定大模型許可協(xié)議合規(guī)工作的具體依據(jù)。評(píng)估大模型的應(yīng)用風(fēng)險(xiǎn)AIPUBSRAILLICENSES系列許可協(xié)議附有明確的免責(zé)聲明和責(zé)任限制條款,此類(lèi)條款對(duì)于保護(hù)大模型的開(kāi)源貢獻(xiàn)者至關(guān)重盡可能選用知名公司發(fā)布的或業(yè)內(nèi)廣泛使用的開(kāi)源大模型的參數(shù)市場(chǎng)檢驗(yàn),侵權(quán)風(fēng)險(xiǎn)較小。而冷門(mén)、小眾的開(kāi)源大模型的參數(shù)文件和代碼文件相對(duì)較大,需審慎評(píng)估后決定是否使用。AIPUBSLICENSES系列許可協(xié)議大模型后續(xù)應(yīng)用和開(kāi)發(fā)的開(kāi)源閉源選擇對(duì)于AIPubsOpenRAIL-MAIPubsOpenRAIL-SApache2.0,屬于寬否繼續(xù)開(kāi)放其衍生作品。對(duì)于AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S兩個(gè)研究用途許可協(xié)議,許可協(xié)議內(nèi)容中刪除了下游和其他用戶(hù)可以自由訪(fǎng)問(wèn)該被許可的模型/源代碼的條款,考慮到其只能用于研究和學(xué)術(shù)用途,原則上應(yīng)僅在研究范圍內(nèi)允許訪(fǎng)問(wèn)和使用。AIPUBSRAILLICENSES系列許可協(xié)議的具體版本,嚴(yán)格履行許可協(xié)議項(xiàng)下規(guī)定的義務(wù)(例如軟件即服務(wù),通過(guò)任何媒體復(fù)制和分發(fā)模型/源代碼,按照AIPUBSRAILLICENSES系列許可協(xié)議規(guī)定履行相關(guān)許可協(xié)議義務(wù)。許可協(xié)議義務(wù)主要包括兩方面:Apache2.0的義務(wù),向模型或?qū)@⑸虡?biāo)和歸屬聲明。第二方面是AIPUBSRAILLICENSES系列許可協(xié)議特有的用AIPUBSRAILLICENSES系列許可協(xié)議附件AAIPUBSLICENSES5A限制作為可執(zhí)行的條款包含在管轄模型/源代碼的使用和/或分發(fā)的任何類(lèi)型的法律協(xié)議5AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S兩個(gè)研究用途許可協(xié)議,還要求源代碼的任何第三方接收者必須遵守僅被允許的學(xué)術(shù)和研究用途,不得商用。BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0許可協(xié)議合規(guī)要點(diǎn)商業(yè)公司在合規(guī)使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模型時(shí)應(yīng)當(dāng)關(guān)注如下問(wèn)題:BigScienceOpenRAIL-MLicense許可協(xié)議和RAILLicensev1.0許可協(xié)議的專(zhuān)利和版權(quán)授權(quán)范圍包括模型、模型衍生作品和補(bǔ)充材料(即代碼文件及其文檔)商業(yè)公司在部署、使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模BigScienceOpenRAIL-MLicense、BigScienceRAILLicensev1.0許可協(xié)議的版權(quán)和專(zhuān)利的許可范圍包括模型、模型衍(即代碼文件及其文檔(即代碼文件及其文檔BigScienceOpenRAIL-MLicense許可協(xié)議BigScienceRAILLicensev1.02、3條進(jìn)行許可,但BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.04條規(guī)定的被許可人需要滿(mǎn)足的對(duì)應(yīng)條件足5條及附件A的使用限制BigScienceOpenRAIL-MLicense許可協(xié)BigScienceRAILLicensev1.0許可協(xié)議對(duì)被許可人的授權(quán)范圍包括版權(quán)和專(zhuān)利權(quán),但不包括商標(biāo)和商號(hào)權(quán)BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.02型的衍生作品。BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.03條明確授予被許可人永久的、全球性的、(許可協(xié)議另有規(guī)定除外)售、進(jìn)口和以其他方式轉(zhuǎn)移模型和補(bǔ)充材料。BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.08條規(guī)定,不允許被許可人使用許可人的商標(biāo)、商號(hào)、標(biāo)識(shí)或以其他方式錯(cuò)誤陳述雙方之間的關(guān)系。特別關(guān)注BigScienceOpenRAIL-MLicense許可協(xié)議BigScienceRAILLicensev1.07可人還應(yīng)盡合理努力使用最新版本的模型”的要求商業(yè)公司在合規(guī)使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.07條規(guī)定的“被許可人還應(yīng)盡合理努力使用最新版本的模型”的要求。該要求被公眾詬病,因?yàn)槿羯虡I(yè)公司在適用BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0許可協(xié)議后續(xù)模型,并再次投入成本對(duì)后續(xù)模型進(jìn)行微調(diào)存在爭(zhēng)議。被許可人對(duì)適用BigScienceOpenRAIL-MLicense許可BigScienceRAILLicensev1.0許可協(xié)議的大模型修改形成的衍生作品無(wú)強(qiáng)制開(kāi)源義務(wù)BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.0456條規(guī)(例如軟件即服務(wù)模型進(jìn)行修改得到的派生作品繼續(xù)進(jìn)行開(kāi)源/BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的開(kāi)源大模型獲得的衍生模型作品,有權(quán)決定是否繼續(xù)開(kāi)源。(無(wú)論是否修改BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.05A的使用限制型的衍生作品的副本(無(wú)論是否修改,需遵守BgSineOpnRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.05條和附件A的使用限制。BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0的附件A13OpenRAILLLaMA2LLaMA3許可協(xié)議合規(guī)要點(diǎn)商業(yè)公司在合規(guī)訪(fǎng)問(wèn)、使用和分發(fā)大模型LLaMA2/3時(shí)應(yīng)當(dāng)關(guān)注如下問(wèn)題。LLaMA2/3LLaMA2/3模型參數(shù)、代碼文件及其文檔LLaMA2/3許可協(xié)議許可的內(nèi)容是“LLaMA材料,而“LLaMA材料包括MetaLLaMA2/3和其文檔?!癓LaMA2/3”是指基礎(chǔ)大語(yǔ)言模型及軟件和算法,包括機(jī)器學(xué)調(diào)代碼以及Meta文檔Meta分LLaMA2/3隨附的規(guī)格、手冊(cè)和文檔。LLaMA2/3的模型權(quán)重參數(shù)文件和開(kāi)源代碼文件統(tǒng)一適用LLaMA2/3許可協(xié)議MetaLLaMA2/3的模型權(quán)重參數(shù)文件和開(kāi)源代碼文是統(tǒng)一適用其定制的LLaMA2/3社區(qū)許可協(xié)議(LLAMA2/3CommunityLicense)LLaMA2/3可接受使用政策(LLaMA2/3AcpbleUePoyMeta對(duì)被許可人授予的使用關(guān)于LLaMA2/3的知識(shí)產(chǎn)權(quán)應(yīng)當(dāng)包括版權(quán)和專(zhuān)利權(quán),但不包括商標(biāo)和商號(hào)權(quán)LLaMA2/3LLaMAMeta還是被許可方均不得使用對(duì)方或其任何關(guān)聯(lián)公司擁有或與之相關(guān)的任何名稱(chēng)或標(biāo)記,除非為了描述和再分發(fā)LLaMA材料而合理和慣常使用。LLaMA2/3及其輸出用于改進(jìn)其他大語(yǔ)言模型LLaMA2/3LLaMA材料或任何輸出或LLaMA(LLaMA2/3或其派生作品LLaMA2/3的使用者特別關(guān)注。如果被許可人及其關(guān)聯(lián)公司提供的產(chǎn)品或服務(wù)的月訪(fǎng)問(wèn)7億,需要另行申請(qǐng)單獨(dú)的商業(yè)許可LLaMA2/3(LLAMA2/3CommunityLLaMA官網(wǎng)的介紹就是一個(gè)定制的商業(yè)許可,被許可人可將LLaMA用于商業(yè)或非商業(yè)用途。但LLaMA2/3(LLAMA2/3CommunityLicense)LLaMA2/3的關(guān)聯(lián)公司提供的產(chǎn)品或服務(wù)的每月活躍用戶(hù)數(shù)在上一個(gè)日歷月7Meta申請(qǐng)單獨(dú)的商業(yè)許可協(xié)議。Meta可以自行決定是否授予該權(quán)利。開(kāi)源軟件許可協(xié)議一般沒(méi)有此類(lèi)規(guī)定,該規(guī)定事實(shí)上要求大型互聯(lián)網(wǎng)公司單獨(dú)申請(qǐng)商業(yè)許可,排除在LLaMA2/3(LLAMA2/3Community適用的被許可人范圍之外。被許可人擁有LLaMA2/3無(wú)強(qiáng)制開(kāi)源義務(wù)LLaMA2/3MetaLLaMA材LLaMA材料的任Meta來(lái)都是此類(lèi)派生作品和修改的擁有者。LLaMA2/3Apache2.0LLaMA2/3獲得的衍生作品,有權(quán)決定是否繼續(xù)開(kāi)源。LLaMA2/3可接受使用政策(LLaMA2/3AcpabeUsePoiy,不得違反使用限制LLaMA2/3LLaMA23(LLA2AcpbleUsePoiyLLMA23用于四類(lèi)禁止用途:第1類(lèi)違反法律或侵犯他人權(quán)利的方式利用LLaMA2/32類(lèi)參與、促進(jìn)、煽動(dòng)、便利或協(xié)助計(jì)劃或開(kāi)展對(duì)3第4類(lèi)是未能適當(dāng)?shù)叵蜃罱K用戶(hù)披露人工智能系統(tǒng)的任何已知危險(xiǎn)3AIOpenRAIL許可協(xié)議相4類(lèi)是LLaMA2/3許可協(xié)議另外增加的限制。LLaMA3特殊要求LLaMA材料(或其任何衍生作品)或使用了LLA3(包括其他AI模型,LLaMA顯示“BuiltwithMetaLLaMA3”。LLaMAAI任何此類(lèi)AI模型名稱(chēng)的開(kāi)頭加入“LLaMA3”Meta僅在此種情況下授予被許可者使用“LLaMA3”標(biāo)記的許可,被許可者需要遵Meta發(fā)布在其官網(wǎng)上的品牌指南,且被許可者因使用“LLaMA3”Meta。通義千問(wèn)許可協(xié)議(Qianwen LICENSEAGREEMENT)合規(guī)要點(diǎn)商業(yè)公司在合規(guī)使用和分發(fā)適用通義千問(wèn)許可協(xié)議的開(kāi)源大模型時(shí)應(yīng)當(dāng)關(guān)注如下問(wèn)題:(檔)的使用、分發(fā)和修改的許可通義千問(wèn)許可協(xié)議授予許可的材料主要包括模型、代碼和文(利)范圍為材料(即模型、代碼和文檔。通義千問(wèn)許可協(xié)議未授予商標(biāo)和商號(hào)權(quán)通義千問(wèn)許可協(xié)議第2條規(guī)定,基于阿里云的知識(shí)產(chǎn)權(quán)或阿里云擁有的在材料中體現(xiàn)的其他權(quán)利,授予被許可人對(duì)材料非獨(dú)占復(fù)制、創(chuàng)建衍生作品及對(duì)材料進(jìn)行修改。通義千問(wèn)許可協(xié)議第6用阿里云的商號(hào)、商標(biāo)、服務(wù)標(biāo)志或產(chǎn)品名稱(chēng)的商標(biāo)許可。特別關(guān)注通義千問(wèn)許可協(xié)議對(duì)模型商業(yè)使用的限制條件商業(yè)公司在合規(guī)使用和分發(fā)通義千問(wèn)人工智能開(kāi)源大模型時(shí)時(shí)應(yīng)當(dāng)特別關(guān)注通義千問(wèn)許可協(xié)議第4條規(guī)定“如果被許可人商業(yè)1使用則沒(méi)有被許可人的產(chǎn)品或服務(wù)擁有不超過(guò)1限制。被許可人對(duì)適用通義千問(wèn)許可協(xié)議的人工智能開(kāi)源大模改形成的衍生作品無(wú)強(qiáng)制開(kāi)源義務(wù)通義千問(wèn)許可協(xié)議第3(即后續(xù)的模型使用分發(fā)者源大模型修改得到的衍生作品是否繼續(xù)開(kāi)源有決定權(quán)。通義千問(wèn)許可協(xié)議第5條規(guī)定了兩點(diǎn)使用規(guī)則(1(模(包括通義千問(wèn)或其衍生作品。由此可見(jiàn)通義千問(wèn)許可協(xié)議概括性的要求使用通義千問(wèn)模型或其任何輸出來(lái)改進(jìn)任何其他大型語(yǔ)言模型?適用中國(guó)法律,杭州法院具司法管轄權(quán)通義千問(wèn)許可協(xié)議第9(QwenLICENSEAGREEMENT)合規(guī)要點(diǎn)(QwenLICENSEAGREEMENT)在通義千問(wèn)許(TongyiQianwenLICENSE基礎(chǔ)上進(jìn)行了微“再分發(fā)和第五條用規(guī)則。對(duì)第三條“再分發(fā)”的修訂主要為:通義千問(wèn)許可協(xié)議(TongyiQianwenLICENSEAGREEMENT)規(guī)定,再制造和分發(fā)材料或其衍生作品的副本,無(wú)論是否進(jìn)行了修改,以源碼或目標(biāo)碼形式,需要滿(mǎn)足第三條第二款規(guī)定中的abcd四個(gè)條件。千問(wèn)許可協(xié)議(QwenLICENSE第三條第二款規(guī)定中的abcd四個(gè)條件。對(duì)第五條使用規(guī)則(TongyiQianwenLICENSE(不包括通義千問(wèn)或其衍生作品(QwenLICENSEAGREEMENT)以使用材料AI模型,但需要在相關(guān)產(chǎn)品文檔中應(yīng)當(dāng)突出顯示使用Qwen構(gòu)建或使用Qwen改進(jìn)”的內(nèi)容。就具體應(yīng)用場(chǎng)景而言,企業(yè)應(yīng)根據(jù)各場(chǎng)景下開(kāi)源大模型應(yīng)用特點(diǎn)采取相應(yīng)措施,以確保訓(xùn)練數(shù)據(jù)的合規(guī)應(yīng)用。(Fnunng大模型微調(diào)是指在預(yù)訓(xùn)練大規(guī)模模型的源語(yǔ)料時(shí),應(yīng)確保語(yǔ)料來(lái)源有合法的開(kāi)源授權(quán)協(xié)議或相關(guān)授權(quán)文件,——量化(Quniaon:大模型量化是指將大型深度學(xué)習(xí)模型(通常是32位浮點(diǎn)數(shù),即FP32)(如16位浮點(diǎn)數(shù)FP168INT8等(Dslaon大模型蒸餾是指通過(guò)訓(xùn)練一個(gè)較小的模(稱(chēng)為學(xué)生模型(稱(chēng)為教師模型”)的輸出。蒸餾的目的是在保持性能的同時(shí),減少模型的大——檢索增強(qiáng)生成(RAG,RrvalAugmntdGneaon:檢索增強(qiáng)生成技術(shù)的核心思想在于將預(yù)訓(xùn)練大規(guī)模生成模型與檢索模塊(BM25、DenseRetriever等)結(jié)合使用。檢索模塊可從大型文(如問(wèn)題或上下文相關(guān)性最高的文檔或信息富的回答或內(nèi)容。檢索模塊雖不直接參與模型訓(xùn)練以影響模型參數(shù),企業(yè)應(yīng)評(píng)估由模型、檢索器和外部文檔庫(kù)構(gòu)成的整體應(yīng)用的安全性,確保經(jīng)過(guò)檢索增強(qiáng)后的大模型仍然滿(mǎn)足相關(guān)數(shù)據(jù)合規(guī)要求。4.物料清單構(gòu)建建議人工智能/機(jī)器學(xué)習(xí)物料清單(ArtificialIntelligence/MachineLnngBllofMtras,ALBOM,即用于記錄和管理人工智算法、模型和相關(guān)元數(shù)據(jù)。AI/MLBOM使AI/ML開(kāi)發(fā)過(guò)程透明化,開(kāi)源大模型應(yīng)用企業(yè)可借助AI/MLBOM更好地了解開(kāi)源大模型系統(tǒng)AI/M

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論