ChatGPT在輔助編程及運(yùn)維方面的探索-大模型在輔助編程及運(yùn)維方面的探索_第1頁
ChatGPT在輔助編程及運(yùn)維方面的探索-大模型在輔助編程及運(yùn)維方面的探索_第2頁
ChatGPT在輔助編程及運(yùn)維方面的探索-大模型在輔助編程及運(yùn)維方面的探索_第3頁
ChatGPT在輔助編程及運(yùn)維方面的探索-大模型在輔助編程及運(yùn)維方面的探索_第4頁
ChatGPT在輔助編程及運(yùn)維方面的探索-大模型在輔助編程及運(yùn)維方面的探索_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大模型在輔助編程及運(yùn)維方面的探索產(chǎn)險(xiǎn)信息技術(shù)部李巖峰、王赫、徐建超、舒勇、黃達(dá)洋一、大模型介紹大模型通常指具有龐大參數(shù)量(通常以數(shù)億或數(shù)十億計(jì)經(jīng)過大量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的深度學(xué)習(xí)模型。這些模型能夠捕捉和理解人類語言的復(fù)雜,具有強(qiáng)大的生成與理解能力。以Transformer架構(gòu)為基礎(chǔ),增強(qiáng)了模型在處理長序列任務(wù)時(shí)的效率和效果。極大地體現(xiàn)了自然語言處理(NLP)領(lǐng)域的顯著進(jìn)步。大模型通過無監(jiān)督學(xué)習(xí)進(jìn)行大規(guī)模的語言建模預(yù)訓(xùn)練,使其具備強(qiáng)大的語言生成(LanguageGeneration)和理解(LanguageComprehension)能力。在預(yù)訓(xùn)練階段,模型利用海量文本數(shù)據(jù)學(xué)習(xí)語言的語法、語義和世界知識(shí),形成豐富的詞向量表示(WordEmbeddings)和上下文關(guān)系映射。隨后,在微調(diào)階段(Fine-Tuning通過監(jiān)督學(xué)習(xí),模型能夠在特定任務(wù)數(shù)據(jù)的指導(dǎo)下進(jìn)一步優(yōu)化性能,達(dá)到在多個(gè)下游任務(wù)中表現(xiàn)卓越的能力。此外,大模型還引入了一系列安全和倫理措施,包括偏差校正、對抗性示例訓(xùn)練等,以減少潛在的濫用風(fēng)險(xiǎn),確保模型在實(shí)際應(yīng)用中的可靠性和安全性。大模型的推出和不斷迭代,無疑為自然語言處理技術(shù)的發(fā)展注入了新的動(dòng)力,為各行各業(yè)的智能應(yīng)用和創(chuàng)新拓展了更為廣闊的前景。二、輔助編程1、輔助編程介紹輔助編程(AI-assistedcoding)是一種通過生成式預(yù)訓(xùn)練Transformer模型輔助軟件開發(fā)的新興技術(shù)。該技術(shù)利用預(yù)訓(xùn)練模型在自然語言處理(NLP)中的強(qiáng)大能力,通過理解和生成代碼,為開發(fā)者提供高效的編碼支持。2、陽光保險(xiǎn)在輔助編程應(yīng)用現(xiàn)狀目前陽光保險(xiǎn)已發(fā)布最新GPT輔助編程工具常青藤版本V1.5,目前已在產(chǎn)、壽、集團(tuán)、數(shù)科等公司推廣,用戶數(shù)達(dá)500人以上,目前正在全科技條線全面推廣?!俺G嗵佟笔顷柟鈹?shù)科完全自研的產(chǎn)品,在產(chǎn)品核心能力和功能方面,與目前國內(nèi)外主流的商業(yè)產(chǎn)品相近,但用戶體驗(yàn)方面還在持續(xù)優(yōu)化,對比結(jié)果如下:表1:與國外主流商業(yè)產(chǎn)品對比表支持實(shí)時(shí)補(bǔ)全和智能問答框兩種方答框的方式展示生成代碼生成以實(shí)時(shí)補(bǔ)全方生成單元測試等以問答框方同阿里和copilot類似,所有功能都可以以問答框的方式展示,不同模型不同問答框,同一模型也可以分多個(gè)會(huì)話展示,生成結(jié)果可行級和函數(shù)級代可以生成spring后臺(tái)的類行級和函數(shù)級生成,也可以生代碼解釋單元測試用戶可根據(jù)個(gè)性需求自定義功能GPT輔助編程工具一樣,在代碼注釋生成、代碼解釋、智能問答等方面生成質(zhì)量高、應(yīng)用效果好,是開發(fā)人員使用最多的場景。但在保險(xiǎn)業(yè)務(wù)代碼生成方面,普遍存在生成質(zhì)量不高、采納率低的問題,其核心原因是當(dāng)前大模型對保險(xiǎn)專業(yè)領(lǐng)域知識(shí)的理解和推理能力較弱。因此GPT輔助編程可以輔助開發(fā)人員提升效率,但是對于保險(xiǎn)業(yè)務(wù)代碼生成效果還遠(yuǎn)達(dá)不到替代人的程度。3、大模型代碼能力未來發(fā)展方向第一,提高代碼語料質(zhì)量,擴(kuò)充代碼相關(guān)多模態(tài)數(shù)據(jù)集。全面提升大模型訓(xùn)練集中代碼語料的質(zhì)量,使語料覆蓋高質(zhì)量的代碼倉庫,設(shè)置合理的過濾規(guī)則,確保語料具有合理的文件長度、代碼行長度、字母數(shù)字比,從而獲得完整、安全、正確、干凈和通用的代碼語料庫。大模型的代碼任務(wù)通常是多模態(tài)的任務(wù),需要同時(shí)理解自然語言、數(shù)學(xué)公式和代碼語言的信息,通過構(gòu)造多模態(tài)對齊數(shù)據(jù)集,提升大模型對代碼相關(guān)跨模態(tài)任務(wù)的解決能力。第二,加強(qiáng)代碼安全對齊算法。自然語言需要倫理道德對齊,代碼也亟需安全對齊。在設(shè)計(jì)RLHF階段需要代碼安全專家的介入,訓(xùn)練模型生成安全無漏洞代碼的傾向,同時(shí)可以設(shè)計(jì)相關(guān)程序的測試流程,完成語法語義正確性的自動(dòng)對第三,拓展大模型上下文窗口。不同于自然語言任務(wù),代碼相關(guān)的各項(xiàng)任務(wù)對上下文窗口的長度都極為敏感,提升大模型的上下文訓(xùn)練窗口,可以有效提升大模型在實(shí)際應(yīng)用中理解/編寫代碼的能力。第四,加強(qiáng)針對大模型的缺陷檢測和安全增強(qiáng)。實(shí)際生產(chǎn)中往往在預(yù)訓(xùn)練模型中進(jìn)行增量訓(xùn)練或微調(diào),這些大模型可能在代碼生成方面存在缺陷和漏洞。如何對預(yù)訓(xùn)練大模型的缺陷進(jìn)行有效檢測和安全增強(qiáng),或通過外部手段規(guī)避風(fēng)險(xiǎn),是未來的研究熱點(diǎn)和發(fā)展趨勢。三、探索使用大模型在代碼缺陷檢測領(lǐng)域的應(yīng)用(一)代碼缺陷檢測背景介紹靜態(tài)代碼掃描(SA)指在軟件工程中,程序員寫好源代碼后,在不運(yùn)行計(jì)算機(jī)程序的條件下,對程序進(jìn)行分析檢查。通過在代碼測試之前,在編碼階段就介入SA,提前發(fā)現(xiàn)并修復(fù)代碼問題,有效減少測試時(shí)間,提高研發(fā)效率,發(fā)現(xiàn)BUG越晚,修復(fù)的成本越大。圖1:代碼測試前后(二)基于規(guī)則的代碼缺陷檢測主要問題隨著缺陷規(guī)則增多,覆蓋的語言和模塊增多,有兩個(gè)突出的痛點(diǎn)急需解決:成本較高。如何引入大模型減少開發(fā)成本,提質(zhì)增效?2、有效率偏低,掃描的能力有限(如斷鏈、框架保證非空、復(fù)雜場景靜態(tài)很難識(shí)別等且風(fēng)險(xiǎn)的接受度不同,掃描的部分高風(fēng)險(xiǎn)問題存在修復(fù)意愿低,對用戶造成打擾。如何通過大模型,從歷史誤報(bào)中學(xué)習(xí)經(jīng)驗(yàn),進(jìn)行過濾,減少打擾,提升召回?(三)基于大模型的缺陷自動(dòng)掃描學(xué)什么:給計(jì)算機(jī)輸入什么內(nèi)容,能讓計(jì)算機(jī)更快、更好地學(xué)習(xí)?主要依托代碼知識(shí)圖譜提取目標(biāo)變量相關(guān)的片段,減少機(jī)器學(xué)習(xí)需要的樣本量,提升學(xué)習(xí)的準(zhǔn)確性。怎么學(xué):針對輸入的內(nèi)容,采用什么算法,能讓機(jī)器像人一樣讀懂多種程序語言,并完成檢測任務(wù)?采用深度學(xué)習(xí)的方法,主要包含預(yù)訓(xùn)練和微調(diào)兩部分。預(yù)訓(xùn)練技術(shù)讓計(jì)算機(jī)在海量無標(biāo)簽的樣本中學(xué)習(xí)到多種語言的通用代碼語義。微調(diào)技術(shù)通過給大模型輸入缺陷檢測樣本,從而得到適配場景的大模型,讓機(jī)器自主進(jìn)行缺陷識(shí)別。圖2:代碼知識(shí)圖譜提取目標(biāo)變量相關(guān)的片段為了平衡模型性能和資源,需要對輸入進(jìn)行縮減。代碼知識(shí)圖譜是基于程序分析手段,對業(yè)務(wù)源代碼經(jīng)過模糊或精準(zhǔn)的詞法分析、語法分析和語義分析后,結(jié)合依賴分析、關(guān)系挖掘等手段,構(gòu)建得到的軟件白盒代碼知識(shí)網(wǎng)。圖譜提供了多種數(shù)據(jù)訪問方式,用戶可以低成本的訪問代碼數(shù)據(jù)。借助代碼知識(shí)圖譜能力,可以根據(jù)不同場景制定不同的與目標(biāo)變量或目標(biāo)場景相關(guān)的上下文源碼獲取能力。提取的關(guān)鍵步驟包括:1、構(gòu)建被分析代碼的知識(shí)圖譜。2、目標(biāo)變量檢測識(shí)別:在變更代碼中識(shí)別目標(biāo)變量,作為待檢測變量。3、變量依賴分析:基于控制流和數(shù)據(jù)流的與目標(biāo)變量相關(guān)的依賴變量分析。4、特征語句提取和剪枝圖3:代碼知識(shí)圖譜提取目標(biāo)變量相關(guān)的片段以空指針風(fēng)險(xiǎn)檢測為例,最終得到如下樣例的代碼切片圖4:代碼切片信息(四)采用大模型學(xué)習(xí)算法進(jìn)行缺陷預(yù)測大模型檢測缺陷有兩種思路:1、通過判別式的方法,識(shí)別是否有缺陷以及缺陷類型。從而預(yù)測新樣本的類別。采用BERT進(jìn)行缺陷檢測共含3步,分別是預(yù)訓(xùn)練、微調(diào)和推理。預(yù)訓(xùn)練階段采用開源的多語言大模型,已較好的學(xué)習(xí)多種程序語言的語義。微調(diào)階段,給模型輸入上述通過代碼知識(shí)圖譜提取的與變量使用點(diǎn)相關(guān)的切片,以及是否有缺陷或者缺陷類型的標(biāo)簽,生成微調(diào)模型,讓機(jī)器具備做檢測任務(wù)的能力。輸入的格式:{"slices":[{"line":"行代碼內(nèi)容","loc":"行號(hào)"mark":{"label":"樣本標(biāo)簽","module_name":"代碼庫名","commit_id":"代碼版本","file_path":"文件名","risk_happend_line":"發(fā)生異常的行"}}推理階段,分析使用點(diǎn)目標(biāo)變量的相關(guān)切片,通過微調(diào)模型進(jìn)行預(yù)測,得到使用點(diǎn)是否有缺陷,以及缺陷類型。模型上線后,用戶對結(jié)果反饋狀態(tài)包括誤報(bào)和接受。采集真實(shí)反饋樣本,加入微調(diào)模型自動(dòng)訓(xùn)練,從而到達(dá)自動(dòng)迭代、快速學(xué)習(xí)新知識(shí)的目的。圖5:模型自動(dòng)訓(xùn)練2、通過生成式的方法,構(gòu)建prompt,讓程序自動(dòng)掃描所有相關(guān)缺陷。shot、引入思維鏈、指定抽象的引導(dǎo)規(guī)則)和微調(diào)的方式,探索模型在空指針缺陷檢測的預(yù)測效果。(五)采用規(guī)則+機(jī)器學(xué)習(xí)進(jìn)行誤報(bào)過濾缺陷檢測場景識(shí)別的缺陷是風(fēng)險(xiǎn),存在接受度問題,如何過濾掉其中低風(fēng)險(xiǎn)問題,是個(gè)難題。通過分析誤報(bào)和修復(fù)的樣本,采集誤報(bào)相關(guān)的特征,如指針類型,模塊誤報(bào)率、文件誤報(bào)率等跟誤報(bào)相關(guān)的10+特征,訓(xùn)練機(jī)器學(xué)習(xí)模型(邏輯回歸),判斷是否需要過濾。整體方案架構(gòu)圖如下:圖6:靜態(tài)代碼風(fēng)險(xiǎn)檢測(六)業(yè)務(wù)落地基于AI的代碼缺陷檢測能力可以集成進(jìn)入code管理平臺(tái),每次代碼提交,展示可能存在的代碼缺陷,阻塞合入,并采集研發(fā)人員的反饋,便于模型迭代。(七)示例1.ifcert=SSL_get_peer_certificate(ssl&&host)2.foo=SSL_get_verify_result(ssl);3.ifX509VOK==foo)||(X509VERR_SELF_SIGNED_CERT_IN_CHAIN==foo圖7:GPT大模型對源代碼的檢測結(jié)果四、探索保險(xiǎn)數(shù)字化運(yùn)維場景(一)保險(xiǎn)行業(yè)的現(xiàn)狀目前,因面臨技術(shù)、市場和法規(guī)等方面的問題,保險(xiǎn)業(yè)在挑戰(zhàn)與變革中謀發(fā)展。面對保險(xiǎn)行業(yè)中客戶日益高漲的即時(shí)信息獲取需要、個(gè)性化的保障方案需求,如何在不穩(wěn)定的經(jīng)濟(jì)環(huán)境和不斷變化的風(fēng)險(xiǎn)因素中,維持公司的保單繼續(xù)率和客戶留存率等,是保險(xiǎn)公司勢必要面臨的問題與挑戰(zhàn)。同時(shí),隨著人口老齡化趨勢的加劇、客戶高需求匹配的代理人高專業(yè)要求等,保險(xiǎn)行業(yè)有效人力不足的問題日漸凸顯。因加強(qiáng)自主創(chuàng)新能力,加快數(shù)字化運(yùn)維轉(zhuǎn)型,彌補(bǔ)有效人力的不足,已成為大勢所趨。(二)大模型在保險(xiǎn)數(shù)字化運(yùn)維的應(yīng)用大模型具有語義學(xué)習(xí)、分析能力,以及可快速響應(yīng)等諸多優(yōu)勢,必將在保險(xiǎn)營銷過程中的險(xiǎn)種及條款咨詢、個(gè)性化保險(xiǎn)方案定制、承保風(fēng)險(xiǎn)防控、保單繼續(xù)率維持、新產(chǎn)品研發(fā)等方面為保險(xiǎn)行業(yè)未來發(fā)展帶來契機(jī),在推動(dòng)保險(xiǎn)行業(yè)向數(shù)字化運(yùn)維轉(zhuǎn)型方面承擔(dān)重要角色。1、售前咨詢及條款解讀大模型經(jīng)過深度學(xué)習(xí)保險(xiǎn)知識(shí),可應(yīng)用于保險(xiǎn)在線咨詢和售前服務(wù)。它可以實(shí)時(shí)向客戶宣導(dǎo)保險(xiǎn)概念、解讀保險(xiǎn)政策等。相比傳統(tǒng)的搜索險(xiǎn)種和條款的查詢方式,客戶只需對大模型提出簡單的查詢要求,就可即時(shí)獲取準(zhǔn)確的產(chǎn)品條款解讀、獲取保費(fèi)保額等。另外,在與客戶群體對話過程中,大模型能夠積累大量的查詢數(shù)據(jù),可協(xié)助保險(xiǎn)公司及代理人更精準(zhǔn)地分析理解客戶的需求。2、制訂個(gè)性化保險(xiǎn)方案作為人工智能技術(shù)的典型應(yīng)用,大模型可以根據(jù)在與客從而實(shí)現(xiàn)為客戶量身定制專屬產(chǎn)品組合和個(gè)性化的保障方案。另外,大模型可根據(jù)保障方案結(jié)合客戶偏好,為代理人提供有針對性的銷售策略和話術(shù)等,在提高產(chǎn)品與客戶需求的匹配度的同時(shí),提升保單成交率和客戶滿意度。3、強(qiáng)化承保風(fēng)險(xiǎn)管控大模型有助于保險(xiǎn)公司強(qiáng)化承保過程中的風(fēng)險(xiǎn)管控。利并結(jié)合海量數(shù)據(jù)進(jìn)行歸類和處理,可以幫助保險(xiǎn)公司更準(zhǔn)確地勾勒用戶畫像,利用自然語言處理和機(jī)器學(xué)習(xí)算法,更精準(zhǔn)地評估客戶投保的風(fēng)險(xiǎn)水平,以降低保單承保逆選擇風(fēng)險(xiǎn),減少保險(xiǎn)欺詐行為。例如,大模型實(shí)時(shí)、智能化地對承保申請自動(dòng)審核,對決策者提供輔助判斷及依據(jù),從而提高承保質(zhì)量和準(zhǔn)確性。通過以上增強(qiáng)保險(xiǎn)公司的風(fēng)險(xiǎn)管理水平,避免不必要的損失。4、提升保單繼續(xù)率保單繼續(xù)率是衡量保險(xiǎn)公司經(jīng)營風(fēng)險(xiǎn)的重要指標(biāo),而大模型的應(yīng)用能夠在維持保單繼續(xù)率中發(fā)揮重要作用。大模型可通過對話為客戶提供即時(shí)的續(xù)費(fèi)金額和日期提醒,提升保單繼續(xù)率。同時(shí),大模型可根據(jù)客戶的保險(xiǎn)需求和歷史保障記錄,對于即將下架的保單險(xiǎn)種提供以客戶為中心的、個(gè)性化的轉(zhuǎn)投保方案,幫助客戶做出更明智的投保決策,延續(xù)保障。以上做法可在提升客戶滿意度的同時(shí),提升保險(xiǎn)公司的保單繼續(xù)率和客戶留存率,實(shí)現(xiàn)保險(xiǎn)公司和客戶的雙贏。5、推動(dòng)未來產(chǎn)品創(chuàng)新大模型在與客戶對話過程中,可持續(xù)收集客戶的產(chǎn)品訴求和期望,通過系統(tǒng)自動(dòng)整理各年齡層的客戶群體對產(chǎn)品訴求的大數(shù)據(jù)信息,勾勒客戶群體用戶畫像,提供偏好分布數(shù)據(jù)等,從而為產(chǎn)品及精算人員對未來保險(xiǎn)產(chǎn)品的險(xiǎn)種設(shè)計(jì)和也可實(shí)時(shí)提供修改意見和依據(jù),支持靈活迭代優(yōu)化,從而使保險(xiǎn)公司高效設(shè)計(jì)、推出符合大眾真實(shí)訴求的產(chǎn)品險(xiǎn)種,助力達(dá)成銷售目標(biāo),提升行業(yè)競爭力和市場占有率。五、未來展望與實(shí)施策略(一)大模型在保險(xiǎn)行業(yè)的推廣應(yīng)用前景隨著大模型技術(shù)的迅猛發(fā)展,人工智能等信息技術(shù)在保險(xiǎn)行業(yè)的應(yīng)用前景廣闊。如上述討論,在保險(xiǎn)數(shù)字化運(yùn)維方面,大模型可以為客戶精準(zhǔn)推薦保險(xiǎn)產(chǎn)品、提供個(gè)性化定制方案、及時(shí)催繳保費(fèi)等,從而縮短出單時(shí)效,提高出單率和保單繼續(xù)率。除此之外,大模型也可應(yīng)用于保全、理賠等保單服務(wù)及客戶服務(wù)方面,為客戶提供7×24小時(shí)及時(shí)響應(yīng)、過程引導(dǎo)和處理,可以提高運(yùn)營時(shí)效,為客戶提供更多智能化的服務(wù)和支持。(二)推動(dòng)保險(xiǎn)行業(yè)的創(chuàng)新與變革大模型的引入將推動(dòng)全保險(xiǎn)行業(yè)的整體創(chuàng)新與變革。利用大模型的自然語言處理能力,保險(xiǎn)公司可以深度挖掘客戶需求,從而精準(zhǔn)設(shè)計(jì)出符合群體畫像的保險(xiǎn)產(chǎn)品,提供更精準(zhǔn)、更合理的計(jì)算費(fèi)率。同時(shí),大模型還可以協(xié)助保險(xiǎn)公司進(jìn)行數(shù)據(jù)分析和風(fēng)險(xiǎn)評估,以及時(shí)規(guī)避逆選擇風(fēng)險(xiǎn)。此外,大模型作為人工智能的典型應(yīng)用,可與大數(shù)據(jù)、區(qū)塊鏈、云計(jì)算等其他前沿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論