2024AIGC行業(yè)應(yīng)用擴展_第1頁
2024AIGC行業(yè)應(yīng)用擴展_第2頁
2024AIGC行業(yè)應(yīng)用擴展_第3頁
2024AIGC行業(yè)應(yīng)用擴展_第4頁
2024AIGC行業(yè)應(yīng)用擴展_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

AIGC行業(yè)應(yīng)用擴展2024AIGC行業(yè)應(yīng)用擴展2024PAGEPAGE3單模態(tài)大模型應(yīng)用AIGC/Chatgpt+搜索引擎目 ? AIGC/GPT4+辦公軟件AIGC/Chatgpt+操作系統(tǒng)AIGC/Chatgpt+游戲錄 ? AIGC/Chatgpt+文學(xué)作品AIGC/Chatgpt+智能客服AIGC/Chatgpt+虛擬人

多模態(tài)大模型應(yīng)用AIGC+圖像AIGC+影視PaLM-E+機器人GPT4+教育/科研GPT4+數(shù)字人GPT4+應(yīng)用開發(fā)投資建議及風(fēng)險提示AIGC/ChatGPT+搜索引擎AIGC/ChatGPT+搜索引擎PAGE4PAGE4重定義搜索引擎,更加智能高效微軟將大模型ChatGPT強大的語言理解和生成能力注入現(xiàn)有的搜索引擎Bing,結(jié)合了語言大模型的優(yōu)勢,同時搜索引擎又能很好地彌補語言模型預(yù)訓(xùn)練時不具備的數(shù)據(jù)實時性。將ChatGPT智能的問答交互方式替換傳統(tǒng)的機械式搜索方式上,強大的語言理解能力讓搜索引擎更精準(zhǔn)的捕捉用戶的需求,使“搜索”變?yōu)椤罢埱蟆?,高效的?nèi)容總結(jié)歸納能力讓搜索引擎更全面的解答用戶的疑惑,使“結(jié)果”變?yōu)椤爸v解”。重新構(gòu)造了傳統(tǒng)的搜索模式,讓用戶可以通過問答的方式深入探索更加全面又準(zhǔn)確的內(nèi)容,提升了用戶體驗,提高了搜索質(zhì)量。Bing恰好能提供更加完整、準(zhǔn)確、具有實時性的內(nèi)容,彌補了ChatGPT先天的不足。由于ChatGPT基于的大模型GPT3在是在2021完成的預(yù)訓(xùn)練,其預(yù)訓(xùn)練時的訓(xùn)練數(shù)據(jù)決定了ChatGPT不具備感知2021年之后的新聞事件。相比單個ChatGPT的交互模式,Bing的加入還可以為生成的內(nèi)容提供所對應(yīng)的鏈接,使用戶檢索更便捷。用戶通過Bing產(chǎn)生的交互內(nèi)容又可以用于語言大模型的微調(diào)迭代,不斷優(yōu)化,從而進一步提升用戶體驗。圖表:接入ChatGPT的新Bing 圖表:新Bing問題解答 AIGC/GPT4+辦公軟件AIGC/GPT4+辦公軟件PAGE5PAGE5辦公軟件編輯更效率,軟件間聯(lián)動解放生產(chǎn)力微軟把大模型OfficeOffice將GPT4賦能OfficeWord軟件,改變了以往傳統(tǒng)的word編輯方式,新一代的Word根據(jù)用戶需求智能地生成多樣的文本供用戶參考或刪改,用戶不需要從零開始編輯,快速提升文本編輯效率。將GPT4賦能OfficeExcel,用戶不需要學(xué)習(xí)復(fù)雜的操作和函數(shù),新一代的Excel將快速處理數(shù)據(jù),生成清晰的表格,甚至還可以發(fā)現(xiàn)數(shù)據(jù)之軟件間數(shù)據(jù)流傳更流暢,功能聯(lián)動進一步解放生產(chǎn)力。用戶既可以根據(jù)文本和Excel表格讓W(xué)ord起草文案,也可以使用Word中的文案一鍵GPT4Office圖表:GPT4接入OfficeWord 圖表:根據(jù)Word文本成PPT AIGC/ChatGPT+操作系統(tǒng)AIGC/ChatGPT+操作系統(tǒng)資料來源:知乎,N軟網(wǎng),PAGE6資料來源:知乎,N軟網(wǎng),PAGE6操作系統(tǒng)交互更智能,數(shù)據(jù)流通更廣闊微軟目前將集成ChatGPT驅(qū)動的Bing嵌入到Windows11操作系統(tǒng)的任務(wù)欄,更新完的操作系統(tǒng)可以在任務(wù)欄界面快速呼喚帶有ChatGPT的Bing,生成的內(nèi)容將會在Edge瀏覽器中的Bing聊天中。操作系統(tǒng)建立在硬件和軟件之間,也筑起了人與軟件之間的互動。所有的應(yīng)用軟件底層的數(shù)據(jù)都需要通過操作系統(tǒng)的調(diào)度才能在正常地響應(yīng)用戶的操作。ChatGPT可以借助操作系統(tǒng)的特性,將自身的智能注入各個應(yīng)用軟件,大大提升用戶的操作體驗,軟件間的數(shù)據(jù)流通也將更便利,生態(tài)覆蓋將更廣闊,因此將類ChatGPT的AIGC技術(shù)賦能操作系統(tǒng)是最關(guān)鍵也是集大成的一步。PC端的發(fā)展史折射出人機交互方式將從復(fù)雜到簡單,從最初通過鼠標(biāo)、鍵盤等媒介的復(fù)雜操作到如今語音交互的簡單操作,而這其中就需要。通過人工智能介入使機器更接近人。AIGC則是將操作系統(tǒng)的輸出更加泛化,使“機與人”交互更加接近“人與人”圖表:帶ChatGPT的Bing嵌入Win11圖表:PC端人機交互發(fā)展史圖表:PC端人機交互發(fā)展史AIGC/ChatGPT+游戲AIGC/ChatGPT+游戲資料來源:量子位,網(wǎng)易,PAGE7資料來源:量子位,網(wǎng)易,PAGE7ChatGPT讓游戲NPC”活起來“RPG(角色扮演)游戲中,世界觀、背景設(shè)定以及NPC交互是重要環(huán)節(jié),智能交互讓NPC更鮮活,讓世界更深入人心。開發(fā)者Bloc用ChatGPT開發(fā)MOD,使NPC能夠根據(jù)玩家問題與背景設(shè)定進行智能交互,Bloc認為這是RPG游戲的未來。其他文字類游戲同樣可以利用大模型使對話內(nèi)容更具真實感,靈動的智能交互將大幅提升游戲沉浸感。網(wǎng)易“玉言“模型將運用于《逆水寒》手游網(wǎng)易伏羲的”玉言“大模型曾在中文語言理解領(lǐng)域最權(quán)威評測CLUE的1.1分類任務(wù)排行榜中登頂?shù)谝?,均分首次超越人類。網(wǎng)易是國內(nèi)首個將語言大模型接入游戲的企業(yè),讓智能NPC定行為反饋,能夠增強可玩性、增加用戶粘性。AIGC還能夠輔助游戲設(shè)計,游戲策劃可以利用ChatGPT生成游戲機制,開發(fā)者用ChatGPT碼Debug,提升游戲開發(fā)效率。AIGC+游戲還包括智能生成游戲攻略、教學(xué)手冊,在創(chuàng)作工坊中無重復(fù)自動創(chuàng)建高交互性、高可玩性關(guān)卡等方面。圖表:《騎馬與砍殺2》NPC智能交互 圖表:《逆水寒》手游 AIGC/ChatGPT+文學(xué)作品AIGC/ChatGPT+文學(xué)作品資料來源:量子位,新趣集,PAGE8資料來源:量子位,新趣集,PAGE8ChatGPT掀起AI電子書熱潮利用ChatGPT的文本生成能力,非作家也能在數(shù)小時內(nèi)制作一本30頁帶插圖的兒童電子書,大大提高出版速度。路透社2Kindle商店中有200多本電子書將ChatGPT列為作者或合著者,這個數(shù)字還在持續(xù)增加。ChatGPT激發(fā)靈感、提高寫作效率。已經(jīng)有專業(yè)作家擁抱擁抱AI,用其快速完成標(biāo)題、導(dǎo)語、背景設(shè)定甚至小說情節(jié)。AIGC為劇本創(chuàng)作帶來新思路AIGC讓劇本創(chuàng)作門檻更低、成本更低、效率更高。早在2020年美國查普曼大學(xué)生就利用GPT-3模型創(chuàng)作劇本,并制作有大型語言模型能夠通過劇本綱要、關(guān)鍵詞等生成基礎(chǔ)劇本,讓寫作更簡單。專業(yè)劇本創(chuàng)作依賴優(yōu)質(zhì)編劇團隊實現(xiàn)劇本生產(chǎn),生成效率有限,成本較高。2021年3月,GPT-3日均文本生成量就達到45億,生成效率非常高,而2021整年閱文集團新增文字量僅億?;谏墒紸I,劇本創(chuàng)作有望降本增效,并開拓創(chuàng)作者思維。圖表:ChatGPT生成設(shè)定與情節(jié) 圖表:Dramatron生成劇本內(nèi)容 AIGC/ChatGPT+智能客服AIGC/ChatGPT+智能客服資料來源:深燃,Viable官網(wǎng),PAGE9資料來源:深燃,Viable官網(wǎng),PAGE9ChatGPT多輪對話能力解決智能客服痛點在沙利文《2021年中國智能客服市場報告》中,僅30%企業(yè)使用智能客服感受整體服務(wù)效率提升,中國青年報社會調(diào)查中心數(shù)據(jù)顯示僅41.3%的受訪在短文本多輪對話能力、處理預(yù)設(shè)流程外問題能力上尤為突出。而能夠流暢進行多輪對話、跨主題對話,準(zhǔn)確理解短文本中的復(fù)雜意圖。這可以提高智能客服的復(fù)雜場景應(yīng)變能力,能夠基于用戶的個人信息和歷史交互,提供更個性化的回答,提升用戶體驗。ChatGPT種知識存儲能力也將對現(xiàn)有知識圖譜生態(tài)造成沖擊。智能客服未來探索基于ChatGPT,未來智能客服將會有以下優(yōu)勢:1.個性化,更好地理解客戶需求,并以獨特地方式解決2.相比過去知識庫、知識圖譜類的智能客服,大模型擺脫了主流的,仍需要3更快速更準(zhǔn)確地處理大量客戶查詢,進一步減少人工客服需求,降低成本4.多語種是ChatGPT最大優(yōu)勢之一,在企業(yè)的國際化場景上很有潛力。5.從客戶反饋中快速識別主題和情緒,提取摘要、提供見解目前國外已有企業(yè)接入ChatGPTAPIThankful.lnc,以及用GPT-4實現(xiàn)客戶反饋提取的Viable。

圖表:ChatGPT扮演牙科客服圖表:Viable基于GPT-4的客戶反饋AIGC/ChatGPT+虛擬人AIGC/ChatGPT+虛擬人資料來源:OpenAI,F(xiàn)ableStudio,PAGE10資料來源:OpenAI,F(xiàn)ableStudio,PAGE10虛擬人交互能力有待提升7*24小時直播、加速品牌年輕化進程、人設(shè)穩(wěn)定可控不會崩塌三大優(yōu)勢。但目前的虛擬主播大部分只能完成預(yù)設(shè)內(nèi)容,互動體驗非常初級。在虛擬偶像、手機助手、個人語音助手等領(lǐng)域,過去的NLP技術(shù)能讓虛擬人根據(jù)背后的知識圖譜、知識庫進行回答,但其對話、任務(wù)理解能力實際體驗仍有提升空間。ChatGPT畫出“點睛之筆”ChatGPTStudio已經(jīng)用GPT-3賦予新虛擬數(shù)字人CharlieandDeck將更加智能,將更具備通用場景應(yīng)用能力,在通過專業(yè)數(shù)據(jù)訓(xùn)練后特定場景回復(fù)的專業(yè)性也能夠更高。圖表:虛擬直播 圖表:FableStudio的虛擬人Charlie預(yù)訓(xùn)練模型從單模態(tài)走向多模態(tài),增強AIGC內(nèi)容生產(chǎn)多樣性預(yù)訓(xùn)練模型從單模態(tài)走向多模態(tài),增強AIGC內(nèi)容生產(chǎn)多樣性資料來源:騰訊產(chǎn)業(yè)研究院,中國信通院,鳳凰網(wǎng)科技,澎湃新聞,PAGE資料來源:騰訊產(chǎn)業(yè)研究院,中國信通院,鳳凰網(wǎng)科技,澎湃新聞,PAGE11多模態(tài)預(yù)訓(xùn)練模型融合文字、圖片、音視頻等多種內(nèi)容形式,增強AIGC通用性預(yù)訓(xùn)練模型包括:1)自然語言處理(NLP)預(yù)訓(xùn)練模型,如谷歌的LaMDA和PaLM、OpenAI的GPT系列;2)計算機視覺(CV)預(yù)訓(xùn)練模型,如微軟的Florence3)多模態(tài)預(yù)訓(xùn)練模型,即融合文字、圖片、音視頻等多種內(nèi)容形式。多模態(tài)預(yù)訓(xùn)練模型致力于處理不同模態(tài)、不同來源、不同任務(wù)的數(shù)據(jù)和信息,相較于ChatGPT等NLP預(yù)訓(xùn)練模型,多模態(tài)的預(yù)訓(xùn)練模型是一種全新的交互、生成模式,滿足AIGC場景下更多的創(chuàng)作需求和應(yīng)用場景。多模態(tài)預(yù)訓(xùn)練模型擁有兩種能力,一是尋找不同模態(tài)數(shù)據(jù)之間的對應(yīng)關(guān)系,比如將文字描述與圖像對應(yīng)起來;二是實現(xiàn)不同模態(tài)數(shù)據(jù)之間的相互轉(zhuǎn)化與生成,比如將文字描述轉(zhuǎn)化為圖像。谷歌和OpenAI分別于3月7日和3月14日公布了視覺語言模型PaLM-E和大型語言模型GPT-4,在多模態(tài)方面方面具有出色表現(xiàn)。圖表:國外主要的AIGC多模態(tài)預(yù)訓(xùn)練模型預(yù)訓(xùn)練模型應(yīng)用參數(shù)量領(lǐng)域谷歌Imagen語言理解與圖像生成110億多模態(tài)Parti語言理解與圖像生成200億多模態(tài)DeepMindGato多面手的智能體12億多模態(tài)OpenAICLIP&DALL-E圖像生成、跨模態(tài)檢索120億多模態(tài)StabilityAIStableDiffusion語言理解與圖像生成多模態(tài)AIGC+圖像:AIGC可實現(xiàn)文本與二維圖像、三維模型轉(zhuǎn)換AIGC+圖像:AIGC可實現(xiàn)文本與二維圖像、三維模型轉(zhuǎn)換資料來源:PC知科技,騰訊網(wǎng),搜狐新聞,PAGE12資料來源:PC知科技,騰訊網(wǎng),搜狐新聞,PAGE12多模態(tài)預(yù)訓(xùn)練模型使AIGC擁有更通用的能力,可實現(xiàn)文本與二維圖像、三維模型之間的轉(zhuǎn)換1.文本生成圖片2.文本生成三維模型英偉達的研究人員于2022年11月發(fā)布了Magic3D,可以根據(jù)“一只藍色毒箭蛙坐在睡蓮上”等提示創(chuàng)建3D模型。3.由二維圖片還原三維場景谷歌研究人員開發(fā)基于瀏覽器的r?平臺,可以根據(jù)歷史地圖和老照片,重建城市舊景的三維場景。此外包括谷歌在內(nèi)的國內(nèi)外科技公司正在探索使用互聯(lián)網(wǎng)上商家和用戶上傳的照片生成并渲染不同餐廳、街道和景點的三維全景。按照技術(shù)原理劃分,圖像生成領(lǐng)域的技術(shù)場景可分為:1)圖像屬性編輯,指圖片去水印、自動調(diào)整光影、設(shè)置濾鏡、修改顏色紋理、復(fù)刻/修改圖像風(fēng)格、提升分辨率等功能;包括更改圖像部分構(gòu)成、修改面部特征(Metaphysics可調(diào)節(jié)自身照片的情緒、年齡、微笑等;Deepfake可實現(xiàn)圖像換臉);3)端到端的圖像生成,包括創(chuàng)意圖像生成和功能性圖像生成兩類場景,前者大多以NFT等形式體現(xiàn),后者大多以營銷類海報/界面、logo、模特圖、用戶頭像為主。圖表:AI生成祝福海報 圖表:英偉達推出Magic3D:由文本生成3D模型 圖表:曼哈頓切爾西街區(qū)的三維重建結(jié)果 AIGC+影視:提升視頻質(zhì)量,拓展影視空間AIGC+影視:提升視頻質(zhì)量,拓展影視空間資料來源:人民日報,央視頻,PAGE13資料來源:人民日報,央視頻,PAGE13AIGC能夠?qū)崿F(xiàn)智能視頻剪輯,提升視頻質(zhì)量權(quán)內(nèi)容價值。2020年兩會期間,人民日報社利用“智能云剪輯師”快速生成視頻,并能實現(xiàn)自動匹配字幕、人物實時追蹤、畫面抖動修復(fù)、橫屏速轉(zhuǎn)豎屏等技術(shù)操作,適應(yīng)多平臺分發(fā)要求。2022年冬奧會期間,央視頻使用AI并定向發(fā)布,為深度開發(fā)體育媒體版權(quán)內(nèi)容價值創(chuàng)造更多可能性。圖表:智能云剪輯師的智能剪輯 圖表:AI智能剪輯視頻第一時間生成谷愛凌奪冠視頻AIGC+影視:提升視頻質(zhì)量,拓展影視空間AIGC+影視:提升視頻質(zhì)量,拓展影視空間資料來源:澎湃號,國泰創(chuàng)投集團,PAGE資料來源:澎湃號,國泰創(chuàng)投集團,PAGE14AIGC能夠創(chuàng)作角色和場景,拓展影視空間一是通過人工智能合成人臉、聲音等相關(guān)內(nèi)容,實現(xiàn)“數(shù)字復(fù)活”已故演員、替換“劣跡藝人”、多語言譯制片音畫中的損失。《阿凡達》等科幻作品中也多次運用換臉技術(shù),為觀眾帶來更好的觀影體驗。聽效果。如《流浪地球2》中太空電梯升降的場景需要在重機械等物理設(shè)備輔助下,結(jié)合數(shù)字技術(shù)將相關(guān)場景虛擬出來,后期加持數(shù)字繪景和合成技術(shù),實現(xiàn)虛擬場景光影融合的效果。圖表:《阿凡達》中的換臉技術(shù) 圖表:人工智能合成《流浪地球2》中的太空電梯多模態(tài)大模型PaLM-E+機器人多模態(tài)大模型PaLM-E+機器人資料來源:PaLM-E:AnEmbodiedMultimodalLanguageModel,PAGE15資料來源:PaLM-E:AnEmbodiedMultimodalLanguageModel,PAGE15多模態(tài)模型使機器人操控場景更豐富,反饋更智能Google發(fā)布的多模態(tài)大模型PaLM-E擁有5620億參數(shù),是至今最大規(guī)模視覺語言模型。Google將PaLM-E賦能機器人,將機器人的視覺感知與文本任務(wù)作為大模型的多模態(tài)輸入,通過模型推理智能操控機器人完成指定任務(wù)。PaLM-E是將預(yù)訓(xùn)練語言大模型PaLM和視覺感知模型ViT融合,因此PaLM-E既擁有PaLM準(zhǔn)確的語言理解能力和邏輯推理能力,也能結(jié)合Vit感知得到的視覺信息,經(jīng)過模型的推理計算,輸出合理的指令控制機器人,使機器人響應(yīng)更加智能。饋的智能性。圖表:ViT+PaLM模型圖表:PaLM-E模型原理與應(yīng)用圖表:ViT+PaLM模型多模態(tài)大模型GPT4+教育/科研多模態(tài)大模型GPT4+教育/科研資料來源:機器之心,PAGE16資料來源:機器之心,PAGE16多模態(tài)模型緩解教育資源短缺,降低獲取知識門檻近日,OpenAI發(fā)布了大型多模態(tài)模型GPT4,與先前的ChatGPT(GPT3.5)相比,GPT4可以接受圖像和文本結(jié)合的輸入,并給出更準(zhǔn)確的文本回復(fù)。由于模型的輸入可以是文本與圖像多模態(tài),GPT4對輸入的內(nèi)容會有更深入和多元的理解,可以勝任更多任務(wù)場景。實驗測試表明GPT4在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng),例如通過了模擬律師考試,且分數(shù)在應(yīng)試者的前10GPT-3.5的得分在倒數(shù)10%左右。因此,將GPT4應(yīng)用于現(xiàn)有的職業(yè)教培領(lǐng)域或是科研輔助將有效解決教育資源的短缺。多模態(tài)的GPT4可以輔助科研,幫助研究人員快速總結(jié)或提煉論文的要點,針對細分的問題也能依據(jù)論文給出準(zhǔn)確的解釋,節(jié)省了大量的閱讀時間,方便知識的梳理和檢索,降低獲取知識的門檻。圖表:GPT近幾個版本在不同考試中表現(xiàn) 圖表:GPT4讀論文 圖表:GPT4根據(jù)具體問題解釋論文細節(jié)多模態(tài)大模型GPT4+數(shù)字人多模態(tài)大模型GPT4+數(shù)字人多模態(tài)模型使數(shù)字人交互更智能,落地場景更多樣數(shù)字人是由感知識別,決策分析,表達生成,終

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論