GPT4及ChatGPT相關(guān)應(yīng)用梳理_第1頁
GPT4及ChatGPT相關(guān)應(yīng)用梳理_第2頁
GPT4及ChatGPT相關(guān)應(yīng)用梳理_第3頁
GPT4及ChatGPT相關(guān)應(yīng)用梳理_第4頁
GPT4及ChatGPT相關(guān)應(yīng)用梳理_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

目錄一、ChatGPT:從全民關(guān)注的爆款應(yīng)用走向商業(yè)化開放,在多個(gè)場景中展現(xiàn)價(jià)值二、GPT4:更強(qiáng)大的多模態(tài)大模型,帶來更廣泛的商業(yè)應(yīng)用可能1.1

AIGC商業(yè)化演進(jìn):重點(diǎn)產(chǎn)品時(shí)間線隨著技術(shù)的快速進(jìn)步,AI生成內(nèi)容(AIGC)極大地解放了生產(chǎn)力,其廣闊的應(yīng)用場景及市場價(jià)值推動(dòng)著其商業(yè)化的快速發(fā)展。垂直領(lǐng)域快速落地,爆款產(chǎn)品不斷推出。隨著技術(shù)不斷演進(jìn),尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商業(yè)化在多個(gè)領(lǐng)域開始落地。其中代碼生成、文本生成、圖像生成、音視頻/游戲等領(lǐng)域已有不少爆款級產(chǎn)品。1)代碼領(lǐng)域,基于OpenAI的Codex模型,Github推出的Copilot具備代碼的生成、補(bǔ)全、建議等功能,用戶量突破百萬級別。2)文本領(lǐng)域,ChatGPT目前已開放API接口,微軟已經(jīng)在Bing和Dynamic365等應(yīng)用接入。3月份發(fā)布的多模態(tài)預(yù)訓(xùn)練大模型GPT-4已開放純文本API,在圖片理解、推理和學(xué)術(shù)考試中展現(xiàn)了強(qiáng)大能力,未來將適用于更廣泛的應(yīng)用場景。3)圖像領(lǐng)域,

Stable

diffusion等文生圖應(yīng)用已突破千萬級用戶量,目前是商業(yè)模式最成熟的領(lǐng)域,國內(nèi)也在積極布局。4)音視頻/游戲領(lǐng)域,起步較晚,對模型復(fù)雜度和算力要求更高,百度的文心一言大模型已經(jīng)具備對視頻生成的能力。圖:AIGC重點(diǎn)產(chǎn)品時(shí)間線DALL-E2StableDiffusionDALL-EMake-a-vedioImagenVideoPhenakiGPT-3Jasper.AIChatGPTCodex代碼文本圖像音視頻/3D/游戲2020202120224月8月10月9月11月Midjourney7月6月CodeWhisperer三大AI繪圖應(yīng)用支持模型底層技術(shù)2月2023Bard3月百度文心一言aiXcoderCopilotCopy.aiMeena底層技術(shù)微軟小冰StableDiffusion

2TabNine科大訊飛SMART-TTSMagic3D2019及更早OpenAGIoogle資料來源:

Sequoia國產(chǎn)其他盜夢師6penGPT-

4處于測試階段Palm2022年發(fā)布2023.3開放api1.2

ChatGPT開放接口,OpenAI商業(yè)化進(jìn)一步推進(jìn)OpenAI開放ChatGPT

API和Whisper

API(應(yīng)用程序接口),允許開發(fā)者將ChatGPT集成至他們的應(yīng)用程序和服務(wù)中。2023年3月1號,OpenAI宣布開放了ChatGPT

API,其由自然語言大模型“GPT3.5

Turbo”

支持,開放的API收費(fèi)模式為0.002美元/1000tokens,較前一代價(jià)格下降90%。OpenAI根據(jù)API調(diào)用的token(分詞)輸入和輸出總數(shù)計(jì)費(fèi)。例如調(diào)用輸入10個(gè)token

,輸出20個(gè)token,則需要支付30個(gè)token的費(fèi)用。同時(shí)token總數(shù)還需低于模型最大限制,GPT-3.5-turbo-0301版本的限制是4096個(gè)token。除此之外,本次OpenAI還開放了Whisper

API。是一種語音轉(zhuǎn)換文字(speech

to

text)的模型,可以轉(zhuǎn)寫或翻譯語音,支持包括英語、中文、阿拉伯語、日語、德語、西班牙語等幾十種語言,使用Whisper

API的費(fèi)用為每分鐘0.006美元。目前OpenAI已經(jīng)開放了包括ChatGPT

API和Whisper

API在內(nèi)的多個(gè)API接口,逐步推進(jìn)商業(yè)化進(jìn)程:OpenAI開放的語言類API包括用于對話的GPT-3.5-turbo(多段對話)、InstructGPT(一問一答),其中InstructGPT根據(jù)其性能可以分為Ada、Babbage、Curie、Davinci(由弱至強(qiáng)),這四個(gè)模型還提供針對具體場景的微調(diào)接口,其中的Ada還可以作為研究的基礎(chǔ)Embedding模型被調(diào)用。開放的多模態(tài)模型為Dall·E

,根據(jù)處理圖像的像素不同進(jìn)行收費(fèi)。開放的音頻模型為Whisper。表:OpenAI開放的相關(guān)模型資料來源:OpenAI,中信建投應(yīng) 具體用 功能模型名定價(jià)(美金/1000tokens)語言模型對話GPT-3.5-turbo0.002InstructGPTAda0.0004Babbage0.0005Curie0.0020Davinci0.0200應(yīng)用模型名 定價(jià)(美金/1000tokens)語言模型Fine-

TuningAda0.0004(訓(xùn)練)

0.0016(調(diào)用)EmbeddingCurie 0.0030(訓(xùn)練)

0.0120(調(diào)用)

Davinci 0.0300(訓(xùn)練)

0.12(調(diào)用)Ada 0.0004具體 具體功能應(yīng)用 模型名 定價(jià)Babbage 0.0006(訓(xùn)練)

0.0024(調(diào)用)

多模態(tài)模型文生圖Dall·E

功能 0.020美金/

image(1024×1024)0.018美金/

image(512×512)0.016美金/

image(256×256)音頻 語音模型 識(shí)別Whisper0.006美金/

minute1.3

微軟與OpenAI深度合作,依托前沿AI技術(shù)提升產(chǎn)品能力資料來源:OpenAI,中信建投微軟作為OpenAI最為重要的合作伙伴和投資人,其旗下產(chǎn)品與OpenAI的相關(guān)模型深度融合。微軟旗下的搜索引擎結(jié)合了GPT4的技術(shù),將搜索、創(chuàng)造、聊天結(jié)為一體,多方位地滿足用戶個(gè)性化的需求;微軟旗下的企業(yè)服務(wù)平臺(tái)Dynamic365是融合CRM、ERP等功能的SaaS服務(wù),其結(jié)合ChatGPT的技術(shù)推出Dynamics365

Copilot,為銷售、服務(wù)、營銷到供應(yīng)鏈等跨業(yè)務(wù)的人員提供幫助;微軟旗下的開發(fā)者工具Power

Platform,結(jié)合ChatGPT技術(shù)推出,Power

Virtual

Agents和AI

Builder,分別提供構(gòu)建聊天機(jī)器人的低代碼方法和面向開發(fā)人員的生成AI功能。微軟產(chǎn)品在融合了生成式AI技術(shù)后展現(xiàn)出更強(qiáng)的產(chǎn)品能力和市場競爭力以Dynamic

365

Copilot為例,在原先的工作場景中,營銷人員需要每天花費(fèi)66

的時(shí)間進(jìn)行郵件回復(fù)(根據(jù)Futurum研究),而Dynamics

365Copilot的推出就有望大大減輕這方面的工作量。產(chǎn)品能力的提升也帶來了廣泛的市場關(guān)注度和認(rèn)可度,以微軟Bing為例,Bing接入ChatGPT一個(gè)月后,微軟公布進(jìn)展稱,經(jīng)過多年的穩(wěn)步發(fā)展,加上數(shù)百萬新Bing預(yù)覽用戶的推動(dòng),Bing每日活躍用戶已突破1億。在新Bing預(yù)覽版的數(shù)百萬活躍用戶中,大約三分之一是Bing的新用戶。圖:Bing基于用戶指令生成產(chǎn)品對比信息表格 圖:微軟Power

Platform平臺(tái)與AI結(jié)合相關(guān)產(chǎn)品時(shí)間線1.4.1B端應(yīng)用:Dynamic365&PowerPlatformDynamic365是微軟推出的企業(yè)服務(wù)平臺(tái),其中于2023年3月9日推出的的Dynamics

365

Copilot結(jié)合了ChatGPT相關(guān)的AI技術(shù),用于

CRM

ERP

。目前處于預(yù)覽階段,其可以為銷售、服務(wù)、營銷到供應(yīng)鏈等跨業(yè)務(wù)的人員提供幫助,例如實(shí)現(xiàn)生成回復(fù)客戶信息的電子郵件,為團(tuán)隊(duì)創(chuàng)建會(huì)議摘要,為營銷活動(dòng)提供靈感等。Power

Platform是微軟旗下的開發(fā)者工具,其中于2023年3月6日推出的Power

Virtual

Agents和AI

Builder都已經(jīng)使用了OpenAI的GPT語言模型技術(shù)。其中Power

Virtual

Agents通過聊天機(jī)器人的形式實(shí)現(xiàn)低代碼編程,比如將AI

聊天機(jī)器人指向企業(yè)的特定資源,如網(wǎng)站或者知識(shí)庫,簡單配置便可使用,無須額外編寫代碼。而AI

Builder

結(jié)合了ChatGPT

API(稱為AzureOpenAI

服務(wù))的生成AI

功能,允許開發(fā)人員使用

GPT

模型生成文本,包括匯總報(bào)告、生成內(nèi)容創(chuàng)意等等。圖:使用Dynamic

365

Copilot輔助回復(fù)郵件資料來源:微軟,中信建投圖:利用Power

Virtual

Agents便捷構(gòu)建聊天機(jī)器人1.4.2

B端應(yīng)用:JasperJasper:結(jié)合GPT-3,打造多款產(chǎn)品截至2022年12月底,Jasper付費(fèi)用戶達(dá)到7萬,2022年年收入7500萬美金,估值已達(dá)15億美金。旗下有多款產(chǎn)品接入GPT-3進(jìn)行商業(yè)性文字創(chuàng)作:Jasper

Starter能夠利用預(yù)定義的模板完成摘要、產(chǎn)品描述、博客文章。Boss

Mode是一款寫作助手,能夠?qū)崿F(xiàn)靈活便捷的商業(yè)文案寫作。通過使用Boss

Mode,用戶僅需要自己編輯20的內(nèi)容,

Jasper會(huì)完成80的內(nèi)容。Jasper

for

Business是專門為B端打造的服務(wù),能夠定制化生成文案。用戶能夠創(chuàng)建新的自定義工作流程,開發(fā)專門滿足其需求的寫作助手。Jasper

Chat是一款起到激發(fā)想法和修改內(nèi)容功能的聊天機(jī)器人,而Jasper

Art能夠?yàn)閺V告、博客文章生成圖片。資料來源:Jasper官網(wǎng),Contrary

Research,中信建投圖:Jasper能夠翻譯25種語言圖:Jasper功能簡述 圖:Jasper將關(guān)鍵詞和提示轉(zhuǎn)換為文章1.4.3

B端應(yīng)用:Brex&Slack&ChatSpot.aiBrex:與OpenAi合作,打造便捷化的金融信息平臺(tái)Brex是一家美國的金融科技平臺(tái)。2023年3月7日,Brex宣布推出基于OpenAI技術(shù)的先進(jìn)人工智能工具。通過Brex

Empower平臺(tái),客戶可以在聊天界面中,使用自然語言來描述要求,獲得相應(yīng)的財(cái)務(wù)相關(guān)信息或是更為復(fù)雜的財(cái)務(wù)分析。Slack:基于ChatGPT能力,助力日常辦公的效率提升Slack是Salesforce旗下的團(tuán)隊(duì)協(xié)作工具,與Teams類似。2023年3月7日,Slack宣布引入OpenAI的ChatGPT,用戶可以在應(yīng)用程序中直接對ChatGPT提問來獲得問題的答案。ChatGPT將協(xié)助用戶進(jìn)行內(nèi)容理解、總結(jié)與歸納,進(jìn)而實(shí)現(xiàn)工作效率的提高。這一功能最初為OpenAI內(nèi)部團(tuán)隊(duì)的協(xié)作工具,現(xiàn)在已經(jīng)向所有的Slack用戶開放。ChatSpot.ai:將ChatGPT等AIGC技術(shù)與CRM結(jié)合,輔助實(shí)現(xiàn)多類任務(wù)HubSpot是一個(gè)著名的營銷、銷售、服務(wù)平臺(tái)(CRM),其推出了一種新的生成AI工具ChatSpot,將HubSpot自己的CRM技術(shù)與OpenAI的ChatGPT、DALL-E

2和谷歌文檔應(yīng)用程序結(jié)合,可以用自然語言完成多類任務(wù),如調(diào)取數(shù)據(jù),生成報(bào)告等功能。圖:Brex產(chǎn)品示意圖 圖:Slack中的ChatGPT相關(guān)應(yīng)用資料來源:Brex官網(wǎng),salesforce官網(wǎng),OpenAI,中信建投1.4.4B端應(yīng)用:HireStack&PencilHireStack:結(jié)合GPT-3提升面試效率HireStack是一家人力資源公司,它利用GPT-3生成面試問題以及對應(yīng)的答案。參考AI給出的回答,HireStack能夠在面試時(shí)評估應(yīng)聘者的專業(yè)能力以及與對應(yīng)職位的匹配度,相比于傳統(tǒng)的人力資源公司,AI能夠極大提升HireStack工作效率。Pencil:基于GPT-3生成多樣化廣告Pencil可以生成效果良好、富有創(chuàng)意且符合品牌要求的廣告文案和視頻。GPT-3

使得

Pencil不僅能夠一般性地描述產(chǎn)品,而是能夠圍繞產(chǎn)品進(jìn)行創(chuàng)意營銷。例如,為打造一個(gè)手電筒廣告,Pencil在廣告中首先展現(xiàn)出在黑暗中工作是十分危險(xiǎn)的,進(jìn)而突出手電筒的重要性。更具創(chuàng)意的解決方案將使得Pencil的廣告對潛在客戶更具吸引力。圖:Pencil基于一款產(chǎn)品生成多種類型的廣告圖:HireStack利用GPT-3生成面試問題和答案資料來源:HireStack官網(wǎng),Pencil官網(wǎng),中信建投1.4.5C端應(yīng)用:Snapchat&DiscordSnapchat:基于ChatGPT

API推出聊天機(jī)器人My

AISnapchat是一款由斯坦福大學(xué)學(xué)生開發(fā)的圖片分享軟件。2023年2月28日Snapchat宣布推出近日基于OpenAI的ChatGPTAPI的人工智能聊天機(jī)器人“My

AI”。目前,這一功能僅對訂閱了Snapchat+的高級用戶開放,訂閱費(fèi)用為每月3.99美元。目前,付費(fèi)用戶數(shù)量為兩百萬,只占公司用戶總數(shù)的一小部分。公司表示,在不久的將來,平臺(tái)的所有客戶都可以免費(fèi)或付費(fèi)使用My

AI。Discord:基于ChatGPT

API推出聊天機(jī)器人ClydeDiscord是一個(gè)游戲聊天應(yīng)用與社區(qū),每月有3000萬用戶在社區(qū)中體驗(yàn)AI相關(guān)的應(yīng)用。2023年3月10日,Discord宣布引入OpenAI

API推出了聊天機(jī)器人Clyde,其可以加入到Discord的不同頻道中(通過輸入“@Clyde”就可以在任意頻道中與Clyde進(jìn)行對話),實(shí)現(xiàn)對話總結(jié)、基于對話中的問題作答、歌單推薦、與用戶進(jìn)行互動(dòng)游戲等方面的功能。圖:Snapchat

MY

AI 圖:Discord

Clyde資料來源:SnapChat,Discord,中信建投1.4.6

C端應(yīng)用:Bing資料來源:Bing,新智元,How-to

Geek,中信建投Bing:整合Open

AI新一代技術(shù),帶來搜索引擎范式轉(zhuǎn)移2月8日,由ChatGPT和GPT-3.5提供支持的全新搜索引擎Bing正式亮相。新版Bing在傳統(tǒng)的搜索外還有對話窗口,可向它提問或是征求它的意見。例如用戶可以向其詢問參加音樂節(jié)的建議。除此之外,新版Bing還可以進(jìn)行創(chuàng)作,例如根據(jù)提示幫助用戶用戶生成從電子郵件到社交媒體的文本,或是表格化的輸出幫助用戶更好對比產(chǎn)品的差異。此外,Bing在不斷迭代,3月7日,Bing發(fā)布了具有三個(gè)風(fēng)格的新版產(chǎn)品以更好滿足用戶個(gè)性化的需求。此外,移動(dòng)版的Bing也在11日發(fā)布,用戶在手機(jī)上即可使用最新版本的Bing。我們認(rèn)為,新Bing不同于傳統(tǒng)的搜索引擎,將“搜索+創(chuàng)造+聊天”融為一體,能夠更加靈活地滿足用戶多樣化需求,或?qū)硭阉饕娴姆妒睫D(zhuǎn)移。新Bing下載量激增,日活已突破1億Bing接入ChatGPT一個(gè)月后,微軟公布其進(jìn)展稱,經(jīng)過多年的穩(wěn)步發(fā)展,加上數(shù)百萬新

Bing

預(yù)覽用戶的推動(dòng),

Bing每日活躍用戶已突破1億。在新

Bing

預(yù)覽版的數(shù)百萬活躍用戶中,大約三分之一是Bing

的新用戶。圖:新Bing界面包含對話框 圖:利用Bing生成社交媒體的文本 圖:Bing生成表格對比產(chǎn)品信息1.4.7

C端應(yīng)用:DuckAssist&PoeDuckDuckGo:與OpenAI合作,推出DuckAssistDuckDuckGo是一個(gè)主打隱私保護(hù)的互聯(lián)網(wǎng)搜索引擎,于2023年3月9日推出了測試版DuckAssist,通過AI

工具來幫助用戶快速找到答案。DuckAssist

的設(shè)計(jì)目標(biāo)是從維基百科等類似來源中,總結(jié)出用戶所需要的答案,并以自然語言的方式傳達(dá)給用戶。DuckDuckGo邀請所有用戶對DuckAssist的功能進(jìn)行測試,且不需要注冊用戶即可直接使用相關(guān)功能,如果測試進(jìn)展順利,它將在“未來幾周內(nèi)”正式添加到瀏覽器中。Quora:基于不同的語言模型,推出了聊天機(jī)器人PoeQuora是一個(gè)專業(yè)問答平臺(tái)/知識(shí)問答社區(qū),類似于美國版的知乎。Quora推出了新的AI聊天機(jī)器人應(yīng)用Poe,最早在2022年12月亮相,但在2023年2月全面發(fā)布。所有iOS用戶都可以通過電話號碼和電子郵件注冊賬戶,然后就能在三種不同的AI聊天機(jī)器人中切換,獲得相應(yīng)的聊天結(jié)果。具體的聊天機(jī)器人包括Sage、Dragonfle(均由OpenAI支持)、

Claude

(由支持Anthropic)。目前Poe作為獨(dú)立產(chǎn)品推出,但若Poe上的相關(guān)內(nèi)容達(dá)到一定的質(zhì)量標(biāo)準(zhǔn),就會(huì)被發(fā)布至Quora網(wǎng)站上,供每月4億訪問者快速查詢。圖:DuckAssist界面示意圖 圖:Quora

POE資料來源:DuckDuckGo,Quora,中信建投1.4.8

C端應(yīng)用:Quizlet&Instacart&Shop資料來源:OpenAI,中信建投Quizlet:結(jié)合ChatGPT

API,推出AI導(dǎo)師Q-ChatQuizlet是一個(gè)全球性的學(xué)習(xí)平臺(tái),有超過6000萬的用戶。結(jié)合ChatGPT

API,Quizlet于2023年2月28日推出了AI導(dǎo)師Q-Chat,其可以基于相關(guān)學(xué)習(xí)材料提出自適應(yīng)問題,生成有趣的聊天內(nèi)容來與學(xué)生進(jìn)行互動(dòng)。Instacart:基于ChatGPT和相關(guān)AI技術(shù),推出Ask

Instacart功能Instacart是一家美國的生鮮雜貨電商平臺(tái)。Instacart利用ChatGPT和自研的AI技術(shù),結(jié)合平臺(tái)上超過75000個(gè)零售合作伙伴店鋪的產(chǎn)品信息,幫助客戶實(shí)現(xiàn)他們的開放式購物目標(biāo),例如可以回答客戶的“我的孩子們午餐吃什么健康的食物?”一類的開放性問題,這一功能名為Ask

Instacart,將在今年晚些時(shí)候推出。Shopify:結(jié)合ChatGPT,提供消費(fèi)個(gè)性化推薦服務(wù)Shop是Shopify的消費(fèi)者應(yīng)用程序,有上億消費(fèi)者在程序上尋找品牌和產(chǎn)品信息。通過與ChatGPT的結(jié)合,Shpo購物助手會(huì)根據(jù)用戶文字描述的需求,掃描數(shù)百萬商品快速找到買家所需,提供個(gè)性化推薦,實(shí)現(xiàn)物流程的簡便化、高效化。圖:Quizlet

Q-Chat生成趣味問答與學(xué)生交互 圖:Ask

Instacart 圖:Shopify中的shop協(xié)助找到買家所需提問什么是適合孩子的健康午餐給出食物推薦和購買鏈接提出需要尋找的服裝需求根據(jù)用戶需求推薦相關(guān)產(chǎn)品1.4.9

C端應(yīng)用:Anania&TabnineAnania:結(jié)合多種語言模型進(jìn)行數(shù)據(jù)分析Anania

是一款數(shù)據(jù)分析軟件,GPT3是Anania使用的AI模型之一。其可以通過簡單、自然的英語對話來分析用戶的數(shù)據(jù)。用戶可以通過它對數(shù)據(jù)進(jìn)行搜集、分析、可視化和導(dǎo)出。例如用戶輸入“向我展示出周內(nèi)和周末用手機(jī)進(jìn)行對話的用戶比例的差異”,Anania即可快速生成對比圖表。Tabnine:結(jié)合GPT-2生成代碼Tabnine使用生成AI技術(shù)來預(yù)測并根據(jù)上下文和語法來推測用戶的下一行代碼。在編寫代碼時(shí),Tabnine可以為用戶推薦其預(yù)測的整行代碼?;蛴脩糨斎胱⑨專琓abnine

則會(huì)為其推薦正確的代碼。圖:輸入注釋Tabnine即可自動(dòng)生成代碼圖:輸入句子Anania即可作出圖表資料來源:Anania官網(wǎng),Tabnine官網(wǎng),中信建投注釋:擬合隨機(jī)森林模型Tabnine自動(dòng)生成了相關(guān)代碼1.4.10

C端應(yīng)用:Jarvis

Lyrics&RationaleJarvis

Lyrics:基于GPT3的歌詞生成工具Jarvis是歌曲創(chuàng)作的伴侶。它能夠根據(jù)任何藝術(shù)家、流派、標(biāo)題和歌詞的提示生成歌詞建議。然后,用戶可以根據(jù)建議創(chuàng)作自己的歌詞。該工具利用隨機(jī)輸入的語句或創(chuàng)意故事生成的歌詞使得藝術(shù)家獲得更多靈感。Rationale:基于GPT3的決策助手用戶只需輸入無法決定的選項(xiàng),Rationale就會(huì)根據(jù)

GPT

和上下文學(xué)習(xí)算法列出該決定的優(yōu)缺點(diǎn)、生成

SWOT

分析或進(jìn)行多標(biāo)準(zhǔn)分析以幫助用戶權(quán)衡選擇。通過考慮所有相關(guān)因素和用戶的背景,Rationale可以幫助用戶做出理性的決定。圖:用戶輸入“吃蘋果”后Rationale列出該決定的優(yōu)缺點(diǎn)圖:輸入歌手名稱即可使用Jarvis生成相關(guān)歌詞資料來源:Jarvis官網(wǎng),Rationale官網(wǎng),中信建投用戶無法確定的事項(xiàng)缺點(diǎn)優(yōu)點(diǎn)目錄一、ChatGPT:從全民關(guān)注的爆款應(yīng)用走向商業(yè)化開放,在多個(gè)場景中展現(xiàn)價(jià)值二、GPT4:更強(qiáng)大的多模態(tài)大模型,帶來更廣泛的商業(yè)應(yīng)用可能2.1.1

GPT-4:

OpenAI最強(qiáng)大的多模態(tài)大模型2023年3月15日,

OpenAI發(fā)布多模態(tài)預(yù)訓(xùn)練大模型GPT-4,并稱其是目前最強(qiáng)大的多模態(tài)大模型。其主要特點(diǎn)如下:GPT-4具備從圖像中獲取和分析信息的能力:GPT-4不僅擁有圖像閱讀能力,還可以從圖像中提取邏輯,進(jìn)行分析思考。以左圖為例:問:如果把圖中的繩子剪掉會(huì)怎么辦?

GPT-4:

氣球會(huì)飛走。GPT-4對圖片的理解能力、分析邏輯能力、物理等學(xué)科的知識(shí)儲(chǔ)備都賦予了這個(gè)模型強(qiáng)大的智能。GPT-4能夠處理更長的文本輸入:在ChatGPT模型中,單次輸入的文本量為3000個(gè)單詞左右,而GPT-4模型單次能夠處理超過25000個(gè)單詞,是上一代ChatGPT模型的近8倍,代表著對長文章的閱讀、分析、生成能力大幅提高。圖:

GPT-4擁有從圖像中提取邏輯的強(qiáng)理解力 圖:GPT-4和ChatGPT單次輸入的文本量對比資料來源:OpenAI,中信建投2.1.2

GPT-4:

能力更為強(qiáng)大而全面的多模態(tài)預(yù)訓(xùn)練大模型GPT-4更具備創(chuàng)造力和協(xié)作能力:它可以與用戶一起生成、編輯和迭代創(chuàng)意和技術(shù)寫作任務(wù),例如創(chuàng)作歌曲、編寫劇本或?qū)W習(xí)用戶的寫作風(fēng)格。如下左圖所示,GPT-4根據(jù)用戶要求生成了一個(gè)解釋灰姑娘故事情節(jié)的句子,并且每個(gè)單詞首字母需滿足字母表A-Z的排序。GPT-4相較于ChatGPT有更強(qiáng)的高級推理能力:GPT-4能夠回答出ChatGPT所不能回答的更為復(fù)雜的邏輯問題。如下右圖所示,給定三個(gè)人物不同的空閑時(shí)間,要求模型安排出合適的會(huì)議時(shí)間,ChatGPT無法在此問題上給出正確答案(右圖灰白色文字),而GPT-4能夠合理的完成這一要求(右圖綠色文字)。而在GPT-3.5難以處理的如AP

Calculus

BC(AP微積分)考試中,GPT-4的水平超過40%的應(yīng)試者。圖:GPT-4根據(jù)用戶要求創(chuàng)作圖:GPT-4能夠處理ChatGPT無法處理的復(fù)雜推理問題要求用一句話描述灰姑娘的劇情且句子中每個(gè)單子的首字母需要滿足字母表A-Z的排序ChatGPT生成的答案是錯(cuò)誤的而GPT-4給出了正確的答案資料來源:OpenAI,中信建投2.2.1

GPT-4:

從語言模型走向多模態(tài)模型,帶來更為豐富的應(yīng)用場景圖1:GPT-4處理圖像相關(guān)的物理問題圖2:GPT-4根據(jù)論文截圖給出摘要(左)并回答相關(guān)問題(右)GPT-4是大型多模態(tài)模型,能夠接受圖像和文本兩種模態(tài)的輸入,再通過文字給出正確的文本答復(fù),在多個(gè)不同的應(yīng)用場景中展現(xiàn)出強(qiáng)大的能力。給出一道物理題和相應(yīng)的示意圖,GPT-4可以給出具體的解題步驟和相應(yīng)的答案(如下圖1所示)給出論文的截圖,GPT-4可以總結(jié)出論文的主要內(nèi)容,并根據(jù)用戶進(jìn)一步的提問補(bǔ)充其中的細(xì)節(jié),在用戶的指令下,GPT-4進(jìn)一步解釋了論文中的第二個(gè)圖像涉及的具體步驟。(如下圖2所示)用戶輸入物理題及其對應(yīng)示意圖GPT-4分步驟給出解答用戶輸入論文圖像及摘要指令GPT-4生成論文摘要GPT-4根據(jù)用戶要求補(bǔ)充解釋論文中圖像的具體步驟資料來源:OpenAI,中信建投2.2.2

GPT-4:

從語言模型走向多模態(tài)模型,帶來更為豐富的應(yīng)用場景用戶給出一張具有相關(guān)數(shù)據(jù)信息的圖表并提出了一個(gè)和圖表數(shù)據(jù)相關(guān)的問題,GPT-4可以識(shí)別出圖表中對應(yīng)的數(shù)據(jù),給出問題的處理步驟和處理結(jié)果。如下圖3所示,給定一張含有芬蘭、格魯吉亞、西亞每日人均肉類消費(fèi)的圖表,GPT4按照要求計(jì)算出了格魯吉亞和西亞每日人均肉類消費(fèi)的和并給出了對應(yīng)步驟。輸入一張圖片并提出和圖片相關(guān)的問題,GPT-4可以基于圖片給出準(zhǔn)確的回答。如下圖4所示,輸入一張“VGA線充手機(jī)”的圖片并要求GPT-4解釋圖片幽默的原因,GPT-4成功按照用戶的要求給出了圖片的三個(gè)部分的具體含義并正確給出了圖片之所以看上去滑稽是因?yàn)椤皩⑤^大的VGA數(shù)據(jù)線接到了相對迷你的現(xiàn)代手機(jī)上”。而在圖5的例子中,GPT-4成功解釋了關(guān)于神經(jīng)網(wǎng)絡(luò)層數(shù)的漫畫內(nèi)容。圖3:GPT-4提取圖像中的數(shù)據(jù)并完成相應(yīng)計(jì)算 圖4:GPT-4解釋圖片含義及幽默的原因 圖5:GPT-4解釋漫畫的內(nèi)容用戶輸入數(shù)據(jù)圖表及相關(guān)問題GPT-4分步驟給出解答用戶輸入圖像并提問為什么圖像看上去滑稽GPT-4解釋圖像為什么會(huì)滑稽用戶輸入漫畫并要求闡述漫畫內(nèi)容GPT-4解釋漫畫對應(yīng)的內(nèi)容資料來源:OpenAI,中信建投2.3GPT-4:從“百科全書”逐步成為文理通吃的“專家”相較于過去的GPT系列模型,GPT-4在更多應(yīng)用領(lǐng)域成為專家,包括為機(jī)器學(xué)習(xí)模型評判標(biāo)準(zhǔn)和為人類設(shè)計(jì)的專業(yè)測試。在為機(jī)器學(xué)習(xí)模型設(shè)計(jì)的傳統(tǒng)基準(zhǔn)上,GPT-4的表現(xiàn)大大優(yōu)于了目前的最好的語言模型,以及大多數(shù)SOTA模型相較于GPT-3.5以及當(dāng)前最好的語言模型,GPT-4在機(jī)器學(xué)習(xí)模型學(xué)術(shù)基準(zhǔn)數(shù)據(jù)集上的表現(xiàn)實(shí)現(xiàn)了全面突破,在7項(xiàng)數(shù)據(jù)集中的測試均優(yōu)于當(dāng)前最優(yōu)的語言模型。除了在Drop基準(zhǔn)數(shù)據(jù)集上與QDGAT模型有一定差距,GPT-4在其余6項(xiàng)基準(zhǔn)數(shù)據(jù)集的測試都實(shí)現(xiàn)了當(dāng)前世界最優(yōu)秀的性能。在MMLU數(shù)據(jù)集中,GPT-4不僅在英語語言上的性能實(shí)現(xiàn)了突破,在其他語言方面的表現(xiàn)也優(yōu)于現(xiàn)在的語言模型。在為人類設(shè)計(jì)的各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)數(shù)據(jù)集中,GPT-4展現(xiàn)出媲美甚至優(yōu)于人類的水平。GPT-3.5模型在一些相對簡單的人類專業(yè)測試中已經(jīng)展現(xiàn)出不錯(cuò)的性能,但當(dāng)任務(wù)的復(fù)雜度上升后,其便難以處理,而GPT-4模型在一些相對困難的任務(wù)中也已經(jīng)取得相當(dāng)優(yōu)異的性能,例如其在模擬律師考試中取得了應(yīng)試者中前10%的成績,而GPT-3.5模型只有倒數(shù)10%的成績,甚至在GPT-3.5難以處理的如AP

Calculus

BC(AP微積分)考試中,GPT-4的水平也已經(jīng)超過40%的應(yīng)試者。表:GPT-4在機(jī)器學(xué)習(xí)模型學(xué)術(shù)基準(zhǔn)數(shù)據(jù)集中的表現(xiàn)語言模型的

所有模型的最佳性能 最佳性能圖:GPT-4在MMLU不同語言上的性能 圖:GPT-4在人類專業(yè)測試中的表現(xiàn)GPT-3.5在英語語言上MMLU任務(wù)的性能資料來源:OpenAI,中信建投2.4

GPT-4:在可控性和真實(shí)性方面比ChatGPT有大幅提升從實(shí)際使用中持續(xù)提升GPT-4協(xié)助進(jìn)行安全方面的研究資料來源:OpenAI,中信建投GPT-4更加可控,回答更加符合事實(shí):Open

AI

花費(fèi)了

6

個(gè)月時(shí)間使用對抗性測試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)對GPT-4進(jìn)行迭代調(diào)整,從而在可控性和真實(shí)性上取得了很好的結(jié)果。在內(nèi)部評估中,GPT-4

回答可能生成有害內(nèi)容的輸入的可能性降低了

82%,產(chǎn)生符合事實(shí)回復(fù)的可能性高出

40%。引入人類反饋進(jìn)行訓(xùn)練。Open

AI引入了ChatGPT用戶以及50名來自人工智能、網(wǎng)絡(luò)安全、生物安全和國際安全等領(lǐng)域的專家提交的反饋來訓(xùn)練模型,以使模型的回答避免含有某些不恰當(dāng)?shù)难哉?。從?shí)際使用中不斷提升。Open

AI將以前模型的使用經(jīng)驗(yàn)應(yīng)用到GPT-4

的安全研究和監(jiān)控系統(tǒng)中。例如Open

AI會(huì)自動(dòng)檢測用戶的行為是否違背安全性原則。若違反,系統(tǒng)會(huì)臨時(shí)發(fā)布警告暫?;蚪褂脩舻男袨椤EcChatGPT

一樣,隨著越來越多的人使用它,OpenAI將定期更新和改進(jìn)GPT-4。GPT-4協(xié)助進(jìn)行安全方面的研究。GPT-4

的高級推理和指令遵循功能加快了安全研究工作。Open

AI使用

GPT-4

來幫助創(chuàng)建訓(xùn)練數(shù)據(jù),以便在訓(xùn)練、評估和監(jiān)控中對分類器進(jìn)行微調(diào)和迭代。圖:GPT-4降低危險(xiǎn)行為比率 圖:Open

AI通過三方面提升GPT-4可控性和真實(shí)性引入人類的反饋進(jìn)行訓(xùn)練2.5

ChatGPT升級GPT-4版本,GPT-4開放相應(yīng)API加速商業(yè)化,資料來源:OpenAI,中信建投模型名定價(jià)輸入長度GPT-3.5-turbo0.002美金/

1K

tokensGPT-4(純文本)0.03美金/

1K

tokens8K長度的輸入0.06美金/

1K

tokens8K長度的回復(fù)0.06美金/

1K

tokens32K長度的輸入0.12美金/

1K

tokens32K長度的回復(fù)ChatGPT升級了對應(yīng)的GPT-4版本:在GPT-4發(fā)布后,OpenAI直接將GPT-4接入了ChatGPT。訂閱了ChatGPTPlus的用戶可以有使用上限的GPT-4訪問權(quán)限。GPT-4開放了相應(yīng)的API

GPT-4純文本API可以通過注冊申請的方式獲取,但目前圖像輸入仍處于Alpha測試階段,尚未開放給用戶。價(jià)格方面,輸入長度為8K的版本輸入和回復(fù)的價(jià)格分別為每1000個(gè)token

0.03美金和0.06美金,輸入長度為32K的版本輸入和回復(fù)的價(jià)格分別為每1000個(gè)token0.06美金和0.12美金。GPT-4商業(yè)化落地加速:GPT-4強(qiáng)大的性能和解決豐富場景下具體問題的能力讓其在優(yōu)化人機(jī)交互體驗(yàn)、提供專業(yè)服務(wù)、提升組織效能、文化傳承與保護(hù)等方面都展現(xiàn)了巨大的潛能。表:GPT-4和ChatGPT

API價(jià)格對比 圖:GPT-4部分的落地應(yīng)用案例Duolinguo Be

My

Eyes StripeIceland

GovermentKhan

academyMorgan

Stanley2.5.1

GPT-4商業(yè)應(yīng)用:工作方式的革新Microsoft

365Copilot:結(jié)合GPT-4連通多種應(yīng)用Microsoft

365

Copilot將GPT-4

的強(qiáng)大功能與

Microsoft

Graph

Microsoft

365

應(yīng)用中的數(shù)據(jù)相結(jié)合,通過自然語言輸入即可產(chǎn)生強(qiáng)大生產(chǎn)力,極大提升了工作效率。個(gè)人辦公:Copilot被整合進(jìn)所有的Microsoft

365應(yīng)用。在Word中,用戶簡單描述即可讓其生成初稿,也可輸入其它文件,指定內(nèi)容進(jìn)行創(chuàng)作。在Excel中,它可以分析趨勢并進(jìn)行數(shù)據(jù)可視化,用戶不再需要使用復(fù)雜的公式;在PPT中,它可以根據(jù)用戶的要求生成演示文稿,也可將其它文件轉(zhuǎn)為精美PPT;在Outlook中,它可以挑選出有價(jià)值的郵件并總結(jié)對應(yīng)要點(diǎn),還可以提供回復(fù)建議。團(tuán)隊(duì)協(xié)作:Copilot不僅局限于Office的幾個(gè)軟件,還將整個(gè)辦公生態(tài)全部打通。郵件、聯(lián)系人、在線會(huì)議等等軟件的數(shù)據(jù)都被接入大語言模型,構(gòu)成新的Copilot系統(tǒng)。

Copilot會(huì)將錯(cuò)過的會(huì)議消息匯總成報(bào)告。在會(huì)議中它能夠?qū)崟r(shí)做出總結(jié)。會(huì)議結(jié)束,Copilot還可根據(jù)內(nèi)容自動(dòng)生成跟進(jìn)郵件。此外,它還可以將重復(fù)的工作流程自動(dòng)化,為公司做SWOT分析,實(shí)時(shí)協(xié)同工作等。我們認(rèn)為,結(jié)合了GPT-4強(qiáng)大AI能力的Microsoft

365

Copilot,將帶來工作效率的大幅提升和工作方式的革新。這一強(qiáng)大增值服務(wù)的落地將帶動(dòng)Office

ARPU值(每個(gè)用戶貢獻(xiàn)收入平均值)的提升,并推動(dòng)Office軟件整體滲透率的提升,具有廣闊的市場前景。若按Microsoft

365

Office2022年用戶數(shù)3.45億人,保守參考GitHub

Copilot

10美金/月的訂閱費(fèi),假設(shè)其中20%的用戶升級相關(guān)服務(wù)來計(jì)算,每年大約將帶來超80億美元的收入。圖:Copilot總結(jié)錯(cuò)過的會(huì)議內(nèi)容資料來源:Microsoft,中信建投圖:Copilot系統(tǒng) 圖:Copilot基于簡單描述生成PPT2.5.2

GPT-4商業(yè)應(yīng)用:人機(jī)交互體驗(yàn)優(yōu)化Duolinguo:使用GPT-4改進(jìn)對話功能Duolinguo是一個(gè)語言學(xué)習(xí)平臺(tái),每月有超過50萬用戶使用其進(jìn)行外語學(xué)習(xí),提供40多種語言課程,支持

100

多種語言。與GPT-4合作的產(chǎn)品Duolinguo

Max產(chǎn)品目前有兩項(xiàng)功能:一是Roleplay,即角色扮演,用戶可以在眾多的場景中和AI伙伴進(jìn)行對話練習(xí),如下左圖便是一個(gè)模擬用法語在咖啡廳場景中點(diǎn)單的例子;二是Explan

My

Answer,即答案解釋,會(huì)針對用戶的回答對上下文的錯(cuò)誤進(jìn)行反饋,若用戶對解釋尚不滿意,可以要求獲得進(jìn)一步的解釋。目前Duolinguo

Max應(yīng)用于西班牙語和法語,未來將應(yīng)用于更多語言,并開發(fā)更多功能。Be

My

Eyes:使用GPT-4優(yōu)化視覺輔助功能Be

MyEyes是一家創(chuàng)立于2012年的丹麥公司,持續(xù)為超過2.5億視力障礙或弱視人群提供輔助技術(shù)。借助GPT-4的多模態(tài)技術(shù),Be

MyEyes在其應(yīng)用程序中正在開發(fā)Virtual

Volunteer功能,

其可以產(chǎn)生與人類志愿者相同水平的分析、理解和反饋能力。例如下圖所示,對于兩件條紋襯衫進(jìn)行拍照,便可以回復(fù)與圖片相關(guān)的問題,如“哪一件是紅色條紋襯衫”、“紅色條紋襯衫之外的另外一件是什么樣的”。Be

My

eyes的首席執(zhí)行官表示,這項(xiàng)技術(shù)將滿足視力障礙或弱視人群大量的視覺解釋需求,使他們在生活中擁有更大的獨(dú)立性。圖:Duolingguo

max的roleplay功能 圖:Duolingguo

max的explain

myanswer功能圖:

Virtual

Volunteer基于拍照圖片回答相關(guān)問題模擬在咖啡廳中用法語進(jìn)行點(diǎn)單并給出相應(yīng)評價(jià)資料來源:OpenAI,中信建投針對用戶的回答對具體知識(shí)進(jìn)行解釋,并可以根據(jù)用戶要求進(jìn)一步擴(kuò)充相關(guān)解釋基于用戶輸入的照片給出相關(guān)問題的答案哪一件是紅色條紋的……是在圖片右側(cè)的那件……另一件衣服是什么樣的……另一件衣服是藍(lán)白色條紋……2.5.3

GPT-4商業(yè)應(yīng)用:提供專業(yè)且個(gè)性化的服務(wù)Khan

Academy:結(jié)合GPT-4的教育平臺(tái)Khan

Academy是一個(gè)非盈利的教育平臺(tái)。其2022

年開始測試最新版本的

Open

AI

語言模型,將向部分參與者提供

Khanmigo

試點(diǎn)計(jì)劃。結(jié)合GPT-4打造的

Khanmigo

AI助手可以為學(xué)習(xí)者提供定制化的教育以及為教師提升工作效率。為學(xué)習(xí)者提供定制化教育:GPT-4像人類一樣多輪對話的能力使得Khan

Academy

能夠向每個(gè)學(xué)生提出個(gè)性化的問題,以促使其更深入地學(xué)習(xí)。如下左圖所示,學(xué)習(xí)者向Khanmigo

詢問數(shù)學(xué)題時(shí),Khanmigo沒有直接給出答案,而是通過問題的形式一步步引導(dǎo)學(xué)習(xí)者回憶學(xué)過的知識(shí),并提供解決問題的思路。這樣能夠使學(xué)習(xí)者更加深入地思考,達(dá)到更好學(xué)習(xí)效果。為教師提高工作效率:教師可以利用Khanmigo編寫課堂提示或?yàn)檎n程創(chuàng)建教學(xué)材料。如下右圖所示,Khanmigo通過問答逐步了解教師想法和課程進(jìn)度,而后為教師提供教學(xué)設(shè)計(jì)的方案。圖:Khanmigo一步步引導(dǎo)學(xué)生回答問題 圖:Khanmigo幫助教師設(shè)計(jì)教學(xué)方案學(xué)生咨詢一道算數(shù)問題資料來源:Open

AI,中信建投Khanmigo引導(dǎo)學(xué)生思考計(jì)算的順序Khanmigo逐步了解教師想法和相關(guān)課程進(jìn)度,協(xié)助教師進(jìn)行教學(xué)方案設(shè)計(jì)2.5.4

GPT-4商業(yè)應(yīng)用:提升組織運(yùn)行效能Stripe:結(jié)合GPT-4的支付平臺(tái)Stripe是一個(gè)支付平臺(tái),借助GPT4的能力進(jìn)行更好地服務(wù)客戶、回答技術(shù)問題以及識(shí)別虛假信息。在客戶服務(wù)方面,Stripe發(fā)現(xiàn)部分客戶會(huì)隱藏它們的網(wǎng)站,因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論