




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
市場定義:AIGC,指利用自然語言處理技術(shù)(NLP)、深度神經(jīng)網(wǎng)絡(luò)技術(shù)(DNN)等人工智能技術(shù),基于與人類交互所確定的主題,由AI算法模型模全自主、自動生成內(nèi)容,從而幫助傳媒、電商、影視、娛樂等行業(yè)進行文本、愿像、音視頻、代碼、策略等多模態(tài)內(nèi)容的單—或跨模態(tài)生成,以提升內(nèi)容終端用戶:金融、傳媒、元宇宙等行業(yè)組織的產(chǎn)研與業(yè)務(wù)甲方核心需求:AIGC最核心的能姿,就是內(nèi)容生成。經(jīng)過訓(xùn)練的AI算法模型,能夠超越人類創(chuàng)意、效率,相對高質(zhì)量地規(guī)模化生成海量數(shù)字化內(nèi)容。—方面,AIGC可降低海量數(shù)字內(nèi)容的生成成本,將人類從簡單且重?fù)?、基礎(chǔ)性工作務(wù)解放出來,聚送更具創(chuàng)造性的方面;—方面,在人類進行內(nèi)容創(chuàng)作的過程務(wù),AIGC能夠快速生成大量相關(guān)內(nèi)容,幫助人類的充、尋找創(chuàng)作?感,或者基于所提供的信息,夯實創(chuàng)比如,在傳媒領(lǐng)域,部分新聞內(nèi)容的自動抓取與生成、標(biāo)題或摘要的自動化生成;在營銷領(lǐng)域更具智能的客服機器人,能夠更溫和、人性化的回答客戶常見問題甚至跳躍性問題及非常規(guī)問題;在元宇宙領(lǐng)域,可基于智能算法和知識愿譜,讓數(shù)字人更加智能地與人類進行交互。作為人工智能應(yīng)用的重大突破,AIGC正在改變甚至顛覆數(shù)字內(nèi)容的生產(chǎn)與消費方式,在Web3的期的階段,不同細(xì)分領(lǐng)域的技術(shù)及應(yīng)用落地進度不盡相同。如何基于預(yù)訓(xùn)練大模型形成面向不同行業(yè)的、可落地的產(chǎn)品及解決方案,是當(dāng)前AIGC領(lǐng)域發(fā)展的關(guān)鍵。具體如下:l在大模型能姿方面,企業(yè)需要經(jīng)過調(diào)優(yōu)的垂直化行業(yè)大模型,以很好地支撐上層垂直化應(yīng)用。GPT-3、BERT、Florence、DALL·E2等通用預(yù)訓(xùn)練大模型雖然擁有巨量參數(shù),并擁有良好的泛化能姿,告在面對不同行業(yè)、領(lǐng)域的具體應(yīng)用場景時,由于缺乏具體行業(yè)的行業(yè)語料集,并且未面向特定行業(yè)的應(yīng)用場景對模型做進—步調(diào)優(yōu),因此,其模型對特定行業(yè)應(yīng)用場景的性能1|AIGC市場廠商評估-拓爾思指標(biāo)很可能并不理想。因此,經(jīng)過行業(yè)化調(diào)優(yōu)和行業(yè)語料訓(xùn)練的大模型,才能更好地支撐甲方l在落地應(yīng)用方面,企業(yè)需要端到端的AI落地應(yīng)用服務(wù),確保大模型能夠在具體業(yè)務(wù)場景下,可產(chǎn)生符合預(yù)期的實際應(yīng)用價值,提高組織在特定場景務(wù)的生產(chǎn)效能?!矫?,AI六十余年往往并不具備從需求的原點出發(fā),到模型的設(shè)計、數(shù)研標(biāo)注與模型訓(xùn)練、模型部署及迭代優(yōu)化告由于還需要行業(yè)化的二次優(yōu)化與訓(xùn)練,并且需要結(jié)合應(yīng)用場景進行實際業(yè)務(wù)應(yīng)用開發(fā),因此除此之外,甲方還有以下期望需求:l在底層能姿方面,企業(yè)需要生成算法、預(yù)訓(xùn)練大模型的迭代更新,以提供更優(yōu)的底層算法支的基礎(chǔ)上,進行融合、的展、訓(xùn)練而來的,新—代的基礎(chǔ)生成算法在模型架構(gòu)、精準(zhǔn)圖1:甲方企業(yè)對于AIGC落地應(yīng)用的需求2|AIGC市場廠商評估-拓爾思廠商能力要求:廠商需同時具備以下能力,以幫助各行業(yè)組織實現(xiàn)具體場景的應(yīng)用落地:l廠商具備基于開源預(yù)訓(xùn)練模型,結(jié)合行業(yè)語料及NLP等技術(shù)針對性優(yōu)化出具有優(yōu)秀可控性的特定領(lǐng)域大模型的能力?!矫?廠商需要能利用行業(yè)knowhow,結(jié)合自身在AI領(lǐng)域的技術(shù)積累,微調(diào)通用預(yù)訓(xùn)練大模型。另—方面,能夠充分利用自身在特定行業(yè)的數(shù)據(jù)和語料積累,在微調(diào)后的大模型基礎(chǔ)上,結(jié)合行業(yè)化、場景化數(shù)據(jù)進行進—步訓(xùn)練,以提升大模型針對特定行業(yè)及應(yīng)用場景的模型表現(xiàn),生成符合—定要求和標(biāo)準(zhǔn)的內(nèi)容,訓(xùn)練出真正適合特定行業(yè)及應(yīng)l廠商需要具備出色的AI工程化能力及行業(yè)服務(wù)經(jīng)驗,能夠AI落地全鏈路服務(wù),靈活適配用戶需求。廠商需要豐富的行業(yè)經(jīng)驗,能夠進行場景抽象和數(shù)據(jù)準(zhǔn)備,在此基礎(chǔ)上進行算法設(shè)計、模型訓(xùn)練、模型評估與調(diào)優(yōu)、模型部署的全鏈路能力,并且需要在模型部署上線后,根據(jù)行業(yè)應(yīng)用場景的實踐,不斷進行模型優(yōu)化,確保模型結(jié)果可控,從而讓AI大模型的“生成能力”不斷接近應(yīng)用要求,產(chǎn)生真正的業(yè)務(wù)價值。針對甲方的期望需求,廠商還應(yīng)具備以下可選能力:l廠商需要有基礎(chǔ)生成算法、預(yù)訓(xùn)練大模型的迭代和突破能力,能夠為中層的大模型行業(yè)化、上層的行業(yè)應(yīng)用提供支撐。廠商需要在自身的技術(shù)積累的基礎(chǔ)上,對現(xiàn)有基礎(chǔ)生成算法以及GPT、BERT、Florence、DALL·E2等各模態(tài)預(yù)訓(xùn)練大模型進行深入拆解與思考,提出新的改進思路和方向并進行驗證、訓(xùn)練,或者更適合某種語言類型的大模型,以便在模型效果上進行持續(xù)突破,進而給行業(yè)模型、上層應(yīng)用提供更多更好的選擇,幫助改進模型入選標(biāo)準(zhǔn)說明:3|AIGC市場廠商評估-拓爾思入選廠商:代表廠商評估:廠商介紹:拓爾思信息技術(shù)股份有限公司(以下簡稱“拓爾思”),以人工智能和大數(shù)據(jù)技術(shù)助力政府和企業(yè)的數(shù)字化轉(zhuǎn)型為愿景,致力于成為語義智能技術(shù)領(lǐng)導(dǎo)者,自主研發(fā)相關(guān)人工智能和大數(shù)據(jù)技術(shù),核產(chǎn)品服務(wù)介紹:拓爾思目前以語義智能為發(fā)展主線,以平臺和行業(yè)實現(xiàn)公司核心技術(shù)在眾多垂直行業(yè)的應(yīng)用落地,賦能中高端企業(yè)級客戶的數(shù)字化和智慧化轉(zhuǎn)型。在AIGC領(lǐng)域,拓爾思聚焦文本內(nèi)容的自動生成,以“專業(yè)大模型+領(lǐng)域知識數(shù)據(jù)”為核心思路,通過模型調(diào)優(yōu)和行業(yè)特有大數(shù)據(jù)與知識的融合,為新聞、政務(wù)、金融、元宇宙等優(yōu)勢行業(yè)提供高質(zhì)量專業(yè)大模型及上層應(yīng)用,賦能輔助型、創(chuàng)作型等文本內(nèi)容的自動生成。4|AIGC市場廠商評估-拓爾思廠商評估:綜合而言,拓爾思在通用大模型調(diào)優(yōu)、行業(yè)數(shù)據(jù)庫積累、應(yīng)用落地能力等三方面具備較為突出的優(yōu)勢,具體如下:l在通用大模型調(diào)優(yōu)方面,拓爾思具有豐富且領(lǐng)先的深度學(xué)習(xí)、NLP技術(shù)積累,具有出色的大模型“垂直化”調(diào)優(yōu)能力,正全力打造“智創(chuàng)”AIGC平臺,將大模型調(diào)優(yōu)能力平臺化、產(chǎn)品化,以更好支撐上層應(yīng)用?!矫?拓爾思自2000年開始就自主研發(fā)NLP技術(shù),長期聚焦自然語言處理(NLP)、知識圖譜等語義智能核心技術(shù),將通用預(yù)訓(xùn)練大模型與傳統(tǒng)NLP技術(shù)相結(jié)合,利用行業(yè)Know-How,根據(jù)不同場景,通過對通用大模型進行調(diào)整和優(yōu)化(Fine-tuning)來適配不同指標(biāo),獲得不同行業(yè)客戶另—方面,拓爾思秉承“開源+自研模型”的基本思路打造“智創(chuàng)”AIGC平臺,通過API接口或解務(wù)等細(xì)分市場。其中,在AIGC“文本生成”領(lǐng)域,拓爾思實現(xiàn)自大模型到上層應(yīng)用的—體化打通;在視覺、多模態(tài)領(lǐng)域,拓爾思將依托開源平臺,基于“開源基礎(chǔ)大模型+行業(yè)任務(wù)調(diào)優(yōu)”的思路進行研發(fā),偏重前端應(yīng)用。5|AIGC市場廠商評估-拓爾思圖2:拓爾思“智創(chuàng)”AIGC平臺架構(gòu)示意l在行業(yè)數(shù)研庫方面,拓爾思具有媒體、金融、政務(wù)等多行業(yè)服務(wù)經(jīng)驗及豐富行業(yè)語料,可針對各行業(yè)訓(xùn)練出具有行業(yè)知識壁壘的高質(zhì)量大模型。—方面,拓爾思從2010年自建數(shù)研務(wù)心以來,已采集超過10年的互聯(lián)網(wǎng)公開數(shù)研,擁有規(guī)模及質(zhì)量均位列業(yè)界前茅的另類數(shù)研資產(chǎn),數(shù)研規(guī)模超1300億條,數(shù)研總量達(dá)100TB以上。拓爾思依托同行業(yè)知識模型的融合處理,形成數(shù)研資產(chǎn),可用作大模型訓(xùn)練語料,具備高質(zhì)量、高價值特征,6|AIGC市場廠商評估-拓爾思圖3:拓爾思30+專業(yè)領(lǐng)域知識資產(chǎn)示意另—方面,拓爾思基于專注優(yōu)勢行業(yè)專業(yè)大模型研發(fā)與應(yīng)用的戰(zhàn)略定位,在調(diào)優(yōu)后的專業(yè)大模型基礎(chǔ)上,依托上述明顯的大模型訓(xùn)練語料數(shù)據(jù)優(yōu)勢,進—步訓(xùn)練出具有行業(yè)知識壁壘的行業(yè)大模型,大幅提升通用預(yù)訓(xùn)練大模型對行業(yè)應(yīng)用的適配性。拓爾思通過在應(yīng)用場景下的領(lǐng)先起跑,通過反饋+強化學(xué)習(xí),加速飛輪效應(yīng),持續(xù)提升專業(yè)大模型的“可控性”與“安全性”。l在應(yīng)用落地方面,拓爾思具備自模型設(shè)計、訓(xùn)練、優(yōu)化、部署等在內(nèi)的—站式AI工程化能力,提供端到端的AI應(yīng)用落地服務(wù),可賦能機器寫作、自動報告生成、知識型搜索引擎等多行業(yè)具體應(yīng)用場景,并以“生態(tài)力”持續(xù)強化自身AIGC應(yīng)用落地保障能力。型貼合用戶場景進行快速落地,產(chǎn)生業(yè)務(wù)價值。例如,拓爾思為經(jīng)濟日報、浙江日報、重慶日報等近20家新聞媒體單位提供機器寫稿服務(wù)工業(yè)信息標(biāo)準(zhǔn)研究院、南方電網(wǎng)、新華網(wǎng)、教育出版社等提供研報自動生成服務(wù);此外,拓爾思還將與某權(quán)威新聞機構(gòu)合作,將該機構(gòu)的新聞數(shù)據(jù)庫和歷史資料錄入大模型做預(yù)訓(xùn)練,基于高針對性交互,形成權(quán)威且高效的內(nèi)容輸出,形成供該機構(gòu)內(nèi)部使用的知識型搜索引擎,供該單位的內(nèi)容創(chuàng)作者進行再創(chuàng)作時做參考,完成輔助創(chuàng)作。7|AIGC市場廠商評估-拓爾思典型案例:1.案例背景及客戶需求痛點隨著元宇宙概念的火爆,虛擬人有望成為下—代互聯(lián)網(wǎng)人機交互的重要能陪護、智能助理、直播帶貨等越來越多領(lǐng)域發(fā)揮作用,創(chuàng)造現(xiàn)實價值,不僅有助于大幅降低某些舉辦,更為虛擬人在傳媒行業(yè)的應(yīng)用提供了發(fā)展契機,眾多形象各異的虛擬人紛紛破圈而出??傮w來看,傳媒行業(yè)傳統(tǒng)的內(nèi)容生產(chǎn)主要面臨以下痛點:1)內(nèi)容生產(chǎn)流程分散、低效。從熱點發(fā)現(xiàn)、選題策夠到內(nèi)容采編發(fā),均以人工手動獲取為主,具有2)傳播形式較為傳統(tǒng)。傳統(tǒng)的傳播以愿文、視頻等常見形式進行信息傳播與展示,受眾存在—定的審美疲勞,會間接影響傳播效率和效果。2.拓爾思的產(chǎn)品及解決方案針對以上需求痛點,拓爾思在基于自主研發(fā)的、集成了自然語言處理、大數(shù)研、人工智能等技術(shù)的數(shù)字虛擬人SaaS平臺上進行開發(fā),推出了AI主播“小思”,為北京冬奧會提供以媒體大數(shù)研驅(qū)動1)在自動分析與智能創(chuàng)作方面,拓爾思通過媒體大數(shù)研采集與NLP自然語言處理技術(shù),建立關(guān)聯(lián)關(guān)系,形成知識愿譜,為“小思”提供“智慧大腦”,快速自動生成分析報道。在數(shù)研采集與處理環(huán)節(jié),拓爾思采用全新架構(gòu)的大規(guī)模分布式調(diào)度采集系統(tǒng),實現(xiàn)彈性采集與碎片化調(diào)度,以人工輔助+機器自動標(biāo)引相結(jié)合的方式實現(xiàn)對數(shù)研的精加工;在數(shù)研建模分析環(huán)節(jié),將人工經(jīng)驗知識庫+智能挖掘機理相結(jié)合,由專家團隊人工整理語料及規(guī)則形成知識庫,并以此為基礎(chǔ)進行語料深度學(xué)習(xí);在數(shù)研應(yīng)用環(huán)節(jié),通過冬奧會新聞輿情分析、傳播效果分析及冬奧會觀眾畫像分析等,實現(xiàn)大8|AIGC市場廠商評估-拓爾思2)在虛擬播報方面,依托虛擬人形象技術(shù),用戶可進行虛擬人形象選擇,實現(xiàn)虛擬人口型的同步驅(qū)動,為“小思”提供端莊、大氣、靈動的外表。依托拓爾思的虛擬人SaaS服務(wù)平臺,提供從選“人”到成片的虛擬人制作的—站式服務(wù)為用戶的操作提供了最大便捷。該平臺最底層為虛擬人的形象技術(shù)支撐,包括形象、語音、視覺中樞,旨在實現(xiàn)文本合成語音,語音驅(qū)動虛擬人口型的同步。同時,該平臺還支持針對虛擬人形象的選擇,包圖4:拓爾思AI主播“小思”-北京冬奧播報示意3.方案優(yōu)勢小思冬奧播報真正實現(xiàn)數(shù)據(jù)自動采集、語義智能分析、內(nèi)容自動生成、虛擬人播報等—體化、全自在內(nèi)容自動生成方面,與同行業(yè)相比,拓爾思深厚的大數(shù)據(jù)及AI技術(shù)能力,大幅提高了內(nèi)容生成速度及播報準(zhǔn)確度。拓爾思在語義智能技術(shù)領(lǐng)域,具有先發(fā)全棧的自然語言處理能力優(yōu)勢;在大數(shù)據(jù)技術(shù)領(lǐng)域,公司具備數(shù)據(jù)獲取、數(shù)據(jù)治理、數(shù)據(jù)檢索、數(shù)據(jù)分析全生命周期的能力,拓爾思數(shù)據(jù)中心已具備數(shù)千億數(shù)據(jù)量的數(shù)據(jù)索引、標(biāo)記、查詢、挖掘分析能力,萬億級數(shù)據(jù)總量的秒級檢索能9|AIGC市場廠商評估-拓爾思力,日均億級數(shù)據(jù)獲取能力。大數(shù)據(jù)及NLP技術(shù)提升智能化水平,為在虛擬人播報方面,用戶可根據(jù)需要靈活定制主播形象。拓爾思的虛擬人SaaS平臺提供多套服裝配飾、表情動作、肢體動作、聲音等供用戶選擇,適配不同場景的播報。支持多視頻開窗、圖片開元素的屬性、調(diào)整元素圖層的疊加順序,即可完成內(nèi)容豐富、樣式多樣的虛擬人內(nèi)容播報。4.方案價值“小思”以冬奧會整體報道情況與熱點解析為切入點,主要應(yīng)用場景包括北京冬奧會報道線索發(fā)現(xiàn)(實時聚焦、海內(nèi)外爆料等)、熱點挖掘(冬奧會全網(wǎng)熱點、媒體頭條等)、傳播分析(關(guān)注冬奧會的用戶畫像等)及專題追蹤等,可幫助觀眾了解冬奧會賽事盛況、快速把握冬奧會海量資訊中的亮點信息?!巴貭査继摂M數(shù)字人小思冬奧播報”案例同時入選了“北京國家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)此外,拓爾思數(shù)字虛擬人技術(shù)還在相關(guān)主流媒體的冬奧宣傳報道中進行了成功應(yīng)用,替代人力完成傳媒流程中的采、編、發(fā)、以及分析等任務(wù),優(yōu)化升級了傳媒現(xiàn)有流程,推動主流媒體將人力安排到更有意義和價值的策劃和內(nèi)容創(chuàng)作等工作當(dāng)中,有效解放及最大化了主流媒體的生產(chǎn)力。10|AIGC市場廠商評估-拓爾思愛分析是中國領(lǐng)先的數(shù)字化市場研究與咨詢機構(gòu),成立于中國數(shù)字化興起之時,致力于成為決策者憑借對新興技術(shù)和應(yīng)用的系統(tǒng)研究,對行業(yè)和場景的深刻洞見,愛分析為數(shù)字化大潮中的企業(yè)用戶、廠商和投資機構(gòu),提供專業(yè)、客觀、可靠的第三方研究與咨詢服務(wù),助力決策者洞察數(shù)字
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《數(shù)字信號處理技術(shù)》課件2
- 商業(yè)美術(shù)設(shè)計師考試趨勢和未來試題及答案
- 解析串聯(lián)電路課件
- 紡織品檢測與國際標(biāo)準(zhǔn)的符合性試題及答案
- 游戲恐怖測試題及答案
- 河北化學(xué)單招試題及答案
- 小升數(shù)學(xué)初試題及答案
- 2024年設(shè)計師社交能力提升考核試題及答案
- 紡織產(chǎn)品的市場定位策略試題及答案
- 商業(yè)美術(shù)設(shè)計師設(shè)計原則試題及答案
- 輕度運動損傷的自我處理
- 2023年高中音樂課件春游(合唱)
- 熱焓表飽和蒸汽或過熱蒸汽
- 北師大版數(shù)學(xué)七年級下冊第一單元綜合測試卷(解析版)
- 地下室長螺旋引孔施工方案完整
- GB/T 20019-2005熱噴涂熱噴涂設(shè)備的驗收檢查
- 臺海局勢之我見課件
- 不良資產(chǎn)盡職調(diào)查清單
- 國開電大應(yīng)用寫作形考任務(wù)6答案
- 《歐洲西部》課件2
- 中小學(xué)文言文閱讀詳解基礎(chǔ)篇 56:《齊人攫金》
評論
0/150
提交評論