人工智能大模型時代的機(jī)遇和挑戰(zhàn)_第1頁
人工智能大模型時代的機(jī)遇和挑戰(zhàn)_第2頁
人工智能大模型時代的機(jī)遇和挑戰(zhàn)_第3頁
人工智能大模型時代的機(jī)遇和挑戰(zhàn)_第4頁
人工智能大模型時代的機(jī)遇和挑戰(zhàn)_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、什么是智能?什么是人工智能?(一)人類對自身智能的認(rèn)知仍然有限整個人類的發(fā)展歷史,其實就是一個進(jìn)化的歷史。幾百萬年前環(huán)境的變化驅(qū)動了人類的進(jìn)化,從類人猿到直立行走,到會使用工具,到進(jìn)入工業(yè)化時代,到今天的智能化時代,都是環(huán)境的改變驅(qū)動人類的進(jìn)化,進(jìn)化驅(qū)動大腦的發(fā)育,發(fā)育驅(qū)動大腦的進(jìn)化。人的智能是從哪里來?或者說人的智慧從哪里來?人類慢慢知道大腦是人類智能的中樞控制系統(tǒng)。因為大腦有神經(jīng)系統(tǒng),可以控制我們的思維,控制我們的行動,控制我們的學(xué)習(xí)能力等。大腦是思維的一個中樞系統(tǒng),但是真正讓人類進(jìn)化和改變世界其實是靠我們這雙手,手是智能的外化。也就是說,實際上是手使用工具,大腦只是思維和思考,真正去執(zhí)行,去使用技術(shù),還是依賴我們這雙手。從使用簡單的智能工具,到使用工業(yè)革命之后的機(jī)械化工具,到現(xiàn)在使用互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng),都離不開這雙手。驅(qū)動人類智能進(jìn)化的核心是語言。我們今天講的大模型,其實最早就是大語言的模型,是多模態(tài)的模型。語言也是智能的關(guān)鍵。生物也有智能,包括低等生物都有智能,但是所謂的人類的高級智能,是因為我們有語言。語言是我們交流的工具、知識的載體,或者是傳遞的載體,它是智能進(jìn)化的一個關(guān)鍵,它讓我們表達(dá)、交流,驅(qū)動技術(shù)的發(fā)展。其實從人類有意識開始,大家就在想,能不能用人工去模擬我們的智能?古典哲學(xué)家有一個基本的假設(shè),所謂的人工智能能不能實現(xiàn)?人類的思考過程、思維過程,大腦怎么運(yùn)作的?能不能符號化、機(jī)械化?因為只有符號化、機(jī)械化,人才能用機(jī)器替代它。但是很可惜的是,人類其實對自身智能的認(rèn)知非常有限?,F(xiàn)在腦科學(xué)的研究僅僅停留在大腦有各種各樣的區(qū)域,這些區(qū)域有的控制我們的記憶,有的控制我們的學(xué)習(xí)能力,有的控制我們的推理能力,有的控制我們的語言能力,各個區(qū)域有一定分工。人類大腦雖然有800億到900億的神經(jīng)元,這個神經(jīng)元驅(qū)動我們大腦的整個思維過程,但是大象可能有2000多億的神經(jīng)元,但它為什么沒有人聰明?科學(xué)家說人類更多的神經(jīng)元是集中在大腦的皮質(zhì)層,皮質(zhì)層幫助我們有很強(qiáng)的學(xué)習(xí)能力、推理能力等。所以,我們對人類智能的認(rèn)知還是非常有限,我們并不清楚大腦是怎么工作的。(二)從功能主義角度去模擬人類的智能那么人工智能假設(shè)就有問題了,我們不知道大腦怎么工作的,怎么對它做符號化、機(jī)械化呢?其實沒有關(guān)系,我們從功能主義的角度去模擬人工智能。首先,我們不要求對人類的認(rèn)知過程、人腦的運(yùn)轉(zhuǎn)機(jī)理有完整的了解,我們試圖用符號化、機(jī)械化的方式模擬這些能力就可以了。人類有哪些智能呢?人類有感知能力,有各種感官系統(tǒng),通過眼睛、耳朵、皮膚,我們可以感知到外部的世界,獲取外部世界的信息;我們有抽象能力、記憶能力、學(xué)習(xí)能力等,再進(jìn)一步高級智能,我們有推理能力、決策能力、語言能力、類比能力、創(chuàng)造能力等,這是人類智能的各種能力。盡管我們現(xiàn)在對人類的認(rèn)知機(jī)理不是那么清楚,但是并不妨礙我們?nèi)ピO(shè)計各種各樣的人工智能系統(tǒng),去仿真或者模擬這樣的能力。馬文·閔斯基是人工智能奠基者之一,1956年達(dá)特茅斯人工智能會議的創(chuàng)始人之一,他認(rèn)為“人工智能就是讓機(jī)器來完成那些由人來做則需要智能的科學(xué)”。就是某一件事如果要人來做,需要某種能力才能完成,通過機(jī)器來做,那就是人工智能。其次,我們不要求人工智能全面地達(dá)到人類的智能水平。如果全面地研究腦科學(xué),研究人腦怎么工作的,怎么全面地去做仿真,我們現(xiàn)在達(dá)不到(這個能力),只能去做模擬,所以我們不需要全面達(dá)到。其實全面達(dá)到也是有問題的,現(xiàn)在很多人說人工智能威脅論,真的全面達(dá)到可能會產(chǎn)生威脅。所以我們只要它做事就可以了,不需要它具有意識,不需要它具有情感。當(dāng)然這個情感、意識等,很多科學(xué)家也在做相關(guān)研究了。鳥類也有智能,它的腦袋只有幾克重量,但鳥的智能水平也挺高,它在樹林穿梭絕對不會碰到一片樹葉,而我們的無人機(jī)現(xiàn)在避障還沒有鳥那么靈活。鳥會做路線規(guī)劃,會做食物辨別,等等,有很強(qiáng)的智能。我們并不知道鳥的大腦的工作原理,不知道它怎么避障,但是并不妨礙我們現(xiàn)在可以做出自主巡航的大飛機(jī)。所以我們可以做一個類比,一個是生物智能,一個是人工智能。我們要用機(jī)器去實現(xiàn)人工智能。機(jī)器實現(xiàn)人工智能有哪些要素呢?比如人類有學(xué)習(xí)能力,那人工智能有學(xué)習(xí)能力,包括深度學(xué)習(xí)能力;人類有聽力,有語言表達(dá)能力,所以人工智能可以語音識別、語音合成;人類有眼睛,那人工智能有計算機(jī)視覺,可以采集各種外部數(shù)據(jù);人類有語言交流表達(dá)能力,所以人工智能有一個研究領(lǐng)域叫自然語言處理;人可以做專家,人工智能以后會有專家系統(tǒng),可以做決策,做推理;人可以做規(guī)劃,比如路線規(guī)劃,那導(dǎo)航就是一個人工智能系統(tǒng),幫我們做路線規(guī)劃;人可以運(yùn)動,機(jī)器人就是仿造人類的運(yùn)動能力。二、人工智能大模型簡介(一)人工智能進(jìn)入大語言模型時代我們通常說1956年是人工智能的元年,經(jīng)過快70年的發(fā)展,其實人工智能已經(jīng)賦能我們生活的方方面面。我們每天都在接觸人工智能的產(chǎn)品,雖然我們有的時候并沒有意識到它的存在,但都在享用人工智能賦能我們生活帶來的便利。人工智能還可以賦能各個行業(yè),即人工智能+X,這個X可能是金融行業(yè)、教育行業(yè)、電力行業(yè)、法律行業(yè)等,包括我們今天的傳媒主題。最近半年,人工智能有一個顛覆性的動作,就是人工智能進(jìn)入大模型時代。這個大模型技術(shù),其實過去幾年一直在發(fā)展。2022年11月30日,OpenAI發(fā)布了ChatGPT,引起了全社會的震撼。ChatGPT為什么影響這么大?因為每一個人都可以使用它,每一個人都可以感受到它的強(qiáng)大。我們可以跟它聊天,跟它討論問題,詢問它一些信息,它可以跟我們的生活息息相關(guān)。它本質(zhì)上是一個自然語言對話方式的人機(jī)交互系統(tǒng)。我們一直想讓機(jī)器跟人類實現(xiàn)自由的交互。ChatGPT在發(fā)布2個月后,全球達(dá)到了1億用戶。有數(shù)據(jù)對比,在全球范圍內(nèi),TikTok9個月達(dá)到了1億用戶,F(xiàn)acebook幾十個月達(dá)到了1億用戶,而手機(jī)用了15年達(dá)到了1億用戶。再往前推,傳統(tǒng)的固定電話,用了75年才達(dá)到了1億用戶。所以ChatGPT這個人機(jī)對話系統(tǒng)帶給大家的震撼力是非常強(qiáng)的。哲學(xué)家維特根斯坦說:語言的邊界就是世界的邊界,知識的邊界。我們從小到大的學(xué)習(xí)過程,其實也是不停地跟父母、跟老師、跟同學(xué)、跟朋友的交流過程,我們學(xué)到了各種知識,了解了這個世界。整個學(xué)習(xí)過程是用語言交流完成的。其實ChatGPT就是做這么一件事情,當(dāng)它把整個語言的知識都學(xué)會,它就能夠了解世界的邊界,了解知識的邊界。更通俗地去解釋這件事,就是人和機(jī)器要互動,要交互。ChatGPT最終完善的版本,應(yīng)該是完全懂人話,說人話?,F(xiàn)在它是能懂點(diǎn)人話,會說點(diǎn)人話。它通過語言交流學(xué)到了各種知識,了解了這個世界之后,它在一定程度上學(xué)會了思考,有一些通用能力,一些創(chuàng)造力。大模型就是這樣。(二)GPT類大模型ChatGPT,CHAT是聊天,GPT是什么?ChatGPT是一個人工智能的對話系統(tǒng),一個互動系統(tǒng),GPT的英文是GenerativePre-trainedTransformer,是生成式的模型。第一個叫Generative(生成),它一個字一個字蹦出來,就像我們說話一樣的,叫生成式。然后它是一個預(yù)訓(xùn)練的Transformer,是一個網(wǎng)絡(luò)結(jié)構(gòu),它本質(zhì)上是語言大模型,實際上是一個詞語接龍的游戲。ChatGPT的參數(shù)規(guī)模是1750億個參數(shù),預(yù)訓(xùn)練的目的就是準(zhǔn)確預(yù)測下一個接龍單詞是什么。基于海量的數(shù)據(jù),經(jīng)過預(yù)訓(xùn)練,ChatGPT擁有相當(dāng)量級的參數(shù)規(guī)模,模型能力已經(jīng)很強(qiáng)大,剩下的是怎么進(jìn)一步馴化它。互聯(lián)網(wǎng)上有很多的數(shù)據(jù),大模型也好,人工智能也好,數(shù)據(jù)是基本要素之一。數(shù)據(jù)經(jīng)過預(yù)測模型,預(yù)訓(xùn)練之后可以得到一個能力很強(qiáng)大的魔獸,但是這個魔獸有的時候不知所措,它不知道每個時間點(diǎn)該完成什么樣的任務(wù),進(jìn)一步經(jīng)過指令學(xué)習(xí),我們可以對它做訓(xùn)練和分工,比如扔給它一堆文字,你幫我翻譯一下,它就做中英翻譯;你幫我寫一段代碼,它就做代碼的生成;你幫我去寫一個新聞稿,它去寫新聞稿。當(dāng)我們把這樣成千上萬的數(shù)據(jù)喂給它,它就知道什么時候該干什么,你只要有一個正確的指令給它,它就知道下一步該做什么,但是這個時候我們還不敢用它,因為有的時候它會亂說,它說的內(nèi)容不符合我們?nèi)祟惖膬r值觀。所以下一步,我們要用人類反饋強(qiáng)化學(xué)習(xí)。我們要訓(xùn)練它說出我們想聽的話,說出符合人類價值觀的話。我們國內(nèi)的各個大模型也在經(jīng)過這幾步的訓(xùn)練。(三)大模型時代走向通用人工智能在過去幾十年,人工智能各個方面已經(jīng)有了巨大的發(fā)展,有了各種各樣的能力,但是之前是專用人工智能,比如說圖像識別,它只能識別人臉,識別路況。現(xiàn)在是通用人工智能,ChatGPT可以做各種任務(wù),可以寫作、聊天、問答、翻譯、編程,甚至可以參加考試。我們通過語言的訓(xùn)練來強(qiáng)化它的學(xué)習(xí)能力,它可以把任務(wù)之間的邊界給打破,這也造就了現(xiàn)在大模型的學(xué)習(xí)能力強(qiáng)。它會現(xiàn)學(xué)現(xiàn)用,會舉一反三,甚至有推理能力。它還有一定的創(chuàng)造能力,所謂AIGC,就是幫助人類生成各種各樣的內(nèi)容,這個內(nèi)容的生成不能是簡單的重復(fù),還要有創(chuàng)造。其實,懂人話和說人話,是從感知智能到認(rèn)知智能的一個巨大發(fā)展。微軟有一篇文章稱ChatGPT是通用人工智能的火花。我們并不能說ChatGPT就是通用人工智能的唯一路徑,但是起碼它點(diǎn)燃了一個火花,或者說可能的一條路徑出現(xiàn)了。ChatGPT+X,就是ChatGPT在各個行業(yè)做一些應(yīng)用和探索,比如跟傳媒行業(yè)的結(jié)合。三、大模型賦能傳媒行業(yè)內(nèi)容生成、交互方式(一)ChatGPT+X:賦能傳媒1.內(nèi)容生成(AIGC)內(nèi)容生成并不是剛剛有的,過去十年一直做這個事情,只不過現(xiàn)在大家對AIGC這個概念提得更多了。其實內(nèi)容生成主要是數(shù)據(jù)源在哪兒。數(shù)據(jù)源有官方數(shù)據(jù)庫、專業(yè)數(shù)據(jù)公司,企業(yè)數(shù)據(jù)庫、互聯(lián)網(wǎng)數(shù)據(jù)、社交媒體、論壇等。2014年美聯(lián)社推出WordSmith,2015年騰訊推出DreamWriter,2016年新華社推出快筆小新。2022年11月30日,ChatGPT出來之后,很多人開始迅速用它創(chuàng)作,其實是快速做了一個推進(jìn)。當(dāng)然這里也會帶來一些問題,比如假新聞,甚至多模態(tài)的創(chuàng)作生成的圖片是AI生成的,我們怎樣審核,這是一個非常重要的課題。2.新的交互方式大模型時代最大的推動,是交互方式的改變。人在幾百萬年的進(jìn)化過程中,人和人交流,人和人互動,對人類社會的發(fā)展起到巨大的作用。計算機(jī)誕生之后,人也在跟機(jī)器自然地互動,而且這幾十年的發(fā)展,人機(jī)互動進(jìn)入了一個新的階段,最早的人機(jī)互動是鼠標(biāo)鍵盤、電腦系統(tǒng),但是我們一直希望人和機(jī)器可以用自然語言做交互,這是最順暢的。我把它歸結(jié)為幾個時代:第一個時代是互聯(lián)網(wǎng)時代,人機(jī)交互是用百度、谷歌,人主動去檢索,我們稱為主動搜索的時代。第二個是移動互聯(lián)網(wǎng)時代,機(jī)器會主動地推個性化的信息給不同的用戶,機(jī)器主動發(fā)起,人類是被動的,所以是被動的內(nèi)容推薦時代。第三個是大模型時代,我們真的實現(xiàn)人機(jī)的互動,雙向的交互,大模型時代最核心的就是多輪的對話交互。這種交互方式的改變給傳媒業(yè)帶來什么變化?(二)人機(jī)雙向交互——視頻媒體的視角人機(jī)交互的方式變化以后,從媒體視角來看,AIGC怎樣創(chuàng)作用戶喜歡的內(nèi)容?怎么滿足用戶個性化的需求?內(nèi)容怎么傳遞給用戶?從內(nèi)容角度來看,用戶在內(nèi)容選擇上,經(jīng)歷了選頻道—關(guān)鍵詞搜索—個性化推薦幾個時代,和人機(jī)交互的演變過程是一樣的。從傳播角度來看,用戶經(jīng)歷了名主播—大眾主播—數(shù)字人主播,下一個階段是什么?下一步就是人機(jī)雙向交互。用戶跟主播做交互,但是主播就一個,怎么能夠響應(yīng)那么多用戶的需求?所以主播也會分身,有數(shù)字分身,不同的用戶需求不一樣,主播的數(shù)字分身可以與不同用戶交互。還有就是用戶之間也變成雙向交互,有點(diǎn)類似于元宇宙的概念。四、大模型的挑戰(zhàn)(一)大模型時代的挑戰(zhàn)大模型還是存在不足,一是沒有可解釋性,缺少透明的機(jī)制。它中間的神經(jīng)網(wǎng)絡(luò)是一個黑盒子,你也不知道它怎么預(yù)測下一次。二是違背事實的一本正經(jīng)的胡說八道,缺少可控機(jī)制。我們說ChatGPT可以懂人話,可以說人話,但是我們希望它不亂說話。三是無法應(yīng)對復(fù)雜的系統(tǒng)任務(wù),缺少符號推理的機(jī)制。人是有一些結(jié)構(gòu)化知識的,怎么結(jié)合,這個也是一個問題。四是模型無法實時更新,ChatGPT的大模型不能快速更新它的參數(shù),它有一些方法可以去快速更新,但是沒有辦法把它整個模型做一個更新,所以它缺少在線學(xué)習(xí)機(jī)制。五是深層次的編碼機(jī)制,語言編碼和圖像編碼的差異,缺少

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論