2023中國人工智能系列白皮書：AI+Art

上傳人：1*** IP屬地：山西上傳時(shí)間：2024-12-31 格式：DOCX 頁數(shù)：428 大?。?.15MB 積分：19.9 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩423頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

委1 1 1 39 43 43 45 57 60 63 68 75 76 2 82 84 94 148 169 171 174 178 185 190 194 195 202 208 230 3 1AI大模型成為一訓(xùn)多能的人工智能算法基礎(chǔ)設(shè)施，2019年以來模型泛化求解能力大幅提升，成為產(chǎn)業(yè)主流技術(shù)路線。AI大模型是“人工智能預(yù)訓(xùn)練大模型”的簡稱，包含了“預(yù)訓(xùn)練”和“大模型”兩層含義?！按竽Ｐ?小模型”逐步成為產(chǎn)業(yè)主流技術(shù)路線，驅(qū)動(dòng)全速發(fā)展，AI模型技術(shù)的成熟無疑將為數(shù)字藝術(shù)帶來更廣闊的發(fā)展空面向藝術(shù)創(chuàng)作者的AI大模型的創(chuàng)作方法論，供多維度的建議。同時(shí)積極探索運(yùn)用AI大模型將數(shù)字藝術(shù)延伸到屏2同應(yīng)用場(chǎng)景下對(duì)算法的表現(xiàn)進(jìn)行研究和分析，可以使人們不斷反思術(shù)的數(shù)字化轉(zhuǎn)型，進(jìn)而推動(dòng)中國式現(xiàn)代化進(jìn)程。因此，藝術(shù)深度融合將成為文化數(shù)字化建設(shè)的重要方向，這也是研究AI在國家此白皮書旨在強(qiáng)調(diào)跨學(xué)科和文理貫通的精神，將文化發(fā)展和AI統(tǒng)一在人文精神框架下，反思科技發(fā)展對(duì)人的精神和社會(huì)心理的影創(chuàng)新。在藝術(shù)學(xué)科重視AI技術(shù)發(fā)展史，通過了解AI使數(shù)字藝術(shù)創(chuàng)作來到了新的階段，國內(nèi)外大模型已經(jīng)具有極爭(zhēng)的新賽道已儼然從技術(shù)路線和成果的比拼轉(zhuǎn)向賦能文化數(shù)字化的國文化藝術(shù)數(shù)字化生產(chǎn)的邏輯和需求。需要加強(qiáng)技術(shù)、3在2023年酷暑之下，猶如精心雕琢每一件藝術(shù)品的雕刻師，傾心打1第1章AI與藝術(shù)：歷史和技術(shù)發(fā)展。1945年7月，《大西洋月刊》（TheAtlantic）發(fā)表了美國工程師和科學(xué)家萬尼瓦·布什（VannevarBush）的文章《誠如所思》（AsWeMayThink），他在戰(zhàn)爭(zhēng)期間擔(dān)任聯(lián)邦科學(xué)研究與發(fā)展球可訪問的數(shù)據(jù)庫成為如今熟知的互聯(lián)網(wǎng)。1946年，賓夕法尼亞大學(xué)展示了占據(jù)了整個(gè)房間的世界上第一臺(tái)被稱為ENIAC（電子數(shù)值1960年代對(duì)數(shù)字技術(shù)的歷史尤為重要，這一時(shí)期為當(dāng)今的大部分技術(shù)及其藝術(shù)探索奠定了基礎(chǔ)。布什的基本思想由西奧多·納爾遜2擇自己的路徑。他的概念顯然預(yù)見了互聯(lián)網(wǎng)上文件和消息的網(wǎng)絡(luò)傳1960年代末，計(jì)算機(jī)技術(shù)和文化中的另一個(gè)重要概念誕生了：當(dāng)今信息空間和圖形用戶界面的先驅(qū)。1968年底，斯坦福研究所的道格拉斯·恩格爾巴特（DouglasEngelbart）提出了位圖（Bitmap）、把流經(jīng)計(jì)算機(jī)處理器的電子信號(hào)和計(jì)算機(jī)屏幕上的圖像之間建立了），以用手直接操縱這個(gè)空間。由恩格爾巴特和伊萬·薩瑟蘭提出概念，艾倫·凱（AlanKay）和加利福尼亞帕洛阿爾托施樂PARC的一組研究人員進(jìn)一步開發(fā)的交互式顯示圖形程序Sketchpad對(duì)于開創(chuàng)計(jì)算果公司推出其Macintosh計(jì)算機(jī)而普及。雖然計(jì)算機(jī)和數(shù)字技術(shù)在1960年代和70年代絕非無處不在，但人們感覺它們將改變社會(huì)。3字計(jì)算進(jìn)步背后的理論和概念產(chǎn)生了興趣。1950年代和60年代見證大量藝術(shù)家所創(chuàng)作的參與性藝術(shù)或技術(shù)藝術(shù)。約翰·凱奇、艾倫·卡普羅和激浪派；愛德華多·保羅齊（Eduar爾頓（RichardHamilton）、威廉·特恩鮑爾（WilliamTurnball）等人所代表的“獨(dú)立團(tuán)隊(duì)”（IndependentGroup/IG）；奧托·皮恩（Otto）；朗索瓦·莫雷萊（Fran?oisMorellet）、胡里奧·勒帕克（JulioLePa等人為代表的GRAV視覺藝術(shù)研究組（GroupedeRecherchedArt魯弗(BillyKlüver)想要在工程師和藝術(shù)家之間建立起他所描述的有效合作關(guān)系，他在貝爾實(shí)驗(yàn)室創(chuàng)立了藝術(shù)與技術(shù)實(shí)驗(yàn)（EAT）。克魯弗與安迪·沃霍爾、羅伯特·勞森伯格、讓·廷格利、約翰·凱奇和賈斯珀·約翰斯等藝術(shù)家共同開發(fā)了項(xiàng)目。這些項(xiàng)目大多首次出現(xiàn)在邁克爾·諾爾（MichaelNoll）、馬克斯·馬修斯（Ma蓮·施瓦茨（LillianSchwa1960年代還舉辦了以藝術(shù)與新興技術(shù)之間關(guān)系為中心的重要展覽。1961年至1973年間在為克羅地4次展覽（Tendencije4(1968-69)）的一部分，突出了計(jì)算機(jī)作為藝術(shù)創(chuàng)作的媒介。前兩次計(jì)算機(jī)藝術(shù)展覽于1965年舉行，2月在德國斯后于4月舉辦了由貝拉·朱萊斯（BelaJulesz）和邁克爾·諾爾在紐約霍華德·懷斯畫廊的展覽。盡管他們的作品類似于抽象繪畫，并且似美學(xué)。1968年，倫敦當(dāng)代藝術(shù)學(xué)院舉辦的《CyberneticSerendipity器人”的作品，這些作品在今天看來可能顯得笨重且過于技術(shù)化，但家和評(píng)論家杰克·伯納姆（JackBurnham）在紐約猶太博物館（theJewishMuseum）組織了展覽《軟件——信息技術(shù)》（Software-約瑟夫·科蘇斯（JosephKosuth）、白南準(zhǔn)（NamJunePaik）、勞倫斯·韋納（LawrenceWeiner）等藝術(shù)家的作品之外，該展覽還展示了的原型。561970年代的藝術(shù)家使用當(dāng)時(shí)的新技術(shù)，例如視頻和通訊衛(wèi)星，點(diǎn)從應(yīng)用衛(wèi)星進(jìn)行電視廣播的大規(guī)模傳播，視頻電話會(huì)議的審美潛爾文獻(xiàn)展上，道格拉斯·戴維斯（DouglasDavis）組織了一次向超過25個(gè)國家和地區(qū)進(jìn)行的衛(wèi)星電視轉(zhuǎn)播。其中包括戴維斯本人、白南準(zhǔn)、激浪派藝術(shù)家和音樂家夏洛特·穆爾曼以及德國藝術(shù)家約瑟夫伊斯（JosephBeuys）的表演。同年，紐約和舊金山藝術(shù)家合作建立星舞蹈表演——一場(chǎng)由美國東西海岸的表演者參與的三地點(diǎn)現(xiàn)場(chǎng)直7和2000年代將繼續(xù)多樣化，從更面向?qū)ο蟮淖髌返桨瑒?dòng)態(tài)和交互方面的作品。隨著1990年代中期萬維網(wǎng)（WWW）的出現(xiàn)，數(shù)字藝種形式的總稱。在2000年代初期，網(wǎng)絡(luò)藝術(shù)進(jìn)入了一個(gè)新階段，藝8電子游戲時(shí)，逐漸熟悉游戲玩法的過程就是了解游戲背后算法的過么連接這4個(gè)點(diǎn)有多少種不同的方法呢？我們可以利用排列組合方那么南極洲的降雪和北極的溫度呢？人工智能則擅長從數(shù)據(jù)中尋找9題是知識(shí)圖譜（Knowledge-Graph），用數(shù)學(xué)可視化的方法表現(xiàn)一組作用是幫助我們發(fā)現(xiàn)隱藏的規(guī)律，并將這些信息歸納整理并表示出聲.mp3”。隨著素材量逐漸地增多這種歸納方法會(huì)逐漸失效，比方如一個(gè)點(diǎn)都代表著一種聲音，每個(gè)點(diǎn)之間的距離則代表聲音的相似程現(xiàn)在還可以大膽假設(shè)這個(gè)知識(shí)圖譜系統(tǒng)中儲(chǔ)存的是從藝術(shù)史里作曲家的樂譜以及指揮家的解讀是指導(dǎo)樂手演奏的兩個(gè)主要外莫阿比特區(qū)前電車棚的大廳舉辦了一場(chǎng)由180多位音樂家同時(shí)舉辦Mix）》，也是后現(xiàn)代主義“重新混合（Remix）”的集中表現(xiàn)——把全理解作品的可能性接近于零。池田借用人難以投出相同落點(diǎn)的小2016年紐約現(xiàn)代藝術(shù)博物館在埃德加·德加的展覽中展出的不斷推演。Grasshopper是一種三維參數(shù)化設(shè)計(jì)軟件，這種軟件大但把部分的“如何”也就是過程的一部分交由數(shù)字程序負(fù)責(zé)構(gòu)建一個(gè)這位藝術(shù)家從德國移民到美國很久之后制作的，他曾在包豪斯研究了將不同顏色彼此相鄰放置所引起的色調(diào)形致敬”和“變體”系列的作品中，他制定了嵌套彩色正方形和矩形的界所研究。JohnF.SimonJr.的ColorPanelv1.0向他的學(xué)生提出的“透明度問題”的程序版本，要求他們混合中間顏基于指令和規(guī)則的實(shí)踐，是數(shù)字藝術(shù)的發(fā)展歷史的重要脈絡(luò)之規(guī)則是創(chuàng)造藝術(shù)的過程的想法也與構(gòu)成所有軟件和每個(gè)計(jì)算機(jī)操作將作品的執(zhí)行留給藝術(shù)家以外的人是勒維特概念藝術(shù)概念的核卡西·瑞斯(CaseyReas)創(chuàng)造了一款類似于勒維特壁畫的軟件。瑞斯的軟件會(huì)執(zhí)行諸如“創(chuàng)建一個(gè)充滿一百個(gè)中小圓圈的表面”，“每個(gè)圓圈都有不同的大小和方向”，“以相同的緩慢速度移動(dòng)”這樣的指將指令、規(guī)則變成算法的過程。瑞斯還與本·弗萊（BenFry）一起創(chuàng)1960年代，像觀念藝術(shù)那樣基于指令的實(shí)踐幾乎是與藝術(shù)家開弗（JamesShaffer）合作使用IBM7094（被認(rèn)為是1960年代早期用于雙子星和阿波羅太空計(jì)劃，也被用于早期的導(dǎo)彈防御系統(tǒng)。用來驅(qū)動(dòng)鼓式繪圖儀，例如繪制一條線需要包含的信息有何時(shí)拿起、式的特點(diǎn)是非響應(yīng)式的，也就是說系統(tǒng)其實(shí)并不知道自己在畫什么，樂家和表演者團(tuán)體所舉辦的“事件”（happenings），這些“事件”通常世界運(yùn)行規(guī)律的理解，強(qiáng)調(diào)順勢(shì)而為。凱奇于1952年首演的作品《433》可說獨(dú)樹一幟、最具代表性。這部作品首演為鋼琴演出，它位聽眾，其實(shí)沒有所謂絕對(duì)的無聲。又如他以《易經(jīng)》（Bookofchanges）為名的作品《MusicofChanges》，將聲音與樂譜的關(guān)系交觀念藝術(shù)。借無為的思維，這對(duì)后結(jié)構(gòu)主義式羅蘭·巴特“作者已死”維特（SolLeWitt）合作，由菲利普·格拉斯（PhilipGlass）配樂。在的結(jié)構(gòu)。這應(yīng)和了前文提到的對(duì)于規(guī)則不間斷的重復(fù)，將引出變化。一體。勞倫斯·韋納（LawrenceWeiner）和約瑟夫·科蘇斯（JosephKosuth）的文字類作品都揭示了這一點(diǎn)。韋納的《HERETHERE&EVERYWHERE》（1989）由四個(gè)文本片段組成，通過直白的文本讓觀眾展開關(guān)于地點(diǎn)的想象?？铺K斯的《綠色霓虹燈中的五個(gè)字》（1965年）則直接用綠色霓虹燈拼出作品的標(biāo)題，使用語言作為材料和媒介。在2000年左右流行的數(shù)字藝術(shù)中，很多藝術(shù)家選擇直接直白的展示作品的代碼一樣，觀眾直接看到的正是創(chuàng)作作品的語言。線表示觀眾如何逐行閱讀代碼，白線表示佩利是如何編寫代碼的，），），），際上當(dāng)用戶獲取進(jìn)入（access）某軟件時(shí)，它自動(dòng)地提供了一些修改如，一個(gè)我們每天都在自己的智能手機(jī)上使用的技術(shù)——觸摸屏幕，不然，例如，“雙指并攏然后分開”這一每天都在使用的“放大”技能，達(dá)到對(duì)原始照片進(jìn)行操控（Manipulation）的目的。例如，圖像識(shí)別通過圖像識(shí)別筆刷在畫面上涂抹，產(chǎn)生一組組形似但其實(shí)不同的照片。在這些圖像產(chǎn)生的過程中，Photoshop依據(jù)自己的內(nèi)在算法邏輯孔卡正是受到此的影響，只不過打孔卡所承載的不僅僅是編織的方進(jìn)一步的實(shí)踐是用復(fù)雜的算法構(gòu)建一種生態(tài)系統(tǒng)即不同的算法生物電子信號(hào)實(shí)際上包含兩種，模擬與數(shù)字。從時(shí)間上來看，1960年代模擬電路在電路中對(duì)信號(hào)的放大和削減是通過元器件的放大特性來這里我們可以把模擬與數(shù)字的區(qū)別對(duì)應(yīng)到故障藝術(shù)中產(chǎn)生故障1960年代的前數(shù)字化作品大多將注意力集中在將電子信號(hào)作為《磁鐵電視（MagnetTV）》(1965)中，將一塊工業(yè)大小的磁鐵放），燈既能產(chǎn)生光又能對(duì)其做出反應(yīng)。動(dòng)能是身體通過運(yùn)動(dòng)而擁有的能），數(shù)字動(dòng)態(tài)圖像和數(shù)字電影的概念是由多種媒體藝術(shù)的歷史和實(shí)基于手繪圖像并通過前電影設(shè)備，如西洋鏡和活動(dòng)電影放映機(jī)數(shù)字媒體的新可能性獲得了新的發(fā)展動(dòng)力。1960年代，老莉蓮·施瓦茨（LillianSchwartz）則創(chuàng)作了三部開創(chuàng)性的電影。在她的電影《英格瑪（Enigma）》(1972)中，施瓦茨使用編程宏語言規(guī)律。在這個(gè)過程中，他將動(dòng)態(tài)圖像從其原始背景中解放出來。“重），頻道共有三段較長的視頻：麗貝卡·艾倫（RebeccaAllen）受發(fā)電站樂隊(duì)（Kraftwerk）委托為其音樂視頻《音樂永不停（MusiqueNon-Stop）》(1986)制作的電腦動(dòng)畫；第二段是大衛(wèi)·鮑伊（DavidBowie）演唱《在憤怒中回看（LookBackInAnger）》，并由露易（LaLaLaHumanSteps）伴舞（錄音來自白南準(zhǔn)1988年的衛(wèi)星連），的影射。則的角度審視一番。1989年，白南準(zhǔn)在完成惠特尼首展的布展工作后，給官方留下了作品的圖紙——圖紙對(duì)于作品的維護(hù)是很有必要是在執(zhí)行規(guī)定的時(shí)候他還在嘗試變化。這是一種騎墻左右搖擺的感到藝術(shù)家對(duì)于將圖像重新在空間內(nèi)編排做的嘗試。冰島藝術(shù)家斯提吉姆·坎貝爾（JimCampbell）的《傾斜的平面（斜的燈光平面上將顯示的鳥類起飛和降落的二維視頻抽象成了一種坎貝爾更早期的創(chuàng)作，如上面的《模棱兩可的圖標(biāo)#1奔跑跌圖標(biāo)#1奔跑跌倒（AmbiguousIcon#1RunningFalling）》相比，又名《人和他的房子（Clovekajehodum）》，被認(rèn)為是世界上第一（1979-84）是第一件在光盤上的交互式藝術(shù)品。在一個(gè)房間（洛娜我們可以從恰因切拉和利森的作品中看到，當(dāng)技術(shù)允許的情況順序，同時(shí)還能自動(dòng)選擇音樂曲目。這些元素都是從媒體數(shù)據(jù)庫中藝術(shù)家對(duì)于技術(shù)偏見的討論實(shí)際上遠(yuǎn)遠(yuǎn)早于人工智能時(shí)代。門（KatherineMoriwaki）合作的《美國沒有天賦（America'sGotNo技術(shù)在藝術(shù)創(chuàng)作中的“作者性”不僅體現(xiàn)在上文提到的引入可能行文化和創(chuàng)造思維帶來的影響不僅僅是方便快速。亨利·詹金斯治漫畫的一種草根階層的等同物——嘗試將話題性的關(guān)注封裝進(jìn)強(qiáng)有力的圖像當(dāng)中。Photoshop的出現(xiàn)允許小規(guī)模的團(tuán)體以較低的花費(fèi)這些觀點(diǎn)在2008年大選中被再一次驗(yàn)證。奧巴馬在互聯(lián)網(wǎng)上傳播。雖然在2008年社交網(wǎng)絡(luò)的用戶量只有今日的十分的DIY網(wǎng)站和教程也如雨后春筍般涌現(xiàn)。這一切可以為接下來的兩艾瑪利亞·烏爾曼（AmaliaUlman）的社交網(wǎng)絡(luò)（Instagram）自拍項(xiàng)目展現(xiàn)了她在社交媒體上創(chuàng)建的一個(gè)虛擬片，更不是單純地探討自拍與相機(jī)之間的關(guān)系。在她的這組作品中，流行的自拍，通過與平臺(tái)上粉絲的互動(dòng)、Hash有社交網(wǎng)絡(luò)用戶分享照片模式的復(fù)制，她成功地塑造出一個(gè)虛擬的、變更，在Facebook上表演了一次自己退出Facebook的和布利斯的作品體現(xiàn)的是技術(shù)以一種平臺(tái)的形式介入藝術(shù)創(chuàng)作的過改變著藝術(shù)創(chuàng)作的過程和結(jié)果，假設(shè)Instagram沒有設(shè)計(jì)“評(píng)論照片”以被定義為通過利用其媒體的關(guān)鍵特征或通過反思其性質(zhì)和影響來和70年代，數(shù)字藝術(shù)主要包括算法繪圖，其中藝術(shù)家編寫代第2章AI與藝術(shù)創(chuàng)作（生成藝術(shù)）種相似性部分來自數(shù)據(jù)可視化和計(jì)算機(jī)圖形學(xué)中的那些模擬世界里術(shù)史上看，現(xiàn)代藝術(shù)中的多個(gè)藝術(shù)思潮都為生成藝術(shù)構(gòu)建了理論框上面對(duì)生成藝術(shù)所作的簡略定義是嚴(yán)謹(jǐn)?shù)膯?？生成藝術(shù)只能存機(jī)器、算法或基因序列來設(shè)計(jì)系統(tǒng)，以生成作為藝術(shù)品的最創(chuàng)作的藝術(shù)案例可以追溯到舊石器時(shí)代中期。1999年，考古學(xué)家發(fā)現(xiàn)了一塊石雕，其特點(diǎn)是刻在石頭上的網(wǎng)格系統(tǒng)可以追溯到70000術(shù)來創(chuàng)造以前人類無法實(shí)現(xiàn)的東西。在此，我們應(yīng)該把這種“無法實(shí)現(xiàn)”理解的個(gè)體化一些，例如一位私營企業(yè)主并不具備繪制插圖和設(shè)助于掌握相應(yīng)技術(shù)的專業(yè)人士。當(dāng)今人工智能這樣的復(fù)雜系統(tǒng)的發(fā)展，就如同2000年之后Photoshop為代表的圖像編輯軟件的普及對(duì)樣的“人工DNA”的使用定義了一種生成藝術(shù)的方法。這個(gè)領(lǐng)域的研世紀(jì)末就開始出現(xiàn)。像保羅·塞尚這樣的藝術(shù)家，他們的作品為立體最早的生成藝術(shù)實(shí)踐者之一。與攝影的命運(yùn)類與藝術(shù)相去甚遠(yuǎn)。近年來，人們則越來越接受一種生成性的藝術(shù)方法。今天，生成性素描、繪畫、動(dòng)畫和詩歌在世界各地的博物館和個(gè)人收藏中展出。例如，特納獎(jiǎng)獲得者基思·泰森（KeithTyson）構(gòu)），始在藝術(shù)和計(jì)算機(jī)科學(xué)的中間地帶嘗試使用房間大小的計(jì)算機(jī)進(jìn)行夠?yàn)橐曈X藝術(shù)進(jìn)行編碼的計(jì)算機(jī)程序，例如DesignbyNumbers和能技術(shù)的突破，使得基于人工智能技術(shù)的生成藝術(shù)得到了進(jìn)一步發(fā)AIGC是一個(gè)涵蓋人工智能和生成性創(chuàng)造力領(lǐng)域的綜合性概念。擬人類創(chuàng)造性思維的能力。在國際上，它與人工智能合成媒體字化場(chǎng)景轉(zhuǎn)型，進(jìn)一步推動(dòng)了AIGC技術(shù)的應(yīng)用和發(fā)展。內(nèi)容編輯能力具備對(duì)現(xiàn)實(shí)世界內(nèi)容進(jìn)行語義理解1亞馬遜云科/cn/campaigns/aigc/?refid=45d0b9972維基百科：“人工智能合成媒體（AI-generatedMedia或S/wiki/Synthetic律，從而進(jìn)行自主決策和創(chuàng)造。在AIGC的發(fā)展初期，生成性模型Networks）和VAE（VariationalAutoencoders）等。這些模型通過學(xué)習(xí)真實(shí)樣本數(shù)據(jù)的分布，能夠生成新的、以假這些模型是基于大量數(shù)據(jù)進(jìn)行預(yù)先訓(xùn)練的，通常被稱為基礎(chǔ)模型型GPT4或BLOOM，可以執(zhí)行跨多個(gè)領(lǐng)域的多種任務(wù)，例如撰寫博客文章、解決算術(shù)問題、對(duì)話聊天、基于文檔回答問題等,由3/cn/campaigns/aigc/?refid=45d0b997-4d67-4dfa-96c0-1f1f25f8cd06和深度神經(jīng)網(wǎng)絡(luò)。例如，AlexKrizhevsky等人在2012年提出的4StableAIhttps://stabilit5GoodfellowI,Pouget-AbadieJ,MirzaM,etal.Generativeadversarinformationprocessingsystems,2Transformers基于自注意力機(jī)制，通過對(duì)輸入序列中不同位置的關(guān)系模型已成為視覺以及自然語言處理領(lǐng)域的重要基石，如Google的BERT8就是基于這一模型。VisionTransformer(ViT)9將自注意力機(jī)制Transformer模型進(jìn)行特征提取和分類，取得了與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)6Krizhevsky,A.,Sutskever,I.,&Hinton,G.E.(20neuralnetworks.InAdvancesinneuralinformationprocessingsyst7VaswaniA,ShazeerN,ParmarN,etal.Attentionisallyouneed[J].Advancesinneuralinform8DevlinJ,ChangMW,LeeK,etal.Bert:Pre-trainingofdunderstanding[J].arXivpreprintarXiv:1810.04805,2019DosovitskiyA,BeyerL,KolesnikovA,etal.Animageisworth16x16worecognitionatscale[J].arXivpreprintarXiv:2010.119210KarrasT,LaineS,networks[C]//ProceedingsoftheIEEE/CVFconferenceoncomputervisionandpatternrecognition.2019:networks[C]//ProceedingsoftheIEEE/CVFconferenceoncomputervisionandpatternrecognition.2019:的表情、人物的發(fā)型等。如圖3-2所示，StyleGAN生成的人臉可以言生成能力和廣泛的應(yīng)用前景。最近，StableDiffusion12作為一種生2015年，一篇研究論文將統(tǒng)計(jì)物理學(xué)中的擴(kuò)散模型引入到機(jī)器12RombachR.,etal.High-resolutionimagesynthesiswithlatentdiffusionmodeIEEE/CVFconferenceoncomputervisionandpatternrecogn13Sohl-DicksteinJ.,etal.DeepunsupervisedlearningusingnonequilibriumthermodyInternationalconferenceonmachinelearning.PMLR,pages2256-2265,14RameshA.,etal.Hierarchicaltext-conditionalimagegenerationw15RombachR.,etal.High-resolutionimagesynthesiswithlatentdiffusionmodels[C].IEEE/CVFconferenceoncomputervisionandpatternrecog鏈組成，它利用變分推斷17在有限時(shí)間內(nèi)生模型高昂的計(jì)算成本仍讓眾多研究人員望而卻步。為了解決這個(gè)問稱為穩(wěn)定擴(kuò)散(StableDiffusion)19。為了實(shí)現(xiàn)穩(wěn)定擴(kuò)散，研究人員使16HoJ.,etal.Denoisingdiffusionprobabilisticmodels[J].Advancesinneuralinfor17BleiD.M.,etal.Variationalinference:Areview18RameshA.,etal.Hierarchicaltext-conditionalimagegenerationw19https://stability.ai/blog/stable-diffus（1）去噪擴(kuò)散概率模型（DDPM）是一種基于擴(kuò)散模型的生成20HoJ.,etal.Denoisingdiffusionprobabilisticmodels[J].Advancesinneuralinformationproc），xo~q(x0)xo~q(x0)xr~q(xelxo)T個(gè)去噪過程，當(dāng)反向過程每一步的真實(shí)分布已知，那么TXr~N(0,TXr~N(0,I)模型設(shè)計(jì)方面，DDPM采用的是一個(gè)基于殘差模塊(residual接(skipconnection)，合并了編碼器中間得到的同維度特征，這有利于網(wǎng)絡(luò)的優(yōu)化。穩(wěn)定擴(kuò)散（StableDiffusion）是一種圖像生成框架，通過在潛在21DhariwalP.,etal.Diffusionmodelsbeatgansoprocessingsystems,2021,示空間(latentspace)中進(jìn)行擴(kuò)散操作，最后將反向過程后的低維表），InputGTPixelBaseline#122RombachR.,etal.High-resolutionimagesynthesiswithlatentdiffusionmodels[C].InProcee訓(xùn)練所有模型參數(shù)變得愈漸困難。例如，使用Adam微調(diào)的GPT-3為了解決這個(gè)問題，微軟在2021年提出了一種名為低秩自適應(yīng)解矩陣注入Transformer架構(gòu)的每一層中，這樣可以數(shù)量減少10000倍，并且減少了GPU內(nèi)存需求。與RoBERTaIEEE/CVFconferenceoncomputervisionandpatternrecogn23BrownT.,etal.Languagemodelsarefew-shotlearners[J].Adva24HuJ.E.,etal.Lora:Low-rankadaptationoflargelanguagemodels[J].arXivpreprintarXi25LiuY.,etal.Roberta:Arobustlyoptimizedbertpretrainingapproach[J]26HeP.,etal.Deberta:Decoding-enhancedbertwithdisentangleda27RadfordA.,etal.Languagemodelsareunsupervisedmultit假設(shè)給定一個(gè)由Φ參數(shù)化的預(yù)訓(xùn)練自回歸語言模型Ps(ylx)的方法，使得在不同概念（例如角色或特定風(fēng)格）上訓(xùn)練StableDiffusion模型更加便捷。經(jīng)過訓(xùn)練的這些模型可以導(dǎo)出并供他人在StableDiffusion模型因其出色的圖像和文本生成能力而在機(jī)器秩適應(yīng)方法，為穩(wěn)定擴(kuò)散（StableDiffusion）模型帶來了諸多優(yōu)勢(shì)，28LiC.,etal.Measuringtheintrinsicdimensionofobjectivelandscapes[J].arXivpreprintarXiv:1804.08838,29AghajanyanA.,etal.Intrinsicdimensionalityexplainstheeffectivenessoflanguagemodelfine-tuninarXivpreprintarXiv:2012.13255注入的遠(yuǎn)比原模型小的低秩矩陣，從而大幅簡化了微調(diào)的計(jì)算復(fù)雜由于穩(wěn)定擴(kuò)散模型本身在訓(xùn)練和推理過程中需要較大的計(jì)算資LoRA技術(shù)的引入有效縮減了模型的文件大小，將其從原來的幾GB級(jí)別降低至2-500MB，使得用戶能夠更輕松地在個(gè)人計(jì)算機(jī)上運(yùn)行經(jīng)過使用LoRA技術(shù)微調(diào)的穩(wěn)定擴(kuò)散模型仍然保持了較高的生訓(xùn)練速度與微調(diào)擴(kuò)散模型相當(dāng)。ControlNet能夠成功地增強(qiáng)諸如y=F(x;0)絡(luò)的整體行為。它將模型原始的網(wǎng)絡(luò)參數(shù)固定，并復(fù)制了一個(gè)原始模型分支，在此基礎(chǔ)上應(yīng)用了外部條件向量進(jìn)行訓(xùn)yc=F(x;0)+z(F(x+z(c;0z1););0z2)30RombachR.,etal.High-resolutionimagesynthesiswithlatentdiffusionmodels[C].InIEEE/CVFconferenceoncomputervisionandpatternrecogn其中零卷積層(zeroconvolution)的初始化權(quán)重和偏置都為在采樣zt經(jīng)過網(wǎng)絡(luò)Eg進(jìn)行去噪后，與原始特征經(jīng)過網(wǎng)絡(luò)E可以為空字符串、默認(rèn)的“專業(yè)、詳細(xì)、高質(zhì)量圖像”語句、利用31SongJ.,etal.Denoisingdiffusionimplicitmodels[J].arXivpreprintarX32Li,J.,etal.Blip:Bootstrappinglanguage-imagepre-trainingforunifiedvision-languageunderstanandgeneration[J].InternationalConferenceonMachineLearning.PML33HoJ.,etal.Denoisingdiffusionprobabilisticmodels[J].Advancesinneuralinformationp卡通線圖。利用網(wǎng)絡(luò)上的卡通插圖提取線描并生成彩色圖像，34HoJ.,etal.Denoisingdiffusionprobabilisticmodels[J].AdvancesinneuralinformationpNeRF（NeuralRadianceField）首次將隱式表示帶入了場(chǎng)景表示中來。簡單來說，NeRF訓(xùn)練的核心是得到以下函數(shù)：輸入3D空間先魯棒地估計(jì)出每幀圖片的法向圖，并基于此使用隱式3D表示重建耦與可控編輯。具體而言，GIRAFFE拓展了標(biāo)準(zhǔn)NeRF的隱式神經(jīng)的隱編碼，同時(shí)將輸出中的RGB顏色變?yōu)榱丝晒┖罄m(xù)網(wǎng)絡(luò)使用的隱像中每一部分的生成內(nèi)容，從而達(dá)到符合用戶需求的可控生成的目開源共享平臺(tái)的建設(shè)和推廣也是促進(jìn)AIGC領(lǐng)域共建產(chǎn)業(yè)發(fā)展生態(tài)相關(guān)行業(yè)主管部門可以通過政策引導(dǎo)充分釋放AIGC的正面應(yīng)行規(guī)定，對(duì)于AIGC生成的作品的權(quán)屬認(rèn)定存在一定的模糊性和困關(guān)法律和開展AIGC作品權(quán)屬認(rèn)定方面的法律法規(guī)研究，可以為增長和模型的復(fù)雜性提高，傳統(tǒng)的單機(jī)深度學(xué)習(xí)算法已經(jīng)無法滿足AIGC系統(tǒng)學(xué)習(xí)到合適的策略和行為，以實(shí)現(xiàn)預(yù)期的生用戶可以通過現(xiàn)實(shí)世界的輸入，對(duì)虛擬世界中的內(nèi)容進(jìn)行修改和定虛擬現(xiàn)實(shí)（VR）和增強(qiáng)現(xiàn)實(shí)（AR）技術(shù)，AIGC可以創(chuàng)作出更加沉虛擬世界的交互媒介，將成為構(gòu)建人機(jī)交互、數(shù)實(shí)融合的重要載體。數(shù)字人不僅是人機(jī)交互的載體，也是構(gòu)建元宇宙新世界的關(guān)鍵要素。性和效率。在工業(yè)領(lǐng)域，AIGC可以應(yīng)用于智能制造和自索生成式AI在實(shí)際生產(chǎn)生活中應(yīng)用的熱情，也在很短的生圖產(chǎn)品Midjourney為代表，一系列移動(dòng)應(yīng)用、商用產(chǎn)品和開源項(xiàng)(1)確保良好的用戶體驗(yàn)。工程化以應(yīng)用為最終生成AI應(yīng)用的用戶界面美觀易用，交互體驗(yàn)好，確保了應(yīng)用系統(tǒng)的構(gòu)建效率和易維護(hù)性。插件式結(jié)構(gòu)與開源軟件模(2)靈活獲取算力資源。生成式AI應(yīng)用的一個(gè)重要特點(diǎn)，就是需要大量的算力資源。資源有限、GPU一卡難求，是很多企業(yè)用戶(3)穩(wěn)定控制生成效果。目前生成式AI的生成結(jié)果往往帶需要引起我們的關(guān)注。模型是生成式AI應(yīng)用的基礎(chǔ)，當(dāng)前大量生成的問題。生成式AI大大提升了創(chuàng)作效率，同時(shí)也生成了海量的媒體袱，造成信息過載和額外的應(yīng)用成本。用戶通過應(yīng)用平臺(tái)設(shè)置參數(shù)、調(diào)用生成式AI模型，并獲得生成但對(duì)于生成式AI應(yīng)用平臺(tái)的需求在使用成本、使用難度、功生成式AI應(yīng)用平臺(tái)提供可視化的用戶界面，用于控制參(2)制作人負(fù)責(zé)提出具體設(shè)計(jì)要求，并評(píng)估設(shè)計(jì)利用生成式AI應(yīng)用平臺(tái)，可以自己直接將創(chuàng)意通過圖像表達(dá)(3)設(shè)計(jì)師負(fù)責(zé)執(zhí)行具體的設(shè)計(jì)操作，不斷調(diào)試要的設(shè)計(jì)效果。設(shè)計(jì)師利用生成式AI應(yīng)用平臺(tái)，快捷、批37為代表的開源應(yīng)用是用戶使用最為廣泛Midjourney以簡潔易于上手的操作界面和可媲美專業(yè)水準(zhǔn)的出圖效果，率先吸引了大眾對(duì)AI圖像生成的關(guān)注。StableDiffusionWebUI是應(yīng)用最廣泛的應(yīng)用軟件之一。StableDiffusionWebUI是一個(gè)基于StableDiffusion模型的開源項(xiàng)目，利用Gradio模塊搭建出網(wǎng)功能快速迭代，支持最新的AI生圖功能；(2)安裝配置操作簡單，普通用戶易于上手；(3)提供豐富全面的控制參數(shù)，專業(yè)用戶可以精細(xì)地掌控創(chuàng)作過程；(4)采用插件機(jī)制擴(kuò)展支持多種功能，吸引了開用節(jié)點(diǎn)式的工作流設(shè)計(jì)模式，適合有3D設(shè)計(jì)軟件使用經(jīng)驗(yàn)的用戶。雖然它的上手門檻較高，但具有異步隊(duì)列系統(tǒng)等StableDiffusion有免費(fèi)出圖額度限制，超過限36https://github.37/comfyanonymous/ComfyUI界面簡潔，操作簡單，主要依靠提示詞控制，出圖可控性不強(qiáng)無本地硬件要求，需要聯(lián)網(wǎng)運(yùn)行無須聯(lián)網(wǎng)，可完全本地部署，但建閉源，無法自定義模型和二次無插件，功能有賴于原廠開發(fā)ComfyUI可以通過插件的形式在StableDiffusionWebUI上使用機(jī)版應(yīng)用，對(duì)設(shè)備要求高，需要配有圖形處地生成圖像。用戶一般使用帶有GPU顯卡的本地計(jì)算機(jī)或租用云環(huán)境中帶有GPU設(shè)備的虛擬機(jī)，在其中安裝和運(yùn)行StableDiffusion當(dāng)前的任務(wù)完成。這種單機(jī)運(yùn)行模式會(huì)極大地影響較大規(guī)模的生成式AI模型，通常需要高性能的硬件設(shè)備，理單元(GPU)或?qū)Ｓ玫腁I加速器。這些設(shè)備能夠并行處理大規(guī)模SageMaker，StabilityAI(S利用擁有彈性和高可用算力支持的云計(jì)算已成為大規(guī)模開展生38/blogs/machine-learning/stability-ai-builds-foundation-models-on-amazon-sagemak在云端拓展算力的方式主要有兩類，以StableDiffusionWebUI商針對(duì)生成式AI業(yè)務(wù)提供專門的虛擬機(jī)類型，在虛擬機(jī)上預(yù)置好上的GPU資源。當(dāng)設(shè)計(jì)任務(wù)較多時(shí)，仍然會(huì)遇到任務(wù)隊(duì)列的瓶頸。(2)后端云算力。面對(duì)大規(guī)模生成式AI任務(wù)需求，往往采用更義、微調(diào)、部署和管理。通過AmazonSage松訪問包括NvidiaGPU、AmazonTrainium在內(nèi)的最新的基礎(chǔ)設(shè)施資源，利用Studio、Notebook等一系列調(diào)試、分析和追蹤模型效果SageMakerJumpStart是AmazonSageMaker提供的一個(gè)資源中在內(nèi)的主流生成式AI開源模型，低代碼地輕松開發(fā)高質(zhì)量?；A(chǔ)設(shè)施。亞馬遜云科技不僅提供基于英偉達(dá)最新GPU芯片(如高性價(jià)比虛擬機(jī)實(shí)例，幫助用戶大幅節(jié)省生成式AI訓(xùn)練和推理的成成結(jié)果的不穩(wěn)定性是擴(kuò)散模型在實(shí)際應(yīng)用中無法回避的問題。AI圖像生成的不穩(wěn)定性主要體現(xiàn)在生成內(nèi)容的準(zhǔn)確性和質(zhì)量會(huì)隨生成條AI生成圖像的內(nèi)容、風(fēng)格、尺寸等指標(biāo)。這就如同在傳統(tǒng)美術(shù)設(shè)計(jì)為了穩(wěn)定控制StableDiffusion模型的生成結(jié)果，主要有以下3(1)植入概念(conceptimplantation)。當(dāng)原有基礎(chǔ)模型中不存在特的標(biāo)識(shí)，并將標(biāo)識(shí)歸到一個(gè)已存在的主題(subject)或類(class)中。通過向基礎(chǔ)模型植入概念，不僅可以控制生成所需的事物主體(2)注入條件(conditioninjection)。當(dāng)不便于用概念描述控制信制技術(shù)有ConttrolNet41和Gligen42等，利用它們就能夠以線稿/邊緣圖(如Canny邊緣、HED邊界、用戶草圖等)、深度圖、人體姿勢(shì)圖39Ruiz,Nataniel,etal."Dreambooth:Finetuningtext-to-imagediffusigeneration."ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPatternRecognition.40https://huggingface.co/blog/zh/lora41Zhang,Lvmin,andManeeshAgrawala."Addingconditionalcontroltotext-to-imagediffusionmodels."arXivpreprintarXiv:2302.05543(2023).42Li,Yuheng,etal."Gligen:Open-setgroundedtext-to-imagegeneration."ProConferenceonComputerVisionandPatte適應(yīng)不同尺寸的圖像生成，降低了模型對(duì)于輸入圖像分辨率的敏感解決方案(solution)是指針對(duì)特定問題或用戶需求提供的完整43Podell,Dustin,etal."SDXL:ImprovingLatentDiffusionModelsfoarXivpreprintarXiv:2307.01952(2023).44Chang,Ziyi,GeorgeA.Koulieris,andHubertPHShum."OntheDesignFModels:ASurvey."arXivpreprintarXiv:2306挑戰(zhàn)。在生成式AI應(yīng)用領(lǐng)域，很多軟件開發(fā)者、信息技提升項(xiàng)目效率。(3)解決方案的架構(gòu)基于對(duì)用戶需求的深入調(diào)研和分析，亞馬遜云科技在2023年6移至AmazonSageMaker，利用云上彈性資源加速模型迭代，避免單插件，客戶即可快速利用AmazonSageMaker資源進(jìn)行推理、訓(xùn)練和插件形式運(yùn)行，用戶不需要改變現(xiàn)有的WebUI使用習(xí)慣。方案插件理等任務(wù)通過插件所提供的功能便捷地遷移到AmazonSageMaker亞馬遜云科技的AI視頻超分辨率重建解決方案采深度學(xué)習(xí)的超分辨率算法，基于海量數(shù)據(jù)預(yù)先訓(xùn)練出AI模型，普通用戶開箱即用，不需要具備AI技術(shù)能力。在工程實(shí)踐上，該解決方一方面，它的架構(gòu)使用AmazonBatch等服務(wù)分塊批量作業(yè)，充分利HD轉(zhuǎn)為4K分辨率時(shí)，在云資源充足的條件下，可通過并發(fā)加速達(dá)到1:1的處理速度(即1分鐘的原始視頻只需1分鐘即可處理完畢)，全面優(yōu)于常規(guī)處理速度。另一方面，基于亞馬遜云科技自研芯亞馬遜云科技的StableDiffusionWebUI插件解決方案和豐富的心與中央美術(shù)學(xué)院的實(shí)驗(yàn)藝術(shù)與科技藝術(shù)學(xué)院合作，利用生成式AI(GenAIShadowPuppetry)互動(dòng)展位。這項(xiàng)工作展示了姿勢(shì)分析、SageMaker訓(xùn)練皮影風(fēng)格模型。先利用GroundingDINO模型從經(jīng)典皮影文獻(xiàn)中提取不同的圖像，如圖2-15所示，并進(jìn)行概念標(biāo)注。再將精選的圖像集作為LoRA模型訓(xùn)練的概念注入，增強(qiáng)其創(chuàng)作能力。員、火車和計(jì)算機(jī)等新穎的元素，如圖2-16所示。在步驟(4)中，技術(shù)，從攝像頭拍攝的觀眾動(dòng)作視頻中提取姿勢(shì)數(shù)據(jù)，用于控制由將互動(dòng)動(dòng)作視頻與背景視頻一起渲染，生成最終的作品，如圖2-18幀之間進(jìn)行姿勢(shì)對(duì)齊，將對(duì)齊的姿勢(shì)幀組合成單個(gè)圖像，作為最后，AmazonSageMaker根據(jù)用戶的動(dòng)作通過預(yù)訓(xùn)練模型生成皮影風(fēng)格的圖像集，生成結(jié)果被合成為視頻后，保存在AmazonS3存儲(chǔ)化元素，不止是觀眾的動(dòng)作，還可以根據(jù)觀眾的面容、表情AI技術(shù)應(yīng)用于圖像生成過程中的規(guī)?；?、標(biāo)準(zhǔn)化和商業(yè)化，從而將工程化過程中積累的最佳實(shí)踐與資源復(fù)制放大，進(jìn)一步降低生成式(1)大規(guī)模生成圖像：利用生成式AI技術(shù)，極少或無需人工干(4)商業(yè)價(jià)值的呈現(xiàn)：生成式AI圖像生成的工業(yè)化不僅僅是一(1)重新定義一些行業(yè)的生產(chǎn)流程。生成式AI技術(shù)是一種先進(jìn)設(shè)計(jì)能力，還具有一定的技術(shù)能力，熟練使用ControlNet等工具。(2)應(yīng)用界面的進(jìn)一步簡化與定制化。簡單的應(yīng)簡的應(yīng)用界面也正是Midjourney迅速走紅、吸引大量用戶嘗試的重(3)模型應(yīng)用方式更加便捷和多樣。在當(dāng)前的應(yīng)一般通過Huggingface、Civitai等網(wǎng)站下載模型后，在自己的環(huán)簡單方法，為所有開發(fā)者降低使用門檻。它在2023世界人工智能大活，也給我們帶來了數(shù)據(jù)管理、數(shù)據(jù)隱私、AI倫理、版權(quán)保護(hù)等諸多新問題和新挑戰(zhàn)。我們需要持續(xù)關(guān)注和思考生成式AI這類以控制對(duì)象為目的的人工智能系統(tǒng)可以幫助藝術(shù)家構(gòu)建虛擬的在作品《FiftySisters（五十姐妹）》中,藝術(shù)家JonMcCormack覺，通過手工繪制創(chuàng)作出藝術(shù)作品。然而在AI生成繪畫中，程被移交給了人工智能。在JonMcCormack的另一件作品《The中這些植物在無盡的解體與重組中不斷循環(huán)。AI生成圖形為藝術(shù)家45/project/fifty-sisters46/project/the-unknowableJamesBridle47《TheCloudIndex（云指數(shù)）》項(xiàng)目(20是一款軟件，可以用來根據(jù)不同的政治結(jié)果創(chuàng)建不同的天氣形態(tài)?！盝ulienDeswaef合作完成的作品。它是一個(gè)能夠創(chuàng)造集合藝術(shù)的3D戶制作模型庫。ShivInteger作為定制軟件會(huì)隨機(jī)在Thingiverse上挑等問題，同時(shí)也在Thingiverse上引發(fā)了關(guān)于它是藝術(shù)還是垃圾的長48/49.https://www.plummerfer《FalloftheHouseofUsherII（厄舍古廈的倒塌Ⅱ)》是一個(gè)手成下一個(gè)訓(xùn)練集的基礎(chǔ)。重復(fù)、回憶和娛樂的概念是“古廈的倒塌”致的貪婪與邪念；知識(shí)量和視野所限。AI站在冷靜的立場(chǎng)，通過人50/fall-of-the-house-of-u過使用Flickr上成千上萬張人臉照片，輸入到名為“生成對(duì)抗網(wǎng)絡(luò)”51/cn/work/details/690?type=project用生成式對(duì)抗網(wǎng)絡(luò)(GAN)構(gòu)建的肖像畫。該作品是以畫布為媒介的，屬于一系列名為《LaFamilledeBelamy》的生成圖像。Belamy這一名稱是為了向生成式智能創(chuàng)作的藝術(shù)品在佳士得拍賣行進(jìn)行拍賣后，實(shí)際成交價(jià)高達(dá)432500美52/?p=A%20fleeting%20memory53.HowthreeFrenchstudentsusedborrowedcodetoputthefirstAIChristie’s[EB/OL]./2018/10/23/18013190/ai-art-portrus-robbie-barrat-ga同質(zhì)化問題，同時(shí)會(huì)讓AI藝術(shù)顯得重復(fù)和庸俗。為了應(yīng)對(duì)這樣的情況藝術(shù)家可的創(chuàng)作素材來訓(xùn)練AI模型，以確保作品的獨(dú)特性，例如藝術(shù)家HelenaSarin使用自己訓(xùn)練的GANs來創(chuàng)作數(shù)字藝術(shù)，她可以在短時(shí)間內(nèi)生成大量的作品草稿，圖2-35“四月賞花的游客大軍哦，他們是麻雀人”（"troopsoftouristscomef《CompressedCinema（壓縮電影）》是一個(gè)包含五個(gè)新的視聽作品的系列，于2020年完成。這個(gè)系列的視頻圖像由CaseyReas創(chuàng)作，每個(gè)作品都有由JanSt.Werner創(chuàng)作的立體聲音軌。這些作品的時(shí)播放任意數(shù)量的視頻，并以任意順序播放，它們也可以作為電影/54/hashtag/bashoGAN?sr的2020年著作《用生成對(duì)抗網(wǎng)絡(luò)創(chuàng)造圖片》（MakingPicturesWithGenerativeAdversarialNetw交換訓(xùn)練數(shù)據(jù)的權(quán)重來操縱原有模型，這種引入的故障據(jù)，而呈現(xiàn)非常規(guī)視覺效果。作品向我們展55/56/2018/12/29/memories-of-passersby-Kimyonghun.201857正在進(jìn)行的關(guān)于機(jī)器如何觀看、理解圖像的研究。57/58/tom-white話”發(fā)聲。這種聲音實(shí)際上是一系列算法，即“感知引擎”。“感知引擎”獲取機(jī)器視覺算法訓(xùn)練的數(shù)據(jù)——包含數(shù)千張物體圖片的數(shù)據(jù)庫解世界的逆向工程。《nimiiacéti?(火星薩滿）》是藝術(shù)家JennaSutela與Somerset室的創(chuàng)新負(fù)責(zé)人DamienHenry合作共同制作的一個(gè)新的視頻裝置。59/tom-white“Alt-C”是一種利用植物產(chǎn)生的電力為開采加密貨幣的單板計(jì)生長，有可能得出大氣條件與加密貨幣生產(chǎn)之間的相關(guān)性。MichaelSedbon已經(jīng)訓(xùn)練了一個(gè)人工智能神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)與英國天氣預(yù)報(bào)相60.uk/whats-on/jenna-sutela-nim《MakingPicturesWithGenerativeAdversarialNetworks(用生成對(duì)抗網(wǎng)絡(luò)創(chuàng)造圖片)》是藝術(shù)家CaseyReas首次介紹新興人工智能技61/Alt-C斯平德爾托普（Spindletop）地區(qū)發(fā)現(xiàn)的世界上第一個(gè)重要石油開發(fā)地點(diǎn)“盧卡斯噴油井（LucasGus62/casey-reas-res63/western-flag-spindletop-texas-2017.html#2019-western-flag-spindl藝術(shù)家運(yùn)用了人工智能(AI)技術(shù)中的imagedetection（圖像檢測(cè)）和densecaption（密集標(biāo)題）功能，對(duì)所有視頻中的圖像進(jìn)行了解讀和抓取，即通過AI去詳細(xì)描繪視頻中出現(xiàn)的所有內(nèi)容。（此藝術(shù)家的實(shí)踐不僅是探索新技術(shù)的可能，同時(shí)也會(huì)關(guān)注相關(guān)倫受到損害的人們，這些數(shù)據(jù)在全球范圍內(nèi)被用于增強(qiáng)警備和軍事應(yīng)數(shù)據(jù)？”此外Exposing.ai項(xiàng)目的研究成果曾出現(xiàn)在《金融時(shí)報(bào)》、《紐約時(shí)報(bào)》、《自然》雜志、美國政府問責(zé)局的報(bào)告、2020年人64/cn/category/article-list/Deepfake是用于合成人類面部、語音或視頻的技術(shù)，已經(jīng)成為Deepfake技術(shù)可以為藝術(shù)創(chuàng)作者提供新的創(chuàng)作手段和方式，但65https://exposing.ai/Ford所替代，他在電影中飾演了人類賞金獵人。Ford面對(duì)著他自己藝術(shù)家借Deepfake這種人工智能技術(shù)來敘述人與人工智能之間的聯(lián)66作品《Zizi-QueeringtheDataset（Zizi-重構(gòu)數(shù)據(jù)集）》中藝術(shù)家JakeElwes以StyleGan(2019)為基礎(chǔ)在包含70,000張人臉照片的FFHQ（2018）數(shù)據(jù)集上進(jìn)行了訓(xùn)練。正如藝術(shù)家在其網(wǎng)站上所言，系列作品從2019年開始一直持續(xù)至今，是藝術(shù)家對(duì)人工智能與變裝7屏裝置，OnassisFoundation,PediSofiaCrespo是一位對(duì)生物學(xué)相關(guān)技術(shù)有著濃厚興趣的藝術(shù)家。她的主要關(guān)注點(diǎn)之一是有機(jī)生命使用人工機(jī)制來模擬自身生成和進(jìn)品質(zhì)疑人工智能在藝術(shù)實(shí)踐中的潛力及其重塑我們對(duì)創(chuàng)造力的理解67/project-zizi-2019.68/project-zizi-2019.的視頻裝置作品《euralSwamp（神經(jīng)沼澤）》挑戰(zhàn)了種族和性別的陳規(guī)陋習(xí)，并探討了在一個(gè)超數(shù)字化的世界中作為黑人和女性的意69https://entangledothers.studio/this-jellyfish-does-not-exist/70https://www.sofiacrespo.c《THECROW（烏鴉）》2022戛納電影短片節(jié)最佳短片。藝術(shù)了一個(gè)披著黑色披肩的舞者模仿烏鴉的動(dòng)作在舞蹈，AI讓每一幀畫面看起來都像是真實(shí)的?！?1/martine-syms-neural-swamp/），字母的雙關(guān)語）賦予了意義。該作品的觀眾可以使用Instagram和Twitter上的#abinfinite1標(biāo)簽上傳圖像，圖像將通過Bonaceto人工詩歌，讓人想起詹姆斯·喬伊斯的《尤利西斯》的足跡中建立的現(xiàn)代作品《Unsupervised(無監(jiān)督)》是藝術(shù)家RefikAnadol長期項(xiàng)目《MachineHallucinations（機(jī)器幻覺）》的一部分，探索基于集體視72/watch?v=pK7AGfB73/ab龐大的數(shù)據(jù)作為基礎(chǔ)進(jìn)行訓(xùn)練，以展開探索。Anadol和他的團(tuán)隊(duì)從數(shù)據(jù)集。作為一種精心策劃的多渠道體驗(yàn)，《MachineHallucinations偶然性提供了一種新的感官自主形式。RefikA在多維空間中的“幻覺”，Anadol用MoMA藝術(shù)品收藏的子集訓(xùn)練其中由一種新形式的藝術(shù)創(chuàng)造力產(chǎn)生的幻覺潛力解釋著MoMA無與在藝術(shù)家兼制作人RiarRizaldi創(chuàng)作的電影《化石》（Fossilis）影中，AI生成的圖像是物理世界和虛擬世界之間的邊緣過渡，考古學(xué)家使用的機(jī)器會(huì)思考如何構(gòu)建一個(gè)可以虛擬觀察這些電子垃圾的是廢棄的CGI資產(chǎn)的復(fù)制品。AI74https://refikanadol.co/mag垃圾圖像。最后，街景取自印度尼西亞的“電子尸體”市場(chǎng):這是一個(gè)人們出售電子廢棄物的市場(chǎng).這些動(dòng)態(tài)影像制作技術(shù)在處理廢棄物和未知世界等領(lǐng)域的知識(shí)。cAI?作為隨著前沿科技與藝術(shù)家人生進(jìn)實(shí)驗(yàn)性的藝術(shù)計(jì)劃。關(guān)于cAI?蔡國強(qiáng)談到：“火藥和AI對(duì)我來說命力’，但需點(diǎn)火人；現(xiàn)在cAI?是我的影子和鏡子，是我的合作伙伴；未來它會(huì)打破這面鏡子，成為獨(dú)立的藝術(shù)家嗎？很多人擔(dān)心75/fossilis.hAI對(duì)人類構(gòu)成威脅。我想，當(dāng)前用AI創(chuàng)作藝術(shù)的危險(xiǎn)性不在于AI本身，而在于，使用AI創(chuàng)作、成果卻不是藝術(shù)……我想通過cAI?從？期待終有一天，cAI?成為超越人類認(rèn)知維度、來自‘外星球’的導(dǎo)師……”。作為一個(gè)實(shí)驗(yàn)，蔡國強(qiáng)與cAI?相互啟發(fā)共同了火藥屏風(fēng)《月亮上的畫布：為外星人作的計(jì)劃第38號(hào)（GenerativePre-trainedTransformer4）等，采用了深度神經(jīng)網(wǎng)絡(luò)和Transformer結(jié)構(gòu)，通過在大規(guī)模數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練，學(xué)習(xí)到了豐富的語言知識(shí)，為各種NLP任務(wù)提供了強(qiáng)大的基礎(chǔ)。預(yù)訓(xùn)練語言模型76/wifiKey_detail.jsp?contid=22806977&from=wifi PoemPortraits是一件實(shí)驗(yàn)性的集體藝術(shù)品，由藝術(shù)家兼設(shè)計(jì)師DariaJelonek于2017年創(chuàng)作的作品。An標(biāo)題被處理成一系列看起來是愛麗絲和鮑勃這兩個(gè)虛構(gòu)人物之間的讓愛麗絲與鮑勃的故事線像量子設(shè)備中的光子糾纏藝術(shù)家將愛情故77https://simon.bird.me/googleDariaJelonek.201778攝像頭、GPS設(shè)備、麥克風(fēng)和時(shí)鐘連接到神經(jīng)網(wǎng)絡(luò)，他在汽車后備20秒鐘捕捉一幅圖像，首先以最直觀的方式將圖像文本化，利用圖句（句子數(shù)據(jù)來源于約200本手工挑選的書籍的語言）。該文本現(xiàn)已出版成書《1theRoad》。這種跨界的藝術(shù)實(shí)驗(yàn)為人工智能與文學(xué)78/quantum-computing-aInterpretation）進(jìn)行基于圖像的視覺解讀，另一個(gè)人工智能會(huì)將這些79/wordcar/80/wiki/1_the_Road多地解讀藝術(shù)作品的內(nèi)容和意義，而不是僅僅體驗(yàn)藝術(shù)作品及其形入提示詞。然后使用圖像標(biāo)注算法（GPT2和CLIP）將這些圖像解在合作中，雙方從技術(shù)和藝術(shù)的角度創(chuàng)作了一系列AI藝術(shù)作品并多81/project-sont術(shù)家的作品中自動(dòng)學(xué)習(xí)特有的藝術(shù)風(fēng)格，從而讓AI模型能夠生成擬等。同時(shí)，AI模型還具有通用的語言理解與交互能力，能夠通過語首先AI模型需要從特定主題出發(fā)，進(jìn)行信息聯(lián)想與選擇決策。為此，AI對(duì)四種基本信息聯(lián)想方式建模，分別是：基于深度詞嵌入近3000個(gè)中國山水畫的繪畫元素，通過考慮與繪畫元素的模型獲取文本中的重點(diǎn)詞語，作為中心概念進(jìn)行思維導(dǎo)圖的實(shí)時(shí)擴(kuò)語言和圖像的多模態(tài)GAN模型常被用于語義可控的圖像生成,），這項(xiàng)工作的AI風(fēng)格化書法生成系統(tǒng)含有兩個(gè)模型：通過這兩個(gè)AI+Art項(xiàng)目，京東AI研究院與中AI交互裝置中觀眾可通過自身參與直接影響作品呈現(xiàn)的結(jié)果，Are(如我們所是）》中，藝術(shù)家MatthewMohr在裝置作品內(nèi)設(shè)置了29臺(tái)攝像機(jī)，從不同角度拍攝參觀者的面部，系統(tǒng)會(huì)自動(dòng)合成拍攝NotTheOnlyOne(N'TOO)是一項(xiàng)正在進(jìn)行的實(shí)驗(yàn)。它試圖從領(lǐng)域易遭受忽視的群體的擔(dān)憂和理想。的敘述范圍。N'TOO使用此信息作為回答問題的基礎(chǔ)。值得注意的82/83/nt84/nt85/work/mask-somerset-houseAl應(yīng)用程序被認(rèn)為應(yīng)該是完美無瑕的中立系統(tǒng)，但實(shí)際應(yīng)用中作合成新的虛擬變裝舞者。視頻中不斷變化的身體均由神經(jīng)網(wǎng)絡(luò)生成，觀眾可以點(diǎn)擊按鈕選擇喜歡的表演者和曲目，當(dāng)AI試圖呈現(xiàn)高難度的表演姿勢(shì)或?qū)⒍喾N不同身份相結(jié)合時(shí)身體會(huì)變得模糊、扭曲。立空間將感官與外界阻隔，以身體作為感知的媒介，通過聲音、光、和參與性，作品《ArchiveDreaming》是土耳其多媒體藝術(shù)家Refik86/project-zizi-va87/project-zizi-va作品《Encode/Decode（“編碼/解碼”）》是藝術(shù)家RafaelLozano-Hemmer根據(jù)牙買加裔英國文化研究學(xué)者斯圖爾特-霍爾霍爾對(duì)電視語境下媒體信息的生產(chǎn)、傳播和解讀方式進(jìn)行了理論分88/works/archive-dreaming/除了人機(jī)交互外，藝術(shù)家也會(huì)將行為表演與AI技術(shù)相結(jié)合，此類交互作品多帶有一定的敘事性，觀眾可以通過手勢(shì)、語音識(shí)別、品《UnlearningLanguage"遺忘語言》是LaurenLeeMcCarthy&KyleMcDonald共同完成的表演項(xiàng)目，作品試圖探索語言對(duì)我們意味著什否想象一個(gè)超越持續(xù)監(jiān)控的未來？UnlearningLanguage是一個(gè)行為算法無法檢測(cè)到的。作品由兩部分組成：1.最多可容納8人的交互），89/eMcCarthy&KyleMcDonald.202290交流等等。91在交互裝置創(chuàng)作中，觀眾不僅可以90/Unlearning-La91錢抒辰.人工智能技術(shù)與環(huán)境藝術(shù)設(shè)計(jì)課堂融合[J].居舍,2020(06):189-19建了一個(gè)AI驅(qū)動(dòng)的虛擬形象。主角露西是一個(gè)富有想象力的小女西對(duì)家人的看法，每個(gè)人都以“視覺隱喻”的形式心露西。露西能夠通過自然語言處理與觀眾進(jìn)行交談，跟蹤觀眾的另外一種由人工智能來控制敘事發(fā)展的方式類似于彼得羅·加利9293/wolvesinthewalls#wolves-in-the-walls滅它們，徹底結(jié)束一個(gè)星球上智慧生命的發(fā)展。觀眾與系統(tǒng)通過互以讓人“懸置懷疑（suspendsuspicion）”，暫時(shí)停止對(duì)虛構(gòu)世界的德，每天晚上為撒山國王（AI扮演）講故事，以推動(dòng)游戲的進(jìn)行。千零一夜》與傳統(tǒng)文本敘事游戲最大的不同點(diǎn)在于游戲中與NPC互人工智能技術(shù)的介入使藝術(shù)家們有機(jī)會(huì)超越傳統(tǒng)的數(shù)字創(chuàng)作邊界，藝術(shù)創(chuàng)作也逐漸由生成，交互向多智能體過渡，多智能體系統(tǒng)（Multi-AgentSystems,MAS）在人工智能領(lǐng)域是一個(gè)研究多個(gè)自治此類知識(shí)。3）權(quán)力下放：沒有任何智能體被指定為控制中心（或系往復(fù)走迷宮的場(chǎng)景。在20世紀(jì)的最后十年，人們喜歡不斷地切換電視頻道，在21世紀(jì)的第一個(gè)十年，他們四處奔跑。近十年來，推薦前進(jìn)、再前進(jìn)。每當(dāng)車輛到達(dá)迷宮的另一端，LED屏幕都會(huì)顯示一追逐的場(chǎng)景。兩輛受AI驅(qū)動(dòng)的汽車在戰(zhàn)爭(zhēng)迷霧中相互97/AI-Car-Maze多智能體系統(tǒng)中的每一個(gè)智能體都需要遵循某種規(guī)則或策略來這與創(chuàng)世紀(jì)的造物行為有一定的相似性。在宗教或神話的敘述98/Chasing-in-th99/AI-Car-Maze在陳抱陽的《第一森林定律》中，他構(gòu)建了一個(gè)半誕性顯露無疑。藝術(shù)家認(rèn)為代表數(shù)字技術(shù)的人工智能被賦予100/AI-Car-M機(jī)械臂的AI：宗旨：照顧并確保樹木的健康和生長。功能：根據(jù)樹木的健康狀況調(diào)整其位置，與DMX舞臺(tái)燈和煙霧機(jī)通信，并適應(yīng)環(huán)境以保護(hù)樹木。與其他代理的互動(dòng)：與DMX舞臺(tái)燈合作提供最佳照明，并與煙霧機(jī)合作確保適當(dāng)?shù)臐穸?。燈光：宗旨：為樹木提供必要的照明。功能：自主改變其光線方向和強(qiáng)度。與其他代理的互動(dòng)：基于自身的內(nèi)部邏輯照亮樹木，但在必要時(shí)可以與機(jī)械臂的AI進(jìn)行協(xié)調(diào)。煙霧機(jī)：宗旨：以霧/露的形式為樹木提供所需的濕度。功能：根據(jù)自身的行為集運(yùn)行，間隔釋放霧氣。與其他代理的互動(dòng)：在可能與機(jī)械臂的AI進(jìn)行協(xié)調(diào)的同時(shí)，提供適當(dāng)?shù)臐穸纫赃_(dá)到最佳的水分水平。樹木：宗旨：系統(tǒng)旨在培育和保護(hù)的中心實(shí)體。功能：在機(jī)械臂AI的照料下生長并保持健康。與其他代理的互動(dòng)：作為照料的接受者，其健康狀況由機(jī)械臂的AI進(jìn)行監(jiān)測(cè)。在其所有操作中，機(jī)械臂的人工智能系統(tǒng)應(yīng)優(yōu)先考慮樹木的健康和生長。為此，它必須：101翻譯自/Forest-Theorem-One1.持續(xù)監(jiān)測(cè)樹木的生理狀態(tài)和健康，根據(jù)需要調(diào)整機(jī)械臂的位置，確保樹木獲得最佳的照明和水分。2.與兩個(gè)燈光和煙霧機(jī)智能代理進(jìn)行溝通和協(xié)調(diào)，確保樹木得到足夠的光照和濕度。3.在任何時(shí)候，都要防止可能對(duì)樹木造成傷害或不良影響的行為或條件。1024.持續(xù)學(xué)習(xí)和策略優(yōu)化，以適應(yīng)變化的環(huán)境條件和樹木的不斷變化的需求。這些原則確保了管理機(jī)械臂的AI始終將樹木的健康和生長放在首位，并考慮到與其他智

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

2023中國人工智能系列白皮書：AI+Art

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔