近期,通過人工智能大模型賦能影像創(chuàng)作,多部AI短片陸續(xù)面世,受到各界關(guān)注。作為一項重要技術(shù),人工智能大模型推動影視行業(yè)從膠片成像、數(shù)字成像進入算法成像時代,大幅提升影像生產(chǎn)效能。很多讀者想了解,新技術(shù)具體怎樣改變影像制作流程,將給影視行業(yè)帶來怎樣的變革,“投進一部小說,還你一部電影”的愿景會實現(xiàn)嗎?我們約請一線創(chuàng)作者和研究者撰文,分享創(chuàng)作體會和前沿觀察。
——編??者
人的創(chuàng)造力依然至關(guān)重要
近一段時間,借助人工智能生成的百萬字長篇小說、近90分鐘時長的電影先后面世,前者創(chuàng)作生成僅用時一個半月,后者憑借50人的團隊只花費3個月時間。人工智能賦能藝術(shù)生產(chǎn),在單體作品規(guī)模上取得新突破,在降本增效上釋放新潛力,展示出新質(zhì)生產(chǎn)力在文藝領域的新動能和新優(yōu)勢。
人工智能是互聯(lián)網(wǎng)和數(shù)字科技加速發(fā)展過程中出現(xiàn)的集成性技術(shù)。從文生文、文生圖到文生視頻,人工智能與藝術(shù)正在碰撞出越來越多的可能。在人工智能助力下,人民日報社推出的短片《江山如此多嬌》、中央廣播電視總臺推出的系列動畫片《千秋詩頌》等受到好評,清華大學團隊推出的科幻小說《機憶之地》參評文學獎項并獲獎,中國文藝網(wǎng)推出的國寶文物擬人化形象“中華器靈”引發(fā)關(guān)注……人工智能藝術(shù)創(chuàng)作可謂話題不斷、熱點頻出。這背后是眾多平臺加速開發(fā)生成式人工智能應用的熱潮,智能工具如雨后春筍般接連涌現(xiàn)。在人工智能推動下,用戶生產(chǎn)機制疊加人機協(xié)同的生產(chǎn)模式,藝術(shù)創(chuàng)作的前景令人充滿期待。
人工智能已經(jīng)成為豐富文藝表達的新介質(zhì)、新工具,而將新技術(shù)的介質(zhì)屬性充分轉(zhuǎn)化為新興文藝形態(tài)的審美屬性,則需要一個復雜的過程。我們知道,互聯(lián)網(wǎng)和數(shù)字技術(shù)的發(fā)展催生了網(wǎng)絡文藝?;ヂ?lián)網(wǎng)自身的交互、沉浸、虛擬等技術(shù)特征,也隨之遷移轉(zhuǎn)化,影響著網(wǎng)絡文藝的審美表征。一方面,要將新技術(shù)的優(yōu)勢通過創(chuàng)作生產(chǎn)渲染和強化出來;另一方面,又要將新技術(shù)吸收和融合進審美特性中,以藝術(shù)的顯性取代技術(shù)的顯性,最終達到新興文藝形態(tài)的穩(wěn)定和成熟。今天,人工智能的加速發(fā)展和有力介入,讓技術(shù)特征再次凸顯,必然觸發(fā)新一輪“技”“藝”融合過程。
當下,人們對人工智能創(chuàng)作產(chǎn)品的認識和接受,普遍還停留在技術(shù)體驗的新奇性上。這說明人工智能的技術(shù)特征在藝術(shù)生產(chǎn)中還處于顯性地位,產(chǎn)品的審美特性還沒有充分發(fā)育形成。一些人工智能生成的長篇小說,還存在敘述或跳躍或冗余、情感描寫較為生硬、人物形象和故事設計套路化等問題,在閱讀體驗和情感代入上都有不足。一些人工智能設計的藝術(shù)形象,風格較單一,識別度與美感都不夠,暴露出受語料和算法限制的短板。
新技術(shù)的介質(zhì)特征并不會自動轉(zhuǎn)化為新興文藝形態(tài)的審美質(zhì)感。這依賴人的充分介入,依賴人將機器不具備的生命體驗、生活經(jīng)驗、情感感知、精神能量和審美想象持續(xù)融入。一位網(wǎng)友感慨地說,他用5分鐘時間讓人工智能生成了一個設計作品,卻花了5個小時才去掉作品中的“AI味”。技術(shù)特征向?qū)徝蕾|(zhì)感的轉(zhuǎn)化之難,可見一斑。《千秋詩頌》節(jié)目團隊在海量國畫、古詩詞語料基礎上,進行了大量人機溝通,經(jīng)歷無數(shù)次藝術(shù)語言與代碼語言的碰撞,才使作品呈現(xiàn)出工筆、水墨等中國審美風格。人工智能的涌現(xiàn)不可能取代人在藝術(shù)創(chuàng)作中的主體地位。技術(shù)是人的延伸,藝術(shù)由人來定義,其轉(zhuǎn)化融合必然通過人來完成。
有人工智能科學家形象地把相關(guān)軟件比喻為“畫家的新畫布”。從必須掌握一定的藝術(shù)技巧才能揮毫潑墨,到只需給出個人的藝術(shù)創(chuàng)意即可“指令生成”,我們應當認清,人在運用新“畫布”的過程中,讓渡給機器的是什么,從機器那里換回的又是什么。人工智能通過進一步剝離“技”“藝”分工以提升效率,人則必須努力克服技術(shù)在追求效率過程中帶來的問題,讓技術(shù)始終為內(nèi)容服務,回歸“技”“藝”融合。
人工智能創(chuàng)作生產(chǎn)越是只需要“指令”和“語料”,使用人工智能的人就越需要把生活的豐富內(nèi)涵、精神的拓展升華融入其中,保持藝術(shù)與生活的互動關(guān)系,保持藝術(shù)與人的根本性關(guān)聯(lián)。唯其如此,科技賦能才能最大程度轉(zhuǎn)化為藝術(shù)的豐盈,帶給人類以精神的充盈。
(彭??寬?作者為中國文聯(lián)網(wǎng)絡文藝傳播中心副主任)
人工智能再造視聽內(nèi)容創(chuàng)作流程
“所思即所見,所見即所想”,將心中所想直接轉(zhuǎn)化為眼前可見的內(nèi)容是人類孜孜以求的夢想。作為AI微短劇《中國神話》創(chuàng)作者,我們?nèi)诤衔纳?、文生圖、文生音樂和文生視頻等人工智能技術(shù),實現(xiàn)了從創(chuàng)意構(gòu)思到視聽呈現(xiàn)的人工智能全流程再造,探索人類與機器智能合作的新模式。
智能化策劃,讓人工智能成為創(chuàng)意策劃的“智囊團”。故事策劃是視聽內(nèi)容創(chuàng)作的首要環(huán)節(jié),傳統(tǒng)編劇的靈感往往受限于個人閱歷和知識結(jié)構(gòu),而大語言模型因為學習了萬億數(shù)量級的文字內(nèi)容,相比于個體創(chuàng)作者,對古今中外的“人情世故”更為了解,有推理能力的人工智能還會組合創(chuàng)新,因而成為故事腳本撰寫的好幫手。利用人工智能工具,可以高效完成劇本方案、人物設定、作品世界觀架構(gòu)等工作。以《中國神話》的創(chuàng)作為例,創(chuàng)作團隊利用智能應用對中國古代神話資料進行智能檢索、關(guān)聯(lián)分析,快速梳理出角色譜系、情節(jié)脈絡等關(guān)鍵信息,在此基礎上生成數(shù)十個走向的故事候選方案,分集故事框架的搭建過程僅需20分鐘,前期策劃的人力投入減少70%左右。事實上,在清華大學團隊近期創(chuàng)作的200余條AI視頻中,人工智能輔助生成的選題方案已涵蓋文史、科技、美食、旅行、教育等多個垂直領域,人工智能幫助策劃者快速獲取靈感、系統(tǒng)化拓展思路,為視聽內(nèi)容策劃與制作的“想什么”賦能。
自動化生產(chǎn),用人工智能豐富“怎么拍”的路徑。在影視畫面制作階段,人工智能技術(shù)的引入帶來流程再造。我們采用文生圖、文生視頻技術(shù),通過輸入文字指令讓人工智能自動生成相應風格的圖片素材與視頻素材,極大簡化了視覺創(chuàng)意從構(gòu)思到呈現(xiàn)的流程。這其中的關(guān)鍵技術(shù)在于將自然語言文本與視覺內(nèi)容建立精準映射,利用大規(guī)模多模態(tài)預訓練模型,實現(xiàn)圖片和視頻內(nèi)容的智能生成。這一技術(shù)打破了傳統(tǒng)動畫影視制作中分鏡繪制、三維建模、動作捕捉等環(huán)節(jié)對專業(yè)技術(shù)的高度依賴,把傳統(tǒng)視聽創(chuàng)作對“心—目—手”的高要求轉(zhuǎn)換為“心—目—言”的新要求,實現(xiàn)了從文字腳本到視覺畫面的直接轉(zhuǎn)化,使影視創(chuàng)意的呈現(xiàn)更加高效靈活。這是視聽內(nèi)容創(chuàng)作的一次重大范式轉(zhuǎn)變。由于語料豐富,人工智能可以快捷制作出包括寫實、抽象等在內(nèi)的近130種不同藝術(shù)風格的影像內(nèi)容,拓展了視覺創(chuàng)意的可能性,為視聽內(nèi)容創(chuàng)作提供更多靈感。
智能配音和剪輯,以人工智能替代大量基礎性工作。音樂是視聽作品的情感載體,對渲染氣氛、引發(fā)共鳴起著關(guān)鍵作用。我們調(diào)用人工智能工具,對短劇的故事情節(jié)、畫面節(jié)奏、情緒基調(diào)進行分析并提取關(guān)鍵信息點;再將文本信息輸入音樂模型,使其實時輸出與影片風格、情感氛圍相匹配的音樂素材;最后再通過人工優(yōu)選與整合潤色,配制出風格一致、節(jié)奏流暢的影片配樂。文生音樂的創(chuàng)作模式實現(xiàn)了人工作曲到智能生成的轉(zhuǎn)變,大幅提升了創(chuàng)作效率,降低了生產(chǎn)成本。
配音是視聽作品的重要組成,對角色塑造、情感表達都起到不容忽視的作用。人工智能語音合成技術(shù)可自動匹配對白語氣,再現(xiàn)角色的音色特點與情感狀態(tài)?;谏疃葘W習的人工智能配音系統(tǒng)還可捕捉真人配音的韻律特點與情感變化,生成更加接近真人的配音效果。目前,我們利用人工智能技術(shù),可實現(xiàn)配音流程的全自動化。
后期制作向來是影視制作中耗時耗力的環(huán)節(jié),我們在視頻剪輯時采用智能鏡頭分類、自動拆條、片段標引、智能字幕、一鍵調(diào)色等方法,可讓人工智能“剪刀手”代勞80%的粗剪工作。6分鐘時長的影片粗剪僅需20分鐘,是傳統(tǒng)手工剪輯速度的5倍。整個視頻全部交付的綜合人力時間成本是傳統(tǒng)制作流程的1/16左右。在人工智能代勞大量基礎性工作后,人類創(chuàng)作者能夠?qū)⒏嗑ν度雽ψ髌返暮暧^調(diào)度與藝術(shù)把控上,并對內(nèi)容進行選擇和優(yōu)化。
整體而言,人工智能技術(shù)將成為提升視聽內(nèi)容生產(chǎn)力的重要工具,人工智能與人類智慧的交織融合正在重塑視聽藝術(shù)的邊界。未來,合成視頻、對話和交互式視頻、無編輯視頻、跨風格視頻等新類型內(nèi)容,將極大豐富視聽產(chǎn)品的品類和形態(tài),提升內(nèi)容的個性化水平,提高內(nèi)容制作的實時性。同時,新的創(chuàng)作生產(chǎn)方式也對創(chuàng)作者的角色定位和知識結(jié)構(gòu)提出了新的要求,審美和想象力將變得更加重要。當然,人工智能也會犯錯,輸出無中生有的內(nèi)容,帶來穿幫鏡頭等問題,隨著技術(shù)的發(fā)展,這些問題將逐步得到解決。
當人工智能技術(shù)進一步成熟之后,視聽內(nèi)容創(chuàng)作效率將提升百倍千倍。人類提供一個初始想法,人工智能就能創(chuàng)作出一部中短篇小說,根據(jù)這部小說又能創(chuàng)作出一部影片,整個過程也許只需要數(shù)分鐘即可完成,這種前所未有的視聽創(chuàng)作的夢幻場景,有很大概率在不久的將來實現(xiàn)。屆時,只要輸入創(chuàng)作訴求甚至輸出腦電波,人們就可進行多模態(tài)優(yōu)質(zhì)內(nèi)容創(chuàng)作,在人工智能協(xié)助下實現(xiàn)藝術(shù)表達。《中國神話》等作品只是一個起點,人工智能賦能文藝創(chuàng)作的更多可能性,正等待著我們?nèi)ヌ剿骱蛯崿F(xiàn)。
(沈??陽?作者為清華大學新聞與傳播學院教授)
掃一掃在手機上查看當前頁面
是否“確認”跳轉(zhuǎn)到登錄頁?