Sora、夢境與比喻——模擬世界的三種方式

周澤雄2024-05-02 10:20

周澤雄/文

我關(guān)注的AI公眾號,最近天天推送OpenAI公司的Sora制作的AI視頻,千奇百怪,異想天開。單看影像品質(zhì),我的常識和見識每天都在拆卸重組。

Sora自詡“世界模擬器”(world simulators),它對視覺經(jīng)驗(yàn)的最大沖擊是:打破三界,重組萬物,又假裝一切都是自然而然、順理成章。

它的訓(xùn)練和算法里有一種不顧一切、殺神弒佛的偽現(xiàn)實(shí)主義傾向。它不會說“不”,不管人類給出的提示詞(prompt)多么荒誕不經(jīng),它總是見招拆招,有板有眼,仿佛它只是一名刻板的寫生畫家。Sora鏡頭華美,風(fēng)格多變,但它的創(chuàng)作態(tài)度則是紀(jì)實(shí)的,它擅長合理化所有荒誕:我們看到了一只皮膚由樹葉組成的大象在森林里行走,見到一列微型火車沿著植物的葉脈蜿蜒前行,撞見一名頭臉由黃色氣球構(gòu)成的無腦人在都市里穿梭通勤,還目睹了大量乍看煞有介事、細(xì)想絕無可能的“雜拌生命”——下半身像蝸牛的貓?jiān)诤V杏芜?,狐貍正以烏鴉的姿態(tài)棲息樹間,一輛絢麗跑車以海豚的姿勢躍出海面……

總之,當(dāng)人類向它發(fā)出戲謔指示,Sora每次都回報(bào)以嚴(yán)謹(jǐn),對指令中暗含的“惡作劇”視而不見。它制作視頻時(shí)的潛臺詞根本不是“瞧,我的想象力多么奇特、奔放”,而是一聲聲謙卑回應(yīng):“主人,您的指示我已完成。請審核,請慢用。”

Sora希望我們相信它制作的一切;我們?nèi)粝嘈帕怂?,世界恐怕將不再可信。它憑一種無動于衷的超然直面荒誕,最終使荒誕得到降解,并不著痕跡地隱入現(xiàn)實(shí)?,F(xiàn)實(shí)經(jīng)此一攪和,則將如夢如幻。它不動聲色,借助幾何原理和物理定律呈現(xiàn)被扭曲的對象,人類則在大驚失色之后習(xí)以為常,逐漸把荒誕視為常態(tài)。當(dāng)你要求Sora再現(xiàn)一種“意料之外、情理之中”的情境,比如復(fù)活一位特定情境中的先人,它會不由分說地完成任務(wù),仿佛為你制作一杯咖啡,而視頻的清晰度和生動性,卻足以榨出你的眼淚,擾亂你的身心,顛倒你的時(shí)空。誠然,這相當(dāng)不壞,但長此以往,我們對生命的回憶和反思,將失去憑依。

日前瞄到一個(gè)視頻,美國前總統(tǒng)奧巴馬在講述量子力學(xué)原理。換在一年前,每個(gè)地球人都不會懷疑講述者的身份:沒錯(cuò),正是奧巴馬先生。但今非昔比,在見識了AI一手主導(dǎo)的智力大爆炸之后,世人對“真實(shí)”的信念發(fā)生了動搖。盡管眼前這位頭發(fā)花白的奧巴馬顯得如此逼真,評論區(qū)卻亂成一團(tuán),人們根本無法就視頻人物的真實(shí)性形成任何共識,即使制作者親自出面澄清視頻確系A(chǔ)I生成,網(wǎng)友的分歧非但沒有減少,反而強(qiáng)化了。因?yàn)?,?dāng)真相失去了標(biāo)準(zhǔn),常識失去了基礎(chǔ),亂套就不再是亂套,而成為新常態(tài)。

僅僅半年前,除了一小部分業(yè)界精英,無人能預(yù)料AI的進(jìn)化勢頭這么迅猛,以致我們那么快就必須面對Sora這種智力怪獸。我們既往的視覺經(jīng)驗(yàn)、神經(jīng)記憶,缺乏與之對應(yīng)的身心儲備,人們或多或少被砸暈了。好在我們體內(nèi)似乎有一個(gè)淡定機(jī)制,一種恰到好處的遲鈍,助我們適應(yīng)一切,讓生活得以繼續(xù)。“Sora”作為世界模擬器,最讓我們驚訝的,是對人類心智和想象力的模擬。你用寥寥數(shù)語提到腦海里的一個(gè)閃念,它就能以令人信服的鏡頭語言,展開大師級的流暢場景。在Sora之后,無論是否情愿,我們都必須養(yǎng)成一種新的習(xí)慣:對每一個(gè)看似可信的影像抱有警惕。在可見的將來,這份警惕有可能變得歇斯底里,我們將不是因?yàn)榭梢刹庞|發(fā)警惕,而是因?yàn)榭尚挪偶由顟岩伞_@不像是好事,這意味著一種底層認(rèn)識論的傾覆。

好在,人間不會被一種方式所模擬,在Sora面世之前,人類也以自己獨(dú)有的方式,模擬著世界。

Sora以電影般的影像對動感世界的華麗模擬,引出一個(gè)顯而易見的對比:這份能力,擅長做夢的人類并不陌生。

在人類心智的幽邃之地,也潛伏著足與Sora匹敵的異能。在我們不知不覺、沉入夢鄉(xiāng)之后,我們也能隨隨便便地?fù)碛袘{虛御風(fēng)、穿梭時(shí)空的能耐。我們不知道今晚將做什么夢,我們無法策劃和排練它,但我們隨時(shí)會被驚得魂飛天外。值大夢初醒,我們秒歸平凡,并以令人絕望的速度失去對夢境的記憶,我們注定無法找到可靠的釋夢方法。若把夢鄉(xiāng)視為一座蘊(yùn)藏豐富的智力富礦,當(dāng)下它仍處于沉睡狀態(tài)。

我們知道,Sora的模擬不僅是一種算法成就,它的耗費(fèi)也極其驚人。它的訓(xùn)練量需要數(shù)百萬塊高端GPU芯片提供支撐,它還依賴龐大的能源提供支持,那些看上去如此細(xì)膩絲滑的流暢影像,背后是一種國家級戰(zhàn)略在協(xié)同發(fā)力。Sora的昂貴決定了它的稀缺。

對照自己的夢,我們輕易發(fā)現(xiàn),在人類的大腦深處,這份能力并不稀缺。Sora的展示與我們夢中所見,差異固然明顯,相似乃至神似之處也非常突出。Sora的模擬始于人類的提示,人類的夢境則不知出于何者之手,但說到影像的展開方式,兩者高度相似。夢帶領(lǐng)我們前往聞所未聞之地,我們夢中所見,既是現(xiàn)實(shí)的投影,也是現(xiàn)實(shí)的變形和扭曲,它從來不會原樣復(fù)制。即使夢中獲悉自己正前往熟悉之地,比如童年的家鄉(xiāng)、當(dāng)下的工作場所,醒來后也會覺出似是而非。具有影像饑渴的夢境,不屑機(jī)械復(fù)印我們的現(xiàn)實(shí)履跡,它每次都帶領(lǐng)夢中人前往陌生之地。也就是說,我們夢中所見,站在影像角度,均是初次出現(xiàn)。如果Sora的影像品質(zhì)值得人類尖叫,我們夢鄉(xiāng)里的影像品質(zhì)似也不應(yīng)低估。依照Sora的操作原理,我可以愉快地假定,在我們的心靈深處,也深藏著相當(dāng)于十萬片GPU顯卡協(xié)同運(yùn)作的影像生成法力。因?yàn)椋覀儔糁械膱鼍巴瑯邮沁B續(xù)和多彩的。當(dāng)我們驚訝于Sora影像展示了連貫和從不掉幀的工程成就,我們也該給作為造夢師的自己豎個(gè)大拇指:我們的夢也從不掉幀,像素不低,且同樣清晰流暢。Sora需要大把燒錢,我們只需眼睛一閉。

導(dǎo)演克里斯托弗·諾蘭在《盜夢空間》里創(chuàng)造性地模擬了人類夢境。對照電影里的華麗場景,凡人之夢難免大有遜色,但那份壯麗、刺激、緊張和意外,我們或多或少都曾遇見,因而也能產(chǎn)生共鳴。為使角色有充足時(shí)間達(dá)成夢中使命,影片還提到一個(gè)有趣數(shù)據(jù):現(xiàn)實(shí)中的5分鐘,夢里可以感受為1個(gè)小時(shí)。該數(shù)據(jù)的學(xué)術(shù)價(jià)值待考,若姑信其真,它等于在說,大腦做夢時(shí)的運(yùn)行速度,比清醒時(shí)快了20倍。繼續(xù)拿Sora來類比,它說明,當(dāng)我們變身“造夢者”,我們真的獲得了類似高端GPU附體的潛能,我們憑清醒時(shí)并不具備的創(chuàng)意,源源不斷地創(chuàng)造著令自己大驚失色的場景。

我們無法在醒后對夢境作出原汁原味的復(fù)述,我們記住的內(nèi)容可能不足真實(shí)夢境的十分之一。早期夢學(xué)家(如弗洛伊德)為了獲得更好的實(shí)驗(yàn)成果,會精確設(shè)定鬧鈴,以便在所謂“快速眼動階段”把自己喚醒,第一時(shí)間逮住夢的尾巴。但成果并不明顯,不管你清醒的速度有多快,夢境逃竄的速度總是更快,你記住的永遠(yuǎn)是一個(gè)低配打折版,你談?wù)摰挠肋h(yuǎn)只是一些依稀影像,類似殘山剩水。鑒于我們被剝奪了還原夢境的能力,當(dāng)我們談及夢的模擬,其實(shí)是在不公平條件下與Sora比較。誰知道呢,人類真實(shí)的夢境也可能無比絢麗,由于醒來是個(gè)祛魅過程,它腐蝕了我們的記憶,令我們無法評估自己的能量。

我就此詢問了ChatGPT-4(OpenAI公司的人工智能對話機(jī)器人),請它將Sora的能力與“人類在做夢中展示的想象力及構(gòu)造動態(tài)影像的能力”進(jìn)行比較。它禮貌地確認(rèn)了我的困惑,承認(rèn)兩者存在可比性,但又著重強(qiáng)調(diào)“一些重要的區(qū)別”。它表示:

AI生成電影般的動態(tài)畫面是基于其訓(xùn)練數(shù)據(jù)和算法,其創(chuàng)造性源頭在于對大量數(shù)據(jù)的學(xué)習(xí)和模式識別。AI生成畫面的過程是無意識的,它沒有情感、欲望或目標(biāo),其生成的畫面通常缺乏情感和深度。

人類夢境的創(chuàng)造則更多地受到個(gè)體的心理活動和情感體驗(yàn)的影響,因而更具獨(dú)特性。

——近乎沒說。實(shí)際上,真正的差別未必在此,人類對世界的模擬,另有一種與Sora截然不同的方式,值得在此鄭重提及。

在Sora之前,夢鄉(xiāng)之外,世界早已被語言里的意象充分模擬,那是人類獨(dú)有的表達(dá)利器——比喻。

世界唯有通過比喻才能闡釋,正如生食唯有經(jīng)過炙煮才能食用。先秦諸子多為比喻大師,文字里跳動著“寓言”這一高品質(zhì)比喻;古希臘人早早將比喻納入學(xué)術(shù)研究,亞里士多德對比喻的分類定義,至今仍為人遵循;西塞羅宣稱:“所謂有文采,就是要適度使用比喻。”在古羅馬人塞涅卡筆下,比喻的泛濫甚至成為值得批評的文章亂象。

把比喻視為修辭之一,就像把人類定義為生命之一,或指出大象比耗子更重,屬于一種犯罪級分類。論者用一種模糊精度的表象準(zhǔn)確,達(dá)成對事實(shí)的歪曲。簡而言之,比喻不應(yīng)棲身于修辭的科目下,與對偶、排比、夸張等野心有限的手段并列,而必須開宗立派,自立山頭。我見到對比喻最具精度的崇高定位,來自耶魯教授哈羅德·布魯姆,他以布道師的口吻宣布:“文學(xué)不僅僅是語言,它還是進(jìn)行比喻的意志,是對尼采曾定義為‘渴望與眾不同’的隱喻的追求,是對流布四方的企望。”

與Sora和夢境不同,比喻雖立足于視覺形象,比喻之成立卻不必借助畫師技法和透視原理。讀者從比喻中感受到的形象,不必具有畫面的完整和豐滿,甚至不必體現(xiàn)為一個(gè)明確的形象,它是高度化約的,像一種超級留白,文學(xué)大師僅憑一個(gè)蜻蜓點(diǎn)水的暗示,就能讓讀者腦補(bǔ)出字面上闕如的形象,隨即會心一笑。讀者的腦補(bǔ)能力,當(dāng)然與他們造夢師的天賦有關(guān),人類通過數(shù)百萬年的進(jìn)化,大腦里已然積淀了海量的形象庫存,只需一根文學(xué)的魔指輕叩,就能把它開啟。

契訶夫小說《在催眠術(shù)表演會上》寫催眠師當(dāng)眾施展法術(shù)后女人們的反應(yīng):“她們遇到他的目光都魂飛魄散,像挨打的蒼蠅一樣。”——這個(gè)潑辣的比喻,根本無法還原,讀者卻能第一時(shí)間領(lǐng)會笑點(diǎn)。作者確信沒有讀者會糾纏“蒼蠅”的細(xì)節(jié),遂補(bǔ)充道:“啊,女人的神經(jīng)!如若缺了她們,這世上的生活該多么枯燥乏味!”

毛姆小說里的巴頓·特拉福德太太走在路上,“神氣就像一個(gè)要做交配飛行的蜂王”——這比喻同樣極為大膽,只有自視極高的文字老手才敢這么寫,而讀者旋即會意,他們耳邊不必出現(xiàn)“嗡嗡”聲,就能感受到太太的先聲奪人。類似例子還有陀思妥耶夫斯基《群魔》里的地主夫人瓦爾瓦拉·彼得羅芙娜,作者寫她“坐著,挺直了腰桿,就像一枝即將從弓上射出的箭”——僅憑一枝文學(xué)線條,一位神氣活現(xiàn)的女人就在讀者眼前躍然而起。這種魔法師般的模擬能力,Sora恐駟馬難追。

為了檢驗(yàn)AI的人性智慧,選擇一些人類比喻作為提示詞,或許不無趣味。我認(rèn)為,美妙的比喻就像一種生物貨幣,只能在人類這個(gè)物種王國里內(nèi)卷式流通,因?yàn)楸扔骺瓷先ナ侨绱碎熉院鸵莨P草草,就像一行種族密碼,只有諳熟該密碼的族人,才能略無滯礙地與作者瞬間交接。當(dāng)然,實(shí)驗(yàn)仍是必要的,即使我的條件極為簡陋——我不具備使用Sora的資格。

我扔給某繪畫AI的第一個(gè)問題是:

雷蒙德·錢德勒在小說《高窗》里曾這樣形容:“兩扇打開的窗戶上掛著紗簾,一會兒飄進(jìn),一會兒飄出,活像一個(gè)沒牙老人睡覺時(shí)的兩片嘴唇來回噗嚕。”——請以你的理解,畫出作家眼里的窗簾。

——它完成了,好像那是小菜一碟。但水準(zhǔn)也就那樣,相當(dāng)于百分制里的78分,但看不出達(dá)到90分的跡象。它能畫出印象,但畫不出感覺。缺了感覺,印象也就丟失了魂。

第二個(gè)提問是:王爾德在《沒有秘密的斯芬克斯》里形容阿洛伊夫人駕到的場景,比喻很妙:“一看正是我苦苦找尋的那個(gè)人。只見她施施然步入客廳,就像一道鑲著灰色蕾絲的月光”。請畫出配得上這副月光的美女。

——它又火速完成了,一位合乎計(jì)算機(jī)美學(xué)的美女,身段完美,蕾絲和灰色都有所展現(xiàn),但“月光”在哪呢?——“月光”里藏著一份曖昧,只有制作者的內(nèi)心也有這份曖昧,“月光”才會水落石出。AI很誠實(shí),它沒有心悸,無力曖昧,人物也就任其乏味了。

最后一個(gè)問題,我問:蘇聯(lián)肅反時(shí)期,文學(xué)界死氣沉沉,作家們擔(dān)心被夜半的烏鴉車突然帶走。一位作者使用了一個(gè)特別精彩的比喻:人們在路上走著,“死刑在他們的體內(nèi)發(fā)光,像是白色的十字架”。——請你畫出這份“特別”。

——知難而退永遠(yuǎn)不是它的品格,它從不繳械,但令我驚訝的是,它的完成度居然不錯(cuò)。它采用了木刻形式,通過呆板的建筑、踽踽獨(dú)行的身影和投射在馬路上的十字架倒影——閃爍著白堊的慘光,以及傾斜的街道所帶來的壓抑,它相當(dāng)出色地傳遞出了這份恐懼。為它喝彩。當(dāng)然,人類讀者從比喻里感受到的絕望和驚悚,它無力傳達(dá)。這份無力,未必緣于技術(shù)和算法上的限制,而是生物間的天塹鴻溝,彌合無望。

比喻是一種扭曲性表現(xiàn),它呈示的形象,往往心態(tài)大于形態(tài)。比喻依賴大面積的留白、變形和省略,令事物脫離常態(tài),讓讀者產(chǎn)生好奇或不適,進(jìn)而于迷迷瞪瞪間被作者順手俘獲。

與修辭不同,比喻是對心智的劫持,而非尋常的修飾。修辭是美化,比喻是魔術(shù);修辭提升效果,比喻改變本質(zhì)。誰掌握了比喻,誰擁有了寫作。每當(dāng)作者想把意思表達(dá)得別致有力,他就會去琢磨比喻。比喻是文字的性感帶,關(guān)聯(lián)著作者意欲攫取的種種“言外之意”,它天生是不安分的,它是文字的酒精狀態(tài)。一位作者想要展示自己的幽默、博學(xué)、修養(yǎng),或可愛勁,他就會尋找比喻。一旦找到,幾乎沒有任何力量能讓他放棄——那需要一種“坐懷不亂”的文字定力。毛姆嘴上嚷嚷著“我們知道追求生動會是件多么致命的事”,筆下卻從不含糊,寧愿為了生動而放棄一切。哈羅德·布魯姆鄭重告誡:“高度形象化語言是榮耀的,也是危險(xiǎn)的,因?yàn)槲覀冇肋h(yuǎn)不可能確定如何對它所有可能的意義和它對我們的作用加以限制。”然而,不敢追求這份危險(xiǎn),也就失去了語言的榮耀。

人類深嵌在比喻里的繁復(fù)動機(jī),主要不是為了模擬世界,而是在筆墨秀場里表演自我,彰顯獨(dú)特。錢鐘書說:“蓋取譬設(shè)喻,寓言十九,乃善說之修詞,非真知之析理。”AI若要在這個(gè)領(lǐng)域與人類競爭,恐怕首先不是提升算法和購置更多的GPU,而是改變自己八風(fēng)不動的機(jī)械屬性,使自己在性情上與人類接近趨同;它必須試著參與人類的欲望,使自己的文字見機(jī)行事地服務(wù)于真誠、戲謔、歪曲、打岔、賣弄、炫耀、嫉妒等各色動機(jī)。——這是它不可能做到的。但是,若AI將自己的職能限定于“真知之析理”,那誠然非常高貴,卻也失去了在比喻的秀場與人類一較短長的機(jī)會。

詩人奧登說:“毋庸置疑,思想的交融如同兩性的交配一般迷人。”——這個(gè)比喻不僅“迷人”,還有點(diǎn)崇高,但其中的畫面甚至不應(yīng)成立,只有讀者的腦海里拒絕涌現(xiàn)那個(gè)場景,連“點(diǎn)到即止”都沒有,這份“迷人”才會兌現(xiàn)。這是一種止于意會的比喻,美感始于形象的離場。這正是人類獨(dú)有的模擬術(shù),唯比喻可以辦到。若我們慫恿Sora啟動虛幻引擎(Unreal Engine),對之精雕細(xì)鏤,奧登或會后悔作此比喻。如你所知,奧登是同性戀者,他對兩性“交配”的推崇,可能不像他說的那么強(qiáng)烈。

一個(gè)讓人摸不著頭腦的比喻,有時(shí)還會使意味倍增。身世玄幻、文筆高超的一戰(zhàn)英雄T.E.勞倫斯,在車禍前一周致友人的信里,如此描述自己的感受:“我想,樹葉從樹上落下之后的感覺一定就是我這樣。”——“這樣”到底是“哪樣”呢?別說AI,人類也捉摸不透。但我們能欣賞這份玄虛里的美妙,AI只能抓瞎、干瞪眼。

先秦老子當(dāng)年留下一句“上善若水”的恢宏比喻,氣象萬千,隱然有種上帝發(fā)表重要講話的氣勢,我們?nèi)艟芙^承認(rèn)它的真理性,還會萌生冒犯感。但今人認(rèn)為,盡管“善”與“水”的道德關(guān)系一言難盡,現(xiàn)實(shí)聯(lián)系卻是絲毫談不上,純屬子虛烏有。雖然如此,在這個(gè)驚人比喻出現(xiàn)之后,當(dāng)我們想要就中華文明說上幾句,似乎總能感受到這股源自老子的湯湯水氣,在中華風(fēng)物間微微晃蕩。僅僅一個(gè)比喻,就有這等法力。

Sora的模擬將止步于此,若貿(mào)然進(jìn)入人類的世襲領(lǐng)地,AI也可能像“挨打的蒼蠅”,四散奔逃。在人類對比喻的迷戀機(jī)制里,恐怕有一種抗拒算法的屬性,阻止AI大舉入侵。這未必證明人類有多棒,但肯定能證明人類有多獨(dú)特。

 

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。

熱新聞