創(chuàng)業(yè)者不必懼怕Sora

孔月昕2024-03-04 07:46

作為九合創(chuàng)投創(chuàng)始人，王嘯曾預(yù)判到視頻的多模態(tài)生成在今年有可能出現(xiàn)，但他沒(méi)想到會(huì)這么快。

2月16日凌晨，他刷到了Sora提供的長(zhǎng)達(dá)1分鐘的視頻，發(fā)現(xiàn)視頻的細(xì)節(jié)、光影處理非常逼真，給他留下了非常深刻的印象。

事實(shí)上，文生視頻大模型或應(yīng)用并不新奇，去年就已經(jīng)有不少相關(guān)產(chǎn)品或模型出現(xiàn)。Meta、Runway、Pika、Adobe等公司都發(fā)布過(guò)視頻生成工具，國(guó)內(nèi)大廠及部分創(chuàng)業(yè)公司也在該領(lǐng)域進(jìn)行研究，且部分公司也取得了一定突破。

不過(guò)，此前AI生成的短視頻大多數(shù)還停留在10秒以?xún)?nèi)，視頻的“真實(shí)性”也大打折扣，遠(yuǎn)遠(yuǎn)達(dá)不到Sora呈現(xiàn)的長(zhǎng)達(dá)1分鐘的穩(wěn)定效果。

因此，Sora的出現(xiàn)，意味著生成式AI迎來(lái)了新的機(jī)會(huì)。行者AI創(chuàng)始人、CEO尹學(xué)淵透露，整個(gè)團(tuán)隊(duì)都非常興奮，干勁十足?！拔覀兠刻於荚谘芯空垓v?！痹谒挠∠罄?，上一次這么興奮，還是ChatGPT發(fā)布的時(shí)候。

Sora很大程度上推動(dòng)了生成視頻應(yīng)用加速發(fā)展的趨勢(shì)。王嘯也認(rèn)為，OpenAI再次明確了視頻模型的技術(shù)發(fā)展路徑，最快6個(gè)月后，可能就有開(kāi)源的“Sora”出現(xiàn)了。

“我相信今年就是AIGC視頻超級(jí)應(yīng)用的元年。”井英科技創(chuàng)始人、CEO朱江表示。

Sora的到來(lái)究竟會(huì)如何影響行業(yè)發(fā)展？投資人從中又發(fā)現(xiàn)了哪些新機(jī)會(huì)和新趨勢(shì)？圍繞相關(guān)話題，《中國(guó)企業(yè)家》近期采訪了九合創(chuàng)投創(chuàng)始人王嘯、行者AI創(chuàng)始人、CEO尹學(xué)淵、井英科技創(chuàng)始人、CEO朱江，以下為采訪整理。

九合創(chuàng)投創(chuàng)始人王嘯：

不用擔(dān)心Sora或OpenAI能通吃

其實(shí)Sora目前的發(fā)展路徑在ChatGPT出來(lái)之后基本就可以預(yù)判了。

Sora是通過(guò)Transformer加上過(guò)去大模型帶來(lái)的知識(shí)庫(kù)，再加Diffusion做出來(lái)的。我們?cè)谝郧熬陀蓄A(yù)判，Transformer加上部分原有算法有可能突破多模態(tài)生成的瓶頸，但（它的到來(lái)）確實(shí)是比我們想象中要快。

另一方面，Transformer+專(zhuān)業(yè)場(chǎng)景數(shù)據(jù)，可能會(huì)在其他場(chǎng)景出現(xiàn)類(lèi)似突破，比如說(shuō)機(jī)器人領(lǐng)域的具身智能、生物領(lǐng)域中的DNA和蛋白生成相關(guān)領(lǐng)域，都可能通過(guò)這種算法模型將隱藏的規(guī)律和信息計(jì)算模擬出來(lái)。

通過(guò)這個(gè)理解再進(jìn)行推演，我們認(rèn)為其他領(lǐng)域也存在大模型重新改寫(xiě)其中底層技術(shù)的可能性。一旦能成功改寫(xiě)，在應(yīng)用層就會(huì)取得巨大突破。

基于此，我覺(jué)得OpenAI是新時(shí)代結(jié)構(gòu)性能力的提供者，它提供了一種大模型通用智能架構(gòu)和能力的輸出。但這個(gè)能力要想運(yùn)用在我們?nèi)粘９ぷ骰蛏a(chǎn)中，就需要針對(duì)場(chǎng)景進(jìn)行各種各樣的整體解決方案的打造。就相當(dāng)于一輛車(chē)，如果只有發(fā)動(dòng)機(jī)也沒(méi)法跑，還需要輪子、座艙。

OpenAI提供了新時(shí)代人工智能的“發(fā)動(dòng)機(jī)”，這一點(diǎn)非常有價(jià)值。就好像有了蘋(píng)果這樣的硬件公司，基于移動(dòng)網(wǎng)絡(luò)，產(chǎn)生了抖音、快手、微信等應(yīng)用，這是一層一層互相依存發(fā)展的。但做移動(dòng)網(wǎng)絡(luò)或者5G的公司，不一定能夠把手機(jī)做出來(lái)，做手機(jī)的公司還能把APP也做好，它們需要的能力不是完全一樣的。

GPT解決了基座問(wèn)題，而且也給到了行業(yè)范例，很多開(kāi)源模型如Llama 2，以及國(guó)內(nèi)的一些開(kāi)源軟件，我覺(jué)得也可以用?，F(xiàn)在Sora出來(lái)了，最快再過(guò)6個(gè)月我覺(jué)得開(kāi)源的“Sora”可能也做得出來(lái)。因?yàn)榧夹g(shù)路線基本確定之后，有一些團(tuán)隊(duì)是可以做出來(lái)相當(dāng)能力的產(chǎn)品，所以我覺(jué)得Sora不太容易形成技術(shù)上的獨(dú)占性。

因此，我覺(jué)得未來(lái)是分工合作的機(jī)會(huì)，OpenAI確實(shí)是一個(gè)很好的領(lǐng)先者，但它不可能壟斷整個(gè)市場(chǎng)。

Sora相關(guān)的視頻模型的能力，我覺(jué)得未來(lái)在to C和to B都有機(jī)會(huì)，因?yàn)樗且环N結(jié)構(gòu)性的能力。無(wú)論對(duì)于家庭、個(gè)人，還是企業(yè)、機(jī)器人等，它都能延伸到各個(gè)方面，只不過(guò)載體不同。比如進(jìn)入工廠制造領(lǐng)域，它需要跟機(jī)器人、加工機(jī)床的軟件結(jié)合；如果延伸到to C就一定要跟手機(jī)、筆記本電腦、Vision Pro等新型終端結(jié)合起來(lái)。

目前大模型生成內(nèi)容并不完全可控，它有時(shí)有幻想、有時(shí)會(huì)瞎說(shuō)，生成的視頻里面偶爾還存在問(wèn)題，這都需要應(yīng)用層的創(chuàng)業(yè)者去把它按照?qǐng)鼍斑M(jìn)行規(guī)劃、生成和使用。

因此，（即使Sora出現(xiàn)）我覺(jué)得還存在大量創(chuàng)業(yè)機(jī)會(huì)，不用擔(dān)心Sora或OpenAI能通吃。

不過(guò)，在部分大模型通用能力領(lǐng)域中，（創(chuàng)業(yè)公司）如果想跟大廠競(jìng)爭(zhēng)，這對(duì)資源的要求非常高。但在垂直領(lǐng)域或行業(yè)領(lǐng)域里解決一些具體問(wèn)題，我覺(jué)得大廠能夠覆蓋的不一定多，也不一定有垂直領(lǐng)域的創(chuàng)業(yè)公司專(zhuān)業(yè)。

對(duì)于大家談到的算力緊缺問(wèn)題，從整體上講，大模型的確是利用大量的數(shù)據(jù)和算力形成的模型能力，進(jìn)而去解決某些特定問(wèn)題，比如視頻生成、語(yǔ)言生成等。簡(jiǎn)單來(lái)說(shuō)，我覺(jué)得它是一個(gè)用“大力出奇跡”的拆解模式去模擬世界或視頻生成中的一部分。當(dāng)模型的數(shù)據(jù)量越大，它的效果就越好。

但我也認(rèn)為，到一定程度后，它可能就不需要更多算力、模型和數(shù)據(jù)了，在某個(gè)程度上它可能存在收斂的部分。盡管算力在里面起到了關(guān)鍵性作用，但我不認(rèn)為它是決定性部分。

此外，我覺(jué)得未來(lái)可能會(huì)產(chǎn)出針對(duì)性的算力芯片。新架構(gòu)算力硬件或芯片出現(xiàn)后，算力的瓶頸可能會(huì)取得突破性的進(jìn)展。我覺(jué)得可能需要一年時(shí)間驗(yàn)證我們面向未來(lái)的推測(cè)。

井英科技創(chuàng)始人、CEO朱江：

超級(jí)應(yīng)用有機(jī)會(huì)在中國(guó)誕生

我覺(jué)得Sora出來(lái)之后，對(duì)我們最有啟發(fā)的還是技術(shù)角度。我們覺(jué)得基于Diffusion Transformer的技術(shù)路線，接下來(lái)還會(huì)成為行業(yè)研發(fā)的熱點(diǎn)；此外，Scaling Law在整個(gè)視頻生成領(lǐng)域也存在很大作用。

盡管從業(yè)內(nèi)來(lái)看，我們認(rèn)為（Sora的技術(shù)路線）不是一個(gè)新的東西，但OpenAI在整個(gè)實(shí)踐過(guò)程中令人非常敬佩，而且比我們預(yù)想的快了3~6個(gè)月的時(shí)間。

這對(duì)整個(gè)視頻生成相關(guān)行業(yè)都是一件好事，我們可以向投資人或者一些圈外的朋友回答一個(gè)問(wèn)題，就是AI生成的視頻，用戶(hù)是否愿意看，或者未來(lái)能否成為用戶(hù)視頻消費(fèi)的主流內(nèi)容。

我們認(rèn)為AI加上內(nèi)容后，可能會(huì)給整個(gè)內(nèi)容的生產(chǎn)關(guān)系和創(chuàng)作者帶來(lái)變革，進(jìn)而會(huì)出現(xiàn)新一代的內(nèi)容平臺(tái)。比如抖音或TikTok的出現(xiàn)，這就是基于手機(jī)的普及以及手機(jī)攝像頭作為生產(chǎn)力工具的載體變化；其次是短視頻這種形態(tài)的出現(xiàn)，用戶(hù)在手機(jī)上可以全屏沉浸式地觀看視頻；配合30~60秒快節(jié)奏，手指滑動(dòng)就可以去閱讀視頻的體驗(yàn)；以及圍繞著短視頻出現(xiàn)的表演型的創(chuàng)作者。得益于這幾個(gè)條件，市場(chǎng)上出現(xiàn)了新一代短視頻超級(jí)內(nèi)容平臺(tái)。

總結(jié)超級(jí)內(nèi)容平臺(tái)出現(xiàn)的條件：首先是生產(chǎn)力工具的變革；其次是圍繞著生產(chǎn)力工具出現(xiàn)了新的創(chuàng)作者；第三是有一種非常適合創(chuàng)作的內(nèi)容形式；最后形成了一個(gè)新的內(nèi)容平臺(tái)，內(nèi)容平臺(tái)是個(gè)結(jié)果。

那么，AIGC時(shí)代為什么一定會(huì)出現(xiàn)新的超級(jí)內(nèi)容平臺(tái)？第一是生產(chǎn)力工具發(fā)生了變革，我覺(jué)得以Diffusion Transformer為基礎(chǔ)的視頻生成模型，在今天讓所有人看到了AI生成的視頻。從質(zhì)量角度來(lái)說(shuō)，一定能達(dá)到用戶(hù)可接受的程度。

第二，我覺(jué)得更重要的一點(diǎn)是出現(xiàn)了一群新的創(chuàng)作者，這群創(chuàng)作者既不是像YouTube平臺(tái)的知識(shí)型創(chuàng)作者，也不是像抖音上的表演型創(chuàng)作者，而是出現(xiàn)了一群以創(chuàng)意為最核心競(jìng)爭(zhēng)力的創(chuàng)作者。換句話說(shuō)，就是只要?jiǎng)?chuàng)作者的腦海里有一個(gè)很好的故事，或者是有一個(gè)非常優(yōu)美打動(dòng)人心的情節(jié)，就可以用AIGC的工具把它生成出來(lái)。

第三，我們理解的短劇不單單是現(xiàn)在大家看到的一個(gè)個(gè)劇情很爽、節(jié)奏很快的內(nèi)容，我們認(rèn)為短劇其實(shí)是一種新的內(nèi)容形式。它是一種長(zhǎng)短視頻結(jié)合的方式，單看每一集，其實(shí)它是一個(gè)短視頻，有30~60秒，但把它連在一起100集時(shí)，它又表達(dá)了一個(gè)很長(zhǎng)很有深度的故事，就像原來(lái)的電影，但換了新的方式去表達(dá)。

因此，我認(rèn)為圍繞新工具的創(chuàng)作者以及新內(nèi)容形式的出現(xiàn)，最終會(huì)催生出一個(gè)新的內(nèi)容平臺(tái)，這也是我們一直非常看好的機(jī)會(huì)。去年年底，我們也面向美國(guó)地區(qū)發(fā)布了第一款短劇的APP Reel.AI，我們現(xiàn)在生成的內(nèi)容其實(shí)在海外也取得了不錯(cuò)的成績(jī)：單集內(nèi)容已經(jīng)有了上百萬(wàn)的播放量；生成的內(nèi)容也在美國(guó)地區(qū)獲得了一定的用戶(hù)付費(fèi)。

因此，我們認(rèn)為AIGC時(shí)代有很多機(jī)會(huì)，OpenAI這樣的模型基座公司可能是新一代的“水電煤”，在此之上一定也會(huì)有AIGC時(shí)代的超級(jí)應(yīng)用型公司。

我也更相信中國(guó)公司能做出世界級(jí)的AIGC的超級(jí)內(nèi)容平臺(tái)。因?yàn)檫^(guò)去這幾年，我覺(jué)得中國(guó)人對(duì)整個(gè)內(nèi)容的理解，包括技術(shù)的結(jié)合其實(shí)更加深入，我們也一直在這條道路上。我們希望能夠隨著視頻技術(shù)的進(jìn)步快速達(dá)到臨界點(diǎn)，加速去實(shí)現(xiàn)我們自己的愿景。

行者AI創(chuàng)始人、CEO尹學(xué)淵：

人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI

去年，部分公司已經(jīng)發(fā)布了一些（視頻）模型，但目前的效果都不盡如人意。而Sora的出現(xiàn)，在速度和質(zhì)量上大大超出了我們的預(yù)期。且Sora采用的Transformer和Diffusion模型融合的技術(shù)路線，是非常別出心裁的，也給我們團(tuán)隊(duì)包括創(chuàng)業(yè)者帶來(lái)了很多啟發(fā)和思路。

同時(shí)，文生視頻模型出現(xiàn)的時(shí)間點(diǎn)提前了，各行各業(yè)可能都會(huì)衍生出更多新機(jī)會(huì)，也能刺激更多人來(lái)?yè)肀д麄€(gè)AI行業(yè)，包括更多研究者投入AI領(lǐng)域共同推進(jìn)技術(shù)進(jìn)步。

與此同時(shí)，底層工具的更新迭代讓AI工具唾手可得后，未來(lái)行業(yè)競(jìng)爭(zhēng)主要會(huì)面向應(yīng)用場(chǎng)景的理解、產(chǎn)品的交付上，像游戲、文旅、教育、營(yíng)銷(xiāo)等場(chǎng)景，要將AI真正落地應(yīng)用，這也對(duì)創(chuàng)業(yè)者提出了更高要求。過(guò)去，創(chuàng)業(yè)者可能靠一個(gè)模型、算法，再做一個(gè)BP（融資商業(yè)計(jì)劃書(shū)），就可以融資；但現(xiàn)在底層技術(shù)已經(jīng)卷到這個(gè)高度了，必然就要求創(chuàng)業(yè)者能夠通過(guò)對(duì)場(chǎng)景的理解，以及產(chǎn)品的交付，真正實(shí)現(xiàn)在市場(chǎng)上掙到錢(qián)，再進(jìn)一步去融資，實(shí)現(xiàn)正循環(huán)。

至于OpenAI是否會(huì)取代其他創(chuàng)業(yè)公司，我覺(jué)得不太可能。ChatGPT和GPT-4已經(jīng)出現(xiàn)一年多了，但在細(xì)分領(lǐng)域大家運(yùn)用的也不完全是GPT的能力，更多的還是在使用創(chuàng)業(yè)公司的自研模型以及微調(diào)后的模型解決具體問(wèn)題。

找準(zhǔn)賽道、真正持續(xù)為用戶(hù)產(chǎn)生價(jià)值才是最重要的。除極少數(shù)的底層研究以外，通用大模型的落地同樣要考慮“最后一公里”的問(wèn)題。創(chuàng)業(yè)團(tuán)隊(duì)需要通過(guò)數(shù)據(jù)、算法、模型、應(yīng)用，在場(chǎng)景落地獲得經(jīng)濟(jì)收益，實(shí)現(xiàn)正循環(huán)，進(jìn)一步獲取數(shù)據(jù)調(diào)用模型，掙到錢(qián)后把人才留住，再調(diào)優(yōu)算法，吸引更多用戶(hù)使用產(chǎn)生更多的數(shù)據(jù)，整個(gè)項(xiàng)目就跑起來(lái)了，創(chuàng)業(yè)公司或產(chǎn)品也很難會(huì)被替代掉。

因此，AI時(shí)代的創(chuàng)業(yè)公司被OpenAI替代并不是一件非常簡(jiǎn)單的事情，并不是說(shuō)OpenAI搞定了一件事，其他人就都要失業(yè)了。

相反，我覺(jué)得人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI。如果沒(méi)有OpenAI開(kāi)啟的這兩次浪潮，沒(méi)有人關(guān)注AI目前是怎么回事兒。國(guó)內(nèi)基本上使用的是國(guó)產(chǎn)大模型，也給中國(guó)的創(chuàng)業(yè)者帶來(lái)了更多機(jī)會(huì)。

來(lái)源：《中國(guó)企業(yè)家》

作者：孔月昕

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【孔月昕】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù)，不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議