創(chuàng)業(yè)者不必懼怕Sora

孔月昕2024-03-04 07:46

作為九合創(chuàng)投創(chuàng)始人,王嘯曾預(yù)判到視頻的多模態(tài)生成在今年有可能出現(xiàn),但他沒(méi)想到會(huì)這么快。 

2月16日凌晨,他刷到了Sora提供的長(zhǎng)達(dá)1分鐘的視頻,發(fā)現(xiàn)視頻的細(xì)節(jié)、光影處理非常逼真,給他留下了非常深刻的印象。 

事實(shí)上,文生視頻大模型或應(yīng)用并不新奇,去年就已經(jīng)有不少相關(guān)產(chǎn)品或模型出現(xiàn)。Meta、Runway、Pika、Adobe等公司都發(fā)布過(guò)視頻生成工具,國(guó)內(nèi)大廠及部分創(chuàng)業(yè)公司也在該領(lǐng)域進(jìn)行研究,且部分公司也取得了一定突破。 

不過(guò),此前AI生成的短視頻大多數(shù)還停留在10秒以?xún)?nèi),視頻的“真實(shí)性”也大打折扣,遠(yuǎn)遠(yuǎn)達(dá)不到Sora呈現(xiàn)的長(zhǎng)達(dá)1分鐘的穩(wěn)定效果。 

因此,Sora的出現(xiàn),意味著生成式AI迎來(lái)了新的機(jī)會(huì)。行者AI創(chuàng)始人、CEO尹學(xué)淵透露,整個(gè)團(tuán)隊(duì)都非常興奮,干勁十足?!拔覀兠刻於荚谘芯空垓v?!痹谒挠∠罄?,上一次這么興奮,還是ChatGPT發(fā)布的時(shí)候。 

Sora很大程度上推動(dòng)了生成視頻應(yīng)用加速發(fā)展的趨勢(shì)。王嘯也認(rèn)為,OpenAI再次明確了視頻模型的技術(shù)發(fā)展路徑,最快6個(gè)月后,可能就有開(kāi)源的“Sora”出現(xiàn)了。 

“我相信今年就是AIGC視頻超級(jí)應(yīng)用的元年。”井英科技創(chuàng)始人、CEO朱江表示。 

Sora的到來(lái)究竟會(huì)如何影響行業(yè)發(fā)展?投資人從中又發(fā)現(xiàn)了哪些新機(jī)會(huì)和新趨勢(shì)?圍繞相關(guān)話題,《中國(guó)企業(yè)家》近期采訪了九合創(chuàng)投創(chuàng)始人王嘯、行者AI創(chuàng)始人、CEO尹學(xué)淵、井英科技創(chuàng)始人、CEO朱江,以下為采訪整理。


九合創(chuàng)投創(chuàng)始人王嘯:

不用擔(dān)心Sora或OpenAI能通吃

其實(shí)Sora目前的發(fā)展路徑在ChatGPT出來(lái)之后基本就可以預(yù)判了。

Sora是通過(guò)Transformer加上過(guò)去大模型帶來(lái)的知識(shí)庫(kù),再加Diffusion做出來(lái)的。我們?cè)谝郧熬陀蓄A(yù)判,Transformer加上部分原有算法有可能突破多模態(tài)生成的瓶頸,但(它的到來(lái))確實(shí)是比我們想象中要快。 

另一方面,Transformer+專(zhuān)業(yè)場(chǎng)景數(shù)據(jù),可能會(huì)在其他場(chǎng)景出現(xiàn)類(lèi)似突破,比如說(shuō)機(jī)器人領(lǐng)域的具身智能、生物領(lǐng)域中的DNA和蛋白生成相關(guān)領(lǐng)域,都可能通過(guò)這種算法模型將隱藏的規(guī)律和信息計(jì)算模擬出來(lái)。

通過(guò)這個(gè)理解再進(jìn)行推演,我們認(rèn)為其他領(lǐng)域也存在大模型重新改寫(xiě)其中底層技術(shù)的可能性。一旦能成功改寫(xiě),在應(yīng)用層就會(huì)取得巨大突破。 

基于此,我覺(jué)得OpenAI是新時(shí)代結(jié)構(gòu)性能力的提供者,它提供了一種大模型通用智能架構(gòu)和能力的輸出。但這個(gè)能力要想運(yùn)用在我們?nèi)粘9ぷ骰蛏a(chǎn)中,就需要針對(duì)場(chǎng)景進(jìn)行各種各樣的整體解決方案的打造。就相當(dāng)于一輛車(chē),如果只有發(fā)動(dòng)機(jī)也沒(méi)法跑,還需要輪子、座艙。

OpenAI提供了新時(shí)代人工智能的“發(fā)動(dòng)機(jī)”,這一點(diǎn)非常有價(jià)值。就好像有了蘋(píng)果這樣的硬件公司,基于移動(dòng)網(wǎng)絡(luò),產(chǎn)生了抖音、快手、微信等應(yīng)用,這是一層一層互相依存發(fā)展的。但做移動(dòng)網(wǎng)絡(luò)或者5G的公司,不一定能夠把手機(jī)做出來(lái),做手機(jī)的公司還能把APP也做好,它們需要的能力不是完全一樣的。

GPT解決了基座問(wèn)題,而且也給到了行業(yè)范例,很多開(kāi)源模型如Llama 2,以及國(guó)內(nèi)的一些開(kāi)源軟件,我覺(jué)得也可以用?,F(xiàn)在Sora出來(lái)了,最快再過(guò)6個(gè)月我覺(jué)得開(kāi)源的“Sora”可能也做得出來(lái)。因?yàn)榧夹g(shù)路線基本確定之后,有一些團(tuán)隊(duì)是可以做出來(lái)相當(dāng)能力的產(chǎn)品,所以我覺(jué)得Sora不太容易形成技術(shù)上的獨(dú)占性。 

因此,我覺(jué)得未來(lái)是分工合作的機(jī)會(huì),OpenAI確實(shí)是一個(gè)很好的領(lǐng)先者,但它不可能壟斷整個(gè)市場(chǎng)。

Sora相關(guān)的視頻模型的能力,我覺(jué)得未來(lái)在to C和to B都有機(jī)會(huì),因?yàn)樗且环N結(jié)構(gòu)性的能力。無(wú)論對(duì)于家庭、個(gè)人,還是企業(yè)、機(jī)器人等,它都能延伸到各個(gè)方面,只不過(guò)載體不同。比如進(jìn)入工廠制造領(lǐng)域,它需要跟機(jī)器人、加工機(jī)床的軟件結(jié)合;如果延伸到to C就一定要跟手機(jī)、筆記本電腦、Vision Pro等新型終端結(jié)合起來(lái)。 

目前大模型生成內(nèi)容并不完全可控,它有時(shí)有幻想、有時(shí)會(huì)瞎說(shuō),生成的視頻里面偶爾還存在問(wèn)題,這都需要應(yīng)用層的創(chuàng)業(yè)者去把它按照?qǐng)鼍斑M(jìn)行規(guī)劃、生成和使用。

因此,(即使Sora出現(xiàn))我覺(jué)得還存在大量創(chuàng)業(yè)機(jī)會(huì),不用擔(dān)心Sora或OpenAI能通吃。 

不過(guò),在部分大模型通用能力領(lǐng)域中,(創(chuàng)業(yè)公司)如果想跟大廠競(jìng)爭(zhēng),這對(duì)資源的要求非常高。但在垂直領(lǐng)域或行業(yè)領(lǐng)域里解決一些具體問(wèn)題,我覺(jué)得大廠能夠覆蓋的不一定多,也不一定有垂直領(lǐng)域的創(chuàng)業(yè)公司專(zhuān)業(yè)。 

對(duì)于大家談到的算力緊缺問(wèn)題,從整體上講,大模型的確是利用大量的數(shù)據(jù)和算力形成的模型能力,進(jìn)而去解決某些特定問(wèn)題,比如視頻生成、語(yǔ)言生成等。簡(jiǎn)單來(lái)說(shuō),我覺(jué)得它是一個(gè)用“大力出奇跡”的拆解模式去模擬世界或視頻生成中的一部分。當(dāng)模型的數(shù)據(jù)量越大,它的效果就越好。 

但我也認(rèn)為,到一定程度后,它可能就不需要更多算力、模型和數(shù)據(jù)了,在某個(gè)程度上它可能存在收斂的部分。盡管算力在里面起到了關(guān)鍵性作用,但我不認(rèn)為它是決定性部分。

此外,我覺(jué)得未來(lái)可能會(huì)產(chǎn)出針對(duì)性的算力芯片。新架構(gòu)算力硬件或芯片出現(xiàn)后,算力的瓶頸可能會(huì)取得突破性的進(jìn)展。我覺(jué)得可能需要一年時(shí)間驗(yàn)證我們面向未來(lái)的推測(cè)。


井英科技創(chuàng)始人、CEO朱江:

超級(jí)應(yīng)用有機(jī)會(huì)在中國(guó)誕生

我覺(jué)得Sora出來(lái)之后,對(duì)我們最有啟發(fā)的還是技術(shù)角度。我們覺(jué)得基于Diffusion Transformer的技術(shù)路線,接下來(lái)還會(huì)成為行業(yè)研發(fā)的熱點(diǎn);此外,Scaling Law在整個(gè)視頻生成領(lǐng)域也存在很大作用。

盡管從業(yè)內(nèi)來(lái)看,我們認(rèn)為(Sora的技術(shù)路線)不是一個(gè)新的東西,但OpenAI在整個(gè)實(shí)踐過(guò)程中令人非常敬佩,而且比我們預(yù)想的快了3~6個(gè)月的時(shí)間。

這對(duì)整個(gè)視頻生成相關(guān)行業(yè)都是一件好事,我們可以向投資人或者一些圈外的朋友回答一個(gè)問(wèn)題,就是AI生成的視頻,用戶(hù)是否愿意看,或者未來(lái)能否成為用戶(hù)視頻消費(fèi)的主流內(nèi)容。 

我們認(rèn)為AI加上內(nèi)容后,可能會(huì)給整個(gè)內(nèi)容的生產(chǎn)關(guān)系和創(chuàng)作者帶來(lái)變革,進(jìn)而會(huì)出現(xiàn)新一代的內(nèi)容平臺(tái)。比如抖音或TikTok的出現(xiàn),這就是基于手機(jī)的普及以及手機(jī)攝像頭作為生產(chǎn)力工具的載體變化;其次是短視頻這種形態(tài)的出現(xiàn),用戶(hù)在手機(jī)上可以全屏沉浸式地觀看視頻;配合30~60秒快節(jié)奏,手指滑動(dòng)就可以去閱讀視頻的體驗(yàn);以及圍繞著短視頻出現(xiàn)的表演型的創(chuàng)作者。得益于這幾個(gè)條件,市場(chǎng)上出現(xiàn)了新一代短視頻超級(jí)內(nèi)容平臺(tái)。 

總結(jié)超級(jí)內(nèi)容平臺(tái)出現(xiàn)的條件:首先是生產(chǎn)力工具的變革;其次是圍繞著生產(chǎn)力工具出現(xiàn)了新的創(chuàng)作者;第三是有一種非常適合創(chuàng)作的內(nèi)容形式;最后形成了一個(gè)新的內(nèi)容平臺(tái),內(nèi)容平臺(tái)是個(gè)結(jié)果。

那么,AIGC時(shí)代為什么一定會(huì)出現(xiàn)新的超級(jí)內(nèi)容平臺(tái)?第一是生產(chǎn)力工具發(fā)生了變革,我覺(jué)得以Diffusion Transformer為基礎(chǔ)的視頻生成模型,在今天讓所有人看到了AI生成的視頻。從質(zhì)量角度來(lái)說(shuō),一定能達(dá)到用戶(hù)可接受的程度。

第二,我覺(jué)得更重要的一點(diǎn)是出現(xiàn)了一群新的創(chuàng)作者,這群創(chuàng)作者既不是像YouTube平臺(tái)的知識(shí)型創(chuàng)作者,也不是像抖音上的表演型創(chuàng)作者,而是出現(xiàn)了一群以創(chuàng)意為最核心競(jìng)爭(zhēng)力的創(chuàng)作者。換句話說(shuō),就是只要?jiǎng)?chuàng)作者的腦海里有一個(gè)很好的故事,或者是有一個(gè)非常優(yōu)美打動(dòng)人心的情節(jié),就可以用AIGC的工具把它生成出來(lái)。

第三,我們理解的短劇不單單是現(xiàn)在大家看到的一個(gè)個(gè)劇情很爽、節(jié)奏很快的內(nèi)容,我們認(rèn)為短劇其實(shí)是一種新的內(nèi)容形式。它是一種長(zhǎng)短視頻結(jié)合的方式,單看每一集,其實(shí)它是一個(gè)短視頻,有30~60秒,但把它連在一起100集時(shí),它又表達(dá)了一個(gè)很長(zhǎng)很有深度的故事,就像原來(lái)的電影,但換了新的方式去表達(dá)。 

因此,我認(rèn)為圍繞新工具的創(chuàng)作者以及新內(nèi)容形式的出現(xiàn),最終會(huì)催生出一個(gè)新的內(nèi)容平臺(tái),這也是我們一直非常看好的機(jī)會(huì)。去年年底,我們也面向美國(guó)地區(qū)發(fā)布了第一款短劇的APP Reel.AI,我們現(xiàn)在生成的內(nèi)容其實(shí)在海外也取得了不錯(cuò)的成績(jī):單集內(nèi)容已經(jīng)有了上百萬(wàn)的播放量;生成的內(nèi)容也在美國(guó)地區(qū)獲得了一定的用戶(hù)付費(fèi)。

因此,我們認(rèn)為AIGC時(shí)代有很多機(jī)會(huì),OpenAI這樣的模型基座公司可能是新一代的“水電煤”,在此之上一定也會(huì)有AIGC時(shí)代的超級(jí)應(yīng)用型公司。

我也更相信中國(guó)公司能做出世界級(jí)的AIGC的超級(jí)內(nèi)容平臺(tái)。因?yàn)檫^(guò)去這幾年,我覺(jué)得中國(guó)人對(duì)整個(gè)內(nèi)容的理解,包括技術(shù)的結(jié)合其實(shí)更加深入,我們也一直在這條道路上。我們希望能夠隨著視頻技術(shù)的進(jìn)步快速達(dá)到臨界點(diǎn),加速去實(shí)現(xiàn)我們自己的愿景。


行者AI創(chuàng)始人、CEO尹學(xué)淵:

人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI

去年,部分公司已經(jīng)發(fā)布了一些(視頻)模型,但目前的效果都不盡如人意。而Sora的出現(xiàn),在速度和質(zhì)量上大大超出了我們的預(yù)期。且Sora采用的Transformer和Diffusion模型融合的技術(shù)路線,是非常別出心裁的,也給我們團(tuán)隊(duì)包括創(chuàng)業(yè)者帶來(lái)了很多啟發(fā)和思路。

同時(shí),文生視頻模型出現(xiàn)的時(shí)間點(diǎn)提前了,各行各業(yè)可能都會(huì)衍生出更多新機(jī)會(huì),也能刺激更多人來(lái)?yè)肀д麄€(gè)AI行業(yè),包括更多研究者投入AI領(lǐng)域共同推進(jìn)技術(shù)進(jìn)步。

與此同時(shí),底層工具的更新迭代讓AI工具唾手可得后,未來(lái)行業(yè)競(jìng)爭(zhēng)主要會(huì)面向應(yīng)用場(chǎng)景的理解、產(chǎn)品的交付上,像游戲、文旅、教育、營(yíng)銷(xiāo)等場(chǎng)景,要將AI真正落地應(yīng)用,這也對(duì)創(chuàng)業(yè)者提出了更高要求。過(guò)去,創(chuàng)業(yè)者可能靠一個(gè)模型、算法,再做一個(gè)BP(融資商業(yè)計(jì)劃書(shū)),就可以融資;但現(xiàn)在底層技術(shù)已經(jīng)卷到這個(gè)高度了,必然就要求創(chuàng)業(yè)者能夠通過(guò)對(duì)場(chǎng)景的理解,以及產(chǎn)品的交付,真正實(shí)現(xiàn)在市場(chǎng)上掙到錢(qián),再進(jìn)一步去融資,實(shí)現(xiàn)正循環(huán)。

至于OpenAI是否會(huì)取代其他創(chuàng)業(yè)公司,我覺(jué)得不太可能。ChatGPT和GPT-4已經(jīng)出現(xiàn)一年多了,但在細(xì)分領(lǐng)域大家運(yùn)用的也不完全是GPT的能力,更多的還是在使用創(chuàng)業(yè)公司的自研模型以及微調(diào)后的模型解決具體問(wèn)題。 

找準(zhǔn)賽道、真正持續(xù)為用戶(hù)產(chǎn)生價(jià)值才是最重要的。除極少數(shù)的底層研究以外,通用大模型的落地同樣要考慮“最后一公里”的問(wèn)題。創(chuàng)業(yè)團(tuán)隊(duì)需要通過(guò)數(shù)據(jù)、算法、模型、應(yīng)用,在場(chǎng)景落地獲得經(jīng)濟(jì)收益,實(shí)現(xiàn)正循環(huán),進(jìn)一步獲取數(shù)據(jù)調(diào)用模型,掙到錢(qián)后把人才留住,再調(diào)優(yōu)算法,吸引更多用戶(hù)使用產(chǎn)生更多的數(shù)據(jù),整個(gè)項(xiàng)目就跑起來(lái)了,創(chuàng)業(yè)公司或產(chǎn)品也很難會(huì)被替代掉。

因此,AI時(shí)代的創(chuàng)業(yè)公司被OpenAI替代并不是一件非常簡(jiǎn)單的事情,并不是說(shuō)OpenAI搞定了一件事,其他人就都要失業(yè)了。 

相反,我覺(jué)得人工智能賽道的每一位創(chuàng)業(yè)者都應(yīng)該感謝OpenAI。如果沒(méi)有OpenAI開(kāi)啟的這兩次浪潮,沒(méi)有人關(guān)注AI目前是怎么回事兒。國(guó)內(nèi)基本上使用的是國(guó)產(chǎn)大模型,也給中國(guó)的創(chuàng)業(yè)者帶來(lái)了更多機(jī)會(huì)。


來(lái)源:《中國(guó)企業(yè)家》

作者:孔月昕

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【孔月昕】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞