AI視頻“卷”成紅海,創(chuàng)業(yè)公司還有機會嗎

任曉寧2024-09-14 16:56

經(jīng)濟觀察報 記者 任曉寧 9月11日,AI視頻創(chuàng)業(yè)公司生數(shù)科技創(chuàng)始團隊在北京亮相,這是今年4月份在中關(guān)村論壇一炮而紅后,生數(shù)科技團隊成員的首次露面。

生數(shù)科技的產(chǎn)品名為Vidu,是國內(nèi)首個長時長、高一致性、高動態(tài)性視頻大模型,當(dāng)時備受外界關(guān)注。不過時至9月,AI視頻行業(yè)已經(jīng)有了很大變化,Vidu不再一枝獨秀,快手、字節(jié)跳動、阿里巴巴、智譜AI、MiniMax、商湯等公司都已經(jīng)推出AI視頻產(chǎn)品。據(jù)經(jīng)濟觀察報不完全統(tǒng)計,僅在國內(nèi),過去4個月時間便有超過10家公司推出了自研AI視頻產(chǎn)品。

東吳證券今年8月發(fā)布的國產(chǎn)AI視頻大模型深度報告測算,AI視頻的潛在行業(yè)空間為3178億元。東吳證券還估算,在全AI模式下,電影、長劇、動畫片和短劇的制作成本,相較傳統(tǒng)模式將下降超過95%。

AI視頻的未來聽起來很美好,但這個領(lǐng)域,目前并沒有出現(xiàn)一個出圈的爆款應(yīng)用。無論是AI視頻產(chǎn)品還是由AI生成的視頻作品,都像是少數(shù)影視專業(yè)人士的玩具,局限在小圈子范圍內(nèi),始終未能像ChatGPT(美國頭部AI應(yīng)用)一樣在大眾層面獲得認(rèn)可。

AI視頻賽道能成為大眾市場嗎?它的商業(yè)機會在哪里?大廠入局之后,它的市場競爭愈加激烈,創(chuàng)業(yè)公司還有機會嗎?生數(shù)科技CEO唐家渝接受經(jīng)濟觀察報在內(nèi)的媒體采訪時,回應(yīng)了上述問題。

關(guān)于競爭和融資

經(jīng)濟觀察報:Vidu發(fā)布4個月以來,國內(nèi)陸續(xù)出現(xiàn)很多AI視頻公司,頭部大廠也都推出了AI視頻產(chǎn)品。作為曾經(jīng)的黑馬,Vidu現(xiàn)在還有優(yōu)勢嗎?

唐家渝:目前在AI視頻語義理解方面,我們能做到業(yè)界最好。另外Vidu在視頻動作幅度較大的情況下,能保持較好的連貫性,用戶公認(rèn)這一點我們做得好。我們最近發(fā)布了AI視頻主體參照一致性生成能力,這是全球首發(fā)的能力,可以解決AI生成視頻的劇情連貫性問題。從這些技術(shù)角度,我們是有優(yōu)勢的。

Vidu在全球最早提出了Diffu-sion(擴散模型)與Transformer(一種基于自注意力機制的深度學(xué)習(xí)模型)融合的底層架構(gòu)U-ViT,并堅持自主的底層算法研發(fā),沒有采用開源結(jié)構(gòu),這也是我們的底氣。

經(jīng)濟觀察報:國內(nèi)AI視頻公司已經(jīng)有10多家,大家的技術(shù)路線和商業(yè)化路徑會不會出現(xiàn)同質(zhì)化趨勢?

唐家渝:在技術(shù)路線上,AI視頻行業(yè)目前處于底層架構(gòu)收斂的狀態(tài),可以理解為同質(zhì)化,但并不意味著大家進(jìn)展都一樣。例如現(xiàn)在的大語言模型都會使用 Transformer架構(gòu),但OpenAI(美國頭部AI公司)是明顯領(lǐng)先的。

在底層架構(gòu)統(tǒng)一的基礎(chǔ)上,各個公司會有一些差異性。例如,如何有效壓縮視頻,如何在保證質(zhì)量的情況下快速生成視頻,會涉及非常多算法技巧、算法難點,這是導(dǎo)致差異性的主要原因。

目前各個公司的商業(yè)方向也是比較類似的,即便是Sora、Runway等國外AI視頻應(yīng)用,也都在積極地?fù)肀Ш萌R塢,或者與廣告公司合作,這是AI視頻技術(shù)比較好落地的領(lǐng)域??傮w來說,AI視頻還處于行業(yè)發(fā)展前期,還有很長的路要走。

經(jīng)濟觀察報:今年6月,生數(shù)科技公布了數(shù)億元融資,接下來會有什么樣的融資規(guī)劃?今年大模型公司融資都面臨一個困境,很難依靠技術(shù)和團隊吸引投資,投資方會要求商業(yè)化能力。你們是否也面臨同樣的問題?

唐家渝:我們正在做新一輪的融資。融資過程中,技術(shù)仍是很關(guān)鍵的東西,目前的AI視頻生成只是初步符合了物理規(guī)律,還有很高的技術(shù)天花板需要突破,比如更強的模型能力以及更多模態(tài)的協(xié)同生成。

我們經(jīng)過一年半的成長,在商業(yè)化方面已經(jīng)階段性交出了比較好的答卷。其實大家耳熟能詳?shù)囊恍┐罂蛻?,已?jīng)接入了Vidu的底層視頻生產(chǎn)能力了,只是我們目前還不能公布。

經(jīng)濟觀察報:你們會如何選擇投資者?有什么考量?

唐家渝:我們會更愿意選擇長期陪伴的投資者,無論是從資源、戰(zhàn)略協(xié)同上,還是上下游產(chǎn)業(yè)上,我覺得都可以接受,最主要的還是希望大家能有長期一起往前走的機會。

關(guān)于商業(yè)化

經(jīng)濟觀察報:現(xiàn)在Vidu是否已經(jīng)商業(yè)化?有哪些已經(jīng)落地的商業(yè)場景?

唐家渝:商業(yè)模式主要有兩種。一種是SaaS(軟件即服務(wù))訂閱模式,用戶打開Vidu.studio可以直接體驗到產(chǎn)品功能。目前我們每月有80個免費積分,如果用戶有更多的需求或想使用更高級的能力,就需要支付訂閱費用。另一種是API(應(yīng)用程序編程接口)形式,將模型能力輸出形式提供給大家,即MaaS(模型即服務(wù))。現(xiàn)在有很多客戶需要具備視頻生成的能力,作為他們已有工作流程的一個環(huán)節(jié),所以他們希望直接調(diào)用模型的能力。

我們的客戶主要來自與視頻內(nèi)容相關(guān)的領(lǐng)域,比如廣告、游戲、短劇和影視等。另一部分客戶是C端(個人用戶端)應(yīng)用,他們需要AI視頻能力支撐他們的新玩法。

經(jīng)濟觀察報:在C端市場和B端(企業(yè)客戶端)行業(yè),哪個領(lǐng)域的AI視頻增長潛力更大?

唐家渝:B端的需求比較穩(wěn)定、確定,能帶來比較直接的收入。在接觸B端行業(yè)的過程中,我們發(fā)現(xiàn),他們提出的都是實實在在的需求,并不是還沒想清楚就簡單試一下,所以B端是我們長期重點關(guān)注的方向。

上線一個月以來,我們的C端用戶增長曲線非常高。所以,我們也在不斷探索C端商業(yè)化的過程中。

經(jīng)濟觀察報:現(xiàn)在AI視頻主要是藝術(shù)家、影視專業(yè)人員在用,普通人用一下就不用了。這個工具什么時候能普及到大眾?會不會一直只是小眾人群的玩具?

唐家渝:AI視頻不會一直都是小眾產(chǎn)品。就像拍照一樣,一開始只是攝影愛好者或攝影師群體使用,現(xiàn)在拍視頻、拍照已經(jīng)成為每個人的習(xí)慣。

現(xiàn)在的AI視頻已經(jīng)發(fā)展到了一個節(jié)點,Vidu最新發(fā)布的功能是,只需輸入一張圖像,就可以保持該主體的一致性,生成各種場景的視頻。我們正在努力降低視頻創(chuàng)作的門檻,讓Vidu成為一個大眾愿意使用的產(chǎn)品,今年年底應(yīng)該就能普及到大眾。

關(guān)于局限和突圍

經(jīng)濟觀察報:很多人覺得用AI生成視頻很難,為什么會這樣?視頻生成技術(shù)還存在怎樣的局限性或瓶頸?

唐家渝:目前的視頻生成模型最大的局限性在于可控性不足。比如生成一段畫面,畫面里的人物或者對象容易崩壞,生成的結(jié)果也有很大的隨機性,需要不斷地嘗試,這背后的本質(zhì)是目前視頻生成技術(shù)的穩(wěn)定性還不夠。

從實際落地的層面上看,上面我們提到的廣告、短劇等場景,對畫面連續(xù)性、一致性的要求是很高的。即便是C端用戶單純?nèi)ネ?,也會希望能一次性就生成一個他們想要的畫面,這背后都是圍繞可控性的需求。

經(jīng)濟觀察報:這種不可控的瓶頸能否實現(xiàn)突破?如果技術(shù)繼續(xù)進(jìn)步,會在哪些方面有所提高?

唐家渝:我們剛剛發(fā)布的主體參照功能,已經(jīng)在一致性生成方面帶來了很大提升。

當(dāng)然,技術(shù)還有更進(jìn)一步提升的空間。比如一個精雕細(xì)琢的柜子,上面有繁復(fù)花紋和鏤空部分,對于這樣復(fù)雜的結(jié)構(gòu),目前AI視頻生成成功的概率依舊不高。場景生成包含很多組成因素,例如AI視頻生成的一款運動鞋,我希望它能在更復(fù)雜、更動態(tài)化的場景中有更好的表現(xiàn)。這些都需要不斷提升模型能力。

 

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
TMT新聞部資深記者
關(guān)注并報道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長行業(yè)分析、深度報道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號:tangtangxiaomo

熱新聞

電子刊物

點擊進(jìn)入