專(zhuān)訪階躍星辰姜大昕:Scaling Law是通往AGI的必要非充分條件

伍洋宇2024-05-02 07:38

中國(guó)通用大模型領(lǐng)域如今已跑出了六家獨(dú)角獸公司——其中只有一家,搜不到任何公開(kāi)估值,甚至沒(méi)有融資新聞,就已經(jīng)被市場(chǎng)默認(rèn)列入“獨(dú)角獸”隊(duì)伍。這家公司就是階躍星辰。

喧囂沸騰的“百模大戰(zhàn)”中,階躍星辰以近乎沉寂的狀態(tài)低調(diào)了一年,直到今年3月才浮出水面。

其發(fā)布的Step系列大模型是一套完整的“組合拳”:Step-1千億參數(shù)語(yǔ)言大模型、Step-1V千億參數(shù)多模態(tài)大模型,以及Step-2萬(wàn)億參數(shù)MoE(混合專(zhuān)家架構(gòu))語(yǔ)言大模型預(yù)覽版。

Step-1V一經(jīng)發(fā)布便登上了OpenCompass多模態(tài)大模型3月榜榜首,二三名分別是阿里的QWen-VL-Max以及谷歌的GeminiProVision,OpenAI的GPT-4V位列第四。

Step-2預(yù)覽版則是國(guó)內(nèi)大模型初創(chuàng)公司首次公開(kāi)萬(wàn)億參數(shù)MoE語(yǔ)言大模型。理論上而言,這是逼近GPT-4發(fā)布初始水平的關(guān)鍵節(jié)點(diǎn)。

不多言不多語(yǔ),但一登臺(tái)就炸場(chǎng)的姿態(tài),大概足以形容階躍星辰的行事風(fēng)格。

在幕后掌控這家公司行為調(diào)性的人是姜大昕。2023年創(chuàng)業(yè)之前,姜大昕是微軟全球副總裁、微軟亞洲互聯(lián)網(wǎng)工程研究院(STCA)的首席科學(xué)家,主導(dǎo)過(guò)微軟搜索引擎Bing,以及智能語(yǔ)音助手Cortana、微軟云Azure、辦公全家桶Microsoft 365等一系列微軟當(dāng)家產(chǎn)品的自然語(yǔ)言理解系統(tǒng)。

深厚的技術(shù)背景使其習(xí)慣于嚴(yán)謹(jǐn)和客觀地表達(dá)。談及技術(shù)細(xì)節(jié),他會(huì)給出明確的判斷:“如果大語(yǔ)言模型要上萬(wàn)億參數(shù),MoE架構(gòu)幾乎是必然選擇?!?/p>

他信仰Scaling Law(規(guī)模法則),認(rèn)為在肉眼可見(jiàn)的未來(lái),至少還有十萬(wàn)億和百萬(wàn)億兩個(gè)數(shù)量級(jí),但并不排除腦神經(jīng)科學(xué)領(lǐng)域有朝一日能夠在Scaling Law和多模態(tài)之外找到通往AGI(通用人工智能)的可能。 

一些公司合作方會(huì)用“實(shí)在”來(lái)形容他。這種描述矛盾而統(tǒng)一,因?yàn)樗葧?huì)揚(yáng)言“我們的多模理解國(guó)內(nèi)第一”,也會(huì)承認(rèn)“還在追趕去年發(fā)布的GPT-4”。背后所依托的邏輯是他所掌握和相信的技術(shù)現(xiàn)實(shí)。

在微軟16年,姜大昕說(shuō)自己形成最堅(jiān)不可摧的認(rèn)知是開(kāi)放心態(tài)和“growth mindset”(成長(zhǎng)型思維)——這是老東家微軟的文化之一,也是他決定創(chuàng)業(yè)的心境來(lái)源。 

他判斷“上一代搜索已經(jīng)做到頭了”。從“Boosting Tree”(提升樹(shù))到神經(jīng)網(wǎng)絡(luò)興起,從CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))再到BERT(谷歌團(tuán)隊(duì)提出的一種自然語(yǔ)言處理預(yù)訓(xùn)練技術(shù)),姜大昕曾把每一代技術(shù)都用進(jìn)搜索,使其實(shí)現(xiàn)從“馬車(chē)”到“汽車(chē)”的轉(zhuǎn)變。

直到2022年ChatGPT橫空出世,他意識(shí)到,這是從“地上跑”到“天上飛”的質(zhì)變。

因此,如果你不知道對(duì)這家新出現(xiàn)的公司具體期待什么,不妨期待它會(huì)如何定義下一代搜索,畢竟它擁有傳統(tǒng)搜索引擎時(shí)代最有話語(yǔ)權(quán)的團(tuán)隊(duì)之一。

階躍星辰會(huì)如何用大模型來(lái)定義下一代搜索?又如何追上與GPT-4的差距?姜大昕給出了自己的答案。

以下為姜大昕采訪實(shí)錄(界面新聞略作編輯): 

技術(shù)只是窗口期,不是護(hù)城河

界面新聞:你們算是國(guó)內(nèi)第一個(gè)公布萬(wàn)億參數(shù)MoE大模型的公司,之前一直保持低調(diào),現(xiàn)在希望在行業(yè)里樹(shù)立一個(gè)什么樣的認(rèn)知?

姜大昕:去年國(guó)內(nèi)開(kāi)始提“百模大戰(zhàn)”,但很多公司是針對(duì)行業(yè)或者應(yīng)用場(chǎng)景發(fā)布了大模型,真正從頭開(kāi)始做通用大模型的滿(mǎn)打滿(mǎn)算十幾二十家,相當(dāng)于已經(jīng)做完第一輪分化。

我們認(rèn)為通用大模型還會(huì)走得更遠(yuǎn),往后發(fā)展有兩個(gè)維度:一個(gè)是Scaling Law,從千億到萬(wàn)億參數(shù),甚至到百萬(wàn)億;另外光做語(yǔ)言模型是不夠的,要想達(dá)到所謂的通用人工智能,就要做多模態(tài)理解和生成的融合,首先要做一個(gè)多模態(tài)理解的模型。

沿著這兩條路,公司發(fā)布了萬(wàn)億參數(shù)語(yǔ)言大模型的預(yù)覽版Step-2,以及多模態(tài)大模型Step-1V。這代表了我們?cè)贕PT-3.5之后兩個(gè)很重要的觀點(diǎn),一個(gè)是模型要大,二是多模態(tài)理解和生成的統(tǒng)一是通往AGI的必經(jīng)之路。

界面新聞:?jiǎn)螐哪P偷慕嵌龋趺蠢斫饽銈兣cGPT-4之間的差距?比如Minimax剛剛發(fā)了abab 6.5,也是萬(wàn)億參數(shù)MoE大模型,他們會(huì)展示各種開(kāi)源測(cè)試集的結(jié)果比對(duì)。

姜大昕:這是個(gè)很有意思的問(wèn)題。前段時(shí)間在迪拜的世界政府峰會(huì)上,OpenAI首席執(zhí)行官Sam Altman有一個(gè)觀點(diǎn)很出圈,我覺(jué)得很對(duì)。

他說(shuō)GPT-5對(duì)比GPT-4,是各個(gè)維度都強(qiáng)了一圈。這句話字面意思是“我的通用能力變強(qiáng)了”,但反過(guò)來(lái)講還有一個(gè)意思是,“我朝著某一個(gè)維度方向去打磨也可以很強(qiáng)”。通過(guò)犧牲一些維度去增強(qiáng)另一個(gè)維度,這個(gè)維度可以強(qiáng)過(guò)GPT-4。就好像一個(gè)大學(xué)生和一個(gè)學(xué)習(xí)了焊工、鉗工的初中生相比,后者可以在某個(gè)維度上超過(guò)大學(xué)生。所以刷榜并不是特別科學(xué),因?yàn)轭}都是公開(kāi)的。 

有些說(shuō)法甚至非常有誤導(dǎo)性。比如說(shuō)“全方位能力達(dá)到了GPT-4的90%”,聽(tīng)著很牛,但假設(shè)GPT-4在某個(gè)能力上是90分,你做到90%就是81分,看上去好像也不錯(cuò)。但反過(guò)來(lái)想,GPT-4的錯(cuò)誤率是10,你的錯(cuò)誤率是19,幾乎是人家的兩倍,在應(yīng)用的時(shí)候體感肯定是不一樣的,用戶(hù)只會(huì)覺(jué)得你做對(duì)是應(yīng)該的,但會(huì)記住你的錯(cuò)誤比別人多了近一倍。

界面新聞:和GPT-4的通用能力對(duì)比,你們對(duì)Step-2下的結(jié)論是什么?

姜大昕:GPT-4是動(dòng)態(tài)的,我們現(xiàn)在的模型也還在最后的打磨階段,希望到今年上半年整個(gè)打磨完成以后,能夠?qū)?biāo)去年GPT-4剛出來(lái)的水平。

界面新聞:現(xiàn)在國(guó)內(nèi)的通用大模型是不是還在集體追趕GPT-4剛剛發(fā)布的狀態(tài)?

姜大昕:對(duì)。這是一個(gè)相對(duì)務(wù)實(shí)的目標(biāo),我們不會(huì)動(dòng)不動(dòng)就說(shuō)我們超過(guò)GPT-4,沒(méi)有這個(gè)必要去吸引眼球。因?yàn)槟憧梢杂懈鞣N辦法在一些小維度上超過(guò)它,甚至分分鐘就可以超過(guò),但這有什么意義?

界面新聞:Step-2采用的MoE架構(gòu),現(xiàn)在也很受關(guān)注。這種架構(gòu)響應(yīng)速度、推理效率都更快更高,但也存在訓(xùn)練穩(wěn)定性、通信成本等問(wèn)題。階躍是什么時(shí)候決定以及為什么決定采用這個(gè)架構(gòu)?怎么去克服這個(gè)架構(gòu)本身可能存在的一些問(wèn)題?

姜大昕:想把模型參數(shù)擴(kuò)大到萬(wàn)億的話,MoE幾乎是一個(gè)必選項(xiàng)。就像做科研或者做工程,很多決策就是各個(gè)維度之間的最佳平衡,MoE也是在性能、參數(shù)量、訓(xùn)練成本、推理成本這些維度權(quán)衡下的最佳選擇。

至于說(shuō)它要解決的很多挑戰(zhàn),我覺(jué)得這就是OpenAI的核心技術(shù),我們要想繼續(xù)往上攀登的話,這個(gè)問(wèn)題遲早要解決。

我們自建機(jī)房是一個(gè)巨大的優(yōu)勢(shì),因?yàn)榭梢杂兴杏布募?xì)節(jié)。我們是系統(tǒng)組、算法組從硬件開(kāi)始就做一個(gè)聯(lián)合的優(yōu)化。 

界面新聞:商業(yè)模式上,你們是toB(企業(yè))和toC(消費(fèi)者)一起做嗎?

姜大昕:不算,我們主力還是在toC。toB的話,我們不是一單一單接的典型打法,是只選擇一些大行業(yè)。比如說(shuō)和上海報(bào)業(yè)旗下的界面財(cái)聯(lián)社成立一個(gè)合資公司,由這家公司去承接生意,我們提供算法和模型。 

界面新聞:如何看待C端產(chǎn)品的商業(yè)前景?很多人認(rèn)為C端極易打價(jià)格戰(zhàn),那它能成立的、有健康現(xiàn)金流的商業(yè)形態(tài)會(huì)是什么樣?

姜大昕:這一輪雖然技術(shù)上發(fā)生了很大的變革,但我覺(jué)得技術(shù)不是護(hù)城河,技術(shù)只能給你一個(gè)窗口期。在這個(gè)窗口期內(nèi),你一定要構(gòu)建公司產(chǎn)品的護(hù)城河。

我覺(jué)得沒(méi)有什么新鮮的,商業(yè)模式基于人的需求,而需求這么多年不會(huì)變?,F(xiàn)在只是說(shuō)技術(shù)變了,找到產(chǎn)品能夠賣(mài)出的商業(yè)模式就完了。

永遠(yuǎn)記住年輕人比你更牛

界面新聞:有人說(shuō)你們算是國(guó)內(nèi)最后一家大模型公司,你怎么看?會(huì)不會(huì)覺(jué)得入局比較晚?

姜大昕:我覺(jué)得不晚,而且我也不認(rèn)為我們一定是最后一家,可能哪一天又冒出來(lái)一家。

界面新聞:當(dāng)初為什么選擇在上海注冊(cè)公司? 

姜大昕:上海對(duì)人工智能有一個(gè)總體生態(tài)上的布局,從芯片到通用大模型,再到各行各業(yè)的應(yīng)用,規(guī)劃得非常清楚。上海的環(huán)境也很適合創(chuàng)業(yè),比如徐匯、濱江,有非常多的創(chuàng)業(yè)公司。 

界面新聞:在微軟的16年,讓你積淀下來(lái)最堅(jiān)不可摧的認(rèn)知和能力是什么?

姜大昕:開(kāi)放的心態(tài),還有就是微軟有個(gè)“growth mindset”(成長(zhǎng)型思維模式)。意思是不要被過(guò)去的一些認(rèn)知所局限,空杯心態(tài)、仰望星空。

過(guò)去的知識(shí)也許可以幫你判斷一件事情的價(jià)值,但也要多聽(tīng)取別人的意見(jiàn),選擇性吸收,最終是讓自己不要活在過(guò)去。你要永遠(yuǎn)知道,年輕人比你更牛,這個(gè)事情在我們公司是非常非常正確的,年輕人也是最厲害的。

界面新聞:在大模型領(lǐng)域創(chuàng)業(yè)的人,有楊植麟這樣帶著“天才少年”標(biāo)簽的,有王小川這種有成功創(chuàng)業(yè)經(jīng)驗(yàn)的,也有你這樣在科技巨頭統(tǒng)領(lǐng)重要業(yè)務(wù)線的人,你覺(jué)得這個(gè)行業(yè)這一代領(lǐng)軍人物之間,最終拼的是什么?

姜大昕:個(gè)人有個(gè)人的特點(diǎn),我覺(jué)得這對(duì)企業(yè)是個(gè)好處。每個(gè)企業(yè)會(huì)有自己獨(dú)特的文化價(jià)值觀,還有組織基因,有各自成功的路徑。

界面新聞:這種價(jià)值觀或者組織基因,可能會(huì)讓公司在什么事情上變得特別不同或者有優(yōu)勢(shì)?

姜大昕: 它會(huì)影響到方方面面,這個(gè)東西講起來(lái)很虛,但又很實(shí)在,因?yàn)闀?huì)決定做事的方式。 

比如一些企業(yè)合作方聽(tīng)完我們的介紹以后,會(huì)用“實(shí)在”來(lái)形容我們。我就問(wèn),您說(shuō)這話是一個(gè)褒義詞還是個(gè)貶義詞(笑)。對(duì)方的意思是,他走訪了很多公司,基本上每家都會(huì)或多或少說(shuō)比GPT-4做得好,只有到了我們這里,我說(shuō)我們?cè)谧汾sGPT-4,承認(rèn)跟GPT-4之間還有差距。

界面新聞:階躍現(xiàn)在有大概150人,團(tuán)隊(duì)規(guī)模的增長(zhǎng)曲線是怎樣的? 

姜大昕:我們一開(kāi)始招人比較快,把訓(xùn)練初始版本模型的人給招起來(lái)了。中間有一段時(shí)間相對(duì)來(lái)說(shuō)比較慢,產(chǎn)品還是在小步往前探索階段,那段時(shí)間并沒(méi)有進(jìn)很多人。產(chǎn)品剛跑起來(lái)的時(shí)候,可能就10個(gè)人。后來(lái)到了下半年,我們才開(kāi)始擴(kuò)招產(chǎn)品和工程體系的同學(xué),然后才有冒泡。

界面新聞:行業(yè)里像百川智能、Minimax等,大概都是兩三百人的體量,你怎么理解大模型公司人才密度的問(wèn)題? 

姜大昕:這個(gè)領(lǐng)域說(shuō)人才密度這件事我是認(rèn)可的。這里面涉及兩件事,一個(gè)是平均人才密度,還有一個(gè)就是,一家公司里最頂尖的那幾個(gè)人決定了大模型的高度,100個(gè)人未必干得過(guò)那10個(gè)人,所以系統(tǒng)、數(shù)據(jù)、算法這三個(gè)維度我們都要有最頂級(jí)的人才。

最近我非常高興的事情是算法團(tuán)隊(duì)又壯大了一些。因?yàn)閺腉PT-3.5到GPT-4,一方面你要有算法能力,另外就是系統(tǒng)要跟上,但如果要探索我說(shuō)的那條路徑,從單模態(tài)到多模態(tài),需要很多不同領(lǐng)域的算法人才。

我現(xiàn)在在各個(gè)方向都找到了頂尖的人才,這也是我“浮出”之后的好處。

界面新聞:每一個(gè)加入的人你都會(huì)自己親自面試嗎?

姜大昕:對(duì)于這些leader我會(huì)的,而且都不是面試,真的是聊天、吃飯,有的還聊了好幾次,吃了好幾次。 

界面新聞:感覺(jué)你在融資信息的發(fā)布上挺謹(jǐn)慎的,但其他家都宣傳得很熱鬧。為什么階躍不怎么去提融資的事情?

姜大昕:我覺(jué)得沒(méi)有必要。我們最終的目標(biāo)是把模型訓(xùn)出來(lái),那我們知道自己的融資節(jié)奏和方式就好。

界面新聞:但如果有高融資或者高估值,應(yīng)該也更容易在市場(chǎng)上建立頭部印象?

姜大昕:現(xiàn)在的好處是,人工智能領(lǐng)域確實(shí)有一批投資人是非常懂的,他們知道這是一個(gè)長(zhǎng)期且比較耗錢(qián)的項(xiàng)目,也愿意相信我們的技術(shù)實(shí)力。 

通往AGI之路,十萬(wàn)億不是盡頭

界面新聞:你所信仰的AGI可以怎樣概括?

姜大昕:AGI目前確實(shí)沒(méi)有一個(gè)準(zhǔn)確的定義,我也不想給它一個(gè)(定義),只能非常概括地說(shuō),達(dá)到人的智能就叫AGI 。而且我覺(jué)得這里面最重要的一個(gè)字就是“G”(general),通用。

界面新聞:你給公司規(guī)劃了“單模態(tài)-多模態(tài)-多模理解和生成的統(tǒng)一-世界模型-AGI”的路徑,每個(gè)階段要走多長(zhǎng)時(shí)間是可估算的嗎?

姜大昕:不好預(yù)測(cè)。就像我看到ChatGPT之前,都還會(huì)說(shuō)自然語(yǔ)言處理這件事,常識(shí)和推理需要十年二十年來(lái)解決,結(jié)果一夜之間就解決了。所以有的科學(xué)突破可能在積累上早就發(fā)生了,但有點(diǎn)像大家說(shuō)的“涌現(xiàn)”,只看到“砰”地一下上去了,是一種跳變。但這個(gè)朝著目標(biāo)邁進(jìn)的過(guò)程,只要沒(méi)有達(dá)到那個(gè)點(diǎn),它就是0。

界面新聞:階躍對(duì)于明年有什么具體的目標(biāo)?

姜大昕:朝著GPT-4.5/5去努力,一個(gè)是規(guī)模擴(kuò)大到10萬(wàn)億參數(shù),第二個(gè)是從能力上,我希望明年對(duì)多模理解和生成的統(tǒng)一有突破,能夠同時(shí)理解和生成。

整條線我們都看得很清楚了,包括我們處在什么階段、什么是確定性的,接下來(lái)肯定是在現(xiàn)有的確定性基礎(chǔ)上再往前走。 

界面新聞:達(dá)到萬(wàn)億參數(shù)模型之后,推進(jìn)Scaling Law最難的事情是什么? 

姜大昕:最難的不是一件,是四件事情,就是我們說(shuō)的算力、系統(tǒng)、數(shù)據(jù)、算法。

界面新聞:感覺(jué)你是一個(gè)非常堅(jiān)信Scaling Law的人,這個(gè)定律有到頭的時(shí)候嗎?

姜大昕:這是個(gè)很好的問(wèn)題。在肉眼可見(jiàn)的未來(lái),我覺(jué)得至少還有兩個(gè)數(shù)量級(jí)。我們到年中應(yīng)該才算真正攀上去萬(wàn)億,那么10萬(wàn)億是個(gè)確定性事件,一定會(huì)攀。

界面新聞:10萬(wàn)億對(duì)應(yīng)的是GPT-5?

姜大昕:不知道是GPT-4.5還是GPT-5,就看OpenAI下一個(gè)模型出來(lái)的是個(gè)什么。其實(shí) GPT-4是2022年10月份就訓(xùn)完了,去年4月份發(fā)布是因?yàn)樗髞?lái)打磨又用了6個(gè)月時(shí)間,跟我們現(xiàn)在狀態(tài)差不多。

雖然OpenAI年初發(fā)布了Sora,但最新一代大模型到底叫GPT-4.5還是GPT-5,多大參數(shù)規(guī)模,都不知道。我們基于它的能力、路線,包括它用的卡做一個(gè)推測(cè)的話,至少是個(gè)10萬(wàn)億級(jí)別。 

界面新聞:那第二個(gè)數(shù)量級(jí)就要到百萬(wàn)億。

姜大昕:這里有一個(gè)參考,就是人腦的神經(jīng)元連接是200萬(wàn)億,但我覺(jué)得不是一個(gè)特別有效的參考,因?yàn)槿撕蜋C(jī)器現(xiàn)在沒(méi)有任何可直接對(duì)比的關(guān)系,可能只是給人一個(gè)目標(biāo)。

界面新聞:除了這個(gè)路徑之外,還存在別的可能彎道超車(chē)的技術(shù)路線嗎?

姜大昕: 除了剛才的兩條路線,還有第三條路徑是解讀人腦到底是怎么工作的,即腦神經(jīng)科學(xué)。

現(xiàn)在所謂大腦神經(jīng)網(wǎng)絡(luò)和真正的神經(jīng)網(wǎng)絡(luò)之間,我覺(jué)得是一種很牽強(qiáng)附會(huì)的類(lèi)比——把它的構(gòu)造想象成神經(jīng)元、樹(shù)突、軸突這些東西,但人腦可能完全不是這么工作的。

但最近有一些有趣的發(fā)現(xiàn),冥冥之中好像人腦的一些規(guī)律在我們最新的大模型設(shè)計(jì)當(dāng)中得到了體現(xiàn)。比如人的智能來(lái)自大腦皮層,是一個(gè)簡(jiǎn)單結(jié)構(gòu)的不斷重復(fù),正好對(duì)應(yīng)了Transformer架構(gòu)的某種特征。還有就是,它認(rèn)為人的智能來(lái)自對(duì)世界的建模,叫作 reference framework,這個(gè)和我們現(xiàn)在把大量知識(shí)輸入、壓縮、對(duì)世界建模從而產(chǎn)生智能的工作,好像從邏輯上也對(duì)應(yīng)了。

但從生理上看,人的神經(jīng)元產(chǎn)生生物放電、化學(xué)遞質(zhì)這個(gè)過(guò)程到底是什么樣的?我們現(xiàn)在訓(xùn)練一個(gè)初中生水平的智能,就要消耗這么多能源,人的大腦就兩三斤,消耗能量也就這么一點(diǎn),它是怎么做到的?這里面還蘊(yùn)藏很多大自然的奧秘,實(shí)際上是可以幫你反哺。

你要么就是學(xué)習(xí)它,要么從它那里得到靈感去改進(jìn)大模型,甚至說(shuō)不定在某個(gè)時(shí)刻,機(jī)器人聰明到一定程度,會(huì)去看明白之后告訴你,或者默默地就把自己給修改了,那我就覺(jué)得很恐怖了(笑)。

界面新聞:你之前提到過(guò)“上一代搜索到頭了”。那你對(duì)這個(gè)時(shí)代的搜索有什么初步定義嗎?或者說(shuō)它未來(lái)可能的形態(tài)是什么樣,會(huì)取代誰(shuí)?

姜大昕:是個(gè)很好的問(wèn)題,我覺(jué)得它是分階段不斷往前演進(jìn)的。

首先,它會(huì)讓用戶(hù)的搜索體驗(yàn)更好。上一代搜索引擎逼用戶(hù)養(yǎng)成了一個(gè)習(xí)慣,就是只能拿關(guān)鍵字提問(wèn),因?yàn)榧偃鐔?wèn)一個(gè)自然語(yǔ)言,用戶(hù)篤定搜索引擎不懂。但是大模型出現(xiàn)以后,不僅可以讓這件事自然語(yǔ)言化,還可以多輪(對(duì)話)。

大模型會(huì)先幫你把前幾十個(gè)文檔和網(wǎng)頁(yè)全看了,然后總結(jié)一套信息給你,還能提供出處,從結(jié)果呈現(xiàn)上也比原來(lái)好很多,從單純的信息檢索變成了知識(shí)獲取。所以(大模型時(shí)代的)搜索第一個(gè)階段是,解決了用戶(hù)提問(wèn)的困難和看答案的效率。 

搜索本身其實(shí)不是一個(gè)端到端的任務(wù),大多人搜索是為了完成一個(gè)工作或者任務(wù)。所以搜索將來(lái)怎么能夠把外部搜索、本地搜索,還有工作環(huán)境的知識(shí)整合在一起,嵌入到一個(gè)端對(duì)端的工作流里面,我覺(jué)得可能是未來(lái)搜索的一個(gè)方向。

界面新聞:如果不考慮Google自己會(huì)進(jìn)化這件事,現(xiàn)在的通用大模型其實(shí)都是要取代曾經(jīng)的Google? 

姜大昕:在取代這件事情上,我覺(jué)得推演起來(lái)非常有意思。

很多人在思考,大模型出來(lái)以后,搜索引擎公司會(huì)產(chǎn)生一個(gè)什么樣的變化?包括我們躍問(wèn)在內(nèi)的很多AI產(chǎn)品都是個(gè)聚合搜索,它是在現(xiàn)有搜索引擎的基礎(chǔ)上,把Top 10或者Top 20的結(jié)果做了一個(gè)網(wǎng)頁(yè)整合。 

所以我覺(jué)得Google等搜索引擎公司會(huì)長(zhǎng)期存在。就你從一個(gè)Query(疑問(wèn))進(jìn)來(lái),到我從1萬(wàn)億個(gè)網(wǎng)頁(yè)當(dāng)中,把Top 20的結(jié)果反饋給你,這件事情永遠(yuǎn)要存在。

至于是哪家公司我不知道,但這件事情不會(huì)消失,因?yàn)榇竽P蜎](méi)有能力在很短的時(shí)間內(nèi)把1萬(wàn)億網(wǎng)頁(yè)全部看一遍,它只能做到把你給我的20個(gè)網(wǎng)頁(yè)看一遍。

從商業(yè)模式來(lái)說(shuō),對(duì)于搜索引擎公司就非常tricky(棘手)——這種情況我是跟還是不跟?跟了,可能會(huì)損失廣告收入,要不跟就得看著用戶(hù)往別人那走。

所以它的一個(gè)解決方法可能是,在跟的同時(shí)秀廣告,它有一段路要去探索這種商業(yè)模式是不是成立:你付費(fèi)了我可以不給你廣告,你不付費(fèi),對(duì)不起,你就得看廣告。

界面新聞:前段時(shí)間行業(yè)里關(guān)于研發(fā)、應(yīng)用、商業(yè)化等爭(zhēng)議非常多,你看了這么多觀點(diǎn)之后,有覺(jué)得和你的想法比較貼切的嗎?

姜大昕:其實(shí)每個(gè)人都沒(méi)有錯(cuò),站在他們的角度,只是各自說(shuō)了一個(gè)不同的事情,然后人為捏在一起之后,好像觀點(diǎn)是很對(duì)立的,其實(shí)我覺(jué)得并不矛盾。

界面新聞:作為創(chuàng)業(yè)者,研發(fā)和應(yīng)用之間你有什么傾向?

姜大昕:我們一直說(shuō)模型和應(yīng)用要同一個(gè)公司做。 

界面新聞:所以你覺(jué)得雙輪驅(qū)動(dòng)是成立的?

姜大昕:對(duì)。我們公司從第一天開(kāi)始,就確定模型和應(yīng)用都要做,因?yàn)槟P托枰獞?yīng)用作為牽引和數(shù)據(jù)的補(bǔ)充。當(dāng)你具體到某個(gè)應(yīng)用的時(shí)候一定要通用模型跟它深度綁定,應(yīng)用才能做到極致。 

反過(guò)來(lái)也是一樣,我不覺(jué)得一個(gè)光做應(yīng)用的公司,沒(méi)有一個(gè)模型跟它深度綁定的話,它能做到極致。

界面新聞:但這對(duì)創(chuàng)業(yè)公司會(huì)是一個(gè)巨大的消耗,也非??简?yàn)后期,比如創(chuàng)業(yè)者的融資能力。

姜大昕:同意,因?yàn)檫@一輪大模型創(chuàng)業(yè),大家會(huì)跟芯片做類(lèi)比,上來(lái)就是明牌重注這樣的格局,沒(méi)辦法。 

界面新聞:對(duì)全球大模型行業(yè)的第一梯隊(duì)和第二梯隊(duì)有什么樣的預(yù)測(cè)?

姜大昕:第一梯隊(duì)現(xiàn)在就是OpenAI的GPT,Anthropic的Claude,還有Google的Gemini,每一家背后都是一朵云。 

經(jīng)過(guò)一年的角逐以后,除非OpenAI馬上放一個(gè)GPT-4.5/5把大家再震暈了,否則以他們當(dāng)家的三款模型來(lái)說(shuō),水平差不了太多,至少GPT-4和Claude 3是,從Gemini Pro來(lái)看是接近了。

第二梯隊(duì)我覺(jué)得就兩家,x.AI的Grok和Meta的Llama,這兩家確實(shí)錢(qián)多、卡多、人才多,但它們慢了,只能隨時(shí)準(zhǔn)備開(kāi)源掀桌子。

我判斷開(kāi)源追不上閉源,除非閉源在走的時(shí)候出現(xiàn)了重大挫折,比如GPT-4.5/5發(fā)不出來(lái),但我覺(jué)得是個(gè)小概率事件。閉源還是會(huì)一直往前走,而且勢(shì)頭不會(huì)太慢,至少走到10萬(wàn)億甚至到百萬(wàn)億,都會(huì)以這樣的速度持續(xù)下去。 

界面新聞:對(duì)標(biāo)全球的第一第二梯隊(duì),國(guó)內(nèi)大模型的整體水平在哪里? 

姜大昕:第二梯隊(duì)。國(guó)內(nèi)進(jìn)步很快,但是距離GPT-4,Claude 3還是有一定差距。除了模型本身還有認(rèn)知上的差距。OpenAI是積累了很久。 

界面新聞:明年國(guó)內(nèi)大模型大概會(huì)達(dá)到一個(gè)什么樣的水平?

姜大昕:取決于兩個(gè)因素,一個(gè)是它們(第一梯隊(duì))有多快,現(xiàn)在最大的變量就是OpenAI新的模型到底是個(gè)什么樣子,這會(huì)影響明年的格局。另一個(gè)要看國(guó)內(nèi)有幾家能在年底前達(dá)到GPT-4。

轉(zhuǎn)載來(lái)源:界面新聞 作者:伍洋宇

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【伍洋宇】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞