專(zhuān)訪階躍星辰姜大昕：Scaling Law是通往AGI的必要非充分條件

伍洋宇2024-05-02 07:38

中國(guó)通用大模型領(lǐng)域如今已跑出了六家獨(dú)角獸公司——其中只有一家，搜不到任何公開(kāi)估值，甚至沒(méi)有融資新聞，就已經(jīng)被市場(chǎng)默認(rèn)列入“獨(dú)角獸”隊(duì)伍。這家公司就是階躍星辰。

喧囂沸騰的“百模大戰(zhàn)”中，階躍星辰以近乎沉寂的狀態(tài)低調(diào)了一年，直到今年3月才浮出水面。

其發(fā)布的Step系列大模型是一套完整的“組合拳”：Step-1千億參數(shù)語(yǔ)言大模型、Step-1V千億參數(shù)多模態(tài)大模型，以及Step-2萬(wàn)億參數(shù)MoE（混合專(zhuān)家架構(gòu)）語(yǔ)言大模型預(yù)覽版。

Step-1V一經(jīng)發(fā)布便登上了OpenCompass多模態(tài)大模型3月榜榜首，二三名分別是阿里的QWen-VL-Max以及谷歌的GeminiProVision，OpenAI的GPT-4V位列第四。

Step-2預(yù)覽版則是國(guó)內(nèi)大模型初創(chuàng)公司首次公開(kāi)萬(wàn)億參數(shù)MoE語(yǔ)言大模型。理論上而言，這是逼近GPT-4發(fā)布初始水平的關(guān)鍵節(jié)點(diǎn)。

不多言不多語(yǔ)，但一登臺(tái)就炸場(chǎng)的姿態(tài)，大概足以形容階躍星辰的行事風(fēng)格。

在幕后掌控這家公司行為調(diào)性的人是姜大昕。2023年創(chuàng)業(yè)之前，姜大昕是微軟全球副總裁、微軟亞洲互聯(lián)網(wǎng)工程研究院（STCA）的首席科學(xué)家，主導(dǎo)過(guò)微軟搜索引擎Bing，以及智能語(yǔ)音助手Cortana、微軟云Azure、辦公全家桶Microsoft 365等一系列微軟當(dāng)家產(chǎn)品的自然語(yǔ)言理解系統(tǒng)。

深厚的技術(shù)背景使其習(xí)慣于嚴(yán)謹(jǐn)和客觀地表達(dá)。談及技術(shù)細(xì)節(jié)，他會(huì)給出明確的判斷：“如果大語(yǔ)言模型要上萬(wàn)億參數(shù)，MoE架構(gòu)幾乎是必然選擇?！?/p>

他信仰Scaling Law（規(guī)模法則），認(rèn)為在肉眼可見(jiàn)的未來(lái)，至少還有十萬(wàn)億和百萬(wàn)億兩個(gè)數(shù)量級(jí)，但并不排除腦神經(jīng)科學(xué)領(lǐng)域有朝一日能夠在Scaling Law和多模態(tài)之外找到通往AGI（通用人工智能）的可能。

一些公司合作方會(huì)用“實(shí)在”來(lái)形容他。這種描述矛盾而統(tǒng)一，因?yàn)樗葧?huì)揚(yáng)言“我們的多模理解國(guó)內(nèi)第一”，也會(huì)承認(rèn)“還在追趕去年發(fā)布的GPT-4”。背后所依托的邏輯是他所掌握和相信的技術(shù)現(xiàn)實(shí)。

在微軟16年，姜大昕說(shuō)自己形成最堅(jiān)不可摧的認(rèn)知是開(kāi)放心態(tài)和“growth mindset”（成長(zhǎng)型思維）——這是老東家微軟的文化之一，也是他決定創(chuàng)業(yè)的心境來(lái)源。

他判斷“上一代搜索已經(jīng)做到頭了”。從“Boosting Tree”（提升樹(shù)）到神經(jīng)網(wǎng)絡(luò)興起，從CNN（卷積神經(jīng)網(wǎng)絡(luò)）、RNN（循環(huán)神經(jīng)網(wǎng)絡(luò)）、LSTM（長(zhǎng)短期記憶網(wǎng)絡(luò)）再到BERT（谷歌團(tuán)隊(duì)提出的一種自然語(yǔ)言處理預(yù)訓(xùn)練技術(shù)），姜大昕曾把每一代技術(shù)都用進(jìn)搜索，使其實(shí)現(xiàn)從“馬車(chē)”到“汽車(chē)”的轉(zhuǎn)變。

直到2022年ChatGPT橫空出世，他意識(shí)到，這是從“地上跑”到“天上飛”的質(zhì)變。

因此，如果你不知道對(duì)這家新出現(xiàn)的公司具體期待什么，不妨期待它會(huì)如何定義下一代搜索，畢竟它擁有傳統(tǒng)搜索引擎時(shí)代最有話語(yǔ)權(quán)的團(tuán)隊(duì)之一。

階躍星辰會(huì)如何用大模型來(lái)定義下一代搜索？又如何追上與GPT-4的差距？姜大昕給出了自己的答案。

以下為姜大昕采訪實(shí)錄（界面新聞略作編輯）：

技術(shù)只是窗口期，不是護(hù)城河

界面新聞：你們算是國(guó)內(nèi)第一個(gè)公布萬(wàn)億參數(shù)MoE大模型的公司，之前一直保持低調(diào)，現(xiàn)在希望在行業(yè)里樹(shù)立一個(gè)什么樣的認(rèn)知？

姜大昕：去年國(guó)內(nèi)開(kāi)始提“百模大戰(zhàn)”，但很多公司是針對(duì)行業(yè)或者應(yīng)用場(chǎng)景發(fā)布了大模型，真正從頭開(kāi)始做通用大模型的滿(mǎn)打滿(mǎn)算十幾二十家，相當(dāng)于已經(jīng)做完第一輪分化。

我們認(rèn)為通用大模型還會(huì)走得更遠(yuǎn)，往后發(fā)展有兩個(gè)維度：一個(gè)是Scaling Law，從千億到萬(wàn)億參數(shù)，甚至到百萬(wàn)億；另外光做語(yǔ)言模型是不夠的，要想達(dá)到所謂的通用人工智能，就要做多模態(tài)理解和生成的融合，首先要做一個(gè)多模態(tài)理解的模型。

沿著這兩條路，公司發(fā)布了萬(wàn)億參數(shù)語(yǔ)言大模型的預(yù)覽版Step-2，以及多模態(tài)大模型Step-1V。這代表了我們?cè)贕PT-3.5之后兩個(gè)很重要的觀點(diǎn)，一個(gè)是模型要大，二是多模態(tài)理解和生成的統(tǒng)一是通往AGI的必經(jīng)之路。

界面新聞：?jiǎn)螐哪Ｐ偷慕嵌龋趺蠢斫饽銈兣cGPT-4之間的差距？比如Minimax剛剛發(fā)了abab 6.5，也是萬(wàn)億參數(shù)MoE大模型，他們會(huì)展示各種開(kāi)源測(cè)試集的結(jié)果比對(duì)。

姜大昕：這是個(gè)很有意思的問(wèn)題。前段時(shí)間在迪拜的世界政府峰會(huì)上，OpenAI首席執(zhí)行官Sam Altman有一個(gè)觀點(diǎn)很出圈，我覺(jué)得很對(duì)。

他說(shuō)GPT-5對(duì)比GPT-4，是各個(gè)維度都強(qiáng)了一圈。這句話字面意思是“我的通用能力變強(qiáng)了”，但反過(guò)來(lái)講還有一個(gè)意思是，“我朝著某一個(gè)維度方向去打磨也可以很強(qiáng)”。通過(guò)犧牲一些維度去增強(qiáng)另一個(gè)維度，這個(gè)維度可以強(qiáng)過(guò)GPT-4。就好像一個(gè)大學(xué)生和一個(gè)學(xué)習(xí)了焊工、鉗工的初中生相比，后者可以在某個(gè)維度上超過(guò)大學(xué)生。所以刷榜并不是特別科學(xué)，因?yàn)轭}都是公開(kāi)的。

有些說(shuō)法甚至非常有誤導(dǎo)性。比如說(shuō)“全方位能力達(dá)到了GPT-4的90%”，聽(tīng)著很牛，但假設(shè)GPT-4在某個(gè)能力上是90分，你做到90%就是81分，看上去好像也不錯(cuò)。但反過(guò)來(lái)想，GPT-4的錯(cuò)誤率是10，你的錯(cuò)誤率是19，幾乎是人家的兩倍，在應(yīng)用的時(shí)候體感肯定是不一樣的，用戶(hù)只會(huì)覺(jué)得你做對(duì)是應(yīng)該的，但會(huì)記住你的錯(cuò)誤比別人多了近一倍。

界面新聞：和GPT-4的通用能力對(duì)比，你們對(duì)Step-2下的結(jié)論是什么？

姜大昕：GPT-4是動(dòng)態(tài)的，我們現(xiàn)在的模型也還在最后的打磨階段，希望到今年上半年整個(gè)打磨完成以后，能夠?qū)?biāo)去年GPT-4剛出來(lái)的水平。

界面新聞：現(xiàn)在國(guó)內(nèi)的通用大模型是不是還在集體追趕GPT-4剛剛發(fā)布的狀態(tài)？

姜大昕：對(duì)。這是一個(gè)相對(duì)務(wù)實(shí)的目標(biāo)，我們不會(huì)動(dòng)不動(dòng)就說(shuō)我們超過(guò)GPT-4，沒(méi)有這個(gè)必要去吸引眼球。因?yàn)槟憧梢杂懈鞣N辦法在一些小維度上超過(guò)它，甚至分分鐘就可以超過(guò)，但這有什么意義？

界面新聞：Step-2采用的MoE架構(gòu)，現(xiàn)在也很受關(guān)注。這種架構(gòu)響應(yīng)速度、推理效率都更快更高，但也存在訓(xùn)練穩(wěn)定性、通信成本等問(wèn)題。階躍是什么時(shí)候決定以及為什么決定采用這個(gè)架構(gòu)？怎么去克服這個(gè)架構(gòu)本身可能存在的一些問(wèn)題？

姜大昕：想把模型參數(shù)擴(kuò)大到萬(wàn)億的話，MoE幾乎是一個(gè)必選項(xiàng)。就像做科研或者做工程，很多決策就是各個(gè)維度之間的最佳平衡，MoE也是在性能、參數(shù)量、訓(xùn)練成本、推理成本這些維度權(quán)衡下的最佳選擇。

至于說(shuō)它要解決的很多挑戰(zhàn)，我覺(jué)得這就是OpenAI的核心技術(shù)，我們要想繼續(xù)往上攀登的話，這個(gè)問(wèn)題遲早要解決。

我們自建機(jī)房是一個(gè)巨大的優(yōu)勢(shì)，因?yàn)榭梢杂兴杏布募?xì)節(jié)。我們是系統(tǒng)組、算法組從硬件開(kāi)始就做一個(gè)聯(lián)合的優(yōu)化。

界面新聞：商業(yè)模式上，你們是toB（企業(yè)）和toC（消費(fèi)者）一起做嗎？

姜大昕：不算，我們主力還是在toC。toB的話，我們不是一單一單接的典型打法，是只選擇一些大行業(yè)。比如說(shuō)和上海報(bào)業(yè)旗下的界面財(cái)聯(lián)社成立一個(gè)合資公司，由這家公司去承接生意，我們提供算法和模型。

界面新聞：如何看待C端產(chǎn)品的商業(yè)前景？很多人認(rèn)為C端極易打價(jià)格戰(zhàn)，那它能成立的、有健康現(xiàn)金流的商業(yè)形態(tài)會(huì)是什么樣？

姜大昕：這一輪雖然技術(shù)上發(fā)生了很大的變革，但我覺(jué)得技術(shù)不是護(hù)城河，技術(shù)只能給你一個(gè)窗口期。在這個(gè)窗口期內(nèi)，你一定要構(gòu)建公司產(chǎn)品的護(hù)城河。

我覺(jué)得沒(méi)有什么新鮮的，商業(yè)模式基于人的需求，而需求這么多年不會(huì)變?，F(xiàn)在只是說(shuō)技術(shù)變了，找到產(chǎn)品能夠賣(mài)出的商業(yè)模式就完了。

永遠(yuǎn)記住年輕人比你更牛

界面新聞：有人說(shuō)你們算是國(guó)內(nèi)最后一家大模型公司，你怎么看？會(huì)不會(huì)覺(jué)得入局比較晚？

姜大昕：我覺(jué)得不晚，而且我也不認(rèn)為我們一定是最后一家，可能哪一天又冒出來(lái)一家。

界面新聞：當(dāng)初為什么選擇在上海注冊(cè)公司？

姜大昕：上海對(duì)人工智能有一個(gè)總體生態(tài)上的布局，從芯片到通用大模型，再到各行各業(yè)的應(yīng)用，規(guī)劃得非常清楚。上海的環(huán)境也很適合創(chuàng)業(yè)，比如徐匯、濱江，有非常多的創(chuàng)業(yè)公司。

界面新聞：在微軟的16年，讓你積淀下來(lái)最堅(jiān)不可摧的認(rèn)知和能力是什么？

姜大昕：開(kāi)放的心態(tài)，還有就是微軟有個(gè)“growth mindset”（成長(zhǎng)型思維模式）。意思是不要被過(guò)去的一些認(rèn)知所局限，空杯心態(tài)、仰望星空。

過(guò)去的知識(shí)也許可以幫你判斷一件事情的價(jià)值，但也要多聽(tīng)取別人的意見(jiàn)，選擇性吸收，最終是讓自己不要活在過(guò)去。你要永遠(yuǎn)知道，年輕人比你更牛，這個(gè)事情在我們公司是非常非常正確的，年輕人也是最厲害的。

界面新聞：在大模型領(lǐng)域創(chuàng)業(yè)的人，有楊植麟這樣帶著“天才少年”標(biāo)簽的，有王小川這種有成功創(chuàng)業(yè)經(jīng)驗(yàn)的，也有你這樣在科技巨頭統(tǒng)領(lǐng)重要業(yè)務(wù)線的人，你覺(jué)得這個(gè)行業(yè)這一代領(lǐng)軍人物之間，最終拼的是什么？

姜大昕：個(gè)人有個(gè)人的特點(diǎn)，我覺(jué)得這對(duì)企業(yè)是個(gè)好處。每個(gè)企業(yè)會(huì)有自己獨(dú)特的文化價(jià)值觀，還有組織基因，有各自成功的路徑。

界面新聞：這種價(jià)值觀或者組織基因，可能會(huì)讓公司在什么事情上變得特別不同或者有優(yōu)勢(shì)？

姜大昕：它會(huì)影響到方方面面，這個(gè)東西講起來(lái)很虛，但又很實(shí)在，因?yàn)闀?huì)決定做事的方式。

比如一些企業(yè)合作方聽(tīng)完我們的介紹以后，會(huì)用“實(shí)在”來(lái)形容我們。我就問(wèn)，您說(shuō)這話是一個(gè)褒義詞還是個(gè)貶義詞（笑）。對(duì)方的意思是，他走訪了很多公司，基本上每家都會(huì)或多或少說(shuō)比GPT-4做得好，只有到了我們這里，我說(shuō)我們?cè)谧汾sGPT-4，承認(rèn)跟GPT-4之間還有差距。

界面新聞：階躍現(xiàn)在有大概150人，團(tuán)隊(duì)規(guī)模的增長(zhǎng)曲線是怎樣的？

姜大昕：我們一開(kāi)始招人比較快，把訓(xùn)練初始版本模型的人給招起來(lái)了。中間有一段時(shí)間相對(duì)來(lái)說(shuō)比較慢，產(chǎn)品還是在小步往前探索階段，那段時(shí)間并沒(méi)有進(jìn)很多人。產(chǎn)品剛跑起來(lái)的時(shí)候，可能就10個(gè)人。后來(lái)到了下半年，我們才開(kāi)始擴(kuò)招產(chǎn)品和工程體系的同學(xué)，然后才有冒泡。

界面新聞：行業(yè)里像百川智能、Minimax等，大概都是兩三百人的體量，你怎么理解大模型公司人才密度的問(wèn)題？

姜大昕：這個(gè)領(lǐng)域說(shuō)人才密度這件事我是認(rèn)可的。這里面涉及兩件事，一個(gè)是平均人才密度，還有一個(gè)就是，一家公司里最頂尖的那幾個(gè)人決定了大模型的高度，100個(gè)人未必干得過(guò)那10個(gè)人，所以系統(tǒng)、數(shù)據(jù)、算法這三個(gè)維度我們都要有最頂級(jí)的人才。

最近我非常高興的事情是算法團(tuán)隊(duì)又壯大了一些。因?yàn)閺腉PT-3.5到GPT-4，一方面你要有算法能力，另外就是系統(tǒng)要跟上，但如果要探索我說(shuō)的那條路徑，從單模態(tài)到多模態(tài)，需要很多不同領(lǐng)域的算法人才。

我現(xiàn)在在各個(gè)方向都找到了頂尖的人才，這也是我“浮出”之后的好處。

界面新聞：每一個(gè)加入的人你都會(huì)自己親自面試嗎？

姜大昕：對(duì)于這些leader我會(huì)的，而且都不是面試，真的是聊天、吃飯，有的還聊了好幾次，吃了好幾次。

界面新聞：感覺(jué)你在融資信息的發(fā)布上挺謹(jǐn)慎的，但其他家都宣傳得很熱鬧。為什么階躍不怎么去提融資的事情？

姜大昕：我覺(jué)得沒(méi)有必要。我們最終的目標(biāo)是把模型訓(xùn)出來(lái)，那我們知道自己的融資節(jié)奏和方式就好。

界面新聞：但如果有高融資或者高估值，應(yīng)該也更容易在市場(chǎng)上建立頭部印象？

姜大昕：現(xiàn)在的好處是，人工智能領(lǐng)域確實(shí)有一批投資人是非常懂的，他們知道這是一個(gè)長(zhǎng)期且比較耗錢(qián)的項(xiàng)目，也愿意相信我們的技術(shù)實(shí)力。

通往AGI之路，十萬(wàn)億不是盡頭

界面新聞：你所信仰的AGI可以怎樣概括？

姜大昕：AGI目前確實(shí)沒(méi)有一個(gè)準(zhǔn)確的定義，我也不想給它一個(gè)（定義），只能非常概括地說(shuō)，達(dá)到人的智能就叫AGI 。而且我覺(jué)得這里面最重要的一個(gè)字就是“G”（general），通用。

界面新聞：你給公司規(guī)劃了“單模態(tài)-多模態(tài)-多模理解和生成的統(tǒng)一-世界模型-AGI”的路徑，每個(gè)階段要走多長(zhǎng)時(shí)間是可估算的嗎？

姜大昕：不好預(yù)測(cè)。就像我看到ChatGPT之前，都還會(huì)說(shuō)自然語(yǔ)言處理這件事，常識(shí)和推理需要十年二十年來(lái)解決，結(jié)果一夜之間就解決了。所以有的科學(xué)突破可能在積累上早就發(fā)生了，但有點(diǎn)像大家說(shuō)的“涌現(xiàn)”，只看到“砰”地一下上去了，是一種跳變。但這個(gè)朝著目標(biāo)邁進(jìn)的過(guò)程，只要沒(méi)有達(dá)到那個(gè)點(diǎn)，它就是0。

界面新聞：階躍對(duì)于明年有什么具體的目標(biāo)？

姜大昕：朝著GPT-4.5/5去努力，一個(gè)是規(guī)模擴(kuò)大到10萬(wàn)億參數(shù)，第二個(gè)是從能力上，我希望明年對(duì)多模理解和生成的統(tǒng)一有突破，能夠同時(shí)理解和生成。

整條線我們都看得很清楚了，包括我們處在什么階段、什么是確定性的，接下來(lái)肯定是在現(xiàn)有的確定性基礎(chǔ)上再往前走。

界面新聞：達(dá)到萬(wàn)億參數(shù)模型之后，推進(jìn)Scaling Law最難的事情是什么？

姜大昕：最難的不是一件，是四件事情，就是我們說(shuō)的算力、系統(tǒng)、數(shù)據(jù)、算法。

界面新聞：感覺(jué)你是一個(gè)非常堅(jiān)信Scaling Law的人，這個(gè)定律有到頭的時(shí)候嗎？

姜大昕：這是個(gè)很好的問(wèn)題。在肉眼可見(jiàn)的未來(lái)，我覺(jué)得至少還有兩個(gè)數(shù)量級(jí)。我們到年中應(yīng)該才算真正攀上去萬(wàn)億，那么10萬(wàn)億是個(gè)確定性事件，一定會(huì)攀。

界面新聞：10萬(wàn)億對(duì)應(yīng)的是GPT-5？

姜大昕：不知道是GPT-4.5還是GPT-5，就看OpenAI下一個(gè)模型出來(lái)的是個(gè)什么。其實(shí) GPT-4是2022年10月份就訓(xùn)完了，去年4月份發(fā)布是因?yàn)樗髞?lái)打磨又用了6個(gè)月時(shí)間，跟我們現(xiàn)在狀態(tài)差不多。

雖然OpenAI年初發(fā)布了Sora，但最新一代大模型到底叫GPT-4.5還是GPT-5，多大參數(shù)規(guī)模，都不知道。我們基于它的能力、路線，包括它用的卡做一個(gè)推測(cè)的話，至少是個(gè)10萬(wàn)億級(jí)別。

界面新聞：那第二個(gè)數(shù)量級(jí)就要到百萬(wàn)億。

姜大昕：這里有一個(gè)參考，就是人腦的神經(jīng)元連接是200萬(wàn)億，但我覺(jué)得不是一個(gè)特別有效的參考，因?yàn)槿撕蜋C(jī)器現(xiàn)在沒(méi)有任何可直接對(duì)比的關(guān)系，可能只是給人一個(gè)目標(biāo)。

界面新聞：除了這個(gè)路徑之外，還存在別的可能彎道超車(chē)的技術(shù)路線嗎？

姜大昕：除了剛才的兩條路線，還有第三條路徑是解讀人腦到底是怎么工作的，即腦神經(jīng)科學(xué)。

現(xiàn)在所謂大腦神經(jīng)網(wǎng)絡(luò)和真正的神經(jīng)網(wǎng)絡(luò)之間，我覺(jué)得是一種很牽強(qiáng)附會(huì)的類(lèi)比——把它的構(gòu)造想象成神經(jīng)元、樹(shù)突、軸突這些東西，但人腦可能完全不是這么工作的。

但最近有一些有趣的發(fā)現(xiàn)，冥冥之中好像人腦的一些規(guī)律在我們最新的大模型設(shè)計(jì)當(dāng)中得到了體現(xiàn)。比如人的智能來(lái)自大腦皮層，是一個(gè)簡(jiǎn)單結(jié)構(gòu)的不斷重復(fù)，正好對(duì)應(yīng)了Transformer架構(gòu)的某種特征。還有就是，它認(rèn)為人的智能來(lái)自對(duì)世界的建模，叫作 reference framework，這個(gè)和我們現(xiàn)在把大量知識(shí)輸入、壓縮、對(duì)世界建模從而產(chǎn)生智能的工作，好像從邏輯上也對(duì)應(yīng)了。

但從生理上看，人的神經(jīng)元產(chǎn)生生物放電、化學(xué)遞質(zhì)這個(gè)過(guò)程到底是什么樣的？我們現(xiàn)在訓(xùn)練一個(gè)初中生水平的智能，就要消耗這么多能源，人的大腦就兩三斤，消耗能量也就這么一點(diǎn)，它是怎么做到的？這里面還蘊(yùn)藏很多大自然的奧秘，實(shí)際上是可以幫你反哺。

你要么就是學(xué)習(xí)它，要么從它那里得到靈感去改進(jìn)大模型，甚至說(shuō)不定在某個(gè)時(shí)刻，機(jī)器人聰明到一定程度，會(huì)去看明白之后告訴你，或者默默地就把自己給修改了，那我就覺(jué)得很恐怖了（笑）。

界面新聞：你之前提到過(guò)“上一代搜索到頭了”。那你對(duì)這個(gè)時(shí)代的搜索有什么初步定義嗎？或者說(shuō)它未來(lái)可能的形態(tài)是什么樣，會(huì)取代誰(shuí)？

姜大昕：是個(gè)很好的問(wèn)題，我覺(jué)得它是分階段不斷往前演進(jìn)的。

首先，它會(huì)讓用戶(hù)的搜索體驗(yàn)更好。上一代搜索引擎逼用戶(hù)養(yǎng)成了一個(gè)習(xí)慣，就是只能拿關(guān)鍵字提問(wèn)，因?yàn)榧偃鐔?wèn)一個(gè)自然語(yǔ)言，用戶(hù)篤定搜索引擎不懂。但是大模型出現(xiàn)以后，不僅可以讓這件事自然語(yǔ)言化，還可以多輪（對(duì)話）。

大模型會(huì)先幫你把前幾十個(gè)文檔和網(wǎng)頁(yè)全看了，然后總結(jié)一套信息給你，還能提供出處，從結(jié)果呈現(xiàn)上也比原來(lái)好很多，從單純的信息檢索變成了知識(shí)獲取。所以（大模型時(shí)代的）搜索第一個(gè)階段是，解決了用戶(hù)提問(wèn)的困難和看答案的效率。

搜索本身其實(shí)不是一個(gè)端到端的任務(wù)，大多人搜索是為了完成一個(gè)工作或者任務(wù)。所以搜索將來(lái)怎么能夠把外部搜索、本地搜索，還有工作環(huán)境的知識(shí)整合在一起，嵌入到一個(gè)端對(duì)端的工作流里面，我覺(jué)得可能是未來(lái)搜索的一個(gè)方向。

界面新聞：如果不考慮Google自己會(huì)進(jìn)化這件事，現(xiàn)在的通用大模型其實(shí)都是要取代曾經(jīng)的Google？

姜大昕：在取代這件事情上，我覺(jué)得推演起來(lái)非常有意思。

很多人在思考，大模型出來(lái)以后，搜索引擎公司會(huì)產(chǎn)生一個(gè)什么樣的變化？包括我們躍問(wèn)在內(nèi)的很多AI產(chǎn)品都是個(gè)聚合搜索，它是在現(xiàn)有搜索引擎的基礎(chǔ)上，把Top 10或者Top 20的結(jié)果做了一個(gè)網(wǎng)頁(yè)整合。

所以我覺(jué)得Google等搜索引擎公司會(huì)長(zhǎng)期存在。就你從一個(gè)Query（疑問(wèn)）進(jìn)來(lái)，到我從1萬(wàn)億個(gè)網(wǎng)頁(yè)當(dāng)中，把Top 20的結(jié)果反饋給你，這件事情永遠(yuǎn)要存在。

至于是哪家公司我不知道，但這件事情不會(huì)消失，因?yàn)榇竽Ｐ蜎](méi)有能力在很短的時(shí)間內(nèi)把1萬(wàn)億網(wǎng)頁(yè)全部看一遍，它只能做到把你給我的20個(gè)網(wǎng)頁(yè)看一遍。

從商業(yè)模式來(lái)說(shuō)，對(duì)于搜索引擎公司就非常tricky（棘手）——這種情況我是跟還是不跟？跟了，可能會(huì)損失廣告收入，要不跟就得看著用戶(hù)往別人那走。

所以它的一個(gè)解決方法可能是，在跟的同時(shí)秀廣告，它有一段路要去探索這種商業(yè)模式是不是成立：你付費(fèi)了我可以不給你廣告，你不付費(fèi)，對(duì)不起，你就得看廣告。

界面新聞：前段時(shí)間行業(yè)里關(guān)于研發(fā)、應(yīng)用、商業(yè)化等爭(zhēng)議非常多，你看了這么多觀點(diǎn)之后，有覺(jué)得和你的想法比較貼切的嗎？

姜大昕：其實(shí)每個(gè)人都沒(méi)有錯(cuò)，站在他們的角度，只是各自說(shuō)了一個(gè)不同的事情，然后人為捏在一起之后，好像觀點(diǎn)是很對(duì)立的，其實(shí)我覺(jué)得并不矛盾。

界面新聞：作為創(chuàng)業(yè)者，研發(fā)和應(yīng)用之間你有什么傾向？

姜大昕：我們一直說(shuō)模型和應(yīng)用要同一個(gè)公司做。

界面新聞：所以你覺(jué)得雙輪驅(qū)動(dòng)是成立的？

姜大昕：對(duì)。我們公司從第一天開(kāi)始，就確定模型和應(yīng)用都要做，因?yàn)槟Ｐ托枰獞?yīng)用作為牽引和數(shù)據(jù)的補(bǔ)充。當(dāng)你具體到某個(gè)應(yīng)用的時(shí)候一定要通用模型跟它深度綁定，應(yīng)用才能做到極致。

反過(guò)來(lái)也是一樣，我不覺(jué)得一個(gè)光做應(yīng)用的公司，沒(méi)有一個(gè)模型跟它深度綁定的話，它能做到極致。

界面新聞：但這對(duì)創(chuàng)業(yè)公司會(huì)是一個(gè)巨大的消耗，也非?？简?yàn)后期，比如創(chuàng)業(yè)者的融資能力。

姜大昕：同意，因?yàn)檫@一輪大模型創(chuàng)業(yè)，大家會(huì)跟芯片做類(lèi)比，上來(lái)就是明牌重注這樣的格局，沒(méi)辦法。

界面新聞：對(duì)全球大模型行業(yè)的第一梯隊(duì)和第二梯隊(duì)有什么樣的預(yù)測(cè)？

姜大昕：第一梯隊(duì)現(xiàn)在就是OpenAI的GPT，Anthropic的Claude，還有Google的Gemini，每一家背后都是一朵云。

經(jīng)過(guò)一年的角逐以后，除非OpenAI馬上放一個(gè)GPT-4.5/5把大家再震暈了，否則以他們當(dāng)家的三款模型來(lái)說(shuō)，水平差不了太多，至少GPT-4和Claude 3是，從Gemini Pro來(lái)看是接近了。

第二梯隊(duì)我覺(jué)得就兩家，x.AI的Grok和Meta的Llama，這兩家確實(shí)錢(qián)多、卡多、人才多，但它們慢了，只能隨時(shí)準(zhǔn)備開(kāi)源掀桌子。

我判斷開(kāi)源追不上閉源，除非閉源在走的時(shí)候出現(xiàn)了重大挫折，比如GPT-4.5/5發(fā)不出來(lái)，但我覺(jué)得是個(gè)小概率事件。閉源還是會(huì)一直往前走，而且勢(shì)頭不會(huì)太慢，至少走到10萬(wàn)億甚至到百萬(wàn)億，都會(huì)以這樣的速度持續(xù)下去。

界面新聞：對(duì)標(biāo)全球的第一第二梯隊(duì)，國(guó)內(nèi)大模型的整體水平在哪里？

姜大昕：第二梯隊(duì)。國(guó)內(nèi)進(jìn)步很快，但是距離GPT-4，Claude 3還是有一定差距。除了模型本身還有認(rèn)知上的差距。OpenAI是積累了很久。

界面新聞：明年國(guó)內(nèi)大模型大概會(huì)達(dá)到一個(gè)什么樣的水平？

姜大昕：取決于兩個(gè)因素，一個(gè)是它們（第一梯隊(duì)）有多快，現(xiàn)在最大的變量就是OpenAI新的模型到底是個(gè)什么樣子，這會(huì)影響明年的格局。另一個(gè)要看國(guó)內(nèi)有幾家能在年底前達(dá)到GPT-4。

轉(zhuǎn)載來(lái)源：界面新聞作者：伍洋宇

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【伍洋宇】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù)，不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議