探秘文心一言,內(nèi)測(cè)近2月發(fā)生了什么

任曉寧2023-05-10 22:50

經(jīng)濟(jì)觀察網(wǎng) 記者 任曉寧 時(shí)至5月,大模型的熱度仍在持續(xù)。上周科大訊飛剛剛發(fā)布大模型產(chǎn)品,這周小紅書又傳出成立大模型團(tuán)隊(duì)的消息。目前已經(jīng)有數(shù)十家公司推出大模型,被外界戲稱為“諸神之戰(zhàn)”。

一眾互聯(lián)網(wǎng)企業(yè)中,百度是國(guó)內(nèi)最早推出大模型產(chǎn)品內(nèi)測(cè)的公司。目前有15萬(wàn)家企業(yè)申請(qǐng)接入百度的大模型產(chǎn)品文心一言,合作的外部公司數(shù)量也最多。文心一言的演進(jìn)過程,可以看作國(guó)內(nèi)大模型行業(yè)一個(gè)縮影。

3月16日,百度文心一言公開邀測(cè),現(xiàn)在已有近2個(gè)月時(shí)間。這段時(shí)間,百度的大模型有哪些改變,做了哪些落地?與其他大模型有哪些不同進(jìn)展?5月9日,經(jīng)濟(jì)觀察網(wǎng)記者就此采訪了百度集團(tuán)副總裁侯震宇。

成本大規(guī)模下降

提到大模型,很多人第一反應(yīng)是貴,比如投身大模型賽道的創(chuàng)業(yè)者王慧文等人,需要自帶5000萬(wàn)美元入局。外部流傳的數(shù)據(jù)是,大模型訓(xùn)練一次需要花3個(gè)月時(shí)間,需要花近1000萬(wàn)美元。

不過侯震宇告訴記者,大模型真不像很多人想象的那么貴。“做大模型有點(diǎn)貴,用大模型沒那么貴,”尤其是使用大模型的企業(yè),做再訓(xùn)練或是微調(diào),所處理的數(shù)據(jù)、算力規(guī)模,與從零開始訓(xùn)練千億大模型的規(guī)模,完全不在一個(gè)量級(jí)。

當(dāng)下推出大模型的公司數(shù)十家,誰(shuí)能成為最終勝利者?侯震宇認(rèn)為,效果和成本,將是決定大模型能不能成的關(guān)鍵因素。

3月16日以來,百度文心一言已內(nèi)測(cè)近兩個(gè)月,完成了4次技術(shù)版本升級(jí)。推理成本降到了十分之一,推理性能提升近10倍。

“當(dāng)別人剛剛思考如何進(jìn)行訓(xùn)練的時(shí)候,我們已經(jīng)在推理上沖出了很遠(yuǎn)。”5月4日,李彥宏在百度內(nèi)部大會(huì)上這樣說。

侯震宇告訴記者,接下來,文心一言還會(huì)有大規(guī)模成本下降。包括模型微調(diào)、模型再訓(xùn)練、模型使用等,“價(jià)格不會(huì)成為大家使用或者擁抱大模型的瓶頸。”

當(dāng)前,國(guó)外大模型公司虧損正在增加中。近期國(guó)外媒體The Information報(bào)道稱,大模型鼻祖去年OpenAI虧損額翻倍,達(dá)到5.4億美元。侯震宇提到,百度不會(huì)這樣,因?yàn)榘俣纫婚_始就非常注重在成本和性能上的優(yōu)化。“大模型對(duì)于百度來說,是一定要做的。而且我們也可以讓成本更低。”

對(duì)比國(guó)外,國(guó)內(nèi)大模型公司的成本會(huì)較低。“我們的電更便宜,云服務(wù)也更便宜。微軟云的毛利大概有60%,國(guó)內(nèi)沒有幾家云廠商能有這樣的利潤(rùn)。”侯震宇認(rèn)為,OpenAI的虧損,是國(guó)外特定場(chǎng)景,也是先驅(qū)者的探路成本,國(guó)內(nèi)大模型平臺(tái)不會(huì)一樣。

當(dāng)然,國(guó)內(nèi)大模型產(chǎn)品目前都沒有公開測(cè)試,這也是成本相對(duì)可控的原因之一。

從科幻落地現(xiàn)實(shí)

對(duì)于百度,文心一言內(nèi)測(cè)前后是一個(gè)分水嶺。用侯震宇的話說,內(nèi)測(cè)前也有客戶找上門,當(dāng)時(shí)他們聊的,就像是科幻片里的題材。

3月份來到百度的客戶,主要由各個(gè)公司一把手、CEO帶隊(duì)。他們都很興奮,覺得大模型什么都能做,想法天馬行空。但現(xiàn)在看,大模型并不是萬(wàn)能的,它需要幾個(gè)要素:接收到更多的知識(shí),并且真正在實(shí)際場(chǎng)景落地。

3月份文心一言剛內(nèi)測(cè)時(shí),人們流行問它一些刁難古怪的問題,或是讓它寫一篇小作文,考幾道數(shù)學(xué)題?,F(xiàn)在不一樣了,侯震宇前幾天見了一個(gè)機(jī)器人公司,他們考慮的是,怎樣通過文心一言,讓自己的機(jī)器人變得更智能。

最近找到文心一言的人,職級(jí)比三月份有所降低,不再是公司一把手,而是各個(gè)公司業(yè)務(wù)或技術(shù)負(fù)責(zé)人。但侯震宇很高興,因?yàn)檫@說明文心一言已經(jīng)開始真正落地了。

有一個(gè)客服公司,接入文心一言后,同樣產(chǎn)出文字回復(fù)的成本,每萬(wàn)字從100元降低到1元。這家公司成本因?yàn)槭褂么竽P投档?,是他們?cè)敢鈬L試這個(gè)新鮮事物的原因。

金山辦公近期也在與文心一言聯(lián)合測(cè)試。金山辦公助理總裁田然稱,百度大模型的迭代速度很快,并在多個(gè)方面取得了優(yōu)勢(shì)。目前在意圖理解、PPT大綱生成、范文書寫、待辦列表生成、文生圖等多模態(tài)生成方面,金山辦公與文心一言正聯(lián)合測(cè)試。

近兩個(gè)月內(nèi),文心一言在生物醫(yī)藥、汽車、芯片等領(lǐng)域也有落地。和百圖生科聯(lián)合構(gòu)建了生物超算平臺(tái),訓(xùn)練超千億級(jí)的多模態(tài)大模型,進(jìn)行創(chuàng)新藥物的研發(fā)。和長(zhǎng)安汽車構(gòu)建了人工智能基礎(chǔ)設(shè)施平臺(tái),雙方基于文心一言聯(lián)合研發(fā)了一款新的人工智能產(chǎn)品。

侯震宇承認(rèn),這項(xiàng)新技術(shù)距離大規(guī)模落地還有很遠(yuǎn)的距離,但相比3月份,現(xiàn)在已經(jīng)變得更實(shí)際了。

文心一言誕生后,對(duì)于百度還產(chǎn)生另一個(gè)好處,就是AI業(yè)務(wù)變得簡(jiǎn)單了。此前,百度一直主打AI,想把AI與各行各業(yè)結(jié)合,但實(shí)際做起來很難。

比如之前有個(gè)客戶,要做AI業(yè)務(wù),百度工作人員需要拿著各種各樣的數(shù)據(jù),去為客戶單獨(dú)訓(xùn)練一個(gè)AI模型出來?,F(xiàn)在在一個(gè)已經(jīng)訓(xùn)練好的預(yù)訓(xùn)練大模型基礎(chǔ)上,可以用比較低的門檻做出細(xì)分模型。作為AI從業(yè)者,侯震宇認(rèn)為,這是一個(gè)很大的福音。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部資深記者
關(guān)注并報(bào)道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長(zhǎng)行業(yè)分析、深度報(bào)道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號(hào):tangtangxiaomo

熱新聞