百度吳甜:現(xiàn)在是建大模型生態(tài)的最好時(shí)機(jī)

任曉寧2023-08-16 20:45

經(jīng)濟(jì)觀察網(wǎng) 記者 任曉寧

8月16日下午,百度文心一言公布了最新進(jìn)展。百度集團(tuán)副總裁吳甜告訴經(jīng)濟(jì)觀察網(wǎng)記者,與3月份剛發(fā)布時(shí)相比,文心一言熟練掌握創(chuàng)作載體有200多個(gè),思維鏈長(zhǎng)度增加了2.1倍,知識(shí)點(diǎn)覆蓋加強(qiáng)了8.3倍。

在用戶端的感知,就是文心一言變得更聰明了。記者體驗(yàn)發(fā)現(xiàn),在邏輯能力、記憶能力方面,文心一言的確有改進(jìn)。3月份時(shí)記者讓它制作某上市公司2018年至2022年的凈利潤(rùn)柱狀圖,當(dāng)時(shí)沒(méi)有顯示出圖表,并且給出了錯(cuò)誤數(shù)據(jù)。今天再次體驗(yàn),文心一言能直接給出正確的圖表。

吳甜現(xiàn)場(chǎng)演示了文心一言的變化,在5分鐘內(nèi),她從無(wú)到有生成了一段23秒有畫(huà)面、有聲音、主旨清晰的牛奶飲品宣傳短視頻。她說(shuō),如果不用AI,完成整套流程需要幾天時(shí)間。

不過(guò),視頻生成能力占用算力較大,目前還沒(méi)有對(duì)外開(kāi)放,需要內(nèi)測(cè)申請(qǐng)才能體驗(yàn)。

文心一言變聰明的背后,是技術(shù)的提升。吳甜告訴記者,其中提升最大的是基礎(chǔ)模型技術(shù),雖然看起來(lái)還是3月份那個(gè)文心一言,但實(shí)際上,底層基礎(chǔ)模型已經(jīng)換了幾個(gè)版本,現(xiàn)在是第3.5版本。其次提升的是數(shù)據(jù),新版本使用了更優(yōu)質(zhì)的數(shù)據(jù)源,此外,模型訓(xùn)練方法也有了改變,使用了長(zhǎng)文建模、多類型多階段精調(diào)模型等。

對(duì)于當(dāng)前的大模型技術(shù)能力,吳甜稱,仍有很大提升空間。她回答記者說(shuō),文心一言距離終極目標(biāo)還有很長(zhǎng)的路要走,下階段最重要的提升大模型邏輯性,并與應(yīng)用結(jié)合。

8月16日當(dāng)天,百度向大模型開(kāi)發(fā)者發(fā)出號(hào)召,提供億元免費(fèi)生態(tài)算力,鼓勵(lì)開(kāi)發(fā)者開(kāi)發(fā)插件。同時(shí)百度也推出了大模型社區(qū)“星河社區(qū)”,提供一體化開(kāi)發(fā)流程。

對(duì)比國(guó)外ChatGPT多個(gè)數(shù)百個(gè)插件的生態(tài),目前文心一言只有5個(gè)插件,分別是:百度搜索、覽卷文檔、E言易圖、說(shuō)圖解畫(huà)、一鏡流影。這些插件均由百度自己開(kāi)發(fā)。

吳甜告訴記者,百度選擇自己開(kāi)發(fā)插件的原因是,想先把開(kāi)發(fā)的過(guò)程走一遍,走通之后再開(kāi)放給開(kāi)發(fā)者。

“AI是復(fù)雜鏈條,需要上下游一起努力。”從整個(gè)AI行業(yè)看,上半年大家還沉浸在熱潮來(lái)襲的狀態(tài)中,半年后的現(xiàn)在,行業(yè)分工變得清晰了。吳甜認(rèn)為,現(xiàn)在國(guó)內(nèi)大模型技術(shù)已經(jīng)相對(duì)成熟,從業(yè)者也更務(wù)實(shí),已經(jīng)到了大家拉起手來(lái),搭建大模型生態(tài)的最好時(shí)機(jī)。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部資深記者
關(guān)注并報(bào)道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長(zhǎng)行業(yè)分析、深度報(bào)道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號(hào):tangtangxiaomo

熱新聞