零一萬(wàn)物李開(kāi)復(fù):用最少的芯片、最低的成本去訓(xùn)練“能力所及”的模型

錢(qián)玉娟2024-05-13 21:10

經(jīng)濟(jì)觀察網(wǎng) 記者 錢(qián)玉娟 5月13日,創(chuàng)新工場(chǎng)董事長(zhǎng)兼CEO李開(kāi)復(fù)帶隊(duì)孵化的AI公司零一萬(wàn)物,正式發(fā)布了千億參數(shù)規(guī)模的閉源模型Yi-Large。這是零一萬(wàn)物發(fā)布的首個(gè)閉源模型,也是首個(gè)千億參數(shù)規(guī)模模型。

這次Yi-Large發(fā)布,許久未露面的李開(kāi)復(fù)還通過(guò)個(gè)人抖音賬號(hào)對(duì)發(fā)布全程進(jìn)行了直播。他介紹,在斯坦福評(píng)測(cè)機(jī)構(gòu)AlpacaEval 2.0官方認(rèn)證的最新模型排行榜上,Yi-Large模型的英語(yǔ)能力主要指標(biāo)LC Win Rate(控制回復(fù)的長(zhǎng)度)排到了世界第二,僅次于美國(guó)人工智能研究公司OpenAI旗下最新大模型ChatGPT-4 Turbo。

在各家大模型進(jìn)入能力力求對(duì)標(biāo)ChatGPT-4的階段,零一萬(wàn)物在Yi-Large模型能力評(píng)測(cè)和展示環(huán)節(jié),也表示在通用能力、代碼生成、數(shù)學(xué)推理、指令遵循等多方面,模型指標(biāo)超越了ChatGPT-4、Google Gemini 1.5等同級(jí)模型。

除了發(fā)布閉源模型Yi-Large,李開(kāi)復(fù)還宣布零一萬(wàn)物早先發(fā)布的Yi-34B、Yi-9B等中小尺寸開(kāi)源模型,版本可升級(jí)到Y(jié)i-1.5系列。借此機(jī)會(huì),零一萬(wàn)物公開(kāi)了開(kāi)源、閉源雙軌大模型的戰(zhàn)略布局。

2023年零一萬(wàn)物創(chuàng)立,以開(kāi)源模式進(jìn)入AI領(lǐng)域。2023年11月,零一萬(wàn)物首發(fā)Yi系列開(kāi)源模型,僅一個(gè)月后,Yi-34B版本模型成為國(guó)內(nèi)唯一一個(gè)被英偉達(dá)AI Playground(AI游樂(lè)場(chǎng),一個(gè)提供預(yù)訓(xùn)練模型和資源的平臺(tái))收錄的大模型。

Yi系列開(kāi)源模型發(fā)布后,零一萬(wàn)物收到了來(lái)自全球開(kāi)發(fā)者的反饋,“從學(xué)習(xí)、導(dǎo)航、銷(xiāo)售、API(應(yīng)用程序編程接口)的應(yīng)用到商業(yè)寫(xiě)作,都已經(jīng)開(kāi)始有早期用戶”。李開(kāi)復(fù)認(rèn)為模型開(kāi)源會(huì)讓全球每個(gè)用戶受益,他甚至覺(jué)得,學(xué)生、創(chuàng)業(yè)者、老師、科研人員、公益組織都需要用大模型,但“無(wú)論用ChatGPT-4還是Yi-Large,(他們)都會(huì)嫌太大、太貴”。

與OpenAI這一超級(jí)獨(dú)角獸在巨額融資后可以用超級(jí)多的GPU展開(kāi)模型訓(xùn)練不同,“我們是務(wù)實(shí)的AGI(通用人工智能)信仰者”,李開(kāi)復(fù)說(shuō),零一萬(wàn)物走出了一條適合自己的路,就是用最少的芯片、最低的成本去訓(xùn)練“能力所及”的模型。

談及零一萬(wàn)物的發(fā)展方向,李開(kāi)復(fù)稱,“我們的精力不會(huì)放在行業(yè)預(yù)測(cè),也不會(huì)用大力出奇跡的唯一思維,(去)追求能不能用一百億美金、一千億美金(預(yù)測(cè)AGI的燃點(diǎn))”,他認(rèn)為與零一萬(wàn)物相關(guān)度更高的是“AI普惠點(diǎn)”,他希望團(tuán)隊(duì)成為一個(gè)“點(diǎn)燃者”,幫助開(kāi)發(fā)者通過(guò)API和Yi系列模型,在電商、社交、娛樂(lè)等領(lǐng)域打造出AI時(shí)代的淘寶、微信、抖音等。

“現(xiàn)在是分秒必爭(zhēng)。”李開(kāi)復(fù)看到國(guó)際大廠都在不斷迭代進(jìn)步,零一萬(wàn)物的步伐也在加快,在推出Yi-Large大模型的同時(shí),零一萬(wàn)物內(nèi)部已經(jīng)啟動(dòng)了下一代模型Yi-XLarge的相關(guān)訓(xùn)練。

李開(kāi)復(fù)稱,目前“不是可以做一個(gè)模型,然后就休兵半年、一年的時(shí)間”,團(tuán)隊(duì)正朝著美國(guó)前沿大模型去探索模型技術(shù)的進(jìn)步。李開(kāi)復(fù)也見(jiàn)證著中國(guó)公司在一個(gè)新的環(huán)境里快速并野蠻生長(zhǎng),“當(dāng)然會(huì)有一家又一家(公司)慢慢地轉(zhuǎn)型甚至退場(chǎng)”,但他隨后說(shuō),眼下中國(guó)模型市場(chǎng)還在成長(zhǎng)中,不要低估中國(guó)創(chuàng)業(yè)者的生命力。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
長(zhǎng)期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢(shì)。擅長(zhǎng)企業(yè)模式、人物專(zhuān)訪及行業(yè)深度報(bào)道。
重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn
微信號(hào):EstherQ138279

熱新聞