百川智能發(fā)布2代開源大模型,王小川:已超越LLaMA 2

任曉寧2023-09-06 22:32

經(jīng)濟(jì)觀察網(wǎng) 記者 任曉寧

9月6日下午,百川智能在北京發(fā)布Baichuan 2系列開源大模型,這些模型可免費商用,百川智能創(chuàng)始人兼CEO王小川說,其開源模型已經(jīng)全面超越了LLaMA2的性能。

LLaMA2發(fā)布于今年7月19日,由美國互聯(lián)網(wǎng)大廠Meta推出,當(dāng)時在全球引起轟動,外界評價說,LLaMA2的開源將可能影響大模型最終格局。

Baichuan 2開源大模型主要包括Baichuan2-7B和Baichuan2-13B,二者分別為70億參數(shù)和130億參數(shù)。王小川說,其70億參數(shù)模型在英文評測級上,已經(jīng)能夠齊平LLaMA2的130億參數(shù)模型,能夠做到“以小博大”。

同為大模型創(chuàng)業(yè)者的瀾舟科技創(chuàng)始人兼CEO周明也來到百川智能發(fā)布會,周明說,國外開源模型更多是支持英文為主的西方語言,對中文的支持要么不足,要么不太友好。他認(rèn)為,Baichuan2兩款模型,對中文用戶的支持非常友好,而且它的性能在很多方面都超越了英文同等尺寸模型,因此是對中國大模型領(lǐng)域研究和應(yīng)用的利好消息。

Baichuan 2大模型建立在上一代產(chǎn)品基礎(chǔ)上,王小川解釋說,跟第一代相比,新產(chǎn)品文科、理科能力均得到提升,此外,其代碼能力、安全能力、邏輯、語義理解也有明顯的提升。

百川智能上一代大模型開源后下載量超過500萬次,有200多家企業(yè)申請試用百川開源模型,包括云廠商、科技制造公司、消費公司等。在百川智能列出的名單里,阿里云、蔚來汽車、美的集團(tuán)都是合作伙伴。

百川智能成立于今年4月10日,4個月時間內(nèi)已發(fā)布了3款大模型產(chǎn)品,也是國內(nèi)首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的8家大模型公司之一。此次百川智能又快速推出了2代產(chǎn)品,王小川解釋說,因為百川智能之前有搜索基因,因此天然懂得如何從萬億網(wǎng)頁中間去精選最好的頁面,可以做到去重、反垃圾。在數(shù)據(jù)處理中,百川智能也借鑒了之前搜索的經(jīng)驗,能小時級完成千億數(shù)據(jù)的清洗和去重工作。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報》社所有。未經(jīng)《經(jīng)濟(jì)觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
TMT新聞部資深記者
關(guān)注并報道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長行業(yè)分析、深度報道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號:tangtangxiaomo

熱新聞

電子刊物

點擊進(jìn)入