京東發(fā)布大模型,走了另一條路

周應(yīng)梅2023-07-13 23:15

經(jīng)濟觀察網(wǎng) 記者 周應(yīng)梅

7月13日,京東的大模型產(chǎn)品言犀在2023京東全球科技探索者大會暨京東云峰會首次公布。在發(fā)布會現(xiàn)場,京東并未重點展示大模型產(chǎn)品的通識問答能力,所有高管的主題演講中提及最多的是“產(chǎn)業(yè)”二字,也未提及學習、追趕OpenAI等內(nèi)容。

今年5月新上任的京東集團CEO許冉也到場發(fā)表了對大模型的看法,“雖然大模型具備智能涌現(xiàn)和泛化的能力,但是當它缺少產(chǎn)業(yè)數(shù)據(jù)的時候,對產(chǎn)業(yè)的理解存在非常大的局限性。”許冉說。她表示,京東不同于其他公司之處在于擁有深厚的產(chǎn)業(yè)數(shù)據(jù)積累。京東理解大模型的公式是:“大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方”。

不過京東依然強調(diào)言犀大模型的訓(xùn)練數(shù)據(jù)70%來自通用領(lǐng)域,30%來自京東的產(chǎn)業(yè)數(shù)據(jù),產(chǎn)業(yè)數(shù)據(jù)占比少。產(chǎn)業(yè)數(shù)據(jù)中來自零售、健康、金融、物流的分別13.6%、6.7%、3.9%、3.2%,并稱既有通用大模型的“常識”,又具備產(chǎn)業(yè)模型的“專業(yè)”。

本次京東并未將言犀大模型作為一個具體平臺發(fā)布,但京東稱會將這個能力開放,并發(fā)布了言犀AI開發(fā)計算平臺,將于8月上線。這是一個提供大模型訓(xùn)練的平臺,現(xiàn)場演示中,京東工作人員展示了五個步驟如何將通用大模型轉(zhuǎn)化為行業(yè)健康大模型,其中包括創(chuàng)建目標、行業(yè)數(shù)據(jù)上傳、創(chuàng)建管道、模型訓(xùn)練(可以選擇目前已經(jīng)開源的市面上的大模型)、部署和發(fā)布模型生成API。同時用戶不需要上傳數(shù)據(jù),可以利用京東提供的數(shù)據(jù)。

京東方面稱,一般這套流程,從數(shù)據(jù)準備、模型訓(xùn)練到模型部署,需要10余名科學家花費一周時間。但利用言犀AI開發(fā)計算平臺,只需要1-2名算法人員,在數(shù)分鐘就能完成,能節(jié)省90%的推理成本。

產(chǎn)品應(yīng)用層面,基于京東的言犀大模型京東也推出了京醫(yī)千詢大模型和金融領(lǐng)域AI營銷運營平臺,分別可用于醫(yī)療問診、營銷活動策略生成等。

京東探索研究院院長何曉冬公布了京東大模型接下來的進度表,7月發(fā)布言犀大模型和言犀AI開發(fā)計算平臺后,下半年大模型將應(yīng)用于京東內(nèi)部核心業(yè)務(wù),2024年上半年將全面開放大模型能力。

(頭圖源:記者周應(yīng)梅拍攝)

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán),嚴禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責任。版權(quán)合作請致電:【010-60910566-1260】。
TMT新聞部記者
關(guān)注并報道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長人物采訪、深度報道。
聯(lián)系郵箱:zhouyingmei@eeo.com.cn