京東何曉冬:大模型有市場(chǎng)競(jìng)爭(zhēng)是好事

周應(yīng)梅2023-07-07 23:42

經(jīng)濟(jì)觀察網(wǎng) 記者 周應(yīng)梅

7月7日,京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬在2023世界人工智能大會(huì)上接受包括經(jīng)濟(jì)觀察網(wǎng)在內(nèi)的媒體采訪時(shí)表示,京東在大模型上一直進(jìn)行技術(shù)積累與布局,并深度結(jié)合了京東和產(chǎn)業(yè)的需求,已經(jīng)陸續(xù)發(fā)布了十億級(jí)、百億級(jí)參數(shù)的大模型。今年的京東探索者科技大會(huì)上,京東即將發(fā)布千億級(jí)參數(shù)大模型。

今年以來,大模型產(chǎn)品批量涌現(xiàn),根據(jù)世界人工智能大會(huì)官方微信披露數(shù)據(jù),2023年的大會(huì)上聚齊了三十多個(gè)大模型及相關(guān)產(chǎn)品。何曉冬認(rèn)為,有市場(chǎng)競(jìng)爭(zhēng)是好事,從2016年以來就感受到競(jìng)爭(zhēng)非常激烈,這也說明市場(chǎng)有需求,其次,競(jìng)爭(zhēng)中產(chǎn)生的技術(shù)和產(chǎn)品才是真正有生命力的。

何曉冬表示,當(dāng)你的技術(shù)過了一個(gè)門檻以后,就會(huì)出現(xiàn)百花齊放的情景,各種各樣的衍生形態(tài)都會(huì)出來,包括AI生成的繪畫、數(shù)字人、人機(jī)對(duì)話等應(yīng)用的出現(xiàn),其實(shí)是因?yàn)榛A(chǔ)的深度學(xué)習(xí)為代表的技術(shù)過了一個(gè)門檻。

何曉冬稱京東大模型并不是馬上就產(chǎn)生的,而是多年的鋪墊。他提及2020年時(shí)京東就關(guān)注到了深度學(xué)習(xí)模型和語言生成,當(dāng)時(shí)也開啟了語言模型研發(fā)。當(dāng)AI通用算法生成語言時(shí)免不了會(huì)生成事實(shí)錯(cuò)誤內(nèi)容,這樣的情況在to C端或許可以調(diào)侃,但在電商領(lǐng)域是無法容忍的。“技術(shù)只有和現(xiàn)實(shí)世界的真實(shí)場(chǎng)景和產(chǎn)品產(chǎn)生緊密融合,才有可能真正產(chǎn)生AI落地的價(jià)值。”何曉冬說。

2021年京東針對(duì)零售電商場(chǎng)景中內(nèi)容生成專業(yè)度不足問題,提出了十億級(jí)K-PLUG算法模型,目前模型已經(jīng)在京東的發(fā)現(xiàn)好貨等場(chǎng)景廣泛應(yīng)用;2022年針對(duì)模型泛化性不足,京東提出了百億級(jí)模型Vega;百億級(jí)模型之后,今年京東再推出千億級(jí)大模型。

何曉冬認(rèn)為,大模型有它的好處,可以容納多種技能,互相之間沒有太多沖突,多個(gè)行業(yè)都可以覆蓋。帶來的困難是它的推理過程和部署成本會(huì)更高,因此對(duì)于一些特定場(chǎng)景,模型不一定求大。

何曉冬在本屆人工智能大會(huì)的公開演講中提及,京東言犀大模型在語言方向已經(jīng)有大量的使用,寫了超過30億字的營(yíng)銷文案,使得營(yíng)銷文案生成做到了自動(dòng)化和智能化。他表示,其它已有的應(yīng)用領(lǐng)域還包括數(shù)字人直播、智能政務(wù)熱線、銀行數(shù)字員工等。

何曉冬認(rèn)為,大模型的可靠性問題不解決,就無法在產(chǎn)業(yè)場(chǎng)景中廣泛應(yīng)用。他提到,為保證大模型的可靠性,三年以來京東在這方面進(jìn)行了一系列改進(jìn),會(huì)把特定的行業(yè)知識(shí)注入文本訓(xùn)練中,比如要寫新品文案推薦會(huì)讓它參考產(chǎn)品說明書;另外,還會(huì)設(shè)計(jì)一個(gè)損失函數(shù),出現(xiàn)錯(cuò)誤或者重要的內(nèi)容沒被抓取到,就會(huì)有額外損失,有一個(gè)懲罰模型,最終讓模型學(xué)會(huì)從可信的信源里獲取基礎(chǔ)知識(shí)。

目前大模型朝著通用大模型和垂直行業(yè)模型兩個(gè)方向發(fā)展。何曉冬稱,垂直行業(yè)模型訓(xùn)練成本和訓(xùn)練難度其實(shí)更高,但部署和應(yīng)用成本會(huì)盡量降下來,因?yàn)橹苯雨P(guān)系到客戶的成本。要做好行業(yè)模型,行業(yè)領(lǐng)域的Know-How非常重要,也需要足夠的基礎(chǔ)常識(shí)作背景,才能帶來好的體驗(yàn)。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
關(guān)注并報(bào)道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長(zhǎng)人物采訪、深度報(bào)道。
聯(lián)系郵箱:zhouyingmei@eeo.com.cn

熱新聞