大模型廠商開啟“圈地戰(zhàn)爭” 騰訊云也降價了

陳月芹2024-05-19 12:51

經(jīng)濟(jì)觀察網(wǎng) 記者 陳月芹 5月17日,騰訊云在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會上宣布混元大模型多個版本模型實現(xiàn)升級,并且發(fā)布了知識引擎、圖像創(chuàng)作引擎、視頻創(chuàng)作引擎三大工具。

經(jīng)濟(jì)觀察網(wǎng)注意到,騰訊管理層在峰會上強(qiáng)調(diào)了混元大模型的技術(shù)精進(jìn)、性能、差異化、安全、低使用門檻、離產(chǎn)業(yè)更近等特點,卻全程沒有公開介紹過價格。

騰訊云官網(wǎng)顯示,它為首次使用混元大模型的用戶提供10萬tokens(大模型文本中的最小單位)的文本生成模型免費(fèi)體驗額度,有效期為1年。而在tokens資源包的價格方面,窗口尺寸為32K的hunyuan-standard模型和hunyuan-pro模型,它們的模型推理輸入價格分別為0.0069元/千tokens和0.069元/千tokens,兩者均為刊例價的6.9折。

值得注意的是,盡管混元大模型的價格在峰會上未被重點提及,但其與此前相比已明顯降低。騰訊云官網(wǎng)一份更新于5月14日的計費(fèi)信息顯示,混元大模型標(biāo)準(zhǔn)版(hunyuan-standard的前身)和高級版(hunyuan-pro的前身)此前的模型推理輸入價格分別為0.012元/千tokens和0.12元/千tokens。

實際上,字節(jié)跳動在5月15日剛剛對外正式發(fā)布豆包大模型。作為較晚發(fā)布大模型產(chǎn)品的互聯(lián)網(wǎng)大廠,字節(jié)跳動選取用“低價”作為賣點和宣傳點,以求出奇制勝。

字節(jié)跳動稱,在窗口尺寸小于等于32K的主力模型中,GPT-4(美國AI研究公司OpenAI旗下的大模型)、百度文心一言、阿里通義千問的模型推理輸入價格分別為0.42元/千tokens、0.12元/千tokens、0.12元/千tokens。而字節(jié)跳動的豆包通用模型 pro-32k 版模型推理輸入價格為0.0008元/千tokens,比行業(yè)價格低99.3%,這讓大模型從“以分計價”進(jìn)入“以厘計價”階段。

字節(jié)跳動旗下火山引擎總裁譚待當(dāng)時表示,該公司能夠在大模型產(chǎn)品上做到低價,是因為它在模型結(jié)構(gòu)、訓(xùn)練、生產(chǎn)等各種技術(shù)層面都能做得很好,有很多優(yōu)化手段能夠?qū)崿F(xiàn)降價。此外,市場對降價的呼聲比較高,平臺必須把試錯成本做到非常低,才能讓大家用起來。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。

字節(jié)跳動這次的降價動作,被市場解讀為打響了大模型“價格戰(zhàn)”。對購買大模型產(chǎn)品的企業(yè)客戶而言,無論是用它來改造企業(yè)內(nèi)部的智慧化系統(tǒng),還是用于醫(yī)院的患者分流倒流服務(wù),抑或是用于車企升級智能駕駛系統(tǒng),這都體現(xiàn)出大模型產(chǎn)品的排他性:客戶選擇某一家企業(yè)的大模型產(chǎn)品后,基于它進(jìn)行的內(nèi)部培訓(xùn)、運(yùn)營和更換的成本都極高。

因此,開啟“圈地戰(zhàn)爭”、盡可能多地?fù)尩降谝慌髽I(yè)客戶,成為現(xiàn)階段大模型廠商十分重要的任務(wù)。這也是字節(jié)跳動、騰訊云等廠商對大模型降價的動力之一。

不過,在本次峰會上,面對“如何看待大模型廠商開打‘價格戰(zhàn)’”、騰訊云是否有降價策略等提問時,騰訊云副總裁、騰訊云智能負(fù)責(zé)人吳運(yùn)聲沒有直接回應(yīng)。

吳運(yùn)聲說,無論是底層能力發(fā)展,或是構(gòu)建應(yīng)用工具鏈發(fā)展,大模型技術(shù)和應(yīng)用還在快速發(fā)展過程中。因此,騰訊云把所有的、大量的精力放在怎樣提高底層大模型能力上,包括怎么讓用戶真正用起來混元大模型、如何多層次對外提供大模型等工作。

在本次峰會上,騰訊云安排了六場演講,其中介紹了騰訊混元多尺寸的大模型矩陣及特色,它旗下的最大模型hunyuan-pro已拓展至萬億級參數(shù)規(guī)模。并且,混元大模型在國內(nèi)率先采用混合專家模型(MoE)結(jié)構(gòu),模型總體性能相比上一代提升了50%,部分中文能力已追平GPT-4。

在多模態(tài)能力方面,混元大模型在生圖領(lǐng)域的文生圖基礎(chǔ)架構(gòu)已升級至Sora(OpenAI旗下的文生視頻大模型)同款的DiT架構(gòu),支持中英文雙語輸入及理解,具備多輪繪圖能力;在生視頻領(lǐng)域,混元已能生成長度達(dá)到16秒的視頻;在生三維(3D)層面,混元已布局文/圖生3D,單圖僅需30秒即可生成3D模型。

此外,騰訊云還重點介紹了混元大模型如何應(yīng)對大模型應(yīng)用過程中可能出現(xiàn)的安全問題,例如模型被盜用、竊取和破壞,商業(yè)機(jī)密或重要數(shù)據(jù)泄漏,以及大模型數(shù)據(jù)安全合規(guī)等問題。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報》社所有。未經(jīng)《經(jīng)濟(jì)觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
資深記者
城市與不動產(chǎn)新聞中心華南組負(fù)責(zé)人
新聞線索請聯(lián)系:chenyueqin@eeo.com.cn

熱新聞

電子刊物

點擊進(jìn)入