騰訊混元大模型負責人劉煜宏:騰訊做大模型不爭一時之先

崔鵬CP2024-06-01 15:32

5月30日,騰訊推出基于混元大模型的App“騰訊元寶”,主要面向工作場景,提供AI搜索、AI總結和AI寫作等核心能力,同時面向日常生活場景新增創(chuàng)建個人智能體的能力。

從去年底至今,眾多頭部大模型廠商和創(chuàng)業(yè)公司都推出了面向C端的App應用,騰訊的入局時間并不算早,考慮到騰訊擁有國內(nèi)數(shù)一數(shù)二的C端用戶體量,這個決定讓人有些意外。

騰訊云副總裁、騰訊混元大模型負責人劉煜宏在采訪中給出了官方的態(tài)度:“騰訊做大模型不爭一時之先?!?nbsp;

因為按照騰訊的估算,目前國內(nèi)大模型應用日活躍用戶滲透率還不到1%,比同行慢幾個月推出App也沒什么影響。

在混元大模型發(fā)布至今的九個月時間里,騰訊在技術架構上做了比較大的升級,從最初的通用專家稠密大模型,變成了如今的MoE混合專家架構,打開了混元大模型參數(shù)量的天花板。

“從測試數(shù)據(jù)看,能力提升超過50%”,劉煜宏介紹稱,升級之后,騰訊混元大模型的參數(shù)規(guī)模已從千億提升至萬億,預訓練語料從萬億提升至7萬億tokens。

在騰訊元寶上線之后,絕大多數(shù)頭部大模型產(chǎn)品都已經(jīng)推出了獨立的C端應用,業(yè)界推動AI落地的共識也進入了新的階段。

雖然市面上與大模型相關的AI應用有很多,而且每家產(chǎn)品都說自己有幾十萬或者幾百萬DAU,但劉煜宏認為,在去重之后,這些應用合并到一起的DAU也就幾百萬,對比國內(nèi)的12億移動互聯(lián)網(wǎng)用戶規(guī)模來說,用戶滲透率還不到1%。

看似火熱的技術和產(chǎn)品,滲透率為何如此之低?

他給出了兩個原因:一個是大模型從ChatGPT 3.5問世開始大火,至今也就不到兩年時間,大模型技術的發(fā)展處于早期階段,產(chǎn)品能力不足,距離企業(yè)和用戶需求又很遠,導致大模型的落地能力較弱。

另一個原因是公眾對大模型的認知度不夠。雖然很多企業(yè)、開發(fā)者和用戶都知道大模型很厲害,但具體怎么用它,大部分人都不知道。

騰訊與很多企業(yè)的CTO或技術負責人都聊過大模型的應用場景,很多人的第一反應還是智能客服,應用落地的探索路徑很窄,說明在用戶教育層面還有很長的路要走。

所以劉煜宏認為就算騰訊元寶的發(fā)布時間晚了幾個月,拉長時間看也不是什么重要的事情,“(大模型應用的)滲透率不到1%,先發(fā)優(yōu)勢也就百分之零點幾,這個優(yōu)勢微不足道?!?/p>

騰訊不著急的心態(tài)從“打榜”這件事上也能體現(xiàn)出來。

“我們看到很多榜單,(有些模型)天天刷榜,但是對用戶有用么?”騰訊并不太關注榜單,也不太參與評測,很多時候“看到媒體報道才知道我們被評測了”,劉煜宏表示。

今年以來,字節(jié)跳動旗下的豆包以及月之暗面的Kimi等應用,都投入不少資金用于買量,進行付費推廣以及廣告投放。

劉煜宏對此表態(tài)稱,買量營銷不是騰訊元寶現(xiàn)階段的主要目標,“甚至對標競品拉高整體規(guī)模也不是我們現(xiàn)階段的目標。”

同樣,因為當下大模型應用的滲透率非常低,現(xiàn)階段去談整個行業(yè)的商業(yè)化也為時尚早,“還是個摸索的階段?!?/p>

未來一段時間,騰訊元寶的重心會放在串聯(lián)騰訊內(nèi)部的核心產(chǎn)品(比如微信公眾號和小程序)通路,以及優(yōu)化更多垂直行業(yè)(法律、金融和醫(yī)療等)的大模型應用體驗。

因為騰訊元寶主要面向工作場景,所以在信息獲取、處理和生產(chǎn)三個環(huán)節(jié)進行了針對性優(yōu)化。

在AI搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,同時內(nèi)容覆蓋微信公眾號等信源。

在AI總結方面,騰訊元寶可上傳最多10個PDF、word、txt等多格式文檔,一次性解析多個微信公眾號鏈接、網(wǎng)址,支持256K的原生窗口上下文,相當于一本《三國演義》或英文版《哈利波特》全集。

很多大模型都說自己有千萬文字的長文能力,劉煜宏認為這個技術上不是問題,騰訊混元大模型也支持,但用戶沒什么需求,“誰會扔一千萬的文字給它,256K長文足以支持99%的需求?!?/p>

在AI寫作方面,元寶不僅支持多輪問答,還能夠將對話的內(nèi)容整理成報告,按照要求進行結構化輸出。

此外,目前騰訊元寶還提供了AI頭像、口語陪練和智能翻譯等生活場景中的常見應用,它們大多由第三方開發(fā)者完成。

根據(jù)公開信息,騰訊內(nèi)部有超600個業(yè)務及場景都已經(jīng)接入混元大模型,其中包括騰訊廣告、微信讀書、騰訊會議、騰訊文檔和騰訊客服等都已經(jīng)基于混元進行過升級,內(nèi)部業(yè)務每日調用次數(shù)已經(jīng)超過2億次。

這被劉煜宏稱為混元大模型最大的優(yōu)勢之一。他認為騰訊的產(chǎn)品覆蓋領域非常全面,大模型在內(nèi)部落地時應用的場景也很廣泛,其它產(chǎn)品無法遇到的問題,混元都已經(jīng)遇到并且解決了。

混元底層的騰訊自研Angel分布式系統(tǒng)架構,也被視為騰訊的優(yōu)勢之一。

與行業(yè)內(nèi)很多大模型產(chǎn)品相比,“騰訊的產(chǎn)品工程能力比較強,技術演進比較早”,劉煜宏表示,“同等情況下我們的成本更低、表現(xiàn)更好?!?/p>

此外,在5月中旬,騰訊剛推出一站式智能體創(chuàng)作與分發(fā)平臺“騰訊元器”,主要面向企業(yè)用戶和開發(fā)者群體。

該平臺能提供豐富的官方插件和知識庫,支持用戶低門檻創(chuàng)建智能體。該平臺支持用戶以API形式將智能體分發(fā)至各類場景,免費token額度從此前的100萬提升至1個億。本次發(fā)布的騰訊元寶也支持用戶和開發(fā)者自建智能體的操作。

“騰訊自己不會做太多智能體”,劉煜宏表示,“更多還是希望(第三方)開發(fā)者用它去創(chuàng)作?!?/p>

轉載來源:界面新聞 作者:崔鵬CP

版權與免責:以上作品(包括文、圖、音視頻)版權歸發(fā)布者【崔鵬CP】所有。本App為發(fā)布者提供信息發(fā)布平臺服務,不代表經(jīng)觀的觀點和構成投資等建議