OpenAI開戰(zhàn)小模型,GPT-4o mini成本再降60%

伍洋宇2024-07-21 08:46

“小模型”戰(zhàn)況突然變得激烈起來,無法做到便宜又好用的公司恐怕要掉隊了。

7月19日,OpenAI突然官宣并上線了一款“小模型”GPT-4o mini,被團隊描述為最智能、最實惠的模型,其性能和價格均已趕超GPT-3.5 Turbo。

作為直觀對比,GPT-4o mini輸入價格為15美分/百萬Tokens,輸出價格為60美分/百萬Tokens。而曾被視為OpenAI內(nèi)部最輕量級且高性價比的GPT-3.5 Turbo,其輸入價格為50美分/百萬Tokens,輸出價格為150美分/百萬Tokens。

至此,OpenAI“小模型”API價格再降至少60%。 

性能方面,該模型支持128K上下文輸入以及16K輸出。OpenAI的基準測試顯示,除了GPT-3.5 Turbo,它的性能還超過了Claude 3 Haiku和Gemini 1.5 Flash這兩種之前最便宜、最好的模型。

GPT-4o mini的高性能來源于GPT-4o,這是OpenAI目前最快、最強大的旗艦大模型。OpenAI在5月的一次直播活動中發(fā)布了GPT-4o,“o”代表omni(全能的),寓意了該模型對多模態(tài)的注重。彼時,團隊表示GPT-4o對音頻、視頻和文本等多模態(tài)理解與生成功能進行了改進,能夠以更高的速度和質(zhì)量處理50種不同的語言。 

目前,GPT-4o mini API接口已開放,支持文本和視覺,未來還將融入文本、圖像、視頻和音頻的輸入和輸出。它將于當?shù)貢r間周四向ChatGPT的免費用戶、ChatGPT Plus和團隊訂閱者開放,ChatGPT企業(yè)用戶將于下周開放。

GPT-4o mini發(fā)布后,山姆·奧特曼在推特上發(fā)文為自家產(chǎn)品站臺,“通往智能的成本,便宜到不值得計量?!彼爬薌PT-4o mini最直觀的特點:便宜的價格,MMLU(Massive Multitask Language Understanding/大規(guī)模多任務(wù)語言理解)得分82%,性能超快。

山姆幾乎不遺余力強調(diào)這一點。他在另一條推文中寫道,早在2022年,世界上最好的模型是text-davinci-003,它比GPT-4o mini差得多,但成本要貴上100多倍。 

性能提升與成本下降正是OpenAI在當前研發(fā)進展中所強調(diào)的。公司在一份新聞稿中表示,“在過去的幾年里,我們見證了人工智能的顯著進步,同時也見證了成本的大幅降低。我們致力于在提高模型性能的同時繼續(xù)降低成本?!?/p>

公司設(shè)想未來,模型將無縫集成到每個應(yīng)用程序和每個網(wǎng)站上。以GPT-4o mini為代表的“小模型”將為開發(fā)人員更高效、更經(jīng)濟地構(gòu)建和擴展強大的AI應(yīng)用鋪平道路?!叭斯ぶ悄艿奈磥韺⒆兊酶菀撰@得、更可靠,并嵌入到我們的日常數(shù)字體驗中?!?nbsp;

通過提效降本促進大模型服務(wù)普及,已經(jīng)成為大模型公司的共識。

今年上半年以來國內(nèi)掀起的API價格戰(zhàn)正是這個趨勢的縮影。而除了大模型推理成本的逐年自然下降,以壓縮和蒸餾等技術(shù)思路做“小模型”也是其中一個重要方向,海外的Mistral AI以及國內(nèi)的DeepSeek、面壁智能都有相應(yīng)成果產(chǎn)出。 

這一方面是為了推動開發(fā)者先用起來,另一方面也是落地端側(cè)設(shè)備的必要歷程。在這一點上,三星和蘋果兩大廠商已經(jīng)在今年顯示出了野心,智能硬件或?qū)⒊蔀榇竽P妥詈玫穆涞貓鼍爸弧?/p>

這意味著,在下一階段,通用大模型公司不僅要按照Scaling Law(規(guī)模法則)繼續(xù)推進大模型的智能提升,更要掌握把模型做小的能力,以覆蓋更多用戶和應(yīng)用場景。這又將是另一個能力維度的極限較量。


來源:界面新聞 作者:伍洋宇

版權(quán)與免責:以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【伍洋宇】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點和構(gòu)成投資等建議

熱新聞

電子刊物

點擊進入