OpenAI的勁敵發(fā)了一款新模型,Claude 3.5 Sonnet多模態(tài)能力超過GPT-4o

伍洋宇2024-06-23 16:23

在GPT-4o炸場一個月后,OpenAI最大的競爭對手Anthropic放出了一款頗有競爭力的新模型。 

北京時間6月21日,Anthropic正式發(fā)布Claude 3.5 Sonnet,這是其Claude系列的最新AI模型。從Anthropic透露的信息來看,在閱讀、編碼、數(shù)學(xué)和視覺等幾個主要AI基準(zhǔn)測試中,新模型能力不僅超過了Claude 3 Sonnet,還超越了Anthropic此前最強(qiáng)版本的旗艦?zāi)P虲laude 3 Opus。

按照慣例,Anthropic也釋出了一系列與行業(yè)競爭對手的測試結(jié)果榜單,令人矚目的是,Claude 3.5 Sonnet的大部分成績優(yōu)于OpenAI、Google、Meta的旗艦?zāi)P?,其中自然也包括剛推出不久還處于風(fēng)口的GPT-4o。 

細(xì)致來看,Claude 3.5 Sonnet在研究生水平推理 (GPQA)、編碼能力 (HumanEval) 、文本推理(DROP)等方面的成績均好于GPT-4o,但在數(shù)學(xué)問題解決能力上稍遜于后者。

Claude 3.5 Sonnet強(qiáng)調(diào)了自己在創(chuàng)意寫作方面的突出表現(xiàn),公司表示它能夠更好理解prompt(指令)之間的細(xì)微差別以及有更強(qiáng)的幽默能力。

而作為一款多模態(tài)大模型,Claude 3.5 Sonnet與GPT-4o相比,沒有將重點放在實時音頻交互能力上,而是暫時著重突出了圖像處理能力的提升。

Claude 3.5 Sonnet在大多數(shù)視覺基準(zhǔn)測試中比Claude 3 Opus平均表現(xiàn)高出10%。公司稱,Claude 3.5 Sonnet可以更準(zhǔn)確地解釋圖表和圖形,在帶有扭曲和視覺偽像的這類“不完美”圖像中,它也能順利完成文本轉(zhuǎn)錄任務(wù)。

據(jù)TechCrunch報道,Anthropic的產(chǎn)品主管Michael Gerstenhaber表示,這些技術(shù)改進(jìn)的來源是架構(gòu)調(diào)整和新訓(xùn)練數(shù)據(jù)(包括人工智能生成的數(shù)據(jù)),但他并未透露具體數(shù)據(jù)內(nèi)容。

性能提高、成本降低的規(guī)律也體現(xiàn)在這款最新模型上。根據(jù)公司分享的信息,Claude 3.5 Sonnet比Opus速度更快(以聊天機(jī)器人為例其速度大約是Opus的兩倍),但價格僅為后者的五分之一。

在定價上,該模型的輸入價格為3美元/百萬Tokens,輸出價格為15美元/百萬Tokens,上下文窗口長度達(dá)200K Tokens。

除了大模型產(chǎn)品,Anthropic此次還推出了一款應(yīng)用產(chǎn)品Artifacts預(yù)覽版。這是一個可供用戶添加和編輯其模型生成內(nèi)容的工作空間,例如用其生成的代碼、文檔、圖像、網(wǎng)站設(shè)計等內(nèi)容創(chuàng)建作品。

這款產(chǎn)品會在Claude的web客戶端設(shè)置一個專用窗口,產(chǎn)品形態(tài)類似于將大模型接入工作流。Anthropic表示,Artifacts后續(xù)還可能會與其他團(tuán)隊合作以接入新功能。

此外,Anthropic透露,公司將在今年晚些時候陸續(xù)更新其余兩款大模型Claude 3.5 Haiku和Claude 3.5 Opus。

作為Anthropic背后的科技巨頭,亞馬遜云科技也隨即宣布,Claude 3.5 Sonnet已正式接入其Amazon Bedrock。


來源:界面新聞 作者:伍洋宇

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【伍洋宇】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點和構(gòu)成投資等建議

熱新聞

電子刊物

點擊進(jìn)入