OpenAI的勁敵發(fā)了一款新模型，Claude 3.5 Sonnet多模態(tài)能力超過GPT-4o

伍洋宇2024-06-23 16:23

在GPT-4o炸場一個月后，OpenAI最大的競爭對手Anthropic放出了一款頗有競爭力的新模型。

北京時間6月21日，Anthropic正式發(fā)布Claude 3.5 Sonnet，這是其Claude系列的最新AI模型。從Anthropic透露的信息來看，在閱讀、編碼、數(shù)學(xué)和視覺等幾個主要AI基準(zhǔn)測試中，新模型能力不僅超過了Claude 3 Sonnet，還超越了Anthropic此前最強(qiáng)版本的旗艦?zāi)Ｐ虲laude 3 Opus。

按照慣例，Anthropic也釋出了一系列與行業(yè)競爭對手的測試結(jié)果榜單，令人矚目的是，Claude 3.5 Sonnet的大部分成績優(yōu)于OpenAI、Google、Meta的旗艦?zāi)Ｐ?，其中自然也包括剛推出不久還處于風(fēng)口的GPT-4o。

細(xì)致來看，Claude 3.5 Sonnet在研究生水平推理 (GPQA)、編碼能力 (HumanEval) 、文本推理（DROP）等方面的成績均好于GPT-4o，但在數(shù)學(xué)問題解決能力上稍遜于后者。

Claude 3.5 Sonnet強(qiáng)調(diào)了自己在創(chuàng)意寫作方面的突出表現(xiàn)，公司表示它能夠更好理解prompt（指令）之間的細(xì)微差別以及有更強(qiáng)的幽默能力。

而作為一款多模態(tài)大模型，Claude 3.5 Sonnet與GPT-4o相比，沒有將重點放在實時音頻交互能力上，而是暫時著重突出了圖像處理能力的提升。

Claude 3.5 Sonnet在大多數(shù)視覺基準(zhǔn)測試中比Claude 3 Opus平均表現(xiàn)高出10%。公司稱，Claude 3.5 Sonnet可以更準(zhǔn)確地解釋圖表和圖形，在帶有扭曲和視覺偽像的這類“不完美”圖像中，它也能順利完成文本轉(zhuǎn)錄任務(wù)。

據(jù)TechCrunch報道，Anthropic的產(chǎn)品主管Michael Gerstenhaber表示，這些技術(shù)改進(jìn)的來源是架構(gòu)調(diào)整和新訓(xùn)練數(shù)據(jù)（包括人工智能生成的數(shù)據(jù)），但他并未透露具體數(shù)據(jù)內(nèi)容。

性能提高、成本降低的規(guī)律也體現(xiàn)在這款最新模型上。根據(jù)公司分享的信息，Claude 3.5 Sonnet比Opus速度更快（以聊天機(jī)器人為例其速度大約是Opus的兩倍），但價格僅為后者的五分之一。

在定價上，該模型的輸入價格為3美元/百萬Tokens，輸出價格為15美元/百萬Tokens，上下文窗口長度達(dá)200K Tokens。

除了大模型產(chǎn)品，Anthropic此次還推出了一款應(yīng)用產(chǎn)品Artifacts預(yù)覽版。這是一個可供用戶添加和編輯其模型生成內(nèi)容的工作空間，例如用其生成的代碼、文檔、圖像、網(wǎng)站設(shè)計等內(nèi)容創(chuàng)建作品。

這款產(chǎn)品會在Claude的web客戶端設(shè)置一個專用窗口，產(chǎn)品形態(tài)類似于將大模型接入工作流。Anthropic表示，Artifacts后續(xù)還可能會與其他團(tuán)隊合作以接入新功能。

此外，Anthropic透露，公司將在今年晚些時候陸續(xù)更新其余兩款大模型Claude 3.5 Haiku和Claude 3.5 Opus。

作為Anthropic背后的科技巨頭，亞馬遜云科技也隨即宣布，Claude 3.5 Sonnet已正式接入其Amazon Bedrock。

來源：界面新聞作者：伍洋宇

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【伍洋宇】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù)，不代表經(jīng)觀的觀點和構(gòu)成投資等建議