Meta發(fā)布最強(qiáng)開源大模型Llama 3 多模態(tài)版本隨后將上線

牛占林2024-04-20 19:02

當(dāng)?shù)貢r(shí)間周四,美國科技巨頭Meta推出了其最強(qiáng)大的開源人工智能(AI)模型Llama 3,以追趕行業(yè)領(lǐng)導(dǎo)者OpenAI。美股盤中,Meta股價(jià)上漲逾2%,今年迄今漲近43%。

Meta首席執(zhí)行官扎克伯格聲稱,Llama 3有8B和70B兩個(gè)版本,大版本的Llama 3將有超過4000億參數(shù)。由于預(yù)訓(xùn)練和指令微調(diào),Llama 3相比Llama 2有了極大的改進(jìn)。

image

Llama 3在多種行業(yè)基準(zhǔn)測(cè)試上展現(xiàn)了最先進(jìn)的性能,并提供了包括改進(jìn)的推理能力在內(nèi)的新功能。Meta認(rèn)為Llama 3是市場(chǎng)上最好的開源大模型。開源意味著這些模型的代碼和數(shù)據(jù)對(duì)公眾開放,任何人都可以查看、修改和使用。

開發(fā)人員抱怨之前的Llama 2模型無法理解基本的上下文,在處理查詢時(shí)經(jīng)常出現(xiàn)混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題,它在生成歷史人物的圖像時(shí)產(chǎn)生了不準(zhǔn)確的描述,這引起了廣泛批評(píng)。

現(xiàn)在,Meta在訓(xùn)練Llama 3時(shí)使用了更高質(zhì)量的數(shù)據(jù),這些數(shù)據(jù)幫助AI模型更好地識(shí)別語言中的細(xì)微差別,從而提高其對(duì)上下文的理解能力。

Meta提到,他們?yōu)長lama 3模型輸入的數(shù)據(jù)量是Llama 2的七倍,這可能有助于提高模型的性能和準(zhǔn)確性。還利用了由AI生成的“合成”數(shù)據(jù)來加強(qiáng)模型在編碼和推理等特定領(lǐng)域的能力。

據(jù)Meta介紹,Llama 3將被整合到其虛擬助手Meta AI中,這是免費(fèi)使用的同類產(chǎn)品中最先進(jìn)的AI應(yīng)用程序。Meta AI助手已經(jīng)在Facebook、Instagram、WhatsApp和Messenger等應(yīng)用中上線,隨后也將迎來更新。

Meta首席產(chǎn)品官Chris Cox在接受采訪時(shí)說,這家社交媒體巨頭為Llama 3配備了新的計(jì)算機(jī)編碼能力,這次除了可以輸入文本外,還可以輸入了圖像,不過目前該模型只能輸出文本內(nèi)容。因此,Llama 3目前還不是多模態(tài)大模型。

但他補(bǔ)充說,更高級(jí)的推理能力,比如制定更長的多步驟計(jì)劃的能力,將在隨后的版本中出現(xiàn)。并計(jì)劃在未來幾個(gè)月發(fā)布多模態(tài)版本,這意味著它們可以同時(shí)生成文本和圖像。

Cox表示,最終的目標(biāo)是幫助用戶從繁雜的工作中解脫出來,讓生活更輕松快樂,無論是與企業(yè)互動(dòng),還是寫作,或者是計(jì)劃旅行。

此外,Llama 3很快將在亞馬遜AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平臺(tái)WatsonX、微軟云Azure、英偉達(dá)的NIM和Snowflake上推出,并得到AMD、AWS、戴爾、英特爾、英偉達(dá)提供的硬件平臺(tái)支持。

轉(zhuǎn)載來源:財(cái)聯(lián)社 作者:牛占林

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【牛占林】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞