Meta發(fā)布最強(qiáng)開源大模型Llama 3 多模態(tài)版本隨后將上線

牛占林2024-04-20 19:02

當(dāng)?shù)貢r(shí)間周四，美國科技巨頭Meta推出了其最強(qiáng)大的開源人工智能(AI)模型Llama 3，以追趕行業(yè)領(lǐng)導(dǎo)者OpenAI。美股盤中，Meta股價(jià)上漲逾2%，今年迄今漲近43%。

Meta首席執(zhí)行官扎克伯格聲稱，Llama 3有8B和70B兩個(gè)版本，大版本的Llama 3將有超過4000億參數(shù)。由于預(yù)訓(xùn)練和指令微調(diào)，Llama 3相比Llama 2有了極大的改進(jìn)。

Llama 3在多種行業(yè)基準(zhǔn)測(cè)試上展現(xiàn)了最先進(jìn)的性能，并提供了包括改進(jìn)的推理能力在內(nèi)的新功能。Meta認(rèn)為Llama 3是市場(chǎng)上最好的開源大模型。開源意味著這些模型的代碼和數(shù)據(jù)對(duì)公眾開放，任何人都可以查看、修改和使用。

開發(fā)人員抱怨之前的Llama 2模型無法理解基本的上下文，在處理查詢時(shí)經(jīng)常出現(xiàn)混淆。谷歌的Gemini AI圖像生成工具也遇到了類似問題，它在生成歷史人物的圖像時(shí)產(chǎn)生了不準(zhǔn)確的描述，這引起了廣泛批評(píng)。

現(xiàn)在，Meta在訓(xùn)練Llama 3時(shí)使用了更高質(zhì)量的數(shù)據(jù)，這些數(shù)據(jù)幫助AI模型更好地識(shí)別語言中的細(xì)微差別，從而提高其對(duì)上下文的理解能力。

Meta提到，他們?yōu)長lama 3模型輸入的數(shù)據(jù)量是Llama 2的七倍，這可能有助于提高模型的性能和準(zhǔn)確性。還利用了由AI生成的“合成”數(shù)據(jù)來加強(qiáng)模型在編碼和推理等特定領(lǐng)域的能力。

據(jù)Meta介紹，Llama 3將被整合到其虛擬助手Meta AI中，這是免費(fèi)使用的同類產(chǎn)品中最先進(jìn)的AI應(yīng)用程序。Meta AI助手已經(jīng)在Facebook、Instagram、WhatsApp和Messenger等應(yīng)用中上線，隨后也將迎來更新。

Meta首席產(chǎn)品官Chris Cox在接受采訪時(shí)說，這家社交媒體巨頭為Llama 3配備了新的計(jì)算機(jī)編碼能力，這次除了可以輸入文本外，還可以輸入了圖像，不過目前該模型只能輸出文本內(nèi)容。因此，Llama 3目前還不是多模態(tài)大模型。

但他補(bǔ)充說，更高級(jí)的推理能力，比如制定更長的多步驟計(jì)劃的能力，將在隨后的版本中出現(xiàn)。并計(jì)劃在未來幾個(gè)月發(fā)布多模態(tài)版本，這意味著它們可以同時(shí)生成文本和圖像。

Cox表示，最終的目標(biāo)是幫助用戶從繁雜的工作中解脫出來，讓生活更輕松快樂，無論是與企業(yè)互動(dòng)，還是寫作，或者是計(jì)劃旅行。

此外，Llama 3很快將在亞馬遜AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM的云平臺(tái)WatsonX、微軟云Azure、英偉達(dá)的NIM和Snowflake上推出，并得到AMD、AWS、戴爾、英特爾、英偉達(dá)提供的硬件平臺(tái)支持。

轉(zhuǎn)載來源：財(cái)聯(lián)社作者：牛占林

版權(quán)與免責(zé)：以上作品（包括文、圖、音視頻）版權(quán)歸發(fā)布者【牛占林】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù)，不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議