卡位谷歌 OpenAI的神秘新品是什么?最新猜測:多模態(tài)AI助理

宋子喬2024-05-14 07:56

OpenAI決心搶在谷歌I/O大會前一天開直播、上新品,“演示像魔法一樣的ChatGPT和GPT-4更新”。

這個(gè)神秘的新產(chǎn)品是什么?GPT-5和搜索引擎的推測已被OpenAI 首席執(zhí)行官阿爾特曼親自推翻。

image

從最新報(bào)道來看,內(nèi)置于手機(jī)的AI助理,可能是OpenAI即將發(fā)布的產(chǎn)品

科技媒體The Information援引知情人士消息稱,OpenAI計(jì)劃推出的是一款多模態(tài)AI模型,該模型具備視覺和聽覺功能,既可以與你交談,也可以識別物體,且具有比目前的聊天機(jī)器人更好的邏輯推理能力。OpenAI已經(jīng)向一些客戶展示了該模型。

OpenAI已經(jīng)開發(fā)了可以轉(zhuǎn)錄音頻和文本轉(zhuǎn)語音的模型,報(bào)道稱,新模型相當(dāng)于這些模型的結(jié)合體,但更準(zhǔn)確、響應(yīng)速度更快。新模型能夠幫助AI助理判別語氣、更好地理解語義,并且“理論上”,該模型可以幫助學(xué)生學(xué)習(xí)數(shù)學(xué)或翻譯現(xiàn)實(shí)世界的手勢。

不過,盡管新模型在“回答某些類型的問題”方面可以超越GPT-4 Turbo,但仍然存在幻覺問題。

有開發(fā)人員Ananay Arora表示,OpenAI可能推出在手機(jī)上內(nèi)置ChatGPT功能的服務(wù),用來撥打電話。Arora在社交平臺上發(fā)布了上述通話相關(guān)代碼的屏幕截圖,他還發(fā)現(xiàn)OpenAI已配置用于實(shí)時(shí)音頻和視頻通信的服務(wù)器的證據(jù)。

image

利用人工智能打電話,可以為用戶節(jié)省等待時(shí)間,該服務(wù)可被視作AI助理的功能之一。

AI助理也是谷歌一直在開發(fā)的功能,消息稱谷歌Pixel 9系列手機(jī)將內(nèi)置全新的專屬AI助理“Pixie”,可以通過設(shè)備的攝像頭查看物品,執(zhí)行諸如指示購買地或提供物品使用說明等操作。

阿爾特曼此前在接受Salesforce首席執(zhí)行官馬克?貝尼奧夫(Marc Benioff)的專訪時(shí)透露,自己最喜歡的AI電影是《她》(《Her》,一個(gè)男人愛上他的AI虛擬助手的故事),“對話語言界面的想法具有令人難以置信的預(yù)見性?!?/p>

The Information在報(bào)道中稱,阿爾特曼希望最終開發(fā)出一種類似該電影中的AI助理那樣,能夠快速響應(yīng)的虛擬助手,并以這種技術(shù)支持蘋果Siri等現(xiàn)有語音助理。

值得注意的是,據(jù)知情人士對媒體透露,蘋果公司即將與OpenAI達(dá)成協(xié)議,將在新一代iOS操作系統(tǒng)上引入后者的技術(shù)。雙方一直在敲定一項(xiàng)協(xié)議的條款,以便在蘋果的下一代iPhone操作系統(tǒng)iOS 18中使用ChatGPT功能。

新模型運(yùn)行依賴云端 未來有望納入ChatGPT免費(fèi)版本

OpenAI認(rèn)為,具有視覺和聽覺功能的AI助理有可能像智能手機(jī)一樣帶來變革。它可以觀察用戶所處的環(huán)境信息,提供建議,潛在的用例如充當(dāng)家庭教師、翻譯交通標(biāo)識、修理汽車等等。

類似的技術(shù)目前所需硬件門檻太高,無法在個(gè)人設(shè)備上運(yùn)行。媒體分析指出,新模型運(yùn)行依賴云端,需要互聯(lián)網(wǎng)連接才能工作。要使具有視覺和聽覺功能的復(fù)雜人工智能對話變得足夠小巧,以便在手機(jī)等個(gè)人設(shè)備上運(yùn)行,可能需要幾個(gè)月甚至幾年的時(shí)間。

目前尚不清楚OpenAI何時(shí)向付費(fèi)客戶提供這些新功能,但據(jù)試用過該語音助手的人士透露,OpenAI最終的計(jì)劃是將這些功能都納入ChatGPT免費(fèi)版本,目標(biāo)是比目前其最先進(jìn)模型GPT-4 Turbo的運(yùn)行成本更低。

OpenAI并沒有回應(yīng)上述推測。

OpenAI最終將推出什么?謎底將在下周揭曉,OpenAI已經(jīng)宣布,將于太平洋時(shí)間5月13日上午10點(diǎn)(北京時(shí)間5月14日凌晨1點(diǎn))在其官網(wǎng)進(jìn)行直播,屆時(shí)將演示一些ChatGPT和GPT-4更新。

轉(zhuǎn)載來源:科創(chuàng)板日報(bào) 作者:宋子喬

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【宋子喬】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞