WAIC 2024丨組團(tuán)秀肌肉的人形機(jī)器人,比語言大模型更具前景?

劉慧瑩2024-07-09 09:06

經(jīng)濟(jì)觀察網(wǎng) 劉慧瑩/文 為期4天的2024世界人工智能大會(下稱“WAIC”)7月7日正式落下帷幕。本屆WAIC現(xiàn)場,能夠隨處走動、跑跳、上下樓梯的人形機(jī)器人成為最吸睛的亮點(diǎn)之一;多家垂直于機(jī)器人關(guān)節(jié)、小腦、手臂等細(xì)分領(lǐng)域的廠商亮相WAIC,讓現(xiàn)場堪比大型機(jī)器人“器官市場”;人形機(jī)器人、具身智能等概念也成為與會者口中的熱門概念。

“我們非常希望與機(jī)器人廠商合作開發(fā)應(yīng)用,目前也在跟一些廠商談。”7月8日,一位國產(chǎn)算力廠商的生態(tài)負(fù)責(zé)人在會后對經(jīng)濟(jì)觀察網(wǎng)表示。與此同時,多位參展商工作人員對記者表示,未來的大模型技術(shù),將不再局限于語言模型,而機(jī)器人將會是更好的載體。

人形機(jī)器人組團(tuán)亮相

在WAIC期間,18臺采用不同技術(shù)架構(gòu)的人形機(jī)器人列陣在世博園展覽館入口依次排開,被稱作“十八金剛”。據(jù)了解,這十八位機(jī)器人各有來頭。

居于列陣首位的是國家地方共建人形機(jī)器人創(chuàng)新中心首次發(fā)布的開源通用人形機(jī)器人公版機(jī)“青龍”,這也是國內(nèi)首款全尺寸通用人形機(jī)器人公版機(jī);與此同時,來自復(fù)旦大學(xué)的光華一號,宇樹科技的H1,達(dá)闥的XR4“七仙女”小紫,開普勒的先行者K1,傅利葉的GR-1,樂聚的夸父4代,松延動力的Song,智元機(jī)器人的遠(yuǎn)征A2等企業(yè)、事業(yè)單位的人形機(jī)器人也位列其間,共同在WAIC期間迎來送往。

不過,看上去既炫酷又震撼的“十八金剛”,可能還處在觀賞性大于實用性的“幼年”階段。

“目前機(jī)器人發(fā)展最核心的問題,在于靈魂與肉體之間的結(jié)合。”松延動力生產(chǎn)及交付副總裁付鵬鵬告訴經(jīng)濟(jì)觀察網(wǎng),“AI大模型現(xiàn)在仍然是局限在屏幕里的,如果要載入機(jī)器人本體,涉及的技術(shù)難度非常高。所以現(xiàn)在的AI機(jī)器人去拿一杯水,動作都很慢,思考的時間都需要很久。”

多位業(yè)內(nèi)人士也在現(xiàn)場對經(jīng)濟(jì)觀察網(wǎng)表示,人形機(jī)器人雖然看起來炫酷,但距離產(chǎn)業(yè)真正成熟恐怕還很遙遠(yuǎn)。目前專注于非人類語言信息處理的公司,其技術(shù)進(jìn)展也很緩慢。

事實上自2024年以來,人形機(jī)器人在資本市場的熱度一度飛升,該領(lǐng)域已經(jīng)出現(xiàn)了兩筆規(guī)模較大的早輪融資——宇樹科技今年2月份完成了B2輪近10億元人民幣融資,投資方包括美團(tuán)、金石投資、源碼資本,老股東深創(chuàng)投、中網(wǎng)投、容億、敦鴻和米達(dá)鈞石跟投;今年6月,銀河通用機(jī)器人完成7億元天使輪融資,投資方共有22家,包括美團(tuán)點(diǎn)評戰(zhàn)投、北汽產(chǎn)投、商湯國香基金、訊飛基金等戰(zhàn)略及產(chǎn)業(yè)投資方,以及啟明創(chuàng)投、藍(lán)馳創(chuàng)投、經(jīng)緯創(chuàng)投、源碼資本、IDG資本等頭部財務(wù)機(jī)構(gòu),光源資本擔(dān)任融資財務(wù)顧問并參與早期投資。

比大語言模型更具想象空間

“人形機(jī)器人究竟能用來干什么?”這是經(jīng)濟(jì)觀察網(wǎng)記者在WAIC現(xiàn)場聽到被問及次數(shù)最多的問題。 

早些時候,特斯拉CEO馬斯克曾公開表示,特斯拉Optimus機(jī)器人將于2025年開始限量生產(chǎn),以供給特斯拉工廠使用,從而進(jìn)一步提升生產(chǎn)效率和自動化水平。事實上,大部分人形機(jī)器人也都有量產(chǎn)計劃,應(yīng)用領(lǐng)域集中在制造業(yè)、服務(wù)業(yè)、醫(yī)療、教育以及建筑工程等行業(yè)。

不過,技術(shù)真正成熟的機(jī)器人,或許更具想象空間。

“當(dāng)前大模型所處理的工作尚未脫離語言,但自然界中能被人類認(rèn)知的信息不超過5%,這些信息中只有不到5%的內(nèi)容能被語言表達(dá),在這個基礎(chǔ)上AI學(xué)習(xí)到的信息很有限。如果直接讓AI去理解世界,它可能不需要語言,就能做得會比人很好,而實現(xiàn)的載體就是機(jī)器人。”摩爾線程市場生態(tài)總監(jiān)呂其恒在WAIC現(xiàn)場對經(jīng)濟(jì)觀察網(wǎng)表示。

他指出:“未來,如果給機(jī)器人裝上眼睛,讓它看世界;裝上其他傳感器,讓它理解世界,那么機(jī)器人即使不會語言,也能學(xué)會人類的一切。就像現(xiàn)在,AI能幫助人類總結(jié)信息、提煉觀點(diǎn),這是人類歷史上第一次智力勞動可以被取代,智力成果可以被生產(chǎn)。如果機(jī)器人的大腦不再完全依賴語言模型,而是通過更多的手段學(xué)習(xí)之四海,我們就可能會創(chuàng)造出一個意想不到的智能體,其智慧甚至可能超越人類。”

作為全功能GPU為核心的國產(chǎn)算力公司,摩爾線程在本屆WAIC上宣布升級了AI旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案,將算力服務(wù)從千卡級別擴(kuò)展至萬卡規(guī)模,使其平臺能夠承載萬P級浮點(diǎn)的通用加速計算,服務(wù)于萬億參數(shù)級別的復(fù)雜大模型訓(xùn)練,為國產(chǎn)AI模型訓(xùn)練的主戰(zhàn)場“備足彈藥”。

“萬卡規(guī)模將成為標(biāo)配,只有AI模型訓(xùn)練的規(guī)模足夠大,才能做得足夠好。” 呂其恒認(rèn)為,“歷史上的工業(yè)革命,往往來自一個偶然的精巧設(shè)計,比如愛因斯坦的相對論、量子力學(xué),或者是現(xiàn)代鋼鐵的出現(xiàn)等工程上的突破。但今天的AI技術(shù)靠訓(xùn)練就能‘堆’出效果,給了人們大力出奇跡的機(jī)會。更何況,一旦最終成功訓(xùn)練出一個超級智慧體,其智慧的擴(kuò)張邊際成本將幾乎為零。”

與此同時,他指出,當(dāng)前具身機(jī)器人的發(fā)展有兩個難點(diǎn):首先是解決機(jī)器人的控制與協(xié)調(diào)問題,讓它能站住,關(guān)節(jié)能控制,行動的時候不摔倒,實現(xiàn)這一目標(biāo)難度很高,本質(zhì)上是機(jī)器人動力學(xué)問題;其次,機(jī)器人需要一個大腦,使它像人的行為一樣自然協(xié)調(diào),不同肢體之間互相配合,同時對外界刺激作出反應(yīng),成本還要低,這就需要極好的產(chǎn)品,而中國一些廠商已經(jīng)走在全球前列。

如果未來AI能夠獲取語言信息之外的全棧信息,那么它或許還可以幫助人類做決策。呂其恒告訴經(jīng)濟(jì)觀察網(wǎng),目前AI還不能做決策,受制于兩個因素:首先,AI無法獲得全棧信息,尤其是非理性的情緒信息;其次,基于康德提出的二律背反(康德的哲學(xué)概念中,二律背反是指對同一個對象或問題所形成的兩種理論或?qū)W說雖然各自成立,但是卻相互矛盾的現(xiàn)象),人對于事物做出哪種解釋并不是基于理性,而是價值觀。其實在金融領(lǐng)域,如果讓AI幫助人來做決策,很可能會更有效,因為金融行業(yè)唯一需要被戰(zhàn)勝的就是信息缺失和情緒波動。

他也感慨道,如果機(jī)器人真的具備了學(xué)習(xí)能力,它或許將比大語言模型更具想象空間。對于人類來說,過去的技能是摘果子,但未來的世界可能會是一片麥田,令我們手足無措。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報》社所有。未經(jīng)《經(jīng)濟(jì)觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
華東新聞中心記者 關(guān)注科技與新能源行業(yè)發(fā)展動態(tài),傳遞有溫度的信息。重點(diǎn)新聞線索可聯(lián)系郵箱:liuhuiying@eeo.com.cn

熱新聞