周伯文:未知與先覺(jué)丨AI·20人

錢玉娟2023-08-11 19:56

經(jīng)濟(jì)觀察報(bào)記者 錢玉娟

在美國(guó)互聯(lián)網(wǎng)公司Meta于7月18日推出最新一代開(kāi)源大模型LLama2后,第二天一大早六點(diǎn)多,周伯文就發(fā)來(lái)一條語(yǔ)音:“我相信接下來(lái)一波垂類模型的應(yīng)用活躍度和場(chǎng)景應(yīng)用會(huì)大大加速”。

這是剛剛結(jié)束和他的采訪之后的第三天。從我們的對(duì)話來(lái)看,他1.75倍的語(yǔ)速、18小時(shí)的工作時(shí)間、思維敏捷,組成了我們對(duì)于這位資深的人工智能專家和新晉的AI創(chuàng)業(yè)者看到的第一印象。

14歲跳級(jí)從少年班考入中國(guó)科學(xué)技術(shù)大學(xué)的周伯文,一直是人群中那個(gè)先覺(jué)者。人工智能領(lǐng)域的從業(yè)者們多多少少都聽(tīng)說(shuō)過(guò)他的名字。周伯文曾在美國(guó)IBM總部擔(dān)任人工智能基礎(chǔ)研究院院長(zhǎng)、Watson集團(tuán)首席科學(xué)家,后來(lái)曾在京東擔(dān)任技術(shù)委員會(huì)主席、云與AI總裁。他現(xiàn)在也是清華教授。

2016年,作為科學(xué)家的周伯文帶領(lǐng)團(tuán)隊(duì)提出了“自注意力機(jī)制”“多頭思維”等概念;一年后,Google研究者撰寫的論文中將他提出的概念加以引用、吸收,加上位置編碼,誕生了在自然語(yǔ)言、圖模型和表征學(xué)習(xí)方面的范式Transformer架構(gòu)。

而ChatGPT得以出現(xiàn)在人類面前,其關(guān)鍵技術(shù)基礎(chǔ)正是Transformer架構(gòu)。當(dāng)前者紅得發(fā)紫,后者則被視為背后那個(gè)真正的隱藏“大佬”,而周伯文團(tuán)隊(duì)提出的多頭自注意力機(jī)制,構(gòu)成了這位“大佬”的思維內(nèi)核。

現(xiàn)在,周伯文的身份還加上了創(chuàng)業(yè)者——2021年末,他在北京創(chuàng)立了銜遠(yuǎn)科技,聚焦生成式AI的產(chǎn)業(yè)應(yīng)用落地,當(dāng)時(shí)這個(gè)賽道一片寂靜。

一年多后,ChatGPT帶來(lái)的新一輪生成式AI浪潮涌來(lái),國(guó)內(nèi)大廠的頂尖科學(xué)家們和商業(yè)部門立刻如臨大敵。2023年春節(jié)后,很多投資人蜂擁而至來(lái)了解銜遠(yuǎn),在佩服銜遠(yuǎn)在生成式人工智能產(chǎn)業(yè)化先覺(jué)的同時(shí),也有一些國(guó)內(nèi)外的AI投資人感到詫異, “以你的背景,這不是把事做小了嗎?為什么不做通用大模型呢?”

但在聽(tīng)取周伯文的技術(shù)商業(yè)化閉環(huán)論述后,投資人開(kāi)始逐漸呈現(xiàn)出認(rèn)同。

幾個(gè)月過(guò)去了,創(chuàng)投圈推演多時(shí)得出的結(jié)論是:與場(chǎng)景應(yīng)用深度融合的大模型符合實(shí)際,也更有前景。

大與小

銜遠(yuǎn)科技的辦公室位于海淀區(qū)最核心的中關(guān)村地段,這里以聚集了像清華、北大和光年之外、百川智能等眾多頂尖中國(guó)高校和人工智能公司而聞名。

每當(dāng)人們走進(jìn)銜遠(yuǎn),尤其初次來(lái)訪者,很難不被掛滿墻面的各類學(xué)術(shù)認(rèn)定證書(shū)、榮譽(yù)獎(jiǎng)狀和高校聘書(shū)所吸引。年輕的科學(xué)家和工程師在一種高漲的熱情氛圍里工作,在ChatGPT的熱潮下,更多的專家在投奔這里。他們說(shuō),八百多平方米的辦公室恐怕很快就不夠用了。

周伯文自己的辦公室緊湊不失舒適,柜子里隨意地堆著書(shū)籍、獎(jiǎng)杯,一張稍大尺寸的照片,是第一屆上海市人工智能戰(zhàn)略咨詢專家與時(shí)任上海市委書(shū)記的合影。這個(gè)會(huì)議今年已經(jīng)辦到了第6屆,還幫助上海成功躋身國(guó)內(nèi)人工智能領(lǐng)域的高地。

這里展示的細(xì)節(jié)都指向,周伯文的團(tuán)隊(duì),可能是帶領(lǐng)我們改變世界的AI領(lǐng)軍者。

不過(guò)現(xiàn)在的銜遠(yuǎn)科技,聚焦在了一個(gè)看起來(lái)并不是那么宏大敘事的切口上,官網(wǎng)介紹,他們要“覆蓋新品開(kāi)發(fā)流程、老品升級(jí)流程與自有方案評(píng)估,助力打造爆品。”

從“改變世界”到“打造爆品”,后者聽(tīng)起來(lái)遠(yuǎn)不如前者性感。

這種大與小之間的張力在他身上隨處可見(jiàn):這位科學(xué)家、創(chuàng)業(yè)者的水杯上印著“周老大”幾個(gè)字,這是公司成立時(shí)員工們送給他的禮物;在他的工作筆記本背面,貼著兩張卡通貼紙,一張貼紙上寫著“we make future brighter(我們讓未來(lái)更美好)”,另一角的貼紙上畫著一個(gè)高射炮彈,炮彈上方是巨大的四個(gè)漢字:指數(shù)增長(zhǎng)。

今年春天的時(shí)候,ChatGPT風(fēng)暴襲來(lái),幾乎所有人都圍繞大模型做宏大敘事。投資人對(duì)周伯文說(shuō),“你把事情做小了。”

甚至有人“指點(diǎn)”他,進(jìn)入AI領(lǐng)域再創(chuàng)業(yè),想要吸引眼球,就只能是做通用大模型,而不是局限于一個(gè)行業(yè)。

“當(dāng)時(shí)的我(的意見(jiàn)),是很典型的非主流意見(jiàn)。”周伯文并沒(méi)有太過(guò)于在乎這種評(píng)價(jià),他是個(gè)“非共識(shí)者”,不愿意附和所謂的共識(shí),“早期的很多判斷,最后也都被證明是對(duì)的,我更愿意看未來(lái)的事情,習(xí)慣了在無(wú)人區(qū)里做事情。”

小切口可以帶來(lái)大價(jià)值,周伯文相信,利用AI算法,用大模型的推理能力深度理解品參將惠及消費(fèi)者、品牌商、經(jīng)銷商等多方角色,

圍繞消費(fèi)行業(yè)的布局與深耕,大模型將成為消費(fèi)升級(jí)的技術(shù)驅(qū)動(dòng)力。“技術(shù)創(chuàng)新力與市場(chǎng)化能力決定了一家創(chuàng)業(yè)公司的價(jià)值上限與下限,所有的創(chuàng)新能力都將在商業(yè)化過(guò)程中被驗(yàn)證”

時(shí)間又一次給出答案:2023年7月,產(chǎn)業(yè)界正在逐漸從“百模大戰(zhàn)”的狂熱中走出,開(kāi)始日漸關(guān)心AIGC技術(shù)深入行業(yè)垂直應(yīng)用領(lǐng)域。

產(chǎn)與研

2023年初,當(dāng)本輪生成式AI浪潮從硅谷席卷全球,周伯文在朋友圈發(fā)出了一張英雄帖,為銜遠(yuǎn)科技招兵買馬,稱對(duì)合伙人“不設(shè)上限”。

現(xiàn)在,工程師們還在慕名而來(lái)。見(jiàn)到周伯文的時(shí)候,他剛剛結(jié)束一場(chǎng)面試,他對(duì)記者說(shuō),“有創(chuàng)造性的算法人才,還是比較難找。”

在周伯文的思考框架里,AI如何與產(chǎn)業(yè)經(jīng)濟(jì)耦合,怎樣在產(chǎn)業(yè)落地中發(fā)揮價(jià)值,需要的是不斷打磨和迭代。

20年前,當(dāng)周伯文在大洋彼岸拿下電子和計(jì)算機(jī)工程博士學(xué)位后,便選擇進(jìn)入在全球人工智能產(chǎn)業(yè)領(lǐng)域享譽(yù)盛名的巨頭IBM。

2015-2016年,上一輪人工智能浪潮來(lái)襲,周伯文看到“第一波人工智能的應(yīng)用開(kāi)始百花齊放”。他迫切地想知道,人工智能能在產(chǎn)業(yè)場(chǎng)景中解決什么問(wèn)題。

2017年他帶著這個(gè)課題加入京東,從0開(kāi)始搭建京東的AI體系。

從執(zhí)掌京東人工智能事業(yè)部,到創(chuàng)立京東人工智能研究院,周伯文還抓起了京東云計(jì)算、人工智能、物聯(lián)網(wǎng)及企業(yè)信息化等業(yè)務(wù),“所有跟數(shù)字化、智能化相關(guān)的業(yè)務(wù),我都涉及管理,定戰(zhàn)略、鋪規(guī)劃。”

周伯文當(dāng)時(shí)就意識(shí)到,海量的商業(yè)信息,可以被壓縮到一個(gè)具備專業(yè)能力的通用大模型中,后者可以通過(guò)學(xué)習(xí)商品供應(yīng)鏈的各個(gè)環(huán)節(jié),并以消費(fèi)者為中心,大大提升關(guān)鍵環(huán)節(jié)效率。

這個(gè)構(gòu)想令他感到興奮,那意味著生成式AI的應(yīng)用已經(jīng)具備爆發(fā)的可能。但同時(shí),他覺(jué)得有必要投入更多的精力去聚焦研究和應(yīng)用。

2021年底,周伯文選擇投身AI領(lǐng)域的創(chuàng)業(yè)浪潮。他希望基于通用大模型能力,選擇切入大消費(fèi)這一垂直領(lǐng)域,展開(kāi)場(chǎng)景應(yīng)用落地的摸索,同時(shí)打造垂直應(yīng)用的價(jià)值閉環(huán)。

2022年5月,他重返學(xué)術(shù)界,被清華大學(xué)電子工程系聘為長(zhǎng)聘教授及惠妍講席教授。同期,周伯文還創(chuàng)立了清華大學(xué)“協(xié)同交互智能研究中心”,其研究方向主要是,智能體跟以人為中心的世界和環(huán)境交互的過(guò)程中,如何不斷迭代和自我學(xué)習(xí),包括多模態(tài)表征、交互、推理,人機(jī)協(xié)同演繹,大小模型共同演化等多方面。

“都是真實(shí)的痛點(diǎn),我們也在扎實(shí)地解決問(wèn)題,現(xiàn)在需要做的是,驗(yàn)證技術(shù)可行,成本可控,可持續(xù)為客戶創(chuàng)造價(jià)值。”周伯文說(shuō)。

在科學(xué)家和企業(yè)家之間切換身份,沒(méi)有給周伯文帶來(lái)難題,相反,他認(rèn)為多元角色豐富了他的思考維度。

他反思稱,科學(xué)家不太強(qiáng)調(diào)應(yīng)用價(jià)值,“不是所有的創(chuàng)新突破都有價(jià)值,有價(jià)值的也不一定能做出創(chuàng)新突破。”

價(jià)值落地 ,隨之成為周伯文創(chuàng)業(yè)初衷,“希望把我的學(xué)術(shù)思想和產(chǎn)業(yè)實(shí)踐結(jié)合起來(lái),銜遠(yuǎn)科技是那個(gè)創(chuàng)造價(jià)值的載體。”

如今,當(dāng)行業(yè)內(nèi)還在卷通用大模型能不能追上ChatGPT時(shí),周伯文已經(jīng)在考慮如何“讓每一件商品都應(yīng)需而生,讓每一個(gè)消費(fèi)者都得償所愿”。

|對(duì)話|

“絕對(duì)的非共識(shí)派”

經(jīng)濟(jì)觀察報(bào):你參加了2023世界人工智能大會(huì)(2023WAIC),與往年相比,有哪些差別感受?

周伯文:我從回國(guó)起,過(guò)去幾年都全程參與WAIC,從第一屆起就成為了上海市人工智能戰(zhàn)略咨詢專家委員會(huì)委員。去年第五屆WAIC時(shí),我到了清華大學(xué),今年是第六屆,我還作為人工智能領(lǐng)域的創(chuàng)業(yè)者再次參與。

除了這個(gè)花絮外,從技術(shù)角度來(lái)講,WAIC一直跟前沿技術(shù)高度匹配,可以看到,今年大模型成為大家討論的話題,但聚焦國(guó)內(nèi)看,大模型在去年末今年初進(jìn)入大眾視野時(shí),外界全都在談OpenAI,“做大模型,中國(guó)的OpenAI在哪里?”之后談“大模型的商業(yè)模式是什么?”一步步走來(lái),到今年年中時(shí),大家的關(guān)注點(diǎn)就變成了大模型應(yīng)用和創(chuàng)造價(jià)值,如何推進(jìn)產(chǎn)業(yè)落地。

今年的WAIC上,產(chǎn)學(xué)研都開(kāi)始深入地思考一個(gè)問(wèn)題,大模型是怎么來(lái)的,要向哪里去?這其實(shí)是我2021年底考慮大模型和產(chǎn)業(yè)進(jìn)行結(jié)合時(shí)的出發(fā)點(diǎn)。

經(jīng)濟(jì)觀察報(bào):你總能在絕大多數(shù)人之前較早出發(fā),這個(gè)認(rèn)知是如何形成的?

周伯文:我應(yīng)該是一個(gè)絕對(duì)的非共識(shí)派。

2021年底,我選擇從京東出來(lái)時(shí),就想要利用技術(shù)把人跟商品所有環(huán)節(jié)上的互動(dòng),從品牌的設(shè)計(jì)、生產(chǎn)、創(chuàng)意制造到交易消費(fèi),背后涉及的數(shù)據(jù)都?jí)嚎s進(jìn)一個(gè)關(guān)于世界知識(shí)的模型中,之后通過(guò)生成式人工智能,搭建起一個(gè)可以跟消費(fèi)者互動(dòng)的橋梁?,F(xiàn)在回頭看,在那時(shí)與絕大多數(shù)是非共識(shí)的。

之所以要做這件事,首先是我認(rèn)識(shí)到大模型一定要有產(chǎn)業(yè)價(jià)值,而人跟商品的連接便是我找到的場(chǎng)景;其次,我認(rèn)為技術(shù)上能夠?qū)崿F(xiàn),把消費(fèi)者與商品的關(guān)系數(shù)據(jù)壓縮進(jìn)模型,經(jīng)過(guò)多次訓(xùn)練,模型能夠精準(zhǔn)地預(yù)測(cè)消費(fèi)者的喜好和需求。

這跟原來(lái)的搜索或匹配邏輯有巨大不同,更細(xì)顆粒度地理解消費(fèi)者后,再將獨(dú)立個(gè)體間的共性聚合起來(lái),進(jìn)而延伸到品牌端,去生成爆品的創(chuàng)新設(shè)計(jì)或打造產(chǎn)品。這讓銜遠(yuǎn)大模型成為唯一一個(gè)能夠連接C端消費(fèi)者和B端品牌與產(chǎn)品兩個(gè)方向的大模型。

“無(wú)人區(qū)”創(chuàng)業(yè)

經(jīng)濟(jì)觀察報(bào):當(dāng)別人還在討論大模型時(shí),你已經(jīng)帶領(lǐng)團(tuán)隊(duì)去摸索產(chǎn)業(yè)落地,這是因?yàn)榭吹搅讼葯C(jī)?

周伯文:作為一個(gè)人工智能技術(shù)研究者和團(tuán)隊(duì)領(lǐng)導(dǎo)者,我永遠(yuǎn)需要在推想“人工智能下一步會(huì)怎么樣”,在2015-2016年,我就認(rèn)為生成式人工智能是通向AGI的必經(jīng)之路,只是在2021年底我們要把生成式人工智能用到產(chǎn)業(yè)時(shí),大部分人并不能理解這件事是能做到的,覺(jué)得我做的這件事情太難了。

到了ChatGPT出來(lái)到2023年春節(jié)后,每個(gè)人都開(kāi)始認(rèn)識(shí)到生成式人工智能與大模型的潛力,大家越來(lái)越多地認(rèn)識(shí)到銜遠(yuǎn)的價(jià)值,但不少人又覺(jué)得我們要做的事不夠大,有些投資人勸我,“本可以融100億美金,你只做10億美金的事”,“做這個(gè)東西,你把自己做小了。”

經(jīng)濟(jì)觀察報(bào):你覺(jué)得自己的故事小嗎?

周伯文:根據(jù)我的科研背景和產(chǎn)業(yè)經(jīng)驗(yàn),他們覺(jué)得我可以做得更大,尤其是大家都在講做多么大的事情。但我認(rèn)為不存在第二家OpenAI,模仿別人就是逃避未知。很多人不想這個(gè)事情,邏輯是先把類OpenAI的東西做出來(lái),之后再思考,反正中國(guó)這么豐富的場(chǎng)景,肯定有應(yīng)用空間。我的非共識(shí)就是要首先對(duì)未來(lái)有洞見(jiàn),所以我要先回答大模型到底有什么用,大模型技術(shù)上發(fā)展演化會(huì)向哪里去,這些問(wèn)題要前置思考,不是先模仿別人,不要逃避未知,把這些更重要的問(wèn)題delay。

經(jīng)濟(jì)觀察報(bào):海外既有OpenAI,在應(yīng)用領(lǐng)域也有Midjourney這樣成功商業(yè)化的獨(dú)角獸成長(zhǎng)起來(lái),中國(guó)是不是也有彎道超車的可能?

周伯文:我的認(rèn)知是,OpenAI是在無(wú)人區(qū)里面去做這件事,我們不應(yīng)該僅僅是跟隨定義,中國(guó)要做的是走一條新路,基礎(chǔ)模型應(yīng)該具備底層技術(shù)驅(qū)動(dòng)上層場(chǎng)景,解決問(wèn)題和創(chuàng)造價(jià)值相結(jié)合的能力。

當(dāng)然,大部分科學(xué)家的想法可能是,參考手里有哪些技術(shù),造出錘子去找釘子,這也是大部分技術(shù)人創(chuàng)業(yè)的心態(tài)。我雖然是科研人出身,但在考慮問(wèn)題時(shí),更多是逆向思考,以終為始——我到底要?jiǎng)?chuàng)造什么樣的價(jià)值。創(chuàng)立銜遠(yuǎn)科技的初心,就是從這個(gè)問(wèn)題開(kāi)始的。21年底,我們確定是“讓每一件商品都應(yīng)需而生,讓每一個(gè)消費(fèi)者都得償所愿”。

除了對(duì)問(wèn)題的深刻理解,更為關(guān)鍵的是,我們知道技術(shù)現(xiàn)在能做到什么樣子,未來(lái)1-2年能做到什么樣子。銜遠(yuǎn)科技就是要依靠最前沿技術(shù)的能力去匹配解決真問(wèn)題帶來(lái)的需求。銜遠(yuǎn)走的是一條自有大模型跟應(yīng)用場(chǎng)景閉環(huán)一體化的發(fā)展路線。

換句話講,從這個(gè)出發(fā)點(diǎn)創(chuàng)業(yè),我唯一的參考系是價(jià)值創(chuàng)造,“能不能給產(chǎn)業(yè)創(chuàng)造價(jià)值”,這是衡量銜遠(yuǎn)科技的一把尺子。

當(dāng)下與未來(lái)

經(jīng)濟(jì)觀察報(bào):進(jìn)入AIGC領(lǐng)域創(chuàng)業(yè)初期,你的節(jié)奏和狀態(tài)如何?在更多人涌入大模型創(chuàng)業(yè)后,是否面臨既定規(guī)劃被打破的局面?

周伯文:會(huì)有一些變化。2021年底出來(lái)創(chuàng)業(yè),公司投入運(yùn)營(yíng)已經(jīng)是2022年,全年疫情影響下,加上我們做的是一個(gè)非常冷門的事情,當(dāng)時(shí)沒(méi)什么人聽(tīng)得懂,但因?yàn)槲伊?xí)慣了承認(rèn)未知,做一個(gè)非共識(shí)派;我們就低頭做事,各項(xiàng)工作都按自己的節(jié)奏來(lái)。

2023年之后,大家突然都開(kāi)始關(guān)注大模型,在行業(yè)內(nèi)有相關(guān)經(jīng)歷的我,不可避免地成為了大家征詢意見(jiàn)的對(duì)象,也有太多采訪讓我談技術(shù)、產(chǎn)業(yè)理解。

這讓我跟外界有了更多交流,也正因此,我才發(fā)現(xiàn)大家對(duì)生成式AI的理解是完全不一樣的。同時(shí),產(chǎn)業(yè)關(guān)注度高雖然帶來(lái)了不少好處, 但GPU算力也比原來(lái)貴了很多,而且人才密度容易碎片化,這對(duì)創(chuàng)業(yè)生態(tài)也帶來(lái)了很多不利的一面。

作為創(chuàng)始人,我要去思考趨利避害,要堅(jiān)持初心,不被市場(chǎng)雜音困擾,同時(shí)要敏感地去吸收新知識(shí)、新進(jìn)展、新算法以及新思考。對(duì)于搞技術(shù)創(chuàng)業(yè)的人來(lái)說(shuō),十分貼切的一個(gè)描述是,“只有偏執(zhí)狂才能生存”。

創(chuàng)業(yè)一定會(huì)是痛苦與快樂(lè)交織的過(guò)程。比如我們現(xiàn)在就需要優(yōu)秀的算法與算法工程人才,特別是創(chuàng)造性思考的人才,但市場(chǎng)上這類群體遠(yuǎn)不夠豐富。這也是我回到清華大學(xué)后,一直把培養(yǎng)人工智能基礎(chǔ)研究、人工智能產(chǎn)業(yè)化的兩類人才作為我最重要、最花時(shí)間的頭等大事。我們國(guó)家未來(lái)的智能化發(fā)展急需這兩類人才。

經(jīng)濟(jì)觀察報(bào):你相信大力出奇跡嗎?

周伯文:大力,只有在正確的方向上,才能出奇跡。比如說(shuō),你沒(méi)有Transformer架構(gòu),沒(méi)有多頭自注意力設(shè)計(jì),是很難出奇跡的。原來(lái)也一直有很多在研究中的語(yǔ)言模型,也用了大量的數(shù)據(jù)集去訓(xùn)練,但原有的模型架構(gòu)不對(duì),抓再多的數(shù)據(jù)都沒(méi)有辦法使它涌現(xiàn)。所以只有方向?qū)α?,才可能有很大的一種奇跡。人工智能產(chǎn)業(yè)化、創(chuàng)業(yè)也是一樣。■

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
長(zhǎng)期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢(shì)。擅長(zhǎng)企業(yè)模式、人物專訪及行業(yè)深度報(bào)道。
重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn
微信號(hào):EstherQ138279

熱新聞