黃鐵軍:做全球頂尖的AI研發(fā)機構丨AI·20人

任曉寧2023-09-15 18:32

經(jīng)濟觀察報記者 任曉寧 北京報道

OpenAI創(chuàng)始人山姆·奧特曼出現(xiàn)在大屏幕上,當他回答“我準備好了”時,全場都沸騰了。

這是6月10日 “AI春晚”北京智源大會上的一幕,那是山姆·奧特曼首次亮相中國。那個夏天,所有人都在為AI即將改變世界而興奮。

在那一天,一眾全球知名的AI科學家,比如圖靈獎得主、Meta首席AI科學家楊立昆、深度學習之父杰弗里·辛頓等,全部出現(xiàn)在大會上。楊立昆因為總統(tǒng)會見不能來京,堅持半夜4點起床,只為和中國觀眾實時交流。

北京智源人工智能研究院(以下簡稱“智源研究院”)院長黃鐵軍當時坐在臺下,這些大咖很多由他邀請而來。在大眾層面,知道黃鐵軍和他身后的智源研究院的人并不多,但在全球AI圈,他是一個響當當?shù)娜宋?;這個成立于2018年的研究院,早已在AI圈聲名遠播。

黃鐵軍研究AI超過30年,擅長智能視覺信息處理技術,對我國數(shù)字視頻編碼國家標準制定和大規(guī)模產(chǎn)業(yè)化做出過突出貢獻,終結了國外向我國視頻行業(yè)索取高額專利費的歷史。他與國外AI大咖們私交甚篤,楊立昆的個人自傳《科學之路》中文版,也邀請黃鐵軍寫了序言。

近30年時間里,黃鐵軍的身份是科學家、北大教授,現(xiàn)在,智源研究院是他花費精力最多的地方。今年4月,微軟總裁布拉德·史密斯接受外媒采訪時說,他認為有全球三家機構處于AI絕對的前沿,一是與微軟合作的Open AI,二是谷歌,另一個就是北京智源人工智能研究院。

今年大火的大模型,智源研究院早在2019年開始布局。2020年,在大多數(shù)人對大模型還一無所知的時候,黃鐵軍掌舵的智源,將主要精力和資金放在研發(fā)大模型上,并在2021年上半年推出了開創(chuàng)“中國首個”、“世界最大”的大模型悟道1.0和悟道2.0。

“很多說中國大模型熱,是因為ChatGPT火了之后才爆發(fā)的,其實并非如此。早在ChatGPT出現(xiàn)之前一年半,我們就已經(jīng)開始系統(tǒng)化布局。那邊爆發(fā)的時候,這邊的艦隊已經(jīng)起航。”8月28日,黃鐵軍對經(jīng)濟觀察報記者說。

目前,智源已經(jīng)培養(yǎng)了一批大模型人才,當前大模型創(chuàng)業(yè)公司、大廠,從事研發(fā)的CTO或首席科學家中,甚至是創(chuàng)始人本人,參加過悟道項目的人為數(shù)不少,智源也因此被人稱為大模型“黃埔軍校”。對于人才被挖角,黃鐵軍并不排斥,“肉都在一個鍋里”,“只要他們還在這個行業(yè),還在為大模型發(fā)揮作用,都是可以的”。他覺得,智源作為非營利機構,能為行業(yè)培養(yǎng)人才,就是促進AI生態(tài)發(fā)展的有意義的事。

闖過無人區(qū)

智源人工智能研究院在2020年選擇做大模型時,國內(nèi)鮮有機構或公司從事這項研究,這仿佛就是一個無人區(qū),智源一腳踏入,并不是偶然。

8月29日,北京五道口智源大廈5層,黃鐵軍向記者講述了這段往事。

故事的開始其實比2020年還要更早一些,2018年11月,智源人工智能研究院成立,由科技部和北京市共同支持,聯(lián)合北京人工智能領域優(yōu)勢單位共建。黃鐵軍擔任首任院長。

他本人非常樂意做這件事。當時他的職務是北京大學計算機科學技術系主任,從2015年開始全程參與我國新一代人工智能發(fā)展規(guī)劃建議、起草和實施。他愿意來智源的原因是,這里與企業(yè)、學校都不一樣,是一種世界范圍內(nèi)都很新的新型研究機構,在這里,可以更高效的探索AI。

擔任院長頭兩年,黃鐵軍在智源的工作重心是凝練方向,“智源學者計劃”匯聚了中國頂尖人工智能學者,開啟了“自由探索+目標導向”科研機制探索。2020年,智源研究院決定把大模型作為攻堅目標,70%的預算投入到大模型研發(fā)和大模型基礎軟硬件生態(tài)建設。當年3月,黃鐵軍在悟道1.0發(fā)布會上提出,“人工智能正在從‘大煉模型’到‘煉大模型’的新階段”,這是“大模型”這個概念首次登上歷史舞臺。

黃鐵軍告訴記者,做研究久了,會有一種直覺式的預感。而且,大模型這個方向,雖然外界很少有認知,但在AI科研圈已經(jīng)有一個比較清晰的趨勢判斷,即:大模型將成為AI未來平臺的起點。

從有想法到最終落實,并不容易。2020年10月,黃鐵軍在一次會議上與時任北京市市長陳吉寧匯報中提到,智源計劃集中資源開展大模型研究。陳市長當機立斷,明確提出大模型會是人工智能的下一個核爆點。

智源投入幾乎全部科研力量。研發(fā)進展很快,第二年,2021年3月,“悟道1.0”大模型項目問世,2021年6月,間隔3個月后,“悟道2.0”亮相。當時的“悟道2.0”,創(chuàng)造了“世界最大”紀錄,達到1.75萬億參數(shù);是GPT-3采用的1750億參數(shù)量的10倍,也超過了谷歌發(fā)布的Switch Transformer(1.6萬億參數(shù)量)。

“悟道2.0”面世后,繼續(xù)突破需要更多的算力和資源。然而,當時正值AI低谷期,前一代AI四小龍備受質(zhì)疑,新一代AI公司融資無門,即使智源,也資源受限。

2023年8月,記者問他,如果當時繼續(xù)做“悟道3.0”“悟道4.0”,會不會推出ChatGPT的就是智源,而不是OpenAI?會不會覺得可惜。

他也覺得有點兒可惜,不過他想的很透徹:即使繼續(xù)做,后來能引發(fā)全球爆火的,依舊會是OpenAI,因為雙方投入的資源完全不是一個量級,而大模型這個方向,缺乏算力資源,無異于紙上談兵。

“2022年下半年,我們的算力資源在國內(nèi)已經(jīng)是領先的了,但不足OpenAI的十分之一。如果只差一兩倍,我們還有可能領先,如果差10倍以上還想領先,可能性就很小了。”

AI黃埔軍校

今年2月,王慧文成立光年之外,廣發(fā)英雄帖,之后大模型公司風起云涌?,F(xiàn)在回顧會發(fā)現(xiàn),大模型創(chuàng)業(yè)公司的技術帶頭人,很多來自智源。

智譜AI創(chuàng)始人唐杰曾擔任過智源人工智能研究院副院長,目前智譜AI被美團投資,與360合作;即將完成10億元融資的月之暗面創(chuàng)始人楊植麟,也參與過悟道的研發(fā)。除了創(chuàng)業(yè)公司,字節(jié)跳動等互聯(lián)網(wǎng)大廠的大模型帶隊者,也或多或少參與過智源項目。

一些國家項目的技術骨干,也同樣來自智源。有些智源學者參與國家項目做研發(fā),也會把算法結果放到智源的開源論壇中,供所有研究者共同探討,黃鐵軍告訴記者,他對此覺得很欣慰。

擔任智源研究院院長前,黃鐵軍當了十幾年北大老師,習慣了教書育人?,F(xiàn)在,他依舊把發(fā)掘人才作為基本工作。

黃鐵軍本人其實是一個“天馬行空”的科學家,記者問他,從業(yè)AI這么多年,有沒有最得意的二三事?他并沒有把十多年前確立的標準和專利積累當做值得講述的事,反而覺得,2015年的一天,他突然靈光一現(xiàn),豁然開朗,推翻了圖像視頻概念,推翻了計算機視覺的基本范式,當然也推翻了自己此前20多年的研究,開創(chuàng)了脈沖視覺原理和技術新體系,一切從零再出發(fā),是更有意思的事。

“我個人的看法是,重大創(chuàng)新一定是首先在一個人腦子里出現(xiàn),否則它就不會發(fā)生。”他和年輕學者們交流,也更熱衷于談論天馬行動的想象,即使當下不可能發(fā)生,但未來,有可能突然有一天就能實現(xiàn)了。擔任院長后事務繁瑣,黃鐵軍不再有精力一行一行敲代碼,和年輕學者一起腦暴,培養(yǎng)、發(fā)掘年輕人,是他最開心的事情之一。

從成功率上講,未知的想象有很大風險,但是一旦成功,影響會是巨大的。

2018年,智源成立之初,就定下目標:支持科學家勇闖AI科技前沿“無人區(qū)”。他們給智源學者提供經(jīng)費,希望支持學者們自由探索,挖掘面向未來的AI研究方向。

2023年,智源曾經(jīng)耗費絕大部分資源和精力投入的大模型方向,已經(jīng)從“無人”變得熱鬧非凡,但也意味著更多未解之謎,有更多需要探索的新無人區(qū)。黃鐵軍說,智源要與企業(yè)錯位發(fā)展,開展更冒險、更開放、更前瞻、更創(chuàng)新地的工作,這是智源作為研究機構應該做的事。

5年時間,智源已經(jīng)嶄露頭角,現(xiàn)在,黃鐵軍提到,更重要是實現(xiàn)當年立下的十年目標:2028年智源研究院成為全世界公認的頂尖人工智能研發(fā)機構。

他還在繼續(xù)證明自己。

微信圖片_20230915155101

黃鐵軍(受訪者供圖)


【對話】

艦隊啟航

我們既不以論文為最終的評價指標,也不以產(chǎn)品作為評價指標;我們想做的,是一個創(chuàng)新性強、性能領先的系統(tǒng),建立一套技術體系,一個技術生態(tài)。

經(jīng)濟觀察報:如何定位智源?

黃鐵軍:智源的性質(zhì)是介于大學和企業(yè)之間的一種新型研發(fā)機構。我們既不以論文為最終的評價指標,也不以產(chǎn)品作為評價指標,而是要做有創(chuàng)新性的系統(tǒng)。這種機構在國外也是很新的形態(tài)。從我個人來說,我2015年就開始參與我國新一代人工智能發(fā)展規(guī)劃,這種科技創(chuàng)新組織方式的改革,是這幾年國家很關注的一個方向,我愿意到智源來做這樣的嘗試。

原有體制下開展AI研究,大學受制于資源有限,企業(yè)受制于產(chǎn)品收入壓力,都約束了創(chuàng)新突破的可能性。智源這種機構有探索出新可能性的很大機會,這是吸引我的最重要的原因。

經(jīng)濟觀察報:智源是國內(nèi)第一個提出大模型概念的機構,也早在2020年就投入大部分資源做大模型。為什么是智源?

黃鐵軍:其實早在2018年、智源研究院成立時,我們從科研的角度對于AI已經(jīng)看到一個比較清晰的趨勢,大模型已經(jīng)是一個比較明確的方向了。當時大模型還不叫大模型,我們看到的方向是:用大數(shù)據(jù)訓練一個規(guī)模很大的模型,有望產(chǎn)生更強的智能。

2020年10月份,我們和時任北京市市長陳吉寧匯報中提到,智源計劃集中資源開展大模型研究。陳市長當機立斷,明確提出大模型會是人工智能的下一個核爆點。我們就開始買算力做事,當時買到了300P的算力,但是300P肯定是遠遠不夠的,就申請再追加單獨的經(jīng)費來做更大的算力。最后定下的是1000P的算力,大約是3億元人民幣的一個專項支出。這種規(guī)模的智算平臺在當時中國是絕對領先的。

經(jīng)濟觀察報:智源2021年6月就推出了兩個大模型產(chǎn)品,直到2023年6月,才又推出了悟道3.0。中間為何間隔這么久?

黃鐵軍:悟道2.0推出后,我們中間發(fā)生了一個重大的變化。當時從我們科研角度來看,新的AI時代已經(jīng)開始了,雖然那時候沒有多少人相信,但在我們這些人眼中,門已經(jīng)打開了。

我們于是開始考慮,既然它是一個時代的事,就絕對不會是智源一家機構在做,它應該是一個全社會、全世界的事情。

當時我們的分歧點是,繼續(xù)做一個悟道3.0版,把它做得更大更強?還是在全國范圍內(nèi)進行布局,讓不僅是北京中關村地區(qū),而是全中國范圍都可以做這件事?最終我們選擇了后者,在國家新一代人工智能重大科技項目中提出了一個旗艦項目建議,從國家的科技布局角度,做系統(tǒng)化的布局和支持。

國家項目立項是需要時間的。從2021年6月份提出建議,到2022年12月份項目批準,花了一年半時間,在傳統(tǒng)項目體制下已經(jīng)是特別快了。這個旗艦項目2023年1月開始執(zhí)行,計劃通過滾動方式,一直持續(xù)到2030年,目標不是把一個模型做多大,或者性能做多高,而是要通過數(shù)據(jù)共建、算法競爭、開放評測、開源協(xié)同的創(chuàng)新機制,建立一套大模型開源開放技術體系,一個支撐大模型持續(xù)發(fā)展的技術生態(tài)。

所以,很多時候大家說中國大模型熱是因為ChatGPT火了之后才爆發(fā)的,并非如此,早在ChatGPT出現(xiàn)之前一年半,我國就已經(jīng)開始系統(tǒng)布局,那邊爆發(fā)的時候,這邊艦隊已經(jīng)起航。

 

AI新時代

新技術變革如果發(fā)生在中國,大家當然會更高興,沒首先爆發(fā)在中國,也不意味著我們就失去了機會。

經(jīng)濟觀察報:會不會覺得遺憾?比如說,如果去年6月你們就發(fā)了悟道3.0,說不定年底的時候火的就不是ChatGPT,而是你們?

黃鐵軍:即使我當時發(fā)布了,也不一定會火。這與大模型的屬性是有密切關系的。

大模型的數(shù)據(jù)量與投入直接相關,我們的算力、數(shù)據(jù)投入都與OpenAI差的很遠。而且差的不是一點半點,我們是1000P的算力,不到2000塊卡,ChatGPT大概是3萬塊卡,它是你15倍的算力,迭代速度會快很多。

科技體制改革的不容易就體現(xiàn)在這里,我們能調(diào)動的資源是幾億元人民幣的體量,OpenAI是用10億美元、100億美元力量在做。如果只差一兩倍,我們就有可能領先,如果差10倍以上你還想領先,這種事可能性就很小了。

但是反過來說,我們也不必糾結一城一池的得失。新技術變革如果發(fā)生在中國,大家當然會更高興,沒首先爆發(fā)在中國,也不意味著我們就失去了機會。

所以一方面確實是有點兒可惜,但另一方面,我們也不會被打亂節(jié)奏,我們從2021年想做的就是建立一個體系,希望在技術體系上保持在前沿的位置,做一個讓大家一起參與的旗艦項目,讓所有人都能發(fā)揮自己的聰明才智,共同塑造AI新時代。

經(jīng)濟觀察報:現(xiàn)在悟道已經(jīng)推出3.0了,也已經(jīng)開源了,接下來你們還想做什么?還有哪些可做的事情嗎?

黃鐵軍:我們作為一個科研機構,和企業(yè)和高校所做的事不一樣,我們會做更前瞻的一些探索。僅就大模型來說,現(xiàn)在是剛剛揭開大幕,可做的東西非常多。

打個比方,大模型在當下,就相當于法拉第轉動電磁線圈,能夠產(chǎn)生電流了。發(fā)電機剛面世,能產(chǎn)生電流,大家很興奮,但是如何讓電流在全社會流通和應用,還有大量的創(chuàng)新性探索要做。

比如在大模型領域,有沒有一種技術手段,能讓現(xiàn)在訓練的成本降低一個數(shù)量級?這種風險很大的創(chuàng)新,是我們應該做的。還有在理論領域,為什么大模型能這么強?尋找這種理論上的解釋,也是我們應該做的。另外會不會有一些架構上的創(chuàng)新,能把一些新技術要素結合在一起,訓練出更高水平的智能?甚至再往大了說,會不會有顛覆大模型的創(chuàng)新出現(xiàn)?這些探索我們也應該嘗試。我們要比企業(yè)更冒險、更開放、更前瞻、更創(chuàng)新地做一些工作。

 

挑戰(zhàn)與想象

在20年之后,AGI有很大可能實現(xiàn)。那時信息表達和流轉的方式,神經(jīng)元和神經(jīng)網(wǎng)絡結構及信號加工機理,都會有巨大變革,這些變革預計會在2045年之前會出現(xiàn)

經(jīng)濟觀察報:您曾在2015年時預判2045年會有AI超級大腦出現(xiàn),經(jīng)過幾年探索后,您的想法變化了嗎?這個時間點會提前或延后嗎?

黃鐵軍:現(xiàn)在的想法會比2015年更樂觀一些,因為經(jīng)過近10年的進展,發(fā)現(xiàn)AI比原來預想的進展更快了。

現(xiàn)在有些人認為,再過2至5年就能實現(xiàn)AGI(通用人工智能),我覺得可能還得再等20年。因為真正的實現(xiàn)AGI,和只在某些方面實現(xiàn)AGI,是有本質(zhì)區(qū)別的。

真正的AGI一定是有自主意識的,人類擁有的智能它全部具備,而且它一定會從多個維度全面超越人類,說的通俗點就是超人,比你在科幻電影里看到的那種超人還要超人。它不一定以實體方式出現(xiàn),可能不一定是我們目前能想象到的形態(tài),但它肯定會有物理載體。

經(jīng)濟觀察報:這些挑戰(zhàn)具體是什么?我們能解決嗎?

黃鐵軍:做了30多年AI,我一直說AI首先是一門技術,我們要尋找一種可行的技術途徑和方法,再通過工程方法把智能做出來,這里面有很多不確定因素。

在技術這條路上,突破偶爾會發(fā)生,絕大多數(shù)時間是在黑暗中探索,這是常態(tài)。像我自己,一二十年反反復復這種狀態(tài),沒有大突破,這是很正常的,一點都不奇怪。

但沒有重大進展并不意味著人不聰明、不努力,只是因為重大突破沒有標準答案,沒有一個規(guī)律性的路徑讓你照著做。

然而,正是因為“面壁十年”,破壁而出、豁然開朗才彌足珍貴,一次突破,足慰平生。2015年我發(fā)明脈沖攝影原理時就是這樣的感覺。這個原理顛覆了1839年發(fā)明的曝光成像原理,把普通光電傳感器“點石成金”,賦予AI一雙追光逐電的慧眼。

AlphaGo表明AI決策能力可以超越人類,大模型正在塑造的則是AGI無所不知的認知大腦。未來10年到20年,這樣的創(chuàng)新還會紛沓至來,信息表達和流轉的方式,神經(jīng)元和神經(jīng)網(wǎng)絡結構及信號加工機理,將會發(fā)生巨大變革,未來的AI將采用類似生物大腦的脈沖神經(jīng)網(wǎng)絡系。我現(xiàn)在仍然認為,2045年左右,將出現(xiàn)真正的AGI。

在此之前,人類社會將享受20年的科技革命紅利,同時也將積累從未面對的巨大風險。現(xiàn)在就應該投入充足資源開展風險研究,并開發(fā)相應的技術支持工具。

版權聲明:以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。
TMT新聞部資深記者
關注并報道TMT(科技、傳媒、通信)領域重大事件,擅長行業(yè)分析、深度報道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號:tangtangxiaomo