黃鐵軍：做全球頂尖的AI研發(fā)機構丨AI·20人

任曉寧2023-09-15 18:32

經(jīng)濟觀察報記者任曉寧 北京報道

OpenAI創(chuàng)始人山姆·奧特曼出現(xiàn)在大屏幕上，當他回答“我準備好了”時，全場都沸騰了。

這是6月10日 “AI春晚”北京智源大會上的一幕，那是山姆·奧特曼首次亮相中國。那個夏天，所有人都在為AI即將改變世界而興奮。

在那一天，一眾全球知名的AI科學家，比如圖靈獎得主、Meta首席AI科學家楊立昆、深度學習之父杰弗里·辛頓等，全部出現(xiàn)在大會上。楊立昆因為總統(tǒng)會見不能來京，堅持半夜4點起床，只為和中國觀眾實時交流。

北京智源人工智能研究院（以下簡稱“智源研究院”）院長黃鐵軍當時坐在臺下，這些大咖很多由他邀請而來。在大眾層面，知道黃鐵軍和他身后的智源研究院的人并不多，但在全球AI圈，他是一個響當當?shù)娜宋?；這個成立于2018年的研究院，早已在AI圈聲名遠播。

黃鐵軍研究AI超過30年，擅長智能視覺信息處理技術，對我國數(shù)字視頻編碼國家標準制定和大規(guī)模產(chǎn)業(yè)化做出過突出貢獻，終結了國外向我國視頻行業(yè)索取高額專利費的歷史。他與國外AI大咖們私交甚篤，楊立昆的個人自傳《科學之路》中文版，也邀請黃鐵軍寫了序言。

近30年時間里，黃鐵軍的身份是科學家、北大教授，現(xiàn)在，智源研究院是他花費精力最多的地方。今年4月，微軟總裁布拉德·史密斯接受外媒采訪時說，他認為有全球三家機構處于AI絕對的前沿，一是與微軟合作的Open AI，二是谷歌，另一個就是北京智源人工智能研究院。

今年大火的大模型，智源研究院早在2019年開始布局。2020年，在大多數(shù)人對大模型還一無所知的時候，黃鐵軍掌舵的智源，將主要精力和資金放在研發(fā)大模型上，并在2021年上半年推出了開創(chuàng)“中國首個”、“世界最大”的大模型悟道1.0和悟道2.0。

“很多說中國大模型熱，是因為ChatGPT火了之后才爆發(fā)的，其實并非如此。早在ChatGPT出現(xiàn)之前一年半，我們就已經(jīng)開始系統(tǒng)化布局。那邊爆發(fā)的時候，這邊的艦隊已經(jīng)起航。”8月28日，黃鐵軍對經(jīng)濟觀察報記者說。

目前，智源已經(jīng)培養(yǎng)了一批大模型人才，當前大模型創(chuàng)業(yè)公司、大廠，從事研發(fā)的CTO或首席科學家中，甚至是創(chuàng)始人本人，參加過悟道項目的人為數(shù)不少，智源也因此被人稱為大模型“黃埔軍校”。對于人才被挖角，黃鐵軍并不排斥，“肉都在一個鍋里”，“只要他們還在這個行業(yè)，還在為大模型發(fā)揮作用，都是可以的”。他覺得，智源作為非營利機構，能為行業(yè)培養(yǎng)人才，就是促進AI生態(tài)發(fā)展的有意義的事。

闖過無人區(qū)

智源人工智能研究院在2020年選擇做大模型時，國內(nèi)鮮有機構或公司從事這項研究，這仿佛就是一個無人區(qū)，智源一腳踏入，并不是偶然。

8月29日，北京五道口智源大廈5層，黃鐵軍向記者講述了這段往事。

故事的開始其實比2020年還要更早一些，2018年11月，智源人工智能研究院成立，由科技部和北京市共同支持，聯(lián)合北京人工智能領域優(yōu)勢單位共建。黃鐵軍擔任首任院長。

他本人非常樂意做這件事。當時他的職務是北京大學計算機科學技術系主任，從2015年開始全程參與我國新一代人工智能發(fā)展規(guī)劃建議、起草和實施。他愿意來智源的原因是，這里與企業(yè)、學校都不一樣，是一種世界范圍內(nèi)都很新的新型研究機構，在這里，可以更高效的探索AI。

擔任院長頭兩年，黃鐵軍在智源的工作重心是凝練方向，“智源學者計劃”匯聚了中國頂尖人工智能學者，開啟了“自由探索+目標導向”科研機制探索。2020年，智源研究院決定把大模型作為攻堅目標，70%的預算投入到大模型研發(fā)和大模型基礎軟硬件生態(tài)建設。當年3月，黃鐵軍在悟道1.0發(fā)布會上提出，“人工智能正在從‘大煉模型’到‘煉大模型’的新階段”，這是“大模型”這個概念首次登上歷史舞臺。

黃鐵軍告訴記者，做研究久了，會有一種直覺式的預感。而且，大模型這個方向，雖然外界很少有認知，但在AI科研圈已經(jīng)有一個比較清晰的趨勢判斷，即：大模型將成為AI未來平臺的起點。

從有想法到最終落實，并不容易。2020年10月，黃鐵軍在一次會議上與時任北京市市長陳吉寧匯報中提到，智源計劃集中資源開展大模型研究。陳市長當機立斷，明確提出大模型會是人工智能的下一個核爆點。

智源投入幾乎全部科研力量。研發(fā)進展很快，第二年，2021年3月，“悟道1.0”大模型項目問世，2021年6月，間隔3個月后，“悟道2.0”亮相。當時的“悟道2.0”，創(chuàng)造了“世界最大”紀錄，達到1.75萬億參數(shù)；是GPT-3采用的1750億參數(shù)量的10倍，也超過了谷歌發(fā)布的Switch Transformer（1.6萬億參數(shù)量）。

“悟道2.0”面世后，繼續(xù)突破需要更多的算力和資源。然而，當時正值AI低谷期，前一代AI四小龍備受質(zhì)疑，新一代AI公司融資無門，即使智源，也資源受限。

2023年8月，記者問他，如果當時繼續(xù)做“悟道3.0”“悟道4.0”，會不會推出ChatGPT的就是智源，而不是OpenAI？會不會覺得可惜。

他也覺得有點兒可惜，不過他想的很透徹：即使繼續(xù)做，后來能引發(fā)全球爆火的，依舊會是OpenAI，因為雙方投入的資源完全不是一個量級，而大模型這個方向，缺乏算力資源，無異于紙上談兵。

“2022年下半年，我們的算力資源在國內(nèi)已經(jīng)是領先的了，但不足OpenAI的十分之一。如果只差一兩倍，我們還有可能領先，如果差10倍以上還想領先，可能性就很小了。”

AI黃埔軍校

今年2月，王慧文成立光年之外，廣發(fā)英雄帖，之后大模型公司風起云涌?，F(xiàn)在回顧會發(fā)現(xiàn)，大模型創(chuàng)業(yè)公司的技術帶頭人，很多來自智源。

智譜AI創(chuàng)始人唐杰曾擔任過智源人工智能研究院副院長，目前智譜AI被美團投資，與360合作；即將完成10億元融資的月之暗面創(chuàng)始人楊植麟，也參與過悟道的研發(fā)。除了創(chuàng)業(yè)公司，字節(jié)跳動等互聯(lián)網(wǎng)大廠的大模型帶隊者，也或多或少參與過智源項目。

一些國家項目的技術骨干，也同樣來自智源。有些智源學者參與國家項目做研發(fā)，也會把算法結果放到智源的開源論壇中，供所有研究者共同探討，黃鐵軍告訴記者，他對此覺得很欣慰。

擔任智源研究院院長前，黃鐵軍當了十幾年北大老師，習慣了教書育人?，F(xiàn)在，他依舊把發(fā)掘人才作為基本工作。

黃鐵軍本人其實是一個“天馬行空”的科學家，記者問他，從業(yè)AI這么多年，有沒有最得意的二三事？他并沒有把十多年前確立的標準和專利積累當做值得講述的事，反而覺得，2015年的一天，他突然靈光一現(xiàn)，豁然開朗，推翻了圖像視頻概念，推翻了計算機視覺的基本范式，當然也推翻了自己此前20多年的研究，開創(chuàng)了脈沖視覺原理和技術新體系，一切從零再出發(fā)，是更有意思的事。

“我個人的看法是，重大創(chuàng)新一定是首先在一個人腦子里出現(xiàn)，否則它就不會發(fā)生。”他和年輕學者們交流，也更熱衷于談論天馬行動的想象，即使當下不可能發(fā)生，但未來，有可能突然有一天就能實現(xiàn)了。擔任院長后事務繁瑣，黃鐵軍不再有精力一行一行敲代碼，和年輕學者一起腦暴，培養(yǎng)、發(fā)掘年輕人，是他最開心的事情之一。

從成功率上講，未知的想象有很大風險，但是一旦成功，影響會是巨大的。

2018年，智源成立之初，就定下目標：支持科學家勇闖AI科技前沿“無人區(qū)”。他們給智源學者提供經(jīng)費，希望支持學者們自由探索，挖掘面向未來的AI研究方向。

2023年，智源曾經(jīng)耗費絕大部分資源和精力投入的大模型方向，已經(jīng)從“無人”變得熱鬧非凡，但也意味著更多未解之謎，有更多需要探索的新無人區(qū)。黃鐵軍說，智源要與企業(yè)錯位發(fā)展，開展更冒險、更開放、更前瞻、更創(chuàng)新地的工作，這是智源作為研究機構應該做的事。

5年時間，智源已經(jīng)嶄露頭角，現(xiàn)在，黃鐵軍提到，更重要是實現(xiàn)當年立下的十年目標：2028年智源研究院成為全世界公認的頂尖人工智能研發(fā)機構。

他還在繼續(xù)證明自己。

微信圖片_20230915155101

黃鐵軍（受訪者供圖）

【對話】

艦隊啟航

我們既不以論文為最終的評價指標，也不以產(chǎn)品作為評價指標；我們想做的，是一個創(chuàng)新性強、性能領先的系統(tǒng)，建立一套技術體系，一個技術生態(tài)。

經(jīng)濟觀察報：如何定位智源？

黃鐵軍：智源的性質(zhì)是介于大學和企業(yè)之間的一種新型研發(fā)機構。我們既不以論文為最終的評價指標，也不以產(chǎn)品作為評價指標，而是要做有創(chuàng)新性的系統(tǒng)。這種機構在國外也是很新的形態(tài)。從我個人來說，我2015年就開始參與我國新一代人工智能發(fā)展規(guī)劃，這種科技創(chuàng)新組織方式的改革，是這幾年國家很關注的一個方向，我愿意到智源來做這樣的嘗試。

原有體制下開展AI研究，大學受制于資源有限，企業(yè)受制于產(chǎn)品收入壓力，都約束了創(chuàng)新突破的可能性。智源這種機構有探索出新可能性的很大機會，這是吸引我的最重要的原因。

經(jīng)濟觀察報：智源是國內(nèi)第一個提出大模型概念的機構，也早在2020年就投入大部分資源做大模型。為什么是智源？

黃鐵軍：其實早在2018年、智源研究院成立時，我們從科研的角度對于AI已經(jīng)看到一個比較清晰的趨勢，大模型已經(jīng)是一個比較明確的方向了。當時大模型還不叫大模型，我們看到的方向是：用大數(shù)據(jù)訓練一個規(guī)模很大的模型，有望產(chǎn)生更強的智能。

2020年10月份，我們和時任北京市市長陳吉寧匯報中提到，智源計劃集中資源開展大模型研究。陳市長當機立斷，明確提出大模型會是人工智能的下一個核爆點。我們就開始買算力做事，當時買到了300P的算力，但是300P肯定是遠遠不夠的，就申請再追加單獨的經(jīng)費來做更大的算力。最后定下的是1000P的算力，大約是3億元人民幣的一個專項支出。這種規(guī)模的智算平臺在當時中國是絕對領先的。

經(jīng)濟觀察報：智源2021年6月就推出了兩個大模型產(chǎn)品，直到2023年6月，才又推出了悟道3.0。中間為何間隔這么久？

黃鐵軍：悟道2.0推出后，我們中間發(fā)生了一個重大的變化。當時從我們科研角度來看，新的AI時代已經(jīng)開始了，雖然那時候沒有多少人相信，但在我們這些人眼中，門已經(jīng)打開了。

我們于是開始考慮，既然它是一個時代的事，就絕對不會是智源一家機構在做，它應該是一個全社會、全世界的事情。

當時我們的分歧點是，繼續(xù)做一個悟道3.0版，把它做得更大更強？還是在全國范圍內(nèi)進行布局，讓不僅是北京中關村地區(qū)，而是全中國范圍都可以做這件事？最終我們選擇了后者，在國家新一代人工智能重大科技項目中提出了一個旗艦項目建議，從國家的科技布局角度，做系統(tǒng)化的布局和支持。

國家項目立項是需要時間的。從2021年6月份提出建議，到2022年12月份項目批準，花了一年半時間，在傳統(tǒng)項目體制下已經(jīng)是特別快了。這個旗艦項目2023年1月開始執(zhí)行，計劃通過滾動方式，一直持續(xù)到2030年，目標不是把一個模型做多大，或者性能做多高，而是要通過數(shù)據(jù)共建、算法競爭、開放評測、開源協(xié)同的創(chuàng)新機制，建立一套大模型開源開放技術體系，一個支撐大模型持續(xù)發(fā)展的技術生態(tài)。

所以，很多時候大家說中國大模型熱是因為ChatGPT火了之后才爆發(fā)的，并非如此，早在ChatGPT出現(xiàn)之前一年半，我國就已經(jīng)開始系統(tǒng)布局，那邊爆發(fā)的時候，這邊艦隊已經(jīng)起航。

AI新時代

新技術變革如果發(fā)生在中國，大家當然會更高興，沒首先爆發(fā)在中國，也不意味著我們就失去了機會。

經(jīng)濟觀察報：會不會覺得遺憾？比如說，如果去年6月你們就發(fā)了悟道3.0，說不定年底的時候火的就不是ChatGPT，而是你們？

黃鐵軍：即使我當時發(fā)布了，也不一定會火。這與大模型的屬性是有密切關系的。

大模型的數(shù)據(jù)量與投入直接相關，我們的算力、數(shù)據(jù)投入都與OpenAI差的很遠。而且差的不是一點半點，我們是1000P的算力，不到2000塊卡，ChatGPT大概是3萬塊卡，它是你15倍的算力，迭代速度會快很多。

科技體制改革的不容易就體現(xiàn)在這里，我們能調(diào)動的資源是幾億元人民幣的體量，OpenAI是用10億美元、100億美元力量在做。如果只差一兩倍，我們就有可能領先，如果差10倍以上你還想領先，這種事可能性就很小了。

但是反過來說，我們也不必糾結一城一池的得失。新技術變革如果發(fā)生在中國，大家當然會更高興，沒首先爆發(fā)在中國，也不意味著我們就失去了機會。

所以一方面確實是有點兒可惜，但另一方面，我們也不會被打亂節(jié)奏，我們從2021年想做的就是建立一個體系，希望在技術體系上保持在前沿的位置，做一個讓大家一起參與的旗艦項目，讓所有人都能發(fā)揮自己的聰明才智，共同塑造AI新時代。

經(jīng)濟觀察報：現(xiàn)在悟道已經(jīng)推出3.0了，也已經(jīng)開源了，接下來你們還想做什么？還有哪些可做的事情嗎？

黃鐵軍：我們作為一個科研機構，和企業(yè)和高校所做的事不一樣，我們會做更前瞻的一些探索。僅就大模型來說，現(xiàn)在是剛剛揭開大幕，可做的東西非常多。

打個比方，大模型在當下，就相當于法拉第轉動電磁線圈，能夠產(chǎn)生電流了。發(fā)電機剛面世，能產(chǎn)生電流，大家很興奮，但是如何讓電流在全社會流通和應用，還有大量的創(chuàng)新性探索要做。

比如在大模型領域，有沒有一種技術手段，能讓現(xiàn)在訓練的成本降低一個數(shù)量級？這種風險很大的創(chuàng)新，是我們應該做的。還有在理論領域，為什么大模型能這么強？尋找這種理論上的解釋，也是我們應該做的。另外會不會有一些架構上的創(chuàng)新，能把一些新技術要素結合在一起，訓練出更高水平的智能？甚至再往大了說，會不會有顛覆大模型的創(chuàng)新出現(xiàn)？這些探索我們也應該嘗試。我們要比企業(yè)更冒險、更開放、更前瞻、更創(chuàng)新地做一些工作。

挑戰(zhàn)與想象

在20年之后，AGI有很大可能實現(xiàn)。那時信息表達和流轉的方式，神經(jīng)元和神經(jīng)網(wǎng)絡結構及信號加工機理，都會有巨大變革，這些變革預計會在2045年之前會出現(xiàn)

經(jīng)濟觀察報：您曾在2015年時預判2045年會有AI超級大腦出現(xiàn)，經(jīng)過幾年探索后，您的想法變化了嗎？這個時間點會提前或延后嗎？

黃鐵軍：現(xiàn)在的想法會比2015年更樂觀一些，因為經(jīng)過近10年的進展，發(fā)現(xiàn)AI比原來預想的進展更快了。

現(xiàn)在有些人認為，再過2至5年就能實現(xiàn)AGI（通用人工智能），我覺得可能還得再等20年。因為真正的實現(xiàn)AGI，和只在某些方面實現(xiàn)AGI，是有本質(zhì)區(qū)別的。

真正的AGI一定是有自主意識的，人類擁有的智能它全部具備，而且它一定會從多個維度全面超越人類，說的通俗點就是超人，比你在科幻電影里看到的那種超人還要超人。它不一定以實體方式出現(xiàn)，可能不一定是我們目前能想象到的形態(tài)，但它肯定會有物理載體。

經(jīng)濟觀察報：這些挑戰(zhàn)具體是什么？我們能解決嗎？

黃鐵軍：做了30多年AI，我一直說AI首先是一門技術，我們要尋找一種可行的技術途徑和方法，再通過工程方法把智能做出來，這里面有很多不確定因素。

在技術這條路上，突破偶爾會發(fā)生，絕大多數(shù)時間是在黑暗中探索，這是常態(tài)。像我自己，一二十年反反復復這種狀態(tài)，沒有大突破，這是很正常的，一點都不奇怪。

但沒有重大進展并不意味著人不聰明、不努力，只是因為重大突破沒有標準答案，沒有一個規(guī)律性的路徑讓你照著做。

然而，正是因為“面壁十年”，破壁而出、豁然開朗才彌足珍貴，一次突破，足慰平生。2015年我發(fā)明脈沖攝影原理時就是這樣的感覺。這個原理顛覆了1839年發(fā)明的曝光成像原理，把普通光電傳感器“點石成金”，賦予AI一雙追光逐電的慧眼。

AlphaGo表明AI決策能力可以超越人類，大模型正在塑造的則是AGI無所不知的認知大腦。未來10年到20年，這樣的創(chuàng)新還會紛沓至來，信息表達和流轉的方式，神經(jīng)元和神經(jīng)網(wǎng)絡結構及信號加工機理，將會發(fā)生巨大變革，未來的AI將采用類似生物大腦的脈沖神經(jīng)網(wǎng)絡系。我現(xiàn)在仍然認為，2045年左右，將出現(xiàn)真正的AGI。

在此之前，人類社會將享受20年的科技革命紅利，同時也將積累從未面對的巨大風險。現(xiàn)在就應該投入充足資源開展風險研究，并開發(fā)相應的技術支持工具。