中國AI產(chǎn)業(yè)地圖:誰是“大模型之都”

任曉寧2023-07-15 10:43

經(jīng)濟觀察報記者 任曉寧 實習記者 陶思羽 譚玉清

一場關于大模型的地域競速已經(jīng)開始。

“現(xiàn)在已有80余個大模型公開發(fā)布,其中北京約占一半”,北京市經(jīng)濟和信息化局黨組書記、局長姜廣智最近在接受媒體采訪時說。

經(jīng)濟觀察報記者不完全統(tǒng)計發(fā)現(xiàn),在新一輪生成式AI熱潮中,全國已經(jīng)出現(xiàn)了106個大模型,其中北京的大模型公司數(shù)量和研發(fā)數(shù)量均占據(jù)“C位”,多達54個;上海在AI算力方面積累了優(yōu)勢;深圳、廣州、杭州、成都等城市也都有多個大模型公司。

今年4月28日,中共中央政治局會議提出,要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風險。5月5日召開的二十屆中央財經(jīng)委員會第一次會議指出,要把握人工智能等新科技革命浪潮。之后,全國各地相繼推出大模型扶持政策。搶占新一輪AI高地,各大城市正在行動中。

目前,各地大模型均還在內測中,未開放給公眾。大模型發(fā)展仍處于混沌初開時刻,最終誰能勝出,成為真正的“大模型之都”,還需繼續(xù)觀察。

北京:54個

姜廣智的話并不夸張,據(jù)經(jīng)濟觀察報不完全統(tǒng)計,截至7月13日,北京已有54個大模型公司。

1

中關村是北京大模型公司的核心聚集地。經(jīng)濟觀察報記者在五道口走訪時,方圓3公里內,就坐落著近10個大模型創(chuàng)業(yè)公司,它們也都是中國大模型公司中的佼佼者。

五道口清華大學南門外,搜狐網(wǎng)絡大廈3層,是王慧文創(chuàng)辦的光年之外。這家公司成立剛4個月,以20.65億元的價格被美團收購。搜狐大廈對面是智源大廈,北京智源人工智能研究院坐落其中,院長是北京大學計算機科學技術系主任黃鐵軍,這是學院派的中堅力量之一,早在2021年,智源就推出了中國首個超大規(guī)模預訓練模型“悟道2.0”,參數(shù)量達到1.75萬億。

智源大廈往南800米,是王小川創(chuàng)辦的百川智能,7月11日,百川智能發(fā)布參數(shù)量130億的通用大語言模型“Baichuan-13B-Base”。

距離智源大廈3公里外的丹棱街上,MiniMax北京團隊在這里辦公,這是當前國內估值最高的大模型創(chuàng)業(yè)公司,6月最新一輪融資后,估值12億美元。丹棱街1公里之外,是銜遠科技的辦公室,這家公司由京東前AI掌門人周伯文創(chuàng)辦。

坐落在中關村附近的,還有李開復的大模型新公司“零一萬物”,這家公司7月3日剛成立,目前團隊已經(jīng)有數(shù)十名核心成員。

出門問問創(chuàng)始人李志飛的公司也在海淀,他們推出了大模型產(chǎn)品“序列猴子”。這附近也有互聯(lián)網(wǎng)大廠推出的大模型產(chǎn)品,比如位于知春路的字節(jié)跳動,在6月28日發(fā)布了大模型服務平臺“火山方舟”。

如果把中關村的范圍擴大到方圓10公里,大模型公司更多。中關村向北10公里,是互聯(lián)網(wǎng)大廠的聚集地后廠村。今年3月,百度在百度科技園里發(fā)布了文心大模型,是國內第一個互聯(lián)網(wǎng)大廠發(fā)布的大模型。

同在北京發(fā)布大模型的大廠,還有位于望京的360,今年發(fā)布了“智腦大模型”。位于亦莊的京東,發(fā)布了“言犀大模型”。

北京還有一批中等規(guī)模公司也發(fā)布了大模型,比如昆侖萬維的“天工”、知乎的“知海圖”、網(wǎng)易有道的“子曰”、第四范式的“式說”……

根據(jù)IDC《2022-2023中國人工智能計算力發(fā)展評估報告》,北京位居2022年中國人工智能城市排行榜首位。獵聘研究院發(fā)布的《AIGC就業(yè)趨勢大數(shù)據(jù)報告2023》顯示,在近一年AIGC新發(fā)職位城市分布TOP10中,北京職位最多,占比為22.21%。

AI政策扶持方面,北京市正在發(fā)力。5月份,北京市政府12天內連發(fā)3個AI相關文件。5月19日,發(fā)布《北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃》;5月30日,印發(fā)《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》;5月30日,印發(fā)《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》。

姜廣智也提到,北京市經(jīng)信局將按季度迭代推出大模型應用成果,形成一批人工智能與經(jīng)濟社會發(fā)展深度融合的典型案例,并正在籌劃通過算力券等形式支持模型伙伴和模型觀察員,首期預計支持不低于4000萬元算力券,補貼到模型伙伴企業(yè)。

上海:12個

今年7月8日,在2023世界人工智能大會閉幕式上,《上海市推動人工智能大模型創(chuàng)新發(fā)展的若干措施》公布,并發(fā)布了“模”都倡議,成立上海人工智能開源生態(tài)產(chǎn)業(yè)集群,打造AI“模都”。

1

圍繞創(chuàng)新能力、創(chuàng)新要素、創(chuàng)新應用、創(chuàng)新環(huán)境四大方向,上海將重點打造三項計劃以及五大平臺。三項計劃分別為:大模型創(chuàng)新扶持計劃、智能算力加速計劃、示范應用推進計劃。

不過,與北京的大模型企業(yè)數(shù)量相比,上海稍微遜色了一籌。據(jù)經(jīng)濟觀察報不完全統(tǒng)計,截至7月13日,上海共有12個大模型,分別是:總部位于上海的MiniMax、復旦大學的MOSS、商湯科技的日日新、達觀數(shù)據(jù)的曹植、微盟的WAI、星環(huán)科技的無涯和求索、樂言科技的樂言、醫(yī)療算網(wǎng)的Uni-talk、上海AI實驗室的書生通用大模型體系、虎博科技的TigerBot、智臻智能的小i、蜜度的蜜度文修。

上海大模型的帶頭人,是商湯及復旦大學。今年7月,商湯日日新大模型更新到了2.0版本,還在大模型基礎上推出了小模型。復旦大學的MOSS于今年2月推出,MOSS系統(tǒng)負責人邱錫鵬說,MOSS在中文能力上已超ChatGPT。

雖然大模型數(shù)量沒有北京多,不過,在每家大模型公司都離不開的算力、芯片方面,上海處于遙遙領先的位置。

今年上半年,英偉達股價暴漲,原因是他們的GPU可以為大模型提供算力,由于GPU出貨量有限,市場供不應求。在上海,也分布著一眾國產(chǎn)GPU公司。

閔行區(qū)和上海自由貿易試驗區(qū)是上海芯片公司重鎮(zhèn)。陳行公路上,坐落著壁仞科技、天數(shù)智芯等為大模型計算提供通用GPU芯片的國產(chǎn)龍頭芯片公司。上海自由貿易試驗區(qū),林立著芯璐科技、日觀芯設、世瞳微電子等從芯片設計到生成的不同節(jié)點、不同研發(fā)類型的半導體公司。

張江也是上海芯片公司聚集地。今年世界人工智能大會上,張江的芯片公司們集中發(fā)布了芯片新品,包括沐曦集成的“曦思N100人工智能推理GPU”、瀚博半導體的“瀚博第二代全功能GPU芯片”、燧原科技的“人工智能云端訓練芯片邃思2.0”等。

同時,上海外資芯片公司較多,閔行區(qū)紫竹科學園區(qū),有著半導體芯片巨頭英特爾的中國區(qū)公司,定義了GPU的英偉達,其中國區(qū)公司也在上海。

除了大模型之外,上海也是上一波深耕計算機視覺的“AI四小龍”商湯科技、依圖科技的發(fā)源地。2019年,上海浦東新區(qū)成為全國第一個人工智能先導區(qū)?,F(xiàn)在,上海交大、復旦、同濟、上大等13所高校和5個科研院所都設立了人工智能相關學科點。

AI扶持政策上,上海在全國范圍內都跑得很快。去年9月,上海出臺了全國首部AI省級法規(guī)《上海市促進人工智能產(chǎn)業(yè)發(fā)展條例》,提到上海市推動算法模型交易流通,上海市經(jīng)濟信息化部門會同相關部門指導行業(yè)組織制定人工智能算法模型推薦目錄,降低算法模型交易風險,提高算法模型交易效率?!稐l例》指出,上海市支持相關主體開展基于先進架構的高效能智能芯片設計創(chuàng)新,研制云端芯片和云端智能服務器,布局類腦芯片,強化軟硬件協(xié)同適配,支持聯(lián)合建設研發(fā)測試和應用平臺,加強技術協(xié)同和芯片架構互聯(lián)互通,提升智能芯片產(chǎn)品和技術競爭力,培育智能芯片應用生態(tài)體系。

深圳:11個

在深圳龍崗政數(shù)局的行政服務大廳,大模型已應用于政務咨詢服務系統(tǒng),背后提供支撐的就是云天勵飛技術股份有限公司名為“天書”的大模型。這家AI公司今年4月4日登陸科創(chuàng)板,是“深圳人工智能第一股”,目前市值229億元。

1

深圳另一家做自然語言處理技術的追一科技,今年也發(fā)布了其自主研發(fā)的大模型“博文Bowen”,落地于金融、政務等垂直場景。

此外,深圳也有大模型科研力量。在深圳福田,前微軟全球執(zhí)行副總裁、AI及技術研發(fā)體系負責人沈向洋掛帥的IDEA研究院,推出了開源通用大模型“姜子牙”系列并開源封神榜第99個通用大模型“姜子牙通用大模型v1”。姜子牙大模型擁有130億參數(shù),可進行千億token量級預訓練。同時,香港中文大學(深圳)和深圳市大數(shù)據(jù)研究院訓練并開源了一個醫(yī)療大模型——HuatuoGPT(華佗GPT),以使語言模型具備像醫(yī)生一樣的診斷能力和提供有用信息的能力。

“北京做的是0到1的事情,上海做的是從1到10的事情,深圳則是做從10到100的事情。”一位專注深圳人工智能企業(yè)的研究人士這樣形容深圳在AI領域與北京、上海的不同。在他看來,深圳的AI公司擅長的是最上層AI應用,可能還要等半年到1年時間,才是深圳公司大顯身手的時刻。

前不久,上述人士對當?shù)卮竽P凸咀隽嗣坠ぷ?,最新?shù)據(jù)是,深圳有11家做大模型的公司和機構,其中既有通用大模型,也有行業(yè)大模型。

當然,深圳AI毫無疑問的龍頭公司還是華為。7月7日下午,華為發(fā)布盤古大模型3.0,并且華為也提供算力,7月6日,華為旗下算力解決方案昇騰AI集群全面升級,集群規(guī)模從最初的4000卡集群擴展至16000卡,為業(yè)界首個萬卡AI集群。

5月31日,深圳市印發(fā)《深圳市加快推動人工智能高質量發(fā)展高水平應用行動方案(2023-2024年)》,同步發(fā)布首批“城市+AI”應用場景清單,統(tǒng)籌設立規(guī)模1000億元的人工智能基金群,以最充足的算力、最大的政策支持、最優(yōu)的產(chǎn)業(yè)生態(tài)、最好的人才環(huán)境、最豐富的場景應用,打造國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)和國家人工智能創(chuàng)新應用先導區(qū)。

上述研究人士告訴經(jīng)濟觀察報,由于大模型創(chuàng)業(yè)門檻比較高,需要頂尖人才,偏基礎研究,在大模型發(fā)展早期,北京這樣高校多的城市有優(yōu)勢。深圳制造業(yè)發(fā)達,將來會強在應用端和產(chǎn)業(yè)化。

7月4日,深圳市人工智能產(chǎn)業(yè)協(xié)會研究團隊發(fā)布的《深圳市人工智能產(chǎn)業(yè)發(fā)展白皮書(2023年度)》顯示,2022年,深圳市人工智能產(chǎn)業(yè)規(guī)模達2488億元。

其中,深圳市人工智能核心產(chǎn)業(yè)規(guī)模達308億元,同比增長52.48%;企業(yè)數(shù)量方面,2022年,深圳市人工智能企業(yè)數(shù)量達1920家;產(chǎn)業(yè)鏈分布方面,2022年,深圳市人工智能基礎層僅占企業(yè)總數(shù)量的8.13%,技術層占企業(yè)總數(shù)量的17.29%,應用層占企業(yè)總數(shù)量的74.58%;區(qū)域分布方面,2022年,深圳市人工智能企業(yè)主要集中在南山、寶安兩區(qū),合計占比高達58.1%。其中,南山區(qū)數(shù)量占36.8%,寶安區(qū)占21.3%。

杭州:8個

據(jù)經(jīng)濟觀察報不完全統(tǒng)計,杭州的大模型有8個,最大的是阿里云的通義大模型家族,此外還有西湖心辰的西湖、宇視科技的梧桐、恒生電子的Light-GPT、螞蟻集團的貞儀、新華三H3C的百業(yè)靈犀、實在智能的塔斯、網(wǎng)易伏羲的玉言。

1

杭州AI龍頭是阿里巴巴,目前,阿里云通義大模型家族已經(jīng)有3款大模型,包括通義千問、通義聽悟和通義萬相。阿里巴巴旗下的螞蟻集團也發(fā)布了貞儀大模型。

杭州另一股AI力量來自網(wǎng)易。在2023世界人工智能大會上,網(wǎng)易伏羲多款AI大模型產(chǎn)品首次亮相,包括“玉言”、“丹青”等。

浙江西湖邊上,還坐落著一家大模型創(chuàng)業(yè)公司西湖心辰,這家公司與西湖大學等科研機構合作,融合了學院派的力量,發(fā)布了西湖大模型。今年以來,西湖心辰獲得了百度、湯姆貓的投資,其最新一輪融資發(fā)生在7月,完成超億元戰(zhàn)略融資。

據(jù)IDC與浪潮信息聯(lián)合發(fā)布的系列《中國人工智能計算力發(fā)展評估報告》,近五年,杭州穩(wěn)居十大算力城市的前三席,與北京、深圳角逐,顯示出強大的競爭力。

在算力載體方面,杭州擁有阿里云城市大腦、海康威視視頻感知國家新一代人工智能開放創(chuàng)新平臺,以及腦與腦機融合前沿科學中心、人工智能協(xié)同創(chuàng)新中心、國家數(shù)據(jù)智能技術創(chuàng)新中心國家級創(chuàng)新平臺。

同時,杭州的科技公司還找到了一個現(xiàn)成的試驗場:電商產(chǎn)業(yè)。作為電子商務之都,頻繁更新的內容生產(chǎn)需要催生了電商對于AIGC的市場需求,這成為當前AIGC在杭州市場化落地的支柱項目。目前杭州科技企業(yè)的AIGC服務已經(jīng)能實現(xiàn)電商場景的快速搭建,除了營銷文字外,商家所需要的產(chǎn)品介紹,圖片素材都可以通過AIGC自動生成。去年流行一時的AI繪畫,部分新媒體已經(jīng)在使用的AI內容生成等,杭州企業(yè)的相關產(chǎn)品也已推出。

政策方面,去年底杭州發(fā)布《2022年杭州市第三批重點建設的人工智能應用場景清單》,涉及智慧城市、智慧制造、智慧醫(yī)療、智慧交通、智慧金融等多個領域,共46個重點建設人工智能應用場景入選。今年6月,杭州市經(jīng)信局起草了《關于加快推進人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的實施意見(征求意見稿)》,現(xiàn)向社會公開征求意見。

目前之江實驗室、阿里達摩院、浙江大學等科研院校都在加大對AIGC領域的研究。

廣州:4個

據(jù)經(jīng)濟觀察報不完全統(tǒng)計,廣州有4個大模型,分別是云從科技的從容、華南理工大學未來技術學院的扁鵲和靈心、數(shù)說故事的SocialGPT、賽靈力科技的達爾文。

1

2021年7月,廣州市科學技術局就發(fā)布了《廣州市人工智能產(chǎn)業(yè)鏈高質量發(fā)展三年行動計劃(2021-2023年)(征求意見稿)》,提出廣州將重點打造1項具有國際影響力的人工智能創(chuàng)新大賽、建設10個人工智能產(chǎn)業(yè)園,打造100個人工智能典型應用場景,培育超1000家人工智能企業(yè)。

去年9月,廣州市發(fā)布了《廣州市促進創(chuàng)新鏈產(chǎn)業(yè)鏈融合發(fā)展行動計劃(2022—2025年)》點出六大重點行動。

成都:3個

據(jù)不完全統(tǒng)計,成都已發(fā)布的大模型有3個:曉多科技與國家超算成都中心聯(lián)合發(fā)布的曉模型XPT、醫(yī)聯(lián)科技發(fā)布的medGPT、明途科技的workChat數(shù)字人。

1

今年5月,曉模型(XPT)發(fā)布,這是基于大語言模型技術開發(fā)的面向電商行業(yè)的垂類大模型。5月 25日,醫(yī)聯(lián)發(fā)布了國內首款醫(yī)療大語言模型——MedGPT,致力于在真實醫(yī)療場景中發(fā)揮實際診療價值,實現(xiàn)從疾病預防、診斷、治療、康復的全流程智能化診療能力。5月31日,明途科技正式發(fā)布明途workChat數(shù)字人,功能包含知識問答、AI寫作、知識采集、輔助工具等。

今年5月,《2023年成都市大數(shù)據(jù)與人工智能(含車載智能控制系統(tǒng))產(chǎn)業(yè)建圈強鏈工作要點》印發(fā),17條細化舉措,給予成都大數(shù)據(jù)與人工智能(含車載智能控制系統(tǒng))產(chǎn)業(yè)鏈發(fā)展“路線圖”。

成都市的目標是,今年力爭培育國家級人工智能專精特新“小巨人”企業(yè)5家、上市企業(yè)1家、上規(guī)企業(yè)10家,人工智能產(chǎn)業(yè)規(guī)模突破700億元。

成都市提出,鼓勵高校、科研機構、龍頭企業(yè)聯(lián)合算力中心聚焦重點產(chǎn)業(yè)領域孵化原創(chuàng)AI大模型,并給予建設方每年最高500萬元的算力成本補貼,降低企業(yè)創(chuàng)新成本。每年發(fā)放總額不超過1000萬元的算力券,用于支持算力中介服務機構、科技型中小微企業(yè)和創(chuàng)客、科研機構、高校等使用國家超算成都中心、成都智算中心算力資源。

南京:3個

身處長三角地區(qū)的南京,近年來也在著力發(fā)展AI產(chǎn)業(yè)。據(jù)不完全統(tǒng)計,南京已有3個大模型公司,分別是孩子王公司的KidsGPT、智子引擎的元乘象和硅基智能的炎帝。

1

孩子王公司的KidsGPT在六一童玩節(jié)期間推出,專攻母嬰童垂直領域。炎帝大模型是一個多模態(tài)的行業(yè)模型,企業(yè)可以用來做短視頻生成、直播生成、電影/電視劇生成、甚至數(shù)字永生等方面的工作。智子引擎是一家多模態(tài)大模型初創(chuàng)企業(yè),已經(jīng)完成千萬元天使輪融資。該公司背后的核心團隊便是中國人民大學高瓴人工智能學院教授盧志武帶領的課題組,其大模型產(chǎn)品元乘象ChatImg參數(shù)約150億。

2022年12月,南京市印發(fā)《南京國家人工智能創(chuàng)新應用先導區(qū)建設實施方案》,提出到2025年,南京將高標準打造5個人工智能產(chǎn)業(yè)園區(qū),爭創(chuàng)1—2個省級以上人工智能產(chǎn)業(yè)集群,培育100家人工智能重點企業(yè),省級以上專精特新小巨人企業(yè)和單項冠軍企業(yè)達到30家,全市人工智能核心產(chǎn)業(yè)收入超過500億元。

未來,南京人工智能計算中心將繼續(xù)在算力支持之外,為企業(yè)客戶提供易用的服務及產(chǎn)品,著眼數(shù)據(jù)、算力、算法等人工智能產(chǎn)業(yè)發(fā)展核心能力,賦能企業(yè),推動人工智能產(chǎn)業(yè)上下游企業(yè)在南京聚集。中心計劃于近期完成核心伙伴的模型適配驗證,將為本地企業(yè)孵化行業(yè)大語言模型提供強有力的基礎模型支撐,在江蘇打造行業(yè)大模型轉商落地標桿示范。

其他:11個

其他發(fā)布大模型的城市還有天津、合肥、哈爾濱、沈陽、西安、長沙、綿陽、廈門。

1

天津已有2個大模型公司:國家超級計算天津中心發(fā)布的天河天元模型、慧言科技和天津大學聯(lián)合發(fā)布的海河·諦聽模型。

在世界人工智能大會期間,國家超算天津中心發(fā)布了天河百億級智能計算開放創(chuàng)新平臺和國產(chǎn)中文大模型——天河天元。國家超算天津中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓練數(shù)據(jù)、中文小說數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù),以及專業(yè)領域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓練數(shù)據(jù)集總token數(shù)達到350B。

安徽合肥的AI公司代表是科大訊飛。今年5月,科大訊飛發(fā)布了星火認知大模型??拼笥嶏w董事長劉慶峰稱,當前訊飛星火認知大模型在文本生成、知識問答、數(shù)學能力三大能力上已超ChatGPT。

在合肥高新區(qū),一個圍繞智能語音和人工智能領域的產(chǎn)業(yè)園區(qū)也蓬勃發(fā)展起來,被稱為“中國聲谷”。這里已有1000多家企業(yè)入駐,從業(yè)人員超過5萬人,形成了千億級的產(chǎn)業(yè)集群。

版權聲明:以上內容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。
TMT新聞部資深記者
關注并報道TMT(科技、傳媒、通信)領域重大事件,擅長行業(yè)分析、深度報道。
聯(lián)系郵箱:renxiaoning@eeo.com.cn
微信號:tangtangxiaomo

熱新聞

電子刊物

點擊進入