算力突圍之戰(zhàn):AI芯片封堵再加劇 國(guó)內(nèi)算力需求尋路

錢(qián)玉娟2023-07-07 22:13

經(jīng)濟(jì)觀察報(bào)記者 錢(qián)玉娟

關(guān)于英偉達(dá)A800芯片可能被禁售的消息,正在引發(fā)連鎖反應(yīng)。

一位英偉達(dá)芯片代理商告訴記者,大約一周前,關(guān)于英偉達(dá)A800芯片被禁售的這個(gè)信號(hào)讓市場(chǎng)上的A800價(jià)格一下子漲了起來(lái)。”

據(jù)這位代理商介紹,英偉達(dá)A800 80GB PCie標(biāo)準(zhǔn)版GPU的市場(chǎng)價(jià),15天前在9萬(wàn)元人民幣/顆,“現(xiàn)在(一顆)11萬(wàn)元左右。”即便價(jià)格飛漲,他告訴記者,英偉達(dá)的高端算力GPU芯片依然是“搶手貨”,在他看來(lái),英偉達(dá)的H800系列GPU芯片目前還可以正常供應(yīng),只不過(guò)價(jià)格更高了。

一面是越來(lái)越貴、越來(lái)越稀缺的高端芯片,一面是下游需求高漲的“百模大戰(zhàn)”,尋找另一條道路,成為迫在眉睫的選擇。

在被認(rèn)為是“史上最火爆”的上海2023年世界人工智能大會(huì)(WAIC)上,算力需求和缺口成為了高頻詞匯。

7月7日上午,清華大學(xué)電子工程系教授汪玉表示,若以大語(yǔ)言模型作為底座,同時(shí)處理我國(guó)14億人的推理請(qǐng)求,所需的計(jì)算量超過(guò)目前我國(guó)數(shù)據(jù)中心總算力的3個(gè)數(shù)量級(jí)。他由此強(qiáng)調(diào)我國(guó)現(xiàn)有算力資源的緊張程度。

“沒(méi)有大算力,做大模型就是天方夜譚。”中國(guó)工程院院士、鵬城實(shí)驗(yàn)室主任高文也在WAIC上透露,團(tuán)隊(duì)正在緊鑼密鼓地對(duì)一個(gè)2000億參數(shù)的大模型進(jìn)行訓(xùn)練,至少“需要4000塊卡訓(xùn)練100天”。

云計(jì)算技術(shù)專(zhuān)家劉世民早早注意到,國(guó)內(nèi)正式渠道如今愈發(fā)買(mǎi)不到高端AI芯片,面對(duì)算力發(fā)展遭遇限制,他也看到,一些云廠商基于相關(guān)AI產(chǎn)品可以提供GPU算力這一最基礎(chǔ)的AI服務(wù),當(dāng)然,其中不乏AWS、Azure這樣的海外云服務(wù)商。

“目前算力比較緊張,所以會(huì)選擇租賃云算力。”云從科技研究院的孫進(jìn)透露,買(mǎi)不到高端算力卡,加之自建算力集群周期長(zhǎng),即便租賃云算力成本相較自建要高,“高出50%~100%”,但這依然成為一些對(duì)算力有需求的科技公司的選擇。

如今,這條道路也在面臨更多挑戰(zhàn):7月4日,有消息稱(chēng)美國(guó)計(jì)劃對(duì)使用亞馬遜云、微軟云等海外云計(jì)算服務(wù)的中國(guó)企業(yè)施加限制。這是繼去年美國(guó)限制對(duì)華半導(dǎo)體出口,今年拉攏日本、荷蘭對(duì)華限制出口先進(jìn)芯片制造設(shè)備后又一舉措,“現(xiàn)在估計(jì)又要封堵云GPU了。” Vibranium Consulting副總裁陳沛說(shuō)。

圍堵加碼

陳沛介紹,云GPU要比自建GPU算力集群貴,“大型云廠商的價(jià)格差不多一小時(shí)2-3美元。”據(jù)他所知,AWS、Azure這樣的大型云服務(wù)商在新加坡有提供部分種類(lèi)的云算力服務(wù),在中國(guó)亦然。

2022年8月,當(dāng)英偉達(dá)的GPU計(jì)算芯片A100和H100被美國(guó)政府要求限制向中國(guó)出口后,對(duì)高端算力有需求的廠商,還可以在擁有先進(jìn)制程AI芯片的AWS、Azure等云廠商提供的云端算力服務(wù)中得到滿(mǎn)足。

而今限制如果繼續(xù)升級(jí),中國(guó)廠商未來(lái)若想使用AWS、Azure等海外云服務(wù)商的云端算力服務(wù),也要獲得美國(guó)政府許可才行。

2022年,由IDC、浪潮信息、清華大學(xué)全球產(chǎn)業(yè)研究院聯(lián)合編制了一份《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》,量化揭示了算力的重要性:全球各國(guó)算力規(guī)模與經(jīng)濟(jì)發(fā)展水平顯著正相關(guān),計(jì)算力指數(shù)平均每提高1點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.5‰和1.8‰;美國(guó)和中國(guó)的計(jì)算力指數(shù)分別為77分和70分,同屬?lài)?guó)別計(jì)算力的領(lǐng)跑者。

上述半導(dǎo)體行業(yè)觀察人士建議,正在算力側(cè)展開(kāi)自研創(chuàng)新的中國(guó)廠商們,當(dāng)下“需要丟掉幻想”,她認(rèn)為,只有不斷攻克芯片的成熟制程,疊加軟件創(chuàng)新才能共同提升算力。

在中國(guó)算力突圍路徑中,國(guó)產(chǎn)GPU芯片自研替代被認(rèn)為是第一大選擇,但這一選擇需要時(shí)間。目前最現(xiàn)實(shí)的選擇是,如何最大化地利用現(xiàn)有的高端芯片資源。

算力共享

按照外媒此前披露,作為微軟全力扶持的AI創(chuàng)業(yè)公司,OpenAI擁有微軟Azure云最高優(yōu)先級(jí)的支持——約有2.5萬(wàn)個(gè)英偉達(dá)GPU正在支持GPT大模型的訓(xùn)練,這是目前世界上規(guī)模最龐大的AI服務(wù)器之一。而OpenAI光用在訓(xùn)練ChatGPT上,就使用了1萬(wàn)個(gè)英偉達(dá)的GPU。

但即便是微軟,GPU也面臨缺口。今年6月,在公開(kāi)的OpenAI CEO Sam Altman 談話(huà)紀(jì)要中提到,GPU的短缺拖延了Open AI客戶(hù)的許多短期計(jì)劃。但這份談話(huà)紀(jì)要很快被刪除。

按照此前媒體報(bào)道,目前中國(guó)企業(yè)GPU芯片持有量超過(guò)1萬(wàn)枚的不超過(guò)5家,擁有1萬(wàn)枚A100的至多1家。且由于美國(guó)去年8月開(kāi)始算力封鎖,這些存貨的剩余使用壽命約為4-6年。

但現(xiàn)實(shí)正在急劇變化:伴隨著今年以來(lái)的生成式AI浪潮和大模型井噴,此前存在的缺口無(wú)疑還在進(jìn)一步放大。

由此,在國(guó)內(nèi)推動(dòng)“算力共享”被提上日程。

北京市經(jīng)信局4月下旬公布的“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,進(jìn)展迅速。7月3日,計(jì)劃公布了第二批伙伴名單中共有63家企業(yè),其中包括百度、京東、神州數(shù)碼和金山等10家算力供應(yīng)伙伴。

北京市經(jīng)信局公布的第一批算力供應(yīng)方伙伴名單只有兩家,一個(gè)是北京超級(jí)云計(jì)算中心,另一個(gè)便是阿里云計(jì)算有限公司。

2022年8月30日,阿里云推出飛天智算平臺(tái)的同時(shí),還啟動(dòng)了張北和烏蘭察布兩座超大規(guī)模智算中心,以公有云和專(zhuān)有云兩種模式,為各類(lèi)機(jī)構(gòu)提供服務(wù)。

彼時(shí)阿里云表示,其智算平臺(tái)以及智算中心可將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍。毫無(wú)疑問(wèn),當(dāng)國(guó)內(nèi)算力供應(yīng)因芯片卡短缺陷入緊張時(shí),云端算力可以補(bǔ)位。

當(dāng)阿里云提出“算力普惠”的目標(biāo)愿景時(shí),華為也通過(guò)推出昇騰AI集群解決方案,以填補(bǔ)著算力需求和硬件算力供給間的溝壑。在7月6日下午的WAIC上,華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊宣布,昇騰AI集群規(guī)模從最初的4000卡擴(kuò)展升級(jí)至16000卡,成為業(yè)內(nèi)首個(gè)萬(wàn)卡AI集群,其算力已經(jīng)在支撐像科大訊飛等企業(yè)進(jìn)行大模型訓(xùn)練以及智能化轉(zhuǎn)型。

AI缺口

如今受益于昇騰AI集群的算力支持,訊飛星火大模型的優(yōu)化訓(xùn)練在有序進(jìn)行中??拼笥嶏w高級(jí)副總裁胡國(guó)平在WAIC上強(qiáng)調(diào),所有的大模型訓(xùn)練都強(qiáng)烈依賴(lài)高端AI芯片集群和生態(tài)。

不過(guò),孫進(jìn)告訴記者,云端算力共享或租賃,往往適用于低頻訓(xùn)練需求的廠商。“基于同樣或同類(lèi)型的算力芯片,云廠商提供的云GPU確實(shí)可以形成替代。”但他表示,“各地建設(shè)的訓(xùn)練算力集群,大部分是消費(fèi)級(jí)推理卡集群,或者是CPU集群。”

一般來(lái)說(shuō),算力被分為三類(lèi):通用算力、智能算力、超算算力。在傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的場(chǎng)景中,基于普通CPU芯片集成的服務(wù)器所能提供的通用算力就可滿(mǎn)足;而人工智能發(fā)展、大模型的訓(xùn)練和推理,這些對(duì)應(yīng)的則是智能算力,是要基于AI芯片所提供的算力。此外,天體物理、航空航天等復(fù)雜運(yùn)算則需要超算算力。

據(jù)工信部消息,近年來(lái)中國(guó)算力產(chǎn)業(yè)規(guī)??焖僭鲩L(zhǎng),年增長(zhǎng)率近30%,算力規(guī)模排名全球第二,僅次于美國(guó)。

但當(dāng)下的問(wèn)題在于,這其中一部分并不是本輪生成式AI所需求的智能算力,而只是通用算力。

此前發(fā)布的《中國(guó)算力指數(shù)發(fā)展白皮書(shū)(2022)》顯示,中、美在全球算力規(guī)模中的份額分別為33%、34%,其中通用算力份額分別為26%、37%,智能算力分別為28%、45%,超級(jí)算力分別為18%、48%。

在劉世民看來(lái),算力共享確實(shí)可以讓更多企業(yè)能用上算力,但先進(jìn)芯片所代表的高端算力,一旦被限制,勢(shì)必限制國(guó)內(nèi)算力的增長(zhǎng)。而今,中國(guó)的人工智能產(chǎn)業(yè)又已經(jīng)步入AIGC時(shí)代,參與其中的廠商需要進(jìn)行的是高頻訓(xùn)練,持續(xù)的優(yōu)化迭代。

值得關(guān)注的是,算力需求暴增下,供給背后的國(guó)產(chǎn)GPU自研以及軟件創(chuàng)新,都將是中國(guó)廠商亦步亦趨要解決的問(wèn)題。

陳沛說(shuō),種種限制框架下,英偉達(dá)提供的高端算力,在市場(chǎng)上不只受歡迎,還是剛需。陳沛記得2020年OpenAI訓(xùn)練GPT-3時(shí),用的是英偉達(dá)GPU芯片V100,“一萬(wàn)顆,耗時(shí)14.8天”,但在一周前,他看到英偉達(dá)發(fā)出的最新測(cè)試結(jié)果中顯示,僅用3000多顆H100 GPU芯片,11分鐘就完成了GPT-3的模型訓(xùn)練。

“英偉達(dá)依然是AI訓(xùn)練領(lǐng)域的老大。”陳沛說(shuō)。

一位國(guó)產(chǎn)AI大模型廠商的創(chuàng)始人也告訴記者,目前其自研的大模型正在儲(chǔ)備的英偉達(dá)算力芯片上“跑著”,盡管芯片禁售是未來(lái)式,但面對(duì)大模型浪潮所帶來(lái)的高頻算力需求,目前我們沒(méi)有太多的備選方案。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
長(zhǎng)期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢(shì)。擅長(zhǎng)企業(yè)模式、人物專(zhuān)訪及行業(yè)深度報(bào)道。
重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn
微信號(hào):EstherQ138279

熱新聞