大模型驅(qū)動(dòng)云計(jì)算需求激增,Arm拿出新應(yīng)對(duì)之策

駱軼琪2024-03-11 07:46

隨著全球云計(jì)算巨頭紛紛提出自研AI芯片計(jì)劃,各類型計(jì)算產(chǎn)業(yè)鏈公司都迎來(lái)巨大發(fā)展機(jī)會(huì)。

雖然目前最為矚目的是GPU巨頭NVIDIA,但AI芯片計(jì)算需求不僅限于強(qiáng)于并行計(jì)算的GPU,還包括主打通用計(jì)算的CPU、專用芯片ASIC等。因此相關(guān)公司都在不斷攻堅(jiān)提升芯片性能。

近日Arm高級(jí)副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理Mohamed Awad接受21世紀(jì)經(jīng)濟(jì)報(bào)道等記者采訪時(shí)分析,目前在云服務(wù)商對(duì)AI的極大興趣驅(qū)動(dòng)下,和AI相關(guān)的計(jì)算需求非常龐大,但傳統(tǒng)的通用CPU已無(wú)法滿足AI相關(guān)計(jì)算需求。而云服務(wù)商自主設(shè)計(jì)芯片過程中,也需要考慮這些芯片都能運(yùn)行目前市面上已有的軟件。

“我們看到合作伙伴正構(gòu)建與AI加速器緊密耦合的定制通用計(jì)算,這在Arm與NVIDIA Grace Hopper、亞馬遜云科技 (AWS) 以及微軟的合作中都有所體現(xiàn)。此外,這一趨勢(shì)也正發(fā)生在許多中國(guó)合作伙伴的項(xiàng)目上,他們?cè)陂_發(fā)加速器的同時(shí),還致力于協(xié)同設(shè)計(jì)通用計(jì)算?!彼m(xù)稱。

自研芯片趨勢(shì)明顯

從整體趨勢(shì)看,Arm 基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll指出,AI芯片行業(yè)正呈現(xiàn)兩個(gè)特征:其一,人們希望對(duì)支持云計(jì)算關(guān)鍵工作負(fù)載的計(jì)算進(jìn)行優(yōu)化;其二,頭部企業(yè)正在打造定制芯片,并需要有效的方式來(lái)實(shí)現(xiàn)。

Mohamed Awad進(jìn)一步分析,“基礎(chǔ)設(shè)施所需處理和管理的數(shù)據(jù)和計(jì)算量相當(dāng)大,加上AI等新工作負(fù)載的計(jì)算需求又非常高。這意味著通用的現(xiàn)成芯片很難優(yōu)化到能夠支持基礎(chǔ)設(shè)施日益增長(zhǎng)的需求。數(shù)據(jù)中心提供商和頭部云服務(wù)提供商正在重新設(shè)計(jì)整個(gè)服務(wù)器、機(jī)架和倉(cāng)庫(kù),從而獲得更佳的性能、效率和總體擁有成本 (TCO)。這一切驅(qū)使他們從定制芯片著手。

他具體舉例道,在基礎(chǔ)設(shè)施領(lǐng)域,看到轉(zhuǎn)型持續(xù)朝向更復(fù)雜的倉(cāng)庫(kù)級(jí)計(jì)算,它不再只關(guān)乎芯片、服務(wù)器或機(jī)架,而是關(guān)乎整個(gè)數(shù)據(jù)中心。

“NVIDIA就是很好的例子,其推出的Grace Hopper從根本上重新設(shè)計(jì)了系統(tǒng)架構(gòu)。在這一設(shè)計(jì)中,從單個(gè)CPU管理多個(gè)GPU,轉(zhuǎn)變?yōu)镃PU與GPU一對(duì)一映射。更多CPU意味著內(nèi)存一致性,最終會(huì)大大提高GPU的利用率?!彼赋觯珹WS和微軟等巨頭也采取了類似方法,從頭開始設(shè)計(jì)系統(tǒng),并從定制系統(tǒng)級(jí)芯片 (SoC) 開始。因?yàn)樗麄儽热魏稳硕几私庾约旱墓ぷ髫?fù)載,可以對(duì)系統(tǒng)各方面進(jìn)行調(diào)優(yōu),包括網(wǎng)絡(luò)、加速甚至是通用計(jì)算,以優(yōu)化效率、性能和TCO。

“去年我們推出了Arm Neoverse計(jì)算子系統(tǒng)(CSS),使定制芯片更迅速且易實(shí)現(xiàn)?!盌ermot O’Driscoll介紹,在Neoverse CSS中,Arm負(fù)責(zé)配置、優(yōu)化和驗(yàn)證一套完整的計(jì)算子系統(tǒng),并針對(duì)基礎(chǔ)設(shè)施市場(chǎng)的各種關(guān)鍵用例進(jìn)行配置,從而讓合作伙伴能夠?qū)W⒂卺槍?duì)特定系統(tǒng)級(jí)工作負(fù)載塑造差異化競(jìng)爭(zhēng)優(yōu)勢(shì),比如軟件調(diào)優(yōu)、定制加速等。此外,客戶還能加速產(chǎn)品上市時(shí)間、降低工程成本。

近期Arm宣布推出兩款基于第三代Neoverse IP構(gòu)建的新Arm Neoverse CSS,即Arm Neoverse CSS V3和Arm Neoverse CSS N3。其中Arm Neoverse CSS V3與CSS N2相比,單芯片性能可提高50%;Arm Neoverse CSS N3與CSS N2相比,其每瓦性能可提升20%。

當(dāng)然,AI的適用范圍不僅是應(yīng)用服務(wù)器和數(shù)據(jù)中心。AI正成為包括網(wǎng)絡(luò)、安全和存儲(chǔ)等諸多領(lǐng)域不可或缺的一部分,它可應(yīng)用到包括小型終端到交換機(jī)、路由器和基站等各種設(shè)備在內(nèi)的整個(gè)基礎(chǔ)設(shè)施中。Mohamed Awad表示,憑借新的CSS N3和CSS V3,Arm專注于釋放芯粒等新技術(shù)的潛力,并更大限度優(yōu)化實(shí)際工作負(fù)載的TCO。

軟硬件適配的重要性

當(dāng)然也正因?yàn)樽匝行酒瑓⑴c者眾多,導(dǎo)致相關(guān)AI芯片從設(shè)計(jì)、流片到最終商用落地的過程,將涉及與不同軟件、接口等匹配,同時(shí)如何節(jié)省能耗也尤為重要。

Dermot O’Driscoll受訪時(shí)介紹,在算力需求持續(xù)增長(zhǎng)下,意識(shí)到算力也受到成本和能源的限制這一點(diǎn)很重要。這也驅(qū)動(dòng)了在數(shù)據(jù)中心和基礎(chǔ)設(shè)施中自上而下的優(yōu)化,并帶來(lái)越來(lái)越多專為軟件工作負(fù)載量身打造定制芯片的需求。

“在構(gòu)建Neoverse N3和V3平臺(tái)時(shí),Arm也與合作伙伴緊密合作,了解他們的軟件需求并針對(duì)這些需求提供優(yōu)化。我們的CSS和IP平臺(tái)意味著合作伙伴可以更加靈活地根據(jù)特定需求進(jìn)一步優(yōu)化設(shè)計(jì)?!彼m(xù)稱,“同時(shí),我們一直在與合作伙伴一起構(gòu)建和優(yōu)化云原生軟件。我們從早期就將軟件棧和工作負(fù)載遷移到Arm平臺(tái)的合作伙伴那里,得到的反饋是,整個(gè)遷移過程比預(yù)期容易?!?/p>

在應(yīng)用場(chǎng)景方面也有新的趨勢(shì)表現(xiàn)。Dermot O’Driscoll分析道,目前行業(yè)重點(diǎn)更多放在訓(xùn)練LLM(大語(yǔ)言模型)上,但隨著生成式AI廣泛應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景,其工作重點(diǎn)將轉(zhuǎn)向推理。有分析師估計(jì),已部署的AI服務(wù)器中有高達(dá)80%專用于推理,這一數(shù)字還將持續(xù)攀升。

近期NVIDIA財(cái)報(bào)會(huì)上也提到,在去年第四財(cái)季,其數(shù)據(jù)中心類業(yè)務(wù)中,約有40%收入是用于AI推理所產(chǎn)生。

這一轉(zhuǎn)變意味著要找到合適的模型和模型配置,并加以訓(xùn)練,然后將其部署到更具成本效益的計(jì)算基礎(chǔ)設(shè)施上。吞吐量是其中一部分考慮因素,當(dāng)然還有其他因素。

Dermot O’Driscoll表示,CPU廣泛可用,并可靈活用于ML(機(jī)器學(xué)習(xí))或其他工作負(fù)載,此外,CPU還易于部署,并可支持各種軟件框架,具備低成本和高能效等優(yōu)勢(shì)。因此,CPU推理將是生成式AI計(jì)算應(yīng)用的關(guān)鍵組成。但顯然,也并非所有AI處理都將在CPU上進(jìn)行。

“NVIDIA Grace Hopper的一大關(guān)鍵創(chuàng)新在于內(nèi)存容量和共享內(nèi)存模式。這種緊耦合的CPU加上加速器配置,對(duì)大參數(shù)LLM非常有益,對(duì)檢索-增強(qiáng)-生成 (RAG) 等新興方法也很有幫助。Arm推出的Neoverse CSS能提供客戶所需的所有接口,以便選擇耦合自身的加速器。這種方法既可以在需要CPU時(shí)提供CPU,又可以在需要AI加速器時(shí)提供AI加速器,做到兩全其美。”他指出。

在Neoverse CSS基礎(chǔ)上,去年10月,Arm全面設(shè)計(jì)(Arm Total Design) 生態(tài)項(xiàng)目推出,圍繞Arm計(jì)算子系統(tǒng)開展創(chuàng)新設(shè)計(jì)。Arm基礎(chǔ)設(shè)施事業(yè)部營(yíng)銷副總裁Eddie Ramirez則介紹,在推出后四個(gè)月內(nèi),Arm全面設(shè)計(jì)生態(tài)項(xiàng)目已有20多家成員加入。其中包括新的EDA和配套IP提供商以及來(lái)自各個(gè)戰(zhàn)略市場(chǎng)的芯片設(shè)計(jì)合作伙伴。

轉(zhuǎn)載來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道 作者:駱軼琪

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【駱軼琪】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞