誰能替代英偉達?

彭新2024-02-26 17:37

“我們離倒閉永遠只有30天。”這是英偉達創(chuàng)始人黃仁勛的口頭禪。

這話從英偉達老板口中說出頗為古怪,因為這家公司作為游戲和人工智能芯片的領(lǐng)頭羊,已經(jīng)擁有對手難以比及的豐厚利潤。但曾經(jīng),英偉達的確面臨過資金耗盡、瀕臨破產(chǎn)的窘境。

始于2022年底的AI熱潮讓這家憂患意識強烈的公司獲益良多,推動著英偉達營收和利潤繼續(xù)狂飆:上一個財務(wù)季度,英偉達總營收221億美元,同比增長265%,環(huán)比增長22%,凈利潤123億美元,同比增長769%。剛剛過去一個財年中,英偉達的營收達到609億美元,同比增長126%,凈利潤298億美元,比上一年增長了581%。

2月23日,英偉達市值暴漲,并短暫突破了2萬億美元,成為全球市值第三大上市公司和最有價值的芯片公司,令曾是全球最強芯片公司的英特爾也難望其項背。

“幾乎完美”的商業(yè)模式

英偉達曾少有人知,過去它發(fā)明了GPU(圖形處理器),支撐了游戲產(chǎn)業(yè)蓬勃發(fā)展,且一度在加密貨幣“挖礦”中大賺了一筆。

隨著AI熱潮來臨,其業(yè)務(wù)再次大幅提振。如今,英偉達控制著AI加速計算80%以上的份額,它還挖了一條又寬又深的“護城河”來維持自己的優(yōu)勢,其成功令人眼紅。

具體來說,為游戲而生的GPU擅長處理圖像、科學(xué)計算等用途,天然適合需要同時處理大量數(shù)據(jù)的AI計算等場景。

20年前,英偉達還開始投資能夠?qū)PU進行編程和微調(diào)的基礎(chǔ)軟件層CUDA,來降低用GPU處理數(shù)據(jù)的復(fù)雜程度,構(gòu)建起生態(tài),但CUDA僅為英偉達專有,這意味著開發(fā)者不能自由對其進行調(diào)整。

通過收購,英偉達還具備了在服務(wù)器集群數(shù)據(jù)傳輸所需的網(wǎng)絡(luò)連接能力,這正是目前訓(xùn)練AI模型所必須的互聯(lián)技術(shù)。如此經(jīng)過十多年發(fā)展,英偉達GPU已成為一種AI基礎(chǔ)設(shè)施。

此外,作為芯片設(shè)計公司,英偉達還將芯片制造等工作外包給臺積電、三星等外部芯片代工廠,將半導(dǎo)體產(chǎn)業(yè)分工合作模式發(fā)揮到極致——永遠使用最有競爭力的芯片制造工藝,意味著英偉達不會犯下英特爾長期難以兌現(xiàn)芯片制造技術(shù)更新承諾的大錯。

最終,英偉達提供了最好的芯片、最好的網(wǎng)絡(luò)技術(shù)以及最好的軟件。黃仁勛曾表示,AI系統(tǒng)最重要的不是硬件組件的成本,而是訓(xùn)練和運行AI應(yīng)用的費用。從這一點來衡量,黃仁勛認為,英偉達在性價比方面沒有對手。

從商業(yè)上來看,英偉達當(dāng)前的模式幾乎無可挑剔,GPU行業(yè)早已經(jīng)歷過創(chuàng)業(yè)潮到巨頭獨大的轉(zhuǎn)變,僅剩下英偉達和AMD兩家公司。隨著半導(dǎo)體的發(fā)展日新月異,技術(shù)與資本門檻不斷上升,相比英偉達將用于將繪制游戲畫面的技術(shù)平移到AI計算,讓外界從零做起、挑戰(zhàn)英偉達的努力困難重重。

但英偉達在AI計算的“壟斷”的現(xiàn)狀難以令人滿意,競爭對手在竭力打破英偉達的統(tǒng)治地位,客戶也需要第二個AI芯片供應(yīng)源。盡管英偉達的GPU有很多優(yōu)點,不過它在用于AI時它可能耗電量太高且編程復(fù)雜。從創(chuàng)業(yè)公司到其他芯片制造商和科技巨頭,英偉達的競爭對手層出不窮。

奮起直追的芯片巨頭

老牌芯片廠商AMD被視為與英偉達水平最接近的同行。

作為英偉達在游戲芯片的長期競爭對手,AMD也擁有自己的AI處理器產(chǎn)品,并與渴求算力的數(shù)據(jù)中心運營商建立了長期合作關(guān)系。

過去,AMD一直在進行其新一代AI戰(zhàn)略規(guī)劃,包括并購和部門重組等,但生成式AI的橫空出世導(dǎo)致該公司產(chǎn)品陣容進一步擴充:去年12月發(fā)布的MI300芯片專門面向復(fù)雜的AI大模型,配置了1530億個晶體管、192GB的內(nèi)存、每秒5.3TB的內(nèi)存帶寬,分別是英偉達最強AI芯片H100的大約2倍、2.4倍和1.6倍。

在軟件上,AMD希望通過將自己的ROCm軟件開源、并且提供更便捷的遷移工具。他們將CUDA應(yīng)用“翻譯”成MI300可以運行的代碼,試圖將英偉達的客戶吸引過來。

相比英偉達,AMD在云端AI芯片市場幾乎從“零”起步,意味著其AI芯片業(yè)務(wù)增速會相當(dāng)快。大型客戶也樂于嘗試AMD的芯片,開發(fā)了ChatGPT的OpenAI就表示,將使用MI300進行部分模型訓(xùn)練。上一個季度,MI300推動AMD數(shù)據(jù)中心GPU總收入超過4億美元,成為公司有史以來收入上漲最快的產(chǎn)品。

AMD CEO蘇姿豐預(yù)計,到2027年,AI芯片的全球銷售額將達到4000億美元,遠高于去年的約400億美元,這意味著AMD需要從中贏得部分市場。有分析師估計,隨著時間的推移,AMD在AI芯片領(lǐng)域的市場份額可能達到20%。

英特爾也不愿意在AI芯片中落后,開始重整旗鼓。

過去一年里,英特爾針對生成式AI只可以在英偉達芯片上運行的說法進行了回擊,大張旗鼓宣傳了其Gaudi 2芯片在第三方測試的表現(xiàn),并宣稱客戶有了擺脫封閉芯片生態(tài)的新選擇。

與英偉達最新的H100相比,英特爾最先進的量產(chǎn)AI加速芯片Gaudi 2在性能上落于下風(fēng),估計每顆H100性能領(lǐng)先Gaudi 2約3.6倍。不過,英特爾認為,Gaudi 2成本更低,其價格優(yōu)勢可以縮小與H100的性價比差距。此外,英特爾也具備和英偉達對應(yīng)的網(wǎng)絡(luò)技術(shù)和類似CUDA的軟件。

目前,英特爾正在調(diào)整GPU策略,以便在云端AI側(cè)追趕英偉達。去年,英特爾宣布,將整合現(xiàn)有的Habana Labs、數(shù)據(jù)中心GPU兩大部門,于2025年推出新平臺“Falcon Shores”,來一步增強AI芯片設(shè)計能力。

AMD和英特爾近年來一直在進行收購活動,以增強其AI產(chǎn)品。

2022年,AMD斥資350億美元收購了可編程芯片公司賽靈思,賽靈思所設(shè)計的芯片在制造后可以重新編程,并能用于AI計算。英特爾在2019年以約20億美元收購了以色列AI初創(chuàng)公司Habana Labs,目前英特爾設(shè)計的AI芯片主要就來自Habana Labs部門。

另走蹊徑的初創(chuàng)公司

如果完全按照商業(yè)競爭,曾經(jīng)歷過大浪淘沙的GPU可能沒有新公司的立足之地,也有一批創(chuàng)業(yè)公司另辟蹊徑,設(shè)法制造比英偉達的GPU更適合AI的芯片。

這些公司選擇的是使用AISC(專用集成電路)架構(gòu),進入云端AI計算場景。

ASIC的設(shè)計思路是把一些算法固定到硬件上,使得芯片復(fù)雜度和開發(fā)難度更低、針對特定任務(wù)的效率更高,但通用性和靈活度不如GPU。在基于AISC架構(gòu)的初創(chuàng)公司中,Cerebras、Groq和Graphcore是其中代表,在中國,則有寒武紀、燧原、比特大陸等。

這些芯片有著眼花繚亂的名字。如最近一竄而紅的Groq,推出了名為LPU(Language Processing Unit,語言處理器)芯片產(chǎn)品,用于大模型推理。根據(jù)Groq提供的測試表現(xiàn)和宣傳,由Groq LPU驅(qū)動的AI問答機器人,提供了遠快于ChatGPT(由GPU驅(qū)動)的回答速度。

不過,外界發(fā)現(xiàn),Groq LPU目前的配置帶來的優(yōu)勢并不明顯。首先,LPU目前僅可以用于推理,不支持大模型訓(xùn)練。如果AI公司需要訓(xùn)練大模型,仍需購買英偉達GPU。此外,LPU使用了一種昂貴且低容量的特殊存儲芯片,使它的成本不具備優(yōu)勢。

阿里巴巴原首席AI科學(xué)家賈揚清就認為,以運行Llama-2 70b模型為例,由于存儲芯片容量的限制,需要用到的Groq LPU數(shù)量遠遠大于H100,這意味著在同等數(shù)據(jù)吞吐量下,Groq的硬件成本是H100的40倍,能耗成本達到10倍。

然而,初創(chuàng)芯片公司向英偉達發(fā)起的競爭絕非一帆風(fēng)順。在英偉達強大的市場統(tǒng)治力下,高昂的運營成本和未知的商業(yè)前景擠壓,都會讓它們很大可能陷入困境。

被稱為“英國英偉達”的初創(chuàng)公司Graphcore即是如此。

Graphcore推出了名為IPU(Intelligence Process Unit,智能處理器)的AI芯片,瞄準(zhǔn)了英偉達作為競爭對手。此前Graphcore在向外界提供的演示中顯示,在一部分由Graphcore IPU驅(qū)動的人工智能模型中,AI問答機器人的回答提供了類似“刷屏”的速度效果,具備一定競爭力。

盡管如此,客戶仍傾向于購買英偉達GPU,難以為Graphcore IPU買單。

這導(dǎo)致這家公司即使在去年的人工智能浪潮下也難以打開更大市場,獲得盈利。Graphcore去年十月份發(fā)布的2022年財務(wù)報告顯示,稅前虧損在同比增長了11%,達到了1.61億英鎊。據(jù)媒體報道,Graphcore正在與大型科技公司進行談判,尋求出售。

長遠來看,初創(chuàng)芯片企業(yè)最大的挑戰(zhàn),還是要建立一個能夠匹敵英偉達的軟件生態(tài)。這一方面,希望擺脫英偉達限制的大型科技企業(yè)們可能更有機會。

隨著早期AI熱潮逐漸消散和巨頭公司加入競爭,風(fēng)險投資涌向初創(chuàng)AI芯片公司的熱情正在消散,初創(chuàng)公司在AI芯片的機會也逐漸渺茫。

更大的威脅

事實上,對于英偉達來說,更大的威脅或許來自自己最大的那批客戶。

亞馬遜、谷歌、微軟以及Meta的數(shù)據(jù)中心都在使用英偉達的產(chǎn)品,并且采購量巨大。這些公司的高管都在最近的財報電話會議上告訴投資者,計劃在今年增加資本支出,直接用于購買英偉達的AI芯片。

在全球云市場上,亞馬遜AWS、微軟Azure和谷歌云占據(jù)了大部分市場。根據(jù)市場調(diào)研機構(gòu)Synergy Research Group的數(shù)據(jù),2023年四季度,全球企業(yè)在云上的花費同比增長近20%,至740億美元,其中AWS、Azure和谷歌云三家廠商的市場份額分別為31%、24%和11%。

這些財大氣粗的科技公司有能力為它們的數(shù)據(jù)中心設(shè)計自己的AI芯片,事實上,他們也如此做了。

如谷歌2016年最早推出了TPU(Tensor Processing Unit,張量處理器),專門針對AI計算做優(yōu)化,目前已經(jīng)推出至第五代。現(xiàn)在,借助自家最先進的AI模型Gemini和開放AI模型Gemma針對TPU的優(yōu)化,谷歌正試圖向外推廣TPU。

全球市占率第一的云計算公司亞馬遜AWS也自2018起陸續(xù)推出了Trainium和Inferentia兩個系列AI芯片,分別用于AI訓(xùn)練和推理,并推出了配套的軟件工具Neuron。同時,AWS在云端打造了一套自己開發(fā)的網(wǎng)絡(luò)、存儲和計算系統(tǒng),一部分取代了英偉達的AI系統(tǒng)。

微軟也加入其中。去年11月,微軟在自家技術(shù)大會期間發(fā)布了自己開發(fā)的云端AI訓(xùn)練和推理芯片Maia 100,Maia 100采用5納米制程,擁有1050億個晶體管,微軟稱該芯片專為微軟云定制設(shè)計, 最大化利用微軟云的硬件效能,滿足GPT等大模型AI計算需求。

這些大型科技公司推出的新的芯片表明,它們有能力在半導(dǎo)體硬件上與英偉達一較高下,甚至匹配自身情況設(shè)計最合適的AI芯片。

不過,在當(dāng)前科技公司生成式AI軍備競賽下,自家芯片并不完善的生態(tài)和較少的產(chǎn)量難以大規(guī)模替代英偉達芯片,甚至缺乏足夠的GPU也是致命的。所以,盡管科技巨頭都在下大力氣設(shè)計自己的硬件,但在一段時間內(nèi),它們?nèi)詴蕾囉ミ_。


來源:界面新聞

作者:彭新

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【彭新】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點和構(gòu)成投資等建議