根據(jù)技術(shù)市場研究機構(gòu)Jon Peddie Research的一份新報告,中國的GPU初創(chuàng)企業(yè)數(shù)量非同尋常,因為中國試圖獲得人工智能的優(yōu)勢以及半導(dǎo)體主權(quán)。
隨著人工智能(AI)、高性能計算(HPC)和圖形處理的需求以前所未有的速度增長,近年來全球GPU制造商的數(shù)量也在增長。談到個人電腦的獨立顯卡,AMD和Nvidia保持領(lǐng)先,而英特爾正在努力追趕。
在上世紀(jì)八九十年代,全球一度有多達數(shù)十家公司在開發(fā)了顯卡和獨立圖形處理器,但為了在3D游戲中獲得最高性能而進行的殘酷競爭,其中絕大多數(shù)公司被淘汰。
到大約2010年時,只有AMD和Nvidia能夠為游戲和計算提供有競爭力的獨立GPU,而其他公司則專注于集成GPU或GPU IP。
從2015年左右開始,中國的PC GPU開發(fā)商數(shù)量開始迅速增加,這得益于中國對技術(shù)自給自足的推動,以及AI和高性能計算作為高科技大趨勢的出現(xiàn)。
根據(jù)Jon Peddie Research的數(shù)據(jù),目前總共有18家公司在開發(fā)和生產(chǎn)GPU。有兩家公司主要針對智能手機和筆記本電腦開發(fā)SoC綁定的GPU,有6家開發(fā)GPU IP,有11家GPU開發(fā)商專注于PC和數(shù)據(jù)中心的GPU,包括AMD、英特爾和英偉達。
事實上,如果在名單中加入其他中國公司,如壁仞科技和天樞智信,那么GPU企業(yè)數(shù)量將更多。不過,壁仞科技和天樞智信目前只專注于AI和高性能計算,所以JPR不認(rèn)為他們是傳統(tǒng)意義上的GPU開發(fā)商。
中國的技術(shù)救國之路:GPU開發(fā)
作為世界第二大經(jīng)濟體,中國不可避免地與美國和其他發(fā)達的國家在幾乎所有方面進行競爭。中國竭盡所能地吸引世界各地的工程師。
事實上,在中國,每年都有數(shù)百家新的IC設(shè)計公司成立。他們開發(fā)的產(chǎn)品種類繁多,從微小的傳感器到復(fù)雜的通信芯片均有涉獵,力圖實現(xiàn)對西方國家供應(yīng)商的自給自足。
但要真正跳上人工智能和高性能計算的浪潮,需要CPU、GPU和特殊用途的計算加速技術(shù)。
談到CPU,中國面臨美國在制造設(shè)備和技術(shù)上的越來越嚴(yán)密的技術(shù)封鎖,不可能很快趕上全球先進水平。然而在另一個賽道上,可以說,開發(fā)和生產(chǎn)一款像樣的GPU,比試圖造出一款有競爭力的CPU更容易出成果。
「對于中國公司來說,人工智能訓(xùn)練是自主研發(fā)GPU的主要驅(qū)動力,一方面是因為英偉達的GPU太貴了,另外也是出于對自給自足的渴望。」JPR的負(fù)責(zé)人Jon Peddie說。
GPU本質(zhì)上是并行設(shè)備,其內(nèi)部有大量的計算單元可以用于冗余,這使得GPU更容易啟動和運行,單位晶體管的成本相對較低,整體產(chǎn)量也不錯。此外,GPU的并行性質(zhì)使其更容易以擴展的方式實現(xiàn)部署。
與CPU相比,GPU在設(shè)計和制造上對制程工藝的要求沒有那么苛刻,即使目前中國最先進的芯片制造商中芯國際并沒有像臺積電那樣先進的生產(chǎn)工藝,仍然可以利用GPU性能擴展的方式實現(xiàn)足夠可觀的性能。
事實上,即使中國的GPU開發(fā)商失去了使用臺積電先進節(jié)點(N7及以下)的機會,至少他們中的一些人仍然可以在中芯國際生產(chǎn)更簡單的GPU設(shè)計,并滿足AI、HPC和部分游戲/娛樂市場的需求。
而且,從國家的角度來看,具有AI和HPC能力的GPU可能也可以說比CPU更重要,因為AI和HPC可以實現(xiàn)全新的應(yīng)用,如自動駕駛汽車和智能城市等應(yīng)用。
盡管美國政府大力限制向中國出口以超級計算機為基礎(chǔ)的CPU和GPU,但比起CPU,GPU在設(shè)計和制造上的相對較低的門檻,使得這種限制的效果遠(yuǎn)沒有CPU來的明顯 。
GPU微架構(gòu)相對容易,硬件設(shè)計卻很昂貴
不過,應(yīng)該注意的是,雖然目前有很多GPU開發(fā)商,但只有兩家能真正為PC打造有競爭力的獨立GPU。這也許是因為,開發(fā)一個GPU架構(gòu)相對容易,但要正確實現(xiàn)它并設(shè)計適當(dāng)?shù)尿?qū)動程序確實很難。
CPU和GPU微架構(gòu)基本上是「科學(xué)和藝術(shù)的交匯」。這些架構(gòu)是一組復(fù)雜的算法,開發(fā)這些架構(gòu)的團隊規(guī)模可能相當(dāng)小,但可能需要長達幾年的時間。
可以這么理解,微架構(gòu)是在餐巾紙和白板上完成的。至于成本,如果只是架構(gòu)師自己,團隊規(guī)模可以只有一個人,也許是三四個人。但是任何類型的建筑,建筑、火箭飛船、網(wǎng)絡(luò)或處理器都是一個復(fù)雜的棋局。
比如,試圖預(yù)測五年后的制造工藝和標(biāo)準(zhǔn),性價比的權(quán)衡,增加什么功能,放棄或忽略什么功能,這些都是非常棘手和耗時的工作。
架構(gòu)師們花了很多時間在頭腦中進行假設(shè),比如如果把緩存做大25%,如果有6000個FPU,是否應(yīng)該做一個PCIe 5.0 I/O總線?這么做能不能按時完成?諸如此類。
由于微架構(gòu)的開發(fā)可能需要數(shù)年時間,而且需要有才華的設(shè)計師,在這個上市時間至關(guān)重要的世界里,許多公司就干脆從Arm或Imagination Technologies等公司授權(quán)使用現(xiàn)成的微架構(gòu),或者是是經(jīng)過驗證的GPU IP。
例如,中國的芯動科技(Innosilicon)就從英國的Imagination公司授權(quán)GPU微架構(gòu)IP用于其Fantasy GPU。
還有一家中國的GPU開發(fā)商,使用了Imagination的PowerVR架構(gòu)。同時,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies獲得的GPU微架構(gòu)。
開發(fā)一個微架構(gòu)的成本可能有所不同,但與現(xiàn)代高端GPU的物理實現(xiàn)成本相比,它的開發(fā)成本相對較低。
多年來,蘋果和英特爾這兩家擁有大量工程人才的公司都依賴Img進行GPU設(shè)計。聯(lián)發(fā)科和其他小型SoC供應(yīng)商依靠Arm。高通公司在很長一段時間內(nèi)使用ATI/AMD,而三星在嘗試設(shè)計自己的圖形引擎數(shù)年后,也轉(zhuǎn)向了AMD。
最近,兩家新的中國GPU公司聘請了前AMD和英偉達的架構(gòu)師,另外兩家使用Img。進入市場的時間和學(xué)習(xí)作為一個架構(gòu)師的技能,要擔(dān)心什么,以及如何找到解決方法,是一個非常耗時的過程。
「如果你能去找一家已經(jīng)有了設(shè)計方案,并且已經(jīng)設(shè)計了很長時間的公司,可以節(jié)省大量的時間和金錢,而在市場上,時間就是一切。」
「這個過程中會有太多的問題。并非每一個由AMD或英偉達設(shè)計的GPU都能成為贏家。不過,一套好的架構(gòu)設(shè)計可以經(jīng)歷幾代的調(diào)整,慢慢進步。」研究機構(gòu)Jon Peddie Research的負(fù)責(zé)人表示。
對于新的生產(chǎn)制程來說,硬件實現(xiàn)和軟件開發(fā)的成本太高了。據(jù)《國際商業(yè)時報》估計,使用5nm級技術(shù)制造的設(shè)備,其設(shè)計成本超過5.4億美元。如果制程為3nm,設(shè)計成本還將增加3倍。
「如果將布局和平面圖、模擬、驗證和驅(qū)動程序全部考慮在內(nèi),GPU開發(fā)的成本和時間就會激增。」Peddie解釋說。
「硬件設(shè)計和布局是非常直接的:如果弄錯一條線,可能要花幾個月的時間來查錯。」
目前,世界上只有少數(shù)幾家公司能夠開發(fā)出具有AMD和英偉達級別的現(xiàn)代游戲或計算用GPU(460億-800億個晶體管規(guī)模)芯片。
不過,前不久中國的壁仞科技發(fā)布的BR104和BR100也達到了幾乎類似的水平。(據(jù)猜測,BR104包含大約385億個晶體管)。
目前,全球11個PC/數(shù)據(jù)中心GPU設(shè)計供應(yīng)商中的8個來自中國,這本身就說明了問題。
也許在不久的將來,除了美國公司,我們不會看到有競爭力的獨立游戲GPU。中國是否能推出有競爭力的競爭對手,目前還有待觀察。