近日,Arm宣布推出面向汽車(chē)領(lǐng)域的標(biāo)準(zhǔn)化預(yù)集成計(jì)算平臺(tái)——Zena計(jì)算子系統(tǒng) (Compute Subsystems, CSS),在AI技術(shù)的驅(qū)動(dòng)下,Zena CSS能夠顯著縮短汽車(chē)相關(guān)芯片的開(kāi)發(fā)周期,將車(chē)廠新車(chē)推向市場(chǎng)的時(shí)間提前一年。
“Zena CSS的優(yōu)勢(shì)在于,在提供更豐富計(jì)算能力的同時(shí),為合作伙伴保留足夠靈活性,助力其專(zhuān)注于加速器開(kāi)發(fā)與差異化創(chuàng)新,從而在AI時(shí)代保持競(jìng)爭(zhēng)力。”Arm汽車(chē)事業(yè)部產(chǎn)品和解決方案副總裁Suraj Gajendra在接受集微網(wǎng)等媒體采訪時(shí)表示。
高靈活性助力客戶(hù)差異化設(shè)計(jì)
在AI時(shí)代,汽車(chē)廠商保持競(jìng)爭(zhēng)力的關(guān)鍵因素之一,是在不影響安全性、能效和靈活性的前提之下,具備可擴(kuò)展的計(jì)算能力。
相較于傳統(tǒng)基于IP進(jìn)行芯片設(shè)計(jì),Zena CSS可減少多達(dá)20%的芯片工程工作量,使團(tuán)隊(duì)能夠?qū)W⒂陂_(kāi)發(fā)針對(duì) AI 定義汽車(chē)工作負(fù)載的差異化功能。此外,Zena CSS通過(guò)軟件標(biāo)準(zhǔn)化,可降低多達(dá)30%的跨平臺(tái)移植工作量,節(jié)省軟件開(kāi)發(fā)時(shí)間與成本。
以上效益能降低整體車(chē)輛平臺(tái)開(kāi)發(fā)總成本,而一致的Arm架構(gòu)則具備跨 ADAS、中央計(jì)算與 IVI 用例的擴(kuò)展能力,可適用于基于單芯片和芯粒 (chiplet) 的芯片設(shè)計(jì)。
靈活性是Zena CSS平臺(tái)的重要特征之一。
比如,該平臺(tái)通過(guò)RTL而非GDS的形式交付??紤]到每款芯片的設(shè)計(jì),包括架構(gòu)都有所不同,客戶(hù)對(duì)于架構(gòu)的需求也各有差異。如果直接通過(guò)GDS進(jìn)行產(chǎn)品交付,本質(zhì)上會(huì)在布局規(guī)劃或物理實(shí)現(xiàn)層面限制客戶(hù)的設(shè)計(jì)——Arm不希望剝奪這種靈活性,而是希望客戶(hù)能夠自主決定不同模塊的放置位置,從而實(shí)現(xiàn)芯片的設(shè)計(jì)和優(yōu)化。
通過(guò)RTL的形式交付,還能進(jìn)一步將芯片性能優(yōu)化的主動(dòng)權(quán)交由客戶(hù)掌握,從而讓其可以根據(jù)目標(biāo)市場(chǎng)的需求進(jìn)行對(duì)應(yīng)優(yōu)化設(shè)計(jì)。
“在GDS的形式下,如果Arm選定某個(gè)工藝節(jié)點(diǎn)并針對(duì)該節(jié)點(diǎn)進(jìn)行優(yōu)化設(shè)計(jì),客戶(hù)就不得不使用相同的工藝節(jié)點(diǎn),失去了選擇的自由和靈活性。然而每個(gè)客戶(hù)都會(huì)根據(jù)成本、性能等不同考量因素,自主選擇特定的代工廠并針對(duì)性地優(yōu)化設(shè)計(jì)??偟膩?lái)說(shuō),我們希望把更多的自由度留給客戶(hù),讓他們能夠根據(jù)自身需求進(jìn)行差異化設(shè)計(jì)?!盨uraj Gajendra說(shuō)。
據(jù)了解,Arm在設(shè)計(jì)Zena CSS之初還充分考慮到Chiplet對(duì)于先進(jìn)芯片的助力。Zena CSS不僅支持芯粒 (Chiplet) 架構(gòu),還提供了該架構(gòu)所需的關(guān)鍵標(biāo)準(zhǔn)接口,能支持客戶(hù)和合作伙伴基于芯粒架構(gòu)進(jìn)行設(shè)計(jì)——包括單個(gè)和多個(gè)的Zena CSS互聯(lián)。而對(duì)芯粒架構(gòu)的支持也將持續(xù)作為Arm未來(lái)計(jì)算子系統(tǒng)的產(chǎn)品路線圖中重要的設(shè)計(jì)組件。
“考慮到部分客戶(hù)的設(shè)計(jì)并不需要芯粒架構(gòu)的實(shí)現(xiàn)方案,因此Zena CSS本身并不包含UCIe接口,但具備了連接UCIe所需的標(biāo)準(zhǔn)接口。芯片廠商既可以通過(guò)添加UCIe接口,將Zena CSS 設(shè)計(jì)為獨(dú)立芯粒;也可以不使用UCIe接口,將其實(shí)現(xiàn)為單片式SoC (系統(tǒng)級(jí)芯片)。這就是我們?yōu)榭蛻?hù)賦予的產(chǎn)品設(shè)計(jì)靈活性。”Suraj Gajendra說(shuō)。
軟硬一體應(yīng)對(duì)算力需求擴(kuò)展
當(dāng)前,大模型正在加速實(shí)現(xiàn)上車(chē),圍繞大模型的創(chuàng)新應(yīng)用部署也成為車(chē)廠打造駕乘體驗(yàn)差異化,消費(fèi)者選購(gòu)汽車(chē)車(chē)型的重要因素。
這一“軟件定義汽車(chē)”的發(fā)展趨勢(shì),也是Arm一直在推動(dòng)的方向。而無(wú)論是軟件定義還是AI定義,算力仍然是重中之重。
如果說(shuō)過(guò)去傳統(tǒng)的4核、 8核甚至12核的算力配置就足以滿(mǎn)足汽車(chē)的需求。那么隨著“AI 定義汽車(chē)”的演進(jìn)——以及大語(yǔ)言模型應(yīng)用的發(fā)展,汽車(chē)需要更加強(qiáng)大的核心來(lái)應(yīng)對(duì)算力的大幅增長(zhǎng),現(xiàn)在16甚至32核的配置已經(jīng)成為普遍需求,而這也是Zena CSS可以發(fā)揮核心價(jià)值之處。
Zena CSS擁有16個(gè)基于Armv9架構(gòu)的Cortex-A720AE核心,且具備擴(kuò)展能力,即通過(guò)兩個(gè)Zena CSS的組合,實(shí)現(xiàn)32核的配置。
“我們希望通過(guò)這種集成化的高算力方案支持合作伙伴,讓車(chē)廠能在越來(lái)越多的AI應(yīng)用上車(chē)時(shí),專(zhuān)注于AI加速以及其他軟件和應(yīng)用的開(kāi)發(fā)。Arm的核心任務(wù)就是打好計(jì)算底座?!盨uraj Gajendra說(shuō)。
除了硬件底座之外,軟件、工具、庫(kù)、編譯器的能力也同樣重要。因此,近年來(lái)Arm也大力投入資源,確保計(jì)算子系統(tǒng)配備適配的AI工具、工作流和軟件庫(kù),以支持運(yùn)行最新的大語(yǔ)言模型及正在落地的新AI應(yīng)用。
在汽車(chē)業(yè)務(wù)領(lǐng)域,今年3月,Arm將KleidiAI 軟件庫(kù)擴(kuò)展到了汽車(chē)領(lǐng)域。KleidiAI 的核心作用是優(yōu)化Arm CPU上大語(yǔ)言模型的運(yùn)行性能。目前這些軟件庫(kù)已完成部署,Arm的客戶(hù)能夠借此充分發(fā)揮16核的算力優(yōu)勢(shì),在Arm CPU上運(yùn)行更高效的AI工作負(fù)載。
標(biāo)準(zhǔn)化底座與差異化空間
Zena CSS在標(biāo)準(zhǔn)化平臺(tái)的基礎(chǔ)之上,為廠商進(jìn)行留出了差異化設(shè)計(jì)區(qū)域。比如標(biāo)準(zhǔn)部分包括CPU 集群、安全島、安全飛地、調(diào)試模塊以及電源管理單元,可選部分包括圖像信號(hào)處理器ISP和圖形處理器GPU。而加速器,以及客戶(hù)與合作伙伴可能需要添加的其他定制邏輯等方面則可自行設(shè)計(jì)。
通過(guò) Arm 計(jì)算子系統(tǒng),客戶(hù)可以復(fù)用核心計(jì)算組件,借由AI加速器子系統(tǒng)的升級(jí)、I/O 的增添或是其他功能的調(diào)整,就能進(jìn)行產(chǎn)品的迭代更新。
“我們的目標(biāo)絕非消除差異化,而是希望合作伙伴保留這種差異化的能力:無(wú)論是自主研發(fā)芯片的車(chē)廠,還是開(kāi)發(fā) SoC 的傳統(tǒng)芯片合作伙伴,都能在加速器、定制邏輯,或是I/O及整體系統(tǒng)架構(gòu)的其他方面實(shí)現(xiàn)差異化的創(chuàng)新。”Suraj Gajendra說(shuō)。
也就是說(shuō),Zena CSS構(gòu)建完成了底層標(biāo)準(zhǔn)化的工作,這個(gè)工作的重要性在于,當(dāng)核心CPU功能以標(biāo)準(zhǔn)化方式實(shí)現(xiàn)時(shí),能顯著提升軟件復(fù)用率。同樣,隨著安全島的集成,安全機(jī)制與主CPU之間的交互也能實(shí)現(xiàn)標(biāo)準(zhǔn)化。因此,Arm聚焦于標(biāo)準(zhǔn)化一小部分,但卻是關(guān)鍵的元素——計(jì)算核心組件,而讓客戶(hù)專(zhuān)注于差異化設(shè)計(jì),這將有效提升開(kāi)發(fā)效率。
“當(dāng)合作伙伴進(jìn)行代際迭代時(shí),假設(shè)這一代產(chǎn)品只需400 TOPS(萬(wàn)億次每秒)的AI性能,他們采用Zena CSS并搭配自主研發(fā)的加速器,即可實(shí)現(xiàn)這一性能目標(biāo)。到了下一代,若希望 CPU基本保持不變,但將AI性能提升至800 TOPS,僅需升級(jí)加速器部分即可。如此一來(lái),在核心計(jì)算部分保持不變的前提下,一方面實(shí)現(xiàn)了代際間的標(biāo)準(zhǔn)化,另一方面又達(dá)到大量軟件復(fù)用的成效,還能獲得所需的額外AI性能。這正是我們?yōu)榭蛻?hù)提供的靈活性與性能優(yōu)化價(jià)值?!盨uraj Gajendra告訴集微網(wǎng)。
超10家合作伙伴合作接洽
過(guò)去幾年,Arm CSS成為手機(jī)、數(shù)據(jù)中心等業(yè)務(wù)主推的平臺(tái),這一創(chuàng)新業(yè)務(wù)形式,以及所帶來(lái)的性能、靈活性、安全等優(yōu)勢(shì),引發(fā)了市場(chǎng)廣泛關(guān)注。
Suraj Gajendra介紹,在過(guò)去幾個(gè)月,Arm一直在圍繞Zena CSS進(jìn)行開(kāi)發(fā)優(yōu)化,市場(chǎng)對(duì)Zena CSS的關(guān)注度和興趣也不斷提升。截至目前,全球已有包括車(chē)廠和芯片設(shè)計(jì)商在內(nèi)超過(guò)10家合作伙伴,一部分已取得了Zena CSS的技術(shù)授權(quán),另一部分則正與Arm進(jìn)行深度合作接洽。
此前,行業(yè)中也一直存在一種聲音,即CSS推出后,Arm將對(duì)以前單獨(dú)處理器授權(quán)模式不再提供支持,但在此次采訪中,Suraj Gajendra否定了這樣的說(shuō)法。
“以我們這次發(fā)布的 Zena CSS 為例,我們將IP產(chǎn)品整合為計(jì)算子系統(tǒng)的核心組成部分。這些IP產(chǎn)品同時(shí)納入我們的產(chǎn)品矩陣,供合作伙伴靈活選用。但我們堅(jiān)信,依托計(jì)算子系統(tǒng)將產(chǎn)品推向市場(chǎng)是最優(yōu)路徑,可以實(shí)現(xiàn)完整的產(chǎn)品解決方案。我們?cè)谡麄€(gè)供應(yīng)鏈中對(duì) CSS 的資源投入與關(guān)注度將持續(xù)深化。同時(shí),已發(fā)布的前幾代 IP 產(chǎn)品仍將保持供應(yīng),滿(mǎn)足客戶(hù)的多樣化需求?!?/p>