9月10日-12日,第二十六屆中國國際光電博覽會(CIOE中國光博會)在深圳會展中心舉辦。10日下午,端側(cè)AI芯片新架構(gòu)與新應(yīng)用主題研討會順利舉辦,會上,匯聚了來自芯片設(shè)計、終端制造、行業(yè)應(yīng)用等領(lǐng)域的專家學(xué)者與企業(yè)代表,通過深度交流,共同探討端側(cè)AI芯片在架構(gòu)設(shè)計上的技術(shù)革新方向,挖掘新架構(gòu)賦能下的消費電子、智能制造、智慧醫(yī)療等場景新機遇。
AI高度適配 EDA 全流程設(shè)計邏輯
華大九天高級解決方案總監(jiān)楊祖聲在《EDA呼喚行業(yè)大模型智能系統(tǒng)》演講分享中,深入剖析了 AI 與 EDA 融合的國內(nèi)外發(fā)展差距。
從應(yīng)用現(xiàn)狀來看,國際頭部企業(yè)如 Synopsys、Cadence 憑借完整的 EDA 工具鏈,通過強化學(xué)習(xí)驅(qū)動設(shè)計迭代優(yōu)化,借助大模型打造工作流助手,實現(xiàn) “輸入設(shè)計需求后自動生成 GDS 文件” 的全自動化目標;而國內(nèi)受限于工具鏈不完善,仍停留在點工具應(yīng)用階段,僅華大九天在模擬芯片領(lǐng)域具備全流程工具能力,數(shù)字芯片和制造 EDA 領(lǐng)域仍需補鏈,存在技術(shù)落后的風(fēng)險。
他特別強調(diào),強化學(xué)習(xí)因具備迭代優(yōu)化特性,非常適配 EDA 全流程設(shè)計邏輯,學(xué)術(shù)界已在器件提參、模擬芯片綜合等環(huán)節(jié)驗證了其價值,未來有望逐步減少人工參與,甚至實現(xiàn)無人化設(shè)計。
楊祖聲闡釋, AI 對 EDA 領(lǐng)域的核心價值是 “學(xué)習(xí)” 與 “連接”。“學(xué)習(xí)” 體現(xiàn)在神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)仿真數(shù)據(jù),大幅提升效率;而“連接” 則體現(xiàn)在強化學(xué)習(xí)能串聯(lián)多個點工具,大模型可生成設(shè)計腳本并調(diào)用 API 接口,實現(xiàn)全流程協(xié)同。
楊祖聲認為,未來 AI+EDA 的理想形態(tài)是以大模型為統(tǒng)一入口,打通各工具模塊,像 ChatGPT 生成工作流程那樣,自動整合點工具形成解決方案,因此需要從點工具、大模型、全流程串聯(lián)等多層面發(fā)展應(yīng)用,構(gòu)建完整生態(tài)。
高效協(xié)同,實現(xiàn)模型部署到芯片
華大九天作為國內(nèi) EDA 領(lǐng)域的龍頭企業(yè),其核心價值在于為芯片設(shè)計提供全流程工具支撐,這些工具直接賦能芯片企業(yè)的研發(fā)效率與集成度。而蘇州國芯科技正是這一技術(shù)支撐的直接受益者與實踐者,其聚焦于終端芯片的研發(fā),產(chǎn)品能夠?qū)崿F(xiàn)端側(cè)數(shù)據(jù)的本地采集、推理與輸出。
會上,蘇州國芯科技股份有限公司技術(shù)經(jīng)理孫磊在會上發(fā)表《國芯科技AI MCU CCR4001S芯片與應(yīng)用介紹》詳盡介紹了蘇州國芯科技及其 AI MCU 芯片 CCR4001S 的相關(guān)情況。
蘇州國芯成立于 ,2001 年,2023 年科創(chuàng)板上市,初期聚焦 CPU 國產(chǎn)化設(shè)計,類似 ARM 的 IP 授權(quán)模式,后發(fā)展自有知識產(chǎn)權(quán)芯片,業(yè)務(wù)涵蓋 IP 授權(quán)、自主芯片研發(fā)及定制芯片,在信息安全領(lǐng)域根基深厚,近年發(fā)力汽車電子,累計出貨超 1200 萬顆,客戶包括比亞迪等車企、工業(yè)控制等領(lǐng)域,擁有 M*Core、RISC-V、PowerPC 三大指令集,可提供定制設(shè)計服務(wù)。
作為面向端側(cè)的 AI MCU 芯片,CCR4001S 基于自研 RISC-V 核(CRV4H 核),主頻 230MHz,配備 32K ICache 和 32K DCache,用于運行芯片主程序。芯片集成 DDR 和 SIP FLASH 作為 NPU 的 “顯存”,不同規(guī)模的 AI 模型可直接在 DDR 中運行并由 NPU 調(diào)用,通過總線實現(xiàn)高效協(xié)同。
為降低客戶部署門檻,國芯提供完整的技術(shù)支持體系:一是編譯工具鏈,包括自研 IDE、支持 RISC-V 的第三方編譯器及調(diào)試器,可實現(xiàn)云端訓(xùn)練模型到芯片端的轉(zhuǎn)化與部署;二是兼容主流 AI 框架,如 DNCNN、ESPCN、YOLOv5 等,NPU 支持絕大多數(shù)網(wǎng)絡(luò)部署,且可定制算子以適配新模型;三是硬件參考設(shè)計、開發(fā)筆記、芯片手冊及 Demo 案例,搭配 Discovery 套件,助力客戶快速評估模型性能與應(yīng)用場景。
孫磊表示,“相對于傳統(tǒng)的嵌入式所沒有的工具鏈,因為我們要實現(xiàn)服務(wù)器端或者說平臺上訓(xùn)練好的模型部署到芯片內(nèi)。訓(xùn)練模型可以通過這套工具把它轉(zhuǎn)化成形,通過編譯調(diào)用芯片NPU內(nèi)部的存儲單元、加速單元,實現(xiàn)模型從訓(xùn)練端到真正芯片端部署的整個流程”。
目前,國芯的 AI MCU 芯片憑借自主指令集、高集成度及靈活適配性,在端側(cè) AI 輕量化場景中展現(xiàn)出顯著優(yōu)勢,為消費電子、工業(yè)控制、汽車電子等領(lǐng)域提供了高效且安全的解決方案。
ASIC芯片制造缺乏協(xié)同,加速產(chǎn)能布局
AI 發(fā)展依賴算力、算法、數(shù)據(jù),其中傳感器是數(shù)據(jù)采集的核心,尤其在機器人、汽車等智能設(shè)備中,需實現(xiàn)動態(tài)感知與實時反饋。廣州增芯科技有限公司副總經(jīng)理彭坤帶來《AI驅(qū)動的智能傳感器產(chǎn)業(yè)升級及傳感器制造技術(shù)》的主題演講。
彭坤首先指出,隨著 AI 技術(shù)的推進,像特斯拉機器人等場景對傳感器的響應(yīng)速度和協(xié)同能力提出了極高要求,傳統(tǒng)傳感器與信號處理芯片分離封裝的模式存在幾十毫秒級延遲,難以滿足需求,因此智能傳感器向 “感存算一體化” 升級成為必然,需將感知、處理、運算、存儲等功能集成于一體。
接著,他分析了傳感器產(chǎn)業(yè)的瓶頸與市場現(xiàn)狀。目前行業(yè)存在 “各環(huán)節(jié)割裂” 的問題,MEMS 傳感器代工與 ASIC 芯片制造缺乏協(xié)同,導(dǎo)致設(shè)計公司試錯成本高;國內(nèi)智能傳感器市場雖達千億級,但國產(chǎn)化率極低,如電動車傳感器國內(nèi)生產(chǎn)比例不足 1%,核心制造能力亟待突破。同時,傳感器正朝著智能化、微型化、仿生化方向發(fā)展,智能度越高的設(shè)備,傳感器占比越大。
針對這些痛點,彭坤介紹了廣州增芯科技的解決方案:在廣州增城建成國內(nèi)首條、唯一的 12 英寸 MEMS+ASIC 協(xié)同制造產(chǎn)線,實現(xiàn)傳感器與配套芯片的 “設(shè)計 - 制造 - 封裝” 一條龍服務(wù)。該全自動化產(chǎn)線 18 個月建成,支持 22 納米及以上工藝節(jié)點,可將 MEMS 傳感器與 ASIC 芯片在同一晶圓上集成或堆疊,大幅降低延遲、提升帶寬,還能提供犧牲層技術(shù)、深硅刻蝕等 MEMS 標準工藝,結(jié)合先進 CMOS 工藝滿足多元需求。
最后,他提到公司的產(chǎn)品規(guī)劃與合作模式。增芯科技將重點布局壓力傳感器、紅外傳感器等,計劃明年推出集成紅外感知與 ASIC 處理的芯片,目前已有 1 款產(chǎn)品量產(chǎn)、8 款在研;集團可投資突破卡脖子技術(shù)的項目,但專注代工不涉足終端市場,旨在通過 12 英寸協(xié)同制造平臺推動智能傳感器國產(chǎn)化與性能升級,助力 AI 時代產(chǎn)業(yè)發(fā)展。
從底層自主研發(fā),堅定國產(chǎn)自主可控 AI 生態(tài)建設(shè)
傳感器這種硬件革新為邊緣 AI 的落地提供了 “數(shù)據(jù)入口” 的支撐,而邊緣 AI 的進一步實現(xiàn),則需要算力芯片對傳感器采集的數(shù)據(jù)進行高效推理處理。邊緣 AI 推理芯片頭部玩家云天勵飛,以 “算力積木” 架構(gòu)為核心,通過 Chiplet 技術(shù)實現(xiàn)靈活算力配置,滿足端側(cè)、邊側(cè)不同場景的推理需求。
云天勵飛市場總監(jiān)張衡《從芯出發(fā),智聯(lián)邊緣》的主題演講分享了人工智能的發(fā)展態(tài)勢,指出 AI 領(lǐng)域遵循 “百天新摩爾定律”,即 100 天內(nèi)相同模型參數(shù)性能提升一倍或相同性能對算力需求減半,技術(shù)革新頻繁。2025 年國內(nèi) DeepSeek 開源大模型的出現(xiàn)具有里程碑意義,如同 2022 年的 ChatGPT,推動了 AI 推理應(yīng)用在邊緣端的大規(guī)模落地,使邊緣 AI 市場成為大廠競爭焦點,而端邊云協(xié)同是降低成本、滿足低延遲與隱私保護需求的關(guān)鍵。
隨后,他分析了邊緣 AI 的痛點與大模型帶來的改變。邊緣場景的碎片化導(dǎo)致需求分散,傳統(tǒng)模式下算法廠商需深度介入項目,成本高、效率低。而大模型的出現(xiàn)有效解決了這一問題:CV 大模型憑借強大的圖像理解與場景泛化能力,減少了對細分場景的依賴;大語言模型具備博士級的語言交互與場景理解能力,能應(yīng)對復(fù)雜邊緣場景。開源大模型更重構(gòu)了產(chǎn)業(yè)生態(tài),讓基礎(chǔ)工程師通過調(diào)參即可實現(xiàn)產(chǎn)品化,推動邊緣 AI 應(yīng)用爆發(fā)。
當前,云天勵飛深耕邊緣 AI 推理芯片,堅持自主可控,從底層指令級微架構(gòu)自主研發(fā),已完成 5 代神經(jīng)網(wǎng)絡(luò)處理器的迭代商用,支持從 CNN 到 Transformer 的計算范式演進。目前第四代產(chǎn)品已商用,第五代Nova 500預(yù)計明年推出,始終緊跟大模型計算架構(gòu)的發(fā)展。
在技術(shù)創(chuàng)新方面,云天勵飛提出 “算力積木” 架構(gòu),通過 Chiplet 片內(nèi)高速互聯(lián)與片間 C2C 互聯(lián),實現(xiàn)單次流片即可靈活堆疊出多算力芯片,滿足不同場景需求。例如,Edge 10 系列可支持 1.5-3B 模型部署,Edge 10Max 算力為其 4 倍,支持 14B 模型及多模型并行計算,Edge 200 則可滿足 DeepSeek 大模型單機推理需求。這些芯片全鏈路國產(chǎn)化,獲國產(chǎn)化 C 級認證,保障自主可控。
在應(yīng)用場景與未來規(guī)劃上,張衡表示公司芯片已應(yīng)用于端側(cè)機器人、邊側(cè)推理盒子、服務(wù)端大模型部署等場景。下一代產(chǎn)品將圍繞 “算力積木 1.0” 升級,提升算力功耗比、降低成本,邊緣側(cè)目標算力 256T-1024T,云端側(cè) 512T-2048T,以滿足更廣泛的智能應(yīng)用需求,堅定推動國產(chǎn)自主可控 AI 生態(tài)建設(shè)。
依托存儲和網(wǎng)絡(luò)設(shè)備積淀,降低 AI 應(yīng)用門檻
AGI 時代來臨,云端模型規(guī)模擴大與端側(cè)智能升級并行,MoE 架構(gòu)推動大模型成本下降,但對運行效率提出更高要求,第三方部署性能與官方存在顯著差距,凸顯模型推理優(yōu)化的技術(shù)斷層。
隨著 AGI 臨近,云端模型規(guī)模擴大、端側(cè)模型愈發(fā)智能,端側(cè)應(yīng)用迎來爆發(fā)趨勢,MoE 架構(gòu),如 DeepSeek R1將推動大模型單個成本大幅下降,為行業(yè)發(fā)展帶來新機遇。但 MoE 新架構(gòu)對模型運行提出嚴峻挑戰(zhàn),存在顯著的推理優(yōu)化技術(shù)斷層(如 DeepSeek R1 官方部署性能與第三方差距懸殊),成為行業(yè)普及的重要障礙。
深圳市銓興科技有限公司王瑜琨表示,銓興科技推出技術(shù)創(chuàng)新與解決方案。公司依托存儲和網(wǎng)絡(luò)設(shè)備積淀,推出銓興添翼 AI Link 超微顯存融合技術(shù)及 AI Link 算法平臺,可將模型訓(xùn)練成本降低 90% 以上,單盤推理并發(fā)性能提升 50% 以上,且兼容英偉達及純國產(chǎn)芯片。該技術(shù)能大幅擴展顯存,單臺服務(wù)器顯存從 1TB 擴展至 8TB,支持從 PC 級 14-32B 模型到云端 32 臺 H200 服務(wù)器等不同規(guī)模模型的訓(xùn)推需求并實現(xiàn)的高性能部署,通過自研訓(xùn)推框架保障快速適配與最優(yōu)性能。
據(jù)了解,銓興科技已經(jīng)構(gòu)建 MaaS 平臺及訓(xùn)推一體硬件系列,推出開箱即用的解決方案,已在醫(yī)療、政務(wù)、法務(wù)、高校等垂域?qū)崿F(xiàn)落地。與浪潮、聯(lián)想、DeepSeek 等企業(yè)深度合作,推出訓(xùn)推一體機、AI Fusion 解決方案等,將高規(guī)格模型訓(xùn)推能力下沉至 PC 端,并計劃未來推出萬元級 200B、1000B AI PC。
未來,銓興科技核心目標是通過技術(shù)創(chuàng)新和生態(tài)合作,降低 AI 應(yīng)用門檻,讓大模型成本下降 90% 以上,實現(xiàn)從垂域場景到千家萬戶的普及。
軟件商業(yè)轉(zhuǎn)化,AI能力落地交付客戶
AI研發(fā)成本高昂,其價值必須通過規(guī)?;瘧?yīng)用來兌現(xiàn)。軟件應(yīng)用,特別是SaaS模式,是實現(xiàn)AI能力標準化、復(fù)制化和規(guī)?;职l(fā)的最佳載體。企業(yè)通過訂閱和使用軟件服務(wù)來獲得AI帶來的降本增效,而AI企業(yè)則通過軟件實現(xiàn)了技術(shù)的商業(yè)轉(zhuǎn)化。
萬興科技通過其軟件矩陣,將AI能力交付給全球數(shù)億用戶和眾多企業(yè)客戶,正是這一路徑的典型體現(xiàn)。線下營銷中心總經(jīng)理唐芳鑫認為,半導(dǎo)體行業(yè)復(fù)雜度高、鏈路長、溝通協(xié)作密集、試錯成本高,設(shè)計階段耗時超 60%,大量時間用于文檔撰寫與溝通,且存在文檔不規(guī)范、工具不統(tǒng)一等問題,導(dǎo)致效率低、成本增加,設(shè)計文檔的文 + 圖缺乏規(guī)范是低效的關(guān)鍵。
萬興科技從概念到設(shè)計、項目管理到文檔存儲的一體化方案。腦圖工具支持多文件解析、兩萬節(jié)點等,助力立項研發(fā);圖示工具含專業(yè)符號、兼容多系統(tǒng)等,解決配圖問題;還有項目管理和 PDF 工具,全流程提升效率。能實現(xiàn)研發(fā)提效,簡化復(fù)雜場景;讓文檔規(guī)范化,便于查閱;促進溝通提效,利于跨部門協(xié)作,還提供 AI 私有化方案保障安全,大幅降低企業(yè)成本,已有眾多行業(yè)案例驗證效果。
除辦公工具,萬興還有萬興喵影等 AI 內(nèi)容創(chuàng)作工具,形成 “工具 + 內(nèi)容 + 社區(qū)” 生態(tài),與微軟、華為等企業(yè)深度合作,適配多種系統(tǒng),在多行業(yè)解決問題,助力企業(yè)降本增效。
依托長三角產(chǎn)業(yè)集群優(yōu)勢,海門成企業(yè)布局優(yōu)選之地
最后,南通市海門區(qū)副區(qū)長王一兵帶來《AI上海門·智創(chuàng)未來》向來賓推介了南通這座兼具區(qū)位優(yōu)勢與產(chǎn)業(yè)活力的城市,為企業(yè)發(fā)展提供了全新選擇。
海門地處長江以北,隸屬南通,總面積 1149 平方公里,人口 100 萬,是江蘇長江以北首個小康達標市,也是首個 GDP 突破千億元的縣市,綜合實力穩(wěn)居全國第 17 位、江蘇第 5 位,素有 “科技之鄉(xiāng)”“教育之鄉(xiāng)”“紡織之鄉(xiāng)”“平安之鄉(xiāng)” 的美譽。
海門最鮮明的優(yōu)勢在于 “靠江靠??可虾!保簱碛?25 公里海岸線與 61 公里長江岸線,距上海直線距離僅 60 公里,8 座過江通道構(gòu)成 “八龍過江” 格局,海太隧道 8 分鐘即可跨江連接蘇州;南通至上海高鐵僅需 26 分鐘,時空距離持續(xù)縮短。更值得關(guān)注的是,國家戰(zhàn)略布局的上海第三機場落子海門,由上海機場集團與南通機場集團合資建設(shè),與浦東、虹橋機場共用編碼,將成為國際航班主場,預(yù)計明年春季開工,三年建成。
在人工智能領(lǐng)域,海門依托長三角產(chǎn)業(yè)集群優(yōu)勢 —— 周邊 200 公里內(nèi)集聚 1200 余家 AI 核心企業(yè),產(chǎn)值超 1500 億,全球前 100 強 AI 企業(yè)超 30 家在上海設(shè)總部或研發(fā)中心 —— 自身已形成 39 家機器人相關(guān)企業(yè)集群,南通振康機器打破日本技術(shù)壟斷,諾博特、科美自動化等企業(yè)表現(xiàn)突出。江蘇省最大算力中心(獲國家發(fā)改委批文)、大數(shù)據(jù)集團,以及工信部機器人產(chǎn)業(yè)化平臺、上海機器人產(chǎn)業(yè)研究院江蘇唯一分支機構(gòu)等,為產(chǎn)業(yè)升級提供硬核支撐。武漢大學(xué)集成電路研究中心、羅普特海洋人工智能研究院等科研平臺,則持續(xù)注入創(chuàng)新動能。
從區(qū)位紅利到產(chǎn)業(yè)實力,從政策保障到生活配套,海門正以長三角北翼的獨特魅力,成為企業(yè)布局未來的優(yōu)選之地。