亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

DeepSeek揭示中國下一代AI芯片! 「這些」公司可能成為供應(yīng)商

來源:鉅亨網(wǎng) #DeepSeek#
2.5w

近日,中國人工智能(AI)公司DeepSeek 在微信上發(fā)布神秘信息,暗示中國下一代AI 芯片即將問世,此消息一出立即在半導(dǎo)體業(yè)界引發(fā)廣泛猜測與熱議。

DeepSeek 僅以一句話點燃網(wǎng)絡(luò)討論,市場開始揣測究竟是哪家AI 芯片供應(yīng)商會率先推出突破性產(chǎn)品。與此同時,美國的科技限制仍在持續(xù)影響中國半導(dǎo)體產(chǎn)業(yè)。

其中,被點名的潛在廠商包括華為、寒武紀、摩爾線程、海光信息及沐曦集成電路。

DeepSeek 在周四(21 日)的貼文中指出,其V3.1 AI 模型的UE8M0 FP8 scale「專門為即將發(fā)布的國產(chǎn)芯片而設(shè)計」,但未透露具體供應(yīng)商。

市場普遍猜測,新模型可能支持多款中國AI 芯片,而不僅局限于單一品牌。

DeepSeek  UE8M0 FP8 技術(shù)細節(jié)與優(yōu)勢

FP8(8 位浮點格式)透過降低精度、減少存儲器與帶寬占用,能加速AI 訓(xùn)練與推理;而UE8M0 則是另一種8 位格式,可將存儲器使用降低多達75%,提高訓(xùn)練效率并減少硬件需求。

該架構(gòu)專為中國芯片硬件邏輯設(shè)計,使模型能順暢運行在國產(chǎn)硬件上,目前支持FP8 的中國設(shè)計芯片包括華為海思半導(dǎo)體、寒武紀、沐曦與摩爾線程產(chǎn)品。

技術(shù)細節(jié):

UE8M0 含義:

U:無符號(Unsigned),適用于啟動值通常非負的場景。

E8M0:8 位全部用于指數(shù)(Exponent),尾數(shù)(Mantissa)為0,透過隱式歸一化或動態(tài)尾數(shù)調(diào)整實現(xiàn)靈活性。

動態(tài)尾數(shù)策略:在實際實作中,可能采用動態(tài)尾數(shù)分配(如根據(jù)指數(shù)范圍動態(tài)調(diào)整尾數(shù)有效位),或預(yù)設(shè)尾數(shù)為1,值的范圍為\(2^{-128}\) 至\(2^{127}\)。

FP8 規(guī)模

指在量化過程中用于縮放數(shù)值的因子(Scale),確保數(shù)值在FP8 的表示范圍內(nèi)。

塊級縮放:將張量分成固定大小的區(qū)塊(如128×128 的tile),每個區(qū)塊共享一個縮放因子。這種區(qū)塊級縮放(而非整個張量級)在保留8 位元位寬的同時,將可用動態(tài)范圍擴展數(shù)十倍。

優(yōu)勢與應(yīng)用:

硬件效率提升

顯存節(jié)?。簷?quán)重顯存占用降低約50%,例如680B 模型權(quán)重檔案從1.3-1.5TB 降至約680GB。

計算加速:由于UE8M0 不含尾數(shù)與符號位,處理器在根據(jù)縮放因子對資料復(fù)原時,僅需乘以對應(yīng)的2 的冪(即指數(shù)位移操作),無需浮點乘法、規(guī)格化或舍入邏輯,縮短了時脈關(guān)鍵路徑。

中國國產(chǎn)芯片適合的搭配:

寒武紀:思元590 芯片支持FP8 精度,算力密度較前代提升40%。

摩爾線程:首個支持原生FP8 的國產(chǎn)GPU 廠商,基于MUSA Compute Capability 3.1 架構(gòu)。

海光信息:DCU(深算系列)透過FP8 優(yōu)化降低30% 顯存占用,運算效率提升20%。

行業(yè)影響:

技術(shù)突破:DeepSeek-V3.1 是中國國內(nèi)首個成功使用FP8 完成大型語言模型訓(xùn)練的案例,證明了FP8 在超大規(guī)模模型訓(xùn)練中的可行性。

生態(tài)閉環(huán):UE8M0 FP8 助力國產(chǎn)AI 芯片– 國產(chǎn)開源模型– 下游應(yīng)用形成完整生態(tài),推動中國AI 芯片加速追趕國際先進水準。

中國國產(chǎn)AI 芯片產(chǎn)業(yè)持續(xù)突破

中國智庫至坦AI 周五(22 日)指出,華為的910D 與寒武紀的思元690 芯片都有可能成為DeepSeek 新模型的基礎(chǔ)。

DeepSeek 團隊過去主要使用英偉達芯片開發(fā)模型,因此轉(zhuǎn)向中國AI 芯片可能在穩(wěn)定性、連線速度及軟體生態(tài)上面臨挑戰(zhàn)。

與此同時,華為正積極打造完整AI 硬件生態(tài)系統(tǒng),以在國內(nèi)挑戰(zhàn)英偉達。今年初,華為發(fā)布CloudMatrix 384 計算系統(tǒng),整合384 顆升騰910C 神經(jīng)處理單元與192 顆鯤鵬服務(wù)器CPU,通過統(tǒng)一總線互聯(lián),提供超高帶寬與低延遲。

對中國下一代AI 芯片的猜測,帶動相關(guān)上市公司股價上揚。周五,寒武紀與海光的上海股票雙雙上漲20%,中國大陸最大晶圓代工廠、同時生產(chǎn)華為升騰和麒麟芯片的中芯國際在香港股價上漲10.1%,收報56.90 港元。

責(zé)編: 愛集微
來源:鉅亨網(wǎng) #DeepSeek#
THE END
關(guān)閉
加載

PDF 加載中...