與文心同心，壁仞科技率先啟動與文心系列模型深度生態(tài)合作

作者：愛集微 5小時前

來源：壁仞科技 #壁仞科技# #大模型#

1829

6月30日，百度正式開源文心大模型4.5系列模型后，壁仞科技率先啟動與文心系列大模型的開源適配工作。通過適配飛槳推理框架及結(jié)合自研推理引擎后端優(yōu)化技術(shù)，壁仞科技能夠迅速實現(xiàn)文心大模型的適配響應(yīng)以及性能調(diào)優(yōu)。

文心4.5系列開源模型共10款，涵蓋了激活參數(shù)規(guī)模分別為47B和3B的混合專家（MoE）模型（最大的模型總參數(shù)量為424B），以及0.3B的稠密參數(shù)模型。

文心4.5系列模型均使用飛槳深度學(xué)習(xí)框架進(jìn)行高效訓(xùn)練、推理和部署。在大語言模型的預(yù)訓(xùn)練中，模型FLOPs利用率（MFU）達(dá)到47%。實驗結(jié)果顯示，該系列模型在多個文本和多模態(tài)基準(zhǔn)測試中達(dá)到SOTA水平，在指令遵循、世界知識記憶、視覺理解和多模態(tài)推理任務(wù)上效果尤為突出。模型權(quán)重按照Apache 2.0協(xié)議開源，支持開展學(xué)術(shù)研究和產(chǎn)業(yè)應(yīng)用。

壁仞科技依托自研的壁礪?系列通用GPU架構(gòu)與深度優(yōu)化的軟件棧，從而實現(xiàn)對文心系列模型的適配。壁礪?系列產(chǎn)品可廣泛用于大語言、多模態(tài)、圖像識別、推薦等場景，支持預(yù)訓(xùn)練、微調(diào)、推理等使用方式，不僅能夠與主流AI生態(tài)無縫兼容，0成本遷移適配，還能夠通過靈活可控的多機多卡集群擴展能力，全方位支持千億及以下不同規(guī)格參數(shù)量模型，為全行業(yè)的各類業(yè)務(wù)場景提供極具性價比的產(chǎn)品方案。

基于飛槳提供開源的產(chǎn)業(yè)級開發(fā)套件，文心系列模型廣泛兼容多種芯片，降低后訓(xùn)練和部署門檻。這也意味著，通過壁礪?系列通用GPU產(chǎn)品與文心系列模型的適配，能夠有效滿足海量中小企業(yè)以及AI開發(fā)者的多樣化需求，進(jìn)一步加速人工智能應(yīng)用在各領(lǐng)域的落地。

值得一提的是，自2023年開始，壁仞科技與百度聯(lián)合發(fā)起飛槳+文心大模型硬件生態(tài)共創(chuàng)計劃，聯(lián)合開展多個重大科研項目攻關(guān)，在訓(xùn)練和推理兩個方向都實現(xiàn)了壁仞GPU與飛槳框架的深度適配，并獲得了二級適配證書。未來，雙方將共同打造軟硬一體的人工智能大模型平臺，推動大模型應(yīng)用規(guī)?；涞?，共創(chuàng)開放、共贏的創(chuàng)新生態(tài)，為新一代智能化浪潮注入澎湃動力。