智譜新MaaS：10B級(jí)效果最好VLM上線，Agents應(yīng)用空間登場(chǎng)

作者：愛(ài)集微 18小時(shí)前

來(lái)源：智譜 #智譜# #AI#

6852

7月2日，智譜開(kāi)放平臺(tái)產(chǎn)業(yè)生態(tài)大會(huì)在上海浦東張江科學(xué)會(huì)堂舉辦。大會(huì)匯聚政府領(lǐng)導(dǎo)、頭部開(kāi)發(fā)者與企業(yè)用戶，集中呈現(xiàn)智譜在多模態(tài)智能與MaaS生態(tài)的核心成果。會(huì)上，浦東創(chuàng)投集團(tuán)和張江集團(tuán)聯(lián)合宣布戰(zhàn)略投資智譜，為智譜構(gòu)建可信的人工智能基礎(chǔ)設(shè)施注入堅(jiān)實(shí)動(dòng)能。

智譜CEO張鵬在主題演講中發(fā)布了智譜攜手生態(tài)伙伴邁向AGI的兩項(xiàng)最新成果：一是開(kāi)源發(fā)布新一代通用視覺(jué)語(yǔ)言模型GLM-4.1V-Thinking，以推理能力為核心突破，刷新10B級(jí)別多模態(tài)模型性能上限；二是MaaS全新上線Agent聚合平臺(tái)「應(yīng)用空間」，全面激活行業(yè)場(chǎng)景中的AI能力，聯(lián)動(dòng)Z基金啟動(dòng)Agent開(kāi)拓者專項(xiàng)扶持計(jì)劃。

同時(shí)，在大會(huì)主題演講環(huán)節(jié)，智譜高級(jí)副總裁吳瑋杰、蒙牛集團(tuán)副總裁&首席數(shù)智官李琤潔、中國(guó)銀聯(lián)金融科技研究院副院長(zhǎng)呂旭峰分別就大模型落地實(shí)踐做了分享。在panel環(huán)節(jié)中，捏TA創(chuàng)始人胡修涵、AiPPT聯(lián)合創(chuàng)始人王振同、flowith CMO 拐子和張江智薈總經(jīng)理沈玲就bigmodel原生創(chuàng)業(yè)話題進(jìn)行了觀點(diǎn)碰撞。

全新發(fā)布：GLM-4.1V-Thinking

7月2日，智譜正式發(fā)布并開(kāi)源視覺(jué)語(yǔ)言大模型GLM-4.1V-Thinking，標(biāo)志著GLM系列視覺(jué)模型實(shí)現(xiàn)從感知走向認(rèn)知的關(guān)鍵躍遷。

GLM-4.1V-Thinking是一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型，專為復(fù)雜認(rèn)知任務(wù)設(shè)計(jì)。它在GLM-4V架構(gòu)基礎(chǔ)上引入“思維鏈推理機(jī)制（Chain-of-Thought Reasoning）”，采用“課程采樣強(qiáng)化學(xué)習(xí)策略（RLCS, Reinforcement Learning with Curriculum Sampling）”，系統(tǒng)性提升模型跨模態(tài)因果推理能力與穩(wěn)定性。

其輕量版GLM-4.1V-9B-Thinking模型參數(shù)控制在10B級(jí)別，在兼顧部署效率的同時(shí)實(shí)現(xiàn)性能突破。該模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項(xiàng)權(quán)威評(píng)測(cè)中，有23項(xiàng)達(dá)成10B級(jí)模型的最佳成績(jī)，其中18項(xiàng)更是持平或超越參數(shù)量高達(dá)72B的Qwen-2.5-VL，充分展現(xiàn)了小體積模型的極限性能潛力。

模型特別在以下任務(wù)中表現(xiàn)卓越，展示出高度的通用性與穩(wěn)健性：

圖文理解（Image General）：精準(zhǔn)識(shí)別并綜合分析圖像與文本信息；
數(shù)學(xué)與科學(xué)推理（Math & Science）：支持持復(fù)雜題解、多步演繹與公式理解；
視頻理解（Video）：具備時(shí)序分析與事件邏輯建模能力；
GUI 與網(wǎng)頁(yè)智能體任務(wù)（UI2Code、Agent）：理解界面結(jié)構(gòu)，輔助自動(dòng)化操作；
視覺(jué)錨定與實(shí)體定位（Grounding）：語(yǔ)言與圖像區(qū)域精準(zhǔn)對(duì)齊，提升人機(jī)交互可控性。

目前，GLM-4.1V-9B-Thinking已在Hugging Face與魔搭社區(qū)同步開(kāi)源。包含兩個(gè)模型，分別是GLM-4.1V-9B-Base基座模型，希望能夠幫助更多研究者探索視覺(jué)語(yǔ)言模型的能力邊界作；GLM-4.1V-9B-Thinking，具備深度思考和推理能力的模型，正常使用和體驗(yàn)，均為這一模型。

在面向科學(xué)研究、教育、自主Agent及多模態(tài)助手等更復(fù)雜現(xiàn)實(shí)世界應(yīng)用時(shí)，補(bǔ)足推理能力后的GLM-4.1V-Thinking ，真正解決開(kāi)放式、信息豐富的千行百業(yè)的場(chǎng)景問(wèn)題。如長(zhǎng)視頻理解、圖像問(wèn)答、學(xué)科解題、文字識(shí)別、文檔解讀、Grounding、GUI Agent和代碼生成。

GLM-4.1V-Thinking 代表了通向通用多模態(tài)推理的重要一步。在接下來(lái)的工作中，我們將通過(guò)更優(yōu)的獎(jiǎng)勵(lì)模型、更好的 RL 算法進(jìn)一步優(yōu)化 GLM-4.1V-Thinking 系列模型；同時(shí)，我們也將探索視覺(jué)與語(yǔ)言模態(tài)如何相互強(qiáng)化，這可能為提升通用推理能力帶來(lái)重大突破。

MaaS應(yīng)用空間：面向千行百業(yè)的AI生態(tài)市場(chǎng)

7月2日，智譜推出全新生態(tài)平臺(tái)「Agent應(yīng)用空間」，并開(kāi)啟「Agents開(kāi)拓者計(jì)劃」，投入數(shù)億資金，全方位扶持AI Agents創(chuàng)業(yè)團(tuán)隊(duì)?！窤gent應(yīng)用空間」是一個(gè)面向企業(yè)客戶和開(kāi)發(fā)者的AI Agent能力聚合平臺(tái)，優(yōu)秀開(kāi)發(fā)者與企業(yè)用戶。平臺(tái)匯聚豐富的Agent應(yīng)用與模型插件（MCP），提供開(kāi)箱即用、靈活編排的組件服務(wù)和Agents 應(yīng)用，幫助企業(yè)無(wú)需自建大模型團(tuán)隊(duì)，即可低門檻接入成熟、安全、可控的Agent能力。

「Agent應(yīng)用空間」提供一站式開(kāi)發(fā)工具鏈、完整的模型調(diào)用接口與靈活的應(yīng)用組合機(jī)制，是“AI原生化”升級(jí)的重要起點(diǎn)。正如智譜CEO張鵬所言：“AI的未來(lái)，不僅是模型性能的比拼，更是生產(chǎn)范式的重構(gòu)。在這個(gè)時(shí)代，每一位開(kāi)發(fā)者、設(shè)計(jì)者、創(chuàng)業(yè)者，都是智能生態(tài)的共同締造者?！毕Ｍ谥亲V的基座模型、多模態(tài)模型和MaaS平臺(tái)的支持下，每個(gè)人都可以用AI表達(dá)想法、生成內(nèi)容、構(gòu)建應(yīng)用，甚至創(chuàng)建一家AI原生公司。這是一場(chǎng)關(guān)于智能的共同創(chuàng)作，也是一場(chǎng)屬于開(kāi)發(fā)者的未來(lái)革命。