7月2日,智譜開(kāi)放平臺(tái)產(chǎn)業(yè)生態(tài)大會(huì)在上海浦東張江科學(xué)會(huì)堂舉辦。大會(huì)匯聚政府領(lǐng)導(dǎo)、頭部開(kāi)發(fā)者與企業(yè)用戶,集中呈現(xiàn)智譜在多模態(tài)智能與MaaS生態(tài)的核心成果。會(huì)上,浦東創(chuàng)投集團(tuán)和張江集團(tuán)聯(lián)合宣布戰(zhàn)略投資智譜,為智譜構(gòu)建可信的人工智能基礎(chǔ)設(shè)施注入堅(jiān)實(shí)動(dòng)能。
智譜CEO張鵬在主題演講中發(fā)布了智譜攜手生態(tài)伙伴邁向AGI的兩項(xiàng)最新成果:一是開(kāi)源發(fā)布新一代通用視覺(jué)語(yǔ)言模型GLM-4.1V-Thinking,以推理能力為核心突破,刷新10B級(jí)別多模態(tài)模型性能上限;二是MaaS全新上線Agent聚合平臺(tái)「應(yīng)用空間」,全面激活行業(yè)場(chǎng)景中的AI能力,聯(lián)動(dòng)Z基金啟動(dòng)Agent開(kāi)拓者專項(xiàng)扶持計(jì)劃。
同時(shí),在大會(huì)主題演講環(huán)節(jié),智譜高級(jí)副總裁吳瑋杰、蒙牛集團(tuán)副總裁&首席數(shù)智官李琤潔、中國(guó)銀聯(lián)金融科技研究院副院長(zhǎng)呂旭峰分別就大模型落地實(shí)踐做了分享。在panel環(huán)節(jié)中,捏TA創(chuàng)始人胡修涵、AiPPT聯(lián)合創(chuàng)始人王振同、flowith CMO 拐子和張江智薈總經(jīng)理沈玲就bigmodel原生創(chuàng)業(yè)話題進(jìn)行了觀點(diǎn)碰撞。
全新發(fā)布:GLM-4.1V-Thinking
7月2日,智譜正式發(fā)布并開(kāi)源視覺(jué)語(yǔ)言大模型GLM-4.1V-Thinking,標(biāo)志著GLM系列視覺(jué)模型實(shí)現(xiàn)從感知走向認(rèn)知的關(guān)鍵躍遷。
GLM-4.1V-Thinking是一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型,專為復(fù)雜認(rèn)知任務(wù)設(shè)計(jì)。它在GLM-4V架構(gòu)基礎(chǔ)上引入“思維鏈推理機(jī)制(Chain-of-Thought Reasoning)”,采用“課程采樣強(qiáng)化學(xué)習(xí)策略(RLCS, Reinforcement Learning with Curriculum Sampling)”,系統(tǒng)性提升模型跨模態(tài)因果推理能力與穩(wěn)定性。
其輕量版GLM-4.1V-9B-Thinking模型參數(shù)控制在10B級(jí)別,在兼顧部署效率的同時(shí)實(shí)現(xiàn)性能突破。該模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項(xiàng)權(quán)威評(píng)測(cè)中,有23項(xiàng)達(dá)成10B級(jí)模型的最佳成績(jī),其中18項(xiàng)更是持平或超越參數(shù)量高達(dá)72B的Qwen-2.5-VL,充分展現(xiàn)了小體積模型的極限性能潛力。
模型特別在以下任務(wù)中表現(xiàn)卓越,展示出高度的通用性與穩(wěn)健性:
圖文理解(Image General):精準(zhǔn)識(shí)別并綜合分析圖像與文本信息;
數(shù)學(xué)與科學(xué)推理(Math & Science):支持持復(fù)雜題解、多步演繹與公式理解;
視頻理解(Video):具備時(shí)序分析與事件邏輯建模能力;
GUI 與網(wǎng)頁(yè)智能體任務(wù)(UI2Code、Agent):理解界面結(jié)構(gòu),輔助自動(dòng)化操作;
視覺(jué)錨定與實(shí)體定位(Grounding):語(yǔ)言與圖像區(qū)域精準(zhǔn)對(duì)齊,提升人機(jī)交互可控性。
目前,GLM-4.1V-9B-Thinking已在Hugging Face與魔搭社區(qū)同步開(kāi)源。包含兩個(gè)模型,分別是GLM-4.1V-9B-Base基座模型,希望能夠幫助更多研究者探索視覺(jué)語(yǔ)言模型的能力邊界作;GLM-4.1V-9B-Thinking,具備深度思考和推理能力的模型,正常使用和體驗(yàn),均為這一模型。
在面向科學(xué)研究、教育、自主Agent及多模態(tài)助手等更復(fù)雜現(xiàn)實(shí)世界應(yīng)用時(shí),補(bǔ)足推理能力后的GLM-4.1V-Thinking ,真正解決開(kāi)放式、信息豐富的千行百業(yè)的場(chǎng)景問(wèn)題。如長(zhǎng)視頻理解、圖像問(wèn)答、學(xué)科解題、文字識(shí)別、文檔解讀、Grounding、GUI Agent和代碼生成。
GLM-4.1V-Thinking 代表了通向通用多模態(tài)推理的重要一步。在接下來(lái)的工作中,我們將通過(guò)更優(yōu)的獎(jiǎng)勵(lì)模型、更好的 RL 算法進(jìn)一步優(yōu)化 GLM-4.1V-Thinking 系列模型;同時(shí),我們也將探索視覺(jué)與語(yǔ)言模態(tài)如何相互強(qiáng)化,這可能為提升通用推理能力帶來(lái)重大突破。
MaaS應(yīng)用空間:面向千行百業(yè)的AI生態(tài)市場(chǎng)
7月2日,智譜推出全新生態(tài)平臺(tái)「Agent應(yīng)用空間」,并開(kāi)啟「Agents開(kāi)拓者計(jì)劃」,投入數(shù)億資金,全方位扶持AI Agents創(chuàng)業(yè)團(tuán)隊(duì)?!窤gent應(yīng)用空間」是一個(gè)面向企業(yè)客戶和開(kāi)發(fā)者的AI Agent能力聚合平臺(tái),優(yōu)秀開(kāi)發(fā)者與企業(yè)用戶。平臺(tái)匯聚豐富的Agent應(yīng)用與模型插件(MCP),提供開(kāi)箱即用、靈活編排的組件服務(wù)和Agents 應(yīng)用,幫助企業(yè)無(wú)需自建大模型團(tuán)隊(duì),即可低門檻接入成熟、安全、可控的Agent能力。
「Agent應(yīng)用空間」提供一站式開(kāi)發(fā)工具鏈、完整的模型調(diào)用接口與靈活的應(yīng)用組合機(jī)制,是“AI原生化”升級(jí)的重要起點(diǎn)。正如智譜CEO張鵬所言:“AI的未來(lái),不僅是模型性能的比拼,更是生產(chǎn)范式的重構(gòu)。在這個(gè)時(shí)代,每一位開(kāi)發(fā)者、設(shè)計(jì)者、創(chuàng)業(yè)者,都是智能生態(tài)的共同締造者?!毕M谥亲V的基座模型、多模態(tài)模型和MaaS平臺(tái)的支持下,每個(gè)人都可以用AI表達(dá)想法、生成內(nèi)容、構(gòu)建應(yīng)用,甚至創(chuàng)建一家AI原生公司。這是一場(chǎng)關(guān)于智能的共同創(chuàng)作,也是一場(chǎng)屬于開(kāi)發(fā)者的未來(lái)革命。