9月6日,阿里巴巴旗下通義千問(wèn)Qwen上線新模型 Qwen3-Max-Preview (Instruct),為其迄今為止最大的模型,擁有超過(guò) 1 萬(wàn)億參數(shù),現(xiàn)已可通過(guò) Qwen Chat 和阿里云 API 使用。
據(jù)介紹,Qwen3-Max-Preview 在多項(xiàng)主流權(quán)威基準(zhǔn)測(cè)試中展現(xiàn)出全球領(lǐng)先的性能。在通用知識(shí)(SuperGPQA)、數(shù)學(xué)推理(AIME25)、編程(LiveCodeBench v6)、人類(lèi)偏好對(duì)齊(Arena-Hard v2)以及綜合性能力評(píng)估(LiveBench)評(píng)測(cè)中,Qwen3-Max-Preview 超越了Claude-Opus 4(Non-Thinking),以及Kimi-K2、DeepSeek-V3.1和其此前的開(kāi)源最佳Qwen3-235B-A22B-Instruct-2507。同時(shí),其性能超越了通義千問(wèn)此前最好成績(jī)的 Qwen3-235B-A22B-2507。
目前,Qwen3-Max-Preview已正式上線阿里云百煉平臺(tái),可通過(guò)API直接調(diào)用。同時(shí),Qwen Chat 也同步上線新模型,支持免費(fèi)使用。據(jù)悉,其內(nèi)部測(cè)試和早期用戶(hù)反饋?zhàn)C實(shí):性能更強(qiáng)、知識(shí)更廣、更擅長(zhǎng)對(duì)話、代理任務(wù)和指令遵循。