近期,全球人工智能領(lǐng)域迎來(lái)了一系列新進(jìn)展,多家科技公司推出了具有突破性能力的AI新模型,標(biāo)志著人工智能技術(shù)正從通用大模型向多模態(tài)助手和智能體演進(jìn)。
5月22日,美國(guó)Anthropic公司推出了“克勞德4”系列兩款新模型:“奧普斯4”(Opus 4)與“十四行詩(shī)4”(Sonnet 4)。Opus 4作為行業(yè)領(lǐng)先的編程模型,能夠高效完成復(fù)雜且持續(xù)時(shí)間長(zhǎng)的任務(wù);而Sonnet 4則在3.7版本基礎(chǔ)上顯著升級(jí),具備更強(qiáng)的指令理解能力與推理、編程表現(xiàn)。
5月20日,谷歌宣布推出“雙子座2.5”系列大語(yǔ)言模型,整體性能和智能推理能力較以往版本大幅提升。同時(shí),谷歌還發(fā)布了多個(gè)多模態(tài)模型,包括圖像生成模型Imagen 4、視頻生成模型Veo 3和音樂(lè)生成模型Lyria 2,這些模型能夠從文本等多種輸入形式生成高質(zhì)量視覺(jué)內(nèi)容。此外,AI電影制作工具Flow集成了先進(jìn)的多模態(tài)技術(shù),使用戶通過(guò)自然語(yǔ)言描述就能生成高質(zhì)量的視覺(jué)作品。
谷歌公司還發(fā)布了全新的進(jìn)化式編程智能體AlphaEvolve,該系統(tǒng)由谷歌的大語(yǔ)言模型驅(qū)動(dòng),旨在實(shí)現(xiàn)通用算法的發(fā)現(xiàn)和優(yōu)化。在對(duì)超過(guò)50個(gè)數(shù)學(xué)難題的測(cè)試中,AlphaEvolve在約75%的案例中重新發(fā)現(xiàn)最優(yōu)解,并在20%的案例中提出更優(yōu)方案。谷歌團(tuán)隊(duì)認(rèn)為,該智能體未來(lái)有望在材料科學(xué)、藥物發(fā)現(xiàn)、可持續(xù)性發(fā)展等領(lǐng)域發(fā)揮變革性作用。
4月,OpenAI發(fā)布了GPT-4.1系列模型以及o3和o4 mini兩款推理模型。GPT-4.1系列模型在編程和指令理解方面表現(xiàn)突出,顯著提升了長(zhǎng)文本處理能力,并具備更高的性價(jià)比。o3模型在編程、數(shù)學(xué)、科學(xué)、視覺(jué)感知等領(lǐng)域均實(shí)現(xiàn)突破,適合處理多維度復(fù)雜問(wèn)題,尤其在圖像、圖表等視覺(jué)任務(wù)上表現(xiàn)突出。o3還具備嚴(yán)謹(jǐn)?shù)姆治瞿芰团惺剿季S,可被視作可靠的“思維伙伴”。o4 mini則是一款經(jīng)過(guò)優(yōu)化的小型模型,在數(shù)學(xué)、編程和視覺(jué)任務(wù)方面表現(xiàn)出色,適用于快速且成本效益高的推理。
商湯科技也宣布推出全新升級(jí)的“日日新SenseNova V6”大模型體系。這一大模型系統(tǒng)通過(guò)多模態(tài)長(zhǎng)思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)等技術(shù)突破,已形成領(lǐng)先的多模態(tài)推理能力,并突破成本邊界。
隨著技術(shù)的快速發(fā)展,AI的能力邊界不斷擴(kuò)大,正如谷歌旗下“深層思維”公司首席執(zhí)行官德米斯·哈薩比斯所說(shuō),團(tuán)隊(duì)正在塑造一個(gè)更加個(gè)性化、更主動(dòng)、更強(qiáng)大的AI,從而加快科學(xué)進(jìn)展的腳步,并開(kāi)創(chuàng)一個(gè)充滿新發(fā)現(xiàn)和成就的新時(shí)代。