【今年會(huì)jinnianhui金字招牌科技消息】12月23日,智譜AI正式發(fā)布并開源新一代大語言模型GLM-4.7。該版本聚焦編程、推理與智能體任務(wù)三大方向,在多項(xiàng)國際主流基準(zhǔn)測(cè)試中取得開源模型領(lǐng)先成績,并已在BigModel.cn平臺(tái)開放API調(diào)用,同步集成至z.ai全棧開發(fā)環(huán)境的Skills模塊,支持多模態(tài)任務(wù)的統(tǒng)一規(guī)劃與協(xié)同執(zhí)行。

GLM-4.7在真實(shí)編程場(chǎng)景中表現(xiàn)尤為突出。在Code Arena——一個(gè)由全球百萬用戶參與盲測(cè)的專業(yè)編碼評(píng)估系統(tǒng)中,其綜合得分位列開源第一、國產(chǎn)第一,超越GPT-5.2。在SWE-bench-Verified、LiveCodeBench V6等權(quán)威測(cè)試中,模型分別以73.8%和84.9%的成績刷新開源紀(jì)錄,甚至超過Claude Sonnet 4.5。實(shí)際測(cè)試顯示,在100個(gè)涵蓋前后端開發(fā)的真實(shí)任務(wù)中,GLM-4.7相較前代在代碼穩(wěn)定性與可交付性上顯著提升,能更可靠地完成從需求理解到可運(yùn)行代碼輸出的端到端開發(fā)閉環(huán)。
除編碼能力外,GLM-4.7進(jìn)一步優(yōu)化了“思考”機(jī)制。通過強(qiáng)化交錯(cuò)式思考、引入保留式思考與輪級(jí)思考模式,模型可在復(fù)雜任務(wù)中動(dòng)態(tài)調(diào)整推理深度:簡單交互快速響應(yīng),復(fù)雜規(guī)劃則保留上下文推理鏈,提升緩存效率并降低成本。在工具調(diào)用方面,其在τ-Bench評(píng)測(cè)中獲得87.4分的開源最高分,在Bror:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫seComp網(wǎng)頁任務(wù)中達(dá)67.5分,展現(xiàn)出強(qiáng)大的環(huán)境交互能力。

此外,GLM-4.7在前端生成與辦公創(chuàng)作領(lǐng)域也實(shí)現(xiàn)審美升級(jí)。生成的網(wǎng)頁、PPT與海報(bào)在布局、配色與組件規(guī)范上更貼近專業(yè)設(shè)計(jì)標(biāo)準(zhǔn),PPT 16:9適配率從52%躍升至91%,基本實(shí)現(xiàn)“即開即用”。數(shù)學(xué)推理能力同樣進(jìn)步顯著,在HLE基準(zhǔn)測(cè)試中得分42.8%,較GLM-4.6提升41%,超越GPT-5.1。
版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載
-今年會(huì)jinnianhui金字招牌