智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型

2025-07-29 09:41 來源：證券日報網(wǎng)

本報訊（記者梁傲男）7月28日，北京智譜華章科技股份有限公司（以下簡稱“智譜”）發(fā)布新一代旗艦?zāi)Ｐ虶LM-4.5，專為智能體應(yīng)用打造的基礎(chǔ)模型。Hugging Face與ModelScope平臺同步開源，模型權(quán)重遵循MIT License。

據(jù)悉，GLM-4.5在包含推理、代碼、智能體的綜合能力達(dá)到開源SOTA，在真實代碼智能體的人工對比評測中，實測國內(nèi)最佳。

智譜方面有關(guān)人士表示，衡量AGI的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5是智譜對此理念的首次完整呈現(xiàn)，并有幸取得技術(shù)突破。GLM-4.5首次在單個模型中實現(xiàn)將推理、編碼和智能體能力原生融合，以滿足智能體應(yīng)用的復(fù)雜需求。

智譜/供圖

記者了解到，為綜合衡量模型的通用能力，智譜選擇了最具有代表性的12個評測基準(zhǔn)，綜合平均分，GLM-4.5取得了全球模型第三、國產(chǎn)模型第一，開源模型第一。

在參數(shù)效率方面，GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3，但在多項標(biāo)準(zhǔn)基準(zhǔn)測試中表現(xiàn)得更為出色，這得益于GLM模型的更高參數(shù)效率。在衡量模型代碼能力的SWE-benchVerified榜單上，GLM-4.5系列位于性能/參數(shù)比帕累托前沿，表明在相同規(guī)模GLM-4.5系列實現(xiàn)了最佳性能。

在性能優(yōu)化之外，GLM-4.5系列也在成本和效率上實現(xiàn)突破，由此帶來遠(yuǎn)低于主流模型定價：API調(diào)用價格低至輸入0.8元/百萬tokens，輸出2元/百萬tokens。同時，高速版本實測生成速度最高可至100 tokens/秒，支持低延遲、高并發(fā)的實際部署需求，兼顧成本效益與交互體驗。

真實場景表現(xiàn)比榜單更重要。為評測GLM-4.5在真實場景Agent Coding中的效果，智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進(jìn)行對比測試。測試采用52個編程開發(fā)任務(wù)，涵蓋六大開發(fā)領(lǐng)域，在獨立容器環(huán)境中進(jìn)行多輪交互測試。實測結(jié)果顯示（如下圖），GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢，特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間，在大部分場景中可以實現(xiàn)平替的效果。

（編輯張明富）

-證券日報網(wǎng)

熱點新聞

工商銀行提高個人積存金投資準(zhǔn)入門檻

金屬板塊高位震蕩多個期貨品種資金凈流出

2026年首單央企重組落地中國石化與中國航油實施重組

兩公司“蹭熱點”火速受罰董秘信披責(zé)任再壓實

24小時排行一周排行

深度策劃

2025證劵市場年會

年會聚焦當(dāng)前資本市場深化改革與機制創(chuàng)新……[詳情]

市場快訊

00:00	上市公司積極開展套期保值對沖風(fēng)險
00:00	資本助力商業(yè)航天賽道熱度持續(xù)攀升
00:00	武漢天源擬5.5億元投建儲能項目
00:00	泰勝風(fēng)能：控股股東持股比例升至38...
00:00	央國企重組提速產(chǎn)業(yè)上下游協(xié)同加...
00:00	道通科技預(yù)計去年凈利潤增超40.42%
00:00	去年全球人形機器人出貨1.3萬臺中...
00:00	國產(chǎn)人形機器人集中亮相CES2026
00:00	澄天偉業(yè)董事長馮學(xué)裕：以精密工藝...
23:59	期貨市場去年全年成交量突破90億手
23:59	數(shù)字人民幣邁入“2.0時代” 規(guī)模化...
23:59	多家銀行開年首期大額存單主打短期...

中文字幕一区二区在线免费观看|黄色男女牲视频|欧美视频精品在线观看|色图成人99久久久成人av|欧美,激情,日韩,无码|视频黄色无码欧美人人爱超碰|不卡另类国产欧美|大力操夜夜操AV超碰|国产在线视频综合|日韩AV美女电影

智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型

智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型