智谱发布新一代多模态模型与 MaaS 生态平台,开启 AGI 应用新纪元

AI新闻资讯1周前发布 一丢
308 00
广告也精彩

2025 年 7 月 2 日,智谱开放平台产业生态大会在上海浦东张江科学会堂隆重举办。这场汇聚政府领导、头部开发者与企业用户的行业盛会,不仅见证了浦东创投集团和张江集团对智谱的战略投资,更重磅揭晓了智谱在多模态智能领域的两项革命性成果:新一代通用视觉语言模型GLM-4.1V-Thinking开源发布,以及 MaaS 生态全新升级的 Agent 聚合平台「应用空间」正式上线。这两大突破标志着智谱在迈向 AGI(通用人工智能)的道路上迈出关键一步,为千行百业的 AI 原生化转型提供了强大动力。

智谱发布新一代多模态模型与 MaaS 生态平台,开启 AGI 应用新纪元

智谱新MaaS:10B级效果最好VLM上线,Agents应用空间也来了

新一代视觉语言模型GLM-4.1V-Thinking:从感知到认知的跨越

智谱此次发布的 GLM-4.1V-Thinking 系列模型,堪称视觉语言大模型领域的里程碑之作。作为支持图像、视频、文档等多模态输入的通用推理型大模型,其核心突破在于实现了从 “感知” 到 “认知” 的关键跃迁 —— 通过引入 “思维链推理机制(Chain-of-Thought Reasoning)” 和 “课程采样强化学习策略(RLCS)”,模型的跨模态因果推理能力与稳定性得到系统性提升,能够处理更复杂的认知任务。
特别值得关注的是轻量版 GLM-4.1V-9B-Thinking,在仅 100 亿参数级别(10B)的情况下,实现了性能与部署效率的完美平衡。该模型在 MMStar、MMMU-Pro、ChartQAPro、OSWorld 等 28 项权威评测中展现出统治力:23 项达成 10B 级模型最佳成绩,其中 18 项甚至持平或超越参数量高达 720 亿的 Qwen-2.5-VL 模型,充分验证了 “小体积模型的极限性能潜力”。
在具体任务表现上,GLM-4.1V-Thinking 展现出高度通用性与稳健性:
  • 图文理解:精准识别图像与文本的综合信息,实现跨模态语义对齐
  • 数学与科学推理:支持复杂题解、多步演绎及公式理解,胜任学科级推理任务
  • 视频理解:具备时序分析与事件逻辑建模能力,可处理长视频内容理解
  • GUI 与网页智能体任务:理解界面结构并辅助自动化操作,如智能日程安排
  • 视觉锚定与实体定位:实现语言与图像区域的精准对齐,提升人机交互可控性
从实际应用场景来看,该模型已在多个领域展现价值:体育解说中识别复杂动态图像并理解赛事逻辑,智能助手基于 GUI 界面完成自动化操作,电商场景中通过图像识别实现 “看图买菜” 的复杂推理等。目前,GLM-4.1V-9B-Thinking 已在 Hugging Face、魔搭社区等平台同步开源,包含基座模型与推理增强模型两个版本,并在智谱开放平台上线免费的 Flash API,助力研究者与开发者探索多模态推理边界。

MaaS 生态升级:「Agent 应用空间」开启 AI 工业化生产时代

与模型发布同步推出的「Agent 应用空间」,标志着智谱 MaaS(模型即服务)生态进入全新阶段。作为面向企业客户与开发者的 AI Agent 能力聚合平台,其核心价值在于打破技术壁垒,让企业无需自建大模型团队,即可低门槛接入成熟、安全、可控的 Agent 能力。
该平台具备三大核心优势:
  • 丰富的 Agent 应用与模型插件(MCP):汇聚各行业解决方案,提供开箱即用的组件服务
  • 全方位生态扶持:启动「Agents 开拓者计划」,投入数亿资金扶持 AI Agents 创业团队
智谱 CEO 张鹏在会上强调:”AI 的未来不仅是模型性能的比拼,更是生产范式的重构。”「Agent 应用空间」正是这一理念的落地实践 —— 通过标准化、模块化的 Agent 能力输出,推动 AI 应用从定制化开发向工业化生产转型。平台已支持长视频理解、图像问答、学科解题、文档解读、GUI Agent、代码生成等复杂场景应用,为科学研究、教育、自主 Agent 开发等领域提供强大支撑。

技术突破背后的战略布局:从模型创新到生态构建

此次双重磅发布,折射出智谱在 AI 领域的系统性战略布局。GLM-4.1V-Thinking 的技术突破体现在三个维度:推理能力的强化使模型更接近人类认知逻辑,轻量级设计适配更多终端部署场景,开源策略则加速技术普惠与生态共建。而「Agent 应用空间」的推出,更是将技术价值转化为产业价值的关键一步 —— 通过聚合模型能力与行业场景,智谱正在构建 “模型 – 工具 – 应用 – 生态” 的完整闭环。
值得关注的是,智谱在模型优化路径上展现出独特思考:不同于单纯追求参数规模,而是通过算法创新(如 RLCS 策略)提升模型效率,这种 “质量优先” 的发展模式更符合 AI 工业化落地的需求。同时,对多模态推理的持续深耕,使其在跨领域应用中具备先发优势,尤其在需要结合视觉与语言理解的复杂场景(如工业质检、医疗影像分析)中潜力巨大。
随着 GLM-4.1V-Thinking 的开源与「Agent 应用空间」的生态启动,智谱正推动 AI 行业从 “模型竞争” 转向 “生态协同“。正如大会所传递的理念,在 AGI 的征程中,每一位开发者、企业用户都是智能生态的共同缔造者。智谱通过技术赋能与生态扶持,正在搭建一个让 AI 创意快速落地的基础设施,为中国 AI 产业的跨越式发展注入新动能。
© 版权声明
广告也精彩

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...