Kimi 推出并开放源码 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

The soul never thinks without a mental image. 灵魂如果没有图像，就无法思考。
Aristotle De Anima

今天，我们发布并开源 Kimi K2.5 模型：

它是 Kimi 迄今最智能的模型，在 Agent、代码、图像、视频及一系列通用智能任务上取得开源 state-of-the-art 表现。
也是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。

我们相信，更智能、更全能，代码能力更强的模型，有助于推动技术平权，让更多人从中受益：

Kimi K2.5 让智能更加触手可及。通过将视觉理解与推理、代码、Agent 等能力结合，K2.5 降低了用户与 AI 的交互门槛：当语言难以准确描述时，可拍照、截图或录屏传给 Kimi，突破文字表达的限制。
Kimi K2.5 让人人精通 Office。K2.5 模型将 Kimi Agent 能力扩展到日常办公领域，开始掌握 Word、Excel、PPT、PDF 等常用软件的中高阶技能，助用户直接交付准专业水平的办公文档。

我们相信，AI Agent 将赋予每个人「超能力」。就像人类社会一样，要处理真正复杂的工作需要协作一样。K2.5 首次引入了「Agent 集群」能力，让 K2.5 学会自主创建自己的「分身」，按需组成不同角色的团队，并行工作，团队作战，获得 10 倍、100 倍的效率提升。

Kimi K2.5 现已登陆 kimi.com、最新版Kimi App、Kimi API 开放平台和我们的编程助手产品 Kimi Code，欢迎体验。

关于 Kimi K2.5 模型的更多技术细节和基准测试结果，请关注我们的技术博客和后续发布的技术报告。

代码 × 视觉

让智能触手可及

Kimi K2.5 进一步提升了开源模型的代码水平，尤其是在前端开发领域。K2.5 模型支持从简单的自然语言对话生成完整的前端界面，并能有效处理交互式布局及滚动触发等动态效果。以下展示了 K2.5 在图像生成工具的辅助下，仅凭单条 Prompt 实现的网站开发实例：

通过融合视觉能力，K2.5 也真正降低了编程的门槛：你可以直接传一段录屏。Kimi K2.5 能自动拆解背后的交互逻辑，并用干净、专业的代码将其从头到尾复现出来。

Kimi K2.5 模型先进的视觉理解和编程能力，也从 API 早期内测客户的反馈中得到了印证：

其中，Keep AI 教练 Kaka 基于 Kimi K2.5 模型的视频动作识别、评估等功能，即将上线，敬请期待。

Agent 集群

赋予你「超能力」

半年前，我们发布了首个万亿参数开源 Agent 模型 Kimi K2。随后推出的 Kimi K2 Thinking，通过增加思考时间，具备了独立完成长达 300 步操作的长程任务能力。但这还不够。处理真实世界的复杂难题，不能只靠单打独斗，更需要团队协作。

今天，我们发布 Kimi K2.5 的全新探索：Agent 集群。这一次，我们从单一 Agent 进化到了 Agent 集群。

面对复杂任务，K2.5 不再是一个包揽一切的「全能专家」，而是化身为一支即时组建的「专业团队」。它能根据任务需求，现场调度多达 100 个分身，并行处理 1500 个步骤。所有的角色分配与任务拆解，无需预设，全由 K2.5 现场决策。

我们来看一个例子。给 Kimi Agent集群投喂 40 篇关于心理学和 AI 的论文。Kimi 先是通过多次调用工具，按顺序把这 40 篇论文通读一遍，以此确保上下文里完整保留了所有必要信息。紧接着，它衍生出几个子agent，本质上是 Kimi 的「分身」，分别负责不同章节撰写。最后，主 agent 负责把关验收，将所有内容汇总生成了一份长达几十页的专业 PDF 综述：

虽然 K2.5 在主流 Agent 评测中已达先进水平，但我们更看重它为用户节省的每一分钟。在大规模搜索（wide search）场景下，与单 Agent 执行相比，Agent 集群将达成目标性能所需的最少关键步骤减少了 3 到 4.5 倍，且随着目标要求的提升，节省幅度进一步扩大；通过并行化，实际运行时间（wall clock）最高可缩短 4.5 倍：

此外，Agent 集群的规模化训练极具挑战。为此，我们重构了强化学习基建，并专门优化了训练算法，以确保能达到极致的效率和性能。目前，这一实验性功能已开启 Beta 测试，并将于近期逐步开放。我们期待 Kimi K2.5 的协作能力，能帮你攻克更多难题。

Kimi Code

正式发布

Kimi K2 系列模型发布以来，因为在软件工程领域的出色表现，受到国内外开发者的喜爱。从 Kimi 开放平台的后台数据看，大量开发者将 Kimi K2 系列模型与 Claude Code、Cline、Roo Code、Kilo Code 等 Coding Agent 产品搭配使用。同时 Coding Agent 产品，也越来越展现出更加通用的能力，使用人群正在向非技术人员扩散，未来有巨大的想象空间。

今天，我们正式介绍来自 Kimi 的编程工具：Kimi Code。它不仅能在终端里直接运行，还能无缝集成到 VSCode、Cursor、JetBrains 和 Zed 等主流编辑器中。Kimi Code 可充分发挥 K2.5 的多模态优势，支持直接输入图片和视频进行编程辅助，并能自动发现并将你现有的技能迁移到新的工作流中。

Kimi Code Bench 是我们内部的代码能力评测基准，涵盖从构建、调试、重构、测试到脚本编写等多种端到端任务，支持多种编程语言。在我们的评估中，搭载了 K2.5 的 Kimi Code，相比之前的 Kimi 模型有了大幅度的提升。

欢迎将 Kimi K2.5 模型 API 搭配 Kimi Code 使用，或通过 Kimi 会员的包月计划（kimi.com/code）使用。

此外，Kimi Code 背后的 Agent SDK 也将开源发布，帮助大家自定义自己的 Agent 体验。我们在 Github 提供了更多信息，详情可至 https://github.com/MoonshotAI/kimi-agent-sdk/tree/main/examples 了解。

开始使用

Kimi K2.5