The soul never thinks without a mental image. 灵魂如果没有图像,就无法思考。
我们相信,更智能、更全能,代码能力更强的模型,有助于推动技术平权,让更多人从中受益:
Kimi K2.5 让智能更加触手可及。通过将视觉理解与推理、代码、Agent 等能力结合,K2.5 降低了用户与 AI 的交互门槛:当语言难以准确描述时,可拍照、截图或录屏传给 Kimi,突破文字表达的限制。
Kimi K2.5 让人人精通 Office。K2.5 模型将 Kimi Agent 能力扩展到日常办公领域,开始掌握 Word、Excel、PPT、PDF 等常用软件的中高阶技能,助用户直接交付准专业水平的办公文档。
我们相信,AI Agent 将赋予每个人「超能力」。就像人类社会一样,要处理真正复杂的工作需要协作一样。K2.5 首次引入了「Agent 集群」能力,让 K2.5 学会自主创建自己的「分身」,按需组成不同角色的团队,并行工作,团队作战,获得 10 倍、100 倍的效率提升。
关于 Kimi K2.5 模型的更多技术细节和基准测试结果,请关注我们的技术博客和后续发布的技术报告。
Kimi K2.5 进一步提升了开源模型的代码水平,尤其是在前端开发领域。K2.5 模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。以下展示了 K2.5 在图像生成工具的辅助下,仅凭单条 Prompt 实现的网站开发实例:
通过融合视觉能力,K2.5 也真正降低了编程的门槛:你可以直接传一段录屏。Kimi K2.5 能自动拆解背后的交互逻辑,并用干净、专业的代码将其从头到尾复现出来。
Kimi K2.5 模型先进的视觉理解和编程能力,也从 API 早期内测客户的反馈中得到了印证:
其中,Keep AI 教练 Kaka 基于 Kimi K2.5 模型的视频动作识别、评估等功能,即将上线,敬请期待。
今天,我们发布 Kimi K2.5 的全新探索:Agent 集群。这一次,我们从单一 Agent 进化到了 Agent 集群。
面对复杂任务,K2.5 不再是一个包揽一切的「全能专家」,而是化身为一支即时组建的「专业团队」。它能根据任务需求,现场调度多达 100 个分身,并行处理 1500 个步骤。所有的角色分配与任务拆解,无需预设,全由 K2.5 现场决策。
我们来看一个例子。给 Kimi Agent集群投喂 40 篇关于心理学和 AI 的论文。Kimi 先是通过多次调用工具,按顺序把这 40 篇论文通读一遍,以此确保上下文里完整保留了所有必要信息。紧接着,它衍生出几个子agent,本质上是 Kimi 的「分身」,分别负责不同章节撰写。最后,主 agent 负责把关验收,将所有内容汇总生成了一份长达几十页的专业 PDF 综述:
虽然 K2.5 在主流 Agent 评测中已达先进水平,但我们更看重它为用户节省的每一分钟。在大规模搜索(wide search)场景下,与单 Agent 执行相比,Agent 集群将达成目标性能所需的最少关键步骤减少了 3 到 4.5 倍,且随着目标要求的提升,节省幅度进一步扩大;通过并行化,实际运行时间(wall clock)最高可缩短 4.5 倍:
此外,Agent 集群的规模化训练极具挑战。为此,我们重构了强化学习基建,并专门优化了训练算法,以确保能达到极致的效率和性能。目前,这一实验性功能已开启 Beta 测试,并将于近期逐步开放。我们期待 Kimi K2.5 的协作能力,能帮你攻克更多难题。
Kimi K2 系列模型发布以来,因为在软件工程领域的出色表现,受到国内外开发者的喜爱。从 Kimi 开放平台的后台数据看,大量开发者将 Kimi K2 系列模型与 Claude Code、Cline、Roo Code、Kilo Code 等 Coding Agent 产品搭配使用。同时 Coding Agent 产品,也越来越展现出更加通用的能力,使用人群正在向非技术人员扩散,未来有巨大的想象空间。
今天,我们正式介绍来自 Kimi 的编程工具:Kimi Code。它不仅能在终端里直接运行,还能无缝集成到 VSCode、Cursor、JetBrains 和 Zed 等主流编辑器中。Kimi Code 可充分发挥 K2.5 的多模态优势,支持直接输入图片和视频进行编程辅助,并能自动发现并将你现有的技能迁移到新的工作流中。
Kimi Code Bench 是我们内部的代码能力评测基准,涵盖从构建、调试、重构、测试到脚本编写等多种端到端任务,支持多种编程语言。在我们的评估中,搭载了 K2.5 的 Kimi Code,相比之前的 Kimi 模型有了大幅度的提升。
从今天起,大家就可以在 Kimi.com 或者 Kimi App 上使用 K2.5 模型。作为 Kimi 最全能的模型,K2.5 提供了四种模式:对于编程用户,我们推荐你把 K2.5 和 Kimi Code 搭配使用。
企业和开发者则可以通过 Kimi 开放平台调用 K2.5 模型的 API。我们在提供 Turbo 级别速度的同时,大幅降低了 API 的价格。