根据最新消息显示,要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。
在 Kimi Work 的回复里,Kimi 提到基于本地文件夹的内容,它启动了 11 个专业 Agent 分 3 个阶段并行协作,模拟完整的企业咨询项目组,最终交付 12 份专业文档,覆盖 6 种格式。
或者针对那些从搜索引擎或者内置数据库中找不到的信息,先用 WebBridge 获取相关信息,再通过 Agent 集群来处理,形成各种报告文档。
Anthropic 前几天在 AI 自我进化的报告中,就曾提到,现在的 Agent 早已从 Coding agents 的时代来到了 Autonomous agents 的阶段,核心的变化就是多 Agent 成为了一种新的工作组织方式。
放心 Vibe Working
越来越多人发现,虽然 Claude Code、Codex,都是叫 Code(代码),但这些 Agent 不只是会写代码;它们还能整理文件、分析数据、搜索资料、自动跑工作流,甚至替我们完成一整个项目里的重复劳动。
而调用 Skill 这些都是基本操作,从右侧的上下文部分,我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。
本地文件深度连接,可直接读取和管理本地文件夹,安全护栏机制要求在修改文件前需用户授权。 7×24 小时定时任务(Cron 引擎),支持按设定时间自动执行 LLM 对话请求、Python/Shell 脚本等,如清晨生成简报或夜间清洗数据,可保持电脑唤醒以确保任务运行。 WebBridge 浏览器自动化,通过自然语言指令让 AI 自主操作浏览器,实现跨网页信息检索、深层数据抓取、自动填写表单等。 原生接入全球金融市场数据,直接打通 A 股、港股、美股等核心数据源,可在对话中调取财报、分析盘面、进行跨表对账,辅助投资决策。
对大多数国内用户来说,Codex 算是第一个真正迈过这道坎的,虽然 Claude Code 在它之前,但 Claude 难用上,Codex 一键安装,加上接连的体验优化,把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。
聊天机器人负责回答问题,Copilot 开始参与工作,Coding Agent 学会执行任务。如今,随着文件访问、浏览器操作和工具调用能力逐渐成熟,Agent 开始承担越来越完整的工作流程。
对于 Google 这种无法搜索到小红书信息的搜索引擎,用 Kimi 来自动化整个搜索过程,并给出对应的总结,也是一种不错的用例。
我们要求它使用 K2.6 Agent 集群来启动并行协作,根据文件夹内的资料,完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。
早在 OpenClaw 火爆的时期,其实就有类似的趋势,但是龙虾的安装和部署劝退了众多人。叫好的多,真用起来的没几个。这类工具一直卡在同一道坎上,只有会折腾的人玩得转,普通人连门都进不去。
究其本质,都是将从前单一的 Agent 演变成 Agent Team,甚至是一整套高达上百个 Agents 的动态工作流。
过去,知识工作的瓶颈往往来自人的时间和精力;未来,越来越多工作或许会变成另一种形式,人负责提出目标、判断方向和做最终决策,而资料搜集、信息整理、分析研究和文档交付,则由一支随时待命的 AI 团队协同完成。
Kimi 会自动启用一个标签组,所有自动化的操作都在该标签组内的网页上进行,调试过程中,Kimi 会自动输入对应的信息,自动截图查看当前页面状态,也会通过获取页面结构来定位搜索框、帖子内容等信息。
过去几年,大模型产品一直在寻找进入工作的方式。
除了直接使用 300 个 Agent 的能力,配合 Agents 集群,我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API,Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。
除了这种常见的深度研究任务,有了 Kimi Work,我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件,使用对应的工具查看文件内容,汇总这些文件的信息。
开启 300 个 AI 分身
大到工作中需要 300 个 Agents 并行处理的复杂任务,小到平时繁琐的文件整理、操作浏览器等等,都能通过这支 Agent 队伍在后台挂机完成。
这些检索内容、生成报告相关的能力,其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的,Codex 增长最快的知识型任务。统计的数据显示,数据分析任务,周环比增长 110%,而研究和知识产物也排名前三,有将近 37% 左右增长。
为了分析预测,它调用 300 个 Agent 去搜集信息、拆解数据、评估概率,再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样,世界杯预测只是另一种形式的复杂任务。
最后,Kimi Work 产出了六份文字报告、一份测算模型,以及用于汇报的 HTML 和 PPT 文档。
除了网页,还有基于金融数据整理的 PPT、表格等内容,详细地概括了苹果的股价、主要收入、不同地区的收入情况等。

此外,结合我们之前要求它完成行业咨询任务,现在可以让它总结信息,自动撰写文件,选择合适的附件并发送邮件。
在 Kimi Work 的案例里,无论是研究 20 家 AI 公司,还是围绕本地文件生成一整套咨询报告,背后是一组 Agent 自动拆解任务、分工协作、交叉审核,再完成最终交付。
在第二步,Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后,还会自动开启质量审查,利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。
展开任务过程,可以看到有分析组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施,以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。
我们找了一份会议记录,并搜集了一些论文资料和图片数据,累计本地的文件数量达到了十余个。过去使用云端的 Kimi,我们要一个个上传这些文件到网页,现在 Kimi Work 可以直接选择该文件夹作为一个项目,开始 Agent Swarm 进行处理。
这件事放到我们打工人身上,只能是先看 A 公司,再看 B 公司;先开网页,再记笔记;先跑表格,再写结论。但 Kimi Work 这类本地 Agent 的加入,让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。
Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上;而为了让 Agent Swarm 真正工作起来,Kimi Work 提供了多项实用能力。
最后我们得到的分析报告也非常全面,数据表、可视化分析和具体的公司介绍都囊括在里面。更有意思的是,每家公司的详情部分都写着一句「风险」,Kimi 给自己的定位是「估值上涨过快,盈利拐点不明」,而核心竞争力是「长文本、编程能力、智能体、开源领先。」
Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引,我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。
从右侧的进度可以看到它会读取文本文件内容,也能提取 PDF 文件、查看图片文件以及处理 Office 文件等,最后生成的表格也成功列举了所有的文件内容和对应的信息。
打开电脑,面对的可能不再只是一个 AI 助手,而是一整个 Agent 团队。
AI 正在组队上工,学会做个甲方
▲ OpenAI 在《知识工作的下一个时代》报告里提到,Codex 当前周活用户超过 500 万,自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面,虽然开发者仍然是 Codex 最大的用户群体,但知识工作者目前约占用户总数的 20%,并且增长速度是开发者的三倍多。
Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务,另一方面,知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定,Agent 集群的能力迎合了这一需求。
我们先是使用现有的本地文件夹创建项目,在该项目内新建任务,要求 Kimi Work 帮我们整理 20 家值得关心的 AI 公司,分析它们的产品定位、融资动态、核心竞争力等信息,并给出网页报告、PPT 等内容。
本地 Agent+Agent Swarm+WebBridge,这几项能力的综合,让 Kimi 能胜任的场景比单纯的聊天要广泛得多。
Kimi 最近推出了 Kimi Work,也是建立在这个趋势之上的一次尝试;其核心逻辑,就是把底层的 Agent Swarm 模型能力,用可视化界面进行封装,放到了本地电脑上。
使用 WebBridge 的方式也非常简单,按照官方的指引,我们在浏览器上安装好 Kimi WebBridge 的扩展程序,或是直接新建任务,要求 Kimi 帮我们完成安装,它会自动执行对应的安装脚本,在本地处理好 WebBridge 相关的服务。
随便点开其中一份文档,Kimi Work 都不是随便应付,从内容到格式都符合直接交付的标准。
由于涉及的文件过多,Kimi K2.6 Agent 集群这次启动了多个阶段来完成,像是在研究分析的第一阶段,它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。
Kimi 在浏览器中自动化操作了一会儿,就自动为我们生成了这份 Gmail 邮件总结报告。
选择 K2.6 Agent 集群开始任务,Kimi 会自动给任务设置对应的进度,并且使用 Subagent 工具调用多个 Agents 来处理。
美加墨世界杯即将在本周打响,48 支球队、104 场比赛。今年的竞猜选手,也有 AI 一席地。
这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台,到现在已成长为一款适用于任何角色、工具和工作流程,且人人都能使用的生产力工具。
当所有 AI 公司都在押注多 Agent 的产品形态时,四年一度的押注开始了。
针对每份文件,它还贴心地给出了使用场景快速导航,例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html,提交正式咨询报告使用 08_综合咨询报告.docx,投行/研究机构参考是 09_深度研究报告.pdf 等。
当然,德国队最后能不能夺冠,目前还不得而知。有意思的是,在这件事里,Kimi 想证明的可能从来不是自己会不会猜球。
Kimi 一点都不含糊,同样是启用了 Subagent 工具,调用多个 Agents,完成了一份内容丰富的调研报告。
今天 Kimi 发布的这份世界杯预测报告里面提到,连续两届世界杯小组出局的阴影,在公众和市场心理上留下了顽固的「近因偏差」,持续压低了德国的定价;但 Elo 排名、阵容估值和人才储备厚度的硬指标上,日耳曼战车依旧稳居世界第一梯队。
对大多数的知识工作者来说,这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。
这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了,我们要求 Kimi 帮我整理一下苹果这三年来的股价信息,以及每年的财报,分析其中值得的关注信息。
One More Thing
例如我们可以要它「检查我的 Gmail 邮箱,看看有没有过去 24 小时内未读的邮件。把重要的邮件总结一下。」然后,总结的内容全部的保存到本地,甚至是把重要的邮件都保存下来。
Kimi 用 Agent Swarm 功能调动 300 个 Agent,对全部 104 场比赛进行赛前公开预测和赛后复盘,觉得德国队被严重低估了,模型测算显示,德国队基准夺冠概率约11.0%,校准后约11.3%。
更重要的变化在于,完成一项任务的主体,正在从单个 Agent 变成多个 Agent 的协作。
而当生活和工作中,越来越多的事情,我们都能安心交给这 300 个 AI 去完成时,那我的八块腹肌,或许真的还有点希望。
究竟事情将如何发展,我们将持续跟踪报道。