300 个 AI 和我的八块腹肌 - 蓝狮官网地址

根据最新消息显示，要说这段时间的热门 AI 产品，Codex 必然是绕不过去的话题。

在 Kimi Work 的回复里，Kimi 提到基于本地文件夹的内容，它启动了 11 个专业 Agent 分 3 个阶段并行协作，模拟完整的企业咨询项目组，最终交付 12 份专业文档，覆盖 6 种格式。

或者针对那些从搜索引擎或者内置数据库中找不到的信息，先用 WebBridge 获取相关信息，再通过 Agent 集群来处理，形成各种报告文档。

Anthropic 前几天在 AI 自我进化的报告中，就曾提到，现在的 Agent 早已从 Coding agents 的时代来到了 Autonomous agents 的阶段，核心的变化就是多 Agent 成为了一种新的工作组织方式。

放心 Vibe Working

越来越多人发现，虽然 Claude Code、Codex，都是叫 Code（代码），但这些 Agent 不只是会写代码；它们还能整理文件、分析数据、搜索资料、自动跑工作流，甚至替我们完成一整个项目里的重复劳动。

而调用 Skill 这些都是基本操作，从右侧的上下文部分，我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。

本地文件深度连接，可直接读取和管理本地文件夹，安全护栏机制要求在修改文件前需用户授权。 7×24 小时定时任务（Cron 引擎），支持按设定时间自动执行 LLM 对话请求、Python/Shell 脚本等，如清晨生成简报或夜间清洗数据，可保持电脑唤醒以确保任务运行。 WebBridge 浏览器自动化，通过自然语言指令让 AI 自主操作浏览器，实现跨网页信息检索、深层数据抓取、自动填写表单等。原生接入全球金融市场数据，直接打通 A 股、港股、美股等核心数据源，可在对话中调取财报、分析盘面、进行跨表对账，辅助投资决策。

对大多数国内用户来说，Codex 算是第一个真正迈过这道坎的，虽然 Claude Code 在它之前，但 Claude 难用上，Codex 一键安装，加上接连的体验优化，把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。

聊天机器人负责回答问题，Copilot 开始参与工作，Coding Agent 学会执行任务。如今，随着文件访问、浏览器操作和工具调用能力逐渐成熟，Agent 开始承担越来越完整的工作流程。

对于 Google 这种无法搜索到小红书信息的搜索引擎，用 Kimi 来自动化整个搜索过程，并给出对应的总结，也是一种不错的用例。

我们要求它使用 K2.6 Agent 集群来启动并行协作，根据文件夹内的资料，完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。

早在 OpenClaw 火爆的时期，其实就有类似的趋势，但是龙虾的安装和部署劝退了众多人。叫好的多，真用起来的没几个。这类工具一直卡在同一道坎上，只有会折腾的人玩得转，普通人连门都进不去。

究其本质，都是将从前单一的 Agent 演变成 Agent Team，甚至是一整套高达上百个 Agents 的动态工作流。

过去，知识工作的瓶颈往往来自人的时间和精力；未来，越来越多工作或许会变成另一种形式，人负责提出目标、判断方向和做最终决策，而资料搜集、信息整理、分析研究和文档交付，则由一支随时待命的 AI 团队协同完成。

Kimi 会自动启用一个标签组，所有自动化的操作都在该标签组内的网页上进行，调试过程中，Kimi 会自动输入对应的信息，自动截图查看当前页面状态，也会通过获取页面结构来定位搜索框、帖子内容等信息。

过去几年，大模型产品一直在寻找进入工作的方式。

除了直接使用 300 个 Agent 的能力，配合 Agents 集群，我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API，Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。

除了这种常见的深度研究任务，有了 Kimi Work，我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件，使用对应的工具查看文件内容，汇总这些文件的信息。

开启 300 个 AI 分身

大到工作中需要 300 个 Agents 并行处理的复杂任务，小到平时繁琐的文件整理、操作浏览器等等，都能通过这支 Agent 队伍在后台挂机完成。

这些检索内容、生成报告相关的能力，其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的，Codex 增长最快的知识型任务。统计的数据显示，数据分析任务，周环比增长 110%，而研究和知识产物也排名前三，有将近 37% 左右增长。

为了分析预测，它调用 300 个 Agent 去搜集信息、拆解数据、评估概率，再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样，世界杯预测只是另一种形式的复杂任务。

最后，Kimi Work 产出了六份文字报告、一份测算模型，以及用于汇报的 HTML 和 PPT 文档。

除了网页，还有基于金融数据整理的 PPT、表格等内容，详细地概括了苹果的股价、主要收入、不同地区的收入情况等。

此外，结合我们之前要求它完成行业咨询任务，现在可以让它总结信息，自动撰写文件，选择合适的附件并发送邮件。

在 Kimi Work 的案例里，无论是研究 20 家 AI 公司，还是围绕本地文件生成一整套咨询报告，背后是一组 Agent 自动拆解任务、分工协作、交叉审核，再完成最终交付。

在第二步，Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后，还会自动开启质量审查，利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。

展开任务过程，可以看到有分析组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施，以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。

我们找了一份会议记录，并搜集了一些论文资料和图片数据，累计本地的文件数量达到了十余个。过去使用云端的 Kimi，我们要一个个上传这些文件到网页，现在 Kimi Work 可以直接选择该文件夹作为一个项目，开始 Agent Swarm 进行处理。

这件事放到我们打工人身上，只能是先看 A 公司，再看 B 公司；先开网页，再记笔记；先跑表格，再写结论。但 Kimi Work 这类本地 Agent 的加入，让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。

Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上；而为了让 Agent Swarm 真正工作起来，Kimi Work 提供了多项实用能力。

最后我们得到的分析报告也非常全面，数据表、可视化分析和具体的公司介绍都囊括在里面。更有意思的是，每家公司的详情部分都写着一句「风险」，Kimi 给自己的定位是「估值上涨过快，盈利拐点不明」，而核心竞争力是「长文本、编程能力、智能体、开源领先。」

Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引，我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。

从右侧的进度可以看到它会读取文本文件内容，也能提取 PDF 文件、查看图片文件以及处理 Office 文件等，最后生成的表格也成功列举了所有的文件内容和对应的信息。

打开电脑，面对的可能不再只是一个 AI 助手，而是一整个 Agent 团队。

AI 正在组队上工，学会做个甲方

▲ OpenAI 在《知识工作的下一个时代》报告里提到，Codex 当前周活用户超过 500 万，自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面，虽然开发者仍然是 Codex 最大的用户群体，但知识工作者目前约占用户总数的 20%，并且增长速度是开发者的三倍多。

Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务，另一方面，知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定，Agent 集群的能力迎合了这一需求。

我们先是使用现有的本地文件夹创建项目，在该项目内新建任务，要求 Kimi Work 帮我们整理 20 家值得关心的 AI 公司，分析它们的产品定位、融资动态、核心竞争力等信息，并给出网页报告、PPT 等内容。

本地 Agent+Agent Swarm+WebBridge，这几项能力的综合，让 Kimi 能胜任的场景比单纯的聊天要广泛得多。

Kimi 最近推出了 Kimi Work，也是建立在这个趋势之上的一次尝试；其核心逻辑，就是把底层的 Agent Swarm 模型能力，用可视化界面进行封装，放到了本地电脑上。

使用 WebBridge 的方式也非常简单，按照官方的指引，我们在浏览器上安装好 Kimi WebBridge 的扩展程序，或是直接新建任务，要求 Kimi 帮我们完成安装，它会自动执行对应的安装脚本，在本地处理好 WebBridge 相关的服务。

随便点开其中一份文档，Kimi Work 都不是随便应付，从内容到格式都符合直接交付的标准。

由于涉及的文件过多，Kimi K2.6 Agent 集群这次启动了多个阶段来完成，像是在研究分析的第一阶段，它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。

Kimi 在浏览器中自动化操作了一会儿，就自动为我们生成了这份 Gmail 邮件总结报告。

选择 K2.6 Agent 集群开始任务，Kimi 会自动给任务设置对应的进度，并且使用 Subagent 工具调用多个 Agents 来处理。

美加墨世界杯即将在本周打响，48 支球队、104 场比赛。今年的竞猜选手，也有 AI 一席地。

这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台，到现在已成长为一款适用于任何角色、工具和工作流程，且人人都能使用的生产力工具。

当所有 AI 公司都在押注多 Agent 的产品形态时，四年一度的押注开始了。

针对每份文件，它还贴心地给出了使用场景快速导航，例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html，提交正式咨询报告使用 08_综合咨询报告.docx，投行/研究机构参考是 09_深度研究报告.pdf 等。

当然，德国队最后能不能夺冠，目前还不得而知。有意思的是，在这件事里，Kimi 想证明的可能从来不是自己会不会猜球。

Kimi 一点都不含糊，同样是启用了 Subagent 工具，调用多个 Agents，完成了一份内容丰富的调研报告。

今天 Kimi 发布的这份世界杯预测报告里面提到，连续两届世界杯小组出局的阴影，在公众和市场心理上留下了顽固的「近因偏差」，持续压低了德国的定价；但 Elo 排名、阵容估值和人才储备厚度的硬指标上，日耳曼战车依旧稳居世界第一梯队。

对大多数的知识工作者来说，这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。

这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了，我们要求 Kimi 帮我整理一下苹果这三年来的股价信息，以及每年的财报，分析其中值得的关注信息。

One More Thing

例如我们可以要它「检查我的 Gmail 邮箱，看看有没有过去 24 小时内未读的邮件。把重要的邮件总结一下。」然后，总结的内容全部的保存到本地，甚至是把重要的邮件都保存下来。

Kimi 用 Agent Swarm 功能调动 300 个 Agent，对全部 104 场比赛进行赛前公开预测和赛后复盘，觉得德国队被严重低估了，模型测算显示，德国队基准夺冠概率约11.0%，校准后约11.3%。

更重要的变化在于，完成一项任务的主体，正在从单个 Agent 变成多个 Agent 的协作。

而当生活和工作中，越来越多的事情，我们都能安心交给这 300 个 AI 去完成时，那我的八块腹肌，或许真的还有点希望。

究竟事情将如何发展，我们将持续跟踪报道。