根据最新消息显示,为一组照片摆了十几个 pose、拍了几百张废片,回到家想挑两张让 AI 修一修,结果 AI 说「请精准描述你的需求」。
在实测中,这也是最让我感到惊艳的一款新品。以前的通用 AI 视频工具往往「读不懂音乐」,最多只能傻傻地对个鼓点。但 MVLAND 的底层做到了对音乐结构、节拍、情感的深度理解。
连学都不用学,把口播交给「开拍」
如果你是一个不懂 HSL、不懂骨相蒙版的新手,平时就不知道该怎么手动修图,Picchi 无从学习你的修图模式,它便提供了一种「借用审美」的解法。
下面跟大家分享下我真实的使用体验,用的时候我的标准也很简单:东西能不能一次出对、比从前省了多少功夫、到底适合谁,给出的东西对我又有多大用处。
P 图也有一套 Skill
工具越强,人反而越累。我们好像都默认了一条潜规则:AI 越厉害,人就得越拼命去追、去学、去写小作文讨好它。
而即将在 6 月 30 日上线的 Artflo 则走的是灵感创作路线。它保留你的判断,把概念影像那套又长又绕的创作流程压短,让过去一条动辄几十万的概念视频,用 AI 几百块就能做出来。
审美这种事本来就是个性化的,我每次都是凭着自己感觉在 P,要想描述清楚到底该怎么 P,相当不容易。 说给人都难解释清,何况说给 AI。
而开拍 AI 助手的出现,让过去这种传统的工作流直接升级,口播创作变成了真正的「不用你想、不用你拍、不用你剪」。
往回看,这也正是美图这两年种种变化的落点:从 App 到 AI Agent,工具复杂度的债由 AI 扛,不再甩给用户;从订阅到算力点消费,你买的是「成果」,费用跟着算力点走,功能权限退到后面;从成熟组织到 AI 创新组织,就是要适配新时代的需求……
在「学 Ta 修图」旁边,Picchi 还提供了一系列的预设,这些预设包含了当下的热门照片风格,像是 Pocket 3、理光负片、Xs Max、徕卡 DL7、鲜花增色、CCD 等不同的相机和场景。
把 8 款产品挨个体验下来,我的感受是:8 款产品合在一起,确实拼出了一套「AI 影像团队」。
根据实际工作流对比,同样做一支精致的 MV,通用视频工具要 3 小时,MVLAND 只要 10 分钟,且画面情绪与音乐节拍严丝合缝。
AI 影像,开始从生成走向交付
当我说出「修出冬日萧肃氛围感」时,它能自动调整面部暖调光和发丝微光,同组提示词直接出片,不需要像以前那样频繁「抽卡」碰运气。
我发现其中有几款,恰好压在我天天犯怵的地方:人像修图、口播、做图,趁着假期我还是一款款真上手用了下来。
在演示中可以看到,剧本、角色、分镜全在画布上可控可改,角色和场景可以跨项目复用,发布后数据还能反哺下一集。
Picchi 的价值核心就在于,它背后虽然是一支由调色、妆造、形象、打光、体态各司其职的 AI 修图师团队,但用户不必知道复杂的底层参数,只需要看到「真的像我、真的好看」。
你可以直接在里面选用官方合作的「百万改妆师」或者「骨相修图大拿」等合伙人模型,直接在 Picchi 首页找到学 Ta 修图,里面就囊括了 Hana、哦基儿、Iris、清颜好困啊等模型,还有热门预设和灵感玩法。
美图把这件事拎出来,做成了「交付式 AI」,AI 负责生成,也要把最终好不好用这件事扛到最后。
面对AI,我只想说一句,「我要美」。结果就是它修了十张,没几张是能用的,还有几张根本不像我自己。
例如,我们可以直接把出门旅游,拍的实际上原图一股脑批量丢进去,Picchi 就会根据之前总结的自定义图片模型,依照我们想要的风格,把照片统一编辑好。
这项全新的功能叫「开拍 AI 助手」。过去拍一条口播,我们要先想好文案、架起设备面对镜头,最后还要调整剪辑轨道。
值得注意的是,「学我修图」是 Picchi 采用顶级显卡、前沿算法以及高质量渲染来实现的,所以它对上传照片的要求也非常严格。
运营二十年的站酷,其价值正是「相信一份作品背后那个鲜活的人」,这也为美图的 AI 提供着高视觉标准、AI 资产库和效果工作流。
例如照片必须足够清晰足够大,照片的人脸区域也必须足够大,此外也只能上传同一人脸的照片,你帮其他人修的图不能和你自己的放在一起。
这一步,恰恰是行业最容易跳过的。大家都忙着比「生成式 AI」谁生得更快、更炫,可用户要的是一次更好的商业判断,一条能直接发的视频,一支情绪真的对得上的 MV。
如果说开拍解决的是个人表达,美图设计室解决的则是商业生存。
我尝试扔进去一段粗糙的口播素材并选定网感模板,它会自动剪掉气口、加字幕、配 BGM 并直出成片。
我们从网上找了一些相机直拍的原图,然后放到 Picchi 中使用「学 Ta 修图」来进行修改;依次使用了哦基儿、Iris 和 Hana,最终呈现的高光面部提亮和骨相微调,是真的很像专业大拿坐在你身边亲自操刀的手笔。
打开 Picchi 应用,首页找到「学我修图」,上传 3-10 组前后对比图,Picchi 就会创建一个专属我们自己的修图模型,它能自动记忆我们的修图风格。
我的答案是,它走到了把成果交付当成底线这一步,它没有把 AI 说成万能药,只一件件啃小众刚需。它始终站在用户和创作者那一边:靠效果驱动,少谈数据驱动。
▲美图生产力场景多款 AI 影像产品
而 AI 修图的终点除了要有更强的参数,更应该是懂你的那个人。专注人像这一件刚需,让 Picchi 反而做到了通用大模型做不到的「真的像你」。
▲ 开拍 生成的自动字幕和花字视频
给每首歌都能拍个大片的 MVLAND
这两年我越来越觉得,现在的 AI 工具有点像越买越贵的智能健身器材,功能堆得越来越满,可大多数人扛回家,只用来晾衣服。
再派出一支专业团队,直接交付
先从那款最戳我痛点的产品 Picchi 说起。通用大模型逼我们「精准描述需求」,说到底还是人在迁就 AI;Picchi 反过来——让 AI 来迁就你。
设计师、灵感型创作者、要规模化生产的企业,三类人需求差得很远。但美图想干的是同一件事:让 AI 来适应你,再对交付出去的结果负责。
所以回到最初那个问题:美图「让 AI 适应人、对结果负责」,到底走到哪一步了?
实测中,我上传了一张商品实拍图,输入商品卖点,它就能生成市场分析、场景图、卖点文案以及多尺寸电商海报的整套物料。
发布会上,美图公司首席产品官陈剑毅说了句挺朴素的话:
少则几万、多则几十万的成本,两三月的制作周期,让 MV 成了少数头部的特权。这叫视频时代的「音乐遗憾」。我们做 MVLAND,就是想把这个遗憾补上。
如果说 Picchi 解决的是「懂不懂你」,MVLAND 解决的是情绪和画面的对齐,那么在这次美图影像节上带来的另外几款产品,美图设计室、开拍和 RoboNeo,则将这种「直接交付成果」的底气,带到了更硬核、更需要全流程托管的商业生产力场景。
开拍的好用,是它让我们连学都不用学,它懂用户的生意,直接帮我们做视频,我们只需要把自己要传递的内容表达清楚,它会把成片这个「结果」直接交付。
吴欣鸿在现场提到一个数据:在这个短视频时代,有超过 80% 的年轻人是通过刷视频发现一首新歌的。然而现实是,市面上绝大多数的歌,根本没有 MV。
在「像不像我自己修的」这一项上,如果满分是 100 分,我愿意打 90 分。因为测试的时候,我上传的原图和对比图,其实就是简单的修了一些光,以及皮肤。在使用「学我修图」时,Picchi 很好地抓住了这些习惯。
如果说 Picchi 搞定的是静态人像的动态审美,那么另一款重磅新品 MVLAND,则把触角伸向了更注重情绪共鸣的音乐视频领域。
这也是 RoboNeo 出力的方向,也是短剧规模化最难的一环,一致性与可持续。
它们的场景覆盖范围相当广,涵盖了口播、电商、MV 和短剧,但落点出奇一致,那就是最终交付的,必须是一件能直接拿去用的成品。
最终,把 AI 产品的及格线,从「生成」抬到了「交付」。
硬要挑一处不足的话,就是创建次数确实太有限了,以及处理的时间还是有点久。
在口播领域,美图推出了由导演、营销、拍摄、剪辑 Agent 组成的口播团队——「开拍」。这次更新,它实现了从选题到拍剪,再到成片和数据复盘的全托管。
规模化生产短剧的 RoboNeo
把一首歌扔进去,音乐分析 Agent 会自动拆解节拍、段落与情绪并生成画面。
做比想容易太多了,很容易让人产生一种我在创造价值的幻觉。但交付给用户好的成果,帮用户赚到钱,才是真正的价值。
它完美解构了一支专业 MV 必备的 5 大要素,拥有理解音乐、人物演绎、视觉风格、情绪编排、歌词字幕等功能,并行业首创了「画布剪辑台」。
为了检验它的能力,我挑了四个层层递进的场景,看它到底做没做到。
这一整套物料,能直接帮助用户进一步完善自己的营销方案,包括判断、选图、写卖点……美图设计室几乎是把「能不能卖货」的压力也扛了下来。
人、灵感和定制需求也在这套系统里
看着那些 AI 生成的 P 图,我很想知道,到底是我不会用 AI,还是 AI 根本没想过要懂我?
但这种「记住你是谁」的能力,相当于直接把我们过去繁琐的 P 图 流程直接打包成了一套 Skill,它也能在批量精修时展现出更大的优势。
如美图创始人吴欣鸿所说:从「用户学工具」,到「用户直接获得结果」,从事实来看,这支 AI 影像团队交出的答卷,确实不太一样。
结果有点出乎我意料,它们和其他 AI 产品比起来有点「非主流」。别的产品让人去适应 AI,美图是让 AI 来适应人;其他人是只丢给你一个工具,美图会把能直接用的成果,交到你手上。
至于面向短剧规模化生产的 RoboNeo,则直接模拟了一个真实的剧组,配置了编剧、选角、导演、美术、执行、运营等 Agent,它主打四大核心能力:懂短剧、镜头可控、资产沉淀和数据闭环。
虽然这个影像团队还有很多空间,Picchi 的专属模型训练时长,Artflo、RoboNeo 短剧新版、MeituHub 正式版也还得等正式上线才见真章。但有件事我越来越确定:美图这次是真正多走了一步,把焦点落在了「给你结果」这件事上。
它通过市场洞察、内容策划、视觉创作、数据分析等 Agent 以及几十个专业技能,能够一次交付全套商业物料。
而在「学我修图」和「学 Ta 修图」之外,那些我们常常挂在嘴边、说不清道不明的「氛围感」,Picchi 现在也能用自然语言准确拆解。
而为了让这支团队运转得更稳、更远,美图还布下了三块重要拼图。
这种全托管让很多个体户和创作者松了口气。根据开拍一些真实用户的体验,一位实体店老板娘提到,以前自己是「拍摄 5 分钟、剪辑 5 小时」,现在用开拍十分钟搞定。而快速产出的短视频获客,也让店铺业绩翻了 2.5 倍。
前几天 APPSO 来到美图影像节,他们一次发了八款产品,号称是「AI 影像团队」,这个节奏确实很 AI 了,但影像设计这个领域的 AI 产品实在太卷了,美图这次有什么不一样呢?
以往用 AI 修图,最痛苦的莫过于每次都要重新打长串提示词,而部分 AI 的指令遵循能力不够强,还经常修改了表情,改到根本不像本人。
一张商品图,变成一套卖货素材
实测的过程中,我尝试把一些平时 PS 的照片丢给它学偏好,再上传新原图,它能从原图和修后图中间找到完整的修图细节,直接 Get 到我的修图偏好。
这几款产品虽然场景各异,但它们合在一起,才真正撑起了「你的 AI 影像团队已就位」这句话;团队的意义,就是替你把结果交付到底。
▲ 我们使用美图设计室内的爆款视频,给制糖工厂的小电拼生成了一段 15s 的小视频。
首先是作为人力底座的站酷(ZCOOL)。当人人都能产图,大家对 AI 生成内容的「信任」反而成了稀缺品。
最后是 8 月 5 日推出正式版的MeituHub,它接住了标准化产品够不着的那 20% 规模化需求。用户只需要用大白话把需求说清楚,专家 Agent 就会替你搭出一条 AI 影像生产线,既能生成网页应用,也能通过 API 嵌入企业原有的流程中。
当整个行业忙着证明「AI 有多强」,美图在证明的是另一件事:AI 到底能不能对你有用、对你的结果负责。前者制造焦虑。后者,才在终结焦虑。
AI 产品到底成不成,最后都得落回这句话上:不看它生成了多少,看你有没有真的用上,有没有真的拿到那个结果。
业内人士认为,这一变化将对相关行业产生深远影响。