小影科技林晓冬：从工具创作到AI原生的三年探索与出海实践

出海 14 年，在 AI 周期里的再出发。

去年以来，出海 AI 原生产品已褪去概念光环，成为实打实的行业新风口，众多创业者纷纷布局，渴望抓住这波发展机遇。

对于涌入这一赛道的新玩家来说，海外市场的吸引力显而易见：付费习惯更成熟，北美和欧洲用户贡献了全球 AI 应用收入的大头，加之 Cursor 等工具的普及让产品落地的门槛大幅降低，一支小团队在短时间内跑出一款可用的产品已不再是难事。

然而，能跑出产品和能跑通商业模式之间，横着一道并不容易跨越的鸿沟。PMF 难以验证、用户留存不稳定、本地化运营经验缺失、合规带来的额外成本......这些都是摆在出海创业者面前的真实挑战。AI 技术能力只是起点，如何把技术优势转化为持续增长的产品，才是真正需要回答的命题。

近期，我们和出海 14 年的小影科技聊了一聊他们近三年来在 AI 原生产品上的投入和成果。去年 9 月，我们已经介绍过其 AI 原生音乐类产品 Rythmix，彼时这款应用上线不到一年便跻身东亚多地音乐榜TOP5。今年，该公司透露旗下又有一款新的 AI 视频生成应用 AI Catch，在欧美、日韩、印度等市场快速起量，上个月连续登顶巴西 App Store 与 Google Play 总榜第一。

与我们对谈的是小影科技 C 端业务 CEO 林晓冬，她于 2018 年加入小影科技，从负责一款视频模板类创作产品登顶印度地区市场，到如今带领公司 ToC 产品板块业务。她透露，截至 26 年一季度末，公司近三年新推出的 AI 原生产品的收入已经超过了过去 10 年研发的工具产品，真正迈入“AI 原生时代”。

在这场高速前进的“AI 革命”中，团队经历了什么？公司已经积累的全球 200 多个国家和地区、超 23 亿规模用户，又扮演了什么样的角色？林晓冬给出了自己的洞察。

（小影科技C 端业务 CEO 林晓冬）

以下是对话原文，考虑阅读体验有所调整：

当产品开始“翻译”用户需求

扬帆出海：为什么特地强调“迈入 AI 原生时代”？

林晓冬：这个问题可以从两个视角来看。

外部看我们，过去大家对小影科技的认知，更多是“出海企业，做剪辑工具的”。而我们目前的业务现状是以多款新的 AI 原生产品成为增长核心，以前的几款剪辑工具则是全面向剪辑 Agent 的方向迭代。

我们自己向内看，这个定义关联的是更底层的东西。团队的组织人才、市场洞察、产品逻辑、本地化策略等等都在契合“AI 时代”这个大环境的变化。

扬帆出海：大概是什么时间公司进入了“AI 原生时代”，到今天为止算是完成了一次成功的转型吗？

林晓冬：没有明确的“完成”时间，只能说是 22 年底大模型爆发以后我们就持续地在寻找创新的方向。到今天为止，一定要说“转型”的话只是一个结果，就是从营收结构上看，最近 3-4 年做的创新业务占比已经超过了我们公司创立前十年做的几款产品的收入。

扬帆出海：“工具”和“AI 原生”这两个阶段有什么差异？这里面最大的变化是什么？

林晓冬：最大的变化是能够给用户带去的体验，以及做产品的逻辑。

工具时代也就是移动互联网那会儿，用户能够做的东西是受限于工具功能和操作能力的，做产品主要就是聚焦功能点的工程化实现。

到了“AI 原生”这个阶段，逻辑有点反过来。用户往往只有模糊的灵感和宽泛想法，没办法精准描述需求，比较明确的是很多用户越来越不满足于简单的创作，很想发挥想象力做一些别人做不出来的东西，而实际上 AI 是有能力承接这些碎片化的创意的。这时候我们的角色，就变成了连接大模型和普通用户的关键桥梁，像需求的翻译官一样。做产品的重心，也从单纯开发功能，转向合理调用模型能力，在垂类场景下做能力适配、体验简化和场景化打磨。

扬帆出海：你们怎么从海量的用户需求中找到真正有价值的机会？

林晓冬：无论是 14 年前还是现在，用户需求本身始终是存在的，技术是那个持续发生的变量。一个产品能不能跑出来，肯定要满足这两个要素，一是实质性的技术突破，为用户带来过去无法实现的新体验，二是击中用户的痛点，这里很多时候是情绪层面的共鸣。

我们内部在具体立项时，主要会看两个标准：一是技术可行性，二是市场空间。

比如我们 AI Catch 这款产品，主打的是基于模板的视频创作，本质上更偏内容驱动，但前提是视频生成效果必须达到好用甚至突破的水平，否则一个追热点的模板做出来没办法给用户带来惊喜，产品就是无效的。

扬帆出海：现在行业都在说“模型趋同、应用破局”，这个趋势对小影科技来说，是机会更大还是挑战更大？

林晓冬：这两年来看，底层模型能力的差距在逐渐缩小，这是一个比较明确的趋势。以及比如在 AI Coding 的加持下，新玩家进场门槛越来越低。在这个前提下，出海的先发优势确实在被稀释。

但当底层模型能力趋同，应用层的竞争中心就转移到“更靠近用户的一侧”，在这个维度我们原有的积累会持续有效，形成一种综合竞争力。可以分为三个层面：

第一，深挖用户需求、透彻理解场景。AI 全球化之后，用户的底层需求其实变化不大，比如“让自己变好看”“更好表达”，但用户往往并不清楚具体怎么实现，这对需求洞察的要求反而更高，在这个点上我们有自己的方法论。

第二，数据积累和业务反哺。我们做的那么多产品，在具体场景中是积累了足够多用户“行为数据”的，团队能够从中抽象出跨市场的行为差异，反哺到产品，也为我们自研垂类模型的持续优化提供数据闭环。

第三，本地化和商业化的增长。我们能在一个新市场快速找到愿意付费的用户、让 ROI 跑正。

第四，对，补充一点，就是团队应对变化的能力。对比工具时代，AI 时代团队思维方式有了很大的变化。一开始刚接触模型，基于过去做产品的传统工程思维，我们更强调规则和可控性，希望模型严格按照预设逻辑执行。但随着模型能力提升，我们也逐渐意识到，过强的约束反而会限制效果空间和创新效率。

AI时代，本地化从共性出发

扬帆出海：公司 22 年到现在做的创新产品能够简单介绍下吗？

林晓冬：我拿两款产品举例。

AI Catch 是一款面向大众用户的 AI 视频生成应用，主打泛娱乐泛社交场景，核心功能是提供海量社媒爆款模板，让用户选择模板、上传照片，AI 自动生成对应风格的短视频，实现“快速表达和复刻”。这款产品上个月凭借一系列亲子家庭玩法，在巴西连续登顶双端总榜第一，在葡萄牙、部分非洲葡语国家也进入下载榜前列。最近在中东阿语地区，也凭借 AI 跳舞玩法快速冲榜。

另一款是 AI 音乐生成应用 Rythmix，除了文生、图生音乐的基础功能，我们还做了从音乐到视频的一体化生成。目前也在欧美、日韩市场保持着较好的增长表现。

扬帆出海：AI Catch 核心玩法是模板，这和移动互联网时代剪辑应用中的模板有什么差别？

林晓冬：模板确实还是一个常见的玩法。在 AI 时代，“视频创作”这个赛道上，模板的作用是给用户一个“AI 可以做什么”的具象化想象。不光是 AI Catch，市场上很多产品也在用类似的方式降低用户的使用门槛。但一款产品能不能完成 PMF，能不能真正跑出来，模板只是最表层的东西。往下一层，有几个关键的因素：

第一是对模型的理解和集成能力。同样的底层模型，不同的团队做出来的产品体验可能差别很大。这涉及到工程化能力、对模型特性的理解。

第二是本地化审美。不同市场的用户对“好看”的定义不同，而且在 AI 时代，内容质量的上限也被明显提高了。AI 生成的画面质感，是移动互联网时代靠滤镜和贴纸无法实现的。

第三是对全球热点的捕捉能力。社交媒体上每天都会有新的流行趋势，我们内部有一套热点捕捉和 AI 模板设计工作流，高度控制上线周期。

扬帆出海：前面提到本地化，这应该是做出海业务绕不开的关键词。AI 原生时代的本地化和过去有什么不一样？

林晓冬：会有不同。之前我自己做产品，本地化是“做深做垂”。比如 2020 年做的 mAst 这款产品主打印度地区，我们深挖人群，语言，地区，做很细化的分类，去垂直向下的找需求，满足用户需求。但是现在 AI 时代，本地化有时候是先看到一个普世的点，比方说一个爆款的玩法，之前宫崎骏那种漫画风格，这个风格如果放到不同国家和地区，用户怎么样才会喜欢？我们考虑的是如何把一个共性的东西适配到本地，思路是反过来的。

扬帆出海：那找到共性以后呢，如何在不同市场实现可持续的规模化增长的？

林晓冬：目前我们几款新的 AI 原生产品的持续增长表现，和我们多年积累的“分发能力”是分不开的，这是一个完整的系统——从找到对的用户，到让他付钱，到让他持续留下来，每一个环节都是分发的一部分。

很多公司把分发理解成渠道问题，觉得找到投放团队就解决了。但我们的经验来看，这是一个环环相扣的问题：获客带来的用户，产品不能接不住；产品接住了，付费路径设计不能出问题；付费跑通了，需求理解不能跑偏否则会导致留存差。任何一个环节断掉，整个链条就不成立。

市场验证是成熟企业的必备素质，即使你看见了一个需求，技术也能够满足，但是产品功能做出来了和用户真正的需求之间还是会有很大的 gap，而我们可以快速通过各种手段完成认知调整，弥补这个 gap。

扬帆出海：AI 时代，新兴市场和成熟市场的用户付费习惯有什么变化吗？

林晓冬：用户的付费习惯确实在发生改变。生成式 AI 让很多以前实现不了的效果成为可能，给用户带来了“aha moment”，创作门槛更低、体验更好，用户也因此愿意为结果付费。同时，大家也逐渐意识到 AI 生成是有成本的，慢慢建立起为 Token 消耗买单的心智。

在付费意愿上，过去我们定义的发达市场比如欧美，新兴市场比如东南亚，还是大同小异的。不一样的是我们可以有产品差异化的打法，在过去的刻板印象上做到新的开拓。

比如在印度市场，过去我们的 mAst 主要依靠 IAA 变现，而现在新产品 AI Catch 采用“订阅+ AI 积分包”的模式，同样能够取得不错的收入表现。本质上是因为每个国家都有相对固定的高价值用户群体，AI Catch 触达到了使用 iOS、具备付费能力的人群；而 mAst 本身是广告驱动的产品形态，在订阅或付费转化上相对更难。

扬帆出海：开头提到过去的几款剪辑工具向剪辑 Agent 的方向迭代，大概是怎么做？

林晓冬：比如 VivaVideo，这款我们 2012 年就推出的产品，主要面向泛生活视频场景。一开始我们是把高频使用的剪辑功能AI化，如智能字幕、人声识别等；现在则是着重探索 AI 剪辑能力，比如通过 Agent 意图识别，帮助用户把上传的日常碎片化内容一键成片。

再比如前面提到的 mAst 属于音乐模板类产品，我们也希望给用户体验 AI 的玩法，但是考虑到用户的付费能力，我们会更多通过模型微调和工程优化来控制成本，在保证效果的同时提升体验，希望推动更广泛用户享受到 AI 带来的创作能力。

通用模型趋同，技术优势何在

扬帆出海：前面提到随着大模型兴起，你们做了一些应用探索，具体是一个怎么样的过程？

林晓冬：我们是在 2022 年底大模型刚出现的时候开始尝试了很多方向，比如证件照、表情包生成、社媒文案生成等，也包括自研模型训练。也有一些产品跑出了不错的效果，但整体来看，很快遇到两个问题：一是生成效果还不够稳定，用户体验存在波动；二是通用大模型迭代很快，自研能力容易被快速追平。

在这个过程中，我们也明晰了团队优势，搞清楚什么是我们的核心能力，什么是可以借力的地方，把主要精力集中在擅长的方向。

大概在 2024 年下半年，随着大模型能力持续成熟，我们判断 AI 原生应用的落地条件已经基本具备，于是开始系统性推进产品化。

扬帆出海：那现在公司核心技术聚焦在哪些方向？如何赋能 AI 原生产品落地？

林晓冬：大模型爆发之前，我们的技术能力主要集中在音视频引擎和端侧 AI 两个方向，积累了大量的自研算法。现在我们更多考虑的是把这些底层原子能力和外部大模型的能力结合起来，进行组合式创新。可以分为几个方向：

第一，基于开源模型进行音视频垂类模型研发，并结合自研算法能力打磨场景化功能，比如 Rythmix 中的 AI 音乐 MV 生成；

第二，结合主流大模型与 LoRA 微调能力，构建图像与视频特效生成的整体技术框架，并打通从模型后训练到工程化部署的完整链路。

在做AI 原生产品的过程中，我们逐步意识到应用层产品现在的核心竞争力之一就是工程化能力，把分散的 AI 算法整合成稳定高效的产品工作流，并在效果、成本与用户体验之间取得平衡，并且能够快速迭代上线。目前我们 AI Catch 这款产品的模板生产工作流，就是基于这样的思路，保证创意和效率。

扬帆出海：现在通用大模型能力越来越强，应用层玩家还有必要投入垂类模型吗？

林晓冬：有必要，垂类模型的研发，本质上是从用户场景出发，而不是从模型本身出发。我们关注的重点不是“做一个模型”，而是“解决一个具体创作场景的问题”。

通用大模型的进步是显而易见的，很多以前需要专门训练的能力，现在调个API就能解决。但我们在实际产品开发中发现，通用模型的边界比想象中更清晰——它擅长处理语言和通用视觉任务，但一旦涉及音视频创作中的时序关系、节奏感知和多模态配合，效果就会明显下降。

以音乐 MV 生成为例，用户的核心诉求是画面跟着音乐“走”——节奏点要对，情绪要匹配，视觉动态要有韵律感。这不是一个“理解内容”的问题，而是一个“感知时间结构”的问题。通用模型在这个维度上没有经过专门优化，生成结果往往在视觉上说得过去，但一放到音乐里就出戏了。

这就是垂类模型存在的理由——不是为了做模型而做，而是通用能力在某个场景里有结构性的短板，需要针对性地去补。我们做的事情本质上是：用垂类模型覆盖通用模型的盲区，再把两者的能力拼成一个完整的场景解决方案。

扬帆出海：在垂类模型和多种 AI 能力逐步完善之后，这些能力在产品层应该怎么组织？你们是否会走向更 Agent 化的创作体验？

林晓冬：肯定会，不过我们对 Agent 的理解，偏向于从用户需求出发，而不是技术形态本身。

目前我们会面对两类用户：对普通用户来说，障碍不是不会用工具，而是很难把脑海里的想法表达清楚——怎么讲一个故事、怎么描述一个画面，这本身就是一件有门槛的事。对专业创作者来说，问题不同，他们更需要的是把多个能力高效串联起来，完成完整的内容生产流程，而不是在不同工具之间反复切换。

这两类需求看起来不同，但指向的是同一个方向：让技术退到后台，让用户只需要专注于表达自己想要什么。这个也是 Agent 的本质——缩短用户意图和用户产出之间的距离。

而为了实现这一点，技术层需要做的就是把各种已有的能力模块化，我们在音视频领域本身就已经积累了很多的自研能力可以被拆解和复用，在整个基础上我们还需要不断扩展能力边界，包括针对具体场景研发新的垂类模型，有效整合外部大模型的能力，把外部和内部的能力统一纳入可编排的框架里。

用新的产研范式应对无穷变化和可能

扬帆出海：从负责具体一款产品到管理整个公司 ToC 业务，有什么想要分享的变化和感受吗？

林晓冬：最大的变化肯定还是注意力的聚焦，时间的分配。之前做产品，时间都花在关注产品功能，解决问题，现在这一部分跟具体产品有关的指标肯定还是会去看，但是更多经历会放在完善团队搭建，用对人。

另一部分更重要的精力是去看行业趋势性的变化，比方说剪辑创作 CLI 化（指令驱动的创作方式），我会更多去思考这种变化会怎么样影响到业务，Agent 框架这样的形态运用到我们的产品中，有什么可以被替代和改造的。就会去理解赛道、场景、用户。

我自己是学动画和数媒出身，毕业后先进入了设计行业，但是发现离用户太远，很难直接定义用户的需求，也就很难去服务好用户，当时要做一个好的设计门槛太高，就想能否通过工具降低理解和服务用户的门槛，所以转去做了产品。

我比较喜欢关注不同的人是怎么表达自己的。比如疫情前我在印度待过一段时间，和当地创作者聊得比较多，发现他们核心的需求其实很简单，就是快、容易上手，同时能够表达和展现自己。这段经历让我会更关注，产品功能是否真正满足了用户的真实诉求，工具只是基础载体，创意和个人情感的表达才是用户真正想要去传递的东西，这和现在 AI 带来的可能性也不谋而合。以前是我自己去直接看用户、聊用户；现在更多是通过数据、内容反馈，还有不同团队的协作，去理解用户。

扬帆出海：你现在搭建团队，完善组织架构，觉得怎么样才能符合“AI 原生时代”的标准？

林晓冬：先说团队吧，我们现在正在实践一种新的产研团队范式，研发的路线偏向于全栈，而不是按照职能去划分。我们不会去约束单一岗位的作用，而是打破岗位的边界，让每个人都要更加的全面去洞察用户需求。比方说产品经理就不会像移动互联网时代那样只关注产品方案设计，而是可以去借助 AI 能力，视角延伸到上下游的协作方甚至全链路。

再说个人，我觉得保持对世界的好奇心肯定是最重要的。因为 AI 技术飞快地迭代，不同的用户表达、创作的差异越来越大，没有兴趣去洞察，就很难做出有真实感的产品。其次的话就是兼具理解用户和技术的能力，你不一定要会写那个代码，但要理解技术背后的能力。最后可能就是比较强的学习和适应能力，因为 AI 领域的变化是非常快的，我们很难依赖单一的固定路径和经验，而是需要不断尝试和调整。

扬帆出海：回到应用层面，AI 原生时代下，应用层新的产品形态层出不穷，对于小影科技来说会有什么变与不变吗？

林晓冬：不变的是我们会持续锚定在 AIGC 影像领域，这是我们十几年积累所在，也是我们认为未来最值得深耕的方向。在这个赛道里，让普通用户不需要学习如何跟 AI 沟通、就能得到想要的创作结果，这个产品理念也不会变。AI 越强大，这件事反而越重要——技术演进的终点，应该是门槛越来越低，而不是越来越高。

变的是我们服务的用户边界和产品深度。过去我们更多面向泛生活场景的大众用户，接下来我们会往 Prosumer 方向走得更深——也就是那些有真实内容生产需求、愿意为效率和质量付费的专业创作者。这类用户对产品的要求完全不同，倒逼我们在能力建设和技术壁垒上有更高的标准。

原文链接：点击前往 >

文章作者：汪酱

版权申明：内容仅供网友参考学习。如有侵权，请联系客服，扬帆出海欢迎行业优质稿件投稿。扬帆出海为您提供中国互联网出海权威资讯，提升出海认知；对接全球企业合作资源，构建企业本地化壁垒；10万+出海从业者社群，帮助打通行业人脉。更多资讯关注扬帆出海官网：https://www.yfchuhai.com/