首页 > 科技快讯 > 融资5000万美元,VAST的新阶段和宋亚宸的新命题丨100个AI创业者

融资5000万美元,VAST的新阶段和宋亚宸的新命题丨100个AI创业者



“所有的这些功课都是贪婪和恐惧。”

文丨祝颖丽

编辑丨宋玮

这是 29 岁的宋亚宸当 CEO 的第 3 年。创业的前一半时间,他都在 “布道”:讲 3D 的重要,讲 UGC 内容平台的可能性……过去一年,当市场开始逐渐意识到他的讲述在变成可能时,事情开始加速。

据我们了解,宋亚宸创办的通用人工智能公司 VAST 近期完成了 5000 万美元 A 轮融资,领投方为阿里和上汽,元禾璞华、BV 百度风投、东方嘉富跟投,老股东春华创投和北京市人工智能产业投资基金也在继续加注。

投资人下重注的理由或许是,VAST 的价值在变得越来越确定。

去年 6 月,VAST 上线了 AI 3D 工作台 Tripo Studio 的 Beta 版本,随后在 12 月推出 Studio 1.0 正式版本。正式上线三个月以来,用户规模和收入持续增长,目前平台累计用户已超过 650 万,服务 9 万多开发者及企业。

VAST 的模型能力也依然在进化。不久前,他们刚刚发布了一款高精度生成模型,这个模型生成的 3D 模型质量极高,不仅几何结构干净,甚至能还原管子机械的内部结构、纹路,效果已经与人类专业建模的差距不大。

接下来,他们还有一款面向实时生产流程优化的 基础模型,这款模型的 3D 将生成过程从十几分钟缩短至约 1–2 秒,可用性和可编辑性都极强。

产品节奏也在加快。VAST 预计今年将推出一款面向普通用户的 UGC 交互内容产品。用户可以创作和浏览可互动的 3D 内容,并在社区分享与传播,类似 “3D 版短视频平台”。

快速的业务节奏或许建立在这家创业公司的 “专注” 上。过去一段时间里,宋亚宸说,他最大的命题和自豪是 “抵御了诱惑”——在具身智能、视频生成轮番爆火的 2025 年,他拒绝了诸多业务上的 “捷径”,让公司的愿景和路线图始终没有变化。

作为一个年轻的创业者,宋亚宸和大多数人一样,勤奋而忙碌。他早上 8 点开始工作、晚上 12 点下班,然后再打几个小时游戏——一天最少的时候只睡两三个小时;他甚至有些 “天赋异禀”,能随时插空睡着,自我调侃是 “充电 5 分钟、待机两小时”。

但如此忙碌的 CEO 也许并不正常。在公司,所有人都能随时给他安排会议,他的时间被挤得满满当当;他还事必躬亲,在大量事务和细节上亲自过问。

他开始将这视作不健康的信号,因为这正说明,公司的组织能力还非常欠缺,因此作为 CEO 的他会被 “代偿”。这也变成了宋亚宸接下来一年的新命题。

以下是我们这次交流后筛选出的部分问答。

3D 互动成了共识,今年将推出 UGC 互动内容平台

晚点:你说现在已经进入了一个共识阶段,这个共识是什么?

宋亚宸:游戏跟电影、长篇小说、绘画很像,都是 “精英的” 艺术。但如果有一天真的出现 UGC 游戏,那肯定不叫游戏。就像短视频不叫 UGC 电影,推特不叫 UGC 小说一样。它会是一种新的内容形态,我们称之为轻交互。目前市面上已经出现了一些很火的 UGC 交互平台,只不过还没有统一的定义。

晚点:这个 3D 互动到底在干啥?有哪些内容?

宋亚宸:举个例子,比如你很讨厌老板,于是把你的老板生成了一个娃娃,闲来无事就捏捏他、弹弹他。这是游戏吗?可能不算,但它就是一个 3D 互动。

晚点:但这种场景会很多吗?

宋亚宸:所有用文字、图片、视频可以表达的,都可以用 3D 表达。比如支持谁、反对谁,原先可以发个赞扬或者声讨的文章,以后也可以做个小游戏,朝他献花或者丢鸡蛋。

晚点:那这个 “3D 互动” 的概念具体怎么定义?和文字视频的互动有什么差别?

宋亚宸:人这一生,只要眼睛是睁开的,就一直在进行 3D 互动。伸手、行走、扔石头等等都是。文字和视频都没法做到这样的实时交互,它们只是对 3D 信息的压缩。

晚点: 目前除了 Tripo Studio 这个工具类产品,你们之后的计划是?

宋亚宸:今年我们会有社区类或者说平台类的产品正式上线,直接面向普通用户,用于 UGC 虚拟内容 / 交互内容的创作。我们的产品也可以用于 IP 和工业设计。

晚点:IP 和工业化设计做什么?

宋亚宸:比如你可以定制一个自己喜欢的手办,冰箱贴、钥匙扣、键帽。

3D 生成对普通人来说的最大意义:第一,让每个人都能做工业设计、有自己的 IP;第二,让每个人都能做虚拟内容,尤其是可交互的。

模型进展:我们的脑回路和其他家不太一样

晚点:讲讲你们最新的技术进展?

宋亚宸:我们有两款新的基础模型,准确说是三个基模。两个属于 AI 3D 大模型,另一个是世界模型。

AI 3D 的大模型里,前段时间更新的旗舰模型 Tripo H3.1,对输入图片的还原度、整体结构和局部细节的表达都有大幅提升。还有马上要发的 Tripo P1.0,用了全新的思维方式和算法框架,相当于从底层把 AI 3D 大模型重做了一遍,最终效果是能够在 2 秒内直接生成专业建模师水平的 3D 模型,比市面已有方案提速百倍以上。

这两个最新的技术基本上就是说在行业里是断层领先。



不同版本的对比

晚点:为什么你们能做到所谓 “断层领先”?

宋亚宸:第一个是数据量,我们拥有 5, 000 多万高质量的 3D 模型作为训练数据,这个数据的规模肯定是领先的。第二就是我们的人才,我们拥有行业最顶尖的图形学和 AI 交叉背景技术团队,人才密度非常高。

第三就是,我们的脑回路和其他家不太一样,发明了新的表达形式。以前的 3D 表达形式都是针对人的,更多服务于渲染、编辑与工程管线,例如网格、点云、体素与分层空间结构等。

我们是开发了针对 AI 的训练的表达形式,构建了更适合大规模训练与扩散生成的表示与建模方式,将几何与结构信息以更高效、更可学习的形式组织起来,这样就能利用更多的数据,更大的算力,更大的参数,实现更稳定的高质量生成与可用输出。

晚点:那第二个方向,就是世界模型现在在一个什么阶段?

宋亚宸:我们去年开始重点做世界模型。首款世界模型也会在近期发布。

首先从定义上,我们认为世界模型应该是通用的。

至于实现方式。VAST 做 3D 大模型时走过这样一条路:2022 年底,行业普遍用 2D 图片数据训练。VAST 是第一个提出 2D 与 3D 数据融合训练的——早期图片数据占八成、3D 占两成,随后比例逐步翻转,到 2024 年下半年,行业基本都转向纯 3D 数据。

我们认为,世界模型也会重走这条路。今天大多数人先从视频路线切入,是因为视频数据更方便获取。但从第一性原理看,世界模型的终局应该建立在 3D 空间数据之上——因为世界本身就是三维的。

只不过这段历史阶段绕不开,资本、人才、数据都先围着视频转,就像当年先围着图片转一样。VAST 的做法是先行一步,现在就将 3D 数据与视频数据融合训练,接受从 “视频为主、3D 为辅” 逐步走向 “3D 为主、视频为辅” 的过程。

晚点:为什么你们要从 3D 模型做到世界模型?

宋亚宸:我们创业的初心就是做 UGC 的交互内容平台。

我们认为交互内容平台可能有两种实现方式,第一种是 Tripo + Cursor ,这个很好理解,Tripo 用来造万物,Cursor 用来定规则。

更进一步的方式是通过世界模型,直接生成一个世界。我们的愿景就是做 UGC 的交互内容平台,当然要做世界模型。

晚点:那如果世界模型比较成熟了,你之前说的 Tripo 加 cursor 的这种方式可能就会被放弃,它是二选一的还是怎么样?

宋亚宸:可能相辅相成,也可能是一个八二和二八开的事情。

当 CEO,就是在逐层布道

晚点:接下来聊聊,你作为 CEO 最近一段时间最大的进化是什么?

宋亚宸:从我的角度上,2025 年其实有大量的机会,市场上有很多事情,有很多积极的信息,或者看起来值得做的事情,但我们在坚持一直想做的事情。

晚点:过去一年你的精力的分配,是怎么样的?

宋亚宸:我首先花了很多时间在思考上。技术的发展是比想象中的要快的,大众对于 AI 的接受程度比想象中要快,所以很多本来觉得不用着急形成答案的一些事情,要尽快找到答案,或者要勇敢去定义了。我花了很多时间思考产品怎么定义,平台怎么定义。

再者,2023 年创业之前,我思考了很多事情,探索了很多东西,很多事情逐渐形成共识了。然后我就在思考说那下一个共识是什么。

第二件事情是布道,我希望布道让更多的人在这件事情上能形成共识,让更多的人包括了我们的投资人、客户、创作者,我们团队内部的人,潜在的候选人,当然也包括媒体,能够加入我们也好,给我们支持也好。这个事情肯定在我占比里面也很大。

第三件事情是产品的定义。产品的定义,思考占一部分,更多的其实是和一线的开发者和创作者走在一起,不管是通过比赛活动,还是每周大量的用户访谈。

晚点:你现在在想的新的非共识的东西是什么?

宋亚宸:那我肯定不能讲了,现在。

晚点:你不是在布道吗?

宋亚宸:最先布道的肯定是团队,然后再是比如说候选人,然后是投资人,他可能是一个逐层布道的过程。

晚点:因为技术在变快,大家对 AI 接受度变高,你想要快速给出答案的是什么?

宋亚宸:创业肯定有 mission 和路径的,原本一开始不用想很多非常细颗粒度的东西,到第二年、第三年的时候再去思考这个事情也是合理的,但现在因为事情被加速了,我要提前去思考很多具体画面感的事情。

晚点:具体指什么?

宋亚宸:比如 UGC 的交互内容平台,我们本来觉得这可能是一个需要 5 到 10 年的事,现在变成了 3 到 5 年。

比如它的内容模板,前一百个具体长什么样子?这件事我们做过探索,但一开始没有着急要答案。我们内部有个团队天天在探索这个事情,也两三年了,它可能是个不急的事情,然后现在它更迫在眉睫了,或者说更重要了。

还有包括比如世界模型的一些重要问题,原来我们只是储备一些人才、资金,思考一下大概的技术路线。但现在我们需要更早、更快地思考很多细节,才能真正实现。

晚点:对比三年前的你自己,你觉得最大的变化和成长是什么?哪些发生的事情跟你想象的不一样。

宋亚宸:做公司很像做产品,产品需要迭代,CEO 也是。往玄乎里面说就是要修很多功课,有很多课题,都需要解决。

几乎没有人生下来就是 CEO,他可能有当好 CEO 的品质,就像武侠小说里骨骼惊奇的习武之才,但如果不学武术的功法,到最后可能只剩力气大。

一样的道理,我也有很多工具得学。我觉得自己在认真把自己当产品迭代,包括怎么更好地直面问题、怎么实事求是地讨论、怎么更清晰地沟通、怎么优先考虑公司利益、同时尊重和信任团队等等。有些东西他就是反人性的。

晚点:中间遇到过你觉得最反人性的课题是什么?

宋亚宸:太多了。比如我们喜欢招正直善良的人,但善良的人有时候不愿意直面激烈的冲突、怕伤害别人。

另外,比如很多事情天然有捷径,有看上去更容易的实现方式。那我们如何保持长期主义、从第一性原理出发、不因为捷径和短期诱惑让自己的行为变形?

总结一下,其实所有的这些功课都是贪婪和恐惧,我刚其实各举了一个。

晚点:听说你是工作时长非常长的一个创业者?

宋亚宸:我基本上是这样的,早上 8 点到晚上 12 点之间,大家都可以给我排会,几乎每天都会排满。但这件事情大家其实不用跟我打招呼,就是排我的日程就行了,全公司人都可以,哪怕你是个实习生,都可以给我发会邀。

比如昨天,我从早到晚 8 点到 12 点都有会,吃饭就是跟我们老股东一起吃的,汇报一下近况。

晚点:有的公司的 CEO 说自己是最闲的,你可能确实我聊过的最忙的 CEO ,为什么会这样?

宋亚宸:这个也是我 2026 年的功课。团队也跟我讲了,说你为什么这么忙?是因为你不信任团队,因为你有很多事情在自己做、自己解决,但其实你应该信任团队。如果很多事情都是别人让你帮、你就帮的话,团队永远不会成长。

我觉得这件事情说得很对,所以在我的 OKR 里面,今年有个 KR 就是这个。因为忙不是一件好事,说明你的公司不成熟。

晚点:是。

宋亚宸:当然可能也因为公司发展太快,组织没有那么快适应,它总会 “代偿”。就像锻炼,比如说你举重,手臂力量差你会用你背的力量;腰部力量差,你可能会用你的臀部力量,这件事情是一样的。

组织能力不够的时候,我就会特别累,这其实不是一件好事,代表这家公司还需要做很多功课,包括我自己还得做很多功课。所以忙肯定不是一个我会想装逼或者吹牛的事情,反而我意识到这件事情是不健康的,会想办法有意识地去改进,不管是公司层面上还是我个人层面。

题图来源:VAST 创始人宋亚宸

相关推荐

VAST创始人宋亚宸:聪明的天才过剩,木讷的天才稀缺
对话 VAST 宋亚宸:3D 关乎全人类幸福,也关乎我的
“说AI应用没人投的都是不懂的”
“人与Agent的社交里,有下一个字节的机会”丨100个AI创业者
科亚医疗宋麒:国内第一张医疗AI三类证的诞生
36氪独家丨把亚洲特色商品卖到北美市场,「亚米YAMI」完成5000万美元B轮融资
为什么ClawdBot能带火Mac mini?叶天奇聊Agent电脑丨100个AI创业者
创投日报 | 「三两白」新获两轮共计5000万元融资、「御数坊」获千万元级Pre-A轮融资;以及今天值得关注的早期项目
周亚辉告别昆仑万维
这个 30 克的挂件,是 AI 的眼睛丨100 个 AI 创业者

网址: 融资5000万美元,VAST的新阶段和宋亚宸的新命题丨100个AI创业者 http://m.xishuta.cn/newsview147597.html

所属分类:互联网创业