前不久,我们写了一篇《投资人盯上了这5个00后》,描摹了行业里关注度最高的具身“小天才”。今天,其中一家又宣布了新一轮融资。
我们获悉,LiberAI已完成数亿元Pre-A轮融资,由顺为资本领投,凯辉基金、元禾原点、慕华科创等知名机构跟投,老股东红杉中国、真格基金持续追加。5月,他们刚刚宣布了近5亿的种子轮、天使轮和天使+轮融资,由真格基金、红杉中国、美团龙珠、顺为资本等联合押注。
新融资的阵容,有两点值得一提。一来,红杉中国已连投三轮,持续押注。真格基金自独家种子轮投资后,同样连投三轮。二来,在世界模型这个新趋势上,凯辉在海外领投了杨立昆(Yann LeCun)的公司AMI Labs,在国内则押注了LiberAI。
从科研的角度看,在大语言模型后,世界模型是接棒的新潮流。它的核心目标,是让AI能够像人类一样构建一个对外部物理环境进行理解和模拟的模型——不只是看懂世界,而且能够预判动作会对世界产生怎样的影响。OpenAI、谷歌和微软等顶级科技公司,以及杨立昆和李飞飞等AI领域最具影响力的学者,都在把资源和注意力集中在这个方向上。
然而,同一个World Model,各有各的理解。既然是在百家争鸣的时代,那么短期内,很难说哪种技术路线最终能跑出来。因而在这个赛道上,00后新锐才能和学界泰斗站在同一个起跑线上,掌握着定义新技术和新趋势的权力。我想这也许便是凯辉同时投了AMI Labs和LiberAI的原因。
那么LiberAI切入世界模型的角度是什么呢?
按抽象一点的说法,世界“应该用什么形式来表示”,是当下各方路线分歧的核心,由此催生了当下竞争最激烈的几大技术流派:
以OpenAI的Sora和谷歌的Genie为代表的视频生成派,核心思路是用海量视频数据训练模型;以李飞飞创立的World Labs为代表的3D空间智能派,是从3D空间出发构建世界;以英伟达的 Isaac和Genesis 为代表的物理引擎派,则把规律和数据写进代码;Yann LeCun为代表的隐空间预测(JEPA)派,不具象地画世界,转而在隐空间里直接预测世界状态的变化;以英伟达GEAR的DreamZero为代表的世界动作模型(WAM)派,则在预测世界的同时,同步输出动作。
在强化学习、物理引擎等各种技术路线中,LiberAI 选择重注预训练——原生物理模态的预训练。“从GPT-3到今天,各行各业,大语言模型、视频模型、自动驾驶,其实最底层的逻辑就是预训练,从数据中挖掘智能。”从本质来说,预训练是给AGI打地基,在此基础上,才能通过后训练等方法塑造各种能力。“在当前阶段做预训练是第一性正确的事情。”
而预训练有自己的挑战。物理数据在现实中极度稀缺,直接和视频混合训练效率极低,很容易导致模态不均衡。WAM派的缺陷就在于此。为了解决这个问题,LiberAI通过模态对齐的方式在物理空间和视频空间建立对应,用数据多的视频空间的泛化性去补足物理空间,提出原生物理模态的预训练范式。
刘松铭,00后清华特奖得主,Al for Physics背景,师从视频生成领域的大牛朱军,2023年博士阶段转向具身研究。兼具物理、具身和视频基础,自然是做世界模型的理想人选。看学术成果,他主导发布全球首个使用大规模预训练+扩散Transformer范式的基座模型RDT-1B,领先硅谷公司的PI-0模型一个月。次年,他先于Generalist的GEN-0模型,提前一个月发布首个使用大规模UMI无本体人类数据预训练范式的具身模型RDT-2。
在交流中,刘松铭说自己相比“学术雕花”而言,更感兴趣的是“物理 AGI 的主线任务”。上述两项学术成就,恰好能体现这一思路,助推他在行业内积累起名气和势能。2025年底,当他决定创业,便快速组建起了一个涵盖模型、数据和硬件整建制的创始团队。他将从这段经历中获取到的经验总结为“真诚才是必杀技”。
4个月后,LiberAI发布了一款高自由度灵巧操作具身基础模型,这体现的是一家初创公司的模型构建及训练能力、全栈工程组织力。
LiberAI的另一特点是,虽然切入的是世界模型,但不只做算法和软件,数采、硬件和模型在这家公司的建构中是紧密相连的。有投资人朋友告诉我,他相信软硬一体能跑得更快,LiberAI是国内最接近Genesis路线的全栈公司。“在硅谷,不管Genesis 还是 Sunday,也都在讲全栈的工程化和系统性的东西。”
上周,我和刘松铭聊了近两小时,谈了谈他的成长经历,以及对技术和创业的理解。小时候目睹父亲创业对他的影响深远——扛着压力创业,在他看来是一种很酷的生活方式。跟他聊完,我有些明白为什么这么多顶级VC和产业大佬都抢着投这个年轻人。毕竟,兼具学术能力和创业素养的00后可不多见。
科技浪潮更迭太快,转眼具身赛道已经分出两代人。这些00后主导的具身公司在起名字这件事上也展现出了新一代的审美和思考角度。刘松铭谈到为什么给这家公司起名叫LiberAI。拥有做选择的自由,于他而言,是人生意义的重要组成。落到业务层面,机器人正是他设想中帮助人们从繁重的工作中解救出来,获取更多选择自由的关键一环。
以下是对话内容节选,略作编辑:
王兴问技术细节,雷军爱问软素质
刘燕秋:美团和顺为投你,你都有见过他们的老大吗?
刘松铭:对,都见过。王兴总是线下见的,雷总是线上见的。
刘燕秋: 还挺好奇,你们都聊什么了?
刘松铭:我个人的感觉是,两个人聊天的风格差别还是挺大。我印象里和王兴总交流时,全程聊的基本都是细节,能看出来他对业务钻研很深,会具体落地到一件事该怎么做、会遇到哪些工程层面的难题、同行竞品都落地了哪些方案等等。
但和雷总沟通的风格完全不一样,雷总聊天更偏向软性素养层面。他提问大多是偏软性的问题,我印象很深,他总爱问凝练总结类的问题,比如:能不能用三句话描述你的创业感受?还有不少同类问题,像是创始人最重要的核心素质是什么。
刘燕秋:所以当时针对雷总问的创业感受这个问题,你是怎么回答的?
刘松铭:第一点,是我内心的真实感受。热情是撑过漫漫雪夜的明灯。创业特别像在刺骨的雪夜行走:你要不停地走,去某个远方;暴风雪非常大,每走一步都要耗费好多能量,看不清前面有什么。但你的手里有一盏煤油灯,靠近灯的地方非常温暖。你会聚集一大群人跟你一起走,但大家手里都没有灯,全仰仗你的这盏灯获取温暖。这盏灯无论如何都不能灭。这盏灯既是热情——你对做的事情充分相信,对自己的 vision非常有热情;也是意志力——你会非常坚定去做这个事情。哪怕是最艰难的时刻,哪怕你自己心里也没底,你也要不断给团队信心。所以说创业其实挺反人性的。
第二个感受,创业是信仰被摧毁又建立的过程。你对自己做的事情充分相信。但很快有一些事实告诉你这东西是错的,你得快速摧毁你的信仰,建立一个新的。不断摧毁和不断产生信仰的过程中,让人很容易有两面性:一方面你要非常坚定,很坚定你想做的事是对的;另一方面你要保持一定怀疑,这个事也有可能确实不对。当真的有一些迹象出现的时候,绝不能沉浸在幻想里,试错之后要快速调整,去做下一个对的事情,你得比你的对手调整更快。
最后一个感受,想要在这个游戏里面取胜,离不开快准狠。
首先是要专注。创业公司跟大公司不一样,资源是有限的,对创始人的要求会很高,特别是做技术,你对技术的判断要尽可能准,要专注地去做一个事。这样你才有足够的资源在单点投入上压倒对手。
其次是要极致。专注做一样事,还要把它做成极致,比别人想的更多、更进一步,才有可能在竞争中获得优势。别人只做 80%,你有能力做到 180%,可能就是一个碾压的优势。如果每一个环节都跟对手做的差不多,其实没啥意义。
最后是快。速度是创业公司的生命。快的前提是你把这事要想清楚。很多时候不够快,不是因为熬夜熬得不够多,或者大家不够卷,而是因为创始人没有想清楚,或者说创始人自己有点摇摆。把这事想得特别清楚,能提前算出一些可能的风险,对快来说非常重要。
预训练是当前最第一性的事情
刘燕秋:现在世界模型还处于百家争鸣的阶段,你也在这个跑道上,你是怎么理解世界模型的?
刘松铭:在我们的视角里,世界模型最核心、最有价值的点,是它在尝试建模物理因果。
以往的视频模型,几乎没有因果建模的能力。视频本质上只是建模相邻帧之间的状态转移关系。
举个例子:前一帧画面是你伸手准备抓水杯,后一帧画面是你抓起了水杯。伸手这个动作,并不代表一定能抓起水杯。能不能抓起来,核心是你对杯子施加了力,是物理作用力导致了结果的发生。但视频模型捕捉不到这层逻辑。世界模型不一样,它会把物理模态纳入考量,建立因果层面的推理逻辑,“强迫”模型基于物理action推导世界state的转移。
从“刻舟求剑”到“知其所以然”,这是学习范式的一个革命。
刘燕秋:听下来很有那个“第一性原理”的意思。
刘松铭:对,因果性比相关性更好泛化。对于VLA来说,vision一旦变了就很难泛化。而世界模型记住的是state和action之间的因果关系,这个关系是普适的。
刘燕秋:那么你们打算怎么实现这种能力呢?
刘松铭:我们觉得预训练是当前阶段最第一性的事情。我们选择重注这个方向。从23年到今天,其实大模型成立的本质是预训练。没有一个好的预训练基础模型,再怎么做微调和RL都是overfit。
所以我们整个团队都是围绕预训练去构建的——我们两位创始人都是具身领域预训练的专家,模型团队吸纳了许多大模型预训练人才,数据Infra的团队有很强的工程背景。
现在预训练的拦路虎是物理数据稀缺,如果直接和纯视频混训很容易导致模态不均衡的问题。视频容易淹没稀缺的物理信号。我们的解法是对齐。在数据多、泛化性强的视频空间和数据少的物理空间之间建立桥梁。用视频模态的泛化性去增强物理的泛化性。
这是一个“四两拨千斤”的效果,十分之一的数据能有一百倍的泛化性。
从小我就觉得创业的人生是很酷的
刘燕秋:聊聊你自己的情况。你的家庭背景是怎样的?过往有哪些事情把你导向现在创业这条路?
刘松铭: 我是2000年出生,童年的时候,父亲刚好在早期创业。他特别忙,每次见到他的时候,旁边都会围着很多同事,或是在应酬。我时常能感受到创业给这个家庭带来的压力,也经常听到父母在讨论怎么处理危机。
正面影响也有很多。第一,小孩子下意识都会模仿父母。从小我就觉得,父亲这样的人生特别酷,扛着压力打拼的生活才有意思。第二,我觉得他很喜欢他的工作。虽然压力特别大,但自己能掌控一摊事,而且不断有进展的感觉是会上瘾的。
我在思考我的人生选择时,时常会“灵魂出窍”。我好像在玩一个游戏,操控着叫做刘松铭的角色。这个事情特别有意思,它会让你不会把结果得失看得那么重,让你很享受这个过程。这会让我更容易选择一些大胆的事。这个选择的背后可能是更精彩更好玩的人生。玩游戏不就是为了“节目效果”嘛。
刘燕秋:那你是顶级的玩家心态,做事把体验过程当成目标,而不是非要执着拿到某个既定结果。
刘松铭:目标肯定是有的,创办公司的目标就是打磨优质产品,但这个目标不会变成束缚自己的枷锁。不是做完一个产品就结束了。
我的目标是成为商人科学家
刘燕秋:你是通过化学竞赛进的清华,本科时做AI for physics,PhD阶段转到具身,每一步的选择都是怎么做出来的?
刘松铭:回应我之前说的关于风险偏好的问题。我所在的省份竞赛的实力比较弱,而我如果通过高考的方式上清华会很吃亏,因为我的语文不好。
所以我去拆解这个问题:我们省没有那么多金牌,是因为我们的教育资源没有那么发达。我可以通过一些方式去请外省的教练来培训我,加上我有一个聪明的大脑,这个事肯定可以 work,这是第一性原理。
如果我相信这个事情可以 work,我是真会去冒风险去试的,于是就来了清华。
刘燕秋:你当时是怎么决定从AI for physics转向具身的方向,是因为当时风口起来了对吗?
刘松铭:那个时候的绝对热点是 GPT 出圈。我当时就在想,我要创业,我要找下一个 GPT时刻,我就在盘下一个时刻会在什么样的领域。
AI for physics 可能会更远一些,它的数据没有那么好获取。另一个领域是视频。视频的数据很多,已经有一些人做了一段时间了,我觉得这不是我的timing。机器人这个事刚刚好,它的数据还不多,但有增长的潜力,它没有那么晚,我有机会可以去做。加上我从小就对机器人的概念很感兴趣。
刘燕秋:你一方面你有创业者的基因,或者说家学熏陶,另外一方面你在学术上的能力也很强,这两方面能力同时在一个年轻人身上具备很难得。
刘松铭:某种程度上有一些巧合,另一方面这也是我规划的结果。清华特别好的特点是创业氛围特别浓厚。我记得我当时本科时候参加过清华创协、启创计划,也跟一些优秀的前辈去交流过。
那个时候我就已经有一些判断,时代的重点会从传统商业逐步走向硬科技,刚好是清华又是一个很硬科技的地方。所以我当时的计划就是,我要创业,要去做硬科技。
刘燕秋:这两件事在你人生中的比例大概是什么样子的?做研究的部分和创业的这个部分。
刘松铭:让我排一个序,我觉得创业肯定是主要的。我首先是一个商人,其次才是科学家,终极目标是商业成功和市场扩张。
我很少“雕花”,“真诚才是必杀技”
刘燕秋:那我看你在学术方面其实也拿下了非常多的成就,所以你觉得自己在这方面是有天分?
刘松铭:我不觉得我在学术方面很有天分。虽然说我的影响力很大,但其实我不是很擅长写文章,做一些很漂亮的 paper,来评奖。
要归纳一下我为什么能有影响力,我觉得真诚是必杀技,人是会有共鸣的。实话说,工作本身并不novel 和 fancy,没有那种很巧妙的一个公式。但我一直在做的是具身的“主线任务”——探索并推动 Scaling Law。这个是能引起大家的广泛共鸣的。
刘燕秋:这是跟你们清华务实的精神有关吗?
刘松铭:对,我觉得挺有关。另外也有点哲学的感觉,有时候无心插柳,容易柳成荫。
刘燕秋:那你来讲一个你在转向具身方向之后研究的很具体很务实的问题吧。
刘松铭:我就讲 RDT2 就好。当时大家面临的问题就是没有数据。那个时候大家做的很多是遥操的数据,问题在于成本会很高。
我们的方案就是 scale up无本体的UMI夹爪数据。我们不再需要一个机器人,人类自己戴着夹爪就能到处去采数据,当然效率就高了。想法非常直接和简单。它的难点在于它很麻烦,很 dirty,你要做很多工程才能够把这个想法变成现实。
刘燕秋:是哪一年开始做的?花了多长时间?
刘松铭:我们是 2024 年底开始做,2025年发布的工作,做了一年的时间。这个周期特别长,一般来说厉害的同学几个月就可以做一篇文章,但我两年的时间就做了两篇文章。其实从 ROI 来看,并不是一个特别划算的事。
以自由命名公司
刘燕秋:你觉得自由这件事很重要吗,因为我看你们公司叫LiberAI。
刘松铭: 对,我觉得自由非常重要。
刘燕秋: 自由怎么重要到你需要把它当成你们公司的名字?
刘松铭:人生最终的结局都是注定的,所以过程非常重要,而过程里自主选择的权利就成了本质。这种自主选择的权利就是自由,自由选择如何度过自己的人生,“为所欲为”嘛。那是什么阻碍了我们自由选择呢?除了金钱之外,那就是我们有太多琐碎的事情要做了。
但现实有客观规律,世上的劳作不会凭空消失,没人愿意做的脏活累活,总得有人承接。从整个社会视角来看,一部分人清闲自由、随心生活,就必然有另一部分人被琐事束缚、失去自由。我就在思考,有没有办法让全人类都拥有自由,人人都能支配自己的时间、选择想做的事。从第一性原理推导,几乎只有一个解决方案:创造一种载体,替人类承接这些繁杂工作,这个事物就是机器人,这刚好和我们公司的vision契合。
刘燕秋:但很多人工作初衷的只是谋生,不是为了享受工作的乐趣,如果机器人取代了他们赖以糊口的工作怎么办?
刘松铭:早年人力车夫靠拉车谋生,汽车普及之后,人力车夫这个职业慢慢消失,但社会整体就业岗位并没有缩减。生产力进步的过程里,一定会源源不断诞生新岗位。行业更迭虽然会带来短期阵痛,但长远来看,从业者最终会转向条件更好的工作。同理,未来琐碎繁杂的工作交由机器人承接后,社会对体力劳动的需求越来越少,但人类会不断催生新需求,社会结构也会随之转变。
刘燕秋:大家现在会说,人类现在所剩无几的优势可能就是这副并不完美的肉身,是人类的具身性,因为脑力工作现在更容易被 AI 取代。但如果世界模型和物理AI大规模应用,那是不是说人类连所剩无几的优势也不存在了?
刘松铭:人的存在不是为了工作,反过来,工作的目的是为了更好地存在。如果 AI 能取代人的所有工作,那人就都不工作好了,没必要比个高低。我的观点是,人的存在本身就是意义。人活着去选择自己想要的事情,决定如何过完自己的一生,尝试各种新奇体验,这就是价值所在。
全部评论