让300亿机器人看懂世界:肇观电子重新定义AI视觉算力新范式

投中网   |   簪竹
2026-05-22 15:25:35  分钟 16    阅读需  4554 字数 

如果未来15年,全球将出现300亿台机器人,而每一台都长着10只“眼睛”——这3000亿只眼睛背后的算力,将由谁来提供?

当具身智能、人形机器人、低空经济……这些曾经只存在于科幻电影中的概念,正以不可思议的速度冲进现实时,一场关于“感知”的算力底层革命就此拉开。那么在这场AI浪潮里,谁会是那个最重要的“卖水人”?

近日,投中网来到上海张江一栋外观素朴的大楼里,发现这场AI革命的基础设施——智能体的“眼睛”,才刚刚睁开,而它的名字叫做“肇观电子”。

公司创始人冯歆鹏告诉投中网,之所以取名“肇观”,源于“肇”为开启、“观”为视觉,合起来就是“开启视觉”之意。

10年磨一剑。投中网获悉,肇观电子已迈入IPO前的最后冲刺阶段,同步推进新一轮融资。至此,在“感知”算力领域,一家中国AI“卖水人”悄然崛起,并成功站上一条比GPU更大的万亿美金赛道。

从AMD到Physical AI:懂芯片、懂算法、懂量产的VPU梦之队

追溯肇观电子的起点,源于“技术狂人”——冯歆鹏的一次抉择。早年间,他任职于AMD,为这家芯片巨头史上最年轻的研发总监。过程中,冯歆鹏又亲手参与、打造了例如HBM、Chiplet等如今支撑英伟达万亿市值的关键技术。

不过,在创业时,冯歆鹏却选择了一条与AMD截然相反的路——专攻VPU(视觉处理器)。

之所以选择VPU领域,按冯歆鹏的话说,这里尚无巨头,肇观电子想要做的,就是成为这个赛道上的定义者。退回到10年前,如果说这个赛道可能还不太被人了解,那么放到今天,GPU的作用是生成世界,VPU就是理解世界。

“当所有智能体都需要看懂物理世界时,VPU就是那个比GPU更大的万亿美金赛道。”冯歆鹏说。

投中嘉川CVSource数据显示,成立于2016年的肇观电子,至今已有10年时间。在这10年中,肇观电子只做了一件事:自研VPU芯片、自研空间操作系统Space OS、自研深度相机与上层算法,搭建起一个完整的“空间智能计算平台”。

在冯歆鹏看来,这不是一个简单的产品策略,而是一场从底层数学建模出发的“第一性原理”式重构。

为何是重构,而不是补充?冯歆鹏认为,究其原因在于:如今GPU尽管全球火爆,但也只不过是30年前一把为游戏世界而生的“旧锤子”。

“从底层架构上看,GPU已有很深的路径依赖,在软件生态上也被捆绑了几十年,无法推倒重来。而物理AI、机器人、无人机等这些‘新钉子’,在用‘旧锤子’去敲时,就会出现‘不匹配’‘不好用’的情况。”

肇观电子的任务,就是要用VPU这把“新锤子”,去敲适配物理AI、机器人、无人机的“新钉子”。

“我们从来就不是在做GPU的补充,而是在做AI领域下一代视觉计算的基础设施。”冯歆鹏总结道。简单来说,肇观电子自研的VPU,就是为视觉理解而生。它从底层架构开始,不需要再兼容三十年前的游戏指令,也不需要为渲染三角形做优化,而是从第一性原理出发,重新定义处理器该如何处理光线、像素、空间结构、时序信息、物理约束等核心的空间智能计算问题。

投中网注意到,在这场底层技术的“重构”中,一支全球顶尖的“造芯梦之队”撑起了这一理想。除冯歆鹏之外,联合创始人周骥博士也是他的老搭档。

履历显示,周骥博士出身于AMD,曾为AMD视频、视觉、图像三个领域的全球最高技术负责人。在AMD期间,两者已共事了20年。

基于对技术发展路径的判断,这对“老战友”于2016年从AMD出走,召集了以毕业于985高校、多数拥有海外学习或工作经验的人才为主,组成全球化团队,开启了一场关于“视觉处理器”的远征。

截至目前,肇观电子凭借深厚的技术积累,成为国家级专精特新小巨人、高新技术企业,并承担国家重点研发专项;同时累计服务200多家客户,视觉方案也成功渗透至工业机器人、无人机、具身智能、短途出行、可穿戴设备等多个应用领域,让其端侧AI视觉算力成为越来越多智能体的“标配眼睛”。

全栈自研,解决“像素爆炸”核心痛点

既然要做AI时代的“新锤子”,肇观电子走的,从来就不是一条传统的芯片公司之路。

与市场上多数纯芯片设计公司不同,肇观电子从最开始就选择了一条更难、但也更贴近客户需求的全栈式自研路径——他们不做单一芯片,而是打造了“自研VPU芯片 + Space OS空间操作系统 + 全栈软件工具链”的一体化计算平台。

从逻辑架构上看,这一计算平台,有点类似于英伟达“GPU+CUDA”的意思。不过,这并不是简单的对标,或者单纯意义上的模仿与技术炫技,而是一种基于产业阶段的前瞻判断。

冯歆鹏向投中网解释,尽管当前空间智能、机器人、低空经济等赛道处于高速发展期,但产业链尚未完全成熟,应用场景与技术模型仍处于快速迭代阶段。在一个成熟价值链中,会经过芯片厂商、模组厂商、方案商、系统厂商、运营服务商五个环节,最终才触达消费者手中。

“目前,具身智能、低空经济等新兴领域的价值链仍在塑形中,远未到分层阶段。这就意味着,客户如果只拿一颗芯片,在商业场景上很难用起来。”冯歆鹏继续说道。

同时,对于下游客户而言,要开发产品的话,既要懂算法,又要懂芯片,还得懂应用场景。这对于大多数客户而言,人才体系建设太难,不仅雇不起,人才也十分稀缺。”

由此,从技术到应用这一步,肇观电子就需要做得“更深、更重”——不仅要芯片自研、操作系统自研,还得软件工具链自研,全栈打通。从底层VPU芯片,到Space OS空间操作系统,乃至再往上一层的InferStudio软件工具链,肇观电子均要实现自主,为客户提供一套完整的服务能力与产业体系。

“只有这样,才能降低应用门槛,缩短落地周期,让客户真正用得起、用得好。”冯歆鹏对投中网说道。依托这样的全栈技术优势,肇观电子首先解决的就是视觉智能领域,最核心的痛点——“像素爆炸”。

冯歆鹏给出的一组数据显示,一帧1080P图片,其包含200万像素,叠加RGB三通道信息后,共计600万个字节;智能设备若以每秒30帧的速度实时处理画面,意味着每33毫秒就要完成一帧海量图像数据运算。

如果这些物理世界实时产生的数据不立刻处理,就会面临数据堆积、流失的风险。面对这样的数据处理压力,业内已明显感到:传统CPU根本无法适配实时运算的需求,通用GPU在解决这一问题的过程中,也十分艰难。

在此背景下,肇观电子的自研VPU,解决了这一痛点。它将原始视觉数据压缩100倍,仅保留核心语义信息,同时获得空间结构信息,在严控延时、降低功耗、压缩算力成本的前提下,实现实时感知、自主避障、精准交互等关键能力。

再者,大语言模型亦是如此:一秒钟的人类语言信息大约有8个Token,而一秒钟1080P视频的信息量可达24万个Token,二者算力需求相差约三万倍。同时,市场已经预警,当前处理文本Token可能消耗掉整个星球的能量。若叠加海量视频视觉数据,基于现有符号系统的计算范式的算力路线,根本算不动。

面对这些需求与痛点,冯歆鹏表示,“肇观电子要做的,就是为全新的基于物理量的计算范式打造算力,从海量信息中抽取少量高价值信息,用高性能计算的方式,来处理时间连续性、空间结构、语义信息、物理约束、因果关系这些空间智能的核心计算问题,从而解决‘算不动’‘处理不了’的现实困境。”

冯歆鹏判断,物理AI真正爆发的标志,不是聊天机器人,而是交通工具智慧移动、无人机自主飞行、人形机器人进入工厂、可穿戴设备“看懂世界”。“未来15年,全球大概率会出现300亿机器人,而每个机器人会有10个眼睛。”他向投中网描述。

在冯歆鹏看来,只要这些智能体想“看懂世界”,他们就需要视觉系统,这意味着无论下游智能体以何种物理形态迭代,但共同的底层需求不变:即在端侧环境下,以实时、低功耗、低成本的方式,感知、理解物理世界。

最重要的是,在视觉密度呈指数级上升后,视觉token带来的算力挑战,会加倍让传统CPU/GPU在端侧实时感知中感觉“疲惫”,由此VPU成为关键。

冯歆鹏指出,未来机器人行业最大的瓶颈,不是模型,而是延迟。抓取、避障、动态位姿调整、实时SLAM、多传感器同步等问题,都要求系统在极短时间内完成“感知→理解→预测→决策”的闭环。肇观电子通过VPU重构视觉计算链路,提供纳秒级多传感器同步、低延迟光流和定位计算、单目、双目、多目3D视觉与边缘时空建模等能力;其Feynman系列深度相机也已广泛服务于机器人与无人机场景。“我们做的不是一个摄像头,而是一个空间智能节点。”冯歆鹏强调。

为此,肇观电子已做好了准备:在深耕10年的过程中,公司一直围绕“筑牢通用智能时代的视觉感知底座”这一核心愿景而展开,致力于成为他们“看懂世界”的第一双“眼睛”。

穿越周期,肇观电子走向下一个10年

从2016年到2026年,肇观电子已整整走了10年。这10年时间里,行业潮起潮落,冯歆鹏也看见身边的人经历变迁。

“对于肇观电子而言,我们在这10年间也经历了很多。”冯歆鹏坦言,在创业之初,肇观电子可能就是一群“技术狂人”聚在一起,我们深耕VPU赛道,在高性能计算的深水区里劈波斩浪。

但10年之后,肇观电子已慢慢在“行业的风浪”里摸爬滚打出来,淬炼出一身更为精准的判断力和服务力。“现在,我们可以自豪地说,获客的命中率,比十年前高了1000倍。”

之所以有这样的自信,源于肇观电子比客户更懂他们。如今,站在AI时代,肇观电子也走到了新的临界点:

在商业上,肇观电子发力的短途出行,已占据垄断性地位,构筑了公司的基本盘;在智能体爆发的工业机器人、无人机、可穿戴设备领域,肇观电子多点开花,抢占市场。“今年,公司的业绩正在实现高增长,未来五年也将进入‘不断翻倍’的状态。”冯歆鹏透露。

在技术上,从VPU芯片到Space OS操作系统,再到InferStudio软件工具链,肇观电子全栈自研的“空间智能计算平台”在一群技术狂人的淬炼下,已经成型并快速迭代。

当然,作为一名创业“老兵”,冯歆鹏也对“价值”二字有深刻感知。在冯歆鹏看来,做一家公司,不能只算自己的账,还要算行业的帐,要算社会的账。“我们从来不做烧200亿,最后只产出50亿的事,这是对社会资源的严重浪费,也是一种价值内耗。每个公司的目标,都应该是创造的价值比消耗的多。”

这种“价值”逻辑已根植于肇观电子服务客户、行业、社会的理念中。对于客户而言,肇观电子提供的从来不是一颗芯片,而是“看懂世界”的完整能力,帮助客户缩短落地周期、降低开发门槛。对于行业来说,肇观电子也选择了一条最难,但最本质的路——从第一性原理出发,用数学建模的方式重构视觉计算,提高行业效率,做全局最优解,而不是局部凑合。

对于社会而言,肇观电子立志用自己手中的技术,温暖更多需要帮助的人。据冯歆鹏介绍,肇观电子推出了一款名为“AngelEye天使眼”的可穿戴智能系统。该体统从具身视觉技术迁移到视障辅助领域,通过第一人称视角观察世界,实时用语音描述环境;还系统集成了摄像头、VPU芯片、视觉模型与语音交互,“相当于用户身边随时有一个AI助手”。

截至目前,这套技术已服务全球超过10万名用户,覆盖15个国家和地区。冯歆鹏认为,这是AI真正落地现实世界的重要方向——AI for good。

这背后不是一个简单的公益故事,而是把最硬核的具身视觉处理技术应用于现实需求中,同时对底层算法的鲁棒性也提出了更高要求,尤其是在复杂、非结构化的真实人类工作和生活环境中稳定运行。这种“渡人”的科技之光,是肇观电子成立10年之后所淬炼出的长期品牌韧性。

从某种意义上看,它超越了传统意义上的企业社会责任。尤其在当今这个商业社会里,技术优势可能被追赶,市场份额可能被蚕食,但一家品牌在用户心中沉淀下来的善意与信任,是最难以被替代的长期资产。

回首10年,肇观电子用坚持,以及AI for good的技术初心,等来了比GPU更大的风口,让这家有技术沉淀、科技向善的公司有望成为万亿美金赛道中的又一家伟大的公司。在AI基础设施“卖水人”的哲学里,肇观电子认为,真正的护城河从来不是某款芯片或某个算法,而是在时间中锤炼出来的判断力、全栈自研的技术底气,以及那份“帮忙不添乱”,推动行业前进发展的善意与初心。

可以预见,在下一个10年,当更多智能体睁开“眼睛”时,肇观电子必然会成为那个让它们彻底看清世界、读懂世界的人。


网站编辑: 郭靖
本文为投中网原创文章,转载或内容合作请点击转载说明,违规转载法律必究
0

全部评论

—— 没有更多评论了 ——
—— 没有更多评论了 ——