机器人干活!面向类家庭服务场景的专项操作基础模型

投中网   |   投中网
2025-05-29 16:40:50  分钟 5    阅读需  1243 字数 

搭载专项场景操作基础模型Zerith-V0,为类家庭服务场景提供快速的解决落地方案。

面向类家庭服务垂直场景(酒店、餐厅等),我们推出了一款轮式人形机器人Zerith-H1(取意Home1)。搭载专项场景操作基础模型Zerith-V0,为类家庭服务场景提供快速的解决落地方案。

为什么要率先做类家庭服务垂直场景的落地?

家庭是通用机器人的终极服务场景,而在奔向家庭这个最复杂泛化、交互性最强的场景途中,我们采取 "垂直场景切入 - 家庭场景延伸" 的梯度推进策略:优先选择与家庭场景高度相似的典型服务业垂直场景(如酒店卧室 / 卫生间、餐厅、后厨)作为突破口。这些场景具备三大核心优势:

1.任务聚焦性:操作流程明确(如酒店清洁、餐食备制、桌面整理),降低对于数据与模型泛化处理复杂度;

2.交互轻量化:初期仅需基础人机协作能力,显著低于家庭场景的多模态交互需求;

3.商业闭环快:通过细分领域规模化落地,快速验证技术可行性并积累真实场景数据。

以自动驾驶为借鉴,验证专项模型可行性

从场景上看,具身智能涵盖任务泛化、对象泛化、背景泛化三大维度。自动驾驶本质上是具身智能的一个子集,已验证 "锁定场景 - 明确任务 - 泛化背景 - 泛化物体" 的垂直落地模式。这提供了可复用的经验 —— 在具身智能领域,同样可通过定义清晰任务边界(如酒店布草整理、餐厅餐桌处理),针对性突破一定范围的物体泛化(各类家具 / 厨具)与背景适应(不同光照、空间布局)的技术瓶颈,打造细分场景专业执行者。

相较自动驾驶的 "零失败容忍" 特性,具身操作允许真实场景中一定程度上的试错操作,所积累的失败数据集可以让算法学会纠正错误操作,形成 "数据采集 - 模型迭代 - 场景验证" 的闭环加速效应。这种特性使机器人能够更早进入真实环境,在动态交互中持续进化决策逻辑。

以类家庭服务垂直场景为切入点,机器人得以逐步攻克复杂度递增的场景,转动从场景数据到多样性数据的往复性飞轮,在真实环境中逐步增强模型能力;也能更早跑入商业小闭环。

Zerith-V0:面向专项场景的具身操作基础模型

目前主流机器人操作VLA模型采用"感知 - 动作"直连架构,依赖堆砌海量数据训练提升适应能力,缺少对操作原理的基础认知。而我们提出的Zerith-V0——采用"认知-行为"双系统架构,以被操作物体为中心构建空间表征,实现原理驱动式的智能操作。

人类的操作智能本质上是分层递进的:首先通过任务目标激发认知系统回滚知识,搜寻任务相关对象的物理结构组成和功能属性。对象先验和拓扑关系用于指导行为系统产生习得性动作,并实时根据主要对象的状态反馈实现行为调整。

数据层面上,划分为知识数据和行为数据。首先学习操作知识数据上,我们通过大规模的视频动作数据来构建。对于行为数据,我们构建了基于下游场景的动作基元数据集。

模型架构层面上,我们搭建了分层双系统的架构——认知系统构建对操作物体的物理属性与功能语义的理解;行为系统则基于物体空间信息映射,实现运动基元的组合优化。两者通过以操作物体为中心的统一空间表征作为交互中间件,屏蔽背景噪声,提升背景泛化能力,让系统更专注于场景任务本身。

「Zerith零次方」致力于打造具身智能时代的技术引擎,加速L2级智能化机器人产品的规模化应用,持续推动通用AGI赋能千行百业、千家万户。目前多个研发岗位火热招募中,欢迎有共同愿景的伙伴加入我们!!!


网站编辑: L
0

全部评论

—— 没有更多评论了 ——
—— 没有更多评论了 ——