它石智航 WIYH 数据集正式开源:全球首个具身 VLTA 多模态数据,加速具身智能真实世界落地
作者
2025-12-30
4次阅读
人工智能

12月26日,它石智航重磅开源了全球首个大规模真实世界具身 VLTA(Vision-Language-Tactile-Action)多模态数据集——World In Your Hands(简称“WIYH 数据集”)。该数据集旨在解决具身智能领域高质量真实世界数据稀缺的难题,加速具身智能在真实世界的落地进程。WIYH 数据集采用首创的“Human-centric”(以人为中心)采集范式,填补了现有数据储备的巨大鸿沟。其核心亮点如下:* 规模庞大与场景丰富:包含超过10万条真实人类操作视频,涵盖40余种任务类型、100多种人类技能及520余种真实物品,还原了商超、工业、家居等10种核心场景。* TARS Datacore 数据引擎:配套构建的云端数据引擎实现了全流程自动化标注,包括原子任务、图像感知(含深度与掩码)及视觉语言标注,帮助机器人理解操作逻辑与空间关系。* 基准测试表现优异:在视言大模型空间推理测试中,该数据集展现了独特的空间感知价值;在世界模型验证中,显著提升了视频生成的物理一致性和动态性;在跨本体迁移实验中,引入人类视频辅助后,机器人操作成功率从8%暴涨至60%。它石智航创始人陈亦伦博士表示,开源数据集是为行业通用具身基座模型训练提供关键语料。目前,该数据集及商用级数据解决方案 TARS SenseHub 已正式开放访问。
科技洞见