马年春晚舞台上,机器人轮番上台演小品、秀武术、拍电影,完成了一场国产人形机器人的国民级亮相,也引发大量追问:机器人何时走进日常生活?今年初启动试运营的广东省首个异构具身智能机器人训练场——惠阳异构具身智能训练场,或许可以解答一二。

训练场位于惠州市惠阳区科技创新中心。推门而入,几十台形态各异的机器人正在给超市货架摆放商品、收银扫描,在“快递站”分拣包裹,制作咖啡,分类生物医药物料……充满科幻感的“未来”触手可及。细看之下,每台机器人背后都有一位人类训练师在仔细操控。这其实是机器人正在接受不同场景的“职业培训”,过程中产生的海量行为数据,正是让通用机器人顺利走入千家万户的“秘籍”。
与实验室里简单、有限、可复现的场景不同,一旦走入真实世界,机器人将面对无穷无尽的复杂状况。要“智能地”应对一切,还需更多来自物理世界的真实行为数据。具身智能机器人训练场通过搭建真实物理场景与仿真平台,供机器人“学习”人类行为,采集有效训练数据,推动具身智能数据标准化,破解高质量训练数据短缺这一发展瓶颈。
“机器人要有强泛化能力”
“机器人一定要有更强的泛化能力,要能举一反三,达到一定程度后才会出现『涌现』的能力,遇到没见过的东西也能自主应对。”惠阳异构具身智能训练场运营方负责人介绍,目前训练场共划分16类大场景,涵盖康养家庭、酒店客房、工业流水线分拣、生物医药物料分类等,场景维持高频迭代,平均每两周更新一次。上月末,训练场正式产出的首批“数字资产”已陆续交付。
场景均采企业工厂真实环境
训练场中的场景均采用当地企业、工厂的真实环境。机器人在训练师操控下,一遍遍重复人类的精准动作,学习应对不同规格、材质、形状物体时的发力方式与运动轨迹等信息,并生成相应数据。数据经过标注、清洗等技术处理后,留下有价值的高质量数据。基于对这些数据的学习,机器人逐渐形成自己的“手感”,越发灵活地应对现实场景。”必须有足够多的数据去教会它,这个过程和我7个月大的小孩学习拿东西很像。”该负责人说。
制造业基础优势助数据生产
目前,优必选、星尘智能、智元、穹彻智能、浙江人形等国内头部机器人企业的约180台机器人已在此“入学”,包括双足机器人、轮式人形机器人、固定式机械臂等不同构型,预计一年可采集500万条多模态数据,并将持续引入更多本体厂商。据介绍,除场景多元丰富外,不同机器人产生的异构数据同样是增加数据多样性、提高泛化能力的重要维度。
国家“十五五”规划纲要重点布局具身智能等未来产业,构建全链条培育体系,提出强化算力算法数据高效供给,在此背景下,“数据”正成为新的“石油”“黄金”,和未来国际竞争的关键资源。”这类数据的需求是全球化的,中国如果能率先掌握高质量的数据标准,就拥有了话语权。”训练场运营方负责人介绍,中国的竞争优势在于制造业基础,大量的场景和技术工人有助于数据生产,快速填补空白。
自去年起,内地具身智能训练场的建设热潮全面爆发,北京、广州、上海、天津、绵阳等多个城市已陆续建成专业训练场。中国人工智能学会副理事长、清华大学教授孙富春对此表示,建设训练场能推动具身智能数据标准化,将仿真数据与真实数据结合,破解高质量训练数据缺乏的难题。
面临重复采集难共享等挑战
同时孙富春指出,当前具身智能训练场面临两方面挑战:一是对具身智能人形机器人的定义与内涵仍存在诸多不一致;二是现有数据采集途径容易造成重复采集,采集的数据难以使用和共享,缺乏统一评价标准与安全可靠的保障。
据介绍,作为惠阳异构具身智能训练场的运营方,刻行时空主要解决异构机器人接入标准不统一、场景数据价值挖掘不足,以及不同模型厂商数据需求匹配与共享效率不高等问题。运营方认为,未来具身智能产业竞争很大程度上将体现为高质量数据能力的竞争,能够持续生产、组织和流通数据的平台,将成为产业发展的重要基础设施,在这一点上,粤港澳大湾区正走在前列。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
深度