作为人工智能和机械工程的横截面,类人形机器人逐渐从实验室转变为现实生活中的应用。其中,体现智能的突破尤其重要 - 它不仅需要机器人具有“思考”的能力,而且还需要通过身体与环境之间的实时互动来完成复杂的运动。
2025年3月7日,大学的教授赵明古(Zhao ),加速进化的首席科学家,在2025年在2025年实验性的智能机器人开发大会上发表了主题演讲,题为“像人类一样踢足球 - 对人形机器人的腿和脚的实施方案”。 Zhao教授将机器人足球作为系统地探索腿部和脚上具体的情报问题的切入点。
1。人工智能的挑战性进化
由于IBM的“深蓝色”计算机在1997年击败了世界国际象棋冠军,因此迫切需要在人工智能领域的新标准。尽管(2016年)的突破引起了人们的关注,但它们的本质仍然是一个静态的决策问题。相比之下,机器人足球被提议是一个更具挑战性的新目标 - 联盟成立于1996年,并树立了一个愿景,以在2050年到2050年实现人类机器人胜利。
1。国际象棋和机器人足球的比较
关键差异:机器人足球需要解决分散操作的问题(禁止依靠场外计算机),实时动态响应(例如避免障碍,协作)和硬件 - 算法协作优化,这实际上是体现智能的全面改进。
2。技术验证和早期练习
早期的实验验证了端到端自动启动小型机器人的可行性。使用模拟环境训练增强学习策略,机器人可以实现基本功能,例如狩猎和踢球,但是由于硬件计算能力和传感器精度的局限性,它仍然需要外部摄像机来协助定位,并且无法应对高强度的对抗。尽管这些实践是原始的,但它们证明了分布式决策和动态控制的可行性,并且还暴露了硬件性能(例如关节驱动器,能源效率)和算法鲁棒性(例如多机械协作策略)中的瓶颈。
近年来,一系列技术突破集中在机器人跌落后迅速起床的问题,涉及高维运动计划(多关节协调),复杂的碰撞检测(地面接触点优化)和抗干扰能力。
全球研究团队通过多元化的方法克服了这一挑战:Zhao Yang的团队在 的团队中模拟了人类基于三维空间动态建模的快速崛起和运动;上海北大大学优化了提高速度的联合驱动策略; UIUC使用增强学习框架来实现自适应培训。共同的目标是通过算法概括(例如两阶段课程学习)与不足的硬件兼容,以在2.5-3秒内实现稳定的上升,并适应复杂的场景,例如坡度地面和负载干扰。
3。机器人足球的具体智能含义和未来前景
机器人足球的具体智能含义反映在感知运动的整合,分散的协调和反干扰鲁棒性中。视觉定位需要动态运动的实时闭环。 11机器人需要做出独立的决策并共享本地信息(例如球位置,对手的运动),同时涉及不可预测的因素,例如碰撞和环境突变。这种情况更接近人类现实世界的复杂性,需要在硬件和算法之间进行深入的协调。
当前的技术瓶颈包括电动机功率和耗散限制高强度运动,模拟现实差距(例如摩擦偏差会导致政策迁移失败)以及多机通信延迟问题。未来的开发方向涵盖了混合控制模式(结合了AI独立决策和人类远程干预措施的“物理电子竞技”)和全身智能合作(扩展到多任务场景,例如攀岩和骑自行车)。同时,需要通过硬件创新(高功率密度电动机,长期电池)和改进的算法鲁棒性(跨性别概括功能)来实施该技术。
2。
1。团队发展历史
人类机器人足球队成立于2004年,已经参加了很长时间的活动,并赢得了许多奖项。该团队已经经历了多代机器人迭代:
初始阶段:专注于学生竞争并专注于基本运动控制;
工业化合作:2023年,团队的核心成员成立了一家加速的进化公司,致力于开发人形机器人产品。 2024年,加速的进化机器人和T1机器人接一个地揭幕,表现出强大的运动能力和聪明的表现。
2。技术实施路径
团队采用了增强学习框架,将模拟和物理实验结合在一起:
模拟训练:在虚拟环境中,训练机器人进行步行,反干扰和动态障碍避免功能;
物理部署:将政策迁移到物理机器人,并通过视觉系统实现环境感知和目标定位。
例如,在回答“倒下后快速起床”的问题时,团队提出了一种两阶段的学习方法:
基本阶段:训练机器人在简化平面环境中完成前后运动;
加强阶段:引入复杂的干扰(例如坡度地面,负载压力)以提高障碍抗性。
最终策略连续下降了20次,只需2.53秒,就可以实现稳定的沮丧。
3。在混合控制模式中创新
为了应对复杂的游戏方案,团队提出了“ AI +手动遥控器”的混合模式:
常规场景:机器人做出独立的决定(例如踢足球和避免障碍);
例外处理:人类操作员干预以解决AI无法应对的紧急情况(例如政策冲突或环境突变)。
该模型被定义为“物理电子竞技”,结合了人工智能的实时响应和人类全球判断的优势。
3。人形机器人踢足球的核心技术挑战
1。在动态环境中的多任务协作
运动控制:有必要实现稳定的步行,快速转向和抗冲突性;
视觉感知:实时设定球,进球和对手的位置,并动态调整策略;
多机械合作:11个机器人需要共享信息并在进攻和防御方面合作,以避免决策冲突。
2。优化硬件和算法之间的兼容性
关节驱动:提高电动机功率和响应速度以满足高强度操作需求;
模拟现实差距:通过战略概括(例如模拟训练中的预设联合力量限制)来补偿硬件不足。
3。例外处理和鲁棒性改进
突然的干扰:例如被击中地面,球路径突然发生变化,等等,您需要快速恢复并调整策略;
长期稳定性:确保机器人在长期比赛中保持性能(例如散热,能量管理)。
4。摘要
人形机器人的开发标志着从单个功能到全身协作的飞跃。踢足球是一个典型的挑战,不仅可以验证动态环境中的技术可行性,而且还为通用人工智能提供了实用的框架。将来,随着硬件性能和算法创新的改善,人类机器人有望在更多领域中重现人类运动的智慧,并最终实现“人类”的自主性和适应性。
(本文是根据“ 2025综合智能机器人开发会议”的速记草案编写的)