九游(NINE GAME)体育·官方网站-感受九游魅力

九游体育 - 智能体育科技12年领军者 | 2000+机构信赖的体育机器人解决方案

图片名

全国订购热线:
15102956922  

主页 > 新闻动态 > 公司新闻

公司新闻
活动公告 公司新闻 健身指南 器材保养 常见问题

Science Robotics封面!DeepMind强化学习打造超一流机器人球员

作者:小编 发布时间:2026-01-22 14:50:24 次浏览

  双足机器人运动技能突破!谷歌DeepMind创新深度强化学习框架,赋能仿人机器人全身控制,征战足球赛场。机器人展现惊人动态技能,跌倒自恢复,战术防守

  双足机器人运动技能突破!谷歌DeepMind创新深度强化学习框架,赋能仿人机器人全身控制,征战足球赛场。机器人展现惊人动态技能,跌倒自恢复,战术防守样样精通。

  AI和机器人专家的长远目标,是创造出具有一般具身智能的代理,它们能够像动物或人类一样,在物理世界中灵活、巧妙地行动。

  这不仅涉及流畅的动作组合,还包括对环境的感知与理解,以及利用身体实现复杂目标的能力。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图1)

  多年来,研究者们致力于在仿真和真实环境中创造出具备复杂运动能力的智能化身代理。

  尽管四足机器人的应用已经相当广泛,但人形和双足机器人的控制仍然面临着诸多挑战,包括稳定性、安全性以及自由度等问题。

  不过,近日Google DeepMind在仿人足球领域取得了突破性进展——

  研 究团队不仅 展示了深度强化学习 如何孕育出高质量的个体技 能,如精准 的踢球、快速的奔跑和灵活的转身,更将这些技能巧妙地编织成一套 敏捷的反应策略。

  目前,相关成果已发表于《Science Robotics》,并成为该期的封面论文。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图2)

  研究人员采用ROBOTIS OP3机器人平台,这款微型仿人机器人经济实惠,拥有20个可控关节,其灵活性足以应对复杂的足球动作。

  在训练中,机器人仅依靠板载传感器如关节位置加速计和陀螺仪来感知环境,并通过板载计算机计算目标关节角度,实现精准的动作执行。

  为了确保机器人能够实时掌握球场动态,研究团队还使用了实时运动捕捉系统,实时监测两个机器人和球的位置。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图3)

  为了测试这些技能的实战效果,研究人员精心设计了一场简化的单对单足球比赛。

  这种巧妙的游戏设定,使得机器人能够在不断试错中,逐步学会如何在激烈的对抗中保持优势。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图4)

  在训练过程中,研究人员采用了分布式MPO这一非策略强化学习算法,对机器人进行了多阶段的仿真训练。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图5)

  他们首先训练了两个teacher策略,分别负责站立和射门,随后通过KL正则化方法将这两个策略融合,形成一个student策略。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图6)

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图7)

  仿真训练对于机器人技能的磨练至关重要,但如何确保这些技能能够安全稳健地应用于真实机器人,是另一个巨大的挑战。

  为此,研究团队在训练和仿真中加入了多种噪音,如观测噪音和仿真动力学模型扰动,以增强机器人的鲁棒性。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图8)

  同时,他们还增加了仿真中的延迟,同时尽降低真实机器人控制软件中的延迟,确保机器人能够迅速响应。

  鉴于机器人在进行动态踢踏运动时,其齿轮容易受到瞬时冲击的影响,特别是膝盖部位容易因此受损。

  为了显著降低机器人在游戏过程中由于高扭矩所引发的损坏风险,研究团队在仿真环境中特别针对膝关节产生的高扭矩设定了惩罚机制。

  通过这一措施,成功地引导机器人学习和采用更为柔和、稳定的步态,显著提高了其运动的安全性和稳定性。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图9)

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图10)

  它们不仅能够快速起身和行走,还能在比赛中灵活应对各种情况,如拒绝干扰、从跌倒中恢复、快速转身射门和拦截移动中的球。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图11)

  更令人惊讶的是,它们还表现出了高水平的战略行为。比如,机器人会巧妙地利用位置优势,防御性地阻挡对手的射门,展现出与真实球员不相上下的竞技水平。

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图12)

Science Robotics封面!DeepMind强化学习打造超一流机器人球员(图13)

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  2-1,40岁C罗腾空转体180度庆祝:无敌小角度低射破门,率队2连胜

  黄金未至5000美元关口,市场已开始讨论6000、7000甚至10000!

  “男子右脑出血被错开左脑”追踪:家属称医院多次沟通协商,目前已获妥善解决

  九游体育官网正版

  REDMI Turbo 5 Max再曝:9000mAh电池+100W快充组合

图片名 客服