专利摘要显示,方法包括:根据第一总奖励函数对初始的运动控制模型进行训练处理,得到第一运动控制模型;根据第二总奖励函数对初始的导航控制模型进行训练处理,得到第一导航控制模型;在维持第一导航控制模型参数不变的情况下,基于第一导航控制模型输出的第一预测速度、第二子奖励函数以及第一总奖励函数,对第一运动控制模型进行训练,得到第二运动控制模型;对第二运动控制模型以及第一导航控制模型的参数进行微调处理,得到用于控制规避障碍物的模型。通过本申请,能够通过导航控制模型和运动控制模型之间的强化学习,提升
九游体育 - 智能体育科技12年领军者 | 2000+机构信赖的体育机器人解决方案
作者:小编 发布时间:2026-03-03 13:54:13 次浏览
专利摘要显示,方法包括:根据第一总奖励函数对初始的运动控制模型进行训练处理,得到第一运动
专利摘要显示,方法包括:根据第一总奖励函数对初始的运动控制模型进行训练处理,得到第一运动控制模型;根据第二总奖励函数对初始的导航控制模型进行训练处理,得到第一导航控制模型;在维持第一导航控制模型参数不变的情况下,基于第一导航控制模型输出的第一预测速度、第二子奖励函数以及第一总奖励函数,对第一运动控制模型进行训练,得到第二运动控制模型;对第二运动控制模型以及第一导航控制模型的参数进行微调处理,得到用于控制规避障碍物的模型。通过本申请,能够通过导航控制模型和运动控制模型之间的强化学习,提升
Copyright © 2025 九游 版权所有 备案号:陕ICP备2020016329号 网站地图