发布时间:2023-06-16
点击次数: 6月14日,腾讯robotics x机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练ai模型和强化学习技术应用到机器人控制领域,让机器狗 max 的灵活性和自主决策能力得到大幅提升。
让机器狗像人和动物一样灵活且稳定的运动,是机器人研究领域长期追求的目标,深度学习技术的不断进步,使得让机器通过“学习”来掌握相关能力,学会应对复杂多变的环境变得可行。
引入预训练和强化学习:让机器狗更加灵动
腾讯Robotics X机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识,进行“举一反三”,灵活应对复杂环境
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜


这一系列的学习分为三个阶段:
第一阶段通过游戏技术中常使用动作捕捉系统,研究员收集真狗的运动姿态数据,包括走、跑、跳、站立等动作,并利用这些数据,在*器中构建了一个模仿学习任务,再将这些数据中的信息抽象并压缩到深度神经网络模型中。这些模型不仅能够准确地涵盖收集的动物运动姿态信息,而且具有相当高的可解释性。
腾讯Robotics X机器人实验室和腾讯游戏合作,用游戏技术提升了*引擎的
准确和高效,同时游戏制作和研发过程中积累了多元的动捕素材。这些技术和数据在基于物理*的智能体训练和真实世界机器人策略部署中扮演了一定的辅助角色。



神经网络模型只接受机器狗的本体感知信息(如电机状态)作为输入,以模仿学习的方式进行训练。在下一步中,模型会融合周围环境的感知数据,例如利用其他传感器来探测脚底下的障碍物。
第二阶段,通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境。当机器狗适应了多种复杂的环境后,这些将灵动姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。

PatentPal专利申请写作
AI软件来为专利申请自动生成内容
274
查看详情


第三阶段,利用上述两个预训练阶段获取的神经网络,机器狗才有前提和机会来聚焦解决最上层的策略学习问题,最终具备端到端解决复杂的任务的能力。在第三阶段中,额外添加的网络将会收集与复杂任务有关的数据,例如在游戏中获取对手和旗帜的信息。此外,通过综合分析所有信息,负责策略学习的神经网络会学习出针对任务的高阶策略,例如往哪个方向跑动,预判对手的行为来决定是否继续追逐等等。
上述每一阶段学习到的知识都可以扩充和调整,不需要重新学习,因此可以不断积累,持续学习。
机器狗障碍追逐比赛 :拥有自主决策和控制能力
为了测试Max所掌握的这些新技能,研究员受到障碍追逐比赛“World Chase Tag“的启发,设计了一个双狗障碍追逐的游戏。World Chase Tag是一个竞技性障碍追逐赛组织,2014年创立于英国,由民间儿童追逐游戏标准化而来。一般来说,障碍追逐比赛每轮次由两名互为对手的运动员参加,一名是追击者(称为攻方),一名是躲避者(称为守方),当一名运动员在整个追逐回合中(即20秒)成功躲避对手(即未发生触碰)时,团队将获得一分。 在预定的追逐回合数中得分最多的战队赢得比赛。
机器狗障碍追逐比赛的场地尺寸为4.5米 x 4.5米,上面分布着一些障碍物。游戏起始,两个MAX机器狗会被放置在场地中的随机位置,且随机一个机器狗被赋予追击者的角色,另一个为躲避者,同时,场地中会在随机位置摆放一个旗子。
躲避者的目标是尽可能接近旗子,但要确保不被追击者捉住。追击者的任务则是抓住躲避者。如果躲避者在被抓到之前成功触碰到旗子,则两个机器狗的角色会瞬间发生互换,同时旗子会重新出现在另一个随机的位置。当躲避者被当前的追击者抓住并且此时扮演追击者角色的机器狗获胜时,游戏即告结束。在所有游戏中,两个机器狗的平均前进速度限制为0.5m/s。
从这个游戏看来,在基于预训练好的模型下,机器狗通过深度强化学习,已经具备一定的推理和决策能力:
比如,当追击者意识到自己在躲避者碰到旗子之前已经无法追上它的时候,追击者就会放弃追击,而是在远离躲避者的位置徘徊,目的是为了等待下一个重置的旗子出现。
另外,当追击者即将抓到躲避者的最后时刻,它喜欢跳起来向着躲避者做出一个"扑"的动作,非常类似动物捕捉猎物时候的行为,或者躲避者在快要接触旗子的时候也会表现出同样的行为。这些都是机器狗为了确保自己的胜利采取的主动加速措施。
据介绍,游戏中机器狗的所有控制策略都是神经网络策略,在*中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器狗上。例如下图所示,机器狗在预训练模型中学会的躲避障碍物的知识,被用在游戏中,即使带有障碍物的场景并未在Chase Tag Game的虚拟世界进行训练(虚拟世界中仅训练了平地下的游戏场景),机器狗也能顺利完成任务。
腾讯Robotics X机器人实验室长期致力于机器人前沿技术的研究,以此前在机器人本体、运动、控制领域等领先技术和积累为基础,研究员们也在尝试将前沿的预训练模型和深度强化学习技术引入到机器人领域,提升机器人的控制能力,让其更具灵活性,这也为机器人走入现实生活,服务人类打下了坚实的基础。
以上就是腾讯机器狗进化:通过深度学习掌握自主决策能力的详细内容,更多请关注其它相关文章!
# 藏着
# 怎么在分类信息网站推广
# 广平互联网营销推广招聘
# 龙岩网站建设必备知识
# 网站营销推广怎样做
# 擅长营销推广
# 广州百度网站优化
# 弄一个网站再推广多少钱
# ai推广网站
# 海阳企业推广网站
# seo描述用英文逗号
# 深度学习
# 中国
# 微软
# 也会
# 游戏中
# 门店
# 开源
# 一名
# 专利申请
# 自主决策。
# 腾讯
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
Xreal AR 眼镜用投屏盒子 Beam 发布:分体式设计,到手 699 元
GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能
2025世界人工智能大会前沿科技共绘“未来”图景, 这家这家独角兽企业的通用大脑将在AI领域大放异彩
人工智能驱动智能建筑会是未来趋势吗?
阿里云推出通义万相AI绘画大模型
“苏南 vs 苏北” AI 分胜负,娱乐性比较工具 EitherChoice 上线
软银、淡马锡、沙特阿美突击入股,“协作机器人第一股”节卡股份:强敌环伺,持续失血是常态
一文看懂被英伟达看中的九号机器人移动底盘
Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话
标小智LOGO推出AI公司起名生成器“Name.GPT”
尼康尼克尔 Z 180-600mm f/5.6-6.3 VR 镜头发布,12499 元
张勇对话多位诺奖得主 人工智能将无处不在
小米创始人雷军将揭示小米AI在年度演讲中的最新进展
周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资
抢占新赛道 加快机器人产业集聚发展
成功孵化首个大型模型解决方案的重庆人工智能创新中心
当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来
音乐制作元工具AudioCraft发布开源AI工具
亚马逊CEO:人工智能将成为公司未来战略的重中之重
华为推出全新操作系统HarmonyOS 4,AI和新引擎完美融合
写出优质文章的妙招:利用"稿见AI助手"的实用指南
史玉柱谈AI:国内最缺是计算数学人才,曾给浙大数学系捐五千万
磐镭发布全新 GeForce RTX 4080 ARMOUR 显卡,售价为 9499 元
对话式论文阅读工具PaperMate上线,综述细节AI告诉你
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
调研海尔智家:AI名,家电命?
此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处
移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速
Transformer六周年:当年连NeurIPS Oral都没拿到,8位作者已创办数家AI独角兽
元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者
B站内测 AI 搜索功能,输入“?”即可体验
微软在 Build 大会上宣布的新 Microsoft Store AI Hub 现已开始推出
探索AI前沿理念 2025全球人工智能技术大会在杭州开幕
“聚智启新,‘蓉’力同行” 成都市人工智能产业融通对接会成功举办
周鸿祎:360智脑开放API接口 AI大模型将赋能百行千业
构建数字文旅新高地!洛阳涧西区开启元宇宙时代
如布科技发布新产品AI口袋学习机S12
小米9号员工李明宣布创业:打造首款安卓桌面机器人
掌阅科技对话式AI应用“阅爱聊”开启内测
AI大模型紫东太初已被注册商标 中科院已注册紫东太初大模型商标
深剖Apple Vision Pro中暗藏的“AI”
陈丹琦ACL学术报告来了!详解大模型「*」数据库7大方向3大挑战,3小时干货满满
马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术
360发布数字安全和人工智能的强大结合:360安全大模型
埃森哲俞毅:AI时代我们需要新的“摩尔定律”
美图发布国内首个“懂美学的”AI视觉大模型MiracleVision
马斯克发推讽刺人工智能:机器学习的本质就是统计
Goodnotes 6推出,带来多项全新AI功能,让电子笔记更智能
AI绘画,还需要懂数学?
改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键