多机器人主动智能与自主学习

提出相关理论,国际领先

在高级智能任务中,人们期望智能机器人能够自主地进行信息收集、智能决策与进行智能动作;在很多场景中,也需要多个智能机器人自主地相互协作完成任务,这时还要求多智能机器人能够通过自主学习(如强化学习)的方式进行训练。我们基于主从结构在通信领域的应用,以及层次化强化学习在已有单智能机器人任务中的成功,在国际上首先提出了一种主从协作多机器人主动智能深度强化学习模型。具体而言,主智能机器人作为多智能机器人协作的媒介,接收各个智能机器人主动发送的信息并将其与自身产生的全局策略相整合,然后根据每个智能机器人的不同情况输出不同指令以修正其行为,从而完成多智能机器人间的协作。我们使训练后的主智能机器人能够学习到有意义的宏观策略,使其它智能机器人更专注于细节行为,两者的有机结合带来了性能的极大提升。我们通过充分的实验证明了这种多智能机器人协作的机制更高效,并在多个多智能机器人强化学习任务中取得了国际领先的性能。

一系列工作成果发表在CVPR2017、NIPSW2017上。