当前位置：主页 > 新闻快讯 > “向机器人展示“坚强的爱”可以帮助他们成功”

“向机器人展示“坚强的爱”可以帮助他们成功”

发布时间：2021-05-15 22:21:01 阅读次数：

根据usc计算机科学家的新研究，为了帮助机器人成功，可能需要表现出一点强烈的爱。

在计算机模拟的操纵任务中，研究人员发现，向人类对手训练机器人可以大大提高物体的抓地力。

研究合作者、计算机科学助理教授斯蒂芬·诺斯·尼古拉迪斯( stefanos nikolaidis )说:“这是第一次以敌对人类顾客为对象的机器人学习。

想象一下像参加体育活动一样。如果总是和让你夺冠的人一起打网球，你会变得更好。和机器人一样。如果我们希望他们学习抓地力等操纵任务，他们可以帮助人们。我们有必要挑战他们。

这项通过人类对抗游戏进行机器人学习的研究于11月4日在智能机器人与系统国际会议上发表。 usc博士生段佳丽和王谦是cc jay kuo教授指导下的主要作者，卡内基梅隆大学的另一位合作者lerrel pinto。

从实践中学习

尼古拉·迪斯( nikolaidis )进入南加州大学威特盖工程学院。他的团队采用了强化学习，这是人工智能程序反复实验学习的技术。

机器人系统不仅要完成工业机器人那样的小范围重复任务，还要根据上一个例子进行学习，增加理论上可以执行的任务范围。

但是，制造通用机器人非常困难，部分原因是需要大量的训练。机器人为了学习如何像人类一样操作对象，需要看到很多例子。

例如，openai给人留下深刻印象的机器人系统学会了用动物(如人类)的手处理魔方，但是要能够操作魔方就需要相当于10，000年的模拟训练。

更重要的是，机器人的灵活性非常具体。如果没有大量的训练，你就不能捡起物体，用另一个把手操作，握着或搬运另一个物体。

作为人，我即使知道物体的位置，也不知道它有多重，或者我举起它时会怎么工作，或者怎么表现，但我们几乎总是能成功。。

这是因为人们对世界的行为非常直观，但机器人就像新生儿一样。

也就是说，机器人系统不太容易宣传。这是人类理所当然的技能。这可能看起来微不足道，但可能会带来严重的后果。夹持机器人等辅助机器人装置要实现帮助残疾人的承诺，机器人系统必须在现实环境中可靠地工作。

人在循环

在克服这个问题方面非常成功的研究之一是将人引入循环。换言之，人类通过展示完成任务的能力向机器人系统提供反馈。

但迄今为止，这些算法提出了强有力的假设。也就是说，需要协助机器人的人类负责人。

尼古拉迪斯说，我一直致力于人机协作，但实际上，人们并不总是在野外与机器人合作。

例如，他指出了日本研究者的研究。这位研究者在公共购物中心内放开机器人，注意到孩子多次朝着它猛烈行动。

那么，如果我们利用人类的倾向让机器人更加困难呢？与其展示如何更好地抓住对象，不如试试如何将其拉出？通过思考，通过添加挑战，这个系统学习到对于现实世界的许多复杂性越来越强。

挑战元素

实验是用计算机模拟，机器人试图拉出物体。人类在电脑上注意模拟机器人的抓地力。把持成功后，人类会尝试使用键盘指示方向，从机器人的把持中夺走物体。

通过添加挑战要素，机器人可以了解弱握力(如将瓶子握在上部)和强握力(握在中央)的区别，从而使对方更难夺走。

nikolaidis承认这是个疯狂的想法，但它确实有效。

研究人员发现，接受人类对手训练的系统拒绝了不稳定的抓握，迅速学习了对这些物体的稳健抓握。在一个实验中，该模型在对人类对象的掌握中成功率达到了52%，在对人类合作者的掌握中成功率达到了26.5%。

据尼古拉·迪斯介绍，机器人不仅学会了如何更牢固地抓住物体，还学会了更稳定地抓握，因此通过在不同方向上采用新物体将取得越来越多的成功。

他们还发现，被训练为人类对手的模型优于模拟对手，后者的握把成功率达到28%。因为，机器人系统最常向有血有肉的人学习。

格拉迪丝解释说，这是因为比起人类所学的对象，它更能理解稳定性和鲁棒性。

机器人会捡起东西。人类想要破坏东西，会导致更稳定的把持。同时，由于学会了更稳定的把握，即使物体处于不同的位置，也会更频繁地成功。也就是说，我学习了摘要。这很重要。

寻找平衡

尼古拉·迪斯( nikolaidis )希望该系统能在一年内用真正的机械臂运行。这提出了新的挑战。在现实世界中，机器人关节的摩擦和噪音会抛弃一些东西。但是，尼古拉·迪斯( nikolaidis )认为机器人对对抗性学习的未来充满希望。

尼古拉斯说:“我认为我们只是通过对抗性人类游戏接触到了学习的潜在应用方面。

我们还很高兴探索在其他任务中的环上的对抗学习，以免造成机械臂、自动驾驶车等移动机器人的障碍。

这引出了一个问题。我们想进行多久的对抗性学习？我们想踢倒机器人让它屈服吗？尼古拉斯说答案是和我们的机器人一起寻求困难的爱和鼓励之间的平衡。

格拉迪斯说。 “在我们提出的算法中，艰难的爱情再次感觉像是运动。它属于特定的规则和约束。

如果人类只是打破了机器人的手掌，机器人就会持续失败，绝对不会学习。也就是说，机器人需要受到挑战，但可以成功学习。

心灵鸡汤：

免责声明：学习富国网免费收录各个行业的优秀中文网站，提供网站分类目录检索与关键字搜索等服务，本篇文章是在网络上转载的，本站不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系btr2031@163.com，本站的工作人员将予以删除。

相关推荐