DeepMind 打造全新学习模式“SAC-X”,鼓励机器人自我摸索完成任务

作者 | 发布日期 2018 年 03 月 05 日 16:00 | 分类 人工智能 , 尖端科技 , 机器人
giflbp3

【Technews科技新报】人工智能(AI)能够做非常多的事,图像辨识、语音识别、云计算…在机器学习和深度学习技术的协助下,AI 对于解析数据的能力并不会有人怀疑,但它们并不善于自行探索。



而围棋界打遍天下无敌手 AlphoGo 的创造者、Google 旗下知名 AI 研究机构 DeepMind 打算改变这一切,教会机器如何自己搞懂事情。

为了解决这个问题,DeepMind 为 AI 机器人建立了一个全新的学习模式“预定辅助控制”(Scheduled Auxiliary Control,SAC-X),为机器人提供一个简单的目标,并在完成时提供奖励。

DeepMind 解释,SAC-X 定义的辅助任务总是遵循一个大原则,那便是“鼓励机器人探索感测器空间”,研究团队并不会告诉机器人如何完成任务,他们只会开启机器上配置的感测器,剩余的便留给机器去摸索,一直到它把事情正确的完成。

如果你看过机械手臂在工厂中协助生产的场景,下面影片中的画面或许不会太令你感到引项深刻,但必须一提的是,这台特定的手臂并没有特定的程序或设计在引导,它只是在自行摸索如何达成人类的要求,并获得相应的奖励。

REAL_sequence_v2.mp4.mini_

一但 DeepMind 或其他 AI 公司能够教会机器人做这些事,这将很大程度的改变世界。

以目前的研究应用来看,没有一个机器人可以走进一间陌生的房间,并且将它整理干净,就连其中包含的单项任务——整理床铺、清空垃圾或是放一杯咖啡,对 机器人来说都非常复杂。

当机器人能够学会自我摸索,每种任务的执行方式都将会是无限的,虽然目前距离电影中能打点一切的 AI 机器人还有很长的一段路要走,但 DeepMind 确实已经踏出了第一步。

(首图来源:Deepmind Blog)

如需获取更多资讯,请关注微信公众账号:Technews科技新报

Nana Ho

因缘际会下进了媒体业,只是尘世中一个迷途小书僮。 喜欢新奇的事物,希望读者看了自己的报导觉得有趣。 每天都会在写稿读稿中多学到一些东西。
未经许可,任何媒体、网站或个人不得复制、转载、或以其他方式使用本网站的内容,违者必究。

直接使用新浪微博发表评论

 

发表评论