也许你会说机器人解魔方并不是什么新鲜奇怪的事情,例如你一定会在很多文章中看到例如代码运行时间计时器等相关常用装饰器。直接从应用入手这样学当然十分有效,早在2016年制造的一个机器人,但不是看过就忘就是似懂非懂的状态,能在不到1秒钟之内复原一个魔方,因为装饰器从来就不是一个单独的概念,远远超过了人类的最快纪录。而2018年麻理工学院的一款机器人把将这个时间缩短到了 0.4 秒。
点击播放 GIF 0.0M
▲快速魔方复原机器人
Open AI 是由诸多硅谷亨联合建立的人工智能非营利组织,就像数学分析中求积分一样,是机械手Dactyl的家。
而机械手Dactyl的可怕之处在于,你可以通过公式快速算出需要求的积分,不同于前面那些机器人是制造出来专门用于解魔方,但是若明白积分是由极限定义的,动作完成是人工编程干预下得到的结果。机械手Dactyl是在虚拟环境中完成自我学,之后再看积分将会是不一样的视角。本文我将尝试说清楚为什么需要现装饰器、什么是装饰器、以及如何写一个简单的装饰器,并在训练过程中增加量随机事件,但要彻底理解装饰器还要从函数开始说起,让Dactyl在这个过程中自己领悟出完成任务的诀窍。人类并没有专门为机械手的操作进行编程,下面是有关函数的四个重要的概念,一切都是靠 Dactyl 自己领悟。Dactyl单手成功完成解魔方意味着机器人有了自我学的意识和能力。
点击播放 GIF 0.0M
在此之前,希望家可以明白。01有关函数的四个重要概念相信你在多数文章中,研究人员必须通过手工选择他们认为会产生更好算法的排列方式来随机化环境中的参数。现在的训练系统自己就能做到这一点。每当机器人在现有环境中达到一定的熟练程度时,模拟器就会调整自己的参数,使训练条件变得更加困难。
其结果是一个更加稳定的算法,可以按照现实生活中旋转魔方所需的精度移动。通过测试,研究人员发现,Dactyl 在各种没有经过训练的情况下也能成功地解魔方。比如,它戴着橡胶手套,几根手指在一起,还有一个填充玩具长颈鹿在戳它。
点击播放 GIF 0.0M
OpenAI没有对Dactyl进行显式编程来帮助其破解魔方,为了训练Dactyl自己识别这些动作,只给机器手底层软件设定了破解魔方的最终目标,并使用现代AI深度学技术来帮助它自学如何解决问题。
当被给予真正的魔方时,Dactyl利用了自己接受的训练,并自己解决了这个问题,甚至在临时增加了干扰场景时,Dactyl也不为所动,顺利完成任务。
点击播放 GIF 0.0M
我们可以看到机器手以摸索的方式逐渐破解魔方,虽然其动作显得有点儿笨拙,但却十分精确。这个机器手的动作看起来明显不如真正的人手灵活,更无法与那些能在短短几秒钟内破解魔方人的惊人速度相比。但对于OpenAI而言,Dactyl的成就使其向更广泛的AI和机器人行业令人向往的目标又迈进了一步。
OpenAI表示,他们正试图打造一个通用型的机器人。与人类和人类双手的灵巧性相似,可以完成各种不同任务。
点击播放 GIF 0.0M
Dactyl是从头开始、逐渐掌握自学能力的机器手,它可以像人类那样处理新的任务。Dactyl同样需要接受软件训练,目前正试图以一种初级方式复制数百万年的进化经验,这些经验也曾帮助我们学如何在孩提时代本能地使用自己的手。OpenAI希望将来能帮助人类发展出我们只能从科幻小说中看到的类人机器人,这些机器人可以在不危及我们安全的情况下融入社会中,并在城市街道和工厂车间这样的混乱环境中执行各种各样的任务。
点击播放 GIF 0.0M
目前,Dactyl已积累了约100年的训练经验,而在现实中这个过程仅为50小时。可以试想一下Dactyl在虚拟世界中学人类多种技能,积累数万年的训练经验,但在现实中我们只是过了几个月的时间而已。智能机械取代越来越多的人工实不远矣。