[摘要]华盛顿大学机器人专家开发出一种新的概率模型,将儿童发育研究和机器学习方法结合起来,目标是造出能通过观察和模仿人类来学习新技能的机器人。
华盛顿发育心理学家与计算机科学家合作,让机器人像儿童那样自然地学习。儿童会追踪大人的目光,研究人员将这种方法教给机器人以完成任务。
孩子来到这个陌生的世界上,他们移动着自己的身体,探索着身体怎样移动、怎样抓住玩具、怎样推开桌上的东西,同时观察模仿着成人的做法,如此这般学习着这个世界的一切。
但如果让机器人专家教一个机器人执行任务,一般情况下,他们只能靠编写程序,或移动机器人的手臂或身体,如此告知它们如何行动。美国华盛顿大学计算机科学与工程教授拉加什·拉奥说:“你可以把这当作是建造能向人类学习的机器人的第一步,它们的学习方法和儿童向大人学习是一样的。如果让那些丝毫不懂计算机程序的人去教一个机器人,只能用演示的方法——让机器人看着怎么洗盘子、叠衣服、做家务。但要实现这一目标,机器人还要能看懂这些动作,并自己学着做出来。”
华盛顿大学机器人专家与该校学习与脑科学实验室研究所副主管安德鲁·麦兹奥夫合作,开发出一种新的概率模型,将儿童发育研究和机器学习方法结合起来,目标是解决机器人技术中的根本性难题:造出能通过观察和模仿人类来学习新技能的机器人。
儿童更擅于感知他人意图
麦兹奥夫以往的研究表明,18个月大的儿童能推测出大人动作的意图,并能想出其他方法达到他们想要的目的。
在一个案例中,儿童看到大人想拉开一个玩具杠铃,但未达到目的,因为杠铃是粘在一起的,大人的手滑到了杠铃末端。儿童看着这一切,然后决定用另一种方法:用他的小手指抓住杠铃末端,更加用力地猛拉——重复大人想要做的。
从某种程度上说,儿童更擅于感知他人的意图,他们通过对自身的探索,学习物理规律,了解自己的行动对事物的影响,甚至能积累足够的知识向他人学习,并理解他们的意图。麦兹奥夫认为,儿童之所以能学习得那么快,原因之一就是他们特别爱玩。
“儿童在玩的时候,看起来是毫无目的,但却是一种学习。”麦兹奥夫说,“这正是儿童很有创造性的秘密。如果他们想知道怎么玩一个新玩具,就要用到玩其他玩具时的经验。在玩的过程中,他们也在学习着一种思维模式,即自己的行动会对外界造成怎样的改变。一旦有了这种思维模式,他们就有了解决新问题的能力,并开始推测别人的意图。”
用“学习概率模型”指导机器人
利用对儿童的研究,拉奥团队开发了机器学习算法——一种学习概率模型:让机器人观察自己的动作,看不同动作可能带来什么样的不同后果,然后用这种学习概率模型,推测一个人究竟想做什么,并完成他的意图,甚至在机器人无法确定时,还能“询问”求助。
研究团队用两个不同的场景对他们的机器人模型进行了测试:一个是计算机模拟实验,其中的机器人能通过追踪人类的目光学习;另一个是真的机器人,能通过模仿人类行动来学习,比如移动桌子上的玩具。
在目光追踪实验中,机器人学习了一种如何移动头部的规则模型,并假定人类转头也遵循这一模型。当人在屋内环视时,机器人会追踪他头部移动的起点和终点,用这些信息算出他在看什么地方,然后用学到的头部运动规则,把自己的头转向人所看的地方。
研究人员还重复了麦兹奥夫对儿童所做的一个实验,让一个大人看向某个地方然后蒙住眼睛时,儿童会对那个地方视而不见,或者也看向那里并蒙住眼睛,表示不感兴趣,因为按他们的理解,大人其实是不想看那里。研究人员让机器人“理解”蒙住眼睛(视而不见)的后果,它们就不再追踪人类转头所看的地方。
“儿童通过自身的体验来理解他人的行为,我们的机器人也是这样。”麦兹奥夫说。
在第二个实验中,研究人员让机器人模仿人类移动桌上的物体并把它们擦干净。在学习模型的指导下,它们每次都不是生硬地模仿人类动作,有时还会用不同的方法来达到同样目的。
华盛顿大学计算机科学与工程博士生郑宰永说:“抓取、拿起、移动这些动作对机器人来说比推要困难,让人类把一个物体拿到另一个位置或许更容易,也更可靠,但还要知道目的是什么,这是机器人技术中的一个难题,也是我们致力研究的问题。”
虽然实验最初只是学习怎样推断目的、模仿简单动作,但研究人员还打算探索这种模型能否帮助机器人学习更复杂的任务。
“儿童通过玩耍观察别人来学习。”麦兹奥夫说,“他们是地球上最棒的学习者——为什么不设计一种能像孩子那样毫不费力学习的机器人呢?”
责编:微科普