■蔡立英 编译
大多数深度学习系统被设计出来都是解决特定问题的,因而往往在单一的技能方面可以创造奇迹,比如识别坦桑尼亚塞伦盖蒂平原图片中的动物,或是从事不同语种之间的翻译。但是,如果你给某个深度学习系统设计的是图像识别的算法,再重新训练它去完成另一个截然不同的任务,比如识别语音,通常它就会只擅长后一种本领,而淡忘前一种技能。
人类不存在这样的问题。我们会利用解决某个问题的知识去完成新的任务,并且当我们开始学习一项新技能时,通常不会忘记如何运用已学会的技能。
未来的深度学习系统借助神经网络,可以做到“多才多艺”,同时学习解决各种不同的问题,包括图像和语音识别、翻译和句子分析等,这种深度学习系统被称为“多任务模型”。美国科研人员正在研发的这个模型,由一个中枢神经网络及其周围的多个分网络组成,这些分网络专长于理解音频、图像或文本等任务。
现有的深度学习系统要很好地完成一项任务,通常需要经过大量数据的训练来提升这一技能。但是,多任务模型完全绕开了这种训练套路,它可以从另一个完全不同任务的相关数据中融会贯通,学会多种技能,比如,在接受图像数据库训练的同时,多任务模型分析句子语法的能力也会得到提升,尽管这个图像数据库与句子分析完全不是一回事。
当它从其他任务中学习时,其表现大致上也是相同的。随着学习的深入,其神经网络上就会积累越来越多的数据。
爱尔兰都柏林数据分析洞察中心的塞巴斯蒂安·路德说:“如果一个神经网络能运用某个任务的知识去帮助其解决另一个截然不同的问题,那么,它将更擅长那些因为缺乏有用数据而很难学会的任务。这让我们更接近通用人工智能 (也称“强人工智能”) 的目标。”
路德指出,这种方法对于制造高端的人工智能机器人同样有用,这种人工智能机器人能在游历世界的过程中学习。世界上充满了无条理的音频、图像和文本,一个从很多不同类型的数据中学习的深度学习系统,可能比高度专业化的机器人更容易理解这些东西。
“不过,这一神经网络非常复杂,可能令研究者们难以弄明白它是如何习得多任务技能的。”路德说。