初识元学习-Meta learning

时间 2021-01-01

meta learning的出现

1.meta learning的出现

Meta Learning，元学习，也叫 Learning to Learn（学会学习）。是继Reinforcement Learning（增强学习）之后又一个重要的研究分支，它的发展历程和动因可以归纳如下图：

举个例子，把棋盘变大之后AlphaGo还能行吗？目前的方法显然是不行的，AlphaGo会立马变成傻瓜。而我们人类分分钟就可以适应新的棋盘。再比如人脸识别，我们人往往可以只看一面就能记住并识别，而现在的深度学习却需要成千上万的图片进行训练之后才能做到。

人类之所以能够快速学习的关键是人类具备学会学习的能力，能够充分的利用以往的知识经验来指导新任务的学习。因此Meta Learning成为了新的攻克方向，核心问题就是要让人工智能自己学会思考，学会推理。

我们在现实生活中往往会遇到很多新任务，现在的深度学习因为无法快速适应新任务，就没办法替代人类工作。而一旦AI具备了这种快速学习的能力，例如机器人，才能够真正走进千家万户。因为每个人对机器人的使用都不一样，每个家庭的环境也都不一样，只有机器人具备了快速学习的能力，不需要预先训练，才能适应各种各样的要求。

因此，要让机器人走进千家万户，我们需要机器人能够实时学习，不断学习，快速学习，即使面对一个新的类似的任务，也能快速掌握。这样的机器人会非常强大，能真正处理各种任务！

因此，在深度增强学习的大框架下，我们还需要：

终生学习Life Long Learning
少样本学习Few Shot Learning
多任务学习Multi Task Learning
多智能体学习Multi Agent Learning
学会学习Meta Learning/Learning to Learn
迁移学习Transfer Learning

也就是说，从机器人的角度，我们希望机器人能够实现的智能决策需要具备以下几点：

能够不断通过与环境交互来学习提升决策能力，也就是终生学习
能够快速学习，面对新的任务，可以通过少量的训练就掌握
可以处理多种任务
可以实现多智能体的协作完成任务
能够学会学习，这和快速学习本质是一样的，就是发现学习规律，面对新任务可以快速入手
这也和快速学习的目标一致，希望通过迁移以往学习的经验来加速新任务的学习。

这都是一些研究分支，但目的都是希望机器人能够和人类一样具备快速学习的能力，能够累积经验，这样的机器人才有可能具备强大的智能决策能力。但是，快速学习，或者说学会学习Meta Learning应该是最关键的技术，是实现通用人工智能AGI的必经之路！