AI市场上最稀缺的人才是什么？

时间 2019-12-10 标签 ai 市场稀缺人才什么

首先，我以为懂人工智能，我是说的是真正懂人工智能的人才，是很是稀缺的。程序员

那么什么叫真正懂呢？算法

就是了解人工智能物理意义的人，而不只仅是懂算法。编程

什么才是真正懂人工智能——庖丁解牛：api

举个我自身的例子。我在清华大学念书时，就用过神经网络，我会用，但我不懂，不懂它的底层意义究竟是什么，不懂这个东西为何可以训练出来，不理解计算机究竟是怎么思考的。网络

这是一个很是重要的思惟门槛。数据结构

对于深度学习来讲，因为这里面是一个黑箱，你能够不知道机器在某一点到底在思考什么，但机器思考的那套总体逻辑和大概每一层单元在干什么，你要很清楚。架构

目前，能理解到这个层次的人很是少。框架

打个比方，有个词叫庖丁解牛。你首先得在眼睛里，大脑里有这头牛的全貌，而后你还必须很会使用这个刀。而不是说你拿着这把刀，你就能够迅速地把这头牛解剖了。dom

你只有既理解牛、又理解刀的使用方法，你才能达到庖丁解牛的境界。函数

一样，人工智能也是这么一个工具。

给你一大堆图片，让你训练出一个模型，你用tensorflow跑出来了，但明天让你训练语音，后天训练物流杂乱的数据化信息，你就蒙圈了。

再好比，有个模型是要用CNN加上全链接的，你的模型是用对抗网络更好一点，那么你的模型就能够不使用神经网络，而应该使用Randomforest，有了模型你应该使用这个，你为何要使用这个，你是经过大量的算法、经验作出来的。

对我来讲，最大的帮助是，一个编程的感性认识。我在大学研究生的时候，我作了大量的编程，每天在debug，debug特别锻炼人对于机器底层运转的思考，一套10万行的程序出错了，你怎么可以迅速给他debug出来，这个你要去理解计算机到底容易在什么地方出错。

人工智能更复杂，人工智能在调试的过程当中，没有debug的提示器，由于它全是数据和数据之间，它是一个数值计算，不能收敛的过程，就是你算着算着错了，你也不知道什么地方出错了，你只能看到这个数据发散了，这是一个特别要命的问题，由于你的程序一点都没有写错，只是你的数据结构、网络结构弄错了，这个要求程序员对这个算法的物理模型、场景模型极其明确物理意义的过程，这是很是复杂的，很难描述这个事情。

最稀缺人才——人工智能架构师：

我有一个特色，我全部学到的东西，我都能从零开始推，就是老师讲的全部东西我均可以从零开始推。这个东西叫元认知。

元认知越底层的人，他在理解一件事情的时候所占用脑子里的内存越少。好比说让我去描绘一个整个的商业案件，有人是背书，从头至尾背下来，我看一遍之后，我可能一个单位我就记住了，而后就忘了，下次让我描述这个事，我把这个单元提出来就能够描述。

人工智能也是，它是一套工具，一个真正好的工程师，他手里全部的人工智能都是算法，好比现已知的，人工智能大类的算法可能有七八类，像支持向量机，神经网络、randomforest，adaboost等一大堆，他在看到一个模型后，能迅速判断哪一个模型更适合。

好比说为何语义识别是用循环网络和LSTM来作识别？由于语义是一个线性的信息流，这个线性信息流里面要记住前面很远的信息，同时要忘掉很大一部分信息，再记住当前的信息，因此，用LSTM能很是完美的解决这个问题，但LSTM在图像识别上就不Work了、在量化金融中的优点也不明显。

这里，不少人会认为股票和语义都是一个时间序列函数，或者是先后序列函数。为何LSTM训练这个很好用，训练股票就不行了呢？

这个，就须要回到元认知。由于他们的数据结构彻底不同，你得理解什么模型处理什么实体结构。

再好比，CNN适合处理大量数据、超大量的数据，且数据和数据之间有明确相关条件，因此，CNN适合处理图像，由于图像的像素之间具备相关性。

而一样的一个状况，语义又不适合了。好比“我写程序”这四个字，每一个字之间一对一的相关性并非那么强，但他有一个总体相关性，他跟图像识别是不同的。简单理解的话，语义是一维函数，图像是二维函数。

因此，这些都是很细节的东西。你只有在使用了大量的程序以后，跑着跑着，才能感知到，哦，原来这个应该用什么算法跑，那个不能用什么算法跑。由于人工智能属于黑暗森林，你只能慢慢去摸索，摸索哪一个是最适合的。你不可能第一天就调试出来，搞清楚哪一种场景，到底该用什么程序，这个程序应该有多少层的网络、结构、单元，每一层单元有什么样的参数，应该跟什么程序进行配合，是否须要两个程序进行嫁接，是否须要高级的好比对抗型的、或者辅助型、或者嫁接型等。你须要不断地锤炼和思考，才能出来这样的感受，都是一点一点悟出来的。

因此，回到最开始的问题，我以为若是用一个特定的职位来定义，这个最稀缺的人才是人工智能架构师。

他能抽象出你最应该使用什么样的工具。在他之下，其余人就能够在一个更细的层面上，去琢磨这个工具具体应该怎么来用。

不过，人工智能架构师又分三个层次。

人工智能架构师的三个层次：

第一层：物理模型架构。

有的时候你们在训练一件事情的相关性上，可能会把两个事情分开放。其实应该把两个事件放在一块儿，把相关性做为训练对象来进行训练，这样训练可能会更好。

或者把一个隐藏的物理意义做为训练对象，把相关性和两个事情都放在一块儿，而后再进行训练。

但不少人就想不到这点，就拿两个事情直接去训练相关性，这是错误的。

物理模型架构，这是最里的一层，须要深入理解物理意义，当知道各类各样的函数该怎么去用的时候，火候就差很少了。

第二层：当咱们肯定怎么训练拓扑模型以后，拓扑模型框架出来的时候，基于拓扑框架我选用什么样的网络模块，具体须要训练成什么效果，而后再具体去训练。

第三层：等这些模块全选好了，每一层用多少个单元、多少个参数，你有没有这个能力。第一层的神经元你能够选择100个，第二层的你选10个，第三个选择多少个，而后用卷积你又选择多少个，核有多大，3×3的、5×5的、10×10的，你处处去试，试一年可能才试出结果来。

好的工程师第一刀就能够给你切到差很少的点上，你这个模型基本10层网络，每一层大概10个神经元，卷积核的层数大概3层，全连接层7层就够了，他会一上来就给你作这个东西。

目前，这三种架构人才都很稀缺。

要培养一个这样的人才，很难很难，必须跨界，尤为物理模型架构层面，必须跨界。你必需要能理解这个东西在物理层面上的意义，你必须经历过不同思惟模式的业务，有开阔的眼界，好比从事过社会、社科、商业等多种类型的工做，而后再反过来去看这件事情，就容易了。

为何说必定要跨界呢？由于跨界会对你补充另一个部分的素养，跨界就是补足你的数据，这叫“一个向量空间的完备性”，你跨界是用来干这个的。

我见过的特别优秀的能扛起人工智能架构师这类角色的人不多。我很欣赏第四范式的戴文渊，他就能够把银行所须要的算法场景变成必定的函数需求，他属于在工程师里情商比较高，相对比较跨界的稀缺人才。

要成为一个这样的人才，我以为至少要十年时间。

这类人才，必定是有强感知能力的，他有感知整个社会存在的能力，而不是把眼睛全放在眼前的技术上。