2018年最全的AI机器学习介绍与应用

时间 2019-12-14 标签 2018年全 ai 机器学习介绍应用

据Gartner公司预测，到2020年，包括机器学习在内的人工智能（AI）技术几乎将在全部新的软件产品和服务中普及。那么什么是机器学习？它与人工智能有什么关系？技术专业人员应该知道哪些潜在的好处和挑战？对于想要转型AI的程序猿们，AI科技大本营对此类问题作了系统性整理。程序员

什么是机器学习？算法

有史以来，第一个使用“机器学习”这个词的人多是亚瑟·塞缪尔（Arthur Samuel），他开发了第一批用于玩跳棋的计算机程序。1959年，他将机器学习定义为“计算机没有被明确编程的学习能力”的技术。其余计算机科学家随后也提出了更多的机器学习数学定义，但塞缪尔的定义仍然是其中最准确和最容易理解的。编程

机器学习是人工智能的一个子集，是计算机科学的一部分，专一于创造具备人类思惟方式的计算机。换句话说，全部机器学习系统都是人工智能系统系统，但并非全部人工智能系统都具备机器学习能力。api

机器学习能够划分为下面几个部分安全

1.监督学习网络

须要程序员提供输入样本以及输入样本的标签。例如，若是您想用监督学习教计算机识别猫的照片，你能够给它提供一大堆图像，有些被标记为“猫”，有些被标记为“不是猫”。机器学习算法将帮助系统学习概念的归纳，这样就可使计算机在新的图像中识别是否有猫。机器学习

2.无监督学习工具

要求系统根据给定的数据集获得分类的方法。例如，若是您有大量的在线销售数据，则可使用无监督学习找到历年销售数据的相关性，来提升销售业绩。例如，你可能会发现，20世纪80年代初出生的女性，若是她们收入超过5万美圆，就会颇有可能喜好某一品牌的巧克力棒；或者购买某种品牌的苏打水的人也会购买某种品牌的薯片。学习

3.半监督学习ui

正如你可能猜到的那样，是有监督学习和无监督学习的结合。回到猫的例子，想象你有大量的图片，其中一些图片被标记为“猫”和“不是猫”，还有一些没有标记。一个半监督的学习系统就可使用标记的图像进行学习，而后猜想哪些未标记的图像包括猫。接着最好的猜想会被反馈到系统中来帮助它提升能力，而后这个循环会继续下去。

4.强化学习

相似于一个惩罚和奖励的系统。强化学习的一个经典例子是赌徒用老虎机赌博。起初，赌徒不知道哪一个老虎机会有回报或者回报有多少，因此他把全部的老虎机都试了一遍。随着时间的推移，他发现一些老虎机的赔率更高。而后，赌徒就会在赔率高的老虎机投入更多的时间和本钱来赢更多的钱。

机器学习应用实例

各行业的机构已经开始尝试机器学习。在某些状况下，软件供应商已经将机器学习归入用于特定目的的工具中，而在其余状况下，用户已经能够根据本身的须要，来调整了通用机器学习应用程序。该技术的一些最多见的应用场景包括：

欺诈检测 - 银行和信用卡发卡机构是最先使用机器学习的机构之一。他们常用这项技术来识别多是欺诈的交易。若是您的信用卡发卡机构打电话给您，询问您最近是否进行了特定的购买，那么该公司可能会使用机器学习功能在您的账户上标记可疑交易。

推荐引擎 - 亚马逊和Netflix等公司使用的在线推荐引擎是机器学习最多见的例子之一。使用从数百万购物者和用户收集的数据，机器学习系统可以根据您过去的购物或收看习惯预测您可能喜欢的物品。

搜索 - 谷歌，微软必应和其余搜索引擎使用机器学习，以逐分钟的方式提升搜索引擎的能力。他们能够分析有关用户点击哪些连接以回应查询的数据，来改善搜索结果。他们还使用机器学习来提升天然语言处理的能力，并为某些问题提供具体的答案。

视频监控 - 机器学习可使人脸识别系统的能力一直提升。在某些状况下，这些系统能够识别已知的犯罪分子，或者能够识别超出规范或违反法律的行为或活动。

手写识别 - 美国邮政服务已经有使用机器学习来训练识别手写地址的系统。

天然语言处理 - 今天，咱们大多数人理所固然地认为像Siri，Cortana或Google Assistant这样的我的助理，能够理解语音请求并回答问题。随着时间的推移，这些工具使用机器学习来提升他们识别、理解和处理口头输入的能力。

客户服务机器人 - 自动代理商可使用天然语言处理和客户服务数据回答常见问题，并随着时间的推移提升答案的质量。

IT安全 - 当今许多最早进的IT安全解决方案（如用户和实体行为分析（UEBA）工具）都使用机器学习算法来识别潜在的攻击。在UEBA的状况下，机器学习创建了用于检测异常状况的“正常”行为的基线，使组织可以识别和减轻零日威胁。

流媒体分析 - 在今天的全天候世界中，社交媒体馈送和在线销售交易等大量数据不断更新。组织使用机器学习来实时发现洞察或识别潜在的问题。

预测性维护 - 物联网（IoT）提供了许多潜在的机器学习用例，包括预测性维护。企业可使用历史设备数据预测机器可能发生故障的时间，使其可以在影响业务或工厂运行以前主动进行维修或安装更换部件。

异常检测 - 就像机器学习能够识别IT系统中的异常行为同样，它也能够检测制成品或食品中的异常状况。工厂可使用通过训练的机器学习系统来识别不符合标准或规格的物品，而不是用视察员来检查货物。

需求预测 - 在许多行业中，将适量的产品投放到正确的位置对于商业成功相当重要。机器学习系统可使用历史数据比人类可以更准确，更快地预测销售。

物流 - 对于运输公司来讲，设置时间表和路线是一件复杂而费时的工做。机器学习系统可帮助肯定从A点到B点得到货物或人员的最有效和最具成本效益的方法。

金融交易 - 每一个交易者都但愿在市场上找到能让他们低买高卖的模式，机器学习算法能够帮助识别基于过去的市场活动的潜在机会。

医疗诊断 - 许多专家预测机器学习诊断工具将与人类专业人员一块儿工做，以肯定疾病并肯定最有效的治疗过程。计算机系统可能特别擅长检测各类扫描中的异常状况和发现罕见疾病。

无人驾驶 – 无人驾驶是机器学习最引人注目的应用之一。在不远的未来，可以自行驾驶的车辆可能成为常态。

机器人 - 虽然他们一直是科幻小说的主角，但有机器学习能力的机器人很快就会成为平常生活的一部分。这些机器人将可以随着时间的推移提升他们的能力，使他们变得对人类更有用。

机器学习的好处

上面描述的许多用例能够由人或软件来处理，而不须要机器学习功能。然而，机器学习技术为这些替代方案提供了几个好处：

速度 - 人类能够建立模型，输入数据并自行运行预测分析所需的计算。然而，人类（或使用不具备人工智能功能的软件的人类）可能须要几天，几周甚至几个月才能完成。可是机器学习工具能够在几秒，几分钟或几小时内完成的任务。

准确性 - 速度使得机器学习系统可以利用大量的数据和更多的模型。所以，人工智能系统比某些任务的人员要好得多，好比预测分析。然而，在其余领域，如语音识别或图像识别，计算机系统仍然没有达到与人类相同的准确度。

效率和成本节省 - 机器学习软件并不便宜，事实上，在某些状况下，它可能很是昂贵。然而，使用软件来自动执行一项繁琐的工做比聘用几十或几百人完成一样的任务要经济得多。

机器学习的挑战

虽然机器学习具备很大的潜力，并已经变得愈来愈常见，但该领域仍然面临着来自于一些技术、机构、哲学方面的挑战。

人才稀缺 - 企业常常须要数据科学家来操做他们的机器学习系统，而拥有这些技能的员工也成为最受追捧的对象。他们的薪水是科技行业中最高的，近年来平均薪酬一直在快速上涨。然而，数据显示，随着供应商推出具备自助服务功能的机器学习软件，使得非数据科学家可使用它，人才稀缺的问题可能会获得缓解。

缺少数据驱动的文化 - 虽然大多数高管都明白数据驱动的决策和机器学习技术的潜在好处，但让大企业的每一个人改变本身的思惟和行为每每是一个漫长而缓慢的过程。机器学习倡导者在尝试推广技术时常常遇到内部障碍。

数据质量较差 - 若是提供模型的数据不许确，世界上最好的人工智能系统也没法获得好的结果。许多研究机构发现，在充分利用机器学习软件以前，他们须要改进数据清理和数据管理流程。

数据集成 - 在许多组织中，数据仍驻留在孤岛应用程序和存储解决方案中。将全部不一样的数据馈送到机器学习系统中可能会带来挑战，可是供应商正在用可接受各类数据类型和格式的解决方案来解决这个问题。

数据安全性 – 一方面有限制数据访问的须要，另外一方面又有使用数据提供机器学习系统的需求，在这两种需求中取得平衡可能会比较麻烦。一些组织可能须要更新他们的策略，或使用加密或匿名数据的机器学习工具。

基础设施要求 - 先进的机器学习系统可在多个快速CPU和GPU的硬件上运行，而且这种运行结果很好。另外，为了将数据从存储移动到应用程序，它们须要大量的存储空间和适当的网络功能。

道德上的两难困境 - 人工智能愈来愈像人类，但缺少道德意识，和考虑到大多数人的决策。例如，当微软发布了一个名为Tay的社交媒体机器人，它具备机器学习能力时，很快就学会了说不适当的和使人反感的东西。有专家呼吁科技公司要确保人工智能系统遵循严格的道德规范，防止他们犯罪，危害人类甚至消灭人类。