结合深度学习的工业大数据应用研究

时间 2021-01-13

摘要：如何将大数据等核心技术与智能制造结合，进一步提高产能与质量，并且降低成本，是新一代制造业革新的关键任务。通过一个具体应用案例，即针对工业中常见的机床刀具消耗冗余的问题，提出了基于大数据和人工智能的方法，以准确预测机床刀具的崩刃，从而增加了机床的生产效率，降低了生产成本。相对于以往使用数据统计和传统机器学习进行刀具磨损预测的方法，新方法通过高速电流采集器获取主轴电流值，结合了卷积神经网络的强拟合性和异常检测算法的强泛化能力，对大数据量的电流值进行预测分析，实现了更快的网络收敛及更高的预测准确率和顽健性。

互联网科技发展蓬勃兴起，人工智能时代来临，抓住下一个风口。为帮助那些往想互联网方向转行想学习，却因为时间不够，资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程，大数据学习群： 740041381就可以找到组织学习欢迎进阶中和进想深入大数据的小伙伴加入

关键词：深度学习；工业大数据；智能制造；异常检测；刀具磨损

1 引言

智能制造（intelligent manufacturing）是指集成知识工程、制造软件系统与机器人视觉等技术，在无人工干预下由智能机器人独立实现的生产过程。智能制造系统是一种融合智能机器与智能行为，在订单制作、产品设计、生产、营销、销售等制造过程的各个方面都可以集成，用一种灵活的方式充分发挥先进生产系统的制造能力的系统。随着云计算、物联网、大数据、人工智能等新一代信息技术的发展，智能制造的内涵有了突飞猛进的变化。目前，智能制造已经成为每个工业发达国家的国家战略。

在工业智能制造中，李杰提出将智能制造体系分为3个阶段。首先，把问题变成数据，也就是传统的信息化过程，利用数据对问题进行建模，把过去老工人的经验变成可挖掘、可量化的持续价值，从而不会因为人的原因而失去知识。然后，把数据变成知识，从“解决显而易见的问题”延伸到“探索不可见的隐藏问题”，不仅要明白“怎么解决问题”，还要理解“为什么会出现问题”。最后，把知识再变成数据，这里的数据指的是生产中用到的设备指令、机械加工的工艺参数、可执行的决策等所有能够量化的指标，用从知识得来的量化数据修正和完善制造过程，从根本上避免问题的出现。

作为智能制造最重要的技术之一，大数据技术对传统工业制造业的影响是巨大的。智能制造的基础是将工业生产中的问题数据化，利用获取的数据对问题解决方法进行数据建模，当类似的问题出现的时候，能够根据模型提出解决问题的方法。这样，将知识固化于数据与算法模型中。

通过对大数据的深入挖掘，获取产品的需求感知，基于大数据分析实现制造业“需求— 制造 — 需求 ”的全流程生命周期管理，实现数字化、网络化、智能化的生产优化、流行预测、精准匹配、供应链优化、营销推送等众多智能制造核心应用，进而驱动产品设计和产业发展。大数据技术对制造业的影响主要有两个方面：一是在制造和管理流程中运用大数据技术提高产品质量和生产效率；二是在现有产品与服务中融入大数据技术，以进行颠覆式的革新。简而言之，融入大数据技术的智能制造关心的两大重点分别是制造流程技术和制造出的产品技术。

深度学习是机器学习研究中的一个新的热门领域，作为人工智能领域的热门技术，近年来发展迅猛。随着深度学习技术的流行，使用人工智能技术在各行各业进行创新应用成为发展趋势。不同于传统的机器学习技术，深度学习对于图像处理具有先天优势，因此大部分在智能制造中的深度学习技术应用案例是在计算机视觉领域的，例如通过图像对产品外观进行检测，以发现残次品。在工业的制造过程中，使用深度学习技术的自动光学检测（automatic optic inspection，AOI）设备也开始替代传统检测设备。

本文通过一个智能制造的实际案例，验证了使用深度学习技术对数控机床进行刀具寿命检测的可行性。从实际应用效果来看，在制造生产过程中，结合了大数据技术的方法比过去采用传统的方法获得了更好的性能提升，同时也节约了成本。

2 智能制造应用

本文将深度学习技术运用到了制造业最重要的环节——使用数控机床（或数控加工中心）进行加工制造，用人工智能代替生产工人对数控机床加工中用到的数控刀具（又称工具）进行寿命监控。通过采集、测量机床电流负载数据的方式，证实了数控机床主轴电流负载的变化与刀具的磨损程度之间存在一定的相关性。例如，当刀具磨损等异常状况（如刀具的崩缺）出现时，电流负载在极短时间内会剧烈波动。然后，进一步采集某一类刀具从正常使用到崩刃的全生命周期的电流数据，从中找到能够反映刀具磨损趋势的特征。经过验证，笔者构建的卷积神经网络（convolutional neural network，CNN）可以使刀具异常状态检测的准确率达到96%。

2.1 问题描述

根据实际生产制造中的数据统计得知，20%以上的数控机床停工是由刀具的过度磨损引起的。及时更换刀具能够将机床的利用率提高至150%，并且节约30%以上的成本。为了及时更换过度磨损的刀具，防止过度磨损的刀具对机床部件造成损坏，传统的办法主要有两种：一种是计数法，根据经验对刀具设定极限加工次数，在刀具达到这个加工次数之后，无论好坏都将其废弃，这种方法的优点在于对刀具寿命进行了管理，缺点在于有些刀具在达到设定的极限加工次数后还能够继续使用，从而造成浪费，或者有些刀具在达到极限次数之前就已经损坏，从而影响生产质量；另一种方法是通过对加工完的工件进行质检来判断机床的刀具是否正常，这种方法的优点是能够克服刀具寿命管理“一刀切”的问题，但缺点在于质检滞后于生产，在检测出废件的时候往往已经有一批废件产生了。

为了解决传统方法的不足，一个更加科学的方式是在刀具发生异常的极短时间内进行响应：提醒工人换新刀，或者机床自动换新刀。实际上，在加工过程中直接测量刀具的磨损程度几乎是不可能的，但是，刀具的磨损状况是可以从声音、振动、切削力，甚至从电流负载变化反映出来的。

2.2 解决思路

本文采取测量机床电流负载的方式，证实数控机床主轴电流负载的变化与刀具磨损程度之间的相关性是存在的。主流数控系统对主轴变速系统进行了闭环设计，即刀具在加工时能够通过传感器将转速恒定在设定数值。假定数控机床主轴夹载的刀具会根据磨损状况影响主轴转速，而主轴负载电流则能够通过调整来稳定主轴转速。于是笔者猜想，通过观测主轴电流变化能够预测出刀具的磨损程度。因此，需要研究以下几个问题。

（1）负载电流能否反映出刀具磨损度的变化

笔者希望在刀具磨损以及出现异常状况（如刀具崩缺）的过程中，在电流负载上找到能够反映出刀具磨损度变化的趋势，于是在机床电气箱内部加装了高精度的霍尔传感器（电流传感器），用来采集机床的主轴电流信号，再通过时域、小波域等特征进行分析。

（2）电流负载和刀具磨损程度之间的联系能否实时检测出刀具的磨损程度

笔者将采集某一特定种类的数控刀具从正常使用到异常（例如崩刃）过程中的电流数据，并用“刀具崩刃”“刀具正常”这两个标签将数据进行分类。在这个过程中，需要确定一些能够反映刀具磨损趋势的特征。笔者构建了一个简单的卷积神经网络，并用这些特征数据做训练测试，从而计算模型对刀具崩刃检测的准确率。刀具实时性检测主要由数据的实时性决定，笔者采用的霍尔传感器采样率为每秒20000个数据点，足以识别出极短时间内的电流变化，达到实时检测的目的。而模型检测存在一定的延时，这主要是受特征数据的时间跨度（即输入数据的大小）、计算机的运算速度的影响。

通过测量数控机床主轴电流数据，对机床刀具出现的异常状况进行建模，从而挖掘出这些电流数据中的潜在价值。在实验中，主要解决3个问题：证明电流分析刀具磨损的可行性；找出能够反映刀具磨损的特征；通过神经网络的方法检测刀具崩刃。

在实验中，笔者抓取到的原始电流信号往往杂乱无章，因此在证实电流分析方法可行性之前，需要在原始电流信号上进行特征处理，找出能够反映刀具磨损变化趋势的特征，并且保证该特征在大多数的刀具电流信号上能够反映出变化趋势。另外，一个特征往往是不够的，不具备可靠性，因此需要从多个角度进行多个特征的分析。最后，将找出的特征作为模型输入，训练笔者设计的算法模型。

3 实验过程及结果分析

3.1 实验环境

该实验使用霍尔传感器和NI数据采集卡对数控机床的主轴电流信号进行采集，采集频率为每秒20 000个数据点，机床的主要加工信息见表1。

3.2 时域分析与特征工程

因为采集到的电流信号是一种时序信号，常见的时域、频域信号分析方法有均值、方差、峰峰值、偏度、峰度、快速傅里叶变化、短时傅里叶变化、能量百分比分析、小波变换等。笔者发现电流信号在时域特征上有着明显的变化，并且从均值、方差、峰峰值、峰度、偏度上进行了特征分析。

电流的均值往往表征了一段时间内电流的稳定性和信号的变化中心，通常对电流的分析是基于电流有效值进行的，从计算效率上考虑，本文通过计算电流值的绝对值求解电流在一段时间内的均值，从而进行分析，如式（1）所示。

互联网科技发展蓬勃兴起，人工智能时代来临，抓住下一个风口。为帮助那些往想互联网方向转行想学习，却因为时间不够，资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程，大数据学习群： 740041381就可以找到组织学习欢迎进阶中和进想深入大数据的小伙伴加入

（1）

电流的方差描述了数据偏离平均值的程度，同时还揭露了数据之间的波动程度，其计算式如下：

（2）

电流的峰峰值描述了信号中最大值和最小值之差，也往往被用于检测整个信号段的波动大小，如式（3）所示。

（3）

峰度描述了频率分布曲线的峰值和数据分布的平坦程度。峰度通常可以在异常检测问题中取得良好的结果，高峰度意味着方差的增加是由低频率大于或者小于平均值的极端差值引起的，如式（4）所示。

（4）

偏度描述了实际随机变量概率分布的不对称性。偏度为0，意味着数据均匀分布在平均值两侧；偏度为负，意味着大多数数据在平均值的右侧；偏度为正，表明大多数数据在平均值的左侧。偏度的计算式如下：

（5）

本文分别对5 把数控刀具的全生命周期电流信号以1 s、1 min为时间跨度进行了时域分析，实验中5 把数控刀具的分析结果是平行的，考虑到信息冗余，本文以1把刀具的特征分析为例，取得的分析结果如图1、图2、图3所示。

图1 原始数据

图2 时间跨度为1 s的时域分析

图3 时间跨度为1 min的时域分析

去除不必要的电流数据之后，笔者分析了均值、方差、峰峰值、峰度、偏度等在数控刀具的全生命周期上的特征表现情况。可以看出，在时间跨度为1 s的时域分析中只能发现在生命周期的尾部有一个突变，而对于刀具磨损的趋势却反映得不太明显，这可能是因为图中的数据点仍然很多（原始图像中每分钟120万个数据点），于是将时间跨度改为1 min，又进行了时域分析。

通过对比可以看出，时间跨度为1 min 的图像更平滑，并且趋势变化更明显，这也是很容易理解的，因为时间跨度的提升相当于对信号做了一种类似于平滑处理的操作。在时间跨度为1 min的时域分析中，不仅在尾部出现了较大的波动，并且也体现出了明显的上升趋势，这与刀具磨损的物理现象是吻合的。普通铣刀在加工过程中，随着表面磨损的增加，其与工件的接触面也增加，从而造成机床负载的增加，并最终反馈于电流上，电流呈现逐步上升的趋势。在刀具严重磨损到崩刃的时候，刀具在物理形态上出现了变化，大多数情况是崩缺，刀具上缺了一小块，使得刀具与工件的接触面突然少了，这使得机床负载也突然减少，但是现代机床具有负载补偿的功能，在刀具崩刃之后，机床会开始补偿，于是负载在骤然下降后又会上升，而负载上的变化又会反映在电流信号中。通过检查现场工作人员记录的加工情况表（见表2）与实验的时域分析图的对应情况，进一步验证了本文的结果。

表2展示了数控刀具在加工过程中的切削声音情况。由于现场加工环境恶劣且复杂，在加工过程中用仪器直接测量刀具磨损状况十分困难，故在实验中由现场工作人员根据经验记录当前机床加工的声音。在时间跨度为1 min的实验中，发生骤变的时间点是加工到58 min时，这与加工情况表中机床切削出现尖锐切削声表明刀具崩刃的时间在同一个区间。通过监测刀具的整个生命周期可以看出，刀具磨损在电流信号上的表现趋势与刀具磨损在物理意义上的变化是相符的。本文在同等加工情况下进行了5 次实验（即5把刀的全生命周期），都得到了类似的变化趋势，由此证明了电流方法的可行性，同时也提取出了能够很好地反映刀具磨损的特征：均值、方差、峰峰值、峰度、偏度。峰度和偏度从两个不同的角度展示了刀具崩刃的骤变情况，呈现出了与均值、方差、峰峰值类似的变化趋势，因此也将其作为神经网络的输入，以帮助网络进行数据拟合。

3.3 小波包分析

小波包变换是在小波变换的基础上发展起来的，具有多分辨特性，可以由粗到精逐步地对信号进行分解分析。利用小波包分析技术进行时频域分析，将原始信号正交地分解到精细的、相互独立的频带上，可以同时获得时间和频率上的局部特征以及通过多分辨率分析得到的特征。将各个频带内的信号能量作为相应的特征量。小波包变换效果经常受到小波基和分解层数的影响，本文使用db5 作为小波基，同时对信号进行了5层分解，分析结果如图4所示。

图4 数控刀具初始加工的频率带能量分布

从图4可以看出，信号能量主要集中在第31频带（0 ~312 .5 Hz）和第32 频带（312.5~625 Hz）内。本文对整个刀具生命周期中这两个频带的能量进行了分析，分析结果如图5所示。

图5 第31频带、第32频带的能量分布

从图5可以看出，这两个频带都表现出了明显的变化趋势：第31频带随着加工时间的增加，能量逐渐下降，在刀具崩刃之后，能量又逐渐上升；第32频带随着加工时长的增加，能量逐步增加，并在刀具崩刃后下降。

通过对电流信号进行频域、时频特征分析，从多个特征域中发现了电流随刀具磨损变化而产生的上升趋势或下降趋势的特征，在模型训练和检测中，本文选取了均值、方差、峰值、峰度4个特征作为网络的输入特征。

3.4 断刀检测

经过验证，神经网络往往比传统机器学习算法具有更好的顽健性、表达能力和学习能力，笔者期望神经网络的这些优点可以稳定、准确地检测出刀具崩刃。笔者从CN N 和传统的反向传播（backpropagation，BP）神经网络着手，对电流信号进行拟合训练测试，并对比两种网络的表现能力。神经网络相关参数见表3。

其中，CNN的具体框架如图6所示。受计算资源和数据的限制，5层神经网络参数（神经元权重参数接近5亿）已经具备拟合训练数据的能力，实际上也正是如此，本文设计的网络在训练集上已经达到了过拟合，具有足够小的偏差，此时更需要做的是使用一些正则化方法来减少网络的方差。本文在网络的1、2、3层的卷积层后添加了批标准化层以减小过拟合，并认为小卷积核能够提取更细致的特征，Adam方法可以帮助网络更快速、安全地到达网络最优点。本文共有4 0 4 个数据样本，52 080 000个数据点，在每次网络的输入批次中，随机抽取了正常加工数据和刀具断刀数据，并且比例为1:1。最后，通过对网络的训练和测试得出的实验结果见表4。

图6 卷积神经网络的设计框架

本文将准确率作为度量标准，CNN取得了96.46%的准确率，BP神经网络取得了86%的准确率。CNN的96.46%准确率在正样本（正常加工样本）中表现很好，正样本预测全部正确，剩余的3.54%错误率主要表现在对负样本（断刀数据样本）的预测上。笔者分析，主要有两方面原因：一是负样本与正样本之间分布差异较大，并且不同的刀具负样本之间分布差异也较大；二是负样本数据量少，网络的参数大部分用于拟合正样本数据，而对负样本数据的拟合情况较差，因为在加工生产中负样本获取的成本较高，所以在实际中获取大量可利用的负样本数据从而减少网络的方差，也是不太符合实际的。但是网络9 6 .4 6% 的准确率依然表现了神经网络的优势，达到了较为满意的效果，并验证了通过神经网络的方法检测刀具崩刃的可行性与应用前景。

3.5 异常检测网络

从异常检测的角度来看，负样本少、样本奇异是异常检测问题的特征之一，刀具崩刃是一种典型的异常检测问题。在异常检测中，异常点与正常点通常有着较大的差异，因此，阈值法是异常检测问题中一种常用的方法。笔者发现，同一个加工环境下不同刀具的正常加工往往类似，但是刀具发生崩刃的异常情况却各不相同，因为没有包含所有断刀形式的数据集，所以使用普通CN N很难拟合负样本情况。针对这类问题，提出了一种不同于一般CNN方法的异常检测卷积神经网络（convolutional neural network using anomaly detection，CNN-AD）方法。在训练阶段，CNN-AD只使用正常样本训练，而在测试阶段，通过设定阈值判断网络的损失值是正样本还是负样本。在实验中，CNN-AD的结构与之前设计的CNN结构相同，不同的是在网络的训练集中只有正样本，即CNN-AD 训练阶段只对正样本进行拟合。在测试阶段，CNN 通过softmax层输出的是概率，而CNN-AD取消了softmax层，最终的输出为网络的损失函数值。本文设定了一个阈值（如设置阈值为1），用以根据损失值划分正负样本。在测试阶段，加工前期的正常样本输入网络中产生的损失函数的值极低，接近于 0；而加工后期，刀具崩刃的异常样本输入网络中产生的损失函数的值与正常样本的差异巨大，通过阈值很容易将其区分开。在训练阶段，网络只对正样本进行训练，因此所有参数都用于拟合正样本数据。在测试阶段，异常样本与正样本差异较大，网络没有训练负样本的“经验”，从而产生较大的损失函数的值。这样就可以使用阈值很好地将正负样本区分开。

除了对CNN-AD进行测试以外，本文还构建了其他网络作为比较，包括CNN、BP、SVM。其中BP和CNN的架构和模型数据与第3 .4节中的一样，不同的是通过PCA方法SVM的输入数据维度从7 200×4 降到了1×4。同样使用准确率作为主要度量标准，但是引入了召回率和F1-Score作为参考，其实验结果见表5。

互联网科技发展蓬勃兴起，人工智能时代来临，抓住下一个风口。为帮助那些往想互联网方向转行想学习，却因为时间不够，资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程，大数据学习群： 740041381就可以找到组织学习欢迎进阶中和进想深入大数据的小伙伴加入

刀具破损检测是典型的异常检测问题。因此，选择召回率和F1-Score作为评估标准更为合适。从表5可以看出，CNN-AD表现最佳，准确率为100％，这可能是由正样本与负样本差异较大并且数据集不全面导致的。CNN、BP 和SVM的性能不如CNN-AD，这可能是由正负样本比引起的。因为与正常加工相比，刀具崩刃的时间非常短，1把刀具的完整生命周期中往往只有少数几个负样本，但是却有几十个正样本。另外，每把刀具崩刃在电流信号中的表现（例如电流幅度的差异或变化趋势）不同。这些原因使得网络不能很好地拟合负样本。SVM在正样本判断中表现良好，但在异常情况检测中表现不佳，负样本检测全部错误，笔者分析可能是因为正样本和负样本之间的差异不足以让SVM找到最佳分割点。

在实验中，CNN-AD收敛速度最快，BP次之，CNN需要花费更多的迭代次数才能完成收敛。CNN-AD只用了不到10次的迭代就完成了收敛，这是因为CNN-AD只使用正样本进行训练，而不需要考虑对负样本的拟合，不同正样本之间差异不大，网络不需要太多的参数就可以完成拟合，因此只需要很少的迭代次数就达到拟合收敛。BP收敛速度快于CNN，但 BP的测试结果却在波动，其准确性有时超过 8 0％，有时却低于 6 0％，这是由于BP的参数较少，不能很好地提取出崩刃和正常样本之间的关键特征。相比 BP的结果，CNN较为稳定，CNN在网络收敛之后，准确率稳定在9 5％以上。这是由于 CN N更复杂且参数数量超过 BP，能够拟合更多的数据情况，而BP的结构相对简单，易于收敛。

3.6 讨论

在C N N 的方法中，网络的准确率主要表现在对正样本的识别效果很好，而对负样本的识别效果不佳，于是本文提出了CNN-AD，利用正负样本之间的差异，不使用负样本进行训练，以这种方式减少负样本对预测准确率的影响，但是该方法依赖于正负样本之间的差异性，因此该方法存在局限性。神经网络的效果依然还有较大的提升空间，而这些提升空间主要表现在减小网络方差上。从目前机器学习领域内可以了解到有两个方向有助于网络拟合负样本，同时也将是笔者进一步的研究方向。

（1）生成模型

生成式对抗网络（ generative adversarial network，GAN是目前机器学习领域的研究热点之一，G A N 得到了很大的扩展，例如：CGA NInfoGAN、DCGAN、WGAN等，学术界已经出现了GAN 变种方法，能够取得很好的生成效果。笔者期望通过GAN生成类似于负样本分布的数据，从而间接地增加负样本数量，使网络更好地拟合负样本。

（2）迁移学习

迁移学习主要包括同构迁移和异构迁移，而很多方法采用的将源域分布空间与目标域分布空间映射到一个共同潜在空间，或者使源域映射空间与目标域映射空间优化，使其尽可能相似的思想，也被称为对称变换和非对称变换。对于不同的加工环境，电流数据的分布也不同，这也叫作数据集偏差，直接使用这些数据有可能使网络效果更差。笔者希望通过迁移学习将不同的机床数据变为可利用的数据，这样就间接增加了数据量，也增强了网络的顽健性和适应性。

4 结束语

本文介绍了大数据与智能制造的概况，并且通过一个智能制造的实际案例让大家认识到在实际工业场景中使用深度学习进行智能化的生产制造是可行的。笔者发现，对于过去需要依靠工人的知识与经验进行判断的场景，现在可以用大数据技术来代替，可拥有更高的性能提升并节约成本。虽然本文的本研究仍然有进一步提升的空间，但是本文的研究迈出了深度学习在智能制造运用中的重要一步，为智能制造的发展提供了新的研发思路。