StartDT AI Lab | 视觉智能引擎——从Face ID提及，浅析顾客数字化

时间 2020-09-22 标签 startdt ai lab 视觉智能引擎 face id 提及浅析顾客数字化

“顾客就是上帝”，这句西谚揭示了顾客占据着商业活动中心地位这一客观规律。为了能更好地服务顾客，优化商家自身的服务与产品，对顾客的分析与需求调研一直是商业经营分析中的重中之重。算法

在商业互联网化、社会数字化的今天，这一规律愈加明显。从Web1.0时×××始，Cookie就被发明出来，用以对“顾客”进行数字化描述和建档并归一化其互联网下的数字行为。网络

其后的Web2.0时代，随着移动互联网的发展，我的生活中的屏—人机交互端口变多了，原先用Cookie对 “顾客” 进行数字化的方式已没法完成对我的全渠道全平台跨屏的行为归一化，为了解决这一问题，设备ID、SuperID应运而生。分布式

当前， Web3.0正如火如荼地发展中，渠道、平台、终端、屏幕随着IOT的发展，经过云端赋能，下沉雾化，对“顾客”进行数字化描述的方式又迎来了更复杂更严峻的挑战。有鉴于此，奇点云与众多有志于此的友商，在多年前就开始了对于新形态“顾客ID”的预研。目前基本达成的共识有两点:ide

IOT时代来临，原来的线下物理社会逐步数字化上线，对于这一开放的数字化环境，已经难以经过惟一有限的媒介数字设备对顾客及行为数字化。这就须要从天然人身上直接数字化并抽取。
这一新形态数字ID须要可以较为高效和准确地拉通原先Web1.0和Web2.0时代的既有数字化信息。
在经历了一段时间摸索后，以人脸生物特征为基础的Face ID方案逐渐显露出优点，而 Face ID也成为了当前奇点云商业智能化方案中对于顾客数字化描述的主要技术方案。基于此，StartDT AI Lab在人脸数字化方向上作了充分且深刻的技术沉淀。下面就为你们展现几点:性能

人脸数字化的核心天然是人脸识别，其包含了人脸生物特征的数字化和准确比对。做为视觉智能引擎中不可或缺的一部分，StartDT AI Lab的人脸识别技术能够解决复杂场景下的人脸识别问题。学习

好比动态视频监控场景下的人脸识别，相较于约束场景下的人脸验证所需的人脸识别技术，其一大挑战是对无约束人脸的识别，难度在于进行人脸识别的人脸图通常会存在模糊、遮挡、低分辨率、面部光照及表情变化巨大等，这些因素都会在必定程度上对人脸识别形成影响，甚至大幅下降人脸识别的准确率。而StartDT AI Lab对这种场景下的人脸识别准确率进行专项课题攻坚，主要研发采用了下面一些技术手段:大数据

01数据加强优化

当训练数据面临样本量过少、质量分布不均衡或者训练集与实际场景分布差别较大时，模型的泛化能力会严重降低，此时数据加强就颇有意义；StartDT AI Lab经过GAN网络同时结合传统图像处理技术，进行样本合成加强。视频

02图像处理图片

在无约束场景下，通常获取的图像质量较差，例如对人脸而言，通常分辨率较差、模糊、遮挡、低光等，StartDT AI Lab经过结合传统方法和深度学习方法，对人脸图像进行去噪、去模糊、超分辨等处理，从而得到更高质量的人脸图片，提高实际场景模型准确性。

03大规模分布式并行训练

采用多机多卡的训练方式，StartDT AI Lab目前支持上百万个ID，上亿张照片规模的训练数据集。

正所谓有矛就有盾，有攻就有防。自从有了数字ID，就有了对应的***技术来破解盗用数字ID，这一问题到了Face ID时代依然存在，而且由于Face ID所在的是开放性数字场景，***手段更是丰富简便了起来。

好比仅仅使用一个手机上的照片或者使用换脸APP就盗用了别人的人脸从而被认证，这样就很是容易被犯罪分子利用，人脸识别的应用范围就大打折扣了。所以，咱们须要在人脸识别进行前增长活体检测加以应对。目前，人脸识别的主要***方法包括照片与视频回放***以及立体面具***。

咱们在产品中针对不一样的应用场景开发了多种活体检测方法，针对无人零售场景，须要配合交互验证的方式对用户不友好，同时须要控制成本，所以咱们开发了基于单目RGB的静默活体检测方法。主要经过深度学习方式提取特征以及基于多特征融合的方法达到了目前场景下99.98%拒绝率，99.8%的经过率。目前算法已用在咱们的多种场景下，时刻为咱们的人脸识别系统保驾护航。

（已集成在产品上的活体检测演示）

在完成Face ID的提取以后，做为数字化需求的天然延展，视频智能引擎对人脸的相关信息也同步进行了数字化，例如年龄性别表情等。

目前，人脸年龄预测方面主要的难点在于如何协调年龄的连续性、年龄间的次序性、年龄分段的模糊性等，还有来自于实际场景中妆容、光照、角度等等的影响。

在人脸性别预测方面，主要问题在于intra-class variability，因此加大光照，角度等intra-class方面的加强数据有助于提高模型性能。

在人脸表情识别方面，碰到的难点主要有3方面:

各模式(光照，姿态等)下表情数据集不足；
因为年龄、性别、种族、表情强度等因素不一样形成high inter-subject variations；
因为光照、姿态、遮挡等因素形成的large intra-class variability。
目前StartDT AI Lab选择的年龄性别表情预测与识别算法在以上问题的解决方面有了很大的突破，再经过大数据样本的训练，取得了相较于目前市面上主流人脸年龄性别表情API更高的性能指标。

经过以上的技术展现，相信读者对奇点云视觉智能引擎中的人脸相关技术能力有了必定了解，也对Face ID为主的Web3.0时代的“顾客”数字化描述这一主要方式有了必定认识。从目前奇点云在Web3.0的实践来看，Face ID在头部20%高净值VIP客户的服务中能有充分的数字化保障，这也直接提升商家在商业模式中80%预期收益的落袋能力。然而对于剩下20%的预期收益，因为其分散在80%长尾客群的稀疏商业行为中，如何以低成本的方式提升这部分预期收益的落袋向来是商业场景中的难点。有鉴于此，奇点云从技术的角度解构了这部分商业场景，并经过技术的一次次突破，不断地提高着预期收益的上限。而这背后的技术细节和故事正是本栏目下一期分享的主题，敬请期待！