以智能数据架构，挖掘增加金矿

时间 2019-12-12 标签智能数据架构挖掘增加金矿

对不少技术团队来讲，在搭建智能数据架构的过程当中，或多或少会遇到一些疑惑和挑战，通过屡次实践后，有些团队已经破除疑惑，成功探索出一条搭建智能数据架构之路，那么他们是如何实现这一技术的呢？在近日的个推技术沙龙成都站，几位架构大师在现场开启了数据技术的“脑暴时间”。算法

诺基亚网络成都研发中心研发经理编程

刘朋《数据增加时代的研发管理》

企业在应对数据增加带来的巨大挑战时，需在研发和管理方面作好充足准备。网络

研发方面，提高数据存储的扩展性；管理方面，除了增长对人和设备的管理外，要努力打造一支具备数据驱动型领导力的团队，让团队中的决策以数据为依据，同时创造出以数据为核心的文化氛围。架构

大数据时代，想要成为一名数据驱动型领导(Data-Driver Leader)，须要具有三大招式。机器学习

第一招：关注研发团队的经济效益数据（Take an Economic View）工具

研发团队不只是成本中心，他们也具备创造经济效益的能力，做为一名数据驱动型领导，在平常工做中要关注相关技术实践可否为公司带来经济利益。oop

第二招：让团队数据可视化(Transparency)学习

在一支研发团队中，部门领导须要将数据可视化，让团队中的每一个人都对核心数据有所了解，这样一来，当问题出现时，每一个人都有能力去解决。大数据

第三招：基于数据，及时快速反馈(Fast Feedback)优化

在团队运行过程当中，做为领导者，不只要制定好相应规划，同时要不断分析数据查找问题，并基于数据以及KPI给成员提供反馈。

虽然数据驱动型领导在推进公司决策方面具备重要做用，但随着公司人员的扩充，部门墙和局部优化（Sub-optimization）愈来愈明显，此时须要打破部门墙，让各个部门和团队都能围绕一个共同的目标进行协做，以达到效益最大化的目标。

个推大数据架构师

袁凯《机器学习平台建设与实践》

机器学习工做的常规流程：运营者首先要将商业问题转化为机器学习可以解决的问题，而后再进行数据收集以及清洗和聚合的工做，接下来开启数据探索和特征工程，通过上述步骤，便能获得事物预测所须要的所有因素，此时，运营者能够选用不一样的算法，并将算法进行训练，获得相应的应用模型。最后，运营者还须要利用真实的数据进行验证，确保模型的可行性。

机器学习做为一门多领域交叉学科，是解决许多实际问题的有效工具。个推经过机器学习，构建了独有的冷、热、温标签，用以分析不一样群体的基础属性和行为特征，描绘用户的精准画像，最终运用于智能推送和精准营销。

想要完成机器学习平台的建设，须要注意三大要点：

1.只有端到端的平台建设才会真正产生价值，同时，特征工程的数据和代码沉淀须要共享运营。

2.从成效出发，聚焦痛点，不要盲目跟随行业，作好系统和培训的一体化。

3.谨慎引入新技术栈。

为了不机器学习平台建设中出现的常见问题，个推的建模平台会提供相应的IDE以及呈现相应特征的管理系统，同时还能提供标准化的ID匹配服务和数据抽取服务，减小工程师的重复工做。此外，个推提供的打包部署服务和后续监控服务，也可以帮助企业保证平台的顺利运行。

聚美优品大数据高级工程师

贺鹏《大数据3.0流计算与智能决策》

大数据3.0时期，Hadoop第一代、Spark内存计算第二代，早期流计算以及人工智能流计算同时并存。

早期流计算具备强一致性、数据乱序与延迟等五大困难点，Flink的出现，有效解决了这些难题，同时Flink还兼具了能够实时增量计算、SQL支持以及CEP支持等六大优势。

流计算发展至今，已经具有了CEP这一强大功能，这也是支撑流计算智能化的关键因素所在。现实生活中，不少复杂的场景没法经过显式规则来进行判断(传统编程为规则编程、指令编程以及if else编程)，好比你没法用if else写出如何判断哪一张图片是树叶，你没法用有限的规则写出如何判断数据流中哪些是人为操做、哪些是机器人刷单，此时须要用机器学习模型来检测和匹配，同时须要ML和流计算相结合使用。

一般状况下， ML模型主流场景有分类和回归两大场景，他们能够检查抽象中无状态 f = fx(x1,x2 ..)无状态模型(有状态的模型典型表明rnn)，而在SQL语义中 UDF恰好与之对应(无状态)，须要把模型放入流处理系统中，也就是将tensorflow PB model模型注册为udf，完成上述步骤后，数据流会进入ML检测阶段。

使用流计算相关功能时，须要强大的平台予以支持，以便在上面实施SQL开发、受权等操做。

以智能数据架构，挖掘增加金矿

刘朋 《数据增加时代的研发管理》

袁凯 《机器学习平台建设与实践》

贺鹏《大数据3.0流计算与智能决策》

刘朋《数据增加时代的研发管理》

袁凯《机器学习平台建设与实践》