滴滴章文嵩:不只软件开源,还向学界开放数据

640?wx_fmt=gif

640?wx_fmt=jpeg

演讲 | 章文嵩前端

责编 | 伍杏玲算法

出品 | CSDN(ID:CSDNnews)数据库

6月27日,在第十四届开源中国开源世界高峰论坛上,滴滴出行高级副总裁章文嵩发表《滴滴共享出行平台与开源》的主题演讲。安全

章文嵩先是介绍滴滴的发展示状:仅去年,滴滴年运送乘客达100亿人次;目前注册用户数达5.5亿。在这背后,滴滴平台天天ETA(预计到达时间)请求在700多亿次。网络

能够想象到,滴滴 6000 名研发人员搭建维护的技术框架是十分庞大的,那么在其中开源软件是扮演一种怎样的角色呢?架构

下面一块儿来看看章文嵩的分享:框架

 

640?wx_fmt=png

滴滴平台天天ETA请求达700多亿次运维

 

咱们先看看网约车如何改变生活?机器学习

咱们经过移动互联网把司机和乘客链接后,实际上解决了信息不对称性的问题,经过这些撮合,能够提高总体的效率,如今你们也感觉到经过网约车比你在路边打出租车的体验好不少。工具

咱们平台上大量司机是兼职司机,天天在上下班的路上接几单,将现有的车辆能有效利用,这就是绿色出行。

咱们也知道出行的需求是弹性的,好比早高峰的时候出行需求特别高,到了十点以后平峰期出行需求比较低的,每每是早高峰需求的二分之一或者三分之一。等到了下班的时候是晚高峰,晚上九点时有一个夜晚小高峰,由于你们加班也好,聚会也好,通常夜晚九点到十点回家。

你们的出行需求是弹性的,理论上供给应该也是弹性的,这样才能作到供需平衡。

若是咱们只按早高峰配置运力,那么在平峰期效率是无法获得发挥的。由于在白天时间都是平峰期,平峰期不少车辆不能获得有效运用。咱们必定要结合全职的运力加上兼职运力(兼职运力自己就要出行就要开车),这样才能够把现有的供给资源车辆,获得有效的利用。

随着共享出行的平台订单密度规模进一步增大,你们还能够拼车出行,并且拼车能有效地让全部交通工具获得有效的利用,会更加绿色环保出行。

在滴滴成立的七年时间里,随着移动互联网的发展。仅去年,滴滴年运送乘客达100亿人次;目前注册用户数达5.5亿。

面向消费者,咱们提供快车、出租车、专车服务、共享单车、代驾等服务,在城市里提供智慧交通、充电站、公交相关的一些服务。

咱们在中国沉淀的产品技术经验也输出到国际市场上:2017年年初,咱们开始布局巴西;2018年,咱们在澳洲、墨西哥布局;两个多星期之前在哥伦比亚布局。

目前拉美市场累计服务用户1亿4000万,拥有数十万司机,咱们的服务受到拉美用户好评的,咱们在拉美的市场增速也是最快的。

天天咱们的业务须要计算大量的数据:计价、每秒钟上报定位点数据、行驶多长时间、行驶多少里程等,还有大量用于提高安全体验效率的数据,好比说A点到B点,预计到达时间怎么样,因此天天滴滴平台有ETA请求达700多亿次,平均一秒钟作400万次计算,这是全世界最大的量。

 

640?wx_fmt=png

技术驱动:6000 名工程师

 

滴滴是彻底靠科技驱动的,目前咱们有近6000名工程师,公司里有一半人员是技术人员,咱们有大数据、人工智能、云计算平台。

在滴滴有不少预测的场景和实时计算场景,例如前文的实时里程计价、交通实时度量、路况度量,包括对将来的路况要作预测,对供须要作预测,在ETA计算时要作预算,路径规划要作预测,包括对分担调度咱们要作预测。这些预测场景经过人工智能算法实现的,因为问题的复杂,这背后须要强大的计算能力。

目前仅一个用做机器学习的GPU(图形处理器)集群已是32P,如今还在不断地扩展中。

滴滴是“物移大智云”里最典型的表明,做为全世界最大的车联网平台,咱们经过移动互联网的方式把更多的车辆、用户连在这个平台上面,在这个过程当中咱们积累了大量的数据,这些数据经过人工智能算法,不断地去提高总体的调度效率、体验的效率,包括总体的安全。

如今滴滴车辆上逐步安装了一些车载设备,有对内对外摄像头,这些摄像头是为了安全,能提供车前的行车记录、订单行程中车内录像,在遇到纠纷的时候更好地判责帮助车主维护权益。

在这里面滴滴大量应用到不少技术:大数据至关于食材,人工智能技术至关于菜谱,云计算平台至关于厨房同样,菜谱加食材,咱们在一个厨房里把美味的大餐作出来。

 

640?wx_fmt=png

受益于开源,也回馈开源

 

滴滴的技术平台用了大量的开源软件,在滴滴平台的主要软件架构中有四五千个服务模块,(PPT)上罗列了一些相对重要的模块。

咱们有不少自建的数据中心,还有SDN(软件定义网络)的软件,SDN用了不少开源软件,由于咱们作了不少资源调度平台,资源调度平台用了容器化,咱们构建一个基于SDN统一资源调动平台,包括数据库的服务。

在存储上,咱们本身搭建了面向位置服务的存储引擎,在开源基础上作了一个对象存储。

离线的数据上,咱们用了MQ的软件来进行总体大批量的数据传输。大数据平台上,有很是庞大规模的数万台集群在跑,包括实时的计算平台。另外咱们也搭建了一个机器学习的平台,主要作一个资源调度平台,上面支撑的AI框架、比较流行学习的框架,咱们在机器学习平台也支持。

滴滴内部作AI应用算法的同窗,他们在平台上只要搭建了本身的模型,至于模型规模、数据获取,这些基本上都能自动化起来,基本不太须要本身大量地写程序。

不少中台的服务是咱们本身开发,咱们围绕本身业务场景来开发司机系统、订单系统、支付等等,就不一一介绍了。

滴滴有自成体系的一套运维系推,里面也有大量的组件。在滴滴的平台上面,经过大量的应用开源软件加上自主开发的软件,共同构建了全世界规模最大的出行平台。

滴滴受益于开源,开源软件帮助公司快速发展和下降成本。因此咱们也想回馈开源,在不少领域,包括移动开发、中间件、系动软件、前端、研发、测试、智慧交通、人工智能这些领域,均有一系列的组件。

这些组件咱们从2017年开始对外开源,总共有23个项目开源,开源得到Star数36000多个,也有外部不少公司参与咱们的项目开发。

滴滴花了大量资源来作开源,一方面是在内部作一些开源的建设,将内部全部部门的壁垒所有打掉,除了一些机密的要求,大部分代码是对内开放的,这样作的好处是能够避免在内部的重复开发。好的项目会真正帮助咱们会对外开源、回馈社区,创建起这个生态标准。

另外一方面但愿对外输出影响力,滴滴整个平台有很是多的技术挑战,实力也不错,对于技术品牌的建设有帮助,后续咱们会吸引更多优秀的人才加入进来。

咱们的核心仍是打造滴滴的技术文化,是开放协做的。

 

640?wx_fmt=png

不只软件开源,还向学界开放数据

 

咱们不光是开源,还对学界开放脱敏数据。由于滴滴是全世界最大的一个共享出行平台,咱们在交通领域的数据较多。因为中国人口巨大,在不少领域中国拥有的数据比全世界其余地方多,可是目前不少高校基于一些研究拿的数据每每是国外的,这是很不对等的。

因此咱们努力在把滴滴一部分脱敏数据开放出来,但愿学术界、科研机构能基于滴滴的数据来作研究。咱们数据量是全世界最大,从2017年,咱们开放成都、东北区域的轨迹数据,还开放了成都的检索数据、西安高新开发区的轨迹数据,今年还开放了车载视频的数据。由于车载视频涉及到不少自动驾驶、计算机视觉方面的研究。

自开放数据以来,已经有四五千家的学术机构来申请咱们的数据。上星期咱们还开放了海口的数据,包括轨迹的数据。固然这上面没有用户信息,乘客和司机的信息隐私必定会保护的。但开放的数据可提供给经济学家,来研究一个城市的交通领域变迁。

2018年,咱们成立了AI for Social Good共创平台,滴滴联合十几家科研机构社会组织一块儿发布的这个平台,咱们但愿联合更多外部力量,在安全、环境、健康、无障碍领域里,对更多的项目,好比说咱们在小部分滴滴汽车中安装了一些移动传感器,用于检测空气数据,帮助绘制精细化的空气质量图,这对环保治理很是有帮助。

将来在这些领域,咱们但愿更多的社会机构和咱们一块儿经过人工智能的方式,让出行更美好,让城市更加智能,谢谢。

人工智能学习路线+实战训练

https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

【End】

640?wx_fmt=jpeg

 

 热 文 推 荐 

小米崔宝秋:小米 AIoT 深度拥抱开源

为何 C 语言仍然占据统治地位?

苹果应用审核团队:每人日审百款 App!

华为在美研发机构 Futurewei 意欲分家?

老司机教你如何写出没人敢维护的代码!

Python有哪些技术上的优势?比其余语言好在哪儿?

上不了北大“图灵”、清华“姚班”,AI专业还能去哪上?

公链史记 | 从鸿蒙初辟到万物生长的十年激荡

边缘计算容器化是否有必要?

马云曾经偶像,终于把阿里留下的1400亿败光了!

640?wx_fmt=gif点击阅读原文,输入关键词,搜索CSDN文章。

640?wx_fmt=png你点的每一个“在看”,我都认真当成了喜欢