BDD100K:一个大规模、多样化的驾驶视频数据集

官网:http://bair.berkeley.edu/blog/2018/05/30/bdd/
数据集下载地址:http://bdd-data.berkeley.edu.
论文下载地址:https://arxiv.org/abs/1805.04687

近日,伯克利大学AI实验室(BAIR)发布了目前最大规模、内容最具多样性的公开驾驶数据集BDD100K,同时设计了一个图片标注系统(Labeling System 的介绍见论文)。BDD100K 数据集包含10万段高清视频,每个视频约40秒,720p,30 fps 。每个视频的第10秒对关键帧进行采样,得到10万张图片(图片尺寸:1280 * 720 ),并进行标注。
这里写图片描述

一、Annotations

1、 道路目标边界框:10万张图片
其中:训练集7万,测试集2万,验证集1万
2、 可行驶区域:10万张图片
3、 车道线标记:10万张图片
4、 全帧实例分割:1万张图片

Annotation包含了被标记对象的:
源图像的URL、类别标签、大小(起始坐标、结束坐标、宽度和高度)、截断、遮挡和交通灯颜色等信息。

二、 Image Tagging

(一)标签类别

数据集中的GT框标签共有10个类别,分别为:Bus、Light、Sign、Person、Bike、Truck、Motor、Car、Train、Rider。总共约有184万个标定框,不同类型目标的数目统计如图1所示。
这里写图片描述
其中小车(Car一类)就超过了100万个样本。平均而言,每张图片约9.7辆车,1.2个人。尤其是,行人的数量多于之前的数据集,具体数目如图2所示(统计是基于各数据集中的训练集的)。
这里写图片描述

(二) 天气、场景和时间

1、天气:晴天、多云、阴天、下雨、下雪、雾天6种天气,以晴天为主。
这里写图片描述
2、 场景:住宅区、公路、城市街道、停车场、加油站、隧道6种场景,以城市街道为主。
这里写图片描述
3、时间:黎明/黄昏、白天、夜晚3个阶段,其中白天、夜晚居多。
这里写图片描述

(三)Occluded、Truncated

目标的是否遮挡、截断情况标注。
这里写图片描述

10万张图片中,包含了不同天气、场景、时间的图片,而且高清、模糊的图片都有,规模大,多样化,都是真实的驾驶场景。