BDD100K：一个大规模、多样化的驾驶视频数据集

时间 2021-01-13 标签目标检测

官网：http://bair.berkeley.edu/blog/2018/05/30/bdd/
数据集下载地址：http://bdd-data.berkeley.edu.
论文下载地址：https://arxiv.org/abs/1805.04687

近日，伯克利大学AI实验室（BAIR）发布了目前最大规模、内容最具多样性的公开驾驶数据集BDD100K，同时设计了一个图片标注系统（Labeling System 的介绍见论文）。BDD100K 数据集包含10万段高清视频，每个视频约40秒，720p，30 fps 。每个视频的第10秒对关键帧进行采样，得到10万张图片（图片尺寸：1280 * 720 ），并进行标注。

一、Annotations

1、道路目标边界框：10万张图片
其中：训练集7万，测试集2万，验证集1万
2、可行驶区域：10万张图片
3、车道线标记：10万张图片
4、全帧实例分割：1万张图片

Annotation包含了被标记对象的：
源图像的URL、类别标签、大小（起始坐标、结束坐标、宽度和高度）、截断、遮挡和交通灯颜色等信息。

二、 Image Tagging

（一）标签类别

数据集中的GT框标签共有10个类别，分别为：Bus、Light、Sign、Person、Bike、Truck、Motor、Car、Train、Rider。总共约有184万个标定框，不同类型目标的数目统计如图1所示。

其中小车（Car一类）就超过了100万个样本。平均而言，每张图片约9.7辆车，1.2个人。尤其是，行人的数量多于之前的数据集，具体数目如图2所示（统计是基于各数据集中的训练集的）。

（二）天气、场景和时间

1、天气：晴天、多云、阴天、下雨、下雪、雾天6种天气，以晴天为主。

2、场景：住宅区、公路、城市街道、停车场、加油站、隧道6种场景，以城市街道为主。

3、时间：黎明/黄昏、白天、夜晚3个阶段，其中白天、夜晚居多。

（三）Occluded、Truncated

目标的是否遮挡、截断情况标注。