MNIST数据集

MNIST数据集(Mixed National Institute of Standards and Technology database)是美国国家标准与技术研究院收集整理的大型手写数字数据库,包含60,000个示例的训练集以及10,000个示例的测试集.
在这里插入图片描述
在这里插入图片描述
我们可以下载数据集,下载后会得到这样四个文件
在这里插入图片描述
得到一个数据集后的首要任务是将数据可视化,从感官上了解数据的具体情况.
这个数据集中包含55000条训练数据5000条验证数据,和10000条测试数据

取出一条数据,打印数据的shape(784,),每条数据是一个长度为784的一维矩阵,这是因为数据经过标准化处理了,每条数据为手写图片的784个像素点。

把数据打印出来看看
在这里插入图片描述
数据的最小值是0,最大值接近1.这说明数据已经经过标准化处理了,如果没有标准化处理图片的像素值是在0~255之间的.

我们要打印出来一张图片看看是什么样子的,先将数据reshape28*28的矩阵,然后打印图片。注意:照片是黑白的。
参考: https://zhuanlan.zhihu.com/p/36592188