临时处理一个Numpy的二进制文件,分析知道里面是dict类型,简单小记一下,若是Numpy和Python基础不熟悉能够看我以前写的文章html
%%time
import numpy as np
%%time
import pandas as pd
%%time
df = pd.DataFrame(np.load("data.npy")) # 经过narry建立DataFrame
%%time
df.head(10) # 快速预览前10行
%%time
# 提取email列
df['Email'] = df[0].map(lambda x : dict(x)["email"])
# 提取pwd列
df['MD5'] = df[0].map(lambda x : dict(x)["pwd"] )
# 删除无用列
del df[0]
%%time
df.size # 查看总共多少数据
%%time
df.shape
%%time
df.head(10)
%%time
df.T.to_json("user.json") # 从新保存为Json(转置只是为了存储成咱们常见的json格式)
关于怎么知道是dict类型的扩展:能够加载看看:np.load("data.npy")
python