论文阅读:CrimAnalyzer:可视化分析圣保罗犯罪模式

当可视化遇上“犯罪克星”

从2020年11月2日开始记录我读论文后的一些总结,希望可以见证自己的成长



前言


本文是我读完IEEE VIS的论文《CrimAnalyzer: Understanding Crime Patterns in São Paulo》后的一些总结


提示:以下是本篇文章正文内容,下面案例可供参考

一、本文讲了什么?

本文将可视化技术应用于城市犯罪模式分析,设计了一套名为**“CrimAnalyzer”**的可视化分析系统,首先应用于圣保罗这一犯罪率极高的大城市,该系统可以灵活的分析不同地狱的犯罪模式(何种犯罪模式最常见、哪种犯罪模式正在增长、犯罪行为集中在那些区域),解释了犯罪形式随时间的演变,提供派警、预防行为的指导,辅助警局。

在这里插入图片描述

二、为何需要这么一套可视化分析系统?

欠发达国家大型城市一直受安全问题困扰,圣保罗就是其中的典范。可视化作为一种数据分析的工具,已经在城市犯罪数据领域得到了应用,如Crimemapping,但他们往往局限于单纯的统计犯罪事件以及数量,难以进行可视推理。

三、有何创新点?

1.算法应用的创新

采用了NMF(非负矩阵分解)来进行犯罪热点的侦查,相较于传统的Getis-Ord General G(高/低聚类算法)而言,速度更快,效果更好。
(1)NMF应用介绍:
在这里插入图片描述

图a为某一区域的25个站点并标记了四个站点,图b模拟了25个站点在5年60个月的犯罪数据,图c、d为NMF分解的结果,c图rank为3,d图rank为5
如图所示,我们制造四组数据模拟某一地区的犯罪事件:
A(B):从一组均值为8,方差为4的正态分布中抽取60个样本,也就是说犯罪数量多且频率大
C:从一组均值为1,方差为4的正态分布中抽取60个样本,也就是说犯罪数量较少但是频率大,而这类数据也是分析者感兴趣的点,但是传统的以数量统计为主的可视分析却容易忽略这个点。
D:从一组均值为0,方差为0.25的正态分布中抽取60个样本,但是在35和47这两个点增加统计量,也就是说平时犯罪行为极少,但在特殊时期犯罪数目暴增。
这四个点都应该被判断为犯罪热点,但是传统的以数量统计为主的可视分析却容易忽略C、D这两种情况。
从c图矩阵分解的情况来看,W矩阵的列可以的表示出了我们想要的结果及高亮显示。
(2)与高/低聚类算法(以下简称G)的对比
在这里插入图片描述

首先,大部分得到的热点数据是重合的,重合率在98%左右
其次,经过如下分析,NMF得到的结果更为合理。
在这里插入图片描述

P:两个算法都认为是热点
F:NMF认为是热点,但是G不认为是
G:G认为是热点,但是NMF不认为是
N:都不认为是热点
如图a所示,NMP多发现的两个区域均是离散的,且犯罪数量符合热点定义,但我们看图b,G多发现的两个区域均和高犯罪区域临界,且犯罪数量少,我们可以认为这是被高犯罪区域“污染”得到的。
NMF可以有效避免污染。

2.更加细粒度的分析

让我们回顾一下第一张大图,总览这个系统,不带实例来硬解释这个系统的使用是枯燥难懂的,所以我希望可以带着实例来为大家介绍每一个部分的用处。
(a)Control Menu:用户可以手动设置数据集以及选择的时间和热点数目。
(b)Map View:用户可以自由选择感兴趣的的区域,包括画折线、点击、画区域
(f)Ranking Type View:五种犯罪类型的排名随时间的变化
(g)Radial Type View:径向图,展示区域每种类型犯罪不同年份的数目以及占比
OK,结合以上三个模块,我们用一个实例来了解究竟如何使用这些模块
在这里插入图片描述

我们摘取了四个典型区域进行分析,C1(左下角)为商业区;C2(左上角)为金融机构区,这两个区域都属于市中心。R1为中产阶级的居住区,R2位较富裕阶级的居住区,这两个区域均为住宅区。
在C1区域主要以路人抢劫(棕色)以及汽车抢劫为主,且由热点图可以得出,路网规则,具有较好城市基础设施的地区汽车盗窃风险比较高。
在C2区域可以看出此地区货物盗窃(绿色)这种犯罪类型一直在增长,但是整个区域内这种犯罪行为却不多见。
从市中心转移到居民区可以发现,R1(中产阶级)巴士抢劫较常见,如R1-b所示,同时,由于站点较少,用户可以方便的逐站点进行犯罪模式分析。
在R2区域,尤其在R2-d中家庭入室盗窃是最常见的犯罪,同时正在逐年增长。
由此可见借助CrimAnalyzer的这几个模块,我们可以灵活选中复杂区域,同时可以清楚地了解区域的犯罪模式(何种犯罪模式最常见、那种犯罪模式正在增长、犯罪行为集中在那些区域),从而可以让我们灵活的交互分析。
© Hotspot View(d) Cumulative Temporal Vie
在这里插入图片描述
在这里插入图片描述
我们只分析汽车抢劫(绿色)这个犯罪行为可以依照表盘看到,下图热点数量比上图多了一个数量级,同时占比也更高,根据径向图可以看出来SP230虽然犯罪数目少,但是具有季节性特征(某一个季节数目激增),而BR116数目在逐年增长。


总结

总之这个论文很神奇,我明天再完善一下