(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210856811.6
(22)申请日 2022.07.20
(71)申请人 东南大学
地址 210096 江苏省南京市玄武区四牌楼 2
号
(72)发明人 金嘉晖 唐俊 张斌杰 张竞慧
罗军舟
(74)专利代理 机构 南京众联专利代理有限公司
32206
专利代理师 张天哲
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 50/26(2012.01)
G06F 16/2458(2019.01)G06F 16/29(2019.01)
(54)发明名称
一种城市环境下多时间段稀疏犯罪发生地
点的预测方法
(57)摘要
本发明公开了一种城市环境下多时间段稀
疏犯罪发生地点的预测方法。 所述方法包括城市
空间和犯罪记录建模、 门控循环网络 ‑神经常微
分方程‑贝叶斯GRU ‑ODE‑Bayes犯罪地点预测模
型、 数据增强模块、 邻近重复增强模块。 根据真实
数据进行处理来抽象数据得到模 型输入向量; 通
过GRU‑ODE‑Bayes犯罪地点预测模型通过输入城
市网格嵌入和犯罪特征来预测犯罪地点; 并使用
数据增强模块来丰富稀 疏犯罪的训练数据, 使用
邻近重复增强模块来实现连续的犯罪预测。 本发
明能对稀 疏犯罪地点进行一个有效的预测, 利于
公共安全和城市治理。
权利要求书3页 说明书7页 附图1页
CN 115169715 A
2022.10.11
CN 115169715 A
1.一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其特征在于, 该方法包括
以下步骤:
(1)建立城市环境下稀疏犯罪发生地点预测模型, 所述犯罪发生地点预测模型包括城
市空间和犯罪记录建模、 门控循环网络 ‑神经常微分方程 ‑贝叶斯GRU ‑ODE‑Bayes犯罪地点
预测模型、 数据增强模块、 邻近重复增强模块; 城市空间和犯罪记录 建模来抽象数据输入到
模型, GRU‑ODE‑Bayes犯罪地点预测模 型通过输入城市网格犯罪特征来预测犯罪地点, 数据
增强模块通过利用高相关性的犯罪类型的犯罪记录和相似城市地区的犯罪记录进行补充
训练数据, 邻近 重复增强模块从附近区域的犯罪事 件中提取 上下文来增强短期连续预测;
(2)对于不同的犯罪类型使用损失函数进行犯罪发生地点预测模型训练, 得到训练好
的犯罪发生 地点预测模型;
(3)利用训练好的犯罪发生 地点预测模型对犯罪发生 地点进行预测。
2.根据权利要求1所述的一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其
特征在于, 步骤(1)中, 城市空间和犯罪记录建模描述如下:
抽象地理城市空间为n个 正方形网格
对于在时间j第i个的网格的嵌入是对所有
该区域嵌入信息的连接
其中vi是环境嵌入, 包括但不限于每个类别兴趣点
的数量、 建筑的功能、 人员的流动强度等; li是位置嵌入, 将网格的经纬度进行编码嵌入;
是动态犯罪嵌入, 通过划分时间段计算每个时间段网格内发生的犯罪事件数量, 得到一天
的周期特征dday、 一周的周期特征dweek、 一个月的周期特征dmonth, 拼接得到动态犯罪嵌入
犯罪记录表示为ec=(i,j), 其含义为在网格i中发生在j 时间
段的类型为c的一起犯罪事件, 则按照时间排序的犯罪事件列 表, 表示为
对于
一个犯罪事 件ec=(i,j), 使用相应的网格嵌入
来表示它。
3.根据权利要求1所述的一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其
特征在于, 步骤(1)中, GRU ‑ODE‑Bayes犯罪 地点预测模型描述如下:
GRU‑ODE‑Bayes犯罪地点预测模型包含两个部分, 一个预测风险网格嵌入的GRU ‑ODE模
块, 一个利用零星的观测记录对模 型进行修正的Bayes Update模块; 对类型为c的犯罪进行
预测, 将犯罪列表Ec输入到模型, 对于第一个记录
是
模型从时间j1开始, 在
时间j1最初预测的风险网格嵌入为
在第k+1个记录
的时间jk+1之前, 由GRU ‑
ODE模块对下一个时间点的风险网格嵌入进行 预测, 计算如下:
当一个真实的犯罪记录
被获取, 预测的嵌入将被GRU ‑Bayes更新, 计算如下:
权 利 要 求 书 1/3 页
2
CN 115169715 A
2计算所有网格嵌入
与预测风险网格嵌入的差值, 差值最小的网格为tk时刻的预
测风险网格。
4.根据权利要求1所述的一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其
特征在于, 步骤(1)中, 数据增强模块采用两种数据增强策略: 跨类型迁移和跨网格迁移;
跨类型迁移数据增强基于两种高度相关的犯罪类 型ca和cb, cb可能在ca发生的很短时间
内发生, 通过计算犯罪类型间的共现率来衡量两种犯罪类型之间的关系, 共现率定义为在
一段时间内同一网格内不同犯罪类型发生的频率Δt(, Δt为超参数, 计算如下:
对于补充犯罪类型ca, 选择另一个相关分数最高的犯罪类型cb, 将Eb加入Ea, 使Ea更长;
训练时, 对Eb样本的损失给 出一个权 重, 即co‑occ(ca,cb)。 ;
跨网格迁移数据增强基于两个特征相似的网格更有可能发生相同的犯罪事件, 通过计
算网格之间的相似度得分, 并为每个网格gi找到m个最相似的网格, m为一个超参数; 将这些
网格中的犯罪事件添加到Ec中; 网格ga和gb之间的相似度得分取网格的环境嵌入vi和vj的皮
尔逊相关系数, 其中
计算如下:
对于网格ga的事件ec=(a,j), 若ga是gb最相似的网格, 则向Ec中添加事 件ec=(a,j)。
5.根据权利要求1所述的一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其
特征在于, 步骤(1)中, 邻近 重复增强模块描述如下:
选择50个犯罪概率最大的网格候选Candidate={can1,can2,…,can50}, 对于每个网格
cani, 获取其周围网格canj在时间[j ‑Δt,j)发生的犯罪事件, 并按照时间排序, 得到 一个邻
近区域重复事件列表Ni={e1,e2,…,ecnt}, 输入到GRU模型中得到邻近重复上下文nci=GRU
(Ni), 将预测嵌入
和邻近重复上下文nci使用一个超参数β相加作为最终预测嵌入,
和
候选candi的真正网格嵌入
之间的差异di由欧几里得距离计算得到, 然后选择最小距
离 δi的
6.根据权利要求1所述的一种城市环境下多时间段稀疏犯罪发生地点的预测方法, 其
特征在于, 步骤(2)中, 使用损失函数进行 犯罪发生 地点预测模型训练描述如下:
对于所有类型c的记 录, 使用长度为16的滑动窗口扫描Ec。 ; 将每组的前 15条记录作为输
入, 最后一条记录作为标签; 以最小化损失值为目标来训练模型, 损失函数由两部分组成,权 利 要 求 书 2/3 页
3
CN 115169715 A
3
专利 一种城市环境下多时间段稀疏犯罪发生地点的预测方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:41:57上传分享