专利一种针对密集人群场景多层次行为识别的方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211228248.4 (22)申请日 2022.10.09 (71)申请人天津大学地址 300072 天津市南开区卫津路9 2号 (72)发明人冯伟　韩瑞泽　颜昊旻　王立凯　王松　 (74)专利代理机构天津市北洋有限责任专利代理事务所 12 201 专利代理师韩帅 (51)Int.Cl. G06V 20/52(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/25(2022.01) G06V 10/44(2022.01)G06V 10/74(2022.01) G06V 10/82(2022.01) (54)发明名称一种针对密集人群场景多层次行为识别的方法 (57)摘要本发明公开了一种针对密集人群场景多层次行为识别的方法，步骤s1，通过卷积神经网络提取场景中对应的特征向量；步骤s2，根据场景中对应的特征向量构建初始基础图神经网络；步骤s3，基础图神经网络特征向量计算获得图像相似度矩阵E；步骤s4，所述基础图神经网络计算行人两两之间的空间距离矩阵D；步骤s5，基础图神经网络根据相似度矩阵E和空间距离矩阵D获得关系矩阵R；步骤s6，基础神经网络采用关系矩阵 R更新场景中特征向量；步骤s7，分层图网络对更新特征向量进行两次聚合获得行人特征nI、分组特征nP、全局特征nG；步骤s8、多层感知机网络获得动作类别预测结果；该方法实现了对场景中多层次动作信息的一次性识别，提高了行为识别效率。权利要求书2页说明书8页附图1页 CN 115457480 A 2022.12.09 CN 115457480 A 1.一种针对密集人群场景多层次行为识别的方法，所述方法基于卷积神经网络、基础图神经网络、分层图神经网络和多层感知机网络；其特征在于；包括如下步骤：步骤s1，通过卷积神经网络提取场景中行人目标检测框对应的特征向量b1,b2,...,bn；步骤s2，根据场景中对应的特征向量构建初始基础图神经网络；步骤s3，所述基础图神经网络特征向量两两之间计算相似度计算获得目标相似度矩阵 E；步骤s4，所述基础图神经网络采用面积归一化的空间距离度量方法计算行人两两之间的空间距离矩阵D；步骤s5，所述基础图神经网络根据相似度矩阵E和空间距离矩阵D获得关系矩阵R；步骤s6，所述基础神经网络采用关系矩阵R更新场景中特征向量；步骤s7，所述分层图网络对更新特征向量进行两次聚合获得行人特征nI、分组特征nP、全局特征nG；步骤s8、所述多层感知机网络按照如下公式获得动作类别预测结果： aG＝Fg(nG) 其中： aI为单体行为识别结果， aP为分组的行为识别结果， aG为场景整体行为识别结果。 2.根据权利要求1所述的一种针对密集人群场景多层次行为识别的方法，其特征在于：所述基础图神经网络特征向量两两之间计算相似度，从而获得图像相似度矩阵E，过程如下：对场景中的行人进行建图G＝(N,E)；其中N表示途中的节点信息， E表示图中的边信息；即节点相似度矩阵。图的节点N初始化为步骤(1)中提取的深度特征，对于节点u和v,其对应的图的边信息的计算公式为： eu,v＝F1(fu)F2(fv)T,u,v∈N 其中F1、 F2为多层感知机网络结构， fu、 fv分别代表节点u和节点v对应的特征。边信息 eu,v 则表示节点u和v的相似度。通过计算任意两节点的相似度，可以得到整个图的相似度矩阵 E。 3.根据权利要求2所述的一种针对密集人群场景多层次行为识别的方法，其特征在于：所述基础神经网络采用关系矩阵R更新场景中特征向量过程：根据初始化的图网络与计算得到的相似度矩阵，对图网络的节点信息进行更新，具体步骤如下：利用下述公式更新图节点信息：其中Fn为一个由全连接层构成的节点更新网络， fu， f’u分别为更新前后的节点特征，节点v表示与节点u 有连接的节点， eu,v在上述步骤计算得到；对更新前后的节点特征进行聚合，具体公式为：权　利　要　求　书 1/2 页 2 CN 115457480 A 2可以得到为最终的行人特征，下标u表示该特征对应的行人编号为u，运算符表示特征向量中元素的按位对应相加。 4.根据权利要求1所述的一种针对密集人群场景多层次行为识别的方法，其特征在于：所述基础图神经网络采用面积归一化的空间距离度量方法计算行人两两之间的空间距离矩阵D；利用面积归一化的空间距离度量方法计算行人之间的初始空间距离，公式如下：其中： xu， xv为检测框下边沿中点的横坐标， yu， yv为检测框下边沿中点的纵坐标； Su、 Sv 为检测框的面积；利用如下公式计算空间距离蒙版矩阵其中： ρ 为预先设定的超参数。 5.根据权利要求3所述的一种针对密集人群场景多层次行为识别的方法，其特征在于：所述基础图神经网络根据相似度矩阵E和空间距离矩阵D按照如下公式获得关系矩阵R；其中：其中由权利要求3所述由距离矩阵D计算得到， λ为预先设定的超参数，用于平衡相似度矩阵与空间距离矩阵之间的权重，⊙代表矩阵对应元素相乘。 6.根据权利要求1所述的一种针对密集人群场景多层次行为识别的方法，其特征在于：所述分层图网络对更新特征向量进行两次聚合获得行人特征nI、分组特征nP、全局特征nG过程；根据关系矩阵R利用聚类算法获取行人分组预测结果；使用聚合网络对每个分组中的所有行人特征nI进行按照如下公式聚合获取分组特征 nP：其中：下标k表示该特征对应的分组编号为k，即第k个分组Gk，表示所有属于该分组的全部行人的对应特征， AiO表示特征聚合操作。表示第k个分组对应的分组特征；使用聚合网络对分组特征nP以及不属于任何分组的行人特征nI进行按照如下公式聚合获取全局特征nG：其中：表示u不属于任意分组，即未参与分组的单人特征表示全部分组形成的分组特征 nG表示聚合得到的全局特征。权　利　要　求　书 2/2 页 3 CN 115457480 A 3

专利 一种针对密集人群场景多层次行为识别的方法

专利一种针对密集人群场景多层次行为识别的方法