简化非极大值抑制分析范文

时间：2022-04-05 11:34:36

简化非极大值抑制分析

《中国科学技术大学学报》2016年第一期

摘要：

以简化非极大值抑制为代表的后处理在基于滑动窗口法的目标检测中发挥着重要作用．针对传统简化非极大值抑制约束条件单一、消除重复检测不充分的问题，提出了一种改进的简化非极大值抑制，即在传统简化非极大值抑制仅计算交集面积对候选检测边界框的覆盖比例的基础上，增加“抑制完全覆盖检测”约束和“PASCALVOC重叠判据”约束，分别对应计算交集面积对选中检测边界框的覆盖比例和对并集面积的重叠比例．实验结果表明，该改进的简化非极大值抑制能有效消除误检，显著提升目标检测方法性能．

关键词：

目标检测；后处理；简化非极大值抑制；抑制完全覆盖检测；PASCALVOC重叠判据

目标检测是计算机视觉领域最基本的挑战之一，广泛应用在工业、医学、军事、教育、商业、体育等领域［1］．滑动窗口法是目标检测方法中的主流方法［2］，虽然在图像的尺度空间中稠密地滑动窗口可以有效地避免漏检，但是也带来了一个重要的难题：目标周围会产生大量覆盖目标整体或部分的彼此邻近的窗口，分类器有很大可能将这些窗口分类为包含目标，从而导致对目标重复检测，发生很多误检．正是为了处理这种情况，基于滑动窗口法的目标检测方法中通常包括一个后处理的步骤．Viola等在做人脸检测研究时提出维奥拉－琼斯目标检测框架［3］，该框架是第一种可以实时处理并给出很好检测率的目标检测方法．本文采用后处理方法解决重复检测问题．首先，如果两个检测结果的边界框有交叠，那么将它们划分到同一个子集，根据此规则将所有检测结果划分到互不相交的子集中；然后，计算子集内所有检测结果边界框的平均值，得出一个最终的检测区域．这样，每一个子集都有一个唯一的检测结果，大大减少了误检的数量．目前，非极大值抑制（non－maximumsuppression，NMS）是应用最为广泛的一类后处理方法，C4行人检测器等诸多目标检测方法［5－9］均采用NMS以消除重复检测．文献［4］将NMS阐述为局部极大值搜索（localmaximumsearch，LMS），即通过LMS获得超越所有相邻者的局部极大值，然后抑制其他局部非极大值．NMS又分mean－shiftNMS、简化NMS等．Mean－ShiftNMS［6］是一种较好的NMS方法，但是在运用过程中，Mean－ShiftNMS需要设置很多的参数．这些参数严重依赖检测方法的其他方面因素，如滑动窗口步长等；因此，大多数研究人员选择采用简洁而实用的简化非极大值抑制．Dollár等［7］在完整的图像中检测目标时，在图像多尺度空间中采用滑动窗口法，其中滑动窗口步长为4个像素，尺度步长为21／10．文中作者用到的简化NMS只有一个参数，即重叠率阈值，并将其设置为0．6；同样地，Enzweiler等在文献［8］中将简化非极大值抑制的重叠率阈值设为0．5．在可变形部位模型（deformablepartmodels，DPM）目标检测方法［9］中，Felzenszwalb等较详细地描述了简化非极大值抑制的过程：首先分类器对图片完成检测后，获得检测结果集合D，其中每一个元素由1个检测边界框和相应的分类器得分构成；然后严格按分类器得分对集合D排序，选中得分最高的检测结果，依次计算该检测边界框对得分较低的候选边界框的覆盖比例，丢弃覆盖超过50％的候选边界框；再更新检测结果并排序，重复上一个步骤，最终选择出所有符合要求的边界框．由于传统的简化非极大值抑制方法存在约束条件单一、消除误检不充分的问题，本文在传统的简化非极大值抑制基础上，增加两条辅助约束条件，提出一种改进的简化非极大值抑制．

1简化非极大值抑制的一般化讨论

本节首先对传统的简化非极大值抑制展开一般化的讨论，然后以DPM目标检测方法在INRIAPerson测试集上检测行人目标为例，分析传统的简化非极大值抑制的不足．

1．1传统的简化非极大值抑制Felzenszwalb等［9］认为简化非极大值抑制是一种“贪婪”的方法，这里的“贪婪”体现在它总是优先选择分类器得分高的检测结果．一旦候选边界框与已经被选中的边界框触发简化非极大值抑制的约束条件，总是分类器得分低的候选边界框被丢弃。

1．2简化非极大值抑制的不足简化非极大值抑制后处理方法非常简洁，但是也存在明显不足．如图1所示，DPM目标检测方法在INRIAPerson测试集上检测行人目标时，存在很多类似图1中展示的误检．

2改进的简化非极大值抑制

传统的简化非极大值抑制凭借简洁实用的优点得到了广泛应用，然而单一约束条件严重限制了后处理的效果．本节提出了两条改进的约束条件，可以有效解决传统简化非极大值抑制的不足，显著提升目标检测方法的性能．

2．1“抑制完全覆盖检测”约束我们观察到一个频繁出现的现象，如图1所示．尺寸大的误检边界框往往将小的检测边界框完全覆盖．受此启发，我们提出“抑制完全覆盖检测”约束：如果分类器得分低的候选检测边界框将已经选中的边界框完全覆盖，则丢弃该候选检测结果．

2．2“PASCALVOC重叠判据”约束为了解决“抑制完全覆盖检测”约束的不足，我们继续提出“PASCALVOC重叠判据”约束，这个约束条件源于PASCALVOC目标检测评价方法，约束也由此得名．PASCALVOC挑战赛［10］对于是否检测到目标的评价方法，即所谓PASCALVOC重叠判据，是通过计算检测结果边界框与标注真实值（groundtruth）边界框的重叠率，如公式（2）所示．当检测结果边界框Bp与标注真实值边界框Bgt的交集面积与其并集面积的比值超过阈值50％时，检测结果Bp视为正确检测到目标.

3实验结果分析

验证实验采用DPM在INRIAPerson数据集上训练得到的行人混合模型，如图4所示．该混合模型共有2个组件模型，每个组件模型分别包含8个可变形部位．INRIAPerson测试集由288张正样本测试图片组成，共包含589个目标．我们利用该模型在INRIAPerson测试集上检测行人目标．用传统的简化非极大值抑制对检测结果后处理时，存在大量分类器得分低且尺寸较大的边界框，原始约束条件在边界框交集面积覆盖大边界框的比例小于设置阈值时失效，产生大量如图1中所示的误检．本文新增的两条约束条件有效抑制了这些误检，故而更好地发掘出检测方法的性能．同时，这种改进的简化非极大值抑制仅在原始方法的约束条件处增加了两条“或”判断条件，未改变算法的计算复杂度．需要指出的是，我们在实验过程中有两点发现：①INRIA在标注真实值时，忽略了很多部分遮挡的目标，而基于部位的目标检测方法，如DPM等可能检测到正确却没有标注的目标，如图6所示，从而导致检测方法“被误检”，影响检测方法的性能评价；②INRIAPerson数据集标注了一些尺寸较小的目标，检测方法很容易漏检这些目标，如图7所示，给DPM等目标检测方法提出了挑战．

4结论

后处理在基于滑动窗口法的目标检测方法中不可或缺，然而，简化非极大值抑制作为一种典型的后处理方法，由于约束条件单一存在消除误检不充分的问题．本文对简化非极大值抑制的约束条件进行了补充，在传统简化非极大值抑制的基础上引入两条附加约束———“抑制完全覆盖检测”约束和“PASCALVOC重叠判据”约束，并对各约束条件进行了一般化的分析．实验结果表明，采用改进的简化非极大值抑制可以有效减少误检，显著提升检测方法的性能．这种改进的简化非极大值抑制后处理适用于所有基于滑动窗口法的目标检测方法．与传统的简化非极大值抑制一样，改进的简化非极大值抑制也面临阈值选择问题，针对INRIAPerson数据集我们提供的对比实验阈值方案是（0．5，0．99，0．30）．未来我们将继续就简化非极大值抑制阈值设置和小尺寸目标的漏检问题进行研究．

作者：张强张陈斌陈宗海单位：中国科学技术大学自动化系

简化非极大值抑制分析范文

扩展阅读