目标检测入门——术语篇

目标检测入门——术语篇


计算机视觉 目标检测 人工智能

这篇博客记录了目标检测领域下常见的专业术语。

术语解释
IoU图和框的 交集/并集,判断检测是否正确的阈值,通常为 0.5。
P每张图像中被检测出的正确目标占总目标数的多少。
AP对于一个类别的平均精度,图像个数/总精度和。
MAP所有类别的平均精度和/总类别数。
AP50…AP50代表 IoU 取 0.5,AP60代表 IoU 值取 0.6。数值越高越难。
ROIRegion of Interest,有很大可能性包含检测目标的区域。
Anchor预先设定在图像上的密集方框,用于后续检测标记。
Region Proposals建议区域,经过 Region Proposal Network(RPN) 得到一个 region 的 p0.5p\geq 0.5,则这个 region 中可能具有目标,这些选出来的区域被称为 ROI(Region of Interests)。RPN 同时会在 feature map 上框定 ROI 大致位置,输出 Bounding-box。
one-stage一步检测器,指从图片到检测结果一步到位。(e.g. YOLO, SSD)
two-stage两步检测器,指分两步走,先从图片提取 ROI,再进行检测。(e.g. RCNN, FPN, etc.)
skeleton骨骼点,常见于行为检测数据集,标记人体几个重要位置的数据。
Re-ID行人重识别,利用计算机视觉技术判断图像或者视频序列中是否存在特定人的技术。
backbone图像特征提取器,往往是目标检测的第一步,常用 ResNet
head分类+定位器
neck插在 backbone 和 detection head 之间的模块,使网络更好地融合/提取 backbone 给出的特征,提高网络性能,例如:FPN,NAS-FPN,PAN,ASFF,RFB,SPP。这部分是科研的主攻点。
© 2024 Hotel