当前位置: 首页 - 行业资讯 - 学界华盛顿大学推出YOLOv3检测速度快SSD和RetinaNet三倍附实现

学界华盛顿大学推出YOLOv3检测速度快SSD和RetinaNet三倍附实现

2025-05-24 行业资讯 0

学界华盛顿大学推出YOLOv3:检测速度快SSD和RetinaNet三倍(附实现)


选自

pjreddie


作者:Joseph Redmon、Ali Farhadi


机器之心编译





近日,来自华盛顿大学的 Joseph Redmon 和 Ali Farhadi 提出 YOLO 的最新版本 YOLOv3。通过在 YOLO 中加入设计细节的变化,这个新模型在取得相当准确率的情况下实现了检测速度的很大提升,一般它比 R-CNN 快 1000 倍、比 Fast R-CNN 快 100 倍。机器之心对论文进行了编译,实现和视频 demo 详见文中。



代码地址:https://pjreddie.com/yolo/.





图 1:我们从 Focal Loss 论文 [7] 中采用了这张图。YOLOv3 在实现相同准确度下要显著地比检测方法快。时间都是在采用 M40 或 Titan X 等相同 GPU 下测量的。






图 2:带有维度先验和定位预测的边界框。我们边界框的宽和高以作为离聚类中心的位移,并使用 Sigmoid 函数预测边界框相对于滤波器应用位置的中心坐标。






表 1:Darknet-53 网络架构。






表 2:主干架构的性能对比:准确率(top-1 误差、top-5 误差)、运算次数(/十亿)、每秒浮点数运算次数(/十亿),以及 FPS 值。






表 3:该表来自 [7]。从中看出,YOLOv3 表现得不错。RetinaNet 需要大约 3.8 倍的时间来处理一张图像,YOLOv3 相比 SSD 变体要好得多,并在 AP_50 指标上和当前最佳模型有得一拼。






图 3:也是借用了 [7] 中的图,展示了以.5 IOU 指标的速度/准确率权衡过程(mAP vs 推断时间)。从图中可以看出 YOLOv3 准确率高,速度也快。




最后,机器之心也尝试使用预训练的 YOLOv3 执行目标检测,在推断中,模型需要花 1s 左右载入模型与权重,而后面的预测与图像本身的像素大小有非常大的关系。因此,吃瓜小编真的感觉 YOLOv3 很快哦。








论文:YOLOv3: An Incremental Improvement








论文链接:https://pjreddie.com/media/files/papers/YOLOv3.pdf




摘要:

我们在本文中提出 YOLO 的最新版本 YOLOv3。我们对 YOLO 加入了许多设计细节的变化,以提升其性能。这个新模型相对更大但准确率更高。不用担心,它依然非常快。对于 320x320 的图像,YOLOv3 可以达到 22ms 的检测速度,获得 28.2mAP 的性能,与 SSD 的准确率相当但是速度快 3 倍。当我们使用旧版.5 IOU mAP 检测指标时,YOLOv3 是非常不错的。它在一块 TitanX 上以 51ms 的速度达到了 57.9 AP_50 的性能,而用 RetinaNet 则以 198ms 的速度获得 57.5 AP_50 的性能,性能相近但快了 3 倍。






本文为机器之心编译,

转载请联系本公众号获得授权



?------------------------------------------------


加入机器之心(全职记者/实习生):hr@jiqizhixin.com


投稿或寻求报道:editor@jiqizhixin.com


广告&商务合作:bd@jiqizhixin.com





标签: 科技行业资讯

上一篇:实时监控数据高科技助力聚合过程优化

下一篇:化学反应之舞揭秘化工工艺流程图的奥秘

相关推荐
推荐资讯
热门文章