新的神经网络架构-EfficientDet

哈Ha!我向您介绍了Tan Mingxing Tan,庞若鸣,Quoc V. Le 撰写的文章“ EfficientDet:可扩展和高效的对象检测”的分析

近年来,在更精确的物体检测方面已经取得了巨大的进步,而现代的物体检测器也变得越来越昂贵。计算过程和昂贵的计算成本阻碍了它们在许多实际应用中的部署,例如机器人技术和自动驾驶汽车,这些应用严重限制了模型的大小和延迟。鉴于这些有限的实际资源,模型效率对于对象检测变得越来越重要。
以前有许多旨在开发更有效的检测器体系结构的工作。通常,这样的工作会更加高效,从而牺牲准确性。一个自然的问题出现了:是否有可能建立一个可扩展的检测体系结构,以更高的准确性和更高的效率以及广泛的资源限制?EfficientDet的创建者认为,他们已经找到了该问题的答案。

EfficientDet:可扩展且高效的对象检测


图片

上表显示,

其他检测器相比,EfficientDet 可以通过更少的计算获得更高的精度

什么是EfficientDet体系结构?


图片
整个EfficientDet体系结构在很大程度上与一级(一级)检测器的范例保持一致。基于在ImageNet上进行了预训练的EfficientNet,将具有加权双向
特征金字塔(BiFPN)的图层附加到该图层,然后分别是用于生成对象类别预测的类和块网络以及边界框。

关于BiFPN:


创建双向特征金字塔的想法是在研究了网络性能和效率以提高缩放比例之后提出的:FPN,PANet和NAS-FPN。PANet的精度比FPN和NAS-FPN更好,但是要付出更多参数和计算的代价。为了提高模型的效率,提出了一些针对跨尺度连接的优化方法:
  • -, , . : , , . PANet, 2 ();
  • -, , , , 2 ();
  • -, PANet, , ( ) , .

图片

特征 网络设计- (a)FPN引入了一条向下的路径,以融合从3级到7级(P3-P7)的多尺度特征;
(b)PANet在FPN的顶部增加了一条自下而上的路径;
©NAS-FPN使用神经
搜索架构搜索对象的不规则网络拓扑;
(d)从所有输入要素到输出要素增加昂贵的连接;
(e)通过删除一些节点来简化面板;
(f)我们的BiFPN具有更好的准确性和效率折衷。

图片
该表显示了从RetinaNet(ResNet50 + FPN)开始,如何将编码器替换为EfficientNet-B3,然后将基本FPN替换为BiFPN,随着每次更改,精度都会提高。

图片
EfficientDet还使用了一个棘手的函数来代替SoftMax,后者基于快速合并归一化方法,该方法提供与基于Softmax的合并相同的准确性,但在GPU上的工作速度是后者的1.26-1.31倍。

图片
通过共同增加所有网络的大小,深度和输入分辨率,还提高了图像分类的性能。
该图显示了不同缩放方法的比较。所有方法都可以提高准确性,但是全面的缩放方法可以提供更好的折衷精度和效率。

图片
在该图中,您可以看到模型尺寸和输出
延迟的比较延迟是根据同一台机器上批次1的大小进行测量的,
配备Titan V GPU和Xeon处理器。AN代表经过增强训练的AmoebaNet + NAS-FPN。

结论:


由于对设计有效对象检测网络体系结构的各种选择进行了系统研究的结果,提出了一种加权双向功能网络和一种定制的复合缩放方法,以提高准确性和效率。基于这些优化,已经开发了一种称为EfficientDet的检测器新系列,该系列检测器始终具有比现有技术更高的精度和效率,并且具有广泛的资源限制。特别是,我们的EfficientDet-D7以比现有最佳检测器更少的参数和FLOPS达到了最先进的精度。 EfficientDet在GPU上也快3.2倍,在CPU上快8.1倍。

资料来源:谭明明,庞国强,V。Le
Google Research脑部团队“ EfficientDet:可扩展且高效的对象检测”
arxiv.org/abs/1911.09070

All Articles