logo

VGG-Net

VGG-16、VGG-19

wangzf / 2023-03-23


目录

VGG-Net 简介

VGG16,VGG19

由于不断的积累实践和日益强大的计算能力,使得研究人员敢于将神经网络的结构推向更深层。 在 2014 年提出的 VGG-Net 中,首次将卷积网络结构拓展至 16 和 19 层,也就是著名的 VGG16 和 VGG19。

VGG 架构由牛津大学视觉几何小组的 Karen Simonyan 和 Andrew Zisserman 于 2014 年开发, 因此命名为 VGG。该模型比当时的过去模型显示出显着的改进 - 特别是 2014 年 Imagenet 挑战赛,也称为 ILSVRC。

相较于此前的 LeNet-5 和 AlexNet 的 $5 \times 5$ 卷积和 $11 \times 11$ 卷积,VGGNet 结构中大量使用 $3 \times 3$ 的卷积核和 $2 \times 2$ 的池化核。 VGG-Net 的网络虽然开始加深但其结构并不复杂,但作者的实践却证明了卷积网络深度的重要性。 深度卷积网络能够提取图像低层次、中层次和高层次的特征,因而网络结构需要的一定的深度来提取图像不同层次的特征。

VGG网络架构:

网络比较:

VGG-16 网络结构

img

VGG 的网络结构非常规整,2-2-3-3-3 的卷积结构也非常利于编程实现。卷积层的滤波器数量的变化也存在明显的规律, 由 64 到 128 再到 256 和 512,每一次卷积都是像素成规律的减少和通道数成规律的增加。 VGG-16 在当年的 ILSVRC 以 32% 的 top5 错误率取得了当年大赛的第二名。这么厉害的网络为什么是第二名? 因为当年有比 VGG 更厉害的网络,也就是致敬 LeNet-5 的 GoogLeNet。

img

img

VGG-19 网络结构

参考