0% found this document useful (0 votes)

5 views

vgg

The document outlines the implementation of the VGG architecture using a function to create VGG blocks with specified convolutional layers and output channels. It details the construction of the VGG-11 model, including the architecture and memory usage for a single input. Additionally, it describes the training process with a smaller network and provides training loop parameters and results.

Uploaded by

wen zhou

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

vgg

Uploaded by

wen zhou

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

2/27/2019 vgg slides

Networks Using Blocks (VGG)

We use the vgg_block function to implement this basic VGG block. This function takes
the number of convolutional layers num_convs and the number of output channels
num_channels as input.

In [1]: import d2l

from mxnet import gluon, init, nd
from mxnet.gluon import nn

def vgg_block(num_convs, num_channels):

blk = nn.Sequential()
for _ in range(num_convs):
blk.add(nn.Conv2D(num_channels, kernel_size=3,
padding=1, activation='relu'))
blk.add(nn.MaxPool2D(pool_size=2, strides=2))
return blk

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 1/6
2/27/2019 vgg slides

VGG Architecture

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 2/6
2/27/2019 vgg slides

In [2]: conv_arch = ((1, 64), (1, 128), (2, 256), (2, 512), (2, 512))

Now, we will implement VGG-11. This is a simple matter of executing a for loop over
conv_arch.

In [3]: def vgg(conv_arch):

net = nn.Sequential()
# The convolutional layer part.
for (num_convs, num_channels) in conv_arch:
net.add(vgg_block(num_convs, num_channels))
# The fully connected layer part.
net.add(nn.Dense(4096, activation='relu'), nn.Dropout(0.5),
nn.Dense(4096, activation='relu'), nn.Dropout(0.5),
nn.Dense(10))
return net

net = vgg(conv_arch)

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 3/6
2/27/2019 vgg slides

Memory usage for single input

Next, we will construct a single-channel data example with a height and width of 224 to
observe the output shape of each layer.

In [4]: net.initialize()
X = nd.random.uniform(shape=(1, 1, 224, 224))
for blk in net:
X = blk(X)
print(blk.name, 'output shape:\t', X.shape)

sequential1 output shape: (1, 64, 112, 112)

sequential2 output shape: (1, 128, 56, 56)
sequential3 output shape: (1, 256, 28, 28)
sequential4 output shape: (1, 512, 14, 14)
sequential5 output shape: (1, 512, 7, 7)
dense0 output shape: (1, 4096)
dropout0 output shape: (1, 4096)
dense1 output shape: (1, 4096)
dropout1 output shape: (1, 4096)
dense2 output shape: (1, 10)

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 4/6
2/27/2019 vgg slides

Model Training

Since VGG-11 is more complicated than AlexNet let's use a smaller network.,

In [5]: ratio = 4
small_conv_arch = [(pair[0], pair[1] // ratio) for pair in conv_arch]
net = vgg(small_conv_arch)

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 5/6
2/27/2019 vgg slides

Training Loop

In [6]: lr, num_epochs, batch_size, ctx = 0.05, 5, 128, d2l.try_gpu()

net.initialize(ctx=ctx, init=init.Xavier())
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': lr})
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
d2l.train_ch5(net, train_iter, test_iter, batch_size, trainer, ctx, num_epochs)

training on gpu(0)
epoch 1, loss 0.9533, train acc 0.654, test acc 0.852, time 37.7 sec
epoch 2, loss 0.4086, train acc 0.850, test acc 0.886, time 35.8 sec
epoch 3, loss 0.3319, train acc 0.878, test acc 0.900, time 35.9 sec
epoch 4, loss 0.2915, train acc 0.894, test acc 0.904, time 35.9 sec
epoch 5, loss 0.2605, train acc 0.905, test acc 0.911, time 35.8 sec

http://127.0.0.1:8000/vgg.slides.html?print-pdf#/ 6/6

Answer For Introduction To Generative AI Quiz
75% (8)
Answer For Introduction To Generative AI Quiz
5 pages
Unit III
No ratings yet
Unit III
58 pages
Modern CNN Architectures
No ratings yet
Modern CNN Architectures
32 pages
Unit 2 CNN
No ratings yet
Unit 2 CNN
15 pages
AlexNet
No ratings yet
AlexNet
20 pages
Aditya Joshi 23252595 Assign 5
No ratings yet
Aditya Joshi 23252595 Assign 5
7 pages
VGG16 Architecture
No ratings yet
VGG16 Architecture
30 pages
20IS712 Deep Learning 300
No ratings yet
20IS712 Deep Learning 300
15 pages
Deep Learning Unit 4
No ratings yet
Deep Learning Unit 4
11 pages
Modern Convolutional Neural Networks
No ratings yet
Modern Convolutional Neural Networks
68 pages
Ker As Tutorial
No ratings yet
Ker As Tutorial
33 pages
nin
No ratings yet
nin
4 pages
Batch Norm
No ratings yet
Batch Norm
7 pages
5-Convolutional Neural Network
No ratings yet
5-Convolutional Neural Network
43 pages
What is VGG
No ratings yet
What is VGG
3 pages
Deep Learning Lab Practicals
No ratings yet
Deep Learning Lab Practicals
24 pages
PyTorch Cheat Sheet & Quick Reference
No ratings yet
PyTorch Cheat Sheet & Quick Reference
6 pages
Chitra k s 2022bcse07aed1011
No ratings yet
Chitra k s 2022bcse07aed1011
21 pages
Assignment3 – DeepLearning
No ratings yet
Assignment3 – DeepLearning
16 pages
Introduction To Keras!: Vincent Lepetit!
No ratings yet
Introduction To Keras!: Vincent Lepetit!
33 pages
AD3511-DEEP LEARNING LAB MANUAL Revised
No ratings yet
AD3511-DEEP LEARNING LAB MANUAL Revised
72 pages
Mark Goldstein mg3479 A2 Code
No ratings yet
Mark Goldstein mg3479 A2 Code
4 pages
Deep-Learning-Assignment-01
No ratings yet
Deep-Learning-Assignment-01
5 pages
Lecture11 cnns-2
No ratings yet
Lecture11 cnns-2
58 pages
Mxnet Documentation: Release 0.0.8
No ratings yet
Mxnet Documentation: Release 0.0.8
93 pages
PyTorch & PyTorch Geometric
No ratings yet
PyTorch & PyTorch Geometric
21 pages
Autoencoders: Parallel Programming Parallel Processing
No ratings yet
Autoencoders: Parallel Programming Parallel Processing
5 pages
CNN Architectures 01
No ratings yet
CNN Architectures 01
66 pages
GPT 2 - Learninhg 5
No ratings yet
GPT 2 - Learninhg 5
2 pages
VGG NEW
No ratings yet
VGG NEW
15 pages
LLM for Maths People
No ratings yet
LLM for Maths People
53 pages
Chapter 5 Deep Learning
No ratings yet
Chapter 5 Deep Learning
35 pages
Harvard CS197 Lecture 6 & 7 Notes
No ratings yet
Harvard CS197 Lecture 6 & 7 Notes
18 pages
2025 Lecture 3 - Architecture
No ratings yet
2025 Lecture 3 - Architecture
68 pages
MLP 1122 20240509 ch10 DeepNN
No ratings yet
MLP 1122 20240509 ch10 DeepNN
47 pages
Accelerating VGG16 DCNN With An FPGA: Dongjoon Park, Pranoti Dhamal
No ratings yet
Accelerating VGG16 DCNN With An FPGA: Dongjoon Park, Pranoti Dhamal
7 pages
Homework IntroToDL
No ratings yet
Homework IntroToDL
3 pages
CS236 Introduction To PyTorch
100% (4)
CS236 Introduction To PyTorch
33 pages
5b Dana
No ratings yet
5b Dana
67 pages
Pytorch 101: Deep Learning PHD Course 2017/2018
No ratings yet
Pytorch 101: Deep Learning PHD Course 2017/2018
19 pages
Week3_Lec1_2
No ratings yet
Week3_Lec1_2
107 pages
VGG Net
No ratings yet
VGG Net
22 pages
Let Us Code: Using Deep Learning Through A Library
No ratings yet
Let Us Code: Using Deep Learning Through A Library
17 pages
Ad3511 Deep Learning Lab Manual
No ratings yet
Ad3511 Deep Learning Lab Manual
80 pages
Project 1 - ANN With Backprop
No ratings yet
Project 1 - ANN With Backprop
3 pages
pytorch.org_tutorials__sources_beginner_ptcheat
No ratings yet
pytorch.org_tutorials__sources_beginner_ptcheat
7 pages
Convolutional Networks
No ratings yet
Convolutional Networks
211 pages
Face - Emotion Recog - Implementation
No ratings yet
Face - Emotion Recog - Implementation
11 pages
Convnets
No ratings yet
Convnets
41 pages
Implementing AI Models on FPGAs_ A Comprehensive T
No ratings yet
Implementing AI Models on FPGAs_ A Comprehensive T
43 pages
Chapter02 Mathematical-Building-Blocks
No ratings yet
Chapter02 Mathematical-Building-Blocks
9 pages
vertopal.com_C3W1_Data_Augmentation_Assignment
No ratings yet
vertopal.com_C3W1_Data_Augmentation_Assignment
16 pages
Pytorch Slides
No ratings yet
Pytorch Slides
31 pages
2c PyTorch4
No ratings yet
2c PyTorch4
4 pages
Pytorch Tutorial 1
No ratings yet
Pytorch Tutorial 1
48 pages
Assignment3 AL
No ratings yet
Assignment3 AL
23 pages
Assignment-U-Net
No ratings yet
Assignment-U-Net
11 pages
Pytorch MNIST Digits Prediction Hands on 1
No ratings yet
Pytorch MNIST Digits Prediction Hands on 1
16 pages
Palaka
No ratings yet
Palaka
2 pages
Pytorch Exercise
No ratings yet
Pytorch Exercise
5 pages
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)
9 Environment
No ratings yet
9 Environment
80 pages
conv-layer
No ratings yet
conv-layer
9 pages
ndarray
No ratings yet
ndarray
21 pages
bounding-box
No ratings yet
bounding-box
8 pages
padding-and-strides
No ratings yet
padding-and-strides
3 pages
Research or Study Plan-1
No ratings yet
Research or Study Plan-1
1 page
SAD - Ch2 - An Overview of UML
No ratings yet
SAD - Ch2 - An Overview of UML
31 pages
NADE
No ratings yet
NADE
4 pages
COMPX310-19A Machine Learning Chapter 10: Neural Networks
No ratings yet
COMPX310-19A Machine Learning Chapter 10: Neural Networks
35 pages
Weka Tutorial 3
No ratings yet
Weka Tutorial 3
50 pages
Unit 3 2DRV
No ratings yet
Unit 3 2DRV
82 pages
Stationary_Non-stationary_White Noise Time Series
No ratings yet
Stationary_Non-stationary_White Noise Time Series
21 pages
Practice Final
No ratings yet
Practice Final
45 pages
Final Quiz 2 - Attempt Review 1
No ratings yet
Final Quiz 2 - Attempt Review 1
4 pages
Formal Languages and Automata: Lab 4. Exercises
No ratings yet
Formal Languages and Automata: Lab 4. Exercises
2 pages
CII4Q3 VISI KOMPUTER - Deep Learning - CNN
No ratings yet
CII4Q3 VISI KOMPUTER - Deep Learning - CNN
106 pages
Standard Normal Cumulative Probability Table
No ratings yet
Standard Normal Cumulative Probability Table
2 pages
2 Models of Computation - DFAs & NFA
No ratings yet
2 Models of Computation - DFAs & NFA
18 pages
Tamilarasi - DL AD3501 - Lesson Plan
No ratings yet
Tamilarasi - DL AD3501 - Lesson Plan
3 pages
Phys 194, Behavior of Complex Systems 1
No ratings yet
Phys 194, Behavior of Complex Systems 1
7 pages
Deeplearning - Ai Deeplearning - Ai
No ratings yet
Deeplearning - Ai Deeplearning - Ai
43 pages
Lect 2 Common Architectural Principles of Deep Networks (3)
No ratings yet
Lect 2 Common Architectural Principles of Deep Networks (3)
20 pages
Lutfiah Farah Azura - Jawaban Uts Ekonometrika 1
No ratings yet
Lutfiah Farah Azura - Jawaban Uts Ekonometrika 1
4 pages
C2_W1_Lab01_Neurons_and_Layers
No ratings yet
C2_W1_Lab01_Neurons_and_Layers
5 pages
CSA501_ QB Neural Network Deep Learning_updated2024
No ratings yet
CSA501_ QB Neural Network Deep Learning_updated2024
11 pages
Capstone Project-1
No ratings yet
Capstone Project-1
15 pages
BCS 465 Neural Network - 2020
No ratings yet
BCS 465 Neural Network - 2020
5 pages
Beta Distribution Summary
No ratings yet
Beta Distribution Summary
9 pages
Chapter 8 - Forecasting
No ratings yet
Chapter 8 - Forecasting
17 pages
Chap 2 Training Feed Forward Neural Networks
No ratings yet
Chap 2 Training Feed Forward Neural Networks
22 pages
TS Lecture1 2019
No ratings yet
TS Lecture1 2019
56 pages
Toc Question Paper
No ratings yet
Toc Question Paper
2 pages
Beta N Weibul Distri
0% (1)
Beta N Weibul Distri
49 pages
Course During Registration State Chart Diagram
100% (1)
Course During Registration State Chart Diagram
4 pages
Generative AI For Software Development
No ratings yet
Generative AI For Software Development
2 pages

vgg

Uploaded by

vgg

Uploaded by

2/27/2019 vgg slides

Networks Using Blocks (VGG)

In [1]: import d2l

def vgg_block(num_convs, num_channels):

In [3]: def vgg(conv_arch):

Memory usage for single input

sequential1 output shape: (1, 64, 112, 112)

In [6]: lr, num_epochs, batch_size, ctx = 0.05, 5, 128, d2l.try_gpu()

You might also like