0% found this document useful (0 votes)

2 views

lesson2

The document discusses neural network training techniques, including the calculation of sum of squared errors and cross-entropy error, as well as mini-batch learning. It introduces numerical differentiation, gradient descent, and the implementation of a two-layer neural network class. Additionally, it covers the process of mini-batch training and evaluating the model using test data.

Uploaded by

Thùy Minh

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

lesson2

Uploaded by

Thùy Minh

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

lesson2

March 16, 2024

#Chapter 4: Neural Network Training

##Sum of Squared Errors
[ ]: import numpy as np
y = [1.0,0.05,0.6,0.0,0.05,0.1,0.0,0.1,0.0,0.0]
#y = [1.0,0.05,0.1,0.0,0.05,0.1,0.0,0.6,0.0,0.0]
t = [0,0,1,0,0,0,0,0,0,0]

def sum_squared_error(y,t):
return 0.5*np.sum((y-t)**2)

sqe = sum_squared_error(np.array(y), np.array(t))

print(sqe)

0.5925
##Cross-Entrpy Error
[ ]: import numpy as np

def cross_entropy_error(y,t):
delta = 1e-7
return -np.sum(t*np.log(y+delta))

y = [1.0,0.05,0.6,0.0,0.05,0.1,0.0,0.1,0.0,0.0]
t = [0,0,1,0,0,0,0,0,0,0]

cee = cross_entropy_error(np.array(y), np.array(t))

print(cee)

0.510825457099338
• In the example, the output correct label is 0.6 and the crossp-entropy error is 0.51
##Mini-Batch Learning - In neural network training, some training data is selected, and training
is conducted for each group of data, which is called a mini-batch
[ ]: from google.colab import drive
drive.mount('/content/drive')

1
Mounted at /content/drive

[9]: cd /content/drive/MyDrive/GG Colab/Deep Learning/dataset

/content/drive/MyDrive/GG Colab/Deep Learning/dataset

[10]: from my_mnist import load_mnist

[ ]: import sys, os
sys.path.append(os.pardir)
import numpy as np

(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True,␣

↪one_hot_label=False)

print(x_train.shape)
print(t_train.shape)

(60000, 784)
(60000,)
##Numericial Differentiation
[ ]: import numpy as np
import matplotlib.pyplot as plt

def numerical_diff(f,x):
h = 1e-4
return (f(x+h) - f(x-h)) / (2*h)

def function_1(x):
return 0.01*x**2 + 0.1*x

x = np.arange(0.0,20.0, 0.1)
y = function_1(x)
plt.xlabel("x")
plt.ylabel("f(x)")
plt.plot(x,y)
plt.show()

2
##Partial Derivative
[ ]: def function_2(x):
return x[0]**2 + x[1]**2

##Gradient
[ ]: import numpy as np

def function_2(x):
return x[0]**2 + x[1]**2

def numericial_gradient(f,x):
h = 1e-4
grad = np.zeros_like(x) #Tra ve mot mang co kich thuoc giong voi mang da cho␣
↪va bang 0

for idx in range(x.size):

tmp_val = x[idx]
x[idx] = tmp_val + h
fxh1 = f(x)

3
x[idx] = tmp_val - h
fxh2 = f(x)

grad[idx] = (fxh1 - fxh2) / (2*h)

x[idx] = tmp_val
return grad

numericial_gradient(function_2, np.array([3.0, 4.0]))

[ ]: array([6., 8.])

##Gradient descent
[ ]: import numpy as np

init_x = np.array([-3.0, 4.0])

def numericial_gradient(f,x):
h = 1e-4
grad = np.zeros_like(x) #Tra ve mot mang co kich thuoc giong voi mang da cho␣
↪va bang 0

for idx in range(x.size):

tmp_val = x[idx]
x[idx] = tmp_val + h
fxh1 = f(x)

x[idx] = tmp_val - h
fxh2 = f(x)

grad[idx] = (fxh1 - fxh2) / (2*h)

x[idx] = tmp_val
return grad

def function_2(x):
return x[0]**2 + x[1]**2

def gradient_descent(f, init_x, lr = 0.01, step_num = 100):

x = init_x

for i in range(step_num):
grad = numericial_gradient(f,x)
x -= lr * grad

return x

gradient_descent(function_2, init_x = init_x, lr = 0.1, step_num = 100)

4
[ ]: array([-6.11110793e-10, 8.14814391e-10])

##Gradients for a Neural Network

[3]: from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive

[4]: cd /content/drive/MyDrive/GG Colab/Deep Learning/common

/content/drive/MyDrive/GG Colab/Deep Learning/common

[5]: from my_functions import softmax, cross_entropy_error

[6]: from my_gradient import numerical_gradient

[ ]: import sys, os
sys.path.append(os.pardir)
import numpy as np

class simpleNet:
def __init__ (self):
self.W = np.random.randn(2,3)

def predict(self, x):

return np.dot(x,self.W)

def loss(self,x,t):
z = self.predict(x)
y = softmax(z)
loss = cross_entropy_error(y,t)

return loss
net = simpleNet()
print(net.W)

x = np.array([0.6, 0.9])
p = net.predict(x)
print(p)

t = np.array([0,0,1])
net.loss(x,t)

def f(W):
return net.loss(x,t)

dW = numerical_gradient(f, net.W)

5
print(dW)

[[-1.02003529 0.65014502 0.34236522]

[-0.24540338 -0.74331997 1.15400741]]
[-0.83288421 -0.27890096 1.2440258 ]
[[ 0.05597043 0.09739811 -0.15336855]
[ 0.08395565 0.14609717 -0.23005282]]
##A Two-layer Neural Network as a Class
[17]: import sys, os
sys.path.append(os.pardir)
from my_functions import *
from my_gradient import numerical_gradient

class TwoLayerNet:
def __init__(self, input_size, hidden_size, output_size, weight_init_std = 0.
↪01):

self.params = {}
self.params['W1'] = weight_init_std * np.random.randn(input_size,␣
↪hidden_size)

self.params['b1'] = np.zeros(hidden_size)
self.params['W2'] = weight_init_std * np.random.randn(hidden_size,␣
↪output_size)

self.params['b2'] = np.zeros(output_size)

def predict(self, x):

W1, W2 = self.params['W1'], self.params['W2']
b1, b2 = self.params['b1'], self.params['b2']

a1 = np.dot(x, W1) + b1
z1 = sigmoid(a1)
a2 = np.dot(z1, W2) + b2
y = softmax(a2)

return y

def loss(self, x, t):

y = self.predict(x)

return cross_entropy_error(y,t)

def accuracy(self, x, t):

y = self.predict(x)
y = np.argmax(y, axis = 1)
t = np.argmax(t, axis = 1)

accuracy = np.sum(y == t) / float(x.shape[0])

6
return accuracy

def numerical_gradient(self, x, t):

loss_W = lambda W: self.loss(x,t)
grads = {}
grads['W1'] = numerical_gradient(loss_W, self.params['W1'])
grads['b1'] = numerical_gradient(loss_W, self.params['b1'])
grads['W2'] = numerical_gradient(loss_W, self.params['W2'])
grads['b2'] = numerical_gradient(loss_W, self.params['b2'])

return grads

net = TwoLayerNet(input_size = 784, hidden_size = 100, output_size = 10)

net.params['W1'].shape
net.params['b1'].shape
net.params['W2'].shape
net.params['b2'].shape

[17]: (10,)

##Implementing Mini-Batch Training

[ ]: import numpy as np
from my_mnist import load_mnist

(x_train, t_train), (x_test, t_test) = load_mnist(normalize = True,␣

↪one_hot_label=True)

train_loss_list = []

inters_num = 10000
train_size = x_train.shape[0]
batch_size = 100
learning_rate = 0.1

network = TwoLayerNet(input_size = 784, hidden_size=50, output_size = 10)

for i in range(inters_num):
batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

grad = network.numerical_gradient(x_batch, t_batch)

for key in ('W1', 'b1', 'W2', 'b2'):

network.params[key] -= learning_rate * grad[key]

7
loss = network.loss(x_batch, t_batch)
train_loss_list.append(loss)

##Using Test Data for Evaluation

[ ]: import numpy as np
from my_mnist import load_mnist

(x_train, t_train), (x_test, t_test) = load_mnist(normalize = True,␣

↪one_hot_label=True)

train_loss_list = []
train_acc_list = []
test_acc_list = []
inter_per_epoch = max(train_size / batch_size, 1)

inters_num = 10000
batch_size = 100
learning_rate = 0.1

network = TwoLayerNet (input_size = 784, hidden_size = 50, output_size = 10)

for i in range (inters_num):

batch_mask = np.random.choice(train_size, batch_size)
x_batch = x_train[batch_mask]
t_batch = t_train[batch_mask]

grad = network.numerical_gradient(x_batch, t_batch)

for key in ('W1', 'b1', 'W2', 'b2'):

network.params[key] -= learning_rate * grad[key]

loss = network.loss(x_batch, t_batch)

train_loss_list.append(loss)

if i% inter_per_epoch == 0:
train_acc = network.accuracy(x_train, t_train)
test_acc = network.accuracy(x_test, t_test)
train_acc_list.append(train_acc)
test_acc_list.append(test_acc)
print("train acc, test acc | " + str(train_acc) + " , " + str(test_acc))

LSTM From Scratch in Python
No ratings yet
LSTM From Scratch in Python
11 pages
Potential Use of Chat GPT in Global Warming: Annals of Biomedical Engineering (2023)
No ratings yet
Potential Use of Chat GPT in Global Warming: Annals of Biomedical Engineering (2023)
2 pages
new exp (1)
No ratings yet
new exp (1)
12 pages
DL_22043 (1)
No ratings yet
DL_22043 (1)
7 pages
mlp-fromscratch__sigmoid-mse
No ratings yet
mlp-fromscratch__sigmoid-mse
13 pages
Experiments - With - Convolutional - Neural - Network - 2 - 6b.ipynb - Colaboratory
No ratings yet
Experiments - With - Convolutional - Neural - Network - 2 - 6b.ipynb - Colaboratory
6 pages
Experiment 2.4 DL
No ratings yet
Experiment 2.4 DL
4 pages
Notebook - Deep Neural Networks
No ratings yet
Notebook - Deep Neural Networks
28 pages
A-Simple-Neural-Network-From-Scratch - Jupyter Notebook
No ratings yet
A-Simple-Neural-Network-From-Scratch - Jupyter Notebook
9 pages
C2 W2ok
No ratings yet
C2 W2ok
109 pages
Chapter02 Mathematical-Building-Blocks
No ratings yet
Chapter02 Mathematical-Building-Blocks
9 pages
Trainina A NN Backpropagation
No ratings yet
Trainina A NN Backpropagation
6 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
S. NO. Title of The Experiments Page No
No ratings yet
S. NO. Title of The Experiments Page No
11 pages
niraj dl
No ratings yet
niraj dl
15 pages
Linear Regr Gd
No ratings yet
Linear Regr Gd
3 pages
Pdf
No ratings yet
Pdf
41 pages
Neural Networks MATH Explained
No ratings yet
Neural Networks MATH Explained
14 pages
lab-report-03
No ratings yet
lab-report-03
14 pages
Adaline Sgd
No ratings yet
Adaline Sgd
4 pages
AD3511 - Deep Learning Lab Manual - - Copy
No ratings yet
AD3511 - Deep Learning Lab Manual - - Copy
61 pages
555610A19_DL_EXP4
No ratings yet
555610A19_DL_EXP4
11 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
Deep Learning
No ratings yet
Deep Learning
30 pages
Downloaded by R GAYATHRI (R.gayathri@aalimec - Ac.in)
No ratings yet
Downloaded by R GAYATHRI (R.gayathri@aalimec - Ac.in)
56 pages
dl lab_merged (2)
No ratings yet
dl lab_merged (2)
60 pages
DL Lab Manual
No ratings yet
DL Lab Manual
52 pages
NN From Scratch PDF 1735495327
No ratings yet
NN From Scratch PDF 1735495327
19 pages
Deep Record
No ratings yet
Deep Record
44 pages
nndl2 (2)
No ratings yet
nndl2 (2)
67 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
deeplg3
No ratings yet
deeplg3
8 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Assignment 1: Q1. Task Description
No ratings yet
Assignment 1: Q1. Task Description
12 pages
keras
No ratings yet
keras
4 pages
Da 3 Lab DL 21BCE2687
No ratings yet
Da 3 Lab DL 21BCE2687
15 pages
Deep Learning Manual (1)
No ratings yet
Deep Learning Manual (1)
53 pages
Part 1.2. Back Propagation
No ratings yet
Part 1.2. Back Propagation
30 pages
Mlp Pytorch Sigmoid Mse
No ratings yet
Mlp Pytorch Sigmoid Mse
20 pages
Deep Learning
No ratings yet
Deep Learning
4 pages
X OR problem using DNN
No ratings yet
X OR problem using DNN
3 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Using A Three Layer Deep Neural Network To Solve An Unsupervised Learning Problem
No ratings yet
Using A Three Layer Deep Neural Network To Solve An Unsupervised Learning Problem
13 pages
Regularization For Neural Network
No ratings yet
Regularization For Neural Network
37 pages
Lab Manual Ann
No ratings yet
Lab Manual Ann
12 pages
Bản sao của simple_neural_net.ipynb - Colab
No ratings yet
Bản sao của simple_neural_net.ipynb - Colab
7 pages
lab 8
No ratings yet
lab 8
10 pages
H2_AndresAlcivar
No ratings yet
H2_AndresAlcivar
12 pages
DL LAB MANUAL
No ratings yet
DL LAB MANUAL
44 pages
ANN PR Code and Output
No ratings yet
ANN PR Code and Output
25 pages
1735550619101_ad3511-deep-learning-lab-manual_241230_204240
No ratings yet
1735550619101_ad3511-deep-learning-lab-manual_241230_204240
63 pages
ccc
No ratings yet
ccc
25 pages
Crash Course On Tensorflow!: Vincent Lepetit!
No ratings yet
Crash Course On Tensorflow!: Vincent Lepetit!
63 pages
PyTorch Crash Course 1713016363
No ratings yet
PyTorch Crash Course 1713016363
15 pages
AM19_ADL_u-net-model
No ratings yet
AM19_ADL_u-net-model
37 pages
AD3511-DEEP LEARNING LAB MANUAL Revised
No ratings yet
AD3511-DEEP LEARNING LAB MANUAL Revised
72 pages
ccs355 Lab Manual
No ratings yet
ccs355 Lab Manual
24 pages
Week 7 - Lab
No ratings yet
Week 7 - Lab
6 pages
Lab4
No ratings yet
Lab4
2 pages
Homework2
No ratings yet
Homework2
3 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
4th Quarter Skills
0% (1)
4th Quarter Skills
2 pages
Buaya - Dannielyn T. Ldm2 Practicum
No ratings yet
Buaya - Dannielyn T. Ldm2 Practicum
24 pages
Distance Learning Programmes: Class - Vii, Viii, Ix & X
No ratings yet
Distance Learning Programmes: Class - Vii, Viii, Ix & X
4 pages
Resume Krzesowiak Debra2014
No ratings yet
Resume Krzesowiak Debra2014
2 pages
Persuasive Essay On Why Homework Is Bad
100% (1)
Persuasive Essay On Why Homework Is Bad
7 pages
Assignment 1C - Samantha Herrera
No ratings yet
Assignment 1C - Samantha Herrera
2 pages
Lesson Plan Emtech
100% (3)
Lesson Plan Emtech
39 pages
Tom Dawson Report Ej
No ratings yet
Tom Dawson Report Ej
7 pages
Tugasan KK TSLB3163 2020
100% (2)
Tugasan KK TSLB3163 2020
4 pages
Grading and Reporting Systems
No ratings yet
Grading and Reporting Systems
10 pages
Example To Be Used For Individual Study and Practice: I Info About The Learners
No ratings yet
Example To Be Used For Individual Study and Practice: I Info About The Learners
6 pages
10 Principles of Competency Based Training: Johann G. Canceran Btvted-2A/Elx
100% (1)
10 Principles of Competency Based Training: Johann G. Canceran Btvted-2A/Elx
3 pages
Science+Investigatory+Project+Instruction+the+Secondary+Schools+Journey (1)
No ratings yet
Science+Investigatory+Project+Instruction+the+Secondary+Schools+Journey (1)
27 pages
Mbmmbi: To Uphold Bahasa Malaysia and To Strengthen The English Language
100% (1)
Mbmmbi: To Uphold Bahasa Malaysia and To Strengthen The English Language
16 pages
Statement of Purpose (Mohak Saple)
No ratings yet
Statement of Purpose (Mohak Saple)
2 pages
Lesson Plan 2 With Reflection
0% (1)
Lesson Plan 2 With Reflection
5 pages
6195-Article Text-12042-1-10-20210130
No ratings yet
6195-Article Text-12042-1-10-20210130
13 pages
Machine Learning Mining Companies
No ratings yet
Machine Learning Mining Companies
5 pages
Didactic Unit Template Teacher: Title of The Unit: Contextualization
No ratings yet
Didactic Unit Template Teacher: Title of The Unit: Contextualization
2 pages
Modul Peka Science Year 6
100% (1)
Modul Peka Science Year 6
21 pages
Monthly Accomplishment Report 1
No ratings yet
Monthly Accomplishment Report 1
5 pages
HW1 Questions
No ratings yet
HW1 Questions
10 pages
COT1
No ratings yet
COT1
2 pages
DLL - Mathematics 3 - Q4 - W3
No ratings yet
DLL - Mathematics 3 - Q4 - W3
3 pages
Communicative Language Teaching (CLT)
No ratings yet
Communicative Language Teaching (CLT)
15 pages
Crystal Salazar Resume
No ratings yet
Crystal Salazar Resume
2 pages
LEAD 578 53 4225 Syllabus
No ratings yet
LEAD 578 53 4225 Syllabus
28 pages
BCOM HRM - Group Dynamics and Leadership
No ratings yet
BCOM HRM - Group Dynamics and Leadership
151 pages
Oral Defense (Powerpoint)
No ratings yet
Oral Defense (Powerpoint)
19 pages