Siamese Network Assignment

This document discusses training a siamese neural network model for audio-visual matching using triplet loss. It loads audio and image embeddings, creates training/test/validation datasets, trains the model over 500 epochs with early stopping, and calculates the identification accuracy on the validation set.

Uploaded by

heat mass

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views

Siamese Network Assignment

Uploaded by

heat mass

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

# %%

! pip install scikit-learn

# %%
! pip install unidecode matplotlib

# %%
from classes import *
from functions import *
import pickle
import pandas as pd
import numpy as np
import os
from sklearn.model_selection import train_test_split
import random
from torch.utils.data import Dataset, DataLoader
import matplotlib.pyplot as plt

# %%
from unidecode import unidecode

# %%
audio_files = os.listdir('datasets/audio')

with open('datasets/audio_embeddings.pickle', 'rb') as file:

audio_embeddings = pickle.load(file)

audio_names = [key.split('/')[0] for key in audio_embeddings.keys()]

audio_df = pd.DataFrame([{'name': key.split('/')[0], 'audio_embedding': value} for

key, value in audio_embeddings.items()])

audio_df['name'] = audio_df['name'].apply(unidecode)

audio_df['audio_embedding'] = audio_df['audio_embedding'].apply(lambda x:
x/np.linalg.norm(x))

# %%
with open('datasets/image_embeddings.pickle', 'rb') as file:
image_embeddings = pickle.load(file)

image_df = pd.DataFrame([{'name': key.split('/')[0], 'image_embedding': value} for

key, value in image_embeddings.items()])

image_df['name'] = image_df['name'].apply(unidecode)

# %%
matches_df = pd.merge(image_df, audio_df, on='name', how='outer')

matches_df.columns = ['name', 'anchor', 'positive']

# %%
coincidences = 0
negatives = []
for i, row in matches_df.iterrows():
while True:
sample = matches_df.sample(n=1)
sample.reset_index(inplace=True, drop=True)
if sample['name'][0] != row['name']:
negatives.append(sample['positive'][0])
break
else:
coincidences += 1

matches_df['negative'] = negatives

# %%
train_set, test_set , _, _2 = train_test_split(matches_df, matches_df['name'],
test_size=0.2)
test_set, validation_set, _, _2 = train_test_split(test_set, test_set['name'],
test_size=0.5)

# %%

# %% [markdown]
# ### Siamese Network Model With Triplet Loss Training

# %%
siamese_model = SiameseNetwork([512, 192], [[256, 512, 256], [256, 512, 256]], 256)

# %%
training_triplet_dataset = TripletDataset(train_set)
testing_triplet_dataset = TripletDataset(test_set)
validation_triplet_dataset = TripletDataset(validation_set)

# %%
train_triplet_dataloader = DataLoader(training_triplet_dataset, batch_size=32,
shuffle=True)
test_triplet_dataloader = DataLoader(testing_triplet_dataset, batch_size=32,
shuffle=True)
validation_triplet_dataloader = DataLoader(validation_triplet_dataset,
batch_size=32, shuffle=True)

# %% [markdown]
# ##### Training with Early Stopping

# %%
# optimizer = optim.SGD(siamese_model.parameters(), lr=0.1)
optimizer = optim.Adam(siamese_model.parameters(), lr=0.0005)
epochs = 500

# %%
training_losses = []
testing_losses = []
early_stopping_indicators = 0
for epoch in range(epochs):

total_loss = 0.0
total_testing_loss = 0.0
training_batches = 0
testing_batches = 0
for anchor_batch, positive_batch, negative_batch in train_triplet_dataloader:
training_batches += 1
optimizer.zero_grad()
loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
loss.backward()
optimizer.step()
total_loss += loss.item()

# validation_losses.append(validation_loss)

for anchor_batch, positive_batch, negative_batch in test_triplet_dataloader:

testing_batches += 1
testing_loss = triplet_loss(siamese_model, anchor_batch, positive_batch,
negative_batch, margin=1.0)
total_testing_loss += testing_loss.item()

total_training_loss_per_batch = total_loss/training_batches
training_losses.append(total_training_loss_per_batch)
total_testing_loss_per_batch = total_testing_loss/testing_batches
testing_losses.append(total_testing_loss_per_batch)
print(f"epoch: {epoch + 1} Training Loss per batch:
{total_training_loss_per_batch}, Testing Loss per batch:
{total_testing_loss_per_batch}\n")
if (epoch > 8) and (np.mean(testing_losses[-6:-3] < np.mean(testing_losses[-
3:]))):
print('Early stopping')
break

# %%
epoch_list = [i+1 for i in range(epoch + 1)]

# %%
plt.plot(epoch_list, training_losses, label='Training Loss')
plt.plot(epoch_list, testing_losses, label='Testing Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()

# %%
from classes import *

# %% [markdown]
# ### 1:2 Identification Accuracy

# %%
ia = identification_accuracy(siamese_model, validation_triplet_dataloader)

# %%
print(f"1:2 Identification Accuracy for validation set is {ia*100}%")

Ableton Shortcuts PDF
No ratings yet
Ableton Shortcuts PDF
9 pages
CS508 SOLVED MCQs FINAL TERM BY JUNAID
100% (1)
CS508 SOLVED MCQs FINAL TERM BY JUNAID
54 pages
Fresco
100% (2)
Fresco
17 pages
Digital Art Cyber Controller 13 Download PDF
No ratings yet
Digital Art Cyber Controller 13 Download PDF
3 pages
Graham Williams - Debian GNU/Linux: Desktop Survival Guide
100% (1)
Graham Williams - Debian GNU/Linux: Desktop Survival Guide
606 pages
Debugging
No ratings yet
Debugging
9 pages
Sota Image Classification Models With Pytorch Api
No ratings yet
Sota Image Classification Models With Pytorch Api
10 pages
Not F: # Check If The File Exists
No ratings yet
Not F: # Check If The File Exists
7 pages
bldd_VIT_ResNet50v2_CustomCNN
No ratings yet
bldd_VIT_ResNet50v2_CustomCNN
38 pages
QLSTMvs LSTM
No ratings yet
QLSTMvs LSTM
7 pages
skin-disease-detection-using-transformers
No ratings yet
skin-disease-detection-using-transformers
35 pages
PyTorch Made Easy A Quick Overview
No ratings yet
PyTorch Made Easy A Quick Overview
55 pages
Notebook - Agave Plant Maturation Model Inference and Testing
No ratings yet
Notebook - Agave Plant Maturation Model Inference and Testing
7 pages
Lstm-Load-Forecasting:6 - All - Features - Ipynb at Master Dafrie:lstm-Load-Forecasting GitHub
No ratings yet
Lstm-Load-Forecasting:6 - All - Features - Ipynb at Master Dafrie:lstm-Load-Forecasting GitHub
5 pages
Untitled5.ipynb - Colab
No ratings yet
Untitled5.ipynb - Colab
4 pages
vertopal.com_HW4ML project starter code template
No ratings yet
vertopal.com_HW4ML project starter code template
6 pages
Part I
No ratings yet
Part I
12 pages
Bert
No ratings yet
Bert
2 pages
val
No ratings yet
val
9 pages
CNN SVM
No ratings yet
CNN SVM
4 pages
Assignment 10 2
No ratings yet
Assignment 10 2
4 pages
Email Spam Classifier
No ratings yet
Email Spam Classifier
22 pages
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
Train Py
No ratings yet
Train Py
4 pages
Rice - Ipynb - Colab
No ratings yet
Rice - Ipynb - Colab
11 pages
neural networks
No ratings yet
neural networks
3 pages
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
No ratings yet
CIFAR_10_ Dataset_Using_CNN_Aniiiii_HTML
8 pages
ML Practical 205160694034
No ratings yet
ML Practical 205160694034
33 pages
DL Lab Manual
100% (1)
DL Lab Manual
35 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
Presentation
No ratings yet
Presentation
31 pages
dl_5 excuted
No ratings yet
dl_5 excuted
13 pages
DL4.ipynb - Colab
No ratings yet
DL4.ipynb - Colab
2 pages
mlp-v4
No ratings yet
mlp-v4
27 pages
# Load The Dataset # Normalize The Images To (-1, 1) For Better Performance of The GAN # Add Channel Dimension # Set Buffer and Batch Size
No ratings yet
# Load The Dataset # Normalize The Images To (-1, 1) For Better Performance of The GAN # Add Channel Dimension # Set Buffer and Batch Size
3 pages
LSTM Classification
No ratings yet
LSTM Classification
10 pages
Week_7_-mnist-mlp
No ratings yet
Week_7_-mnist-mlp
7 pages
TMA01 Question 2 (55 Marks)
No ratings yet
TMA01 Question 2 (55 Marks)
26 pages
Apply SVM To Amazon Reviews Data Set Avg W2vec (M)
No ratings yet
Apply SVM To Amazon Reviews Data Set Avg W2vec (M)
8 pages
Machine Learning Model Building
No ratings yet
Machine Learning Model Building
6 pages
Start - Copy (2)
No ratings yet
Start - Copy (2)
3 pages
autonomous
No ratings yet
autonomous
22 pages
Recurrent Neural Networks: Pytorch
No ratings yet
Recurrent Neural Networks: Pytorch
6 pages
Estiven - Hurtado.Santos - Regresión Con Varios Algoritmos
No ratings yet
Estiven - Hurtado.Santos - Regresión Con Varios Algoritmos
16 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Fibercablelength Understanding
No ratings yet
Fibercablelength Understanding
5 pages
Vertopal.com HW4ML Project Code
No ratings yet
Vertopal.com HW4ML Project Code
24 pages
merge
No ratings yet
merge
33 pages
22MCA1008 - Varun ML LAB ASSIGNMENTS
100% (1)
22MCA1008 - Varun ML LAB ASSIGNMENTS
41 pages
cyberbullying code
No ratings yet
cyberbullying code
6 pages
Image Classification Handson-Image - Test
No ratings yet
Image Classification Handson-Image - Test
5 pages
GEMA - IA B3 CNN - Transfer Learning - DenseNet121 - Colab
No ratings yet
GEMA - IA B3 CNN - Transfer Learning - DenseNet121 - Colab
9 pages
Machine
100% (1)
Machine
45 pages
Dl 5 Excuted
No ratings yet
Dl 5 Excuted
13 pages
Apex For Bres 1
No ratings yet
Apex For Bres 1
6 pages
dltslips[1]_pagenumber
No ratings yet
dltslips[1]_pagenumber
24 pages
Step 1: Finding The Data Set: "Amazon - Reviews - Multilingual - UK - v1 - 00.tsv - GZ" 'RT' "Utf8"
No ratings yet
Step 1: Finding The Data Set: "Amazon - Reviews - Multilingual - UK - v1 - 00.tsv - GZ" 'RT' "Utf8"
4 pages
autonomouvvs
No ratings yet
autonomouvvs
53 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
DL5.ipynb - Colab
No ratings yet
DL5.ipynb - Colab
3 pages
AI Lec Code
No ratings yet
AI Lec Code
12 pages
Few-Shot Learning Tutorial - Medium
No ratings yet
Few-Shot Learning Tutorial - Medium
16 pages
Training Code
No ratings yet
Training Code
27 pages
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Web2 Lec3
No ratings yet
Web2 Lec3
47 pages
IPA File Extraction Using Jailbroken Iphone - by Shashank's Blog - Medium
No ratings yet
IPA File Extraction Using Jailbroken Iphone - by Shashank's Blog - Medium
7 pages
Computer Applications in Construction Management
No ratings yet
Computer Applications in Construction Management
32 pages
Scientific Computing
No ratings yet
Scientific Computing
39 pages
Course Overview: Autodesk® Moldflow® Insight
No ratings yet
Course Overview: Autodesk® Moldflow® Insight
1 page
ICT English Notes
No ratings yet
ICT English Notes
49 pages
Mark McKinnon - Plug Me in Renzik, Autopsy Plugins Now and in The Future
No ratings yet
Mark McKinnon - Plug Me in Renzik, Autopsy Plugins Now and in The Future
45 pages
CS001 Midterm Solved McQs Papers by Waqar Sidhu
100% (1)
CS001 Midterm Solved McQs Papers by Waqar Sidhu
16 pages
Sky Deutschland HD 19E - Free Cardsharing Test
No ratings yet
Sky Deutschland HD 19E - Free Cardsharing Test
4 pages
Yealink MVC860 Datasheet
No ratings yet
Yealink MVC860 Datasheet
4 pages
Literature Review Edit
No ratings yet
Literature Review Edit
9 pages
Resume
100% (2)
Resume
7 pages
FinAssam User Manual (EPM FIRST SALARY HOD)
No ratings yet
FinAssam User Manual (EPM FIRST SALARY HOD)
13 pages
Copper Hawk 05 Jul 2024
No ratings yet
Copper Hawk 05 Jul 2024
11 pages
91fdea68 3
No ratings yet
91fdea68 3
94 pages
Gas Chromatograph Interface For ROC809 User Program Manual
No ratings yet
Gas Chromatograph Interface For ROC809 User Program Manual
54 pages
Simrad Cs68 Ecdis Sensors & Safety Parameters Settings Checklist
No ratings yet
Simrad Cs68 Ecdis Sensors & Safety Parameters Settings Checklist
2 pages
ML Step by Step
No ratings yet
ML Step by Step
10 pages
Big Data Unit II
No ratings yet
Big Data Unit II
4 pages
Fujitsu ARROWS Tab Q555/K32 64 GB 25.6 CM (10.1") Intel Atom® 4 GB Wi-Fi 4 (802.11n) Windows 8.1 Pro Black
No ratings yet
Fujitsu ARROWS Tab Q555/K32 64 GB 25.6 CM (10.1") Intel Atom® 4 GB Wi-Fi 4 (802.11n) Windows 8.1 Pro Black
3 pages
Inrec Outfil Outrec
No ratings yet
Inrec Outfil Outrec
5 pages
Faxoc JOB DESCRIPTION MachineLearning
No ratings yet
Faxoc JOB DESCRIPTION MachineLearning
1 page
Digital Homework 202883836281
No ratings yet
Digital Homework 202883836281
13 pages
Complete Download Core Java Volume II Advanced Features Cay S Horstmann PDF All Chapters
100% (1)
Complete Download Core Java Volume II Advanced Features Cay S Horstmann PDF All Chapters
65 pages
Car Resale Value
No ratings yet
Car Resale Value
20 pages
PHP Assignment 4
No ratings yet
PHP Assignment 4
40 pages