0% found this document useful (0 votes)

13 views

Assignment 0.2

The document outlines an assignment focused on comparing the functioning of four machine learning algorithms: Support Vector Machine (SVM), Naïve Bayes, Random Forest, and K-Nearest Neighbors (KNN). It includes a comparison table detailing each algorithm's working principles, core mathematical concepts, training speed, overfitting risks, interpretability, best use cases, and limitations. Additionally, it provides Python code for visualizing decision boundaries for these algorithms.

Uploaded by

monish.g2022ai-ds

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views

Assignment 0.2

Uploaded by

monish.g2022ai-ds

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 8

Assignment 0.

2: Comparing the
Functioning of Machine Learning
Algorithms
Objective:
The goal of this assignment is to understand and compare how different machine learning
algorithms function, their strengths, weaknesses, and best use cases.

Algorithms for Comparison:

1. Support Vector Machine (SVM)
2. Naïve Bayes
3. Random Forest
4. K-Nearest Neighbors (KNN)

Comparison Table:
K-Nearest
Support Vector
Criteria Naïve Bayes Random Forest Neighbors
Machine (SVM)
(KNN)
Uses Bayes’
Finds an optimal Classifies based
theorem to Uses multiple
hyperplane that on the majority
How does it calculate the decision trees and
best separates the class of the k-
work? probability of a aggregates their
data points of nearest
class given the output
different classes neighbors
data
Decision Probability,
Entropy, Gini Distance metrics
Core Math boundaries, Bayes’ theorem,
impurity, (Euclidean,
Concepts Support vectors, Conditional
Information gain Manhattan, etc.)
Kernel functions independence
Training: O(n^2) Training: O(n log
Speed (Big-O Training: O(n), Training: O(1),
to O(n^3), n), Prediction:
Notation) Prediction: O(1) Prediction: O(n)
Prediction: O(n) O(log n)
High (especially
Low (if Medium to High (if High (if k is too
Overfitting Risk with a non-linear
assumptions hold) too many trees) small)
kernel)
Hard to interpret, Easy to interpret
Hard to interpret
Interpretability especially with Easy to explain for small
(black-box)
non-linear kernels datasets
Best Use Cases High-dimensional Spam detection, Complex decision Small datasets,
Pattern
Sentiment tasks, Financial
data, Text recognition,
analysis, Medical modeling, Fraud
classification Image
diagnosis detection
classification
Assumes feature Slow for large
Slow for large Prone to overfitting
independence, datasets,
datasets, Kernel if too many trees,
Limitations Can fail if features Sensitive to
selection is Computationally
are highly irrelevant
critical expensive
correlated features

Detailed Explanation of Each Algorithm

1. Support Vector Machine (SVM)

Working Principle:

 SVM aims to find the optimal decision boundary (hyperplane) that maximizes the
margin between different classes.
 It uses support vectors (critical data points) to define the boundary.
 Non-linearly separable data can be handled using kernel functions like RBF,
polynomial, or sigmoid.

Mathematical Concepts:

 Maximizing the margin between different classes.

 Kernel trick for non-linearly separable data.
 Lagrange multipliers for optimization.

Use Cases:

 Text classification (e.g., spam filtering).

 Image recognition.
 Bioinformatics (e.g., cancer classification).

2. Naïve Bayes

Working Principle:

 Based on Bayes’ theorem, which calculates the probability of a class given input
features.
 Assumes that all features are independent (hence "naïve").
 Fast and efficient for large datasets with categorical data.

Mathematical Concepts:

 Conditional probability: P(A|B) = P(B|A) * P(A) / P(B)

 Feature independence assumption simplifies computation.
Use Cases:

 Sentiment analysis.
 Spam detection.
 Medical diagnosis.

3. Random Forest

Working Principle:

 An ensemble learning method that constructs multiple decision trees and aggregates
their predictions.
 Uses bagging (bootstrap aggregation) to improve accuracy.
 Reduces variance and overfitting compared to a single decision tree.

Mathematical Concepts:

 Entropy & Gini impurity to measure node purity.

 Information gain to split nodes.
 Majority voting for classification.

Use Cases:

 Fraud detection.
 Credit scoring.
 Disease prediction.

4. K-Nearest Neighbors (KNN)

Working Principle:

 A lazy learning algorithm that memorizes training data.

 Classifies new points based on the majority vote of their k nearest neighbors.
 Distance metrics such as Euclidean distance determine proximity.

Mathematical Concepts:

 Distance metrics: Euclidean, Manhattan, Minkowski.

 Curse of dimensionality affects performance.

Use Cases:

 Recommender systems.
 Image recognition.
 Anomaly detection.

Decision Boundary Plots

Below is Python code to visualize decision boundaries for these algorithms:

import numpy as np

import matplotlib.pyplot as plt

from sklearn import datasets

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import StandardScaler

from sklearn.svm import SVC

from sklearn.naive_bayes import GaussianNB

from sklearn.ensemble import RandomForestClassifier

from sklearn.neighbors import KNeighborsClassifier

from mlxtend.plotting import plot_decision_regions

# Load dataset

X, y = datasets.make_classification(n_features=2, n_classes=2, n_clusters_per_class=1,

n_redundant=0, random_state=42)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

scaler = StandardScaler()

X_train = scaler.fit_transform(X_train)

X_test = scaler.transform(X_test)

# Define classifiers

classifiers = {

"SVM": SVC(kernel='linear'),

"Naïve Bayes": GaussianNB(),

"Random Forest": RandomForestClassifier(n_estimators=10),

"KNN": KNeighborsClassifier(n_neighbors=3)
}

# Plot decision boundaries

fig, axes = plt.subplots(2, 2, figsize=(12, 10))

axes = axes.flatten()

for i, (name, clf) in enumerate(classifiers.items()):

clf.fit(X_train, y_train)

plot_decision_regions(X_test, y_test, clf=clf, ax=axes[i])

axes[i].set_title(name)

plt.tight_layout()

plt.show()

OUTPUT:

Naïve Bayes:
Random Forest:
KNN:

Mu Tybsc CS Syllabus 2023
No ratings yet
Mu Tybsc CS Syllabus 2023
63 pages
11 Most Common Machine Learning Algorithms Explained in A Nutshell by Soner Yıldırım Towards Data Science
No ratings yet
11 Most Common Machine Learning Algorithms Explained in A Nutshell by Soner Yıldırım Towards Data Science
16 pages
8
No ratings yet
8
9 pages
Assignment 2
No ratings yet
Assignment 2
111 pages
Chatgpt Unit - 3
No ratings yet
Chatgpt Unit - 3
4 pages
ML CheatSheet
No ratings yet
ML CheatSheet
14 pages
Interview Preparing - ML Draft
No ratings yet
Interview Preparing - ML Draft
12 pages
Module_5
No ratings yet
Module_5
5 pages
Understanding Machine Learning Algorithms - in Depth
No ratings yet
Understanding Machine Learning Algorithms - in Depth
167 pages
Machine Learning Algorithms
No ratings yet
Machine Learning Algorithms
9 pages
Machine Learning Mid 2 Set 1
No ratings yet
Machine Learning Mid 2 Set 1
6 pages
DM assignment 2
No ratings yet
DM assignment 2
23 pages
Dl
No ratings yet
Dl
10 pages
Assignment 1-ML
No ratings yet
Assignment 1-ML
4 pages
Machine learning algorithms laiki
No ratings yet
Machine learning algorithms laiki
123 pages
Chapter Four
No ratings yet
Chapter Four
75 pages
Unit 5 Learning with Algorithm
No ratings yet
Unit 5 Learning with Algorithm
7 pages
ML ModuleUntitled 2
No ratings yet
ML ModuleUntitled 2
8 pages
ml1
No ratings yet
ml1
17 pages
Interview AI Algo
No ratings yet
Interview AI Algo
3 pages
Machine Learning - Overview
No ratings yet
Machine Learning - Overview
5 pages
5 markd
No ratings yet
5 markd
24 pages
Classification
No ratings yet
Classification
4 pages
Minor Project
No ratings yet
Minor Project
9 pages
Supervised Learning Final With Diagrams Cleaned
No ratings yet
Supervised Learning Final With Diagrams Cleaned
7 pages
Machine Learning
No ratings yet
Machine Learning
32 pages
Module Iii
No ratings yet
Module Iii
15 pages
ml_cheatsheet
No ratings yet
ml_cheatsheet
4 pages
Module 3
No ratings yet
Module 3
11 pages
UNIT 1,2,3
No ratings yet
UNIT 1,2,3
17 pages
Machine Learning Algorithms
No ratings yet
Machine Learning Algorithms
13 pages
1.Write the Formula for Sigmoid, Hyperbolic Tangen...
No ratings yet
1.Write the Formula for Sigmoid, Hyperbolic Tangen...
3 pages
ML U4
No ratings yet
ML U4
48 pages
ML notes
No ratings yet
ML notes
10 pages
ML Assigment 3
No ratings yet
ML Assigment 3
4 pages
ml 2m cie2
No ratings yet
ml 2m cie2
4 pages
Machine Learning Algorithms 1728923216
No ratings yet
Machine Learning Algorithms 1728923216
12 pages
Machine Learning
No ratings yet
Machine Learning
15 pages
Chapter 4. Classification Algorithms-Stud
No ratings yet
Chapter 4. Classification Algorithms-Stud
43 pages
ML QB WITH ANSWER
No ratings yet
ML QB WITH ANSWER
20 pages
Monish_Nlp
No ratings yet
Monish_Nlp
2 pages
Machine Learning in A Nutshell
No ratings yet
Machine Learning in A Nutshell
36 pages
Machine_Learning_Algorithms_Overview
No ratings yet
Machine_Learning_Algorithms_Overview
7 pages
ML UNIT4
No ratings yet
ML UNIT4
10 pages
Machine Learning Concept1
No ratings yet
Machine Learning Concept1
16 pages
What Are The Common Algorithms in Machine Learning
No ratings yet
What Are The Common Algorithms in Machine Learning
3 pages
Raghav soni(20IOT6014) Algo_Assignment
No ratings yet
Raghav soni(20IOT6014) Algo_Assignment
14 pages
ML - Interview Prep
No ratings yet
ML - Interview Prep
9 pages
Lec 17 -Dsfa23
No ratings yet
Lec 17 -Dsfa23
32 pages
Classification Algorithm in Machine Learning
No ratings yet
Classification Algorithm in Machine Learning
7 pages
Machine Learning Classification Bootcamp Cheatsheet
No ratings yet
Machine Learning Classification Bootcamp Cheatsheet
7 pages
ML assignment
No ratings yet
ML assignment
13 pages
Unit 4 Introduction to Algorithm
No ratings yet
Unit 4 Introduction to Algorithm
10 pages
Machine Learning 2
No ratings yet
Machine Learning 2
21 pages
New Classification and Regression Models
No ratings yet
New Classification and Regression Models
7 pages
Report of Comparing 5 Classification Algorithms of Machine Learning PDF
No ratings yet
Report of Comparing 5 Classification Algorithms of Machine Learning PDF
4 pages
Three Machine Learning Algorithms
No ratings yet
Three Machine Learning Algorithms
11 pages
Project Report 2
No ratings yet
Project Report 2
11 pages
Kernel Methods: Fundamentals and Applications
From Everand
Kernel Methods: Fundamentals and Applications
Fouad Sabry
No ratings yet
K Nearest Neighbor Algorithm: Fundamentals and Applications
From Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
No ratings yet
Perceptrons: Fundamentals and Applications for The Neural Building Block
From Everand
Perceptrons: Fundamentals and Applications for The Neural Building Block
Fouad Sabry
No ratings yet
Bavya_NLP_0.1
No ratings yet
Bavya_NLP_0.1
5 pages
Introduction to Large Language Models (LLMs) - - Unit 6 - Week 4
No ratings yet
Introduction to Large Language Models (LLMs) - - Unit 6 - Week 4
3 pages
Report (2)
No ratings yet
Report (2)
1 page
Harris
No ratings yet
Harris
5 pages
MediClient
No ratings yet
MediClient
2 pages
Summary (9)
No ratings yet
Summary (9)
1 page
BDA--_Module 5
No ratings yet
BDA--_Module 5
31 pages
dw_phy (1)
No ratings yet
dw_phy (1)
2 pages
Big Data Exam Help
No ratings yet
Big Data Exam Help
7 pages
BECE352E Module 3
No ratings yet
BECE352E Module 3
64 pages
Predicting Ayurveda-Based Constituent Balancing in Human Body Using Machine Learning Methods
No ratings yet
Predicting Ayurveda-Based Constituent Balancing in Human Body Using Machine Learning Methods
11 pages
Prediction of Cardiovascular Disease Using Machine Learning Techniques
No ratings yet
Prediction of Cardiovascular Disease Using Machine Learning Techniques
6 pages
MCA syllabus
No ratings yet
MCA syllabus
26 pages
APS1070 Lecture (1) Slides
No ratings yet
APS1070 Lecture (1) Slides
86 pages
Electronics 11 01044 v2
No ratings yet
Electronics 11 01044 v2
26 pages
Data Mining Using Learning Techniques For Fraud Detection
No ratings yet
Data Mining Using Learning Techniques For Fraud Detection
3 pages
Intelligent Control of Robotic Arm Using Brain Computer Interface and Artificial Intelligence
No ratings yet
Intelligent Control of Robotic Arm Using Brain Computer Interface and Artificial Intelligence
14 pages
Air Quality Index Using Machine Learning - A Jordan Case Study
No ratings yet
Air Quality Index Using Machine Learning - A Jordan Case Study
11 pages
ML Unit 3 MID1
No ratings yet
ML Unit 3 MID1
83 pages
Project: ©great Learning. Proprietary Content. All Rights Reserved. Unauthorised Use or Distribution Prohibited
No ratings yet
Project: ©great Learning. Proprietary Content. All Rights Reserved. Unauthorised Use or Distribution Prohibited
8 pages
Predictive Big Data Analytics For Supply Chain Demand Forecasting: Methods, Applications, and Research Opportunities
No ratings yet
Predictive Big Data Analytics For Supply Chain Demand Forecasting: Methods, Applications, and Research Opportunities
22 pages
001-Plant Disease Detection with Fertilizer Recommendation-356_Plant
No ratings yet
001-Plant Disease Detection with Fertilizer Recommendation-356_Plant
7 pages
Application and Comparison of Classification Techniques in Controlling Credit Risk
0% (1)
Application and Comparison of Classification Techniques in Controlling Credit Risk
16 pages
ML[1]
No ratings yet
ML[1]
49 pages
Sentiment Analysis Using Bert On Yelp Restaurant Reviews
No ratings yet
Sentiment Analysis Using Bert On Yelp Restaurant Reviews
63 pages
Instance Based Learning
No ratings yet
Instance Based Learning
36 pages
ML 2
No ratings yet
ML 2
3 pages
A Case Study On Data Classification Approach Using K-Nearest Neighbor
No ratings yet
A Case Study On Data Classification Approach Using K-Nearest Neighbor
7 pages
A Closer Look at Deep Learning On Tabular Data
No ratings yet
A Closer Look at Deep Learning On Tabular Data
43 pages
Using Deep Learning Neural Networks and Candlestick Chart Representation To Predict Stock Market
No ratings yet
Using Deep Learning Neural Networks and Candlestick Chart Representation To Predict Stock Market
13 pages
All Machine Learning Algorithms Explained in One Line
No ratings yet
All Machine Learning Algorithms Explained in One Line
12 pages
Distance Based Models
No ratings yet
Distance Based Models
19 pages
Deep Gender Identification Model With Biometric Fingerprint Data
No ratings yet
Deep Gender Identification Model With Biometric Fingerprint Data
6 pages
iridology-diabetes2
No ratings yet
iridology-diabetes2
22 pages
Development of An Early Warning System To Support Educational Planning Process by Identifying At-Risk Students
No ratings yet
Development of An Early Warning System To Support Educational Planning Process by Identifying At-Risk Students
12 pages
Get Out of My Lab: Large-Scale, Real-Time Visual-Inertial Localization
No ratings yet
Get Out of My Lab: Large-Scale, Real-Time Visual-Inertial Localization
10 pages
A Comparison of Classification Techniques On Prediction of Student Performance
No ratings yet
A Comparison of Classification Techniques On Prediction of Student Performance
6 pages
Cheat Sheets For Ai: Neural Networks, Machine Learning, Deeplearning & Big Data
No ratings yet
Cheat Sheets For Ai: Neural Networks, Machine Learning, Deeplearning & Big Data
25 pages