0% found this document useful (0 votes)

40 views

Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02

This document provides an overview of a course on statistical methods in artificial intelligence. It outlines the course content, which includes topics like linear classification, neural networks, Bayesian classifiers, clustering, and decision trees. It lists reference materials and the expected assessment breakdown. The remainder of the document summarizes the key points from the first lecture, including an introduction to nearest neighbor classification and the KNN algorithm. Evaluation methods like cross-validation are also introduced.

Uploaded by

srikanth.mujjiga

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views

Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02

Uploaded by

srikanth.mujjiga

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 26

Statistical Methods in Artificial Intelligence

CSE471 - Monsoon 2015 : Lecture 02

Avinash Sharma
CVIT, IIIT Hyderabad

Course Content

Introduction
Linear Classification
Neural Networks
Probability Densities
Bayesian Classifiers
Dimensionality Reduction
Support Vector Machines
Kernel Methods
Clustering Techniques
Decision Tree/Graphical Models

Reference Material
Books
Pattern Classification by Duda, Hart & Stork
The Elements of Statistical Learning by Hastie, Tibshirani and
Friedman
Machine Learning : A probabilistic Perspective by Kevin P. Murphy

Pre-requisite
Basics of Linear Algebra, Probability Theory and Statistics.
Programming in Matlab and C/C++.

Course Website

http://courses.iiit.ac.in

Online Courses/Tutorials and Research Papers

Assessment & Attendance

Policy
Assessment
27% Project
18% Assignments (Best of 6 out of 7)
30% Two Mid-semester Exams (15% each)
25% Final Exam
Zero Marks in assignment to both parties in case
a copy is detected
Cooperation with TAs is expected

Zero Tolerance for institute attendance policy

Expected Outcome
This course would enable students to
understand pattern recognition techniques in
detail.
We will ensure that both theoretical as well as
practical aspects are learnt simultaneously.
The project deliverables are expected to be
working systems attached to some practical
application.

Lecture 02: Plan

Nearest Neighbor (NN) Classifier
KNN Classifier
Classifier Evaluation
Assignment
Basic Linear Algebra Operations
Linear Discriminant Functions

Nearest Neighbor (NN)

Classifier
Two data points (samples) from the same
class should have similar features/attributes.
Similarity in feature space should be aligned
with similarity between among data points in
the real-world scenarios.
The easiest way to classify a data point in
the test data is to find a very similar data
point in the training data.

Nearest Neighbor (NN) Classifier

Eager v/s Lazy learning
Eager learning: Learn a classifier using training
data before receiving a test data sample to classify.
Lazy learning: Simply stores training data and waits
until it is given a test data sample.

NN Classifier
A lazy learning approach where each data sample is
represented as point in a Euclidean space.
Any new test data sample is assigned with the label
of closest data point in the training data using
Euclidean distance metric.

Nearest Neighbor (NN)

Classifier
Class A
Class B

Test #3

Test #2

Test #1

Nearest Neighbor (KNN) Classifier

NN rule leads to partition of the Euclidean
space into cells (Vornoi cells)

K-Nearest Neighbor (KNN) Classifier

Class A
Class B

Test #3

Test #2

Test #1

Practical Aspects
K should be chose empirically and preferably odd to
avoid tie situation.
KNN can have both discrete-value and continuousvalue target functions.
Weighted contributions from different neighbors can
be used to compute final label.
Distance based weighting can be used for giving
higher importance to closer data points.
Performance of NN classification typically degrades
when data is high-dimensional.
This can be avoided by assigning feature weights
inside Euclidean distance computation.

Effect of K on decision
boundaries
1 NN

5 NN

20 NN

KNN Classifier
Advantages:
Learn complex target functions
Training is very fast
Zero loss of information

Disadvantages:
Classification cost for new instances can be
very high
Major computation takes place at
classification time

Classifier Evaluation
Cross Validation is an important means of
evaluating classifiers. Types of cross
validation techniques are:
Random Subsampling
K-fold Cross-Validation
Leave-one-out Cross-validation

Assignment
Iris data or other standard dataset
KNN classifier
Matlab/C++ pipeline
K-fold cross-validation
A 2-3 page report on setup & experimental
evaluation

Basic Linear Algebra

Operations
Vector
Vector Operations
Scaling
Transpose
Addition
Subtraction
Dot Product

Equation of a Plane

Vector
Operations

Transpose

Scaling: Only Magnitude Changes

Vector
Operations

Dot Product (Inner Product) of two vectors is a scalar.

Dot product if two perpendicular vectors is 0

Equation of a Plane

Linear Discriminant
Functions
Assumes
a 2-class classification setup

Decision boundary is represented explicitly in

terms of components of .
Aim is to seek parameters of a linear discriminant
function which minimize the training error.
Why Linear ?
Simplest possible
Generalized

Linear Discriminant Functions &

Decision Surfaces

Class A
Class B

The perceptron

Perceptron Decision
Boundary

Perceptron Summary

Decision boundary surface (hyperplane)

divides feature space into two regions
Orientation of the surface is decided by the
normal vector
Location of the surface is determined by the
bias term

is proportional to distance of
from

the surface

positive side,
negative

side

Accelerated Data Science Introduction To Machine Learning Algorithms
No ratings yet
Accelerated Data Science Introduction To Machine Learning Algorithms
37 pages
"Classifiers": R & D Project by Under The Guidance of
No ratings yet
"Classifiers": R & D Project by Under The Guidance of
59 pages
SWE622 Lecture 3 Classification
No ratings yet
SWE622 Lecture 3 Classification
57 pages
Pattern Revision
No ratings yet
Pattern Revision
63 pages
Lect 1
No ratings yet
Lect 1
24 pages
Machine Learning Introduction
No ratings yet
Machine Learning Introduction
56 pages
Unit 5
No ratings yet
Unit 5
28 pages
T6- KNN - Features, Distances &amp; Non-Parametric Models
No ratings yet
T6- KNN - Features, Distances &amp; Non-Parametric Models
23 pages
Lecture 1
No ratings yet
Lecture 1
36 pages
Session 5 ppt
No ratings yet
Session 5 ppt
36 pages
DW&M Unit 3 Part I
No ratings yet
DW&M Unit 3 Part I
101 pages
UNIT-3
No ratings yet
UNIT-3
100 pages
Introduction To Classification - PPT Slides 1
No ratings yet
Introduction To Classification - PPT Slides 1
62 pages
03 Supervised Classification
No ratings yet
03 Supervised Classification
68 pages
Deep Learning Answers
No ratings yet
Deep Learning Answers
36 pages
Classification Techniques
No ratings yet
Classification Techniques
99 pages
Unit-1 ML
No ratings yet
Unit-1 ML
19 pages
UNIT 2 - Notes
No ratings yet
UNIT 2 - Notes
31 pages
ML_UNIT-1
No ratings yet
ML_UNIT-1
64 pages
NLP Chapter 2
No ratings yet
NLP Chapter 2
79 pages
ML unit-2 (CEC)
No ratings yet
ML unit-2 (CEC)
96 pages
CSCI946 w5-classification
No ratings yet
CSCI946 w5-classification
72 pages
Classification
No ratings yet
Classification
53 pages
Chapter 4. Classification Algorithms-Stud
No ratings yet
Chapter 4. Classification Algorithms-Stud
43 pages
Lecture 02 - KNN and ML Basics
No ratings yet
Lecture 02 - KNN and ML Basics
33 pages
Asset-V1 ColumbiaX+CSMM.101x+1T2017+type@asset+block@AI Edx ML 5.1intro
No ratings yet
Asset-V1 ColumbiaX+CSMM.101x+1T2017+type@asset+block@AI Edx ML 5.1intro
70 pages
A Study of Classification Algorithms Using Rapidminer
No ratings yet
A Study of Classification Algorithms Using Rapidminer
12 pages
Pattern Recognition 14
No ratings yet
Pattern Recognition 14
46 pages
DM assignment 2
No ratings yet
DM assignment 2
23 pages
Machine Learning
No ratings yet
Machine Learning
33 pages
06 Lectureslides LinearClassification Fixed
No ratings yet
06 Lectureslides LinearClassification Fixed
52 pages
08classification I
No ratings yet
08classification I
52 pages
Unit 3 in Machine Intelligence
No ratings yet
Unit 3 in Machine Intelligence
62 pages
Classification FoundationalMathofAI S24
No ratings yet
Classification FoundationalMathofAI S24
6 pages
Machine Learning - Classifiers and Boosting: Reading CH 18.6-18.12, 20.1-20.3.2
No ratings yet
Machine Learning - Classifiers and Boosting: Reading CH 18.6-18.12, 20.1-20.3.2
54 pages
Machine Learning HC
No ratings yet
Machine Learning HC
4 pages
ML Fundamentals by Bitspace
No ratings yet
ML Fundamentals by Bitspace
19 pages
What Is Computer Vision?
No ratings yet
What Is Computer Vision?
120 pages
Lecture 3 Basics of Clssification
No ratings yet
Lecture 3 Basics of Clssification
53 pages
Notes Chapter Linear Classifiers
No ratings yet
Notes Chapter Linear Classifiers
4 pages
Unit Ii
No ratings yet
Unit Ii
118 pages
cs188 Fa23 Note21
No ratings yet
cs188 Fa23 Note21
8 pages
Lecture 2 Final
No ratings yet
Lecture 2 Final
90 pages
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015
No ratings yet
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015
23 pages
2EL1730-ML-Lecture04-Non Parametric Learning and Nearest Neighbor
No ratings yet
2EL1730-ML-Lecture04-Non Parametric Learning and Nearest Neighbor
47 pages
Chapter 01 Introduction To Machine Learning
No ratings yet
Chapter 01 Introduction To Machine Learning
59 pages
ML Unit 1
No ratings yet
ML Unit 1
73 pages
ML RUSA Module 6 Probablistic EM KNN SVM
No ratings yet
ML RUSA Module 6 Probablistic EM KNN SVM
51 pages
Unit4_PPT
No ratings yet
Unit4_PPT
118 pages
B2 Mini Project Review 1 Final (1) B
No ratings yet
B2 Mini Project Review 1 Final (1) B
52 pages
ML - Interview Prep
No ratings yet
ML - Interview Prep
9 pages
Anuranan Das Summer of Sciences, 2019. Understanding and Implementing Machine Learning
No ratings yet
Anuranan Das Summer of Sciences, 2019. Understanding and Implementing Machine Learning
17 pages
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
No ratings yet
Aula 4 (L) - Oggi La Tua Lezione È in Presenza
11 pages
Algorithm
No ratings yet
Algorithm
27 pages
ML-UNIT-I
No ratings yet
ML-UNIT-I
14 pages
7.classification Before
No ratings yet
7.classification Before
27 pages
Supervised Machine Learning
No ratings yet
Supervised Machine Learning
74 pages
Classification
No ratings yet
Classification
61 pages
Data Mining All Summary
No ratings yet
Data Mining All Summary
47 pages
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 03
No ratings yet
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 03
22 pages
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
No ratings yet
Assignment #1: K Nearest Neighbor Classifier: Name: Srikanth Mujjiga (Roll No: 2015-50-831
8 pages
Secrete
No ratings yet
Secrete
1 page
KLA
No ratings yet
KLA
1 page
Master of Public Administration Oral Comp Exam
No ratings yet
Master of Public Administration Oral Comp Exam
4 pages
Chapter 2.1 Classification and Tabulation
No ratings yet
Chapter 2.1 Classification and Tabulation
26 pages
Fikreslassie Alemu
0% (1)
Fikreslassie Alemu
127 pages
Adaptive Control
No ratings yet
Adaptive Control
382 pages
haladyna mkale
No ratings yet
haladyna mkale
9 pages
DLL WK 7
No ratings yet
DLL WK 7
3 pages
End Semester Arrear Time Table 19.11.2024
No ratings yet
End Semester Arrear Time Table 19.11.2024
16 pages
Hypothesis Testing With One Sample: Larson & Farber, Elementary Statistics: Picturing The World, 3e 3
No ratings yet
Hypothesis Testing With One Sample: Larson & Farber, Elementary Statistics: Picturing The World, 3e 3
23 pages
Citation Analysis
No ratings yet
Citation Analysis
181 pages
Identification of The Needs of Haemodialysis Patients Using The Concept of Maslow's Hierarchy of Needs
No ratings yet
Identification of The Needs of Haemodialysis Patients Using The Concept of Maslow's Hierarchy of Needs
8 pages
IJRPR27084
No ratings yet
IJRPR27084
5 pages
Set+1 Descriptive+statistics+Probability+
100% (2)
Set+1 Descriptive+statistics+Probability+
4 pages
Estimation of California Bearing Ratio (CBR) From Index Properties and Compaction Characteristics of Coarse Grained Soil
No ratings yet
Estimation of California Bearing Ratio (CBR) From Index Properties and Compaction Characteristics of Coarse Grained Soil
4 pages
Statistics S1: Pearson Edexcel
No ratings yet
Statistics S1: Pearson Edexcel
28 pages
Implementasi Program Tanam Jagung Panen Sapi (TJPS) Di Kabupaten Malaka Provinsi Nusa Tenggara Timur
No ratings yet
Implementasi Program Tanam Jagung Panen Sapi (TJPS) Di Kabupaten Malaka Provinsi Nusa Tenggara Timur
19 pages
Hsslive-xi-economics-statistics-vijayabheri-malappuram-dp
No ratings yet
Hsslive-xi-economics-statistics-vijayabheri-malappuram-dp
80 pages
St. Mary's University: Department of Accounting and Finance
No ratings yet
St. Mary's University: Department of Accounting and Finance
171 pages
Statistics DLL - W3
No ratings yet
Statistics DLL - W3
11 pages
Barbados Statistical Service Development of Official Statistics in Barbados
No ratings yet
Barbados Statistical Service Development of Official Statistics in Barbados
6 pages
Assignment On Corelation and Regression-1
No ratings yet
Assignment On Corelation and Regression-1
7 pages
Lecture 2 - Unit 1 - Types of Research
No ratings yet
Lecture 2 - Unit 1 - Types of Research
17 pages
The HUMSS Curriculum Exposure and Student Career Choice Preferences Among Student- A Quantitative Analysis of Influencing Factor-1
No ratings yet
The HUMSS Curriculum Exposure and Student Career Choice Preferences Among Student- A Quantitative Analysis of Influencing Factor-1
11 pages
Jurnal Zafran New
No ratings yet
Jurnal Zafran New
15 pages
9 Hypothesis Testing
No ratings yet
9 Hypothesis Testing
32 pages
Unit - Iv Budgeting and Evaluating Front Office Operation Budgeting For Fo Operations Making A Front Office Budget
No ratings yet
Unit - Iv Budgeting and Evaluating Front Office Operation Budgeting For Fo Operations Making A Front Office Budget
11 pages
PDF Discovering Knowledge in Data An Introduction to Data Mining 1st Edition Daniel T. Larose download
100% (1)
PDF Discovering Knowledge in Data An Introduction to Data Mining 1st Edition Daniel T. Larose download
81 pages
Artificial Intelligence in Data Mining
No ratings yet
Artificial Intelligence in Data Mining
4 pages
Class 12 Chapter 13 Maths Important Formulas
No ratings yet
Class 12 Chapter 13 Maths Important Formulas
2 pages
20 +Hamzah+et+al,+ID+1427,+209-218
No ratings yet
20 +Hamzah+et+al,+ID+1427,+209-218
10 pages
Text Mining QP
No ratings yet
Text Mining QP
1 page

Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02

Uploaded by

Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02

Uploaded by

Statistical Methods in Artificial Intelligence

CSE471 - Monsoon 2015 : Lecture 02

Online Courses/Tutorials and Research Papers

Assessment & Attendance

Zero Tolerance for institute attendance policy

Lecture 02: Plan

Nearest Neighbor (NN)

Nearest Neighbor (NN) Classifier

Nearest Neighbor (NN)

Nearest Neighbor (KNN) Classifier

K-Nearest Neighbor (KNN) Classifier

Basic Linear Algebra

Scaling: Only Magnitude Changes

Dot Product (Inner Product) of two vectors is a scalar.

Dot product if two perpendicular vectors is 0

Decision boundary is represented explicitly in

Linear Discriminant Functions &

Decision boundary surface (hyperplane)

You might also like