0% found this document useful (0 votes)

4 views

hci_lab2_1 (1)

The document outlines the construction of decision trees for classifying records based on two datasets using information gain measures. It includes Python code for building the decision trees and classifying test records, along with the predicted outcomes for each test record. The constructed decision trees and their classifications are provided for both datasets.

Uploaded by

gauravkr210679

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views

hci_lab2_1 (1)

Uploaded by

gauravkr210679

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 4

da-lab3-221it084-final

March 1, 2025
#DA LAB DECISION TREE ##Name:Vishwajeet H. Dodyalkar ##Roll No: 221IT084 ##Sub-
ject: Data Analytics (IT350)
Question 1 F or the below dataset, construct a decision tree for classifying a new
test record using
information gain measure. Also, classify the below test records using the
constructed decision tree:
a. Outlook = Rainy , T emp = Cool, Humidity = High, Windy = T rue b. Outlook =
Sunny , T emp
= Mild, Humidity = Normal, Windy = F alse
[18]: import pandas as pd
import numpy as np
import pprint
data=pd.DataFrame([
['Rainy','Hot','High', False,'No'],
['Rainy','Hot','High', True,'No'],
['Overcast ','Hot','High', False,'Yes'],
['Sunny','Mild','High',False,'Yes'],
['Sunny','Cool','Normal', False,'Yes'],
['Sunny','Cool','Normal', True,'No'],
['Overcast ','Cool','Normal', True,'Yes'],
['Rainy','Mild','High',False,'No'],
['Rainy','Cool','Normal', False,'Yes'],
['Sunny','Mild','Normal', False,'Yes'],
['Rainy','Mild','Normal', True,'Yes'],
['Overcast ','Mild','High', True,'Yes'],
['Overcast ','Hot','Normal',False,'Yes'],
['Sunny','Mild','High',True,'No']
], columns =['Outlook','Temp','Humidity ','Windy','Play Golf '])
defentropy(target_col):
values, counts =np.unique(target_col, return_counts =True)
probs=counts/counts.sum()
return-np.sum(probs *np.log2(probs))
definfo_gain (data, attribute, target ='Play Golf '):
total_entropy =entropy(data[target])
values, counts =np.unique(data[attribute], return_counts =True)
weighted_entropy =sum(
1
(counts[i] /sum(counts)) *entropy(data[data[attribute] ==␣
↪values[i]][target])
fori inrange(len(values))
)
returntotal_entropy -weighted_entropy
defbuild_tree (data, attributes, target ='Play Golf '):
iflen(np.unique(data[target])) ==1:
returnnp.unique(data[target])[ 0]
iflen(attributes) ==0:
returndata[target] .mode()[0]
gains={attr: info_gain(data, attr, target) forattr inattributes}
best_attribute =max(gains, key =gains.get)
tree={best_attribute: {}}
forvalue innp.unique(data[best_attribute]):
subset=data[data[best_attribute] ==value]
remaining_attributes =[attr forattr inattributes ifattr!=␣
↪best_attribute]
tree[best_attribute][value] =build_tree(subset, remaining_attributes, ␣
↪target)
returntree
defprint_tree (tree, indent =''):
if notisinstance (tree,dict):
print(indent +f"→{tree }")
return
attribute =next(iter(tree))
print(indent +f"{attribute }?")
forvalue, subtree intree[attribute] .items():
print(indent +f" {value }")
print_tree(subtree, indent +"")
attributes =['Outlook','Temp','Humidity ','Windy']
tree=build_tree(data, attributes)
print("Constructed Decision Tree: ")
print_tree(tree)
defclassify (tree, record):
if notisinstance (tree,dict):
returntree
attribute =next(iter(tree))
value=record[attribute]
ifvalue not intree[attribute]:
return'Unknown'
2
returnclassify(tree[attribute][value], record)
test_records =[
{'Outlook':'Rainy','Temp':'Cool','Humidity ':'High','Windy': True},
{'Outlook':'Sunny','Temp':'Mild','Humidity ':'Normal','Windy': False}
]
print("\nClassifications for Test Records: ")
fori, record inenumerate (test_records):
result=classify(tree, record)
print(f"Test Record {i+1}:{record }=> Predicted: {result }")
Constructed Decision Tree:
Outlook?
Overcast
→ Yes
Rainy
Humidity?
High
→ No
Normal
→ Yes
Sunny
Windy?
False
→ Yes
True
→ No
Classifications for Test Records:
Test Record 1: {'Outlook': 'Rainy', 'Temp': 'Cool', 'Humidity': 'High', 'Windy':
True} => Predicted: No
Test Record 2: {'Outlook': 'Sunny', 'Temp': 'Mild', 'Humidity': 'Normal',
'Windy': False} => Predicted: Yes
Question 2 F or the below dataset, construct a decision tree for classifying a new
test record using
information gain measure. Also, classify the below test records using the
constructed decision tree:
a. Industry = Urban, JobType = Sales, Income = Low, Previous Customer = Y es b.
Industry =
Electronics, JobType = Engineering, Income = High, Previous Customer = No
[23]: import pandas as pd
import numpy as np
import pprint
data=pd.DataFrame([
['Aerospace ','Engineering ','High','No','NO'],
['Aerospace ','Engineering ','High','Yes','NO'],
3
['Auto','Engineering ','High','No','YES'],
['Electronics ','Marketing ','High','No','YES'],
['Urban','Marketing ','Low','No','YES'],
['Urban','Marketing ','Low','Yes','NO'],
['Auto','Marketing ','Low','Yes','YES'],
['Aerospace ','Sales','High','No','NO'],
['Aerospace ','Marketing ','Low','No','YES'],
['Electronics ','Sales','Low','No','NO'],
['Aerospace ','Sales','Low','Yes','YES'],
['Electronics ','Sales','High','Yes','NO'],
['Auto','Engineering ','Low','No','YES'],
['Electronics ','Sales','High','Yes','NO']
], columns =['Industry ','JobType','Income','Previous Customer ','Class'])
defentropy(target_col):
values, counts =np.unique(target_col, return_counts =True)
probs=counts/counts.sum()
return-np.sum(probs *np.log2(probs))
definfo_gain (data, attribute, target ='Class'):
total_entropy =entropy(data[target])
values, counts =np.unique(data[attribute], return_counts =True)
weighted_entropy =sum((counts[i] /sum(counts)) *␣
↪entropy(data[data[attribute] ==values[i]][target]) foriin␣
↪range(len(values)))
returntotal_entropy -weighted_entropy
defbuild_tree (data, attributes, target ='Class'):
iflen(np.unique(data[target])) ==1:
returnnp.unique(data[target])[ 0]
iflen(attributes) ==0:
returndata[target] .mode()[0]
gains={attr: info_gain(data, attr, target) forattr inattributes}
best_attribute =max(gains, key =gains.get)
tree={best_attribute: {}}
forvalue innp.unique(data[best_attribute]):
subset=data[data[best_attribute] ==value]
remaining_attributes =[attr forattr inattributes ifattr!=␣
↪best_attribute]
tree[best_attribute][value] =build_tree(subset, remaining_attributes, ␣
↪target)
4
returntree
defvisualize_tree (tree, indent ='', level=0):
if notisinstance (tree,dict):
print(indent +f'→{tree }')
return
forkey, value intree.items():
print(indent +key)
forsub_key, sub_value invalue.items():
print(indent +f' {sub_key }')
visualize_tree(sub_value, indent +'', level +1)
attributes =['Industry ','JobType','Income','Previous Customer ']
tree=build_tree(data, attributes)
print("Constructed Decision Tree: ")
pprint.pprint(tree)
visualize_tree(tree)
defclassify (tree, record, data, target ='Class'):
if notisinstance (tree,dict):
returntree
attribute =next(iter(tree))
value=record.get(attribute, 'Unknown')
ifvalue not intree[attribute]:
returndata[target] .mode()[0]
returnclassify(tree[attribute][value], record, data, target)
test_records =[
{'Industry ':'Urban','JobType':'Sales','Income':'Low','Previous ␣
↪Customer ':'Yes'},
{'Industry ':'Electronics ','JobType':'Engineering ','Income':'High',␣
↪'Previous Customer ':'No'}
]
print("\nClassifications for Test Records: ")
fori, record inenumerate (test_records):
result=classify(tree, record, data)
print(f"Test Record {i+1}:{record }=> Predicted: {result }")
Constructed Decision Tree:
5
{'Industry': {'Aerospace': {'Income': {'High': 'NO', 'Low': 'YES'}},
'Auto': 'YES',
'Electronics': {'JobType': {'Marketing': 'YES', 'Sales': 'NO'}},
'Urban': {'Previous Customer': {'No': 'YES', 'Yes': 'NO'}}}}
Industry
Aerospace
Income
High
→ NO
Low
→ YES
Auto
→ YES
Electronics
JobType
Marketing
→ YES
Sales
→ NO
Urban
Previous Customer
No
→ YES
Yes
→ NO
Classifications for Test Records:
Test Record 1: {'Industry': 'Urban', 'JobType': 'Sales', 'Income': 'Low',
'Previous Customer': 'Yes'} => Predicted: NO
Test Record 2: {'Industry': 'Electronics', 'JobType': 'Engineering', 'Income':
'High', 'Previous Customer': 'No'} => Predicted: NO
6

2 in The Matter of The Petition For Authority To Continue Use of The Firm Name "Ozaeta, Romulo, Etc.
No ratings yet
2 in The Matter of The Petition For Authority To Continue Use of The Firm Name "Ozaeta, Romulo, Etc.
2 pages
FIMA 40053: Risk Management (Midterm Examination)
100% (3)
FIMA 40053: Risk Management (Midterm Examination)
18 pages
da-lab3-221it084-final (1)
No ratings yet
da-lab3-221it084-final (1)
6 pages
DA_LAB3_221IT064
No ratings yet
DA_LAB3_221IT064
6 pages
221IT027_DA_lab3 (2)
No ratings yet
221IT027_DA_lab3 (2)
5 pages
DT RF
No ratings yet
DT RF
7 pages
Unit II Part 1
No ratings yet
Unit II Part 1
62 pages
22K61A0654_2_sasi_auto
No ratings yet
22K61A0654_2_sasi_auto
24 pages
DECISION TREES
No ratings yet
DECISION TREES
7 pages
Machine Learning Lab: Delhi Technological University
No ratings yet
Machine Learning Lab: Delhi Technological University
6 pages
Practical No4 - 5 ML
No ratings yet
Practical No4 - 5 ML
11 pages
Data Mining: Classification-1
No ratings yet
Data Mining: Classification-1
53 pages
Module 3
No ratings yet
Module 3
33 pages
MLT UNIT-3 notes
No ratings yet
MLT UNIT-3 notes
35 pages
L5 - Decision Tree - B
No ratings yet
L5 - Decision Tree - B
51 pages
Ml Unit 2 Final_iii Yr
No ratings yet
Ml Unit 2 Final_iii Yr
72 pages
Lab Program 3
No ratings yet
Lab Program 3
6 pages
ML Unit-2 Material WORD
No ratings yet
ML Unit-2 Material WORD
25 pages
41 j48 Naive Bayes Weka
No ratings yet
41 j48 Naive Bayes Weka
5 pages
Decision Trees
No ratings yet
Decision Trees
11 pages
15.module6 Decisiontree-Updated 14
No ratings yet
15.module6 Decisiontree-Updated 14
20 pages
Exercise5 Solution
No ratings yet
Exercise5 Solution
22 pages
Decision Tree Introduction
No ratings yet
Decision Tree Introduction
14 pages
7 - Classfication - Concept - DecisionTree - Evaluation
No ratings yet
7 - Classfication - Concept - DecisionTree - Evaluation
47 pages
Unit 3 Classification
No ratings yet
Unit 3 Classification
71 pages
DWDM Lab 2
No ratings yet
DWDM Lab 2
3 pages
Lecture 6 - Decision Trees
No ratings yet
Lecture 6 - Decision Trees
43 pages
Lecture 8
No ratings yet
Lecture 8
28 pages
practical 15 python
No ratings yet
practical 15 python
6 pages
3-Classification, Clustering and Prediction
No ratings yet
3-Classification, Clustering and Prediction
142 pages
St. John College of Engineering and Management, Palghar - Maharashtra
No ratings yet
St. John College of Engineering and Management, Palghar - Maharashtra
11 pages
23BCE7092_ML_Lab_Assignment[1]
No ratings yet
23BCE7092_ML_Lab_Assignment[1]
14 pages
UNIT III MACHINE LEARNING
No ratings yet
UNIT III MACHINE LEARNING
19 pages
Chapter 2 Types of Machine Learning and Their Learning Strategies
No ratings yet
Chapter 2 Types of Machine Learning and Their Learning Strategies
45 pages
Unit-II - Tree Based Methods
No ratings yet
Unit-II - Tree Based Methods
158 pages
Decision Tree
No ratings yet
Decision Tree
14 pages
Decision Tree
No ratings yet
Decision Tree
33 pages
Decision Tree
No ratings yet
Decision Tree
6 pages
MIS410-Chapter6
No ratings yet
MIS410-Chapter6
47 pages
Lecture 7.2 - DTC Algorithm Implementation
No ratings yet
Lecture 7.2 - DTC Algorithm Implementation
7 pages
Week 6 - 7 - Classification
No ratings yet
Week 6 - 7 - Classification
67 pages
Classification With Decision Trees I: Instructor: Qiang Yang
No ratings yet
Classification With Decision Trees I: Instructor: Qiang Yang
29 pages
02 Input Output
No ratings yet
02 Input Output
44 pages
P 4 Andp 5
No ratings yet
P 4 Andp 5
4 pages
Data Mining Classification Algorithms: Credits: Padhraic Smyth
No ratings yet
Data Mining Classification Algorithms: Credits: Padhraic Smyth
54 pages
Data Mining Question Set
No ratings yet
Data Mining Question Set
5 pages
UCS622
No ratings yet
UCS622
1 page
L6 Decision Tree Classifier
No ratings yet
L6 Decision Tree Classifier
46 pages
Project Occupancy Alfonso Vicente Aragues
No ratings yet
Project Occupancy Alfonso Vicente Aragues
18 pages
TTDS Lecture 4
No ratings yet
TTDS Lecture 4
31 pages
DM Mod 3
No ratings yet
DM Mod 3
14 pages
14MachineLearningDecisionTreeRandomForest - Ipynb - Colaboratory
No ratings yet
14MachineLearningDecisionTreeRandomForest - Ipynb - Colaboratory
29 pages
Classification_With_Decision_Tree_MarketingData - Jupyter Notebook
No ratings yet
Classification_With_Decision_Tree_MarketingData - Jupyter Notebook
9 pages
FALLSEM2024-25 BCSE209L TH VL2024250101598 2024-08-05 Reference-Material-I
No ratings yet
FALLSEM2024-25 BCSE209L TH VL2024250101598 2024-08-05 Reference-Material-I
31 pages
Slide 3
No ratings yet
Slide 3
23 pages
Classification - Issues Regarding Classification and Prediction
No ratings yet
Classification - Issues Regarding Classification and Prediction
42 pages
Big Data Lesson 5 Lucrezia Noli
No ratings yet
Big Data Lesson 5 Lucrezia Noli
30 pages
Decision tree
No ratings yet
Decision tree
16 pages
Module - 4.1-DM-1
No ratings yet
Module - 4.1-DM-1
63 pages
20210913115613D3708 - Session 05-08 Decision Tree Classification
No ratings yet
20210913115613D3708 - Session 05-08 Decision Tree Classification
37 pages
AD3461 ML lab manual
No ratings yet
AD3461 ML lab manual
32 pages
Apache Cassandra Developer Associate - Exam Practice Tests
From Everand
Apache Cassandra Developer Associate - Exam Practice Tests
Cristian Scutaru
No ratings yet
3. IT464-LabAssignment-3
No ratings yet
3. IT464-LabAssignment-3
1 page
gauravkumar_221it027_Report (1)
No ratings yet
gauravkumar_221it027_Report (1)
6 pages
gauravkumar_221it027@it301_Lab2
No ratings yet
gauravkumar_221it027@it301_Lab2
28 pages
Engineering Economics-Class 7
No ratings yet
Engineering Economics-Class 7
23 pages
Work at Height Checklist
No ratings yet
Work at Height Checklist
2 pages
Al Alif Final
No ratings yet
Al Alif Final
41 pages
Gland Packing Standards Regulations THINKTANK
No ratings yet
Gland Packing Standards Regulations THINKTANK
9 pages
II Sem Telecommunications Equipment Used in Front Office 2 PDF
No ratings yet
II Sem Telecommunications Equipment Used in Front Office 2 PDF
4 pages
Voltage Dip Calculations Using Spreadsheets
No ratings yet
Voltage Dip Calculations Using Spreadsheets
6 pages
Authority To Lease Scribd
No ratings yet
Authority To Lease Scribd
1 page
WRF Tutorial
No ratings yet
WRF Tutorial
84 pages
PT Program History
No ratings yet
PT Program History
27 pages
Coker Vessel Life Extension Repair Implementation Amador AZZ DCU Mumbai 2016
No ratings yet
Coker Vessel Life Extension Repair Implementation Amador AZZ DCU Mumbai 2016
39 pages
CCHSStrategicPlan 2016-19
No ratings yet
CCHSStrategicPlan 2016-19
12 pages
5
100% (1)
5
6 pages
Engineer To Engineer Note Ee-18: Choosing and Using Ffts For Adsp-21Xx
No ratings yet
Engineer To Engineer Note Ee-18: Choosing and Using Ffts For Adsp-21Xx
3 pages
Egarch Model
No ratings yet
Egarch Model
25 pages
Additional Mathematics Revision Paper 2 2024 - 240501 - 174942
No ratings yet
Additional Mathematics Revision Paper 2 2024 - 240501 - 174942
4 pages
LH 621i General Hydraulics Spares Parts
100% (1)
LH 621i General Hydraulics Spares Parts
122 pages
Quotation: Therapeutics Chemical Research Corporation
No ratings yet
Quotation: Therapeutics Chemical Research Corporation
63 pages
Registration Form 2014
No ratings yet
Registration Form 2014
12 pages
Iqc - Midterms
No ratings yet
Iqc - Midterms
7 pages
Biomass Drying
No ratings yet
Biomass Drying
6 pages
Associate New
No ratings yet
Associate New
1 page
Case Study OB - Domino's Pizza (Job Satisfaction)
80% (15)
Case Study OB - Domino's Pizza (Job Satisfaction)
33 pages
2 (R) Retail Management
No ratings yet
2 (R) Retail Management
34 pages
S&T Trimline PTS Jan14
No ratings yet
S&T Trimline PTS Jan14
2 pages
OBC Suspect 2023-24
No ratings yet
OBC Suspect 2023-24
7 pages
2021-10-31 Diploma Agriculture Plant Science Revised 2078
No ratings yet
2021-10-31 Diploma Agriculture Plant Science Revised 2078
153 pages
Global Brand Strategy
No ratings yet
Global Brand Strategy
10 pages
AAMA 2605铝制品喷漆
No ratings yet
AAMA 2605铝制品喷漆
15 pages
HW e PN 2015 16 PDF
No ratings yet
HW e PN 2015 16 PDF
186 pages

hci_lab2_1 (1)

Uploaded by

hci_lab2_1 (1)

Uploaded by

da-lab3-221it084-final

You might also like