0% found this document useful (0 votes)

2 views

DMDW Lab10[1]

The document outlines the implementation of the FP-Growth and Hierarchical clustering algorithms using the WEKA tool and Python programming. FP-Growth efficiently finds frequent patterns in large datasets using an FP-Tree, while Hierarchical clustering builds a hierarchy of clusters without predefining the number of clusters. Both algorithms are demonstrated with code examples and visualizations for better understanding.

Uploaded by

jagnoorsm.cs.22

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views

DMDW Lab10[1]

Uploaded by

jagnoorsm.cs.22

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

LAB - 910

1. Implement and demonstrate the FP-Growth algorithm using (i) the WEKA tool and (ii)
Python programming.

The FP-Growth algorithm is an efficient method for finding frequent patterns in large datasets
without the need for candidate generation, which makes it much faster than the Apriori algorithm.
It compresses the input dataset into a compact data structure known as an FP-Tree (Frequent
Pattern Tree). The algorithm first scans the database to identify frequent items and organizes them
into the tree structure based on their frequency. Then, it recursively mines the FP-Tree to extract
frequent itemsets by exploring the conditional patterns. Since it avoids the expensive process of
generating and testing a large number of candidate sets, FP-Growth is highly efficient, especially
for large and dense datasets. It is widely used in applications like market basket analysis, customer
behavior analysis, and recommender systems.

(i) the WEKA tool

(ii)Python programming

import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# (A) Prepare Data

dataset = [
['milk', 'bread'],
['milk', 'butter'],
['bread', 'eggs'],
['milk', 'bread', 'butter']
]

# (B) Convert to one-hot encoding

from mlxtend.preprocessing import TransactionEncoder
te = TransactionEncoder()
te_data = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_data, columns=te.columns_)

# (C) Apply FP-Growth (similar to Apriori in mlxtend)

from mlxtend.frequent_patterns import fpgrowth

frequent_itemsets = fpgrowth(df, min_support=0.5, use_colnames=True)

print(frequent_itemsets)

# (D) Generate association rules

rules = association_rules(frequent_itemsets, metric="confidence",
min_threshold=0.7)
print(rules)

OUTPUT:

2. Implement and demonstrate the Hierarchical clustering algorithm using (i) the WEKA
tool and (ii) Python programming.

Hierarchical clustering is a method of cluster analysis that seeks to build a hierarchy of clusters.
It does not require specifying the number of clusters in advance, unlike other methods such as K-
Means. The process begins by treating each data point as its own individual cluster. Then, in a
step-by-step manner, it merges the closest pairs of clusters based on a chosen distance metric
(like Euclidean distance) and linkage criterion (such as single, complete, or average linkage).
This continues until all points are combined into a single cluster, forming a tree-like structure
known as a dendrogram. This dendrogram can be cut at any level to obtain the desired number of
clusters. Hierarchical clustering is useful for visualizing data structure and is often applied in
fields like bioinformatics and social sciences.
(i) the WEKA tool

Hierarchical Clustering Visualization of the Iris Dataset

Dendrogram of Iris Dataset using Hierarchical Clustering

(ii)Python programming
import numpy as np
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage
from sklearn.cluster import AgglomerativeClustering

# 1. Generate some sample data

np.random.seed(42)
X = np.random.rand(10, 2) # 10 points in 2D

# 2. Plot the points

plt.scatter(X[:, 0], X[:, 1], color='black')
plt.title('Data Points')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.show()
# 3. Create the linkage matrix
linked = linkage(X, method='ward') # Ward minimizes the variance

# 4. Plot the Dendrogram

plt.figure(figsize=(10, 5))
dendrogram(linked,
orientation='top',
distance_sort='descending',
show_leaf_counts=True)
plt.title('Dendrogram')
plt.xlabel('Data Points')
plt.ylabel('Distance')
plt.show()

# 5. Apply Agglomerative Clustering

from sklearn.cluster import AgglomerativeClustering

# Apply Agglomerative Clustering (corrected version)

cluster = AgglomerativeClustering(n_clusters=3, linkage='ward')
labels = cluster.fit_predict(X)

# 6. Plot clustered data

plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='rainbow')
plt.title('Hierarchical Clustering Results')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.show()

OUTPUT:

Data Points
Dendrogram

Hierarchical Clustering Results

Autosar Tester Diagnostics Training
No ratings yet
Autosar Tester Diagnostics Training
10 pages
Record 5
No ratings yet
Record 5
22 pages
Exp 8
No ratings yet
Exp 8
5 pages
Data Minig Lab File
No ratings yet
Data Minig Lab File
25 pages
Recent Trends in IT Practical Solutions
No ratings yet
Recent Trends in IT Practical Solutions
11 pages
Expt-5
No ratings yet
Expt-5
3 pages
ML Unit 5
No ratings yet
ML Unit 5
50 pages
Hierarchical Clustering in Machine Learning
No ratings yet
Hierarchical Clustering in Machine Learning
11 pages
Chp10 Cluster Analysis Basic Concepts and Methods
No ratings yet
Chp10 Cluster Analysis Basic Concepts and Methods
24 pages
Hierarchical-Clustering-in-Machine-Learning
No ratings yet
Hierarchical-Clustering-in-Machine-Learning
10 pages
Aiml Unit 3 4
No ratings yet
Aiml Unit 3 4
19 pages
Lesson 6 - Unsupervised Learning
No ratings yet
Lesson 6 - Unsupervised Learning
63 pages
Hierarchical clustering
No ratings yet
Hierarchical clustering
23 pages
Agnes
No ratings yet
Agnes
25 pages
Prac7 8 9 10
No ratings yet
Prac7 8 9 10
12 pages
Association Rule Mining Lesson PDF
No ratings yet
Association Rule Mining Lesson PDF
9 pages
Exp 8
No ratings yet
Exp 8
3 pages
Clustering
No ratings yet
Clustering
19 pages
Experiment 6,7
No ratings yet
Experiment 6,7
14 pages
Hierarchical Clustering Unit 4 ML
No ratings yet
Hierarchical Clustering Unit 4 ML
14 pages
Dwdm Answer
No ratings yet
Dwdm Answer
19 pages
DM Lab Internal
No ratings yet
DM Lab Internal
37 pages
Result - 22 - 7 - 2022, 2 - 07 - 06 PM
No ratings yet
Result - 22 - 7 - 2022, 2 - 07 - 06 PM
2 pages
Exp 8
No ratings yet
Exp 8
7 pages
Heirarchical clustering
No ratings yet
Heirarchical clustering
22 pages
Day12 Hierarchical Clustering
No ratings yet
Day12 Hierarchical Clustering
9 pages
Chapter 2
No ratings yet
Chapter 2
30 pages
Data Mining Project - Clustering - State Wise Health Income
No ratings yet
Data Mining Project - Clustering - State Wise Health Income
9 pages
Cluster Analysis in Python Chapter2 PDF
No ratings yet
Cluster Analysis in Python Chapter2 PDF
30 pages
4.4 Hierarchical Clustering Methods
No ratings yet
4.4 Hierarchical Clustering Methods
39 pages
Hierarchical Clustering and Data Science Group Project - Assignment 2
No ratings yet
Hierarchical Clustering and Data Science Group Project - Assignment 2
29 pages
3.2 HierCluster
No ratings yet
3.2 HierCluster
17 pages
DOC-20231118-WA0008new Unit 5
No ratings yet
DOC-20231118-WA0008new Unit 5
15 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
10 pages
Fa22-bcs-025 MOAZ Assignment 1
No ratings yet
Fa22-bcs-025 MOAZ Assignment 1
9 pages
Data Mining
No ratings yet
Data Mining
27 pages
Marketing Analytics Week-10 LAQ
No ratings yet
Marketing Analytics Week-10 LAQ
5 pages
Hierarchical Clustering
No ratings yet
Hierarchical Clustering
34 pages
DA_LabFile
No ratings yet
DA_LabFile
63 pages
Chinninti Venkata Assessment Machine Learning
No ratings yet
Chinninti Venkata Assessment Machine Learning
11 pages
Lesson 3.6 - Supervised Learning Neural Networks
No ratings yet
Lesson 3.6 - Supervised Learning Neural Networks
35 pages
Data Mining and Analytics Lab Exp 5
No ratings yet
Data Mining and Analytics Lab Exp 5
3 pages
Lecture - 11 Hierarchical Clustering
No ratings yet
Lecture - 11 Hierarchical Clustering
28 pages
Clustering Algorithms CheatSheet 1710438661
No ratings yet
Clustering Algorithms CheatSheet 1710438661
6 pages
Data Mining Unit 5
No ratings yet
Data Mining Unit 5
30 pages
Weka 3 Tool
No ratings yet
Weka 3 Tool
37 pages
Hierarchical Clustering in Machine Learning - GeeksforGeeks
No ratings yet
Hierarchical Clustering in Machine Learning - GeeksforGeeks
8 pages
Spooo
No ratings yet
Spooo
9 pages
9536 DWM Expt 7 Merged
No ratings yet
9536 DWM Expt 7 Merged
14 pages
FullMarks - Clustering StudentSolution 2
No ratings yet
FullMarks - Clustering StudentSolution 2
13 pages
DWM Exp8 127 133 137
No ratings yet
DWM Exp8 127 133 137
4 pages
report 2
No ratings yet
report 2
7 pages
ML_Lec-17
No ratings yet
ML_Lec-17
12 pages
Hierarchical Clustering PDF
No ratings yet
Hierarchical Clustering PDF
5 pages
Practical Data Analysis Cookbook - Sample Chapter
100% (1)
Practical Data Analysis Cookbook - Sample Chapter
31 pages
Hierarchical ClusteringAlgorithm
No ratings yet
Hierarchical ClusteringAlgorithm
32 pages
Association Rule Mining3
No ratings yet
Association Rule Mining3
13 pages
Assignment 1: Data Mining MGSC5126 - 10
No ratings yet
Assignment 1: Data Mining MGSC5126 - 10
10 pages
DMlab - FilE prINCE
No ratings yet
DMlab - FilE prINCE
27 pages
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
From Everand
Learning Pandas 2.0: A Comprehensive Guide to Data Manipulation and Analysis for Data Scientists and Machine Learning Professionals
Matthew Rosch
No ratings yet
Machine Learning in the AWS Cloud: Add Intelligence to Applications with Amazon SageMaker and Amazon Rekognition
From Everand
Machine Learning in the AWS Cloud: Add Intelligence to Applications with Amazon SageMaker and Amazon Rekognition
Abhishek Mishra
No ratings yet
Business Analytics With Excel Course
No ratings yet
Business Analytics With Excel Course
9 pages
Application Wise Process Steps For Stability Control - Fuji (HMI)
No ratings yet
Application Wise Process Steps For Stability Control - Fuji (HMI)
7 pages
Solaris
No ratings yet
Solaris
28 pages
Failed_Migrating Watsonx Assistant Classic Deployments [WA Deploy L4] Quiz_ Attempt Review
No ratings yet
Failed_Migrating Watsonx Assistant Classic Deployments [WA Deploy L4] Quiz_ Attempt Review
6 pages
COAG NMAT For October 2021-B
No ratings yet
COAG NMAT For October 2021-B
41 pages
Oracle Histogram Checking
No ratings yet
Oracle Histogram Checking
6 pages
SAP Business Warehouse: Business Explorer Analyzer For Power Users
No ratings yet
SAP Business Warehouse: Business Explorer Analyzer For Power Users
45 pages
Prince of Persia - Warrior Within - PC Manual
0% (1)
Prince of Persia - Warrior Within - PC Manual
13 pages
Window 11 Update
No ratings yet
Window 11 Update
26 pages
Software Firewalls For Dummies
No ratings yet
Software Firewalls For Dummies
64 pages
Cambridge IGCSE™: Computer Science 0478/13
No ratings yet
Cambridge IGCSE™: Computer Science 0478/13
10 pages
Nmot Two Marks-Full
No ratings yet
Nmot Two Marks-Full
25 pages
Partial Fractions
100% (1)
Partial Fractions
5 pages
First Boot
No ratings yet
First Boot
3,379 pages
Bootstrap Questions
No ratings yet
Bootstrap Questions
88 pages
Ch12 Determinants and Systems of Linear Equations
No ratings yet
Ch12 Determinants and Systems of Linear Equations
53 pages
Anh 8 thi diem Ex Unit 111 Keys
No ratings yet
Anh 8 thi diem Ex Unit 111 Keys
2 pages
AI in China 2020 White Paper by Daxue Consulting 2
100% (1)
AI in China 2020 White Paper by Daxue Consulting 2
140 pages
Zomato Review
No ratings yet
Zomato Review
4 pages
Applications of Geographic Information Systems in Social Media
No ratings yet
Applications of Geographic Information Systems in Social Media
8 pages
Electronic Thesis and Dissertation PDF
100% (3)
Electronic Thesis and Dissertation PDF
6 pages
Electronic Commerce Topologies
No ratings yet
Electronic Commerce Topologies
42 pages
Chapter 3 - Multimedia Learning Theory and Instructional Message
100% (1)
Chapter 3 - Multimedia Learning Theory and Instructional Message
29 pages
f7r701 DVR
No ratings yet
f7r701 DVR
14 pages
FAQ (1) BSNL
No ratings yet
FAQ (1) BSNL
3 pages
neotysAcademyCatalog EN PDF
No ratings yet
neotysAcademyCatalog EN PDF
9 pages
Sample Cover Letter For Livelihood Officer
100% (5)
Sample Cover Letter For Livelihood Officer
9 pages
604 CA Final ISCA MCQ - by CA Swapnil Patni PDF
50% (2)
604 CA Final ISCA MCQ - by CA Swapnil Patni PDF
73 pages
Ricoh Error Codes
50% (2)
Ricoh Error Codes
6 pages

DMDW Lab10[1]

Uploaded by

DMDW Lab10[1]

Uploaded by

LAB - 910

(i) the WEKA tool

# (A) Prepare Data

# (B) Convert to one-hot encoding

# (C) Apply FP-Growth (similar to Apriori in mlxtend)

frequent_itemsets = fpgrowth(df, min_support=0.5, use_colnames=True)

# (D) Generate association rules

Hierarchical Clustering Visualization of the Iris Dataset

# 1. Generate some sample data

# 2. Plot the points

# 4. Plot the Dendrogram

# 5. Apply Agglomerative Clustering

# Apply Agglomerative Clustering (corrected version)

# 6. Plot clustered data

Hierarchical Clustering Results

You might also like