0% found this document useful (0 votes)

17 views3 pages

HTCB Unit 5

Uploaded by

Isarar Siddique

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

17 views3 pages

HTCB Unit 5

Uploaded by

Isarar Siddique

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

UNIT – 5 Clustering

Cluster Analysis: Clustering is a technique used to group similar objects into sets called
clusters. It’s widely used in various fields to discover patterns and relationships in data.

Types of Clustering:

1. Partitioning Methods: Divide data into non-overlapping subsets (clusters) where each
data point belongs to exactly one group. Example: K-means clustering.

- K-means Clustering:

- Algorithm:

1. Initialize K cluster centroids randomly.

2. Assign each data point to the nearest centroid, forming K clusters.

3. Update centroids by computing the mean of all points in each cluster.

4. Repeat steps 2 and 3 until centroids stabilize or a maximum number of iterations is

reached.

- Details:

- Suitable for high-dimensional data.

- Requires predefined K (number of clusters).

- May converge to local optima depending on initial centroid selection.

![K-means clustering
diagram](https://upload.wikimedia.org/wikipedia/commons/e/ea/K-
means_convergence.gif)

2. Hierarchical Methods: Create a tree of clusters, where each node is a cluster consisting
of its child nodes (clusters). Example: Agglomerative clustering.

- Agglomerative Clustering:

- Algorithm:

1. Treat each data point as a single cluster.

2. Merge the closest pair of clusters until all points belong to one cluster.
3. Construct a tree (dendrogram) to represent the hierarchy of clusters.

- Details:

- No need to specify the number of clusters beforehand.

- Computationally expensive for large datasets.

- Can be visualized using a dendrogram.

![Agglomerative clustering
diagram](https://upload.wikimedia.org/wikipedia/commons/f/fd/Hierarchical_clustering_si
mple_diagram.svg)

3. Density-Based Methods: Clusters are regions of high density separated by regions of

low density. Example: DBSCAN (Density-Based Spatial Clustering of Applications with
Noise).

- DBSCAN:

- Algorithm:

- Parameters: ε (epsilon) and MinPts (minimum number of points).

1. Find core points with at least MinPts within ε distance.

2. Expand clusters by including reachable points (density-connected) to form clusters.

3. Mark points as noise if they don’t meet criteria for any cluster.

- Details:

- Can find arbitrarily shaped clusters.

- Robust to outliers and noise.

- Parameters ε and MinPts affect cluster quality.

![DBSCAN clustering
diagram](https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/DBSCAN-
Illustration.svg/330px-DBSCAN-Illustration.svg.png)

4. Grid-Based Methods: Data space is divided into cells, where each cell represents a
bucket of data points. Example: STING (Statistical Information Grid).
- STING:

- Algorithm:

1. Partition data space into a grid of cells.

2. Count data points in each cell to form initial clusters.

3. Merge adjacent clusters based on statistical tests or predefined criteria.

- Details: - Efficient for large spatial datasets. - Allows dynamic adjustments to grid
resolution.

- May require domain knowledge to set appropriate grid size and merging criteria.

Applications in Text Mining, Web Mining, Temporal and Spatial Data Mining

Text Mining: Extracting meaningful information from text data.

Application: Topic modeling in text documents using Latent Dirichlet Allocation (LDA) to
cluster articles into topics based on word frequency and co-occurrence.

Web Mining: Extracting useful information from web pages and web usage data.

- Application: Clustering web pages to identify similar content for better search
engine results using techniques like TF-IDF (Term Frequency-Inverse Document
Frequency).

Temporal Data Mining: Analyzing data collected over time.

- Application: Identifying periodic patterns in time-series data such as sales data

using techniques like seasonal decomposition.

Spatial Data Mining: Analyzing data with a spatial component (location-based data).

- Application: Using DBSCAN to identify clusters of crime incidents in a city for

targeted policing efforts.

How To Make Pacts With The Devil
80% (5)
How To Make Pacts With The Devil
16 pages
Ensayos Persuasivos para Niños
100% (2)
Ensayos Persuasivos para Niños
6 pages
Class 9 Maths Final Paper Indraprastha School
No ratings yet
Class 9 Maths Final Paper Indraprastha School
7 pages
Chekurkov Antigravity Research PDF
75% (4)
Chekurkov Antigravity Research PDF
5 pages
Pad 251
No ratings yet
Pad 251
246 pages
Gas Analysis v2 Powell 2010 StanfordGW
No ratings yet
Gas Analysis v2 Powell 2010 StanfordGW
27 pages
Fundamentals of Data Science Unit 3
No ratings yet
Fundamentals of Data Science Unit 3
15 pages
ISSUU PDF Downloader
No ratings yet
ISSUU PDF Downloader
9 pages
Ch-7-Revenue (Prashant Kirad)
No ratings yet
Ch-7-Revenue (Prashant Kirad)
4 pages
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
No ratings yet
Sathyabama Institute of Science and Technology SIT1301-Data Mining and Warehousing
22 pages
Designing For Inclusivity Web Accessibility in Full Stack Applications
No ratings yet
Designing For Inclusivity Web Accessibility in Full Stack Applications
4 pages
Office Note - of Majedul Islam
No ratings yet
Office Note - of Majedul Islam
4 pages
The Edge Financial Report
No ratings yet
The Edge Financial Report
33 pages
Experiment Electromotive force and Resistance updated
No ratings yet
Experiment Electromotive force and Resistance updated
3 pages
By Lior Rokach and Oded Maimon: Clustering Methods
No ratings yet
By Lior Rokach and Oded Maimon: Clustering Methods
5 pages
big data techniques of 2025
No ratings yet
big data techniques of 2025
31 pages
clustering
No ratings yet
clustering
6 pages
Data Mining Assignment 2
No ratings yet
Data Mining Assignment 2
25 pages
Ds Econtent
No ratings yet
Ds Econtent
8 pages
Cluster Analysis
No ratings yet
Cluster Analysis
4 pages
Clustering Notes
No ratings yet
Clustering Notes
17 pages
Dmaclat4 Merged
No ratings yet
Dmaclat4 Merged
46 pages
Density-Based Clustering Algorithms Are The Algorithms Which Are
No ratings yet
Density-Based Clustering Algorithms Are The Algorithms Which Are
1 page
v240C Installation User Manual v2
No ratings yet
v240C Installation User Manual v2
161 pages
Asynchronous Task Cluster Analysis
No ratings yet
Asynchronous Task Cluster Analysis
2 pages
Clustering
No ratings yet
Clustering
34 pages
UNIT-5 PPT
No ratings yet
UNIT-5 PPT
85 pages
Ambo University: Inistitute of Technology
No ratings yet
Ambo University: Inistitute of Technology
15 pages
Big Data Analytics
No ratings yet
Big Data Analytics
25 pages
Final QUIZ TAYO SA ICT
No ratings yet
Final QUIZ TAYO SA ICT
4 pages
Cluster Analysis
No ratings yet
Cluster Analysis
22 pages
Cluster
No ratings yet
Cluster
20 pages
Solve These
No ratings yet
Solve These
7 pages
Chatgpt Unit - 4
No ratings yet
Chatgpt Unit - 4
4 pages
Clustering in Machine Learning
No ratings yet
Clustering in Machine Learning
4 pages
UNIT V MACHINE LEARNING
No ratings yet
UNIT V MACHINE LEARNING
5 pages
Clustering Explanation
No ratings yet
Clustering Explanation
8 pages
unit5_CSM_ML
No ratings yet
unit5_CSM_ML
32 pages
Clustering
No ratings yet
Clustering
28 pages
mod3 dm
No ratings yet
mod3 dm
20 pages
Marketing Models
No ratings yet
Marketing Models
14 pages
Clustering Unit4
No ratings yet
Clustering Unit4
9 pages
Partition
No ratings yet
Partition
52 pages
Data Mining Unit-Iv
No ratings yet
Data Mining Unit-Iv
34 pages
Clustering
No ratings yet
Clustering
45 pages
05 Clustering
No ratings yet
05 Clustering
96 pages
Unsupervised Learning
No ratings yet
Unsupervised Learning
64 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
21 pages
DWMModule 4 (1) (1) (1)
No ratings yet
DWMModule 4 (1) (1) (1)
31 pages
Ballast Water Management Plan
No ratings yet
Ballast Water Management Plan
51 pages
Clustering
No ratings yet
Clustering
11 pages
Unit 5
No ratings yet
Unit 5
10 pages
Unsupervised Learning-01
No ratings yet
Unsupervised Learning-01
42 pages
Clustering: An Overview: Key Concepts Objective
No ratings yet
Clustering: An Overview: Key Concepts Objective
12 pages
Clustering
No ratings yet
Clustering
7 pages
Clustering
No ratings yet
Clustering
12 pages
Firewall - Sonicwall Models
No ratings yet
Firewall - Sonicwall Models
2 pages
BTSDSB2018
No ratings yet
BTSDSB2018
30 pages
Gautam A. Kudale
No ratings yet
Gautam A. Kudale
6 pages
Lecture 9 Clustering
No ratings yet
Lecture 9 Clustering
36 pages
Machine Learning Unit-4
No ratings yet
Machine Learning Unit-4
24 pages
Introduction to Cluster Analysis.
No ratings yet
Introduction to Cluster Analysis.
53 pages
Instant Download The Bloomsbury Handbook of Music Production 1st Edition Andrew Bourbon PDF All Chapters
No ratings yet
Instant Download The Bloomsbury Handbook of Music Production 1st Edition Andrew Bourbon PDF All Chapters
50 pages
2024 02 02 (I Iib) e
No ratings yet
2024 02 02 (I Iib) e
37 pages
Soal Selidik Sikap
No ratings yet
Soal Selidik Sikap
8 pages
Test 8-Environment(1)-Questions_FINAL
No ratings yet
Test 8-Environment(1)-Questions_FINAL
20 pages
Nokia AirScale Base Station
100% (2)
Nokia AirScale Base Station
5 pages
DWM PT 2 QB Soln
No ratings yet
DWM PT 2 QB Soln
8 pages
M5
No ratings yet
M5
40 pages
M5
No ratings yet
M5
40 pages
Cluster Analysis
No ratings yet
Cluster Analysis
18 pages
AKSHAYA
No ratings yet
AKSHAYA
3 pages
ML - 8
No ratings yet
ML - 8
70 pages
Unit 4 Clustering
No ratings yet
Unit 4 Clustering
18 pages
Lecture 23 Soil Taxonomy
No ratings yet
Lecture 23 Soil Taxonomy
49 pages
Data Mining Clustering
No ratings yet
Data Mining Clustering
76 pages
Clustering new
No ratings yet
Clustering new
6 pages
Decision Support Systems Lecture2Supplementary PDF
No ratings yet
Decision Support Systems Lecture2Supplementary PDF
32 pages
ML Unit 4 Notes - NJ
No ratings yet
ML Unit 4 Notes - NJ
15 pages
Chapter 5
No ratings yet
Chapter 5
43 pages
ECOTECT Analysis Tutorial PartI
No ratings yet
ECOTECT Analysis Tutorial PartI
27 pages
Product Datasheet: Circuit Breaker Compact NSX250H - TMD - 250 A - 3 Poles 3d
No ratings yet
Product Datasheet: Circuit Breaker Compact NSX250H - TMD - 250 A - 3 Poles 3d
2 pages
Data Mining-Unit 3-Part1
No ratings yet
Data Mining-Unit 3-Part1
41 pages
Custer Analysis: Prepared by Navin Ninama
No ratings yet
Custer Analysis: Prepared by Navin Ninama
20 pages
Legend For Wiring Diagrams K1600GT (K48)
No ratings yet
Legend For Wiring Diagrams K1600GT (K48)
7 pages
Transgender 101 Final PDF
No ratings yet
Transgender 101 Final PDF
44 pages
The Secret Of Machine Learning
From Everand
The Secret Of Machine Learning
Mhd Arjunanta
No ratings yet
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
From Everand
DEEP LEARNING TECHNIQUES: CLUSTER ANALYSIS and PATTERN RECOGNITION with NEURAL NETWORKS. Examples with MATLAB
César Pérez López
No ratings yet
Image Segmentation: Unlocking Insights through Pixel Precision
From Everand
Image Segmentation: Unlocking Insights through Pixel Precision
Fouad Sabry
No ratings yet
Machine Learning - Advanced Concepts
From Everand
Machine Learning - Advanced Concepts
Derrick Mwiti
No ratings yet