0% found this document useful (0 votes)

4 views3 pages

Data_Mining_Key_Concepts

Uploaded by

manishpal2003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views3 pages

Data_Mining_Key_Concepts

Uploaded by

manishpal2003

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

a.

Draw the diagram for key steps of data mining

Key steps of data mining:

1. Data Cleaning: Remove noise and inconsistent data.

2. Data Integration: Combine data from multiple sources.

3. Data Selection: Select relevant data for analysis.

4. Data Transformation: Convert data into a suitable format.

5. Data Mining: Apply algorithms to extract patterns.

6. Pattern Evaluation: Identify interesting patterns.

7. Knowledge Presentation: Visualize the results.

b. Define the term Support and Confidence

Support: It is the frequency of an itemset appearing in the dataset.

Support(X) = Transactions containing X / Total transactions

Confidence: It measures the reliability of a rule, calculated as the proportion of transactions

containing both X and Y to those containing X.

Confidence(X -> Y) = Support(X U Y) / Support(X)

c. Explain Data Warehouse Process

The Data Warehouse process involves the following steps:

1. Data Extraction: Gather data from multiple sources.

2. Data Transformation: Clean and standardize data for consistency.

3. Data Loading: Store transformed data in the data warehouse.

4. Data Access: Enable users to query and analyze the data for decision-making.

d. Illustrate the Warehousing Strategy

A data warehousing strategy involves:

1. Top-down Approach: Design the enterprise-wide warehouse first, followed by smaller data marts.

2. Bottom-up Approach: Build data marts first, integrating them later into a warehouse.

3. Hybrid Approach: Combines top-down and bottom-up approaches for flexibility and scalability.

e. Write the statement for Apriori Algorithm

The Apriori Algorithm identifies frequent itemsets in a dataset using a bottom-up approach, starting

with single items and extending them iteratively by adding items, provided their subsets are

frequent. It uses the Apriori Property: "All non-empty subsets of a frequent itemset must also be

frequent."

f. List out the drawbacks of k-mean algorithm

1. Requires pre-specifying the number of clusters (k).

2. Sensitive to initial cluster centroids and outliers.

3. Only works well with spherical clusters.

4. May converge to local minima and fail to produce the global optimal solution.

5. Inefficient with large datasets due to high computation cost.

g. Explain about the Classification

Classification is a supervised learning technique used to assign labels to data based on predefined

categories. It builds a model using training data, which is then applied to predict the class labels of

new data. Common algorithms include Decision Trees, Naive Bayes, and SVM.

h. Discuss the Clustering

Clustering is an unsupervised learning method used to group similar data points into clusters based

on shared characteristics. Examples include K-means, DBSCAN, and Hierarchical Clustering. Unlike

classification, clustering does not require labeled data.

i. Explain the needs on Data Mining

Data mining is essential to:

1. Extract useful patterns and insights from large datasets.

2. Aid decision-making processes in business, healthcare, and education.

3. Detect fraud, predict trends, and improve efficiency in various domains.

4. Handle and analyze the growing volume of data effectively.

j. Write a short note on Binning

Binning is a data smoothing technique used to reduce noise in numerical data by grouping values

into bins or intervals. Methods include:

1. Equal-width binning: Divides data into bins of equal size.

2. Equal-frequency binning: Divides data such that each bin contains the same number of elements.

3. Smoothing by bin means: Replaces data in a bin with the mean value.

Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
Data Mining Suggestions
No ratings yet
Data Mining Suggestions
5 pages
Seperated
No ratings yet
Seperated
11 pages
DWDM_QB[1]
No ratings yet
DWDM_QB[1]
6 pages
DWDM 2MARKS (3)
No ratings yet
DWDM 2MARKS (3)
15 pages
Qb Data Mining
No ratings yet
Qb Data Mining
5 pages
Data Mining Long Answers
No ratings yet
Data Mining Long Answers
4 pages
DWM_Question_Bank_with_Answers
No ratings yet
DWM_Question_Bank_with_Answers
5 pages
DM VSAQ
No ratings yet
DM VSAQ
8 pages
Question Bank 2
No ratings yet
Question Bank 2
4 pages
Document
No ratings yet
Document
44 pages
DMA_qb_solved
No ratings yet
DMA_qb_solved
42 pages
Iv Semester: Data Mining Question Bank: Unit 2 2 Mark Questions)
No ratings yet
Iv Semester: Data Mining Question Bank: Unit 2 2 Mark Questions)
5 pages
DMDW Question Bank
No ratings yet
DMDW Question Bank
17 pages
Model Question paper 2
No ratings yet
Model Question paper 2
7 pages
Solve These
No ratings yet
Solve These
7 pages
IV-cse DM Viva Questions
No ratings yet
IV-cse DM Viva Questions
10 pages
DMBI Questions
No ratings yet
DMBI Questions
8 pages
DWDM
No ratings yet
DWDM
18 pages
dwm NOTES
No ratings yet
dwm NOTES
118 pages
DM Question Bank
No ratings yet
DM Question Bank
5 pages
DWDM MID - 2 Question Paper and Online Bits
No ratings yet
DWDM MID - 2 Question Paper and Online Bits
3 pages
CEUC502 - DMBI_Question_Bank
No ratings yet
CEUC502 - DMBI_Question_Bank
12 pages
DMDW Imp Ques
No ratings yet
DMDW Imp Ques
17 pages
Short Notes On Data Mining & Warehousing
No ratings yet
Short Notes On Data Mining & Warehousing
43 pages
Data Warehousing and Mining April 2019
No ratings yet
Data Warehousing and Mining April 2019
4 pages
SemSuggestions DM
No ratings yet
SemSuggestions DM
6 pages
Data Mining
No ratings yet
Data Mining
7 pages
Gandhinagar Institute of Technology: Computer Engineer Ing Department Question Bank
No ratings yet
Gandhinagar Institute of Technology: Computer Engineer Ing Department Question Bank
3 pages
Data Mining
No ratings yet
Data Mining
20 pages
QUESTION BANK BCA_IDS
No ratings yet
QUESTION BANK BCA_IDS
3 pages
1569928600-7cs It3a dmwh-3555
No ratings yet
1569928600-7cs It3a dmwh-3555
2 pages
data science question bank
No ratings yet
data science question bank
6 pages
Data Mining University Answer
No ratings yet
Data Mining University Answer
10 pages
PROFICIENCY Data Mining
No ratings yet
PROFICIENCY Data Mining
6 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
No ratings yet
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
7 pages
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
No ratings yet
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
31 pages
Unit-3 DMDW
No ratings yet
Unit-3 DMDW
36 pages
2018 & 2019 Data Mining Answers
No ratings yet
2018 & 2019 Data Mining Answers
25 pages
Data Mining Assignment
No ratings yet
Data Mining Assignment
2 pages
Data Mining 2-5
No ratings yet
Data Mining 2-5
4 pages
comp 414 revision
No ratings yet
comp 414 revision
9 pages
DMBI_All_pyqs
No ratings yet
DMBI_All_pyqs
4 pages
DM
No ratings yet
DM
7 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
No ratings yet
Recommender System - Module 2 - Data Mining Techniques in Recommender System
58 pages
Vi Sem Bca Qbank - Wcms - Fds
50% (2)
Vi Sem Bca Qbank - Wcms - Fds
11 pages
Data Mining Question Bank
No ratings yet
Data Mining Question Bank
4 pages
Data Mining Question Bank
0% (1)
Data Mining Question Bank
7 pages
Data Mining and Warehousing (1)
No ratings yet
Data Mining and Warehousing (1)
7 pages
DW Model Questions
No ratings yet
DW Model Questions
8 pages
dataqb
No ratings yet
dataqb
38 pages
DMDW Lab Oral Question Bank
No ratings yet
DMDW Lab Oral Question Bank
4 pages
2 - Data Mining and Warehousing - L2
No ratings yet
2 - Data Mining and Warehousing - L2
6 pages
DM UNIT-1 Question and Answer
No ratings yet
DM UNIT-1 Question and Answer
25 pages
CS-DM MODULE -1
No ratings yet
CS-DM MODULE -1
27 pages
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
From Everand
IT Specialist: Data Analytics Certification Prep - 500 Exam Questions and Explanations
Steve Brown
No ratings yet
The Secret Of Machine Learning
From Everand
The Secret Of Machine Learning
Mhd Arjunanta
No ratings yet
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Introduction to Robotics
From Everand
Introduction to Robotics
Swarnalata Verma
No ratings yet
Data Mining Models: Techniques and Applications
From Everand
Data Mining Models: Techniques and Applications
Ravi Deshpande
No ratings yet
Small Fund Factsheet February 2023
No ratings yet
Small Fund Factsheet February 2023
88 pages
Nikto Cheat Sheet: Scan Options Display Options
No ratings yet
Nikto Cheat Sheet: Scan Options Display Options
1 page
Pharmacognosy (Effective From The Session - 2016-17)
No ratings yet
Pharmacognosy (Effective From The Session - 2016-17)
16 pages
stalins foreign policy
No ratings yet
stalins foreign policy
14 pages
Folder HCMBOK To Agile
No ratings yet
Folder HCMBOK To Agile
4 pages
Study of Effect of Varying Engine Mount Locations and Stiffness On Vibration in Heavy Commercial Vehicles IJERTV3IS21173
No ratings yet
Study of Effect of Varying Engine Mount Locations and Stiffness On Vibration in Heavy Commercial Vehicles IJERTV3IS21173
4 pages
434 590169 0005 - AdvisoryStatus
No ratings yet
434 590169 0005 - AdvisoryStatus
4 pages
Form 3 - Demand Notice
No ratings yet
Form 3 - Demand Notice
2 pages
Custodio Castro Elementary School: School Heads Monthly Instructional / Supervisory Plan
100% (1)
Custodio Castro Elementary School: School Heads Monthly Instructional / Supervisory Plan
7 pages
Mtech Semester II 2017
No ratings yet
Mtech Semester II 2017
10 pages
Step-by-Step Instructions - How To Higg
No ratings yet
Step-by-Step Instructions - How To Higg
5 pages
12th Maths Answer Key For Quarterly Exam 2019 Question Paper English Medium PDF
No ratings yet
12th Maths Answer Key For Quarterly Exam 2019 Question Paper English Medium PDF
8 pages
Service Description Template
No ratings yet
Service Description Template
2 pages
C Epri Electric Power Engineering Co LTD
No ratings yet
C Epri Electric Power Engineering Co LTD
10 pages
Chapter 5
No ratings yet
Chapter 5
34 pages
2-nd-merit-list-notice-list-XI-Science
No ratings yet
2-nd-merit-list-notice-list-XI-Science
8 pages
Kesavananda Bharati v. State of Kerala
No ratings yet
Kesavananda Bharati v. State of Kerala
6 pages
Task 1 - Business Letter
No ratings yet
Task 1 - Business Letter
7 pages
Catheterization
No ratings yet
Catheterization
3 pages
Taurus Series Multimedia Player TB50 Specifications V1.0.4
No ratings yet
Taurus Series Multimedia Player TB50 Specifications V1.0.4
9 pages
Revision 6 - Schedule of Wall and Floor Fin
No ratings yet
Revision 6 - Schedule of Wall and Floor Fin
1 page
(VOLKSWAGEN) Sistema Electrico Volkswagen Jetta PDF
100% (1)
(VOLKSWAGEN) Sistema Electrico Volkswagen Jetta PDF
58 pages
DN 60772 PDF
No ratings yet
DN 60772 PDF
6 pages
Anilkumar Kanjibhai Patel (Mechanical Technician) Updated CV
No ratings yet
Anilkumar Kanjibhai Patel (Mechanical Technician) Updated CV
5 pages
Agent 17
No ratings yet
Agent 17
34 pages
Swconfig System Basics
No ratings yet
Swconfig System Basics
484 pages
Change Management Plan
0% (3)
Change Management Plan
2 pages
A Comparison Between Some Mechanical Properties of Self Compacting Concrete and Normal Concrete
No ratings yet
A Comparison Between Some Mechanical Properties of Self Compacting Concrete and Normal Concrete
13 pages
The RES Licensing Framework Under Greek Law
No ratings yet
The RES Licensing Framework Under Greek Law
13 pages
(Ebook) Sequence Alignment: Methods, Models, Concepts, and Strategies by Michael S. Rosenberg ISBN 9780520256972, 0520256972 instant download
100% (1)
(Ebook) Sequence Alignment: Methods, Models, Concepts, and Strategies by Michael S. Rosenberg ISBN 9780520256972, 0520256972 instant download
58 pages

Data_Mining_Key_Concepts

Uploaded by

Data_Mining_Key_Concepts

Uploaded by

a.

Draw the diagram for key steps of data mining

Key steps of data mining:

1. Data Cleaning: Remove noise and inconsistent data.

2. Data Integration: Combine data from multiple sources.

3. Data Selection: Select relevant data for analysis.

4. Data Transformation: Convert data into a suitable format.

5. Data Mining: Apply algorithms to extract patterns.

6. Pattern Evaluation: Identify interesting patterns.

7. Knowledge Presentation: Visualize the results.

b. Define the term Support and Confidence

Support: It is the frequency of an itemset appearing in the dataset.

Support(X) = Transactions containing X / Total transactions

Confidence: It measures the reliability of a rule, calculated as the proportion of transactions

containing both X and Y to those containing X.

Confidence(X -> Y) = Support(X U Y) / Support(X)

c. Explain Data Warehouse Process

The Data Warehouse process involves the following steps:

1. Data Extraction: Gather data from multiple sources.

2. Data Transformation: Clean and standardize data for consistency.

3. Data Loading: Store transformed data in the data warehouse.

d. Illustrate the Warehousing Strategy

A data warehousing strategy involves:

e. Write the statement for Apriori Algorithm

f. List out the drawbacks of k-mean algorithm

1. Requires pre-specifying the number of clusters (k).

2. Sensitive to initial cluster centroids and outliers.

3. Only works well with spherical clusters.

5. Inefficient with large datasets due to high computation cost.

g. Explain about the Classification

h. Discuss the Clustering

classification, clustering does not require labeled data.

Data mining is essential to:

1. Extract useful patterns and insights from large datasets.

2. Aid decision-making processes in business, healthcare, and education.

3. Detect fraud, predict trends, and improve efficiency in various domains.

4. Handle and analyze the growing volume of data effectively.

j. Write a short note on Binning

into bins or intervals. Methods include:

1. Equal-width binning: Divides data into bins of equal size.

You might also like