5 knowledge representation

Uploaded by

saharsh0812

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

37 views

5 knowledge representation

Uploaded by

saharsh0812

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 19

KNOWLEDGE

REPRESENTATION
Knowledge Representation
• Knowledge representation is the presentation of knowledge to the user for
visualization in terms of trees, tables, rules graphs, charts, matrices, etc.
• For Example: Histograms
Data Mining Task Primitives
A data mining task can be specified in the form of a data mining query, which is
input to the data mining system.

A data mining query is defined in terms of data mining task primitives. These
primitives allow the user to interactively communicate with the data mining system
during discovery in order to direct the mining process, or examine the findings from
different angles or depths
The data mining primitives specify the
following
• The set of task-relevant data to be mined: This specifies the portions of the
database or the set of data in which the user is interested. This includes the
database attributes or data warehouse dimensions of interest (referred to as the
relevant attributes or dimensions).
• The kind of knowledge to be mined: This specifies the data mining functions to be
performed, such as characterization, discrimination, association or correlation
analysis, classification, prediction, clustering, outlier analysis, or evolution
analysis.
• The background knowledge to be used in the discovery process: This knowledge
about the domain to be mined is useful for guiding the knowledge discovery
process and for evaluating the patterns found. Concept hierarchies are a popular
form of background knowledge, which allow data to be mined at multiple levels of
abstraction.
• The interestingness measures and thresholds for pattern evaluation: They may be
used to guide the mining process or, after discovery, to evaluate the discovered
patterns. Different kinds of knowledge may have different interestingness
measures.

• The expected representation for visualizing the discovered patterns: This refers to
the form in which discovered patterns are to be displayed, which may include
rules, tables, charts, graphs, decision trees, and cubes.

• A data mining query language can be designed to incorporate these primitives,

allowing users to flexibly interact with data mining systems.
Data Mining Tasks
Since the data mining process breaks up the overall task of finding patterns from
data into a set of well-defined subtasks, it is also useful for structuring discussions
about data science.

Data scientists decompose a business problem into subtasks. The solutions to the
subtasks can then be composed to solve the overall problem. Some of these
subtasks are unique to the particular business problem, but others are common data
mining tasks.
Data Mining Tasks
• Classification (class probability estimation)
• Clustering
• Regression
• Co-occurrence grouping (association rules)
• Data reduction
Task Relevant Data
Task relevant data: where and how to retrieve the data to be used for mining.

• Database or data warehouse name: where to find the data

• Database tables or data warehouse cubes
• Condition for data selection, relevant attributes or dimensions and data grouping
criteria: all this is used in the SQL query to retrieve the data
Background knowledge: Concept
hierarchies
• Schema hierarchy
• Set grouping hierarchy
• Operation driven hierarchy
• Rule-based hierarchy
Data Visualization
• It deals with the representation of data in a graphical or pictorial format.
• Patterns in the data are marked easily by using the data visualization technique.

Why visualize data?

• Identifying problems:
– Histograms for nominal attributes: is the distribution consistent with
background knowledge?
– Graphs for numeric values: detecting outliers.

• Visualization show dependencies

Visualization Techniques
1. Pixel- oriented visualization technique
2. Geometric projection visualization technique
3. Icon-based visualization techniques
4. Hierarchical visualization techniques
Pixel- oriented visualization technique
• In pixel based visualization techniques, there are separate sub-windows for the
value of each attribute and it is represented by one colored pixel.
• Tuple with 'm' variable has different 'm' colored pixel to represent each variable
and each variable has a sub window.
• The color mapping of the pixel is decided on the basis of data characteristics and
visualization tasks.
Geometric projection visualization
technique
Techniques used to find geometric transformation are:

i. Scatter-plot matrices
• It consists of scatter plots of all possible pairs of variables in a dataset.

ii. Hyper slice

• It is an extension to scatter-plot matrices. They represent multi-
dimensional function as a matrix of orthogonal two dimensional slices.

iii. Parallel co-ordinates

• The parallel vertical lines which are separated defines the axes.
Icon-based visualization techniques
• Icon-based visualization techniques are also known as iconic display techniques.
• Each multidimensional data item is mapped to an icon.
• This technique allows visualization of large amount of data.
• The most commonly used technique is Chernoff faces.
Hierarchical visualization techniques
• Hierarchical visualization techniques are used for partitioning of all dimensions in
to subset.
• These subsets are visualized in hierarchical manner.

i. Dimensional stacking
In dimension stacking, n-dimensional attribute space is partitioned in 2-dimensional
subspaces.
Attribute values are partitioned into various classes.
Each element is two dimensional space in the form of xy plot.
ii. Mosaic plot
Mosaic plot gives the graphical representation of
successive decompositions.
Rectangles are used to represent the count of categorical
data and at every stage, rectangles are split parallel.
iii. Worlds within worlds
Worlds within worlds are useful to generate an interactive hierarchy of display.
Innermost word must have a function and two most important parameters.
Through this, N-vision of data are possible like data glove and stereo displays, including
rotation, scaling (inner) and translation (inner/outer).
iv. Tree maps
Tree maps visualization techniques are well suited for displaying large amount of hierarchical
structured data.
The visualization space is divided into the multiple rectangles that are ordered, according to a
quantitative variable.
The levels in the hierarchy are seen as rectangles containing the other rectangle.
Each set of rectangles on the same level in the hierarchy represents a category, a column or an
expression in a data set.

ServiceNow Certified System Administrator CSA Practice Test Set 8
No ratings yet
ServiceNow Certified System Administrator CSA Practice Test Set 8
101 pages
DM Unit 3
No ratings yet
DM Unit 3
18 pages
DA UNIT 5
No ratings yet
DA UNIT 5
11 pages
Data Analytics - Unit-V
No ratings yet
Data Analytics - Unit-V
9 pages
L5 Data Visualization
No ratings yet
L5 Data Visualization
33 pages
U1 - Data Mining Task Primitives
No ratings yet
U1 - Data Mining Task Primitives
4 pages
5 Da
No ratings yet
5 Da
6 pages
Week 02.1 Chaptr002
No ratings yet
Week 02.1 Chaptr002
29 pages
IDS Unit 5 Visualization
No ratings yet
IDS Unit 5 Visualization
24 pages
Knowledge Representation in Data Mining
No ratings yet
Knowledge Representation in Data Mining
22 pages
DA Unit-5
No ratings yet
DA Unit-5
6 pages
02 Data
No ratings yet
02 Data
42 pages
Chapter 2-Getting To Know Your Data
No ratings yet
Chapter 2-Getting To Know Your Data
23 pages
Unit 4 Part A
No ratings yet
Unit 4 Part A
51 pages
Data Mining Primitives, Languages and System Architecture
No ratings yet
Data Mining Primitives, Languages and System Architecture
64 pages
Data Visualization
No ratings yet
Data Visualization
23 pages
Data Visualization 1
No ratings yet
Data Visualization 1
5 pages
DVP 3
No ratings yet
DVP 3
97 pages
DA UNIT- V
No ratings yet
DA UNIT- V
14 pages
FDS Notes 3
No ratings yet
FDS Notes 3
6 pages
Chapter 3 Non Spatial Data Visualization
No ratings yet
Chapter 3 Non Spatial Data Visualization
45 pages
Data Preprocessing
No ratings yet
Data Preprocessing
76 pages
Data Mining Primitives, Languages and System Architecture
No ratings yet
Data Mining Primitives, Languages and System Architecture
64 pages
Data Visulization Techniques
No ratings yet
Data Visulization Techniques
10 pages
DM14 Visualisation
100% (1)
DM14 Visualisation
67 pages
8clst
No ratings yet
8clst
100 pages
Data Mining Task Primitives and Major Issues
No ratings yet
Data Mining Task Primitives and Major Issues
18 pages
Data Visualization Unit-V 21.11.24
No ratings yet
Data Visualization Unit-V 21.11.24
69 pages
Unit-2 data Mining
No ratings yet
Unit-2 data Mining
23 pages
Applications and Trends in Data Mining: - Chapter 11
No ratings yet
Applications and Trends in Data Mining: - Chapter 11
63 pages
Unit - 2 Pca20g02t.docx
No ratings yet
Unit - 2 Pca20g02t.docx
15 pages
Visualization
No ratings yet
Visualization
15 pages
unit-5
No ratings yet
unit-5
15 pages
DWDM-LS2-Fall-24-25
No ratings yet
DWDM-LS2-Fall-24-25
42 pages
Concepts and Techniques: - Chapter 7
No ratings yet
Concepts and Techniques: - Chapter 7
123 pages
Da Unit-5
100% (1)
Da Unit-5
19 pages
Data Science Four Marks Qa
No ratings yet
Data Science Four Marks Qa
4 pages
02 Data
No ratings yet
02 Data
47 pages
Data Mining and Data Warehousing Notes ct1
No ratings yet
Data Mining and Data Warehousing Notes ct1
12 pages
A Preliminary Exploration of The Data To Better Understand Its Characteristics
No ratings yet
A Preliminary Exploration of The Data To Better Understand Its Characteristics
35 pages
Unit III
No ratings yet
Unit III
105 pages
Data Mining Primitives, Languages and System Architecture
No ratings yet
Data Mining Primitives, Languages and System Architecture
26 pages
Mining Using Genitic Algorithms
No ratings yet
Mining Using Genitic Algorithms
7 pages
Outlier Analysis
No ratings yet
Outlier Analysis
104 pages
Ch-4 Data Mining Knowledge Representation Premitives
No ratings yet
Ch-4 Data Mining Knowledge Representation Premitives
16 pages
Data Visualization
No ratings yet
Data Visualization
14 pages
Data Analytics-Data Visualization UNIT-V
No ratings yet
Data Analytics-Data Visualization UNIT-V
11 pages
Data Mining Primitives
No ratings yet
Data Mining Primitives
39 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
22 pages
Concepts and Techniques: Data Mining
No ratings yet
Concepts and Techniques: Data Mining
101 pages
Data Mining Issues and Tasks
No ratings yet
Data Mining Issues and Tasks
5 pages
Data Visualization Tech.
No ratings yet
Data Visualization Tech.
6 pages
Data Analytics - Unit 5 (22IT513PE)
No ratings yet
Data Analytics - Unit 5 (22IT513PE)
46 pages
Chapter-1 - Introduction To Data Mining
No ratings yet
Chapter-1 - Introduction To Data Mining
10 pages
What Is Cluster Analysis?: Unsupervised Learning Stand-Alone Tool Preprocessing Step
No ratings yet
What Is Cluster Analysis?: Unsupervised Learning Stand-Alone Tool Preprocessing Step
21 pages
Cda U2 Visualization
No ratings yet
Cda U2 Visualization
38 pages
Data Visualization Techniques: Dr. D. Koteswara Rao
No ratings yet
Data Visualization Techniques: Dr. D. Koteswara Rao
41 pages
Data Mining and Visualization of Large Databases
No ratings yet
Data Mining and Visualization of Large Databases
20 pages
Data Visualization 13
No ratings yet
Data Visualization 13
26 pages
Basic Concepts in Data Structures
From Everand
Basic Concepts in Data Structures
K.Meenendranath Reddy
No ratings yet
Data Structures and Algorithm
From Everand
Data Structures and Algorithm
Knowledge Flow
No ratings yet
Normalization Example
No ratings yet
Normalization Example
14 pages
KSession 3
No ratings yet
KSession 3
15 pages
The Buffer Manager of A DBMS
100% (8)
The Buffer Manager of A DBMS
7 pages
Dbms Riddhi
100% (1)
Dbms Riddhi
64 pages
Spring Boot REST CRUD Application With POSTMAN Client
No ratings yet
Spring Boot REST CRUD Application With POSTMAN Client
6 pages
Student Record Keeping System Database: Team Members
No ratings yet
Student Record Keeping System Database: Team Members
27 pages
ArcGIS - Basics - India - World - Data - Final - GIS Center Version PDF
No ratings yet
ArcGIS - Basics - India - World - Data - Final - GIS Center Version PDF
37 pages
Unit-3 Relational Data Model
No ratings yet
Unit-3 Relational Data Model
24 pages
17CS81 IOT Notes Module4
No ratings yet
17CS81 IOT Notes Module4
17 pages
MS805 Course Outline 2022-23
No ratings yet
MS805 Course Outline 2022-23
3 pages
Backup & Recovery
No ratings yet
Backup & Recovery
28 pages
B.Tech - CS - Design 3rd Year Year 2023-24
No ratings yet
B.Tech - CS - Design 3rd Year Year 2023-24
33 pages
Garments Factory Management
No ratings yet
Garments Factory Management
41 pages
Sumit Meshram Resume
No ratings yet
Sumit Meshram Resume
2 pages
Henry Books
No ratings yet
Henry Books
3 pages
DF100 - 04 - Storage and Retrieval With Arrays
No ratings yet
DF100 - 04 - Storage and Retrieval With Arrays
41 pages
Sathish Resume-3
No ratings yet
Sathish Resume-3
3 pages
Mindorks Android Online Professional Course - Syllabus
No ratings yet
Mindorks Android Online Professional Course - Syllabus
7 pages
DBMS Min PJT Final Report
No ratings yet
DBMS Min PJT Final Report
41 pages
FCP_FAZ_AD-7.4-Questions
No ratings yet
FCP_FAZ_AD-7.4-Questions
13 pages
Pro SQL Server 2019 Wait Statistics: A Practical Guide to Analyzing Performance in SQL Server - Second Edition Enrico Van De Laar download
100% (1)
Pro SQL Server 2019 Wait Statistics: A Practical Guide to Analyzing Performance in SQL Server - Second Edition Enrico Van De Laar download
41 pages
Karishma Panduri CV
No ratings yet
Karishma Panduri CV
2 pages
de 5
No ratings yet
de 5
1 page
Procedure: 1
No ratings yet
Procedure: 1
29 pages
Introduction To Database Systems CSE 344: Basic Query Evaluation and Indexes
No ratings yet
Introduction To Database Systems CSE 344: Basic Query Evaluation and Indexes
38 pages
Resume Anitha
No ratings yet
Resume Anitha
3 pages
Histogram From Raw Data: Frequency
No ratings yet
Histogram From Raw Data: Frequency
2 pages
Creating Natively Compiled Stored Procedures
No ratings yet
Creating Natively Compiled Stored Procedures
2 pages
How Do I Do That in Spatialite/Sqlite: Illustrating Classic Gis Tasks
No ratings yet
How Do I Do That in Spatialite/Sqlite: Illustrating Classic Gis Tasks
27 pages

5 knowledge representation

Uploaded by

5 knowledge representation

Uploaded by

KNOWLEDGE

• A data mining query language can be designed to incorporate these primitives,

• Database or data warehouse name: where to find the data

Why visualize data?

• Visualization show dependencies

ii. Hyper slice

iii. Parallel co-ordinates

You might also like