0% found this document useful (0 votes)

27 views

20 Cost Based Optimization Annotated

The document discusses cost-based query optimization and focuses on plan cost estimation. It explains that the database management system stores statistics about tables, attributes, and indexes to estimate the cost of executing a query plan. These statistics include the number of tuples and distinct values for attributes. It also discusses how to estimate the selectivity of different predicate types like equality, range, and complex predicates. The document notes limitations in assuming uniform data distributions and independent predicates. It introduces techniques like histograms and sampling to improve selectivity estimates.

Uploaded by

smumin011

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views

20 Cost Based Optimization Annotated

Uploaded by

smumin011

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 52

Cost-Based Query Optimization

Lecture 20: Cost-Based Query Optimization

1 / 52
Cost-Based Query Optimization Recap

Recap

2 / 52
Cost-Based Query Optimization Recap

Query Optimization

• Approach 1: Heuristics / Rules

▶ Rewrite the query to remove stupid / inefficient things.
▶ These techniques may need to examine catalog, but they do not need to examine data.
• Approach 2: Cost-based Search
▶ Use a model to estimate the cost of executing a plan.
▶ Evaluate multiple equivalent plans for a query and pick the one with the lowest cost.

3 / 52
Cost-Based Query Optimization Recap

Today’s Agenda

• Plan Cost Estimation

• Plan Enumeration

4 / 52
Cost-Based Query Optimization Plan Cost Estimation

Plan Cost Estimation

5 / 52
Cost-Based Query Optimization Plan Cost Estimation

Cost Estimation

• How long will a query take?

▶ CPU: Small cost; tough to estimate
▶ Disk: Number of block transfers
▶ Memory: Amount of DRAM used
▶ Network: Number of messages
• How many tuples will be read/written?
• It is too expensive to run every possible plan to determine this information, so the
DBMS need a way to derive this information. . .

6 / 52
Cost-Based Query Optimization Plan Cost Estimation

Statistics

• The DBMS stores internal statistics about tables, attributes, and indexes in its internal
catalog.
• Different systems update them at different times.
• Manual invocations:
▶ Postgres/SQLite: ANALYZE
▶ Oracle/MySQL: ANALYZE TABLE
▶ SQL Server: UPDATE STATISTICS
▶ DB2: RUNSTATS

7 / 52
Cost-Based Query Optimization Plan Cost Estimation

Statistics

• For each relation R, the DBMS maintains the following information:

▶ NR : Number of tuples in R.
▶ V(A, R): Number of distinct values for attribute A.

8 / 52
Cost-Based Query Optimization Plan Cost Estimation

Derivable Statistics

• The selection cardinality SC(A, R) is the average number of records with a value for
an attribute A is given by: NR / V(A, R)
• What could go wrong with this estimate?

9 / 52
Cost-Based Query Optimization Plan Cost Estimation

Derivable Statistics

• The selection cardinality SC(A, R) is the average number of records with a value for
an attribute A is given by: NR / V(A, R)
• Note that this assumes data uniformity.
▶ 10,000 students, 10 colleges – how many students in SCS?

10 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection Statistics

• Equality predicates on unique keys are easy to estimate.

• What about more complex predicates? What is their selectivity?
CREATE TABLE people (
id INT PRIMARY KEY,
val INT NOT NULL,
age INT NOT NULL,
status VARCHAR(16)
);
SELECT * FROM people WHERE id = 123 --- Easier
SELECT * FROM people WHERE val > 1000 --- Harder: Range predicate
SELECT * FROM people WHERE age = 30 AND status = 'Lit' --- Harder:
Complex predicate

11 / 52
Cost-Based Query Optimization Plan Cost Estimation

Complex Predicates

• The selectivity (sel) of a predicate P is the fraction of tuples that qualify.

• Formula depends on type of predicate:
▶ Equality
▶ Range
▶ Negation
▶ Conjunction
▶ Disjunction

12 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection – Complex Predicates

• Assume that V(age,people) has five distinct values (0–4) and NR = 5
• Equality Predicate: A=constant
▶ sel(A=constant) = SC(P) / NR
▶ Example: sel(age=2) = 1/5
SELECT * FROM people WHERE age = 2

13 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection – Complex Predicates

• Range Predicate:
▶ sel(A>=a) = (Amax – a) / (Amax – Amin )
▶ Example: sel(age>=2) ≈ (4 – 2) / (4 – 0) ≈ 1/2
SELECT * FROM people WHERE age >= 2

14 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection – Complex Predicates

• Negation Query:
▶ sel(not P) = 1 – sel(P)
▶ Example: sel(age != 2) = 1 – (1/5) = 4/5
• Observation: Selectivity ≈ Probability
SELECT * FROM people WHERE age != 2

15 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection – Complex Predicates

• Conjunction:
▶ sel(P1 ∧ P2) = sel(P1) × sel(P2)
▶ sel(age=2 ∧ name LIKE ’A%’)
• This assumes that the predicates are independent.
• Not always true in practice!
SELECT * FROM people WHERE age = 2 AND name LIKE 'A%'

16 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection – Complex Predicates

• Disjunction:
▶ sel(P1 ∨ P2) = sel(P1) + sel(P2) – sel(P1∧P2) = sel(P1) + sel(P2) – sel(P1) × sel(P2)
▶ sel(age=2 OR name LIKE ’A%’)
• This again assumes that the selectivities are independent.
SELECT * FROM people WHERE age = 2 OR name LIKE 'A%'

17 / 52
Cost-Based Query Optimization Plan Cost Estimation

Selection Cardinality

• Assumption 1: Uniform Data

▶ The distribution of values (except for the heavy hitters) is the same.
• Assumption 2: Independent Predicates
▶ The predicates on attributes are independent
• Assumption 3: Inclusion Principle
▶ The domain of join keys overlap such that each key in the inner relation will also exist in
the outer table.

18 / 52
Cost-Based Query Optimization Plan Cost Estimation

Correlated Attributes

• Consider a database of automobiles:

▶ Number of Makes = 10, Number of Models = 100
• And the following query: (make = ”Honda”ANDmodel = ”Accord”)
• With the independence and uniformity assumptions, the selectivity is:
▶ 1/10 × 1/100 = 0.001
• But since only Honda makes Accords, the real selectivity is 1/100 = 0.01

19 / 52
Cost-Based Query Optimization Plan Cost Estimation

Cost Estimation

• Our formulas are nice, but we assume that data values are uniformly distributed.

20 / 52
Cost-Based Query Optimization Plan Cost Estimation

Cost Estimation

• Our formulas are nice, but we assume that data values are uniformly distributed.

21 / 52
Cost-Based Query Optimization Plan Cost Estimation

Cost Estimation

• Our formulas are nice, but we assume that data values are uniformly distributed.

22 / 52
Cost-Based Query Optimization Plan Cost Estimation

Histograms With Quantiles

• Vary the width of buckets so that the total number of occurrences for each bucket is
roughly the same.

23 / 52
Cost-Based Query Optimization Plan Cost Estimation

Histograms With Quantiles

• Vary the width of buckets so that the total number of occurrences for each bucket is
roughly the same.

24 / 52
Cost-Based Query Optimization Plan Cost Estimation

Sampling

• Modern DBMSs also collect samples from tables to estimate selectivities.

• Update samples when the underlying tables changes significantly.
• Example: 1 billion tuples

SELECT AVG(age) FROM people WHERE age > 50

id name age status

1001 Shiyi 58 Senior
1002 Rahul 41 Sophomore
1003 Peter 25 Freshman
1004 Mark 25 Junior
1005 Alice 38 Senior

25 / 52
Cost-Based Query Optimization Plan Cost Estimation

Sampling

• Modern DBMSs also collect samples from tables to estimate selectivities.

• Update samples when the underlying tables changes significantly.
• Example: 1 billion tuples
• sel(age>50) = 1/3

SELECT AVG(age) FROM people WHERE age > 50

id name age status

1001 Shiyi 58 Senior
1003 Mark 25 Junior
1005 Alice 38 Senior

26 / 52
Cost-Based Query Optimization Plan Cost Estimation

Observation

• Now that we can (roughly) estimate the selectivity of predicates, what can we
actually do with them?

27 / 52
Cost-Based Query Optimization Plan Enumeration

Plan Enumeration

28 / 52
Cost-Based Query Optimization Plan Enumeration

Query Optimization

• After performing rule-based rewriting, the DBMS will enumerate different plans for
the query and estimate their costs.
▶ Single relation
▶ Multiple relations
• It chooses the best plan it has seen for the query after exhausting all plans or
some timeout.

29 / 52
Cost-Based Query Optimization Plan Enumeration

Single-Relation Query Planning

• Pick the best access method.

▶ Sequential Scan
▶ Binary Search (clustered indexes)
▶ Index Scan
• Predicate evaluation ordering.
• Simple heuristics are often good enough for this.
• OLTP queries are especially easy. . .

30 / 52
Cost-Based Query Optimization Plan Enumeration

OLTP Query Planning

• Query planning for OLTP queries is easy because they are sargable (Search Argument
Able).
▶ It is usually just picking the best index.
▶ Joins are almost always on foreign key relationships with a small cardinality.
▶ Can be implemented with simple heuristics.

CREATE TABLE people (

id INT PRIMARY KEY,
val INT NOT NULL,
);

SELECT * FROM people WHERE id = 123;

31 / 52
Cost-Based Query Optimization Plan Enumeration

Multi-Relation Query Planning

• As number of joins increases, number of alternative plans grows rapidly

▶ We need to restrict search space.
• Fundamental decision in System R: only left-deep join trees are considered.
▶ Modern DBMSs do not always make this assumption anymore.

32 / 52
Cost-Based Query Optimization Plan Enumeration

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

33 / 52
Cost-Based Query Optimization Plan Enumeration

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

34 / 52
Cost-Based Query Optimization Plan Enumeration

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

• Allows for fully pipelined plans where intermediate results are not written to temp
files.
▶ Not all left-deep trees are fully pipelined.

35 / 52
Cost-Based Query Optimization Plan Enumeration

Multi-Relation Query Planning

• Enumerate the orderings

▶ Example: Left-deep tree 1, Left-deep tree 2. . .
• Enumerate the physical join operator for each logical join operator
▶ Example: Hash, Sort-Merge, Nested Loop. . .
• Enumerate the access paths for each table
▶ Example: Index 1, Index 2, Seq Scan. . .
• Use dynamic programming to reduce the number of cost estimations.

36 / 52
Cost-Based Query Optimization Plan Enumeration

Dynamic Programming

37 / 52
Cost-Based Query Optimization Plan Enumeration

Dynamic Programming

38 / 52
Cost-Based Query Optimization Plan Enumeration

Dynamic Programming

39 / 52
Cost-Based Query Optimization Plan Enumeration

Dynamic Programming

40 / 52
Cost-Based Query Optimization Plan Enumeration

Dynamic Programming

41 / 52
Cost-Based Query Optimization Plan Enumeration

Candidate Plan Example

• How to generate plans for search algorithm:

▶ Enumerate relation orderings
▶ Enumerate join algorithm choices
▶ Enumerate access method choices
• No real DBMSs does it this way. It’s actually more messy. . .
SELECT * FROM R, S, T
WHERE R.a = S.a AND S.b = T.b

42 / 52
Cost-Based Query Optimization Plan Enumeration

Candidate Plans

• Step 1: Enumerate relation orderings

43 / 52
Cost-Based Query Optimization Plan Enumeration

Candidate Plans

• Step 2: Enumerate join algorithm choices

44 / 52
Cost-Based Query Optimization Plan Enumeration

Candidate Plans

• Step 3: Enumerate access method choices

45 / 52
Cost-Based Query Optimization Plan Enumeration

Postgres Optimizer

• Examines all types of join trees

▶ Left-deep, Right-deep, bushy
• Two optimizer implementations:
▶ Traditional Dynamic Programming Approach
▶ Genetic Query Optimizer (GEQO)
• Postgres uses the traditional algorithm when number of tables in query is less than 12
and switches to GEQO when there are 12 or more.

46 / 52
Cost-Based Query Optimization Plan Enumeration

Postgres Optimizer

47 / 52
Cost-Based Query Optimization Plan Enumeration

Postgres Optimizer

48 / 52
Cost-Based Query Optimization Plan Enumeration

Postgres Optimizer

49 / 52
Cost-Based Query Optimization Conclusion

Conclusion

50 / 52
Cost-Based Query Optimization Conclusion

Parting Thoughts

• Selectivity estimations
• Key assumptions in query optimization
▶ Uniformity
▶ Independence
▶ Histograms
▶ Join selectivity
• Dynamic programming for join orderings

51 / 52
Cost-Based Query Optimization Conclusion

Next Class

• Design Decisions in Query Optimization

52 / 52

Cellebrite Reader v7.60 Jan 2022 Eng PDF
No ratings yet
Cellebrite Reader v7.60 Jan 2022 Eng PDF
129 pages
Segmentation Analysis
No ratings yet
Segmentation Analysis
17 pages
100 Dataengineering Interview Questions TRRaveendra 1694654407
No ratings yet
100 Dataengineering Interview Questions TRRaveendra 1694654407
58 pages
Week6 Slides Updated
No ratings yet
Week6 Slides Updated
57 pages
SML 5
No ratings yet
SML 5
14 pages
2016 Electric Distribution Network Planning
No ratings yet
2016 Electric Distribution Network Planning
32 pages
An Introduction To Data Mining: Prof. S. Sudarshan CSE Dept, IIT Bombay
No ratings yet
An Introduction To Data Mining: Prof. S. Sudarshan CSE Dept, IIT Bombay
48 pages
15-optimization (1)
No ratings yet
15-optimization (1)
8 pages
oladapo omolade-1
No ratings yet
oladapo omolade-1
23 pages
003-KNN Complete Updated
No ratings yet
003-KNN Complete Updated
72 pages
An Introduction To Data Mining IIT Bombay
No ratings yet
An Introduction To Data Mining IIT Bombay
48 pages
ML (Interview)
No ratings yet
ML (Interview)
20 pages
Visual Data Mining: Concepts, Frameworks and Algorithm Development
No ratings yet
Visual Data Mining: Concepts, Frameworks and Algorithm Development
30 pages
Data Mining Unit 3
No ratings yet
Data Mining Unit 3
50 pages
2024 MTH058 Lecture07 FederatedLearning
No ratings yet
2024 MTH058 Lecture07 FederatedLearning
25 pages
ML - 5
No ratings yet
ML - 5
53 pages
003 KNN Complete
No ratings yet
003 KNN Complete
66 pages
DNN (1)
No ratings yet
DNN (1)
11 pages
Query Evaluation
No ratings yet
Query Evaluation
51 pages
Flexible Indexing With Postgres: Ruce Omjian
No ratings yet
Flexible Indexing With Postgres: Ruce Omjian
52 pages
DM - Ch4 - Classification (Part1)
No ratings yet
DM - Ch4 - Classification (Part1)
20 pages
meth_2024_part3_imput
No ratings yet
meth_2024_part3_imput
32 pages
CC - Unit IV - Chapters
No ratings yet
CC - Unit IV - Chapters
47 pages
Lecture Slides-Week15,16
No ratings yet
Lecture Slides-Week15,16
50 pages
Performance Comparison Between Naïve Bayes, Decision Tree and K-Nearest Neighbor in Searching Alternative Design in An Energy Simulation Tool
No ratings yet
Performance Comparison Between Naïve Bayes, Decision Tree and K-Nearest Neighbor in Searching Alternative Design in An Energy Simulation Tool
7 pages
Final Review
No ratings yet
Final Review
20 pages
ML Lecture06 Unsupervised Learning
No ratings yet
ML Lecture06 Unsupervised Learning
87 pages
Predicting Churn
No ratings yet
Predicting Churn
37 pages
Data Mining: Practical Machine Learning Tools and Techniques
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
69 pages
03 Advanced SQL Annotateddi
No ratings yet
03 Advanced SQL Annotateddi
77 pages
ENSEMBLE LEARNING-1
No ratings yet
ENSEMBLE LEARNING-1
61 pages
INT524 unit3
No ratings yet
INT524 unit3
35 pages
SSRN 3478927
No ratings yet
SSRN 3478927
40 pages
DDB Lec 4 PDF
No ratings yet
DDB Lec 4 PDF
69 pages
Sampling and Sampling Methods Dewi Rosmala
No ratings yet
Sampling and Sampling Methods Dewi Rosmala
21 pages
DWDM 4
No ratings yet
DWDM 4
58 pages
Clustering Dan Evaluasi
No ratings yet
Clustering Dan Evaluasi
35 pages
11 - Model Eval and Tuning
No ratings yet
11 - Model Eval and Tuning
17 pages
cluster analysis
No ratings yet
cluster analysis
34 pages
Data Warehousing and Mining
No ratings yet
Data Warehousing and Mining
14 pages
Esm570 04
No ratings yet
Esm570 04
32 pages
DADM S15 K-NN Classification
No ratings yet
DADM S15 K-NN Classification
13 pages
Unit 4 Clustering - K-Means and Hierarchical
No ratings yet
Unit 4 Clustering - K-Means and Hierarchical
40 pages
Mining Discriminative Patterns To Predict Health Status For Cardiopulmonary Patients
No ratings yet
Mining Discriminative Patterns To Predict Health Status For Cardiopulmonary Patients
56 pages
Chapter 9 PDF
No ratings yet
Chapter 9 PDF
25 pages
CS3491 - Aiml - Unit Iii Supervised Learning
No ratings yet
CS3491 - Aiml - Unit Iii Supervised Learning
162 pages
PSY - 2060 - 2022H1 - Session 01 2022-01-19 02 - 39 - 01
No ratings yet
PSY - 2060 - 2022H1 - Session 01 2022-01-19 02 - 39 - 01
24 pages
UNIT03
No ratings yet
UNIT03
52 pages
Real WorldDatabasePerformanceTechniques
No ratings yet
Real WorldDatabasePerformanceTechniques
70 pages
Cost Estimating Module
No ratings yet
Cost Estimating Module
51 pages
L3 Overview of ML Model Development Lifecycle-1
No ratings yet
L3 Overview of ML Model Development Lifecycle-1
30 pages
MLT Unit 3
100% (1)
MLT Unit 3
38 pages
Chapter 06 Linear Reg
No ratings yet
Chapter 06 Linear Reg
24 pages
Kami Export - Obtaining Data
No ratings yet
Kami Export - Obtaining Data
63 pages
What Is A Decision Tree ?: - Decision Tree Is A Classifier in The Form of A Tree Structure, Where Each Node Is Either
No ratings yet
What Is A Decision Tree ?: - Decision Tree Is A Classifier in The Form of A Tree Structure, Where Each Node Is Either
18 pages
Chapter 9 - Learning Techniques
No ratings yet
Chapter 9 - Learning Techniques
25 pages
Decision Tree Learning
No ratings yet
Decision Tree Learning
15 pages
UNIT IV Non Parametric Methods
No ratings yet
UNIT IV Non Parametric Methods
37 pages
Week12_PCA_BayesianInference_before_lecture
No ratings yet
Week12_PCA_BayesianInference_before_lecture
82 pages
Lecture 03 Bayes Classifier With Prob Concepts
No ratings yet
Lecture 03 Bayes Classifier With Prob Concepts
70 pages
Evaluating Hedge Fund and CTA Performance: Data Envelopment Analysis Approach
From Everand
Evaluating Hedge Fund and CTA Performance: Data Envelopment Analysis Approach
Greg N. Gregoriou
No ratings yet
AP Statistics Flashcards, Fifth Edition: Up-to-Date Practice
From Everand
AP Statistics Flashcards, Fifth Edition: Up-to-Date Practice
Barron's Educational Series
No ratings yet
Step by Step Guide: Excel Pivot Tables
No ratings yet
Step by Step Guide: Excel Pivot Tables
11 pages
NAS RRC UsersGuide
No ratings yet
NAS RRC UsersGuide
14 pages
Spring Framework Cookbook PDF
100% (2)
Spring Framework Cookbook PDF
194 pages
Voyager 9520/40 Voyager GS9590 Eclipse 5145: Quick Start Guide
No ratings yet
Voyager 9520/40 Voyager GS9590 Eclipse 5145: Quick Start Guide
16 pages
Task 1
No ratings yet
Task 1
7 pages
Section A (40 Marks) Answer All The in Anwers Sheet Given QUESTION 1-15: Choose The Best Answer
No ratings yet
Section A (40 Marks) Answer All The in Anwers Sheet Given QUESTION 1-15: Choose The Best Answer
8 pages
Datastage Designer
No ratings yet
Datastage Designer
322 pages
BiosSettingsWindows User's Guide
No ratings yet
BiosSettingsWindows User's Guide
9 pages
Difference Between Data Mining and Data Warehouse Data Warehouse
No ratings yet
Difference Between Data Mining and Data Warehouse Data Warehouse
4 pages
Ram Manohar Bheemana: Contact About Me
No ratings yet
Ram Manohar Bheemana: Contact About Me
7 pages
Ebook PE Query Optimization
No ratings yet
Ebook PE Query Optimization
59 pages
Ad Patch
100% (1)
Ad Patch
7 pages
Components of A C Program (Part 3)
No ratings yet
Components of A C Program (Part 3)
25 pages
1 Class:: Transistor
No ratings yet
1 Class:: Transistor
32 pages
Status Code 42
No ratings yet
Status Code 42
3 pages
Module 5 Lab: Implementing Data Integrity: Exercise 1: Creating Constraints
No ratings yet
Module 5 Lab: Implementing Data Integrity: Exercise 1: Creating Constraints
9 pages
IMP6
No ratings yet
IMP6
60 pages
DB2 Load
No ratings yet
DB2 Load
20 pages
Windows Rootkits A Game of "Hide and Seek"
No ratings yet
Windows Rootkits A Game of "Hide and Seek"
28 pages
ACN Shaikh Osama Mohammed Arif (1905690090)
No ratings yet
ACN Shaikh Osama Mohammed Arif (1905690090)
130 pages
For Finding Length of Array.: Java Cheat Sheet
No ratings yet
For Finding Length of Array.: Java Cheat Sheet
4 pages
WD1006-WAH OEM Manual 198706
No ratings yet
WD1006-WAH OEM Manual 198706
45 pages
JAVA Cheat Sheet: by Via
No ratings yet
JAVA Cheat Sheet: by Via
1 page
ManuallyDeleteDS Job
No ratings yet
ManuallyDeleteDS Job
11 pages
Microprocessor & Microcontroller Lab Manual: For Second Year B.E-CSE Students
No ratings yet
Microprocessor & Microcontroller Lab Manual: For Second Year B.E-CSE Students
106 pages
ID3 Algorithm: Abbas Rizvi CS157 B Spring 2010
No ratings yet
ID3 Algorithm: Abbas Rizvi CS157 B Spring 2010
19 pages
UNIX Getconfig
No ratings yet
UNIX Getconfig
6 pages
WickedWhims 4.3.5.142d Exception
No ratings yet
WickedWhims 4.3.5.142d Exception
7 pages

20 Cost Based Optimization Annotated

Uploaded by

20 Cost Based Optimization Annotated

Uploaded by

Cost-Based Query Optimization

Lecture 20: Cost-Based Query Optimization

• Approach 1: Heuristics / Rules

• Plan Cost Estimation

Plan Cost Estimation

• How long will a query take?

• For each relation R, the DBMS maintains the following information:

• Equality predicates on unique keys are easy to estimate.

• The selectivity (sel) of a predicate P is the fraction of tuples that qualify.

Selection – Complex Predicates

Selection – Complex Predicates

Selection – Complex Predicates

Selection – Complex Predicates

Selection – Complex Predicates

• Assumption 1: Uniform Data

• Consider a database of automobiles:

Histograms With Quantiles

Histograms With Quantiles

• Modern DBMSs also collect samples from tables to estimate selectivities.

SELECT AVG(age) FROM people WHERE age > 50

id name age status

• Modern DBMSs also collect samples from tables to estimate selectivities.

SELECT AVG(age) FROM people WHERE age > 50

id name age status

Single-Relation Query Planning

• Pick the best access method.

OLTP Query Planning

CREATE TABLE people (

SELECT * FROM people WHERE id = 123;

Multi-Relation Query Planning

• As number of joins increases, number of alternative plans grows rapidly

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

Multi-Relation Query Planning

• Fundamental decision in System R: Only consider left-deep join trees.

Multi-Relation Query Planning

• Enumerate the orderings

Candidate Plan Example

• How to generate plans for search algorithm:

• Step 1: Enumerate relation orderings

• Step 2: Enumerate join algorithm choices

• Step 3: Enumerate access method choices

• Examines all types of join trees

• Design Decisions in Query Optimization

You might also like