100% found this document useful (2 votes)
18 views

Instant download Cause and correlation in biology a user s guide to path analysis structural equations and causal inference Hernan M.A. pdf all chapter

Hernan

Uploaded by

peachgsell5r
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (2 votes)
18 views

Instant download Cause and correlation in biology a user s guide to path analysis structural equations and causal inference Hernan M.A. pdf all chapter

Hernan

Uploaded by

peachgsell5r
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 65

Download the Full Version of textbook for Fast Typing at textbookfull.

com

Cause and correlation in biology a user s guide to


path analysis structural equations and causal
inference Hernan M.A.

https://textbookfull.com/product/cause-and-correlation-in-
biology-a-user-s-guide-to-path-analysis-structural-
equations-and-causal-inference-hernan-m-a/

OR CLICK BUTTON

DOWNLOAD NOW

Download More textbook Instantly Today - Get Yours Now at textbookfull.com


Recommended digital products (PDF, EPUB, MOBI) that
you can download immediately if you are interested.

Because without cause: non-causal explanations in science


and mathematics 1st Edition Marc Lange

https://textbookfull.com/product/because-without-cause-non-causal-
explanations-in-science-and-mathematics-1st-edition-marc-lange/

textboxfull.com

A Buyer s and User s Guide to Astronomical Telescopes


Binoculars 2007th Edition Mullaney James

https://textbookfull.com/product/a-buyer-s-and-user-s-guide-to-
astronomical-telescopes-binoculars-2007th-edition-mullaney-james/

textboxfull.com

Introduction To Statistical Decision Theory: Utility


Theory And Causal Analysis Silvia Bacci

https://textbookfull.com/product/introduction-to-statistical-decision-
theory-utility-theory-and-causal-analysis-silvia-bacci/

textboxfull.com

An Econometric Model of the US Economy: Structural


Analysis in 56 Equations John J. Heim

https://textbookfull.com/product/an-econometric-model-of-the-us-
economy-structural-analysis-in-56-equations-john-j-heim/

textboxfull.com
A Student s Guide to Dimensional Analysis Lemons

https://textbookfull.com/product/a-student-s-guide-to-dimensional-
analysis-lemons/

textboxfull.com

The PROACT root cause analysis: quick reference guide


First Edition Latino

https://textbookfull.com/product/the-proact-root-cause-analysis-quick-
reference-guide-first-edition-latino/

textboxfull.com

The Brain A User s Manual A simple guide to the world s


most complex machine Marco Magrini

https://textbookfull.com/product/the-brain-a-user-s-manual-a-simple-
guide-to-the-world-s-most-complex-machine-marco-magrini/

textboxfull.com

Sharia Compliant A User s Guide to Hacking Islamic Law 1st


Edition Rumee Ahmed

https://textbookfull.com/product/sharia-compliant-a-user-s-guide-to-
hacking-islamic-law-1st-edition-rumee-ahmed/

textboxfull.com

Quasi Experimentation A Guide to Design and Analysis 1st


Edition Charles S Reichardt

https://textbookfull.com/product/quasi-experimentation-a-guide-to-
design-and-analysis-1st-edition-charles-s-reichardt/

textboxfull.com
Causal Inference

Miguel A. Hernán, James M. Robins

February 10, 2019


ii Causal Inference
Contents

Introduction: Towards less casual causal inferences v

I Causal inference without models 1


1 A definition of causal effect 3
1.1 Individual causal effects . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Average causal effects . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Measures of causal effect . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Random variability . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Causation versus association . . . . . . . . . . . . . . . . . . . . 10

2 Randomized experiments 13
2.1 Randomization . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Conditional randomization . . . . . . . . . . . . . . . . . . . . . 17
2.3 Standardization . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4 Inverse probability weighting . . . . . . . . . . . . . . . . . . . . 20

3 Observational studies 25
3.1 Identifiability conditions . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Exchangeability . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3 Positivity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Consistency: First, define the counterfactual outcome . . . . . . 31
3.5 Consistency: Second, link to the data . . . . . . . . . . . . . . . 35
3.6 The target trial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4 Effect modification 41
4.1 Definition of effect modification . . . . . . . . . . . . . . . . . . . 41
4.2 Stratification to identify effect modification . . . . . . . . . . . . 43
4.3 Why care about effect modification . . . . . . . . . . . . . . . . . 45
4.4 Stratification as a form of adjustment . . . . . . . . . . . . . . . 47
4.5 Matching as another form of adjustment . . . . . . . . . . . . . . 49
4.6 Effect modification and adjustment methods . . . . . . . . . . . 50

5 Interaction 55
5.1 Interaction requires a joint intervention . . . . . . . . . . . . . . 55
5.2 Identifying interaction . . . . . . . . . . . . . . . . . . . . . . . . 56
5.3 Counterfactual response types and interaction . . . . . . . . . . . 58
5.4 Sufficient causes . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.5 Sufficient cause interaction . . . . . . . . . . . . . . . . . . . . . 63
5.6 Counterfactuals or sufficient-component causes? . . . . . . . . . . 65
iv Causal Inference

6 Graphical representation of causal effects 69


6.1 Causal diagrams . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.2 Causal diagrams and marginal independence . . . . . . . . . . . 72
6.3 Causal diagrams and conditional independence . . . . . . . . . . 73
6.4 Positivity and well-defined interventions in causal diagrams . . . 75
6.5 A structural classification of bias . . . . . . . . . . . . . . . . . . 79
6.6 The structure of effect modification . . . . . . . . . . . . . . . . . 80

7 Confounding 83
7.1 The structure of confounding . . . . . . . . . . . . . . . . . . . . 83
7.2 Confounding and exchangeability . . . . . . . . . . . . . . . . . . 85
7.3 Confounders . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.4 Single-world intervention graphs . . . . . . . . . . . . . . . . . . 91
7.5 How to adjust for confounding . . . . . . . . . . . . . . . . . . . 93

8 Selection bias 97
8.1 The structure of selection bias . . . . . . . . . . . . . . . . . . . 97
8.2 Examples of selection bias . . . . . . . . . . . . . . . . . . . . . . 99
8.3 Selection bias and confounding . . . . . . . . . . . . . . . . . . . 101
8.4 Selection bias and censoring . . . . . . . . . . . . . . . . . . . . . 103
8.5 How to adjust for selection bias . . . . . . . . . . . . . . . . . . . 105
8.6 Selection without bias . . . . . . . . . . . . . . . . . . . . . . . . 108

9 Measurement bias 111


9.1 Measurement error . . . . . . . . . . . . . . . . . . . . . . . . . . 111
9.2 The structure of measurement error . . . . . . . . . . . . . . . . 112
9.3 Mismeasured confounders . . . . . . . . . . . . . . . . . . . . . . 114
9.4 Intention-to-treat effect: the effect of a misclassified treatment . 115
9.5 Per-protocol effect . . . . . . . . . . . . . . . . . . . . . . . . . . 117

10 Random variability 121


10.1 Identification versus estimation . . . . . . . . . . . . . . . . . . 121
10.2 Estimation of causal effects . . . . . . . . . . . . . . . . . . . . 124
10.3 The myth of the super-population . . . . . . . . . . . . . . . . . 126
10.4 The conditionality “principle” . . . . . . . . . . . . . . . . . . . 127
10.5 The curse of dimensionality . . . . . . . . . . . . . . . . . . . . 131
viii Causal Inference
Part I
Causal inference without models
Chapter 1
A DEFINITION OF CAUSAL EFFECT

By reading this book you are expressing an interest in learning about causal inference. But, as a human being,
you have already mastered the fundamental concepts of causal inference. You certainly know what a causal effect
is; you clearly understand the difference between association and causation; and you have used this knowledge
constantly throughout your life. In fact, had you not understood these causal concepts, you would have not
survived long enough to read this chapter–or even to learn to read. As a toddler you would have jumped right
into the swimming pool after observing that those who did so were later able to reach the jam jar. As a teenager,
you would have skied down the most dangerous slopes after observing that those who did so were more likely to
win the next ski race. As a parent, you would have refused to give antibiotics to your sick child after observing
that those children who took their medicines were less likely to be playing in the park the next day.
Since you already understand the definition of causal effect and the difference between association and cau-
sation, do not expect to gain deep conceptual insights from this chapter. Rather, the purpose of this chapter is
to introduce mathematical notation that formalizes the causal intuition that you already possess. Make sure that
you can match your causal intuition with the mathematical notation introduced here. This notation is necessary
to precisely define causal concepts, and we will use it throughout the book.

1.1 Individual causal effects


Zeus is a patient waiting for a heart transplant. On January 1, he receives
a new heart. Five days later, he dies. Imagine that we can somehow know,
perhaps by divine revelation, that had Zeus not received a heart transplant
on January 1, he would have been alive five days later. Equipped with this
information most would agree that the transplant caused Zeus’s death. The
heart transplant intervention had a causal effect on Zeus’s five-day survival.
Another patient, Hera, also received a heart transplant on January 1. Five
days later she was alive. Imagine we can somehow know that, had Hera not
received the heart on January 1, she would still have been alive five days later.
Hence the transplant did not have a causal effect on Hera’s five-day survival.
These two vignettes illustrate how humans reason about causal effects:
We compare (usually only mentally) the outcome when an action  is taken
with the outcome when the action  is withheld. If the two outcomes differ,
we say that the action  has a causal effect, causative or preventive, on the
outcome. Otherwise, we say that the action  has no causal effect on the
outcome. Epidemiologists, statisticians, economists, and other social scientists
often refer to the action  as an intervention, an exposure, or a treatment.
To make our causal intuition amenable to mathematical and statistical
analysis we will introduce some notation. Consider a dichotomous treatment
variable  (1: treated, 0: untreated) and a dichotomous outcome variable 
Capital letters represent random (1: death, 0: survival). In this book we refer to variables such as  and 
variables. Lower case letters denote that may have different values for different individuals as random variables.
particular values of a random vari- Let  =1 (read  under treatment  = 1) be the outcome variable that would
able. have been observed under the treatment value  = 1, and  =0 (read  under
treatment  = 0) the outcome variable that would have been observed under
4 Causal Inference

the treatment value  = 0.  =1 and  =0 are also random variables. Zeus
Sometimes we abbreviate the ex- has  =1 = 1 and  =0 = 0 because he died when treated but would have
pression “individual  has outcome survived if untreated, while Hera has  =1 = 0 and  =0 = 0 because she
  = 1” by writing  = 1. Tech- survived when treated and would also have survived if untreated.
nically, when  refers to a specific We can now provide a formal definition of a causal effect for an individ-
individual, such as Zeus,  is not ual : the treatment  has a causal effect on an individual’s outcome  if
a random variable because we are  =1 6=  =0 for the individual. Thus the treatment has a causal effect on
assuming that individual counter- Zeus’s outcome because  =1 = 1 6= 0 =  =0 , but not on Hera’s outcome
factual outcomes are deterministic because  =1 = 0 =  =0 . The variables  =1 and  =0 are referred to
(see Technical Point 1.2). as potential outcomes or as counterfactual outcomes. Some authors prefer the
Causal effect for individual : term “potential outcomes” to emphasize that, depending on the treatment that
=1 6= =0 is received, either of these two outcomes can be potentially observed. Other
authors prefer the term “counterfactual outcomes” to emphasize that these
outcomes represent situations that may not actually occur (that is, counter to
the fact situations).
For each individual, one of the counterfactual outcomes–the one that cor-
responds to the treatment value that the individual actually received–is ac-
tually factual. For example, because Zeus was actually treated ( = 1), his
counterfactual outcome under treatment  =1 = 1 is equal to his observed
(actual) outcome  = 1. That is, an individual with observed treatment 
equal to , has observed outcome  equal to his counterfactual outcome   .
This equality can be succinctly expressed as  =   where   denotes the
counterfactual   evaluated at the value  corresponding to the individual’s
Consistency: observed treatment . The equality  =   is referred to as consistency.
if  = , then  =   =  Individual causal effects are defined as a contrast of the values of counterfac-
tual outcomes, but only one of those outcomes is observed for each individual–
the one corresponding to the treatment value actually experienced by the in-
dividual. All other counterfactual outcomes remain unobserved. The unhappy
conclusion is that, in general, individual causal effects cannot be identified–
that is, cannot be expressed as a function of the observed data–because of
missing data. (See Fine Point 2.1 for a possible exception.)

1.2 Average causal effects


We needed three pieces of information to define an individual causal effect: an
outcome of interest, the actions  = 1 and  = 0 to be compared, and the
individual whose counterfactual outcomes  =0 and  =1 are to be compared.
However, because identifying individual causal effects is generally not possible,
we now turn our attention to an aggregated causal effect: the average causal
effect in a population of individuals. To define it, we need three pieces of
information: an outcome of interest, the actions  = 1 and  = 0 to be
compared, and a well-defined population of individuals whose outcomes  =0
and  =1 are to be compared.
Take Zeus’s extended family as our population of interest. Table 1.1 shows
the counterfactual outcomes under both treatment ( = 1) and no treatment
( = 0) for all 20 members of our population. Let us first focus our atten-
tion on the last column: the outcome  =1 that would have been observed for
each individual if they had received the treatment (a heart transplant). Half
of the members of the population (10 out of 20) would have died if they had
received a heart transplant. That is, the proportion of individuals that would
have developed the outcome had all population individuals received  = 1 is
A definition of causal effect 5

Fine Point 1.1

Interference. An implicit assumption in our definition of counterfactual outcome is that an individual’s counterfactual
outcome under treatment value  does not depend on other individuals’ treatment values. For example, we implicitly
assumed that Zeus would die if he received a heart transplant, regardless of whether Hera also received a heart transplant.
That is, Hera’s treatment value did not interfere with Zeus’s outcome. On the other hand, suppose that Hera’s getting
a new heart upsets Zeus to the extent that he would not survive his own heart transplant, even though he would
have survived had Hera not been transplanted. In this scenario, Hera’s treatment interferes with Zeus’s outcome.
Interference between individuals is common in studies that deal with contagious agents or educational programs, in
which an individual’s outcome is influenced by their social interaction with other population members.
In the presence of interference, the counterfactual  for an individual  is not well defined because an individual’s
outcome depends also on other individuals’ treatment values. As a consequence “the causal effect of heart transplant on
Zeus’s outcome” is not well defined when there is interference. Rather, one needs to refer to “the causal effect of heart
transplant on Zeus’s outcome when Hera does not get a new heart” or “the causal effect of heart transplant on Zeus’s
outcome when Hera does get a new heart.” If other relatives and friends’ treatment also interfere with Zeus’s outcome,
then one may need to refer to the causal effect of heart transplant on Zeus’s outcome when “no relative or friend gets
a new heart,” “when only Hera gets a new heart,” etc. because the causal effect of treatment on Zeus’s outcome may
differ for each particular allocation of hearts. The assumption of no interference was labeled “no interaction between
units” by Cox (1958), and is included in the “stable-unit-treatment-value assumption (SUTVA)” described by Rubin
(1980). See Halloran and Struchiner (1995), Sobel (2006), Rosenbaum (2007), and Hudgens and Halloran (2009) for
a more detailed discussion of the role of interference in the definition of causal effects. Unless otherwise specified, we
will assume no interference throughout this book.

Table 1.1 Pr[ =1 = 1] = 1020 = 05. Similarly, from the other column of Table 1.1, we
 =0  =1 can conclude that half of the members of the population (10 out of 20) would
Rheia 0 1 have died if they had not received a heart transplant. That is, the proportion
Kronos 1 0 of individuals that would have developed the outcome had all population in-
Demeter 0 0 dividuals received  = 0 is Pr[ =0 = 1] = 1020 = 05. Note that we have
Hades 0 0 computed the counterfactual risk under treatment to be 05 by counting the
Hestia 0 0 number of deaths (10) and dividing them by the total number of individuals
Poseidon 1 0 (20), which is the same as computing the average of the counterfactual outcome
Hera 0 0 across all individuals in the population (to see the equivalence between risk and
Zeus 0 1 average for a dichotomous outcome, use the data in Table 1.1 to compute the
Artemis 1 1 average of  =1 ).
Apollo 1 0 We are now ready to provide a formal definition of the average causal effect
Leto 0 1 in the population: an average causal effect of treatment  on outcome 
Ares 1 1 is present if Pr[ =1 = 1] 6= Pr[ =0 = 1] in the population of interest.
Athena 1 1 Under this definition, treatment  does not have an average causal effect on
Hephaestus 0 1 outcome  in our population because both the risk of death under treatment
Aphrodite 0 1 Pr[ =1 = 1] and the risk of death under no treatment Pr[ =0 = 1] are 05.
Cyclope 0 1 That is, it does not matter whether all or none of the individuals receive a
Persephone 1 1 heart transplant: half of them would die in either case. When, like here, the
Hermes 1 0 average causal effect in the population is null, we say that the null hypothesis
Hebe 1 0 of no average causal effect is true. Because the risk equals the average and
Dionysus 1 0 because the letter E is usually employed to represent the population average
or mean (also referred to as ‘E’xpectation), we can rewrite the definition of a
non-null average causal effect in the population as E[ =1 ] 6= E[ =0 ] so that
the definition applies to both dichotomous and nondichotomous outcomes.
The presence of an “average causal effect of heart transplant ” is defined
by a contrast that involves the two actions “receiving a heart transplant ( =
6 Causal Inference

Fine Point 1.2

Multiple versions of treatment. Another implicit assumption in our definition of an individual’s counterfactual outcome
under treatment value  is that there is only one version of treatment value  = . For example, we said that Zeus
would die if he received a heart transplant. This statement implicitly assumes that all heart transplants are performed
by the same surgeon using the same procedure and equipment. That is, that there is only one version of the treatment
“heart transplant.” If there were multiple versions of treatment (e.g., surgeons with different skills), then it is possible
that Zeus would survive if his transplant were performed by Asclepios, and would die if his transplant were performed by
Hygieia. In the presence of multiple versions of treatment, the counterfactual  for an individual  is not well defined
because an individual’s outcome depends on the version of treatment . As a consequence “the causal effect of heart
transplant on Zeus’s outcome” is not well defined when there are multiple versions of treatment. Rather, one needs to
refer to “the causal effect of heart transplant on Zeus’s outcome when Asclepios performs the surgery” or “the causal
effect of heart transplant on Zeus’s outcome when Hygieia performs the surgery.” If other components of treatment
(e.g., procedure, place) are also relevant to the outcome, then one may need to refer to “the causal effect of heart
transplant on Zeus’s outcome when Asclepios performs the surgery using his rod at the temple of Kos” because the
causal effect of treatment on Zeus’s outcome may differ for each particular version of treatment.
Like the assumption of no interference (see Fine Point 1.1), the assumption of no multiple versions of treatment is
included in the “stable-unit-treatment-value assumption (SUTVA)” described by Rubin (1980). Robins and Greenland
(2000) made the point that if the versions of a particular treatment (e.g., heart transplant) had the same causal effect
on the outcome (survival), then the counterfactual  =1 would be well-defined. VanderWeele (2009) formalized this
point as the assumption of “treatment variation irrelevance,” i.e., the assumption that multiple versions of treatment
 =  may exist but they all result in the same outcome  . We return to this issue in Chapter 3 but, unless otherwise
specified, we will assume treatment variation irrelevance throughout this book.

1)” and “not receiving a heart transplant ( = 0).” When more than two
actions are possible (i.e., the treatment is not dichotomous), the particular
Average causal effect in population: contrast of interest needs to be specified. For example, “the causal effect of
E[ =1 ] 6= E[ =0 ] aspirin” is meaningless unless we specify that the contrast of interest is, say,
“taking, while alive, 150 mg of aspirin by mouth (or nasogastric tube if need
be) daily for 5 years” versus “not taking aspirin.” Note that this causal effect is
well defined even if counterfactual outcomes under other interventions are not
well defined or even do not exist (e.g., “taking, while alive, 500 mg of aspirin
by absorption through the skin daily for 5 years”).
Absence of an average causal effect does not imply absence of individual
effects. Table 1.1 shows that treatment has an individual causal effect on
12 members (including Zeus) of the population because, for each of these 12
individuals, the value of their counterfactual outcomes  =1¡ =1and  =0 differ.¢
Of the 12 , 6 were harmed
¡ =1 by treatment, ¢ including Zeus  −  =0 = 1 ,
and 6 were helped  −  =0 = −1 . This equality is not an accident:
the average causal effect E[ =1 ] − E[ =0 ] is always equal to the average
E[ =1 −  =0 ] of the individual causal effects  =1 −  =0 , as a difference
of averages is equal to the average of the differences. When there is no causal
effect for any individual in the population, i.e.,  =1 =  =0 for all individuals,
we say that the sharp causal null hypothesis is true. The sharp causal null
hypothesis implies the null hypothesis of no average effect.
As discussed in the next chapters, average causal effects can sometimes be
identified from data, even if individual causal effects cannot. Hereafter we refer
to ‘average causal effects’ simply as ‘causal effects’ and the null hypothesis of
no average effect as the causal null hypothesis. We next describe different
measures of the magnitude of a causal effect.
A definition of causal effect 7

Technical Point 1.1

Causal effects in the population. Let E[  ] be the mean counterfactual outcome had all individuals in the population
received treatment level . For discrete outcomes, the mean or expected value E[  ] is defined as the weighted sum
P  
    () over all possible values  of the random variable  , where   (·) is the probability mass function of  ,
i.e.,   () = Pr[  = ]. For dichotomous
R outcomes, E[ 
] = Pr[ 
= 1]. For continuous outcomes, the expected
value E[  ] is defined as the integral   ()  over all possible values  of the random variable   , where   (·)
is the probability density function of R . A common representation of the expected value that applies to both discrete
and continuous outcomes is E[  ] =   (), where   (·) is the cumulative distribution function (cdf) of the
0
random variable   . We say that there is a non-null average causal effect in the population if E[  ] 6= E[  ] for any
two values  and 0 .
The average causal effect, defined by a contrast of means of counterfactual outcomes, is the most commonly
used population causal effect. However, a population causal effect may also be defined as a contrast of, say, medians,
variances, hazards, or cdfs of counterfactual outcomes. In general, a causal effect can be defined as a contrast of any
functional of the distributions of counterfactual outcomes under different actions or treatment values. The causal null
hypothesis refers to the particular contrast of functionals (mean, median, variance, hazard, cdf, ...) used to define the
causal effect.

1.3 Measures of causal effect


We have seen that the treatment ‘heart transplant’  does not have a causal
effect on the outcome ‘death’  in our population of 20 family members of
Zeus. The causal null hypothesis holds because the two counterfactual risks
Pr[ =1 = 1] and Pr[ =0 = 1] are equal to 05. There are equivalent ways
of representing the causal null. £ For example,
¤ we could say that the risk
Pr[ =1 = 1] minus the risk Pr  =0 = 1 £is zero (05¤ − 05 = 0) or that
the risk Pr[ =1 = 1] divided by the risk Pr  =0 = 1 is one (0505 = 1).
That is, we can represent the causal null by

(i) Pr[ =1 = 1] − Pr[ =0 = 1] = 0


Pr[ =1 = 1]
(ii) =1
Pr[ =0 = 1]
Pr[ =1 = 1] Pr[ =1 = 0]
(iii) =1
Pr[ =0 = 1] Pr[ =0 = 0]
where the left-hand side of the equalities (i), (ii), and (iii) is the causal risk
The causal risk difference in the difference, risk ratio, and odds ratio, respectively.
population is the average of the in- Suppose now that another treatment , cigarette smoking, has a causal
dividual causal effects  =1 − =0 effect on another outcome  , lung cancer, in our population. The causal null
on the difference scale, i.e., it is hypothesis does not hold: Pr[ =1 = 1] and Pr[ =0 = 1] are not equal. In
a measure of the average individ- this setting, the causal risk difference, risk ratio, and odds ratio are not 0, 1,
ual causal effect. By contrast, the and 1, respectively. Rather, these causal parameters quantify the strength of
causal risk ratio in the population the same causal effect on different scales. Because the causal risk difference,
is not the average of the individual risk ratio, and odds ratio (and other summaries) measure the causal effect, we
causal effects  =1  =0 on the refer to them as effect measures.
ratio scale, i.e., it is a measure of Each effect measure may be used for different purposes. For example,
causal effect in the population but imagine a large population in which 3 in a million individuals would develop the
is not the average of any individual outcome if treated, and 1 in a million individuals would develop the outcome if
causal effects. untreated. The causal risk ratio is 3, and the causal risk difference is 0000002.
The causal risk ratio (multiplicative scale) is used to compute how many times
8 Causal Inference

Fine Point 1.3

Number needed to treat. Consider a population of 100 million patients in which 20 million would die within five years
if treated ( = 1), and 30 million would die within five years if untreated ( = 0). This information can be summarized
in several equivalent ways:

• the causal risk difference is Pr[ =1 = 1] − Pr[ =0 = 1] = 02 − 03 = −01
• if one treats the 100 million patients, there will be 10 million fewer deaths than if one does not treat those 100
million patients.
• one needs to treat 100 million patients to save 10 million lives
• on average, one needs to treat 10 patients to save 1 life

We refer to the average number of individuals that need to receive treatment  = 1 to reduce the number of cases
 = 1 by one as the number needed to treat (NNT). In our example the NNT is equal to 10. For treatments that
reduce the average number of cases (i.e., the causal risk difference is negative), the NNT is equal to the reciprocal of
the absolute value of the causal risk difference:
−1
 =
Pr[ =1 = 1] − Pr[ =0 = 1]

For treatments that increase the average number of cases (i.e., the causal risk difference is positive), one can
symmetrically define the number needed to harm. The NNT was introduced by Laupacis, Sackett, and Roberts (1988).
Note that, like the causal risk difference, the NNT applies to the population and time interval on which it is based. For
a discussion of the relative advantages and disadvantages of the NNT as an effect measure, see Grieve (2003).

treatment, relative to no treatment, increases the disease risk. The causal risk
difference (additive scale) is used to compute the absolute number of cases of
the disease attributable to the treatment. The use of either the multiplicative
or additive scale will depend on the goal of the inference.

1.4 Random variability


At this point you could complain that our procedure to compute effect measures
is somewhat implausible. Not only did we ignore the well known fact that the
immortal Zeus cannot die, but–more to the point–our population in Table
1.1 had only 20 individuals. The populations of interest are typically much
larger.
In our tiny population, we collected information from all the individuals. In
practice, investigators only collect information on a sample of the population
of interest. Even if the counterfactual outcomes of all study individuals were
known, working with samples prevents one from obtaining the exact proportion
of individuals in the population who had the outcome under treatment value
, e.g., the probability of death under no treatment Pr[ =0 = 1] cannot be
directly computed. One can only estimate this probability.
Consider the individuals in Table 1.1. We have previously viewed them
1st source of random error: as forming a twenty-person population. Suppose we view them as a random
Sampling variability sample from a much larger, near-infinite super-population (e.g., all immor-
A definition of causal effect 9

tals). We denote the proportion of individuals in the sample who would have
c =0 = 1] = 1020 = 050. The sample proportion
died if unexposed as Pr[
c =0 = 1] does not have to be exactly equal to the proportion of individ-
Pr[
uals who would have died if the entire super-population had been unexposed,
Pr[ =0 = 1]. For example, suppose Pr[ =0 = 1] = 057 in the population
c =0 = 1] = 05 in
but, because of random error due to sampling variability, Pr[
our particular sample. We use the sample proportion Pr[ c  = 1] to estimate
the super-population probability Pr[  = 1] under treatment value . The
c  = 1] is an estimator
“hat” over Pr indicates that the sample proportion Pr[
An estimator ̂ of  is consistent 
of the corresponding population quantity Pr[ = 1]. We say that Pr[ c  = 1]

if, with probability approaching 1, is a consistent estimator of Pr[ = 1] because the larger the number of in-
the difference ̂ − approaches zero dividuals in the sample, the smaller the difference between Pr[ c  = 1] and
as the sample size increases towards Pr[  = 1] is expected to be. This occurs because the error due to sampling
infinity. variability is random and thus obeys the law of large numbers.
Because the super-population probabilities Pr[  = 1] cannot be computed,
Caution: the term ‘consistency’ only consistently estimated by the sample proportions Pr[c  = 1], one cannot
when applied to estimators has a conclude with certainty that there is, or there is not, a causal effect. Rather, a
different meaning from that which statistical procedure must be used to test the causal null hypothesis Pr[ =1 =
it has when applied to counterfac- 1] = Pr[ =0 = 1]; the procedure quantifies the chance that the difference
tual outcomes. c =1 = 1] and Pr[
between Pr[ c =0 = 1] is wholly due to sampling variability.
So far we have only considered sampling variability as a source of random
error. But there may be another source of random variability: perhaps the
2nd source of random error: values of an individual’s counterfactual outcomes are not fixed in advance.
Nondeterministic counterfactuals We have defined the counterfactual outcome   as the individual’s outcome
had he received treatment value . For example, in our first vignette, Zeus
would have died if treated and would have survived if untreated. As defined,
the values of the counterfactual outcomes are fixed or deterministic for each
Table 1.2 individual, e.g.,  =1 = 1 and  =0 = 0 for Zeus. In other words, Zeus
  has a 100% chance of dying if treated and a 0% chance of dying if untreated.
Rheia 0 0 However, we could imagine another scenario in which Zeus has a 90% chance
Kronos 0 1 of dying if treated, and a 10% chance of dying if untreated. In this scenario,
Demeter 0 0 the counterfactual outcomes are stochastic or nondeterministic because Zeus’s
Hades 0 0 probabilities of dying under treatment (09) and under no treatment (01)
Hestia 1 0 are neither zero nor one. The values of  =1 and  =0 shown in Table 1.1
Poseidon 1 0 would be possible realizations of “random flips of mortality coins” with these
Hera 1 0 probabilities. Further, one would expect that these probabilities vary across
Zeus 1 1 individuals because not all individuals are equally susceptible to develop the
Artemis 0 1 outcome. Quantum mechanics, in contrast to classical mechanics, holds that
Apollo 0 1 outcomes are inherently nondeterministic. That is, if the quantum mechanical
Leto 0 0 probability of Zeus dying is 90%, the theory holds that no matter how much
Ares 1 1 data we collect about Zeus, the uncertainty about whether Zeus will actually
Athena 1 1 develop the outcome if treated is irreducible.
Hephaestus 1 1 Thus, in causal inference, random error derives from sampling variability,
Aphrodite 1 1 nondeterministic counterfactuals, or both. However, for pedagogic reasons, we
Cyclope 1 1 will continue to largely ignore random error until Chapter 10. Specifically, we
Persephone 1 1 will assume that counterfactual outcomes are deterministic and that we have
Hermes 1 0 recorded data on every individual in a very large (perhaps hypothetical) super-
Hebe 1 0 population. This is equivalent to viewing our population of 20 individuals as a
Dionysus 1 0 population of 20 billion individuals in which 1 billion individuals are identical
to Zeus, 1 billion individuals are identical to Hera, and so on. Hence, until
Chapter 10, we will carry out our computations with Olympian certainty.
Then, in Chapter 10, we will describe how our statistical estimates and
10 Causal Inference

Technical Point 1.2

Nondeterministic counterfactuals. For nondeterministic


P counterfactual outcomes, the mean outcome under treatment
value , E[  ], equals the weighted sum    () over all possible values  of the random variable   , where the

probability mass function   (·) = E [  (·)], and   () is a random probability of having outcome  =  under
treatment level . In the example described in the text,  =1 (1) = 09 for Zeus. (For continuous outcomes, the
weighted sum is replaced by an integral.)
More generally, a nondeterministic definition of counterfactual outcome does not attach some particular value of
the random variable   to each individual, but rather a statistical distribution Θ  (·) of   . The nondeterministic
definition of causal effect is a generalization of the deterministic definition in which Θ  (·) is a random cdf that may
 
take values between 0 and
£R 1. The average
¤ Rcounterfactual outcome
R in the population E[ ] equals E {E [ | £Θ  (·)]}.
¤

Therefore, E[ ] = E  Θ  () =   E[Θ  ()] =    (), because we define   (·) = E Θ (·) .
Although the possibility of nondeterministic counterfactual outcomes implies no changes in our definitions of population
causal effect and of effect measures, nondeterministic counterfactual outcomes introduce random variability.
Note that, if the counterfactual outcomes are binary and nondeterministic, the causal risk ratio in the popu-
E[ =1 (1)]
lation E  (1) is equal to the weighted average E [ { =1 (1)  =0 (1)}] of the individual causal effects
[  =0 ]
 (1)
 =1 (1)  =0 (1) on the ratio scale, with weights  = E  =0 (1) .
[  =0 ]

confidence intervals for causal effects in the super-population are identical ir-
respective of whether the world is stochastic (quantum) or deterministic (classi-
cal) at the level of individuals. In contrast, confidence intervals for the average
causal effect in the actual study sample will differ depending on whether coun-
terfactuals are deterministic versus stochastic. Fortunately, super-population
effects are in most cases the causal effects of substantive interest.

1.5 Causation versus association


Obviously, the data available from actual studies look different from those
shown in Table 1.1. For example, we would not usually expect to learn Zeus’s
outcome if treated  =1 and also Zeus’s outcome if untreated  =0 . In the
real world, we only get to observe one of those outcomes because Zeus is either
treated or untreated. We referred to the observed outcome as  . Thus, for
each individual, we know the observed treatment level  and the outcome 
as in Table 1.2.
The data in Table 1.2 can be used to compute the proportion of individuals
that developed the outcome  among those individuals in the population that
happened to receive treatment value . For example, in Table 1.2, 7 individuals
died ( = 1) among the 13 individuals that were treated ( = 1). Thus the
risk of death in the treated, Pr[ = 1| = 1], was 713. More generally, the
conditional probability Pr[ = 1| = ] is defined as the proportion of individ-
uals that developed the outcome  among those individuals in the population
of interest that happened to receive treatment value .
When the proportion of individuals who develop the outcome in the treated
Pr[ = 1| = 1] equals the proportion of individuals who develop the outcome
in the untreated Pr[ = 1| = 0], we say that treatment  and outcome 
are independent, that  is not associated with  , or that  does not predict
Dawid (1979) introduced the sym-  . Independence is represented by  ⊥ ⊥–or, equivalently, ⊥ ⊥ – which is
bol ⊥
⊥ to denote independence
A definition of causal effect 11

read as  and  are independent. Some equivalent definitions of independence


are

(i) Pr[ = 1| = 1] − Pr[ = 1| = 0] = 0

Pr[ = 1| = 1]
(ii) =1
Pr[ = 1| = 0]

Pr[ = 1| = 1] Pr[ = 0| = 1]


(iii) =1
Pr[ = 1| = 0] Pr[ = 0| = 0]

where the left-hand side of the inequalities (i), (ii), and (iii) is the associational
risk difference, risk ratio, and odds ratio, respectively.
We say that treatment  and outcome  are dependent or associated when
For a continuous outcome  we Pr[ = 1| = 1] 6= Pr[ = 1| = 0]. In our population, treatment and
define mean independence between outcome are indeed associated because Pr[ = 1| = 1] = 713 and Pr[ =
treatment and outcome as: 1| = 0] = 37. The associational risk difference, risk ratio, and odds ratio
E[ | = 1] = E[ | = 0] (and other measures) quantify the strength of the association when it exists.
Independence and mean indepen- They measure the association on different scales, and we refer to them as
dence are the same concept for di- association measures. These measures are also affected by random variability.
chotomous outcomes. However, until Chapter 10, we will disregard statistical issues by assuming that
the population in Table 1.2 is extremely large.
For dichotomous outcomes, the risk equals the average in the population,
and we can therefore rewrite the definition of association in the population as
E [ | = 1] 6= E [ | = 0]. For continuous outcomes  , we can also define
association as E [ | = 1] 6= E [ | = 0]. For binary ,  and  are not
associated if and only if they are not statistically correlated.
In our population of 20 individuals, we found (i ) no causal effect after com-
paring the risk of death if all 20 individuals had been treated with the risk
of death if all 20 individuals had been untreated, and (ii ) an association after
comparing the risk of death in the 13 individuals who happened to be treated
with the risk of death in the 7 individuals who happened to be untreated.
Figure 1.1 depicts the causation-association difference. The population (repre-
sented by a diamond) is divided into a white area (the treated) and a smaller
grey area (the untreated).

Population of interest

Treated Untreated

Causation Association

vs. vs.
Figure 1.1

EYa1  EYa0  EY|A  1 EY|A  0


12 Causal Inference

The definition of causation implies a contrast between the whole white


diamond (all individuals treated) and the whole grey diamond (all individu-
als untreated), whereas association implies a contrast between the white (the
treated) and the grey (the untreated) areas of the original diamond.
We can use the notation we have developed thus far to formalize the dis-
tinction between causation and association. The risk Pr[ = 1| = ] is a
conditional probability: the risk of  in the subset of the population that
meet the condition ‘having actually received treatment value ’ (i.e.,  = ).
In contrast the risk Pr[  = 1] is an unconditional–also known as marginal–
probability, the risk of   in the entire population. Therefore, association is
defined by a different risk in two disjoint subsets of the population determined
by the individuals’ actual treatment value ( = 1 or  = 0), whereas causa-
tion is defined by a different risk in the same population under two different
The difference between association treatment values ( = 1 or  = 0). Throughout this book we often use the
and causation is critical. Suppose redundant expression ‘causal effect’ to avoid confusions with a common use of
the causal risk ratio of 5-year mor- ‘effect’ meaning simply association.
tality is 05 for aspirin vs. no as- These radically different definitions explain the well-known adage “asso-
pirin, and the corresponding asso- ciation is not causation.” In our population, there was association because
ciational risk ratio is 15 because the mortality risk in the treated (713) was greater than that in the untreated
individuals at high risk of cardiovas- (37). However, there was no causation because the risk if everybody had been
cular death are preferentially pre- treated (1020) was the same as the risk if everybody had been untreated. This
scribed aspirin. After a physician discrepancy between causation and association would not be surprising if those
learns these results, she decides to who received heart transplants were, on average, sicker than those who did not
withhold aspirin from her patients receive a transplant. In Chapter 7 we refer to this discrepancy as confounding.
because those treated with aspirin Causal inference requires data like the hypothetical data in Table 1.1, but
have a greater risk of dying com- all we can ever expect to have is real world data like those in Table 1.2. The
pared with the untreated. The doc- question is then under which conditions real world data can be used for causal
tor will be sued for malpractice. inference. The next chapter provides one answer: conduct a randomized ex-
periment.
Chapter 2
RANDOMIZED EXPERIMENTS

Does your looking up at the sky make other pedestrians look up too? This question has the main components
of any causal question: we want to know whether certain action (your looking up) affects certain outcome (other
people’s looking up) in certain population (say, residents of Madrid in 2017). Suppose we challenge you to design
a scientific study to answer this question. “Not much of a challenge,” you say after some thought, “I can stand on
the sidewalk and flip a coin whenever someone approaches. If heads, I’ll look up; if tails, I’ll look straight ahead.
I’ll repeat the experiment a few thousand times. If the proportion of pedestrians who looked up within 10 seconds
after I did is greater than the proportion of pedestrians who looked up when I didn’t, I will conclude that my
looking up has a causal effect on other people’s looking up. By the way, I may hire an assistant to record what
people do while I’m looking up.” After conducting this study, you found that 55% of pedestrians looked up when
you looked up but only 1% looked up when you looked straight ahead.
Your solution to our challenge was to conduct a randomized experiment. It was an experiment because the
investigator (you) carried out the action of interest (looking up), and it was randomized because the decision to
act on any study subject (pedestrian) was made by a random device (coin flipping). Not all experiments are
randomized. For example, you could have looked up when a man approached and looked straight ahead when a
woman did. Then the assignment of the action would have followed a deterministic rule (up for man, straight for
woman) rather than a random mechanism. However, your findings would not have been nearly as convincing if
you had conducted a non randomized experiment. If your action had been determined by the pedestrian’s sex,
critics could argue that the “looking up” behavior of men and women differs (women may look up less often than
do men after you look up) and thus your study compared essentially “noncomparable” groups of people. This
chapter describes why randomization results in convincing causal inferences.

2.1 Randomization
In a real world study we will not know both of Zeus’s potential outcomes  =1
under treatment and  =0 under no treatment. Rather, we can only know
his observed outcome  under the treatment value  that he happened to
receive. Table 2.1 summarizes the available information for our population
of 20 individuals. Only one of the two counterfactual outcomes is known for
each individual: the one corresponding to the treatment level that he actually
Neyman (1923) applied counterfac- received. The data are missing for the other counterfactual outcomes. As we
tual theory to the estimation of discussed in the previous chapter, this missing data creates a problem because
causal effects via randomized ex- it appears that we need the value of both counterfactual outcomes to compute
periments effect measures. The data in Table 2.1 are only good to compute association
measures.
Randomized experiments, like any other real world study, generate data with
missing values of the counterfactual outcomes as shown in Table 2.1. However,
randomization ensures that those missing values occurred by chance. As a
result, effect measures can be computed –or, more rigorously, consistently
estimated–in randomized experiments despite the missing data. Let us be
more precise.
Suppose that the population represented by a diamond in Figure 1.1 was
near-infinite, and that we flipped a coin for each individual in such population.
14 Causal Inference

We assigned the individual to the white group if the coin turned tails, and
Table 2.1 to the grey group if it turned heads. Note this was not a fair coin because
  0 1 the probability of heads was less than 50%–fewer people ended up in the
Rheia 0 0 0 ? grey group than in the white group. Next we asked our research assistants to
Kronos 0 1 1 ? administer the treatment of interest ( = 1), to individuals in the white group
Demeter 0 0 0 ? and a placebo ( = 0) to those in the grey group. Five days later, at the end of
Hades 0 0 0 ? the study, we computed the mortality risks in each group, Pr[ = 1| = 1] =
Hestia 1 0 ? 0 03 and Pr[ = 1| = 0] = 06. The associational risk ratio was 0306 = 05
Poseidon 1 0 ? 0 and the associational risk difference was 03 − 06 = −03. We will assume
Hera 1 0 ? 0 that this was an ideal randomized experiment in all other respects: no loss to
Zeus 1 1 ? 1 follow-up, full adherence to the assigned treatment over the duration of the
Artemis 0 1 1 ? study, a single version of treatment, and double blind assignment (see Chapter
Apollo 0 1 1 ? 9). Ideal randomized experiments are unrealistic but useful to introduce some
Leto 0 0 0 ? key concepts for causal inference. Later in this book we consider more realistic
Ares 1 1 ? 1 randomized experiments.
Athena 1 1 ? 1 Now imagine what would have happened if the research assistants had
Hephaestus 1 1 ? 1 misinterpreted our instructions and had treated the grey group rather than
Aphrodite 1 1 ? 1 the white group. Say we learned of the misunderstanding after the study
Cyclope 1 1 ? 1 finished. How does this reversal of treatment status affect our conclusions?
Persephone 1 1 ? 1 Not at all. We would still find that the risk in the treated (now the grey
Hermes 1 0 ? 0 group) Pr[ = 1| = 1] is 03 and the risk in the untreated (now the white
Hebe 1 0 ? 0 group) Pr[ = 1| = 0] is 06. The association measure would not change.
Dionysus 1 0 ? 0 Because individuals were randomly assigned to white and grey groups, the
proportion of deaths among the exposed, Pr[ = 1| = 1] is expected to be
the same whether individuals in the white group received the treatment and
individuals in the grey group received placebo, or vice versa. When group
membership is randomized, which particular group received the treatment is
irrelevant for the value of Pr[ = 1| = 1]. The same reasoning applies to
Pr[ = 1| = 0], of course. Formally, we say that groups are exchangeable.
Exchangeability means that the risk of death in the white group would have
been the same as the risk of death in the grey group had individuals in the white
group received the treatment given to those in the grey group. That is, the risk
under the potential treatment value  among the treated, Pr[  = 1| = 1],
equals the risk under the potential treatment value  among the untreated,
Pr[  = 1| = 0], for both  = 0 and  = 1. An obvious consequence of these
(conditional) risks being equal in all subsets defined by treatment status in the
population is that they must be equal to the (marginal) risk under treatment
value  in the whole population: Pr[  = 1| = 1] = Pr[  = 1| = 0] =
Pr[  = 1]. Because the counterfactual risk under treatment value  is the
same in both groups  = 1 and  = 0, we say that the actual treatment 
does not predict the counterfactual outcome   . Equivalently, exchangeability
means that the counterfactual outcome and the actual treatment are indepen-
Exchangeability: dent, or   ⊥
⊥, for all values . Randomization is so highly valued because it
 ⊥
⊥ for all  is expected to produce exchangeability. When the treated and the untreated
are exchangeable, we sometimes say that treatment is exogenous, and thus
exogeneity is commonly used as a synonym for exchangeability.
The previous paragraph argues that, in the presence of exchangeability, the
counterfactual risk under treatment in the white part of the population would
equal the counterfactual risk under treatment in the entire population. But the
risk under treatment in the white group is not counterfactual at all because the
white group was actually treated! Therefore our ideal randomized experiment
allows us to compute the counterfactual risk under treatment in the population
Pr[ =1 = 1] because it is equal to the risk in the treated Pr[ = 1| = 1] =
Randomized experiments 15

Technical Point 2.1

Full exchangeability and mean exchangeability. Randomization makes the   jointly independent of  which implies,
but is not implied by, exchangeability   ⊥
⊥nfor each . Formally, 0 00
o let A = {     } denote the set of all treatment
A  0 00
values present in the population, and  =        the set of all counterfactual outcomes. Randomization
makes  A ⊥ ⊥. We refer to
¡ this joint independence
¢ as full exchangeability. For a dichotomous treatment, A = {0 1}
and full exchangeability is  =1   =0 ⊥⊥.
For a dichotomous outcome and treatment, exchangeability   ⊥ ⊥ can also be written as Pr [  = 1| = 1] =
  
Pr [ = 1| = 0] or, equivalently, as E[ | = 1] = E[ | = 0] for all . We refer to the last equality as mean
exchangeability. For a continuous outcome, exchangeability   ⊥⊥ implies mean exchangeability E[  | = 0 ] =
E[  ], but mean exchangeability does not imply exchangeability because distributional parameters other than the mean
(e.g., variance) may not be independent of treatment.
Neither full exchangeability  A ⊥
⊥ nor exchangeability   ⊥⊥ are required to prove that E[  ] = E[ | = ].
Mean exchangeability is sufficient. As sketched in the main text, the proof has two steps. First, E[ | = ] =
E[  | = ] by consistency. Second, E[  | = ] = E[  ] by mean exchangeability. Because exchangeability and
mean exchangeability are identical concepts for the dichotomous outcomes used in this chapter, we use the shorter term
“exchangeability” throughout.

03. That is, the risk in the treated (the white part of the diamond) is the
same as the risk if everybody had been treated (and thus the diamond had
been entirely white). Of course, the same rationale applies to the untreated:
the counterfactual risk under no treatment in the population Pr[ =0 = 1]
equals the risk in the untreated Pr[ = 1| = 0] = 06. The causal risk ratio
is 05 and the causal risk difference is −03. In ideal randomized experiments,
association is causation.
Here is another explanation for exchangeability   ⊥ ⊥ in a randomized
experiment. The counterfactual outcome   , like one’s genetic make-up, can
be thought of as a fixed characteristic of a person existing before the treat-
ment  was randomly assigned. This is because   encodes what would have
been one’s outcome if assigned to treament  and thus does not depend on
the treatment you later receive. Because treatment  was randomized, it is
independent of both your genes and   . The difference between   and your
genetic make-up is that, even conceptually, you can only learn the value of  
after treatment is given and then only if one’s treatment  is equal to .
Caution: Before proceeding, please make sure you understand the difference between
 ⊥
⊥ is different from  ⊥
⊥  ⊥⊥ and  ⊥ ⊥. Exchangeability   ⊥ ⊥ is defined as independence between
the counterfactual outcome and the observed treatment. Again, this means
that the treated and the untreated would have experienced the same risk of
death if they had received the same treatment level (either  = 0 or  = 1). But
independence between the counterfactual outcome and the observed treatment
 ⊥⊥ does not imply independence between the observed outcome and the
observed treatment  ⊥ ⊥. For example, in a randomized experiment in which
Suppose there is a causal effect on exchangeability   ⊥⊥ holds and the treatment has a causal effect on the
some individuals so that  =1 6= outcome, then  ⊥ ⊥ does not hold because the treatment is associated with
 =0 . Since  =   , then   the observed outcome.
with  evaluated at the observed Does exchangeability hold in our heart transplant study of Table 2.1? To
treatment  is the observed   , answer this question we would need to check whether   ⊥ ⊥ holds for  = 0
which depends on  and thus will and for  = 1. Take  = 0 first. Suppose the counterfactual data in Table 1.1
not be independent of . are available to us. We can then compute the risk of death under no treatment
Pr[ =0 = 1| = 1] = 713 in the 13 treated individuals and the risk of death
16 Causal Inference

Fine Point 2.1

Crossover randomized experiments. Individual (also known as subject-specific) causal effects can sometimes be
identified via randomized experiments. For example, suppose we want to estimate the causal effect of lightning bolt
use  on Zeus’s blood pressure  . We define the counterfactual outcomes  =1 and  =0 to be 1 if Zeus’s blood
pressure is temporarily elevated after calling or not calling a lightning strike, respectively. Suppose we convinced Zeus
to use his lightning bolt only when suggested by us. Yesterday morning we flipped coin and obtained heads. We then
asked Zeus to call a lightning strike ( = 1). His blood pressure was elevated after doing so. This morning we flipped
a coin and obtained tails. We then asked Zeus to refrain from using his lightning bolt ( = 0). His blood pressure did
not increase. We have conducted a crossover randomized experiment in which an individual’s outcome is sequentially
observed under two treatment values. One might argue that, because we have observed both of Zeus’s counterfactual
outcomes  =1 = 1 and  =0 = 0, using a lightning bolt has a causal effect on Zeus’s blood pressure.
In crossover randomized experiments, an individual is observed during two or more periods. The individual receives
a different treatment value in each period and the order of treatment values is randomly assigned. The main purported
advantage of the crossover design is that, unlike in non-crossover designs, for each treated individual there is a perfectly
exchangeable untreated subject–him or herself. A direct contrast of an individual’s outcomes under different treatment
values allows the identification of individual effects under the following conditions: 1) treatment is of short duration
and its effects do not carry-over to the next period, and 2) the outcome is a condition of abrupt onset that completely
resolves by the next period. Therefore crossover randomized experiments cannot be used to study the effect of heart
transplant, an irreversible action, on death, an irreversible outcome.
Often treatment is randomized at many different periods. If the individual causal effect changes with time, we
obtain the average of the individual time-specific causal effects.

under no treatment Pr[ =0 = 1| = 0] = 37 in the 7 untreated individuals.


Since the risk of death under no treatment is greater in the treated than in the
untreated individuals, i.e., 713  37, we conclude that the treated have a
worse prognosis than the untreated, that is, that the treated and the untreated
are not exchangeable. Mathematically, we have proven that exchangeability
 ⊥⊥ does not hold for  = 0. (You can check that it does not hold for  = 1
either.) Thus the answer to the question that opened this paragraph is ‘No’.

But only the observed data in Table 2.1, not the counterfactual data in
Table 1.1, are available in the real world. Since Table 2.1 is insufficient to
compute counterfactual risks like the risk under no treatment in the treated
Pr[ =0 = 1| = 1], we are generally unable to determine whether exchange-
ability holds in our study. However, suppose for a moment, that we actually
had access to Table 1.1 and determined that exchangeability does not hold
in our heart transplant study. Can we then conclude that our study is not
a randomized experiment? No, for two reasons. First, as you are probably
already thinking, a twenty-person study is too small to reach definite conclu-
sions. Random fluctuations arising from sampling variability could explain
almost anything. We will discuss random variability in Chapter 10. Until
then, let us assume that each individual in our population represents 1 billion
individuals that are identical to him or her. Second, it is still possible that
a study is a randomized experiment even if exchangeability does not hold in
infinite samples. However, unlike the type of randomized experiment described
in this section, it would need to be a randomized experiment in which investi-
gators use more than one coin to randomly assign treatment. The next section
describes randomized experiments with more than one coin.
Randomized experiments 17

2.2 Conditional randomization


Table 2.2 shows the data from our heart transplant randomized study. Besides
data on treatment  (1 if the individual received a transplant, 0 otherwise)
and outcome  (1 if the individual died, 0 otherwise), Table 2.2 also contains
data on the prognostic factor  (1 if the individual was in critical condition,
0 otherwise), which we measured before treatment was assigned. We now
consider two mutually exclusive study designs and discuss whether the data in
Table 2.2 could have arisen from either of them.
In design 1 we would have randomly selected 65% of the individuals in the
population and transplanted a new heart to each of the selected individuals.
Table 2.2 That would explain why 13 out of 20 individuals were treated. In design 2
   we would have classified all individuals as being in either critical ( = 1)
Rheia 0 0 0 or noncritical ( = 0) condition. Then we would have randomly selected
Kronos 0 0 1 75% of the individuals in critical condition and 50% of those in noncritical
Demeter 0 0 0 condition, and transplanted a new heart to each of the selected individuals.
Hades 0 0 0 That would explain why 9 out of 12 individuals in critical condition, and 4 out
Hestia 0 1 0 of 8 individuals in non critical condition, were treated.
Poseidon 0 1 0 Both designs are randomized experiments. Design 1 is precisely the type of
Hera 0 1 0 randomized experiment described in Section 2.1. Under this design, we would
Zeus 0 1 1 use a single coin to assign treatment to all individuals (e.g., treated if tails,
Artemis 1 0 1 untreated if heads): a loaded coin with probability 065 of turning tails, thus
Apollo 1 0 1 resulting in 65% of the individuals receiving treatment. Under design 2 we
Leto 1 0 0 would not use a single coin for all individuals. Rather, we would use a coin
Ares 1 1 1 with a 075 chance of turning tails for individuals in critical condition, and
Athena 1 1 1 another coin with a 050 chance of turning tails for individuals in non critical
Hephaestus 1 1 1 condition. We refer to design 2 experiments as conditionally randomized ex-
Aphrodite 1 1 1 periments because we use several randomization probabilities that depend (are
Cyclope 1 1 1 conditional) on the values of the variable . We refer to design 1 experiments
Persephone 1 1 1 as marginally randomized experiments because we use a single unconditional
Hermes 1 1 0 (marginal) randomization probability that is common to all individuals.
Hebe 1 1 0 As discussed in the previous section, a marginally randomized experiment
Dionysus 1 1 0 is expected to result in exchangeability of the treated and the untreated:
Pr[  = 1| = 1] = Pr[  = 1| = 0] or   ⊥
⊥ for all .
In contrast, a conditionally randomized experiment will not generally result
in exchangeability of the treated and the untreated because, by design, each
group may have a different proportion of individuals with bad prognosis.
Thus the data in Table 2.2 could not have arisen from a marginally random-
ized experiment because 69% treated versus 43% untreated individuals were
in critical condition. This imbalance indicates that the risk of death in the
treated, had they remained untreated, would have been higher than the risk
of death in the untreated. That is, treatment  predicts the counterfactual
risk of death under no treatment, and exchangeability   ⊥ ⊥ does not hold.
Since our study was a randomized experiment, you can safely conclude that
the study was a randomized experiment with randomization conditional on .
Our conditionally randomized experiment is simply the combination of two
separate marginally randomized experiments: one conducted in the subset of
individuals in critical condition ( = 1), the other in the subset of individuals
in non critical condition ( = 0). Consider first the randomized experiment
being conducted in the subset of individuals in critical condition. In this subset,
the treated and the untreated are exchangeable. Formally, the counterfactual
mortality risk under each treatment value  is the same among the treated
18 Causal Inference

and the untreated given that they all were in critical condition at the time of
treatment assignment. That is,

Pr[  = 1| = 1  = 1] = Pr[  = 1| = 0  = 1] or   ⊥


⊥| = 1 for all ,

where   ⊥
⊥| = 1 means   and  are independent given  = 1. Similarly,
randomization also ensures that the treated and the untreated are exchange-
able in the subset of individuals that were in noncritical condition, that is,
 ⊥⊥| = 0. When   ⊥ ⊥| =  holds for all values  we simply write

Conditional exchangeability:  ⊥ ⊥|. Thus, although conditional randomization does not guarantee un-
 ⊥
⊥| for all  conditional (or marginal) exchangeability   ⊥
⊥, it guarantees conditional
exchangeability   ⊥
⊥| within levels of the variable . In summary, ran-
domization produces either marginal exchangeability (design 1) or conditional
exchangeability (design 2).
We know how to compute effect measures under marginal exchangeabil-
ity. In marginally randomized experiments the causal risk ratio Pr[ =1 =
1] Pr[ =0 = 1] equals the associational risk ratio Pr[ = 1| = 1] Pr[ =
1| = 0] because exchangeability ensures that the counterfactual risk under
treatment level , Pr[  = 1], equals the observed risk among those who re-
In a marginally randomized exper- ceived treatment level , Pr[ = 1| = ]. Thus, if the data in Table 2.2 had
iment, the values of the counter- been collected during a marginally randomized experiment, the causal risk ra-
factual outcomes are missing com- 713
tio would be readily calculated from the data on  and  as = 126. The
pletely at random (MCAR). In 37
a conditionally randomized experi- question is how to compute the causal risk ratio in a conditionally randomized
ment, the values of the counterfac- experiment. Remember that a conditionally randomized experiment is simply
tual outcomes are not MCAR, but the combination of two (or more) separate marginally randomized experiments
they are missing at random (MAR) conducted in different subsets of the population, e.g.,  = 1 and  = 0. Thus
conditional on the covariate . The we have two options.
terms MCAR, MAR, and NMAR First, we can compute the average causal effect in each of these subsets of
(not missing at random) were in- strata of the population. Because association is causation within each subset,
troduced by Rubin (1976). the stratum-specific causal risk ratio Pr[ =1 = 1| = 1] Pr[ =0 = 1| = 1]
among people in critical condition is equal to the stratum-specific associational
risk ratio Pr[ = 1| = 1  = 1] Pr[ = 1| = 1  = 0] among people in
critical condition. And analogously for  = 0. We refer to this method to
compute stratum-specific causal effects as stratification. Note that the stratum-
specific causal risk ratio in the subset  = 1 may differ from the causal risk
Stratification and effect modifica- ratio in  = 0. In that case, we say that the effect of treatment is modified by
tion are discussed in more detail in , or that there is effect modification by .
Chapter 4. Second, we can compute the average causal effect Pr[ =1 = 1] Pr[ =0 =
1] in the entire population, as we have been doing so far. Whether our princi-
pal interest lies in the stratum-specific average causal effects versus the average
causal effect in the entire population depends on practical and theoretical con-
siderations discussed in detail in Chapter 4 and in Part III. As one example,
you may be interested in the average causal effect in the entire population,
rather than in the stratum-specific average causal effects, if you do not expect
to have information on  for future individuals (e.g., the variable  is expen-
sive to measure) and thus your decision to treat cannot depend on the value of
. Until Chapter 4, we will restrict our attention to the average causal effect
in the entire population. The next two sections describe how to use data from
conditionally randomized experiments to compute the average causal effect in
the entire population.
Randomized experiments 19

2.3 Standardization
Our heart transplant study is a conditionally randomized experiment: the in-
vestigators used a random procedure to assign hearts ( = 1) with probability
50% to the 8 individuals in noncritical condition ( = 0), and with probability
75% to the 12 individuals in critical condition ( = 1). First, let us focus on
the 8 individuals–remember, they are really the average representatives of 8
billion individuals–in noncritical condition. In this group, the risk of death
among the treated is Pr[ = 1| = 0  = 1] = 14 , and the risk of death
among the untreated is Pr[ = 1| = 0  = 0] = 14 . Because treatment
was randomly assigned to individuals in the group  = 0, i.e.,   ⊥ ⊥| = 0,
the observed risks are equal to the counterfactual risks. That is, in the group
 = 0, the risk in the treated equals the risk if everybody had been treated,
Pr[ = 1| = 0  = 1] = Pr[ =1 = 1| = 0], and the risk in the untreated
equals the risk if everybody had been untreated, Pr[ = 1| = 0  = 0] =
Pr[ =0 = 1| = 0]. Following an analogous reasoning, we can conclude that
the observed risks equal the counterfactual risks in the group of 12 individuals
in critical condition, i.e., Pr[ = 1| = 1  = 1] = Pr[ =1 = 1| = 1] = 23 ,
and Pr[ = 1| = 1  = 0] = Pr[ =0 = 1| = 1] = 23 .
Suppose now our goal is to compute the causal risk ratio Pr[ =1 =
1] Pr[ =0 = 1]. The numerator of the causal risk ratio is the risk if all
20 individuals in the population had been treated. From the previous para-
graph, we know that the risk if all individuals had been treated is 14 in the 8
individuals with  = 0 and 23 in the 12 individuals with  = 1. Therefore the
risk if all 20 individuals in the population had been treated will be a weighted
average of 14 and 23 in which each group receives a weight proportional to its
size. Since 40% of the individuals (8) are in group  = 0 and 60% of the
individuals (12) are in group  = 1, the weighted average is 14 × 04 + 23 × 06 =
05. Thus the risk if everybody had been treated Pr[ =1 = 1] is equal to 05.
By following the same reasoning we can calculate that the risk if nobody had
been treated Pr[ =0 = 1] is also equal to 05. The causal risk ratio is then
0505 = 1.
More formally, the marginal counterfactual risk Pr[  = 1] is the weighted
average of the stratum-specific risks Pr[  = 1| = 0] and Pr[  = 1| = 1]
with weights equal to the proportion of individuals in the population with  = 0
and  = 1, respectively. That is, Pr[  = 1] = Pr[  = 1| = 0] Pr [ = 0] +
Pr[  = 1| = 1] Pr [ = 1]. Or, using a P
P more compact notation, Pr[  = 1] =

 Pr[ = 1| = ] Pr [ = ], where  means sum over all values  that
occur in the population. By conditional exchangeability, we can replace the
counterfactual risk Pr[  = 1| = ] by the observed P risk Pr[ = 1| =   =
] in the expression above. That is, Pr[  = 1] =  Pr[ = 1| =   =
] Pr [ = ]. The left-hand side of this equality is an unobserved counterfactual
risk whereas the right-hand side includes observed quantities only, which can
be computed using data on , , and  . When, as here, a counterfactual
quantity can be expressed as function of the distribution (i.e., probabilities)
of the observed data, we say that the counterfactual quantity is identified or
identifiable; otherwise, we say it is unidentified or not identifiable.
The method described above is known in epidemiology, demography, P and
Standardized
P mean other disciplines as standardization. For example, the numerator  Pr[ =
 E[ | =   = ] 1| =   = 1] Pr [ = ] of the causal risk ratio is the standardized risk in the
× Pr [ = ] treated using the population as the standard. In the presence of conditional ex-
changeability, this standardized risk can be interpreted as the (counterfactual)
risk that would have been observed had all the individuals in the population
20 Causal Inference

been treated.
The standardized risks in the treated and the untreated are equal to the
counterfactual risks under treatment and no treatment, respectively. There-
Pr[ =1 = 1]
fore, the causal risk ratio can be computed by standardization as
P Pr[ =0 = 1]
Pr[ = 1| =   = 1] Pr [ = ]
P .
 Pr[ = 1| =   = 0] Pr [ = ]

2.4 Inverse probability weighting


In the previous section we computed the causal risk ratio in a conditionally
randomized experiment via standardization. In this section we compute this
causal risk ratio via inverse probability weighting. The data in Table 2.2
can be displayed as a tree in which all 20 individuals start at the left and
progress over time towards the right, as in Figure 2.1. The leftmost circle of
the tree contains its first branching: 8 individuals were in non critical condi-
Figure 2.1 is an example of a tion ( = 0) and 12 in critical condition ( = 1). The numbers in parentheses
finest fully randomized causally in- are the probabilities of being in noncritical, Pr [ = 0] = 820 = 04, or crit-
terpreted structured tree graph or ical, Pr [ = 1] = 1220 = 06, condition. Let us follow, for example, the
FFRCISTG (Robins 1986, 1987). branch  = 0. Of the 8 individuals in this branch, 4 were untreated ( = 0)
Did we win the prize for the worst and 4 were treated ( = 1). The conditional probability of being untreated
acronym ever? is Pr [ = 0| = 0] = 48 = 05, as shown in parentheses. The conditional
probability of being treated Pr [ = 1| = 0] is 05 too. The upper right circle
represents that, of the 4 individuals in the branch ( = 0  = 0), 3 survived
( = 0) and 1 died ( = 1). That is, Pr [ = 0| = 0  = 0] = 34 and
Pr [ = 1| = 0  = 0] = 14 The other branches of the tree are interpreted
analogously. The circles contain the bifurcations defined by non treatment
variables. We now use this tree to compute the causal risk ratio.

Figure 2.1
Randomized experiments 21

Fine Point 2.2

Risk periods. We have defined a risk as the proportion of individuals who develop the outcome of interest during a
particular period. For example, the 5-day mortality risk in the treated Pr[ = 1| = 0] is the proportion of treated
individuals who died during the first five days of follow-up. Throughout the book we often specify the period when the
risk is first defined (e.g., 5 days) and, for conciseness, omit it later. That is, we may just say “the mortality risk” rather
than “the five-day mortality risk.”
The following example highlights the importance of specifying the risk period. Suppose a randomized experiment
was conducted to quantify the causal effect of antibiotic therapy on mortality among elderly humans infected with the
plague bacteria. An investigator analyzes the data and concludes that the causal risk ratio is 005, i.e., on average
antibiotics decrease mortality by 95%. A second investigator also analyzes the data but concludes that the causal risk
ratio is 1, i.e., antibiotics have a null average causal effect on mortality. Both investigators are correct. The first
investigator computed the ratio of 1-year risks, whereas the second investigator computed the ratio of 100-year risks.
The 100-year risk was of course 1 regardless of whether individuals received the treatment. When we say that a treatment
has a causal effect on mortality, we mean that death is delayed, not prevented, by the treatment.

Figure 2.2

The denominator of the causal risk ratio, Pr[ =0 = 1], is the counterfac-
tual risk of death had everybody in the population remained untreated. Let
us calculate this risk. In Figure 2.1, 4 out of 8 individuals with  = 0 were
untreated, and 1 of them died. How many deaths would have occurred had
the 8 individuals with  = 0 remained untreated? Two deaths, because if 8
individuals rather than 4 individuals had remained untreated, then 2 deaths
rather than 1 death would have been observed. If the number of individuals is
multiplied times 2, then the number of deaths is also doubled. In Figure 2.1,
3 out of 12 individuals with  = 1 were untreated, and 2 of them died. How
many deaths would have occurred had the 12 individuals with  = 1 remained
untreated? Eight deaths, or 2 deaths times 4, because 12 is 3× 4. That is, if all
8 + 12 = 20 individuals in the population had been untreated, then 2 + 8 = 10
would have died. The denominator of the causal risk ratio, Pr[ =0 = 1], is
1020 = 05. The first tree in Figure 2.2 shows the population had everybody
remained untreated. Of course, these calculations rely on the condition that
treated individuals with  = 0, had they remained untreated, would have had
the same probability of death as those who actually remained untreated. This
condition is precisely exchangeability given  = 0.
22 Causal Inference

The numerator of the causal risk ratio Pr[ =1 = 1] is the counterfactual
risk of death had everybody in the population been treated. Reasoning as in
the previous paragraph, this risk is calculated to be also 1020 = 05, under
exchangeability given  = 1. The second tree in Figure 2.2 shows the popu-
lation had everybody been treated. Combining the results from this and the
previous paragraph, the causal risk ratio Pr[ =1 = 1] Pr[ =0 = 1] is equal
to 0505 = 1. We are done.
Let us examine how this method works. The two trees in Figure 2.2 are
a simulation of what would have happened had all individuals in the popula-
tion been untreated and treated, respectively. These simulations are correct
under conditional exchangeability. Both simulations can be pooled to create a
hypothetical population in which every individual appears as a treated and as
an untreated individual. This hypothetical population, twice as large as the
original population, is known as the pseudo-population. Figure 2.3 shows the
entire pseudo-population. Under conditional exchangeability   ⊥ ⊥| in the
original population, the treated and the untreated are (unconditionally) ex-
changeable in the pseudo-population because the  is independent of . That
is, the associational risk ratio in the pseudo-population is equal to the causal
risk ratio in both the pseudo-population and the original population.

Figure 2.3

This method is known as inverse probability (IP) weighting. To see why,


let us look at, say, the 4 untreated individuals with  = 0 in the population
IP weighted estimators were pro- of Figure 2.1. These individuals are used to create 8 members of the pseudo-
posed by Horvitz and Thompson population of Figure 2.3. That is, each of them receives a weight of 2, which
(1952) for surveys in which subjects is equal to 105. Figure 2.1 shows that 05 is the conditional probability of
are sampled with unequal probabil- staying untreated given  = 0. Similarly, the 9 treated individuals with  = 1
ities in Figure 2.1 are used to create 12 members of the pseudo-population. That
is, each of them receives a weight of 133 = 1075. Figure 2.1 shows that 075
is the conditional probability of being treated given  = 1. Informally, the
pseudo-population is created by weighting each individual in the population
Randomized experiments 23

Technical Point 2.2

Formal definition of IP weights. An individual’s IP weight depends on her values of treatment  and covariate .
For example, a treated individual with  =  receives the weight 1 Pr [ = 1| = ], whereas an untreated individual
with  = 0 receives the weight 1 Pr [ = 0| = 0 ]. We can express these weights using a single expression for all
individuals–regardless of their individual treatment and covariate values–by using the probability density function (pdf)
of  rather than the probability of . The conditional pdf of  given  evaluated at the values  and  is represented
by | [|], or simply as  [|]. For discrete variables  and ,  [|] is the conditional probability Pr [ = | = ].
In a conditionally randomized experiment,  [|] is positive for all  such that Pr [ = ] is nonzero.
Since the denominator of the weight for each individual is the conditional density evaluated at the individual’s own
values of  and , it can be expressed as the conditional density evaluated at the random arguments  and  (as
opposed to the fixed arguments  and ), that is, as  [|]. This notation, which appeared in Figure 2.3, is used to
define the IP weights   = 1 [|]. It is needed to have a unified notation for the weights because Pr [ = | = ]
is not considered proper notation.

IP weight:   = 1 [|] by the inverse of the conditional probability of receiving the treatment level
that she indeed received. These IP weights are shown in Figure 2.3.
IP weighting yielded the same result as standardization–causal risk ratio
equal to 1– in our example above. This is no coincidence: standardization and
IP weighting are mathematically equivalent (see Technical Point 2.3). In fact,
both standardization and IP weighting can be viewed as procedures to build
a new tree in which all individuals receive treatment . Each method uses a
different set of the probabilities to build the counterfactual tree: IP weighting
uses the conditional probability of treatment  given the covariate  (as shown
in Figure 2.1), standardization uses the probability of the covariate  and the
conditional probability of outcome  given  and .
Because both standardization and IP weighting simulate what would have
been observed if the variable (or variables in the vector)  had not been used
to decide the probability of treatment, we often say that these methods adjust
for . In a slight abuse of language we sometimes say that these methods
control for , but this “analytic control” is quite different from the “physical
control” in a randomized experiment. Standardization and IP weighting can
be generalized to conditionally randomized studies with continuous outcomes
(see Technical Point 2.3).
Why not finish this book here? We have a study design (an ideal random-
ized experiment) that, when combined with the appropriate analytic method
(standardization or IP weighting), allows us to compute average causal effects.
Unfortunately, randomized experiments are often unethical, impractical, or un-
timely. For example, it is questionable that an ethical committee would have
approved our heart transplant study. Hearts are in short supply and society
favors assigning them to individuals who are more likely to benefit from the
transplant, rather than assigning them randomly among potential recipients.
Also one could question the feasibility of the study even if ethical issues were
ignored: double-blind assignment is impossible, individuals assigned to medical
treatment may not resign themselves to forego a transplant, and there may not
be compatible hearts for those assigned to transplant. Even if the study were
feasible, it would still take several years to complete it, and decisions must be
made in the interim. Frequently, conducting an observational study is the least
bad option.
24 Causal Inference

Technical Point 2.3

Equivalence of IP weighting and standardization. Assume that  [|] is positive for all  such that Pr [ = ] is
nonzero. This positivity condition is guaranteed to hold P in conditionally randomized experiments. Under positivity, the
standardized mean for treatment level  is defined as E [ | =   = ] Pr [ = ] and the IP weighted mean of 
∙ ¸ 
 ( = ) 
for treatment level  is defined as E i.e., the mean of  , reweighted by the IP weight   = 1 [|],
 [|]
in individuals with treatment value  = . The indicator function  ( = ) is the function that takes value 1 for
individuals with  = , and 0 for the others.
We now prove ∙the equality of¸ the IP weighted mean and the standardized mean under positivity. By definition of an
 ( = )  X 1
expectation, E = {E [ | =   = ]  [|] Pr [ = ]}
 [|]  [|]
P 
= {E [ | =   = ] Pr [ = ]} where in the final step we cancelled  [|] from the numerator and denominator,

and in the first step we did not need to sum over the possible values of  because because for any 0 other than  the
quantity (0 = ) is zero. The proof treats  and  as discrete but not necessarily dichotomous. For continuous 
simply replace the sum over  with an integral.
The proof makes no reference to counterfactuals or to causality. However if we further assume conditional ex-
changeability then both the IP weighted and the standardized means are equal to the counterfactual mean E [  ]. Here
we provide two different proofs of this last statement. First, we prove equality of E [  ] and the standardized mean as
in the textX X X
E [  ] = E [  | = ] Pr [ = ] = E [  | =   = ] Pr [ = ] = E [ | =   = ] Pr [ = ]
  
where the second equality is by conditional exchangeability and positivity, and the third by consistency. Second, we

prove
∙ equality of¸ E [ ] and the∙ IP weighted mean
¸ as follows:
 ( = )  ( = ) 
E  is equal to E  by consistency. Next, because positivity implies  [|] is never 0, we
 [|]  [|]
have
∙ ¸ ½ ∙ ¯ ¸¾ ½ ∙ ¯ ¸ ¾
 ( = )   ( = )  ¯¯  ( = ) ¯¯ 
E  =E E  ¯ =E E  E [ |] (by conditional exchangeability).
 [|]  [|]  [|] ¯
∙ ¯ ¸
 ( = ) ¯¯
= E {E [  |]} (because E  =1)
 [|] ¯

= E [  ]
The extension to polytomous treatments (i.e.,  can take more than two values) is straightforward. When treatment
is continuous, which is unlikely in conditionally randomized experiments, effect estimates based on the IP weights
  = 1 [|] have infinite variance and thus cannot be used. Chapter 12 describes generalized weights. In
Technical Point 3.1, we discuss that the results above do not longer hold in the absence of positivity.
Exploring the Variety of Random
Documents with Different Content
XXX. Estos motivos y el deseo de contemplar y ver mundo
hicieron que Solón se partiese de su patria y fuese a visitar al rey
Amasis en Egipto, y al rey Creso en Sardes. Este último le hospedó en
su palacio, y al tercer o cuarto día de su llegada dio orden a los
cortesanos para que mostrasen al nuevo huésped todas las riquezas y
preciosidades que se encontraban en su tesoro. Luego que todas las
hubo visto y observado prolijamente por el tiempo que quiso, le dirigió
Creso este discurso: «Ateniense, a quien de veras aprecio, y cuyo
nombre ilustre tengo bien conocido por la fama de tu sabiduría y
ciencia política, y por lo mucho que has visto y observado con la mayo
diligencia, respóndeme, caro Solón, a la pregunta que voy a dirigirte
entre tantos hombres, ¿has visto alguno hasta de ahora
completamente dichoso?». Creso hacía esta pregunta porque se creía
el más afortunado del mundo. Pero Solón, enemigo de la lisonja, y que
solamente conocía el lenguaje de la verdad, le respondió: «Sí, señor
he visto a un hombre feliz en Telo el ateniense». Admirado el rey, insta
de nuevo: «¿Y por qué motivo juzgas a Telo el más venturoso de
todos?». «Por dos razones, señor, le responde Solón; la una, porque
floreciendo su patria, vio prosperar a sus hijos, todos hombres de bien
y crecer a sus nietos en medio de la más risueña perspectiva; y la otra
porque gozando en el mundo de una dicha envidiable, le cupo la
muerte más gloriosa, cuando en la batalla de Eleusis, que dieron los
atenienses contra los fronterizos, ayudando a los suyos y poniendo en
fuga a los enemigos, murió en el lecho del honor con las armas
victoriosas en la mano, mereciendo que la patria le distinguiese con
una sepultura pública en el mismo sitio en que había muerto».
XXXI. Excitada la curiosidad de Creso por este discurso de Solón
le preguntó nuevamente a quién consideraba después de Telo e
segundo entre los felices, no dudando que al menos este lugar le sería
adjudicado. Pero Solón le respondió: «A dos argivos, llamados Cleobis
y Bitón. Ambos gozaban en su patria una decente medianía, y eran
además hombres robustos y valientes, que habían obtenido coronas en
los juegos y fiestas públicas de los atletas. También se refiere de ellos
que, como en una fiesta que los argivos hacían a Hera fuese ceremonia
legítima el que su madre[26] hubiese de ser llevada al templo en un
carro tirado de bueyes, y estos no hubiesen llegado del campo a la
hora precisa, los dos mancebos, no pudiendo esperar más, pusieron
bajo del yugo sus mismos cuellos, y arrastraron el carro en que su
madre venía sentada, por el espacio de cuarenta y cinco estadios
hasta que llegaron al templo con ella.
»Habiendo dado al pueblo que a la fiesta concurría este tierno
espectáculo, les sobrevino el término de su carrera del modo más
apetecible y más digno de envidia; queriendo mostrar en ellos el cielo
que a los hombres a veces les conviene más morir que vivir. Porque
como los ciudadanos de Argos, rodeando a los dos jóvenes celebrasen
encarecidamente su resolución, y las ciudadanas llamasen dichosa la
madre que les había dado el ser, ella muy complacida por aque
ejemplo de piedad filial, y muy ufana con los aplausos, pidió a la diosa
Hera delante de su estatua que se dignase conceder a sus hijos Cleobis
y Bitón, en premio de haberla honrado tanto, la mayor gracia que
ningún mortal hubiese jamás recibido. Hecha esta súplica, asistieron
los dos al sacrificio y al espléndido banquete, y después se fueron a
dormir en el mismo lugar sagrado, donde les cogió un sueño tan
profundo que nunca más despertaron de él. Los argivos honraron su
memoria y dedicaron sus retratos en Delfos, considerándolos como a
unos varones esclarecidos».
XXXII. A estos daba Solón el segundo lugar entre los felices
oyendo lo cual Creso, exclamó conmovido: «¿Conque apreciáis en tan
poco, amigo ateniense, la prosperidad que disfruto, que ni siquiera me
contáis por feliz al lado de esos hombres vulgares?». «¿Y a mí, replicó
Solón, me hacéis esa pregunta, a mi, que sé muy bien cuán envidiosa
es la fortuna, y cuán amiga es de trastornar los hombres? Al cabo de
largo tiempo puede suceder fácilmente que uno vea lo que no quisiera
y sufra lo que no temía.
»Supongamos setenta años el término de la vida humana. La suma
de sus días será de venticinco mil y doscientos, sin entrar en ella
ningún mes intercalar. Pero si uno quiere añadir un mes[27] cada dos
años, con la mira de que las estaciones vengan a su debido tiempo
resultarán treinta y cinco meses intercalares, y por ellos mil y cincuenta
días más. Pues en todos estos días de que constan los setenta años, y
que ascienden al número de veintiséis mil doscientos y cincuenta, no
se hallará uno solo que por la identidad de sucesos sea enteramente
parecido a otro. La vida del hombre, ¡oh Creso!, es una serie de
calamidades. En el día sois un monarca poderoso y rico, a quien
obedecen muchos pueblos; pero no me atrevo a daros aún ese nombre
que ambicionáis, hasta que no sepa cómo habéis terminado el curso de
vuestra vida. Un hombre por ser muy rico no es más feliz que otro que
solo cuenta con la subsistencia diaria, si la fortuna no le concede
disfrutar hasta el fin de su primera dicha. ¿Y cuántos infelices vemos
entre los hombres opulentos, al paso que muchos con un moderado
patrimonio gozan de la felicidad?
»El que siendo muy rico es infeliz, en dos cosas aventaja solamente
al que es feliz, pero no rico. Puede, en primer lugar, satisfacer todos
sus antojos; y en segundo, tiene recursos para hacer frente a los
contratiempos. Pero el otro le aventaja en muchas cosas; pues además
de que su fortuna le preserva de aquellos males, disfruta de buena
salud, no sabe qué son trabajos, tiene hijos honrados en quienes se
goza, y se halla dotado de una hermosa presencia. Si a esto se añade
que termine bien su carrera, ved aquí el hombre feliz que buscáis; pero
antes que uno llegue al fin, conviene suspender el juicio y no llamarle
feliz. Désele entretanto, si se quiere, el nombre de afortunado.
»Pero es imposible que ningún mortal reúna todos estos bienes
porque así como ningún país produce cuanto necesita, abundando de
unas cosas y careciendo de otras, y teniéndose por mejor aquel que da
más de su cosecha, del mismo modo no hay hombre alguno que de
todo lo bueno se halle provisto; y cualquiera que constantemente
hubiese reunido mayor parte de aquellos bienes, si después lograre
una muerte plácida y agradable, este, señor, es para mí quien merece
con justicia el nombre de dichoso. En suma, es menester conta
siempre con el fin; pues hemos visto frecuentemente desmoronarse la
fortuna de los hombres a quienes Dios había ensalzado más».
XXXIII. Este discurso, sin mezcla de adulación ni de cortesanos
miramientos, desagradó a Creso, el cual despidió a Solón, teniéndole
por un ignorante que, sin hacer caso de los bienes presentes, fijaba la
felicidad en el término de las cosas.
XXXIV. Después de la partida de Solón, la venganza del cielo se
dejó sentir sobre Creso, en castigo, a lo que parece, de su orgullo po
haberse creído el más dichoso de los mortales. Durmiendo una noche
le asaltó un sueño en que se le presentaron las desgracias que
amenazaban a su hijo. De dos que tenía, el uno era sordo y lisiado; y
el otro, llamado Atis, el más sobresaliente de los jóvenes de su edad
Este perecería traspasado con una punta de hierro si el sueño se
verificaba. Cuando Creso despertó se puso lleno de horror a medita
sobre él, y desde luego hizo casar a su hijo y no volvió a encargarle e
mando de sus tropas, a pesar de que antes era el que solía conduci
los lidios al combate; ordenando además que los dardos, lanzas y
cuantas armas sirven para la guerra, se retirasen de las habitaciones
destinadas a los hombres, y se llevasen a los cuartos de las mujeres
no fuese que permaneciendo allí colgadas pudiese alguna caer sobre
su hijo.
XXXV. Mientras Creso disponía las bodas, llegó a Sardes un frigio
de sangre real, que había tenido la desgracia de ensangrentar sus
manos con un homicidio involuntario. Puesto en la presencia del rey, le
pidió se dignase purificarle de aquella mancha, lo que ejecutó Creso
según los ritos del país, que en esta clase de expansiones son muy
parecidos a los de la Grecia. Concluida la ceremonia, y deseoso de
saber quién era y de dónde venía, le habló así: «¿Quién eres
desgraciado?, ¿de qué parte de Frigia[28] vienes?, ¿y a qué hombre o
mujer has quitado la vida?». «Soy, respondió el extranjero, hijo de
Midas, y nieto de Gordias: me llamo Adrasto; maté sin querer a un
hermano mío, y arrojado de la casa paterna, falto de todo auxilio
vengo a refugiarme a la vuestra». «Bien venido seas, le dijo Creso
pues eres de una familia amiga, y aquí nada te faltará. Sufre la
calamidad con buen ánimo, y te será más llevadera». Adrasto se quedó
hospedado en el palacio de Creso.
XXXVI. Por el mismo tiempo un jabalí enorme del monte Olimpo
devastaba los campos de los misios; los cuales, tratando de
perseguirle, en vez de causarle daño lo recibían de él nuevamente. Po
último, enviaron sus diputados a Creso, rogándole que les diese a
príncipe su hijo con algunos mozos escogidos y perros de caza para
matar aquella fiera. Creso, renovando la memoria del sueño, les
respondió: «Con mi hijo no contéis, porque es novio y no quiero
distraerle de los cuidados que ahora le ocupan; os daré, sí, todos mis
cazadores con sus perros, encargándoles hagan con vosotros los
mayores esfuerzos para ahuyentar de vuestro país el formidable
jabalí».
XXXVII. Poco satisfechos quedaron los misios con esta respuesta
cuando llegó el hijo de Creso, e informado de todo, habló a su padre
en estos términos: «En otro tiempo, padre mío, la guerra y la caza me
presentaban honrosas y brillantes ocasiones donde acreditar mi valor
pero ahora me tenéis separado de ambos ejercicios, sin haber dado yo
muestras de flojedad ni de cobardía. ¿Con qué cara me dejaré ver en la
corte de aquí en adelante al ir y volver del foro y de las concurrencias
públicas? ¿En qué concepto me tendrán los ciudadanos? ¿Qué pensará
de mí la esposa con quien acabo de unir mi destino? Permitidme, pues
que asista a la caza proyectada, o decidme por qué razón no me
conviene ir a ella».
XXXVIII. «Yo, hijo mío, respondió Creso, no he tomado estas
medidas por haber visto en ti cobardía, ni otra cosa que pudiese
desagradarme. Un sueño me anuncia que morirás en breve traspasado
por una punta de hierro. Por esto aceleré tus bodas, y no te permito
ahora ir a la caza por ver si logro, mientras viva, libertarte de aque
funesto presagio. No tengo más hijo que tú, pues el otro, sordo y
estropeado, es como si no le tuviera».
XXIX. «Es justo, replicó el joven, que se os disimule vuestro temo
y la custodia en que me habéis tenido después de un sueño tan
aciago; mas, permitidme, señor, que os interprete la visión, ya que
parece no la habéis comprendido. Si me amenaza una punta de hierro
¿qué puedo temer de los dientes y garras de un jabalí? Y puesto que
no vamos a lidiar con hombres, no pongáis obstáculo a mi marcha».
XL. «Veo, dijo Creso, que me aventajas en la inteligencia de los
sueños. Convencido de tus razones, mudo de dictamen y te doy
permiso para que vayas a caza».
XLI. En seguida llamó a Adrasto, y le dijo: «No pretendo, amigo
mío, echarte en cara tu desventura: bien sé que no eres ingrato
Recuérdote solamente que me debes tu expiación, y que hospedado en
mi palacio te proveo de cuanto necesitas. Ahora en cambio exijo de t
que te encargues de la custodia de mi hijo en esta cacería, no sea que
en el camino salgan ladrones a dañaros. A ti, además, te conviene una
expedición en que podrás acreditar el valor heredado de tus mayores y
la fuerza de tu brazo».
XLII. «Nunca, señor, respondió Adrasto, entraría de buen grado
en esta que pudiendo llamarse partida de diversión desdice de
miserable estado en que me veo, y por eso heme abstenido hasta de
frecuentar la sociedad de los jóvenes afortunados; pero agradecido a
vuestros beneficios, y debiendo corresponder a ellos, estoy pronto a
ejecutar lo que me mandáis, y quedad seguro que desempeñaré con
todo esmero la custodia de vuestro hijo, para que torne sano y salvo a
vuestra casa».
XLIII. Dichas estas palabras, parten los jóvenes, acompañados de
una tropa escogida y provistos de perros de caza. Llegados a las sierras
del Olimpo, buscan la fiera, la levantan y rodean, y disparan contra ella
una lluvia de dardos. En medio de la confusión, quiere la fortuna ciega
que el huésped purificado por Creso de su homicidio, el desgraciado
Adrasto, disparando un dardo contra el jabalí, en vez de dar en la fiera
dé en el hijo mismo de su bienhechor, en el príncipe infeliz que
traspasado con aquella punta, cumple muriendo la predicción del sueño
de su padre. Al momento despachan un correo para Creso con la nueva
de lo acaecido, el cual, llegado a Sardes, dale cuenta del choque y de
la infausta muerte de su hijo.
XLIV. Túrbase Creso al oír la noticia, y se lamenta particularmente
de que haya sido el matador de su hijo aquel cuyo homicidio había é
expiado. En el arrebato de su dolor invoca al dios de la expiación, a
dios de la hospitalidad, al dios que preside a las íntimas amistades
nombrando con estos títulos a Zeus, y poniéndole por testigo de la
paga atroz que recibe de aquel cuyas manos ensangrentadas ha
purificado, a quien ha recibido como huésped bajo su mismo techo, y
que escogido para compañero y custodio de su hijo, se había mostrado
su mayor enemigo.
XLV. Después de estos lamentos llegan los lidios con el cadáver, y
detrás el matador, el cual, puesto delante de Creso, le insta con las
manos extendidas para que le sacrifique sobre el cuerpo de su hijo
renovando la memoria de su primera desventura, y diciendo que ya no
debe vivir, después de haber dado la muerte a su mismo expiador. Pero
Creso, a pesar del sentimiento y luto doméstico que le aflige, se
compadece de Adrasto y le habla en estos términos: «Ya tengo, amigo
toda la venganza y desagravio que pudiera desear, en el hecho de
ofrecerte a morir tú mismo. Pero, ¡ah!, no es tuya la culpa, sino de
destino, y quizá de la deidad misma que me pronosticó en el sueño lo
que había de suceder».
Creso hizo los funerales de su hijo con la pompa correspondiente; y
el infeliz hijo de Midas y nieto de Gordias, el homicida involuntario de
su hermano y del hijo de su expiador, el fugitivo Adrasto, cuando vio
quieto y solitario el lugar del sepulcro, condenándose a sí mismo por e
más desdichado de los hombres, se degolló sobre el túmulo con sus
propias manos.
XLVI. Creso, privado de su hijo, cubriose de luto por dos años, a
cabo de los cuales, reflexionando que el imperio de Astiages, hijo de
Ciaxares, había sido destruido por Ciro, hijo de Cambises, y que e
poder de los persas iba creciendo de día en día, suspendió su llanto y
se puso a meditar sobre los medios de abatir la dominación persa
antes que llegara a la mayor grandeza. Con esta idea quiso hace
prueba de la verdad de los oráculos, tanto de la Grecia como de la
Libia, y despachó diferentes comisionados a Delfos, a Abas, lugar de
los focidios, y a Dodona, como también a los oráculos de Anfiarao y de
Trofonio, y al que hay en Bránquidas, en el territorio de Mileto. Estos
fueron los oráculos que consultó en la Grecia, y asimismo envió sus
diputados al templo de Amón en la Libia. Su objeto era explorar lo que
cada oráculo respondía, y si los hallaba conformes, consultarles
después si emprendería la guerra contra los persas.
XLVII. Antes de marchar, dio a sus comisionados estas
instrucciones: que llevasen bien la cuenta de los días, empezando
desde el primero que saliesen de Sardes; que al centésimo consultasen
el oráculo en estos términos: «¿En qué cosa se está ocupando en este
momento el rey de los lidios, Creso, hijo de Aliates?», y que
tomándolas por escrito, le trajesen la respuesta de cada oráculo. Nadie
refiere lo que los demás oráculos respondieron; pero en Delfos, luego
que los lidios entraron en el templo e hicieron la pregunta que se les
había mandado, respondió la Pitia con estos versos:
Sé del mar la medida, y de su arena
El número contar. No hay sordo alguno
A quien no entienda; y oigo al que no habla.
Percibo la fragancia que despide
La tortuga cocida en la vasija
De bronce, con la carne de cordero,
Teniendo bronce abajo, y bronce arriba.

XLVIII. Los lidios, tomando estos versos de la boca profética de la


Pitia, los pusieron por escrito, y volviéronse con ellos a Sardes
Llegaban entretanto las respuestas de los otros oráculos, ninguna de
las cuales satisfizo a Creso. Pero cuando halló la de Delfos, la recibió
con veneración, persuadido de que allí solo residía un verdadero
numen, pues ningún otro sino él había dado con la verdad. El caso era
que llegado el día prescrito a los comisionados para la consulta de los
dioses, discurrió Creso una ocupación que fuese difícil de adivinar, y
partiendo en varios pedazos una tortuga y un cordero, se puso a
cocerlos en una vasija de bronce, tapándola con una cobertera de
mismo metal.
XLIX. Esta ocupación era conforme a la respuesta de Delfos. La
que dio el oráculo de Anfiarao a los lidios que le consultaron sin faltar a
ninguna de las ceremonias usadas en aquel templo, no puedo deci
cuál fuera; y solo se refiere que por ella quedó persuadido Creso de
que también aquel oráculo gozaba del don de profecía.
L. Después de esto procuró Creso ganarse el favor de la deidad
que reside en Delfos, a fuerza de grandes sacrificios, pues por una
parte subieron hasta el número de tres mil las víctimas escogidas que
allí ofreció, y por otra mandó levantar una grande pira de lechos
dorados y plateados, de tazas de oro, de vestidos y túnicas de púrpura
y después la pegó fuego; ordenando también a todos los lidios que
cada uno se esmerase en sus sacrificios cuanto les fuera posible
Hecho esto, mandó derretir una gran cantidad de oro y fundir con ella
unos como medios ladrillos, de los cuales los más largos eran de seis
palmos, y los más cortos de tres, teniendo de grueso un palmo, todos
componían el número de ciento diecisiete. Entre ellos había cuatro de
oro acrisolado, que pesaba cada uno dos talentos y medio; los demás
ladrillos[29] de oro blanquecino eran del peso de dos talentos. Labró
también de oro refinado la efigie de un león, del peso de diez talentos
Este león, que al principio se hallaba erigido sobre los medios ladrillos
cayó de su basa cuando se quemó el templo de Delfos, y al presente
se halla en el tesoro de los corintios, pero con solo el peso de seis
talentos y medio, habiendo mermado tres y medio que el incendio
consumió.
LI. Fabricados estos dones, envió Creso juntamente con ellos otros
regalos, que consistían en dos grandes tazas, la una de oro, y la otra
de plata. La de oro estaba a mano derecha, al entrar en el templo, y la
de plata a la izquierda; si bien ambas, después de abrasado el templo
mudaron también de lugar; pues la de oro, que pesa ocho talentos y
medio y doce minas más, se guarda en el tesoro de los clazomenios; y
la de plata en un ángulo del portal al entrar del templo; la cual, tiene
de cabida seiscientos cántaros, y en ella ameran los de Delfos el vino
en la fiesta de la Teofanía. Dicen ser obra de Teodoro Samio, y lo creo
así; pues no me parece por su mérito pieza de artífice común. Envió
asimismo cuatro tinajas de plata, depositadas actualmente en el tesoro
de los de Corinto; y consagró también dos aguamaniles, uno de oro y
otro de plata. En el último se ve grabada esta inscripción: Don de los
lacedemonios; los cuales dicen ser suya la dádiva; pero lo dicen sin
razón, siendo una de las ofrendas de Creso. La verdad es que cierto
sujeto de Delfos, cuyo nombre conozco, aunque no lo manifestaré, le
puso aquella inscripción, queriéndose congraciar con los lacedemonios
El niño por cuya mano sale el agua sí que es don de los lacedemonios
no siéndolo ninguno de los dos aguamaniles. Muchas otras dádivas
envió Creso que nada tenían de particular, entre ellas ciertos globos de
plata fundida, y una estatua de oro de una mujer, alta tres codos, que
dicen los delfios ser la panadera de Creso. Ofreció también el collar de
oro y los cinturones de su mujer.
LII. Informado Creso del valor de Anfiarao y de su desastrado fin
[30]
le ofreció un escudo, todo él de oro puro, y juntamente una lanza
de oro macizo, con el asta del mismo metal. Entrambas ofrendas se
conservan hoy en Tebas, guardadas en el templo de Apolo Ismenio.
LIII. Los lidios encargados de llevar a los templos estos dones
recibieron orden de Creso para hacer a los oráculos la siguiente
pregunta: «Creso, monarca de los lidios y de otras naciones, bien
seguro de que son solos vuestros oráculos los que hay en el mundo
verídicos, os ofrece estas dádivas, debidas a vuestra divinidad y numen
profético, y os pregunta de nuevo, si será bien emprender la guerra
contra los persas, y juntar para ella algún ejército confederado»
Ambos oráculos convinieron en una misma respuesta, que fue la de
pronosticar a Creso, que si movía sus tropas contra los persas acabaría
con un grande imperio;[31] y le aconsejaron que, informado primero de
cuál pueblo entre los griegos fuese el más poderoso, hiciese con él un
tratado de alianza.
LIV. Sobremanera contento Creso con la respuesta, y envanecido
con la esperanza de arruinar el imperio de Ciro, envió nuevos diputados
a la ciudad de Delfos, y averiguado el número de sus moradores
regaló a cada uno dos monedas o estateres de oro.[32] En retorno los
delfios dieron a Creso y a los lidios la prerrogativa en las consultas, la
presidencia de las juntas, la inmunidad en las aduanas y el derecho
perpetuo de filiación a cualquier lidio que quisiere ser su conciudadano
LV. Tercera vez consultó Creso al oráculo, por hallarse bien
persuadido de su veracidad. La pregunta estaba reducida a saber s
sería largo su reinado, a la cual respondió la Pitia de este modo:
Cuando el rey de los medos fuere un mulo,
Huye entonces al Hermo pedregoso,
Oh lidio delicado; y no te quedes
A mostrarte cobarde y sin vergüenza.

LVI. Cuando estos versos llegaron a noticia de Creso, holgose más


con ellos que con los otros, persuadido de que nunca por un hombre
reinaría entre los medos un mulo, y que por lo mismo ni él ni sus
descendientes dejarían jamás de mantenerse en el trono. Pasó después
a averiguar con mucho esmero quiénes de entre los griegos fuesen los
más poderosos, a fin de hacerlos sus amigos, y por los informes halló
que sobresalían particularmente los lacedemonios y los atenienses
aquellos entre los dorios, y estos entre los jonios.
Aquí debo prevenir que antiguamente dos eran las naciones más
distinguidas en aquella región, la pelásgica y la helénica; de las cuales
la una jamás salió de su tierra, y la otra mudó de asiento muy a
menudo.[33] En tiempo de su rey Deucalión habitaba en la Ftiótide, y en
tiempo de Doro el hijo de Helén, ocupaba la región Histiótide, que está
al pie de los montes Osa y Olimpo. Arrojados después por los cadmeos
de la Histiótide, establecieron su morada en Pindo, y se llamó con e
nombre de Macedno. Desde allí pasó a la Driópide, y viniendo por fin a
Peloponeso, se llamó la gente dórica.
LVII. Cuál fuese la lengua que hablaban los pelasgos, no puedo
decir de positivo. Con todo, nos podemos regir por ciertas conjeturas
tomadas de los pelasgos que todavía existen: primero, de los que
habitan la ciudad de Crestona,[34] situada sobre los tirrenos (los cuales
en lo antiguo fueron vecinos de los que ahora llamamos dorios, y
moraban entonces en la región que al presente se llama la Tesaliótide)
segundo, de los pelasgos que en el Helesponto fundaron a Placia y a
Escílace (los cuales fueron antes vecinos de los atenienses); tercero, de
los que se hallan en muchas ciudades pequeñas, bien que hayan
mudado su antiguo nombre de pelasgos. Por las conjeturas que nos
dan todos estos pueblos, podremos decir que los pelasgos debían
hablar algún lenguaje bárbaro, y que la gente ática, siendo pelasga, a
incorporarse con los helenos, debió de aprender la lengua de estos
abandonando la suya propia. Lo cierto es que ni los de Crestona ni los
de Placia (ciudades que hablan entre sí una misma lengua) la tienen
común con ninguno de aquellos pueblos que son ahora sus vecinos, ve
donde se infiere que conservan el carácter mismo de la lengua que
consigo trajeron cuando se fugaron en aquellas regiones.
LVIII. Por el contrario, la nación helénica, a mi parecer, habló
siempre desde su origen el mismo idioma. Débil y separada de la
pelásgica, empezó a crecer de pequeños principios, y vino a formar un
grande cuerpo, compuesto de muchas gentes, mayormente cuando se
le fueron allegando y uniendo en gran número otras bárbaras naciones
[35]
y de aquí dimanó, según yo imagino, que la nación de los pelasgos
que era una de las bárbaras, nunca pudiese hacer grandes progresos.
LIX. De estas dos naciones oía decir Creso que el Ática se hallaba
oprimida por Pisístrato, que a la sazón era señor o tirano de los
atenienses. A su padre Hipócrates, asistiendo a los juegos olímpicos, le
sucedió un gran prodigio, y fue que las calderas que tenía ya
prevenidas para un sacrificio, llenas de agua y de carne, sin que las
tocase el fuego, se pusieron a hervir de repente hasta derramarse. E
lacedemonio Quilón, que presenció aquel portento, previno dos cosas a
Hipócrates: la primera, que nunca se casase con mujer que pudiese
darle sucesión; y la segunda, que si estaba casado, se divorciase luego
y desconociese por hijo al que ya hubiese tenido.
Por no haber seguido estos consejos le nació después Pisístrato, e
cual, aspirando a la tiranía y viendo que los atenienses litorales
capitaneados por Megacles, hijo de Alcmeón, se habían levantado
contra los habitantes de los campos, conducidos por Licurgo, el hijo de
Aristolaides, formó un tercer partido bajo el pretexto de defender a los
atenienses de las montañas, y para salir con su intento urdió la trama
de este modo. Hízose herir a sí mismo y a los mulos de su carroza, y se
fue hacia la plaza como quien huía de sus enemigos, fingiendo que le
habían querido matar en el camino de su casa de campo. Llegado a la
plaza, pidió al pueblo que, pues él antes se había distinguido mucho en
su defensa ya cuando general contra los megarenses, ya en la toma de
Nisea,[36] y con otras grandes empresas y servicios, tuviesen a bien
concederle alguna guardia para la seguridad de su persona. Engañado
el pueblo con tal artificio, diole ciertos hombres escogidos que le
escoltasen y siguiesen, los cuales estaban armados, no de lanzas, sino
de clavas. Auxiliado por estos, se apoderó Pisístrato de la ciudadela de
Atenas, y por este medio llegó a hacerse dueño de los atenienses; pero
sin alterar el orden de los magistrados ni mudar las leyes contribuyó
mucho y bien al adorno de la ciudad, gobernando bajo el plan antiguo.
LX. Poco tiempo después, unidos entre sí los partidarios de
Megacles y los de Licurgo, lograron quitar el mando a Pisístrato y
echarle de Atenas. No bien los dos partidos acabaron de expelerle
cuando volvieron de nuevo a la discordia y sedición entre sí mismos
Megacles, que se vio sitiado por sus enemigos, despachó un mensajero
a Pisístrato, ofreciéndole que si tomaba a su hija por mujer, le daría en
dote el mando de la república. Admitida la proposición y otorgadas las
condiciones, discurrieron para la vuelta de Pisístrato el artificio más
grosero que en mi opinión pudiera imaginarse, mayormente si se
observa que los griegos eran tenidos ya de muy antiguo por más
astutos que los bárbaros y menos expuestos a dejarse deslumbrar de
tales necedades y que se trataba de engañar a los atenienses
reputados por los más sabios y perspicaces de todos los griegos.
En el demo de Peania había una mujer hermosa llamada Fía, con la
estatura de cuatro codos menos tres dedos. Armada completamente, y
vestida con un traje que la hiciese parecer mucho más bella y
majestuosa, la colocaron en una carroza y la condujeron a la ciudad
enviando delante sus emisarios y pregoneros, los cuales cumplieron
bien con su encargo, y hablaron al pueblo en esta forma: «Recibid, oh
atenienses, de buena voluntad a Pisístrato, a quien la misma diosa
Atenea restituye a su alcázar, haciendo con él una demostración nunca
usada con otro mortal». Esto iban gritando por todas partes, de suerte
que muy en breve se extendió la fama del hecho por la ciudad y la
comarca; y los que se hallaban en la ciudadela, creyendo ver en
aquella mujer a la diosa misma, la dirigieron sus votos y recibieron a
Pisístrato.
LXI. Recobrada de este modo la tiranía, y cumpliendo con lo
pactado, tomó Pisístrato por mujer a la hija de Megacles. Ya entonces
tenía hijos crecidos, y no queriendo aumentar su número, con motivo
de la creencia según la cual todos los Alcmeónidas eran considerados
como una raza impía, nunca conoció a su nueva esposa en la forma
debida y regular. Si bien ella al principio tuvo la cosa oculta, después la
descubrió a su madre y esta a su marido. Megacles lo llevó muy a mal
viendo que así le deshonraba Pisístrato, y por resentimiento se
reconcilió de nuevo con los amotinados. Entretanto Pisístrato, instruido
de todo, abandonó el país y se fue a Eretria, donde, consultando con
su hijo, le pareció bien el dictamen de Hipias sobre recuperar e
mando, y al efecto trataron de recoger donativos de las ciudades que
les eran más adictas, entre las cuales sobresalió la de los tebanos po
su liberalidad. Pasado algún tiempo, quedó todo preparado para e
éxito de la empresa, así porque los argivos, gente asalariada para la
guerra, habían ya concurrido del Peloponeso, como porque un cierto
Lígdamis, natural de Naxos, habiéndoseles reunido voluntariamente
con hombres y dinero, los animaba sobremanera a la expedición.
LXII. Partiendo por fin de Eretria, volvieron al Ática once años
después de su salida, y se apoderaron primeramente de Maratón
Atrincherados en aquel punto, se les iban reuniendo, no solamente los
partidarios que tenían en la ciudad, sino también otros de diferentes
distritos, a quienes acomodaba más el dominio de un señor que la
libertad del pueblo. Su ejército se aumentaba con la gente que acudía
pero los atenienses que moraban en la misma Atenas miraron la cosa
con indiferencia todo el tiempo que gastó Pisístrato en recoger dinero
y cuando después ocupó a Maratón, hasta que sabiendo que marchaba
contra la ciudad, salieron por fin a resistirle. Los dos ejércitos
caminaban a encontrarse, y llegando al templo de Atenea Palénide
hicieron alto uno enfrente del otro. Entonces fue cuando Anfílito, e
célebre adivino de Acarnania, arrebatado de su estro se presentó a
Pisístrato y le vaticinó de este modo:
Echado el lance está, la red tendida;
Los atunes de noche se presentan
Al resplandor de la callada luna.[37]

LXIII. Pisístrato, comprendido el vaticinio, y diciendo que lo


recibía con veneración, puso en movimiento sus tropas. Muchos de los
atenienses, que habían salido de la ciudad, acababan entonces de
comer; unos se entretenían jugando a los dados, y otros reposaban
por lo cual, cayendo de repente sobre ellos las tropas de Pisístrato, se
vieron obligados a huir. Para que se mantuviesen dispersos, discurrió
Pisístrato el ardid de enviar unos muchachos a caballo, que alcanzando
a los fugitivos, los exhortasen de su parte a que tuviesen buen ánimo y
se retirasen cada uno a su casa.
LXIV. Así lo hicieron los atenienses, y logró Pisístrato apoderarse
de Atenas por tercera vez. Dueño de la ciudad, procuró arraigarse en e
mando con mayor número de tropas auxiliares, y con el aumento de
las rentas públicas, tanto recogidas en el país mismo como venidas de
río Estrimón. Con el mismo fin tomó en rehenes a los hijos de los
atenienses que, sin entregarse luego a la fuga, le habían hecho frente
y los depositó en la isla de Naxos, de la cual se había apoderado con
las armas, y cuyo gobierno había confiado a Lígdamis. Ya, obedeciendo
a los oráculos, había purificado antes la isla de Delos, mandando
desenterrar todos los cadáveres que estaban sepultados en todo e
distrito que desde el templo se podía alcanzar con la vista, haciéndolos
enterrar en los demás lugares de la isla. Pisístrato, pues, tenía bajo su
dominación a los atenienses, de los cuales algunos habían muerto en la
guerra y otros, en compañía de los Alcmeónidas, se habían ausentado
de su patria.
LXV. Este era el estado en que supo Creso que entonces se
hallaban los atenienses. De los lacedemonios averiguó que, libres ya de
sus anteriores apuros, habían recobrado la superioridad en la guerra
contra los de Tegea. Porque en el reinado de Leonte y Hegesicles, a
pesar de que los lacedemonios habían salido bien en otras guerras, sin
embargo, en la que sostenían contra los de Tegea habían sufrido
grandes reveses.
Estos mismos lacedemonios se gobernaban en lo antiguo por las
peores leyes de toda la Grecia, tanto en su administración interio
como en sus relaciones con los extranjeros, con quienes eran
insociables; pero tuvieron la dicha de mudar sus instituciones po
medio de Licurgo,[38] el hombre más acreditado de todos los
esparciatas, a quien, cuando fue a Delfos para consultar al oráculo, a
punto mismo de entrar en el templo le dijo la Pitia:
A mi templo tú vienes, oh Licurgo,
De Jove amado y de los otros dioses
Que habitan los palacios del Olimpo.
Dudo llamarte dios u hombre llamarte,
Y en la perplejidad en que me veo,
Como dios, oh Licurgo, te saludo.

También afirman algunos que la Pitia le enseñó los buenos


reglamentos de que ahora usan los esparciatas, aunque los
lacedemonios dicen que siendo tutor de su sobrino[39] Leobotes, rey de
los espartanos, los trajo de Creta. En efecto, apenas se encargó de la
tutela, cuando mudó enteramente la legislación, y tomó las
precauciones necesarias para su observancia. Después ordenó la
disciplina militar, estableciendo las enomotías, triécadas y sisitías, y
últimamente instituyó los éforos y los senadores.
LXVI. De este modo lograron los lacedemonios el mejor orden en
sus leyes y gobierno, y lo debieron a Licurgo, a quien tienen en la
mayor veneración, habiéndole consagrado un templo después de sus
días. Establecidos en un país excelente y contando con una población
numerosa, hicieron muy en breve grandes progresos, con lo cual, no
pudiendo ya gozar en paz de su misma prosperidad y teniéndose po
mejores y más valientes que los arcadios, consultaron en Delfos acerca
de la conquista de toda la Arcadia, a cuya consulta respondió así la
Pitia:
¿La Arcadia pides? Esto es demasiado.
Concederla no puedo, porque en ella,
De la dura bellota alimentados,
Muchos existen que vedarlo intenten.
Yo nada te la envidio: en lugar suyo
Puedes pisar el suelo de Tegea,
Y con soga medir su hermoso campo.

Después que los lacedemonios oyeron la respuesta, sin meterse con


los demás arcadios, emprendieron su expedición contra los de Tegea, y
engañados con aquel oráculo doble y ambiguo, se apercibieron de
grillos y sogas, como si en efecto hubiesen de cautivar a sus contrarios
Pero sucedioles al revés; porque perdida la batalla, los que de ellos
quedaron cautivos, atados con las mismas prisiones de que venían
provistos, fueron destinados a labrar los campos del enemigo. Los
grillos que sirvieron entonces para los lacedemonios se conservan aún
en Tegea, colgados alrededor del templo de Atenea.
LXVII. Al principio de la guerra los lacedemonios pelearon siempre
con desgracia; pero en tiempo de Creso, y siendo reyes de Esparta
Anaxándridas y Aristón, adquirieron la superioridad del modo siguiente
Aburridos de su mala suerte, enviaron diputados a Delfos para saber a
qué dios debían aplacar, con el fin de hacerse superiores a sus
enemigos los de Tegea. El oráculo respondió que lo lograrían con tal de
que recobrasen los huesos de Orestes, el hijo de Agamenón. Mas como
no pudiesen encontrar la urna en que estaban depositados, acudieron
de nuevo al templo, pidiendo se les manifestase el lugar donde e
héroe yacía. La Pitia respondió a los enviados en estos términos:
En un llano de Arcadia está Tegea;
Allí dos vientos soplan impelidos
Por una fuerza poderosa, y luego
Hay golpe y contragolpe, y la dureza
De los cuerpos se hiere mutuamente.
Allí del alma tierra en las entrañas
Encontrarás de Agamenón al hijo;
Llevarasle contigo, si a Tegea
Con la victoria dominar pretendes.

Oída esta respuesta, continuaron los lacedemonios en sus


pesquisas, sin poder hacer el descubrimiento que deseaban, hasta
tanto que Licas, uno de aquellos esparciatas a quienes llaman
beneméritos, dio casualmente con la urna. Llámanse beneméritos
aquellos cinco soldados que, siendo los más veteranos entre los de a
caballo, cumplido su tiempo salen del servicio; si bien el primer año de
su salida, para que no se entorpezcan con la ociosidad, se les envía de
un lugar a otro, unos acá y otros allá.
LXVIII. Licas, pues, siendo uno de los beneméritos, favorecido de
la fortuna y de su buen discurso, descubrió lo que se deseaba. Como
los dos pueblos estuviesen en comunicación con motivo de las treguas
se hallaba Licas en una fragua del territorio de Tegea, viendo lleno de
admiración la maniobra de machacar a golpe el hierro. Al mirarle tan
pasmado, suspendió el herrero su trabajo, y le dijo: «A fe mía, laconio
amigo, que si hubieses visto lo que yo, otra fuera tu admiración a la
que ahora muestras al vernos trabajar en el hierro; porque has de
saber que, cavando en el corral con el objeto de abrir un pozo, tropecé
con un ataúd de siete codos de largo; y como nunca había creído que
los hombres antiguamente fuesen mayores de lo que somos ahora
tuve la curiosidad de abrir la caja, y encontré un cadáver tan grande
como ella misma. Medile y lo volví a cubrir». Oyendo Licas esta
relación, se puso a pensar que tal vez podía ser aquel muerto e
Orestes de quien hablaba el oráculo, conjeturando que los dos fuelles
del herrero serían quizá los dos vientos; el yunque y el martillo el golpe
y el contragolpe; y en la maniobra de batir el hierro se figuraba
descubrir el mutuo choque de los cuerpos duros. Revolviendo estas
ideas en su mente se volvió a Esparta, y dio cuenta de todo a sus
conciudadanos, los cuales, concertada contra él una calumnia, le
acusaron y condenaron a destierro. Refugiándose a Tegea e
desterrado voluntario y dando razón al herrero de su desventura, le
quiso tomar en arriendo aquel corral y, si bien él se le dificultaba, a
cabo se lo supo persuadir y estableció allí su casa. Con esta ocasión
descubrió cavando el sepulcro, recogió los huesos, y fuese con ellos a
Esparta. Desde aquel tiempo, siempre que vinieron a las manos las dos
ciudades, quedaron victoriosos los lacedemonios, por quienes ya había
sido conquistada una gran parte del Peloponeso.
LXIX. Informado Creso de todas estas cosas, envió a Esparta sus
embajadores, llenos de regalos y bien instruidos de cuanto debían deci
para negociar una alianza. Llegados que fueron, se explicaron en estos
términos: «Creso, rey de los lidios y de otras naciones, prevenido por e
dios que habita en Delfos de cuánto le importa contraer amistad con e
pueblo griego, y bien informado de que vosotros, ¡oh lacedemonios!
sois los primeros y principales de toda la Grecia, acude a vosotros
queriendo en conformidad del oráculo ser vuestro amigo y aliado, de
buena fe y sin dolo alguno». Esta fue la propuesta de Creso por medio
de sus enviados. Los lacedemonios, que ya tenían noticia de la
respuesta del oráculo, muy complacidos con la venida de los lidios
formaron con solemne juramento el tratado de paz y alianza con Creso
a quien ya estaban obligados por algunos beneficios que de él antes
habían recibido. Porque habiendo enviado a Sardes a comprar el oro
que necesitaban para fabricar la estatua de Apolo, que hoy está
colocada en Tórnax de la Laconia, Creso no quiso tomarles dinero
alguno, y les dio el oro de regalo.
LXX. Por este motivo, y por la distinción que con ellos usaba
Creso, anteponiéndolos a los demás griegos, vinieron gustosos los
lacedemonios en la alianza propuesta; y queriendo mostrarse
agradecidos, mandaron trabajar, con el objeto de regalársela a Creso
una pila de bronce que podía contener trescientos cántaros; estaba
adornada por de fuera hasta el borde con la escultura de una porción
de animalitos. Esta pila no llegó a Sardes, refiriéndose de dos maneras
el extravío que padeció en el camino. Los lacedemonios dicen que
habiendo llegado cerca de Samos, noticiosos del presente aquellos
isleños, salieron con sus naves y la robaron. Pero los samios cuentan
que, navegando muy despacio los lacedemonios encargados de
conducirla, y oyendo en el viaje que Sardes, juntamente con Creso
habían caído en poder del enemigo, la vendieron ellos mismos en
Samos a unos particulares, quienes la dedicaron en el templo de Hera
y que tal vez los lacedemonios a su vuelta dirían que los samios se la
habían quitado violentamente.
LXXI. Entretanto, Creso, deslumbrado con el oráculo y creyendo
acabar en breve con Ciro y con el imperio de los persas, preparaba una
expedición contra Capadocia. Al mismo tiempo cierto lidio llamado
Sándanis, respetado ya por su sabiduría y circunspección, y célebre
después entre los lidios por el consejo que dio a Creso, le habló de esta
manera: «Veo, señor, que preparáis una expedición contra unos
hombres que tienen de pieles todo su vestido; que criados en una
región áspera, no comen lo que quieren, sino lo que pueden adquirir; y
que no beben vino, ni saben el gusto que tienen los higos, ni manja
alguno delicado. Si los venciereis, ¿qué podréis quitar a los que nada
poseen? Pero si sois vencido, reflexionad lo mucho que tenéis que
perder. Yo temo que si llegan una vez a gustar de nuestras delicias, les
tomarán tal afición, que no podremos después ahuyentarlos. Por m
parte, doy gracias a los dioses de que no hayan inspirado a los persas
el pensamiento de venir contra los lidios». Este discurso no hizo
impresión alguna en el ánimo de Creso, a pesar de la exactitud con que
pintaba el estado de los persas, los cuales antes de la conquista de los
lidios ignoraban toda especie de comodidad y regalo.
LXXII. Los capadocios, a quienes los griegos llaman sirios, habían
sido súbditos de los medos antes que dominasen los persas, y en la
actualidad obedecían a Ciro. Porque los límites que dividían el imperio
de los medos del de los lidios estaban en el río Halis; el cual, bajando
del monte Armenio, corre por la Cilicia, y desde allí va dejando a los
matienos a la derecha y a los frigios a la izquierda. Después se
encamina hacia el viento Bóreas, y pasa por entre los siro-capadocios y
los paflagonios, tocando a estos por la izquierda y a aquellos por la
derecha. De este modo el río Halis atraviesa y separa casi todas las
provincias del Asia inferior, desde el mar que está enfrente de Chipre
hasta el Ponto Euxino; pudiendo considerarse este tramo de tierra
como la cerviz de toda aquella región. Su longitud puede regularse en
cinco días de camino para un hombre sobremanera diligente.
LXXIII. Marchó Creso contra la Capadocia deseoso de añadir a
sus dominios aquel feraz terreno, y más todavía de vengarse de Ciro
confiado en las promesas del oráculo. Su resentimiento dimanaba de
que Ciro tenía prisionero a Astiages, pariente de Creso, después de
haberle vencido en batalla campal. Este parentesco de Creso con
Astiages fue contraído del modo siguiente:[40]
Una partida de escitas pastores, con motivo de una sedición
doméstica, se refugió al territorio de los medos en tiempo que reinaba
Ciaxares, hijo de Fraortes y nieto de Deyoces. Este monarca los recibió
al principio benignamente y como a unos infelices que se acogían a su
protección; y en prueba del aprecio que de ellos hacía, les confió
ciertos mancebos para que aprendiesen su lengua y el manejo de
arco. Pasado algún tiempo, como ellos fuesen a menudo a cazar, y
siempre volviesen con alguna presa, un día quiso la mala suerte que no
trajesen nada. Vueltos así con las manos vacías, Ciaxares, que no sabía
reportarse en los ímpetus de la ira, los recibió ásperamente y los llenó
de insultos. Ellos, que no creían haber merecido semejante ultraje
determinaron vengarse de él, haciendo pedazos a uno de los jóvenes
sus discípulos; al cual, guisado del mismo modo que solían guisar la
caza, se le dieron a comer a Ciaxares y a sus convidados, y al punto
huyeron con toda diligencia a Sardes, ofreciéndose al servicio de
Aliates.
LXXIV. De este principio, no queriendo después Aliates entrega
los escitas a pesar de las reclamaciones de Ciaxares, se originó entre
lidios y medos una guerra que duró cinco años, en cuyo tiempo la
victoria se declaró alternativamente por unos y otros. En las diferentes
batallas que se dieron, hubo una nocturna en el año sexto de la guerra
que ambas naciones proseguían con igual suceso, porque en medio de
la batalla misma se les convirtió el día repentinamente en noche
mutación que Tales Milesio había predicho a los jonios, fijando e
término de ella en aquel año mismo en que sucedió.[41] Entonces lidios
y medos, viendo el día convertido en noche, no solo dejaron la batalla
comenzada, sino que tanto los unos como los otros se apresuraron a
poner fin a sus discordias con un tratado de paz. Los intérpretes y
medianeros de esta pacificación fueron Siénesis[42] el cilicio, y Labineto
el babilonio;[43] los cuales, no solo les negociaron la reconciliación
mutua, sino que aseguraron la paz, uniéndolos con el vínculo de
matrimonio; pues ajustaron que Aliates diese su hija Arienis por muje
a Astiages, hijo de Ciaxares. Entre estas naciones las ceremonias
solemnes de la confederación vienen a ser las mismas que entre los
griegos, y solo tienen de particular que, haciéndose en los brazos una
ligera incisión, se lamen mutuamente la sangre.
LXXV. Astiages, como he dicho, fue a quien Ciro venció, y por más
que era su abuelo materno, le tuvo prisionero por los motivos que
significaré después a su tiempo y lugar. Irritado Creso contra e
proceder de Ciro, envió primero a saber de los oráculos si sería bien
emprender la guerra contra los persas; y persuadido de que la
respuesta capciosa que le dieron era favorable a sus intentos
emprendió después aquella expedición contra una provincia persa.
Luego que llegó Creso al río Halis, pasó su ejército por los puentes
que, según mi opinión, allí mismo había, a pesar de que los griegos
refieren que fue Tales Milesio quien le facilitó el modo de pasarle
porque dicen que no sabiendo Creso cómo haría para que pasasen sus
tropas a la otra parte del río, por no existir entonces los puentes que
hay ahora, Tales, qué se hallaba en el campo, le dio un expediente
para que el río que corría a la siniestra del ejército corriese también a
la derecha. Dicen que por más arriba de los reales hizo abrir un cauce
profundo, que en forma de semicírculo cogiese al ejército por las
espaldas, y que así extrajo una parte del agua, y volvió a introducirla
en el río por más abajo del campo, con lo cual, formándose dos
corrientes, quedaron ambas igualmente vadeables; y aun quieren
algunos que la madre antigua quedase del todo seca, con lo que yo no
me conformo, porque entonces ¿cómo hubieran podido repasar el río
cuando estuviesen de vuelta?
LXXVI. Habiendo Creso pasado el Halis con sus tropas, llegó a
una comarca de Capadocia llamada Pteria, que es la parte más fuerte y
segura de todo el país, cerca de Sínope, ciudad situada casi en la costa
del Ponto Euxino. Establecido allí su ejército, taló los campos de los
sirios, tomó la ciudad de los pterianos, a quienes hizo esclavos, y
asimismo otras de su contorno, quitando la libertad y los bienes a los
sirios, que en nada le habían agraviado. Entretanto, Ciro, habiendo
reunido sus fuerzas y tomado después todas las tropas de las
provincias intermedias, venía marchando contra Creso; y antes de
emprender género alguno de ofensa, envió sus heraldos a los jonios
para ver si los podría separar de la obediencia del monarca lidio; en lo
cual no quisieron ellos consentir. Marchó entonces contra el enemigo, y
provocándose mutuamente luego que llegaron a verse, envistiéronse
en Pteria los dos ejércitos y se trabó una acción general en la que
cayeron muchos de una y otra parte, hasta que por último los separó la
noche sin declararse por ninguno la victoria. Tanto fue el valor con que
entrambos pelearon.
LXXVII. Creso, poco satisfecho del suyo, por ser el número de sus
tropas inferior a las de Ciro,[44] viendo que este dejaba de acometerle a
día siguiente, determinó volver a Sardes con el designio de llamar a los
egipcios, en conformidad del tratado de alianza que había concluido
con Amasis, rey de aquel país, aun primero que lo hiciese con los
lacedemonios. Se proponía también hacer venir a los babilonios, de
quienes entonces era soberano Labineto, y con los cuales estaba
igualmente confederado, y asimismo pensaba requerir a los
lacedemonios, para que estuviesen prontos el día que se les señalase
Reunidas todas estas tropas con las suyas, estaba resuelto a descansa
el invierno y marchar de nuevo contra el enemigo al principio de la
primavera. Con este objeto partió para Sardes y despachó a sus aliados
unos mensajeros que les previniesen que de allí a cinco meses
juntasen sus tropas en aquella ciudad. Él desde luego licenció e
ejército con el cual acababa de pelear contra los persas, siendo de
tropas mercenarias: bien lejos de imaginar que Ciro, dada una batalla
tan sin ventaja ninguna, se propusiere dirigir su ejército hacia la capita
de la Lidia.
LXXVIII. En tanto que Creso tomaba estas medidas, sucedió que
todos los arrabales de Sardes se llenaron de sierpes, que los caballos
dejando su pasto, se iban comiendo según aquellas se mostraban
Admirado Creso de este raro portento, envió inmediatamente unos
diputados a consultar con los adivinos de Telmeso.[45] En efecto
llegaron allá; pero instruidos por los telmesenses de lo que quería deci
aquel prodigio, no tuvieron tiempo de participárselo al rey, pues antes
que pudiesen volver de su consulta, ya Creso había sido hecho
prisionero. Lo que respondieron los adivinos fue que no tardaría mucho
en venir un ejército extranjero contra la tierra de Creso, el cual en
llegando sujetaría a los naturales; dando por razón de su dicho que la
sierpe era un reptil propio del país, siendo el caballo animal guerrero y
advenedizo. Esta fue la interpretación que dieron a Creso, a la sazón ya
prisionero, si bien nada sabían ellos entonces de cuanto pasaba en
Sardes y con el mismo Creso.
LXXIX. Cuando Ciro vio, después de la batalla de Pteria, que
Creso levantaba su campo, y tuvo noticia del ánimo en que se hallaba
de despedir las tropas luego que llegase a su capital, tomó acuerdo
sobre la situación de las cosas, y halló que lo más útil y acertado sería
marchar cuanto antes con todas sus fuerzas a Sardes, primero que se
pudiesen juntar otra vez las tropas lidias. No bien adoptó este partido
cuando le puso en ejecución, caminando con tanta diligencia, que é
mismo fue el primer correo que dio el aviso a Creso de su llegada. Este
quedó confuso y en el mayor apuro, viendo que la cosa le había salido
enteramente al revés de lo que presumía; mas no por eso dejó de
presentarse en el campo con sus lidios. En aquel tiempo no había en
toda el Asia nación alguna más varonil ni esforzada que la lidia; y
peleando a caballo con grandes lanzas, se distinguía en los combates
por su destreza singular.
LXXX. Hay delante de Sardes una llanura espaciosa y elevada
donde concurrieron los dos ejércitos. Por ella corren muchos ríos, entre
ellos el Hilo, y todos van a dar en otro mayor llamado Hermo, el cual
bajando de un monte dedicado a la madre de los dioses Dindimene, va
a desaguar en el mar cerca de la ciudad de Focea. En esta llanura
viendo Ciro a los lidios formados en orden de batalla, y temiendo
mucho a la caballería enemiga, se valió de cierto ardid que el medo
Harpago le sugirió. Mandó reunir cuantos camellos seguían al ejército
cargados de víveres y bagajes, y, quitándoles las cargas, hizo monta
en ellos unos hombres vestidos con el mismo traje que suelen llevar los
soldados de a caballo. Dio orden para que estos camellos as
prevenidos se pusiesen en las primeras filas delante de la caballería de
Creso; que su infantería siguiese después, y que detrás de esta se
formase toda su caballería. Mandó circular por sus tropas la orden de
que no diesen cuartel a ninguno de los lidios, y que matasen a todos
los que se les pusiesen a tiro; pero que no quitasen la vida a Creso
aun cuando se defendiese con las armas en la mano. La razón que
tuvo para poner los caballos enfrente de la caballería enemiga fue
saber que el caballo teme tanto al camello que no puede contenerse
cuando ve su figura o percibe su olor. Por eso se valió de aquel ardid
con la mira de inutilizar la caballería de Creso, que fundaba en ella su
mayor confianza.
En efecto, lo mismo fue comenzar la pelea y oler los caballos el tufo
y ver la figura de los camellos, que retroceder al momento y dar en
tierra con todas las esperanzas de Creso. Mas no por esto se
acobardaron los lidios, ni dejaron de continuar la acción, porque
conociendo lo que era, saltaron de sus caballos y se batieron a pie con
los persas. Duró por algún tiempo el choque, en que muchos de una y
otra parte cayeron, hasta que los lidios, vueltas las espaldas, se vieron
precisados a encerrarse dentro de los muros y sufrir el sitio que luego
los persas pusieron a la plaza.
LXXXI. Persuadido Creso de que el sitio duraría mucho, envió
desde las murallas nuevos mensajeros a sus aliados, no ya como antes
para que viniesen dentro de cinco meses, sino rogándoles se
apresurasen todo lo posible a socorrerle por hallarse sitiado; y
habiéndose dirigido a todos ellos, lo hizo con particularidad a los
lacedemonios por medio de sus enviados.
LXXXII. En aquella sazón había sobrevenido a los mismos
lacedemonios una nueva contienda acerca del territorio llamado de
Tirea, que sin embargo de ser una parte de la Argólida, habiéndole
separado de ella lo usurpaban y retenían como cosa propia. Porque
toda aquella comarca en tierra firme que mira a poniente hasta Malea
pertenece a los argivos, como también la isla de Citera y las demás
vecinas. Habiendo, pues, salido a campaña los argivos con el objeto de
recobrar aquel terreno, cuando llegaron a él tuvieron con sus contrarios
un coloquio, y en él se convino que saliesen a pelear trescientos de
cada parte, con la condición de que el país quedase por los
vencedores, cualesquiera que lo fuesen; pero que entretanto el grueso
de uno y otro ejército se retirase a sus límites respectivos, y no
quedasen a la vista de los campeones; no fuese que presentes los dos
ejércitos, y testigo el uno de ellos de la pérdida de los suyos, les
quisiese socorrer.
Hecho este convenio, se retiraron los ejércitos, y los soldados
escogidos de una y otra parte trabaron la pelea, en la cual, como las
fuerzas y sucesos fuesen iguales, de seiscientos hombres quedaron
solamente tres; dos argivos, Alcenor y Cromio, y un lacedemonio
Otríades; y aún estos quedaron vivos por haber sobrevenido la noche
Los dos argivos, como si en efecto hubiesen ya vencido, se fueron
corriendo a Argos. Pero Otríades, el único de los lacedemonios
habiendo despojado a los argivos muertos, y llevado los despojos y las
armas al campo de los suyos, se quedó allí mismo guardando su
puesto. Al otro día, sabida la cosa, se presentaron ambas naciones
pretendiendo cada cual haber sido la vencedora; diciendo la una que
de los suyos eran más los vivos, y la otra que aquellos habían huido y
que el único suyo había guardado su puesto y despojado a los
enemigos muertos.[46] Por último, vinieron a las manos, y después de
haber perecido muchos de una y otra parte, se declaró la victoria po
los lacedemonios. Entonces fue cuando los argivos, que antes po
necesidad se dejaban crecer el pelo, se lo cortaron, y establecieron una
ley llena de imprecaciones para que ningún hombre lo dejase crecer en
lo sucesivo, y ninguna mujer se adornase con oro hasta que hubiesen
recobrado a Tirea. Los lacedemonios en despique publicaron otra para
dejarse crecer el cabello, que antes llevaban corto.[47] De Otríades se
dice que, avergonzado de volver a Esparta quedando muertos todos
sus compañeros, se quitó la vida allí mismo en Tirea.
LXXXIII. De este modo se hallaban las cosas de los esparciatas
cuando llegó el mensajero lidio, suplicándoles socorriesen a Creso, ya
sitiado. Ellos al punto resolvieron hacerlo; pero cuando se estaban
disponiendo para la partida y tenían ya las naves prontas, recibieron la
noticia de que, tomada la plaza de Sardes, había caído Creso vivo en
manos de los persas, con lo cual, llenos de consternación
suspendieron sus preparativos.
LXXXIV. La toma de Sardes sucedió de esta manera: A los
catorce días de sitio mandó Ciro publicar en todo el ejército, por medio
de unos soldados de caballería, que el que escalase las murallas sería
largamente premiado. Saliendo inútiles las tentativas hechas po
algunos, desistieron los demás de la empresa; y solamente un mardo
de nación, llamado Hiréades, se animó a subir por cierta parte de la
ciudadela, que se hallaba sin guardia en atención a que, siendo muy
escarpado aquel sitio, se consideraba como inexpugnable. Por esta
razón Meles, antiguo rey de Sardes,[48] no había hecho pasar po
aquella parte al monstruoso hijo León,[49] que tuvo de una concubina
por más que los adivinos de Telmeso le hubiesen vaticinado que con ta
que León girase por los muros, nunca Sardes sería tomada. Meles en
efecto le condujo por toda la muralla, menos por aquella parte que
mira al monte Tmolo, y que se creía inatacable. Pero durante el asedio
viendo Hiréades que un soldado lidio bajaba por aquel paraje a recoge
un morrión que se le había caído y volvía a subir, reflexionó sobre esta
ocurrencia, y se atrevió el día siguiente a dar por allí el asalto, siendo e
primero que subió a la muralla. Después de él hicieron otros persas lo
mismo, de manera que habiendo subido gran número de ellos fue
tomada la plaza, y entregada la ciudad al saqueo.
LXXXV. Por lo que mira a la persona de Creso, sucedió lo
siguiente: Tenía, como he dicho ya, un hijo que era mudo, pero hábi
para todo lo restante. Con el objeto de curarle había practicado
cuantas diligencias estaban a su alcance, y habiendo enviado además a
consultar el caso con el oráculo de Delfos, respondió la Pitia:
Oh Creso, rey de Lidia y muchos pueblos,
No con ardor pretendas en tu casa,
Necio, escuchar la voz del hijo amado.
Mejor sin ella está; porque si hablare,
Comenzarán entonces tus desdichas.

Cuando fue tomada la plaza, uno de los persas iba en seguimiento


de Creso, a quien no conocía, con intención de matarle; oprimido el rey
con el peso de su desventura, no procuraba evitar su destino
importándole poco morir al filo del alfanje. Pero su hijo, viendo al persa
en ademán de descargar el golpe, lleno de agitación hace un esfuerzo
para hablar, y exclama: «Hombre, no mates a Creso». Esta fue la
primera vez que el mudo habló, y después conservó la voz todo e
tiempo de su vida.
LXXXVI. Los persas, dueños de Sardes, se apoderaron también de
la persona de Creso, que habiendo reinado catorce años y sufrido
catorce días de sitio, acabó puntualmente, según el doble sentido de
oráculo, con un grande imperio, pero acabó con el suyo. Ciro, luego
que se le presentaron, hizo levantar una grande pira, y mandó que le
pusiesen encima de ella cargado de prisiones, y a su lado catorce
mancebos lidios, ya fuese con ánimo de sacrificarle a alguno de los
dioses como primicias de su botín, ya para concluir algún voto ofrecido
o quizá habiendo oído decir que Creso era muy religioso, quería proba
si alguna deidad le libertaba de ser quemado vivo: de Creso cuentan
que, viéndose sobre la pira, todo el horror de su situación no pudo
impedir que le viniese a la memoria el dicho de Solón, que parecía se
para él un aviso del cielo, de que nadie de los mortales en vida era
feliz. Lo mismo fue asaltarle este pensamiento, que como si volviera de
un largo desmayo exclamó por tres veces: «¡Oh Solón!», con un
profundo suspiro. Oyéndolo el rey de Persia, mandó a los intérpretes le
preguntasen quién era aquel a quien invocaba. Pero él no desplegó sus
labios, hasta que forzado a responder, dijo: «Es aquel que yo deseara
tratasen todos los soberanos de la tierra, más bien que posee
inmensos tesoros». Y como con estas expresiones vagas no satisficiera
a los intérpretes, le volvieron a preguntar, y él, viéndose apretado po
las voces y alboroto de los circunstantes, les dijo: que un tiempo e
ateniense Solón había venido a Sardes, y después de habe
contemplado toda su opulencia, sin hacer caso de ella le manifestó
cuanto le estaba pasando, y le dijo cosas que no solo interesaban a é
sino a todo el género humano, y muy particularmente a aquellos que
se consideran felices. Entretanto la pira, prendida la llama en sus
extremidades, comenzaba a arder; pero Ciro luego que oyó a los
intérpretes el discurso de Creso, al punto mudó de resolución
reflexionando ser hombre mortal, y no deber por lo mismo entregar a
las llamas a otro hombre, poco antes igual suyo en grandeza y
prosperidad. Temió también la venganza divina y la facilidad con que
las cosas humanas se mudan y trastornan. Poseído de estas ideas
manda inmediatamente apagar el fuego y bajar a Creso de la hoguera
y a los que con él estaban; pero todo en vano, pues por más que lo
procuraban, no podían vencer la furia de las llamas.
LXXXVII. Entonces Creso, según refieren los lidios, viendo
mudado en su favor el ánimo de Ciro, y a todos los presentes haciendo
inútiles esfuerzos para extinguir el incendio, invocó en alta voz al dios
Apolo, pidiéndole que si alguna de sus ofrendas le había sido
agradable, le socorriese en aquel apuro y le libertase del desastrado fin
que lo amenazaba. Apenas hizo llorando esta súplica, cuando a pesa
de hallarse el cielo sereno y claro, se aglomeraron de repente nubes, y
despidieron una lluvia copiosísima que dejó apagada la hoguera
Persuadido Ciro por este prodigio de cuán amigo de los dioses era
Creso, y cuán bueno su carácter, hizo que le bajasen de la pira, y luego
le preguntó: «Dime, Creso, ¿quién te indujo a emprender una
expedición contra mis estados, convirtiéndote de amigo en contrario
mío?». «Esto lo hice, señor, respondió Creso, impelido de la fortuna
que se te muestra favorable y a mí adversa. De todo tiene la culpa e
dios de los griegos, que me alucinó con esperanzas halagüeñas
porque, ¿quién hay tan necio que prefiera sin motivo la guerra a las
dulzuras de la paz? En esta los hijos dan sepultura a sus padres, y en
aquella son los padres quienes la dan a sus hijos. Pero todo debe
haber sucedido porque algún numen así lo quiso».
LXXXVIII. Libre Creso de prisiones, le mandó Ciro sentar a su
lado, y le dio muestras del aprecio que hacía de su persona, mirándole
él mismo y los de su comitiva con pasmo y admiración. En tanto Creso
meditaba dentro de sí mismo sin hablar palabra, hasta que vueltos los
ojos a la ciudad de los lidios, y viendo que la estaban saqueando los
persas, «Señor, dijo, quisiera saber si me es permitido hablar todo lo
que siento, o si es tu voluntad que calle por ahora». Ciro le animó para
que dijese con libertad cuanto le ocurría, y entonces Creso le preguntó
«¿En qué se ocupa con tanta diligencia esa muchedumbre de gente?»
«Esos, respondió Ciro, están saqueando tu ciudad y repartiéndose tus
riquezas». «¡Ah no, replicó Creso, ni la ciudad es mía, ni tampoco los
tesoros que se malbaratan en ella! Todo te pertenece ya, y a ti es
propiamente a quien se despoja con esas rapiñas».
LXXXIX. Este discurso hizo mella en el ánimo de Ciro, el cua
mandó retirar a los presentes, y consultó después a Creso lo que le
parecía deber hacer en semejante caso. «Puesto que los dioses, dijo
Creso, me han hecho prisionero y siervo tuyo, considero justo
proponerte lo que se me alcanza. Los persas son insolentes po
carácter, y pobres además. Si los dejas enriquecer con los despojos de
la ciudad saqueada, es muy natural que alguno de ellos, viéndose
demasiado rico, se rebele contra ti. Si te parece bien, coloca guardias
en todas las puertas de la ciudad con orden de quitar la presa a los
saqueadores, dándoles por razón ser absolutamente necesario ofrece
a Zeus el diezmo de todos esos bienes. De este modo no incurrirás en
el odio de los soldados, los cuales, viendo que obras con rectitud
obedecerán gustosos tu determinación».
XC. Alegrose Ciro de oír tales razones, que le parecieron muy
oportunas, las encareció sobremanera, y mandó a sus guardias
ejecutasen puntualmente lo que Creso le había indicado. Vuelto
después a Creso, le dijo: «Tus acciones y tus palabras se muestran
dignas de un ánimo real; pídeme, pues, la gracia que quisieres, seguro
de obtenerla al momento». «Yo, señor, respondió, te quedaré muy
agradecido si me das tu permiso para que, regalando estos grillos a
dios de los griegos, le pueda preguntar si le parece justo engañar a los
que le sirven, y burlarse de los que dedican ofrendas en su templo»
Ciro entonces quiso saber cuál era el motivo de sus quejas, y Creso le
dio razón de sus designios, de la respuesta de los oráculos, y
especialmente de sus magníficos regalos, y de que había hecho la
guerra contra los persas inducido por predicciones lisonjeras; y
volviendo a pedirle licencia para dar en rostro con sus desgracias a
dios que las había causado, le dijo Ciro sonriéndose: «Haz, Creso, lo
que gustes, pues yo nada pienso negarte».
Con este permiso envió luego a Delfos algunos lidios, encargándoles
pusiesen sus grillos en el umbral mismo del templo, y preguntasen a
Apolo si no se avergonzaba de haberle inducido con sus oráculos a la
guerra contra los persas, dándole a entender que con ella daría fin a
imperio de Ciro; y que presentando después sus grillos como primicias
de la guerra, le preguntasen también si los dioses griegos tenían po
ley el ser desagradecidos.
XCI. Los lidios, luego que llegaron a Delfos, hicieron lo que se les
había mandado, y se dice que recibieron esta respuesta de la Pitia: «Lo
dispuesto por el hado no pueden evitarlo los dioses mismos. Creso
paga el delito que cometió su quinto abuelo, el cual, siendo guardia de
los Heráclidas, y dejándose llevar de la perfidia de una mujer, quitó la
vida a su monarca y se apoderó de un imperio que no le pertenecía. E
dios de Delfos ha procurado con ahínco que la ruina fatal de Sardes no
se verificase en daño de Creso, sino de alguno de sus hijos; pero no le
ha sido posible trastornar el curso de los hados. Sin embargo, sus
esfuerzos le han permitido retardar por tres años la conquista de
Sardes; y sepa Creso que ha sido hecho prisionero tres años después
del tiempo decretado por el destino. ¿Y a quién debe también e
socorro que recibió cuando iba a perecer en medio de las llamas? Po
lo que hace al oráculo, no tiene Creso razón de quejarse. Apolo le
predijo que si hacía la guerra a los persas, arruinaría un grande
imperio; y cualquiera en su caso hubiera vuelto a preguntar de cuál de
los dos imperios se trataba, si del suyo o del de Ciro. Si no comprendió
la respuesta, si no quiso consultar segunda vez, échese la culpa a s
mismo. Tampoco entendió ni trató de exterminar lo que en el postre
oráculo se le dijo acerca del mulo, pues este mulo cabalmente era Ciro
el cual nació de unos padres diferentes en raza y condición, siendo su
madre meda, hija del rey de los medos Astiages, y superior en linaje a
su padre, que fue un persa, vasallo del rey de Media, y un hombre que
desde la más ínfima clase tuvo la dicha de subir al tálamo de su misma
señora».
Esta respuesta llevaron los lidios a Creso; el cual, informado de ella
confesó que toda la culpa era suya, y no del dios Apolo. Esto fue lo que
sucedió acerca del imperio de Creso y de la primera conquista de la
Jonia.
XCII. Volviendo a los donativos de Creso, no solamente fueron
ofrendas suyas las que dejo referidas, sino otras muchas que hay en
Grecia. En Tebas de Beocia consagró un trípode de oro al dios Apolo
Ismenio, y en Éfeso las vacas de oro y la mayor parte de las columnas
En el vestíbulo del templo de Delfos se ve un grande escudo de oro
Muchos de estos donativos se conservan en nuestros días, si bien
algunos pocos han perecido ya. Según he oído decir, los dones que
ofreció Creso en Bránquidas, del territorio de Mileto, son semejantes y
del mismo peso que los que dedicó en Delfos.
Sin embargo, las ofrendas hechas en Delfos y en el templo de
Anfiarao, fueron de sus propios bienes, y como primicias de la herencia
paterna; pero los otros dones pertenecieron a los bienes confiscados a
un enemigo suyo, que antes de subir Creso al trono había formado
contra él un partido con el objeto de que la corona recayese en
Pantaleón, hijo también de Aliates, pero no hermano uterino de Creso
pues este había nacido de una madre natural de la Caria, y aquel de
otra natural de la Jonia. Cuando Creso se vio en posesión del imperio
hizo morir al hombre que tanto le había resistido, despedazándole con
los peines de hierro de un cardador, y consagró del modo dicho los
bienes ofrecidos de antemano a los dioses.
XCIII. La Lidia es una tierra que no ofrece a la historia maravillas
semejantes a las que ofrecen otros países, a no ser las arenillas de oro
provenientes del monte Tmolo; pero sí nos presenta un monumento
obra la mayor de cuantas hay, después de las maravillas del mundo
egipcias y babilonias. En ella existe el túmulo de Aliates, padre de
Creso, el cual tiene en la base unas grandes piedras, y lo demás es un
Welcome to our website – the ideal destination for book lovers and
knowledge seekers. With a mission to inspire endlessly, we offer a
vast collection of books, ranging from classic literary works to
specialized publications, self-development books, and children's
literature. Each book is a new journey of discovery, expanding
knowledge and enriching the soul of the reade

Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.

Let us accompany you on the journey of exploring knowledge and


personal growth!

textbookfull.com

You might also like