100% found this document useful (1 vote)
24 views

Statistical Data Mining Using SAS Applications Second Edition Chapman Hall CRC Data Mining and Knowledge Discovery Series George Fernandez instant download

The document is a promotional overview of various data mining and knowledge discovery books, including 'Statistical Data Mining Using SAS Applications' by George Fernandez. It highlights the series' aim to integrate mathematical, statistical, and computational methods for data analysis, while providing links to purchase or download the titles. The content also includes a brief description of the series editor and the scope of the series, emphasizing practical applications and examples in data mining.

Uploaded by

puthanmirkec
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (1 vote)
24 views

Statistical Data Mining Using SAS Applications Second Edition Chapman Hall CRC Data Mining and Knowledge Discovery Series George Fernandez instant download

The document is a promotional overview of various data mining and knowledge discovery books, including 'Statistical Data Mining Using SAS Applications' by George Fernandez. It highlights the series' aim to integrate mathematical, statistical, and computational methods for data analysis, while providing links to purchase or download the titles. The content also includes a brief description of the series editor and the scope of the series, emphasizing practical applications and examples in data mining.

Uploaded by

puthanmirkec
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 79

Statistical Data Mining Using SAS Applications

Second Edition Chapman Hall CRC Data Mining and


Knowledge Discovery Series George Fernandez pdf
download
https://ebookgate.com/product/statistical-data-mining-using-sas-
applications-second-edition-chapman-hall-crc-data-mining-and-
knowledge-discovery-series-george-fernandez/

Get Instant Ebook Downloads – Browse at https://ebookgate.com


Instant digital products (PDF, ePub, MOBI) available
Download now and explore formats that suit you...

Data Mining with R Learning with Case Studies Chapman Hall


CRC Data Mining and Knowledge Discovery Series 1st Edition
Torgo
https://ebookgate.com/product/data-mining-with-r-learning-with-case-
studies-chapman-hall-crc-data-mining-and-knowledge-discovery-
series-1st-edition-torgo/
ebookgate.com

Pattern Discovery Using Sequence Data Mining Applications


and Studies 1st Edition Pradeep Kumar

https://ebookgate.com/product/pattern-discovery-using-sequence-data-
mining-applications-and-studies-1st-edition-pradeep-kumar/

ebookgate.com

Bayesian Data Analysis Second Edition Chapman Hall CRC


Texts in Statistical Science Andrew Gelman

https://ebookgate.com/product/bayesian-data-analysis-second-edition-
chapman-hall-crc-texts-in-statistical-science-andrew-gelman/

ebookgate.com

Data Mining and Knowledge Discovery for Geoscientists 1st


Edition Guangren Shi (Auth.)

https://ebookgate.com/product/data-mining-and-knowledge-discovery-for-
geoscientists-1st-edition-guangren-shi-auth/

ebookgate.com
Data Mining Using SAS Enterprise Miner A Case Study
Approach 2nd Edition

https://ebookgate.com/product/data-mining-using-sas-enterprise-miner-
a-case-study-approach-2nd-edition/

ebookgate.com

Knowledge Discovery with Support Vector Machines Wiley


Series on Methods and Applications in Data Mining 1st
Edition Lutz H. Hamel
https://ebookgate.com/product/knowledge-discovery-with-support-vector-
machines-wiley-series-on-methods-and-applications-in-data-mining-1st-
edition-lutz-h-hamel/
ebookgate.com

Knowledge Discovery Practices and Emerging Applications of


Data Mining Trends and New Domains 1st Edition A.V.
Senthil Kumar
https://ebookgate.com/product/knowledge-discovery-practices-and-
emerging-applications-of-data-mining-trends-and-new-domains-1st-
edition-a-v-senthil-kumar/
ebookgate.com

Data mining and medical knowledge management cases and


applications 1st Edition Petr Berka

https://ebookgate.com/product/data-mining-and-medical-knowledge-
management-cases-and-applications-1st-edition-petr-berka/

ebookgate.com

Biological Knowledge Discovery Handbook Preprocessing


Mining and Postprocessing of Biological Data 1st Edition
Mourad Elloumi
https://ebookgate.com/product/biological-knowledge-discovery-handbook-
preprocessing-mining-and-postprocessing-of-biological-data-1st-
edition-mourad-elloumi/
ebookgate.com
Statistical
Data Mining
Using SAS
Applications
Second Edition

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 1 5/18/10 3:36:35 PM


Chapman & Hall/CRC
Data Mining and Knowledge Discovery Series

SERIES EDITOR
Vipin Kumar
University of Minnesota
Department of Computer Science and Engineering
Minneapolis, Minnesota, U.S.A

AIMS AND SCOPE


This series aims to capture new developments and applications in data mining and knowledge
discovery, while summarizing the computational tools and techniques useful in data analysis. This
series encourages the integration of mathematical, statistical, and computational methods and
techniques through the publication of a broad range of textbooks, reference works, and hand-
books. The inclusion of concrete examples and applications is highly encouraged. The scope of the
series includes, but is not limited to, titles in the areas of data mining and knowledge discovery
methods and applications, modeling, algorithms, theory and foundations, data and knowledge
visualization, data mining systems and tools, and privacy and security issues.

PUBLISHED TITLES
UNDERSTANDING COMPLEX DATASETS: GEOGRAPHIC DATA MINING AND
DATA MINING WITH MATRIX DECOMPOSITIONS KNOWLEDGE DISCOVERY, SECOND EDITION
David Skillicorn Harvey J. Miller and Jiawei Han
COMPUTATIONAL METHODS OF FEATURE TEXT MINING: CLASSIFICATION, CLUSTERING,
SELECTION AND APPLICATIONS
Huan Liu and Hiroshi Motoda Ashok N. Srivastava and Mehran Sahami
CONSTRAINED CLUSTERING: ADVANCES IN BIOLOGICAL DATA MINING
ALGORITHMS, THEORY, AND APPLICATIONS Jake Y. Chen and Stefano Lonardi
Sugato Basu, Ian Davidson, and Kiri L. Wagstaff
INFORMATION DISCOVERY ON ELECTRONIC
KNOWLEDGE DISCOVERY FOR HEALTH RECORDS
COUNTERTERRORISM AND LAW ENFORCEMENT Vagelis Hristidis
David Skillicorn
TEMPORAL DATA MINING
MULTIMEDIA DATA MINING: A SYSTEMATIC Theophano Mitsa
INTRODUCTION TO CONCEPTS AND THEORY
Zhongfei Zhang and Ruofei Zhang RELATIONAL DATA CLUSTERING: MODELS,
ALGORITHMS, AND APPLICATIONS
NEXT GENERATION OF DATA MINING Bo Long, Zhongfei Zhang, and Philip S. Yu
Hillol Kargupta, Jiawei Han, Philip S. Yu,
Rajeev Motwani, and Vipin Kumar KNOWLEDGE DISCOVERY FROM DATA STREAMS
João Gama
DATA MINING FOR DESIGN AND MARKETING
Yukio Ohsawa and Katsutoshi Yada STATISTICAL DATA MINING USING SAS
APPLICATIONS, SECOND EDITION
THE TOP TEN ALGORITHMS IN DATA MINING George Fernandez
Xindong Wu and Vipin Kumar

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 2 5/18/10 3:36:35 PM


Chapman & Hall/CRC
Data Mining and Knowledge Discovery Series

Statistical
Data Mining
Using SAS
Applications
Second Edition

George Fernandez

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 3 5/18/10 3:36:35 PM


CRC Press
Taylor & Francis Group
6000 Broken Sound Parkway NW, Suite 300
Boca Raton, FL 33487-2742

© 2010 by Taylor and Francis Group, LLC


CRC Press is an imprint of Taylor & Francis Group, an Informa business

No claim to original U.S. Government works

Printed in the United States of America on acid-free paper


10 9 8 7 6 5 4 3 2 1

International Standard Book Number-13: 978-1-4398-1076-7 (Ebook-PDF)

This book contains information obtained from authentic and highly regarded sources. Reasonable efforts
have been made to publish reliable data and information, but the author and publisher cannot assume
responsibility for the validity of all materials or the consequences of their use. The authors and publishers
have attempted to trace the copyright holders of all material reproduced in this publication and apologize to
copyright holders if permission to publish in this form has not been obtained. If any copyright material has
not been acknowledged please write and let us know so we may rectify in any future reprint.

Except as permitted under U.S. Copyright Law, no part of this book may be reprinted, reproduced, transmit-
ted, or utilized in any form by any electronic, mechanical, or other means, now known or hereafter invented,
including photocopying, microfilming, and recording, or in any information storage or retrieval system,
without written permission from the publishers.

For permission to photocopy or use material electronically from this work, please access www.copyright.
com (http://www.copyright.com/) or contact the Copyright Clearance Center, Inc. (CCC), 222 Rosewood
Drive, Danvers, MA 01923, 978-750-8400. CCC is a not-for-profit organization that provides licenses and
registration for a variety of users. For organizations that have been granted a photocopy license by the CCC,
a separate system of payment has been arranged.

Trademark Notice: Product or corporate names may be trademarks or registered trademarks, and are used
only for identification and explanation without intent to infringe.
Visit the Taylor & Francis Web site at
http://www.taylorandfrancis.com

and the CRC Press Web site at


http://www.crcpress.com
Contents

Preface.......................................................................................................... xiii
Acknowledgments.........................................................................................xxi
About the Author....................................................................................... xxiii
1. Data Mining: A Gentle Introduction......................................................1
1.1 Introduction.......................................................................................1
1.2 Data Mining: Why It Is Successful in the IT World...........................2
1.2.1 Availability of Large Databases: Data Warehousing...............2
1.2.2 Price Drop in Data Storage and Efficient Computer
Processing..............................................................................3
1.2.3 New Advancements in Analytical Methodology....................3
1.3 Benefits of Data Mining.....................................................................4
1.4 Data Mining: Users............................................................................4
1.5 Data Mining: Tools............................................................................6
1.6 Data Mining: Steps............................................................................6
1.6.1 Identification of Problem and Defining the Data
Mining Study Goal...............................................................6
1.6.2 Data Processing.....................................................................6
1.6.3 Data Exploration and Descriptive Analysis............................7
1.6.4 Data Mining Solutions: Unsupervised Learning Methods........8
1.6.5 Data Mining Solutions: Supervised Learning Methods.........8
1.6.6 Model Validation...................................................................9
1.6.7 Interpret and Make Decisions..............................................10
1.7 Problems in the Data Mining Process...............................................10
1.8 SAS Software the Leader in Data Mining........................................10
1.8.1 SEMMA: The SAS Data Mining Process............................11
1.8.2 SAS Enterprise Miner for Comprehensive Data Mining
Solution...............................................................................11
1.9 Introduction of User-Friendly SAS Macros for Statistical
Data Mining....................................................................................12
1.9.1 Limitations of These SAS Macros........................................13

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 5 5/18/10 3:36:36 PM


vi ◾ Contents

1.10 Summary..........................................................................................13
References...................................................................................................13
2. Preparing Data for Data Mining...........................................................15
2.1 Introduction.....................................................................................15
2.2 Data Requirements in Data Mining.................................................15
2.3 Ideal Structures of Data for Data Mining.........................................16
2.4 Understanding the Measurement Scale of Variables.........................16
2.5 Entire Database or Representative Sample........................................17
2.6 Sampling for Data Mining...............................................................17
2.6.1 Sample Size..........................................................................18
2.7 User-Friendly SAS Applications Used in Data Preparation...............18
2.7.1 Preparing PC Data Files before Importing into SAS Data.......18
2.7.2 Converting PC Data Files to SAS Datasets Using the
SAS Import Wizard.............................................................20
2.7.3 EXLSAS2 SAS Macro Application to Convert PC Data
Formats to SAS Datasets.....................................................21
2.7.4 Steps Involved in Running the EXLSAS2 Macro................22
2.7.5 Case Study 1: Importing an Excel File Called “Fraud”
to a Permanent SAS Dataset Called “Fraud”.......................24
2.7.6 SAS Macro Applications—RANSPLIT2: Random
Sampling from the Entire Database.....................................25
2.7.7 Steps Involved in Running the RANSPLIT2 Macro...........26
2.7.8 Case Study 2: Drawing Training (400), Validation
(300), and Test (All Left-Over Observations) Samples
from the SAS Data Called “Fraud”......................................30
2.8 Summary..........................................................................................33
References...................................................................................................33

3. Exploratory Data Analysis....................................................................35


3.1 Introduction.....................................................................................35
3.2 Exploring Continuous Variables.......................................................35
3.2.1 Descriptive Statistics............................................................35
3.2.1.1 Measures of Location or Central Tendency.........36
3.2.1.2 Robust Measures of Location..............................36
3.2.1.3 Five-Number Summary Statistics........................37
3.2.1.4 Measures of Dispersion........................................37
3.2.1.5 Standard Errors and Confidence Interval
Estimates.............................................................38
3.2.1.6 Detecting Deviation from Normally
Distributed Data.................................................38
3.2.2 Graphical Techniques Used in EDA
of Continuous Data.............................................................39

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 6 5/18/10 3:36:36 PM


Contents ◾ vii

3.3 Data Exploration: Categorical Variable............................................ 42


3.3.1 Descriptive Statistical Estimates of Categorical Variables.......42
3.3.2 Graphical Displays for Categorical Data..............................43
3.4 SAS Macro Applications Used in Data Exploration......................... 44
3.4.1 Exploring Categorical Variables Using the SAS Macro
FREQ2............................................................................... 44
3.4.1.1 Steps Involved in Running the FREQ2 Macro...... 46
3.4.2 Case Study 1: Exploring Categorical Variables in a SAS
Dataset................................................................................47
3.4.3 EDA Analysis of Continuous Variables Using SAS
Macro UNIVAR2...............................................................49
3.4.3.1 Steps Involved in Running the UNIVAR2
Macro..................................................................51
3.4.4 Case Study 2: Data Exploration of a Continuous
Variable Using UNIVAR2..................................................53
3.4.5 Case Study 3: Exploring Continuous Data by a Group
Variable Using UNIVAR2..................................................58
3.4.5.1 Data Descriptions................................................58
3.5 Summary......................................................................................... 64
References.................................................................................................. 64

4. Unsupervised Learning Methods..........................................................67


4.1 Introduction.....................................................................................67
4.2 Applications of Unsupervised Learning Methods.............................68
4.3 Principal Component Analysis.........................................................69
4.3.1 PCA Terminology...............................................................70
4.4 Exploratory Factor Analysis..............................................................71
4.4.1 Exploratory Factor Analysis versus Principal
Component Analysis...........................................................72
4.4.2 Exploratory Factor Analysis Terminology............................73
4.4.2.1 Communalities and Uniqueness..........................73
4.4.2.2 Heywood Case....................................................73
4.4.2.3 Cronbach Coefficient Alpha................................74
4.4.2.4 Factor Analysis Methods.....................................74
4.4.2.5 Sampling Adequacy Check in Factor
Analysis...............................................................75
4.4.2.6 Estimating the Number of Factors.......................75
4.4.2.7 Eigenvalues..........................................................76
4.4.2.8 Factor Loadings...................................................76
4.4.2.9 Factor Rotation................................................... 77
4.4.2.10 Confidence Intervals and the Significance
of Factor Loading Converge................................78
4.4.2.11 Standardized Factor Scores..................................78

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 7 5/18/10 3:36:36 PM


viii ◾ Contents

4.5 Disjoint Cluster Analysis..................................................................80


4.5.1 Types of Cluster Analysis.....................................................80
4.5.2 FASTCLUS: SAS Procedure to Perform Disjoint
Cluster Analysis...................................................................81
4.6 Biplot Display of PCA, EFA, and DCA Results...............................82
4.7 PCA and EFA Using SAS Macro FACTOR2...................................82
4.7.1 Steps Involved in Running the FACTOR2 Macro...............83
4.7.2 Case Study 1: Principal Component Analysis of 1993
Car Attribute Data............................................................. 84
4.7.2.1 Study Objectives................................................. 84
4.7.2.2 Data Descriptions................................................85
4.7.3 Case Study 2: Maximum Likelihood FACTOR Analysis
with VARIMAX Rotation of 1993 Car Attribute Data.........97
4.7.3.1 Study Objectives..................................................97
4.7.3.2 Data Descriptions................................................97
4.7.3 CASE Study 3: Maximum Likelihood FACTOR
Analysis with VARIMAX Rotation Using a
Multivariate Data in the Form of Correlation Matrix........ 116
4.7.3.1 Study Objectives................................................ 116
4.7.3.2 Data Descriptions.............................................. 117
4.8 Disjoint Cluster Analysis Using SAS Macro DISJCLS2.................121
4.8.1 Steps Involved in Running the DISJCLS2 Macro..............124
4.8.2 Case Study 4: Disjoint Cluster Analysis of 1993 Car
Attribute Data...................................................................125
4.8.2.1 Study Objectives................................................125
4.8.2.2 Data Descriptions..............................................126
4.9 Summary........................................................................................140
References.................................................................................................140

5. Supervised Learning Methods: Prediction..........................................143


5.1 Introduction...................................................................................143
5.2 Applications of Supervised Predictive Methods..............................144
5.3 Multiple Linear Regression Modeling............................................. 145
5.3.1 Multiple Linear Regressions: Key Concepts and
Terminology...................................................................... 145
5.3.2 Model Selection in Multiple Linear Regression.................148
5.3.2.1 Best Candidate Models Selected Based on
AICC and SBC..................................................149
5.3.2.2 Model Selection Based on the New SAS
PROC GLMSELECT.......................................149
5.3.3 Exploratory Analysis Using Diagnostic Plots.....................150
5.3.4 Violations of Regression Model Assumptions....................154
5.3.4.1 Model Specification Error..................................154

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 8 5/18/10 3:36:36 PM


Contents ◾ ix

5.3.4.2 Serial Correlation among the Residual..............154


5.3.4.3 Influential Outliers............................................ 155
5.3.4.4 Multicollinearity................................................ 155
5.3.4.5 Heteroscedasticity in Residual Variance............ 155
5.3.4.6 Nonnormality of Residuals................................156
5.3.5 Regression Model Validation.............................................156
5.3.6 Robust Regression.............................................................156
5.3.7 Survey Regression.............................................................. 157
5.4 Binary Logistic Regression Modeling............................................. 158
5.4.1 Terminology and Key Concepts........................................ 158
5.4.2 Model Selection in Logistic Regression.............................. 161
5.4.3 Exploratory Analysis Using Diagnostic Plots.....................162
5.4.3.1 Interpretation....................................................163
5.4.3.2 Two-Factor Interaction Plots between
Continuous Variables.........................................164
5.4.4 Checking for Violations of Regression Model
Assumptions......................................................................164
5.4.4.1 Model Specification Error..................................164
5.4.4.2 Influential Outlier.............................................164
5.4.4.3 Multicollinearity................................................165
5.4.4.4 Overdispersion...................................................165
5.5 Ordinal Logistic Regression...........................................................165
5.6 Survey Logistic Regression.............................................................166
5.7 Multiple Linear Regression Using SAS Macro REGDIAG2...........167
5.7.1 Steps Involved in Running the REGDIAG2 Macro..........168
5.8 Lift Chart Using SAS Macro LIFT2..............................................169
5.8.1 Steps Involved in Running the LIFT2 Macro....................170
5.9 Scoring New Regression Data Using the SAS Macro RSCORE2..... 170
5.9.1 Steps Involved in Running the RSCORE2 Macro.............171
5.10 Logistic Regression Using SAS Macro LOGIST2...........................172
5.11 Scoring New Logistic Regression Data Using the SAS Macro
LSCORE2......................................................................................173
5.12 Case Study 1: Modeling Multiple Linear Regressions.....................173
5.12.1 Study Objectives................................................................173
5.12.1.1 Step 1: Preliminary Model Selection..................175
5.12.1.2 Step 2: Graphical Exploratory Analysis and
Regression Diagnostic Plots...............................179
5.12.1.3 Step 3: Fitting the Regression Model and
Checking for the Violations of Regression
Assumptions...................................................... 191
5.12.1.4 Remedial Measure: Robust Regression to
Adjust the Regression Parameter Estimates
to Extreme Outliers...........................................203

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 9 5/18/10 3:36:37 PM


x ◾ Contents

5.13 Case Study 2: If–Then Analysis and Lift Charts............................ 206


5.13.1 Data Descriptions............................................................. 208
5.14 Case Study 3: Modeling Multiple Linear Regression
with Categorical Variables..............................................................212
5.14.1 Study Objectives................................................................212
5.14.2 Data Descriptions..............................................................212
5.15 Case Study 4: Modeling Binary Logistic Regression.......................232
5.15.1 Study Objectives................................................................232
5.15.2 Data Descriptions............................................................. 234
5.15.2.1 Step 1: Best Candidate Model Selection............235
5.15.2.2 Step 2: Exploratory Analysis/Diagnostic Plots.....237
5.15.2.3 Step 3: Fitting Binary Logistic Regression.........239
5.16 Case Study: 5 Modeling Binary Multiple Logistic Regression....... 260
5.16.1 Study Objectives............................................................... 260
5.16.2 Data Descriptions..............................................................261
5.17 Case Study: 6 Modeling Ordinal Multiple Logistic Regression..... 286
5.17.1 Study Objectives............................................................... 286
5.17.2 Data Descriptions............................................................. 286
5.18 Summary........................................................................................301
References.................................................................................................301

6. Supervised Learning Methods: Classification.....................................305


6.1 Introduction...................................................................................305
6.2 Discriminant Analysis................................................................... 306
6.3 Stepwise Discriminant Analysis..................................................... 306
6.4 Canonical Discriminant Analysis.................................................. 308
6.4.1 Canonical Discriminant Analysis Assumptions................ 308
6.4.2 Key Concepts and Terminology in Canonical
Discriminant Analysis.......................................................309
6.5 Discriminant Function Analysis..................................................... 310
6.5.1 Key Concepts and Terminology in Discriminant
Function Analysis.............................................................. 310
6.6 Applications of Discriminant Analysis............................................313
6.7 Classification Tree Based on CHAID.............................................313
6.7.1 Key Concepts and Terminology in Classification Tree
Methods............................................................................ 314
6.8 Applications of CHAID................................................................. 316
6.9 Discriminant Analysis Using SAS Macro DISCRIM2................... 316
6.9.1 Steps Involved in Running the DISCRIM2 Macro........... 317
6.10 Decision Tree Using SAS Macro CHAID2.................................... 318
6.10.1 Steps Involved in Running the CHAID2 Macro............... 319

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 10 5/18/10 3:36:37 PM


Contents ◾ xi

6.11 Case Study 1: Canonical Discriminant Analysis and Parametric


Discriminant Function Analysis.....................................................320
6.11.1 Study Objectives................................................................320
6.11.2 Case Study 1: Parametric Discriminant Analysis...............321
6.11.2.1 Canonical Discriminant Analysis (CDA)..........328
6.12 Case Study 2: Nonparametric Discriminant Function Analysis..... 346
6.12.1 Study Objectives............................................................... 346
6.12.2 Data Descriptions..............................................................347
6.13 Case Study 3: Classification Tree Using CHAID...........................363
6.13.1 Study Objectives............................................................... 364
6.13.2 Data Descriptions............................................................. 364
6.14 Summary........................................................................................375
References.................................................................................................376
7. Advanced Analytics and Other SAS Data Mining Resources.............377
7.1 Introduction...................................................................................377
7.2 Artificial Neural Network Methods...............................................378
7.3 Market Basket Analysis..................................................................379
7.3.1 Benefits of MBA................................................................380
7.3.2 Limitations of Market Basket Analysis..............................380
7.4 SAS Software: The Leader in Data Mining.....................................381
7.5 Summary........................................................................................382
References.................................................................................................382

Appendix I: Instruction for Using the SAS Macros...............................383


Appendix II: Data Mining SAS Macro Help Files...................................387
Appendix III: Instruction for Using the SAS Macros with Enterprise
Guide Code Window..........................................................441
Index........................................................................................................... 443

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 11 5/18/10 3:36:37 PM


© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 12 5/18/10 3:36:37 PM


Preface

Objective
The objective of the second edition of this book is to introduce statistical data min-
ing concepts, describe methods in statistical data mining from sampling to decision
trees, demonstrate the features of user-friendly data mining SAS tools and, above
all, allow the book users to download compiled data mining SAS (Version 9.0 and
later) macro files and help them perform complete data mining. The user-friendly
SAS macro approach integrates the statistical and graphical analysis tools available
in SAS systems and provides complete statistical data mining solutions without
writing SAS program codes or using the point-and-click approach. Step-by-step
instructions for using SAS macros and interpreting the results are emphasized in
each chapter. Thus, by following the step-by-step instructions and downloading
the user-friendly SAS macros described in the book, data analysts can perform
complete data mining analysis quickly and effectively.

Why Use SAS Software?


The SAS Institute, the industry leader in analytical and decision support solu-
tions, offers a comprehensive data mining solution that allows you to explore large
quantities of data and discover relationships and patterns that lead to intelligent
decision-making. Enterprise Miner, SAS Institute’s data mining software, offers
an integrated environment for businesses that need to conduct comprehensive data
mining. However, if the Enterprise Miner software is not licensed at your organiza-
tion, but you have license to use other SAS BASE, STAT, and GRAPH modules,
you could still use the power of SAS to perform complete data mining by using the
SAS macro applications included in this book.
Including complete SAS codes in the data mining book for performing com-
prehensive data mining solutions is not very effective because a majority of business
and statistical analysts are not experienced SAS programmers. Quick results from
data mining are not feasible since many hours of code modification and debugging
program errors are required if the analysts are required to work with SAS program

xiii

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 13 5/18/10 3:36:37 PM


xiv ◾ Preface

codes. An alternative to the point-and-click menu interface modules is the user-


friendly SAS macro applications for performing several data mining tasks, which
are included in this book. This macro approach integrates statistical and graphical
tools available in the latest SAS systems (version 9.2) and provides user-friendly data
analysis tools, which allow the data analysts to complete data mining tasks quickly,
without writing SAS programs, by running the SAS macros in the background.
SAS Institute also released a learning edition (LE) of SAS software in recent years
and the readers who have no access to SAS software can buy a personal edition of
SAS LE and enjoy the benefits of these powerful SAS macros (See Appendix 3 for
instructions for using these macros with SAS EG and LE).

Coverage:
The following types of analyses can be performed using the user-friendly SAS macros.

◾◾ Converting PC databases to SAS data


◾◾ Sampling techniques to create training and validation samples
◾◾ Exploratory graphical techniques:
−− Univariate analysis of continuous response
−− Frequency data analysis for categorical data
◾◾ Unsupervised learning:
−− Principal component
−− Factor and cluster analysis
−− k-mean cluster analysis
−− Biplot display
◾◾ Supervised learning: Prediction
−− Multiple regression models
• Partial and VIF plots, plots for checking data and model problems
• Lift charts
• Scoring
• Model validation techniques
−− Logistic regression
• Partial delta logit plots, ROC curves false positive/negative plots
• Lift charts
◾◾ Model validation techniques
Supervised learning: Classification
−− Discriminant analysis
• Canonical discriminant analysis—biplots
• Parametric discriminant analysis
• Nonparametric discriminant analysis
• Model validation techniques
−− CHAID—decisions tree methods
• Model validation techniques

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 14 5/18/10 3:36:37 PM


Preface ◾ xv

Why Do I Believe the Book Is Needed?


During the last decade, there has been an explosion in the field of data warehousing
and data mining for knowledge discovery. The challenge of understanding data has
led to the development of new data mining tools. Data-mining books that are cur-
rently available mainly address data-mining principles but provide no instructions
and explanations to carry out a data-mining project. Also, many existing data ana-
lysts are interested in expanding their expertise in the field of data-mining and are
looking for how-to books on data mining by using the power of the SAS STAT and
GRAPH modules. Business school and health science instructors teaching in MBA
programs or MPH are currently incorporating data mining into their curriculum and
are looking for how-to books on data mining using the available software. Therefore,
this second edition book on statistical data mining, using SAS macro applications,
easily fills the gap and complements the existing data-mining book market.

Key Features of the Book


No SAS programming experience required: This is an essential how-to guide, espe-
cially suitable for data analysts to practice data mining techniques for knowl-
edge discovery. Thirteen very unique user-friendly SAS macros to perform
statistical data mining are described in the book. Instructions are given in the
book in regard to downloading the compiled SAS macro files, macro-call file,
and running the macro from the book’s Web site. No experience in modify-
ing SAS macros or programming with SAS is needed to run these macros.
Complete analysis in less than 10 min.: After preparing the data, complete predic-
tive modeling, including data exploration, model fitting, assumption checks,
validation, and scoring new data, can be performed on SAS datasets in less
than 10 min.
SAS enterprise minor not required: The user-friendly macros work with the
standard SAS modules: BASE, STAT, GRAPH, and IML. No additional
SAS modules or the SAS enterprise miner is required.
No experience in SAS ODS required: Options are available in the SAS mac-
ros included in the book to save data mining output and graphics in RTF,
HTML, and PDF format using SAS new ODS features.
More than 150 figures included in this second edition: These statistical data min-
ing techniques stress the use of visualization to thoroughly study the struc-
ture of data and to check the validity of statistical models fitted to data. This
allows readers to visualize the trends and patterns present in their database.

Textbook or a Supplementary Lab Guide


This book is suitable for adoption as a textbook for a statistical methods course in
statistical data mining and research methods. This book provides instructions and

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 15 5/18/10 3:36:37 PM


xvi ◾ Preface

tools for quickly performing a complete exploratory statistical method, regression


analysis, logistic regression multivariate methods, and classification analysis. Thus,
it is ideal for graduate level statistical methods courses that use SAS software.
Some examples of potential courses:

◾◾ Biostatistics
◾◾ Research methods in public health
◾◾ Advanced business statistics
◾◾ Applied statistical methods
◾◾ Research methods
◾◾ Advanced data analysis

What Is New in the Second Edition?


◾◾ Active internet connection is no longer required to run these macros: After down-
loading the compiled SAS macros and the mac-call files and installing them
in the C:\ drive, users can access these macros directly from their desktop.
◾◾ Compatible with version 9 : All the SAS macros are compatible with SAS ver-
sion 9.13 and 9.2 Windows (32 bit and 64 bit).
◾◾ Compatible with SAS EG: Users can run these SAS macros in SAS Enterprise
Guide (4.1 and 4.2) code window and in SAS learning Edition 4.1 by using
the special macro-call files and special macro files included in the download-
able zip file. (See Appendixes 1 and 3 for more information.)
◾◾ Convenient help file location: The help files for all 13 included macros are now
separated from the chapter and included in Appendix 2.
◾◾ Publication quality graphics: Vector graphics format such as EMF can be gen-
erated when output file format TXT is chosen. Interactive ActiveX graphics
can be produced when Web output format is chosen.
◾◾ Macro-call error check: The macro-call input values are copied to the first 10
title statements in the first page of the output files. This will help to track the
macro input errors quickly.

Additionally the following new features are included in the SAS-specific macro
application:

I. Chapter 2
a. Converting PC data files to SAS data (EXLSAS2 macro)
−− All numeric (m) and categorical variables (n) in the Excel file are converted to
X1-Xm and C1-Cn, respectively. However, the original column names will be
used as the variable labels in the SAS data. This new feature helps to maximize
the power of the user-friendly SAS macro applications included in the book.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 16 5/18/10 3:36:37 PM


Preface ◾ xvii

−− Options for renaming any X1-X n or C1-C n variables in a SAS data step are
available in EXLSAS2 macro application.
−− Using SAS ODS graphics features in version 9.2, frequency distribu-
tion display of all categorical variables will be generated when WORD,
HTML, PDF, and TXT format are selected as output file formats.
b. Randomly splitting data (RANSPLIT2)
−− Many different sampling methods such as simple random sampling, stratified
random sampling, systematic random sampling, and unrestricted random
sampling are implemented using the SAS SURVEYSELECT procedure.

II. Chapter 3
a. Frequency analysis (FREQ2)
−− For one-way frequency analysis, the Gini and Entropy indexes are
reported automatically.
−− Confidence interval estimates for percentages in frequency tables are
automatically generated using the SAS SURVEYFREQ procedure. If
survey weights are specified, then these confidence interval estimates are
adjusted for survey sampling and design structures.
b. Univariate analysis (UNIVAR2)
−− If survey weights are specified, then the reported confidence interval
estimates are adjusted for survey sampling and design structures using
SURVEYMEAN procedure.

III. Chapter 4
a. PCA and factor analysis (FACTOR2)
−− PCA and factor analysis can be performed using the covariance matrix.
−− Estimation of Cronbach coefficient alpha and their 95% confidence inter-
vals when performing latent factor analysis.
−− Factor pattern plots (New 9.2: statistical graphics feature) before and
after rotation.
−− Assessing the significance and the nature of factor loadings (New 9.2:
statistical graphics feature).
−− Confidence interval estimates for factor loading when ML factor analysis
is used.
b. Disjoint cluster analysis (DISJCLUS2)

IV. Chapter 5
a. Multiple linear regressions (REGDIAG2)
−− Variable screening step using GLMSELECT and best candidate model
selection using AICC and SBC.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 17 5/18/10 3:36:37 PM


xviii ◾ Preface

−− Interaction diagnostic plots for detecting significant interaction between


two continuous variables or between a categorical and continuous
variable.
−− Options are implemented to run the ROBUST regression using SAS
ROBUSTREG when extreme outliers are present in the data.
−− Options are implemented to run SURVEYREG regression using SAS
SURVEYREG when the data is coming from a survey data and the
design weights are available.

b. Logistic regression (LOGIST2)


−− Best candidate model selection using AICC and SBC criteria by compar-
ing all possible combination of models within an optimum number of
subsets determined by the sequential step-wise selection using AIC.
−− Interaction diagnostic plots for detecting significant interaction between two
continuous variables or between a categorical and continuous variable.
−− LIFT charts for assessing the overall model fit are automatically generated.
−− Options are implemented to run survey logistic regression using SAS
PROC SURVEYLOGISTIC when the data is coming from a survey data
and the design weights are available.

V. Chapter 6

CHAID analysis (CHAID2)


−− Large data (>1000 obs) can be used.
−− Variable selection using forward and stepwise selection and backward
elimination methods.
−− New SAS SGPLOT graphics are used in data exploration.

Potential Audience
◾◾ This book is suitable for SAS data analysts, who need to apply data mining
techniques using existing SAS modules for successful data mining, without
investing a lot of time in buying new software products, or spending time on
additional software learning.
◾◾ Graduate students in business, health sciences, biological, engineering, and
social sciences can successfully complete data analysis projects quickly using
these SAS macros.
◾◾ Big business enterprises can use data mining SAS macros in pilot studies
involving the feasibility of conducting a successful data mining endeavor
before investing big bucks on full-scale data mining using SAS EM.
◾◾ Finally, any SAS users who want to impress their boss can do so with quick and
complete data analysis, including fancy reports in PDF, RTF, or HTML format.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 18 5/18/10 3:36:38 PM


Preface ◾ xix

Additional Resources
Book’s Web site: A Web site has been setup at http://www.cabnr.unr.edu/gf/dm.
Users can find information in regard to downloading the sample data files used in
the book, and additional reading materials. Users are also encouraged to visit this
page for information on any errors in the book, SAS macro updates, and links for
additional resources.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 19 5/18/10 3:36:38 PM


© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 20 5/18/10 3:36:38 PM


Acknowledgments

I am indebted to many individuals who have directly and indirectly contributed


to the development of this book. I am grateful to my professors, colleagues,
and my former and present students who have presented me with consulting
problems over the years that have stimulated me to develop this book and
the accompanying SAS macros. I would also like to thank the University of
Nevada–Reno and the Center for Research Design and Analysis faculty and
staff for their support during the time I spent on writing the book and in revis-
ing the SAS macros.
I have received constructive comments about this book from many CRC Press
anonymous reviewers, whose advice has greatly improved this edition. I would like
to acknowledge the contribution of the CRC Press staff from the conception to the
completion of this book. I would also like to thank the SAS Institute for providing
me with an opportunity to continuously learn about this powerful software for the
past 23 years and allowing me to share my SAS knowledge with other users.
I owe a great debt of gratitude to my family for their love and support as well
as their great sacrifice during the last 12 months while I was working on this book.
I cannot forget to thank my late dad, Pancras Fernandez, and my late grandpa,
George Fernandez, for their love and support, which helped me to take challeng-
ing projects and succeed. Finally, I would like to thank the most important person
in my life, my wife Queency Fernandez, for her love, support, and encouragement
that gave me the strength to complete this book project within the deadline.

George Fernandez
University of Nevada-Reno
[email protected]

xxi

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 21 5/18/10 3:36:38 PM


© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 22 5/18/10 3:36:38 PM


About the Author

George Fernandez, Ph.D., is a professor of applied statistical methods and serves


as the director of the Reno Center for Research Design and Analysis, University of
Nevada. His publications include an applied statistics book, a CD-Rom, 60 journal
papers, and more than 30 conference proceedings. Dr. Fernandez has more than 23
years of experience teaching applied statistics courses and SAS programming.
He has won several best-paper and poster presentation awards at regional and
international conferences. He has presented several invited full-day workshops on
applications of user-friendly statistical methods in data mining for the American
Statistical Association, including the joint meeting in Atlanta (2001); Western SAS*
users conference in Arizona (2000), in San Diego (2002) and San Jose (2005); and
at the 56th Deming’s conference, Atlantic City (2003). He was keynote speaker
and workshop presenter for the 16th Conference on Applied Statistics, Kansas State
University, and full-day workshop presenter at the 57th session of the International
Statistical Institute conference at Durbin, South Africa (2009). His recent paper,
“A new and simpler way to calculate body’s Maximum Weight Limit–BMI made
simple,” has received worldwide recognition.

* This was originally an acronym for statistical analysis system. Since its founding and adoption
of the term as its trade name, the SAS Institute, headquartered in North Carolina, has consid-
erably broadened its scope.

xxiii

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 23 5/18/10 3:36:38 PM


© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 24 5/18/10 3:36:38 PM


Chapter 1

Data Mining: A Gentle


Introduction

1.1 Introduction
Data mining, or knowledge discovery in databases (KDD), is a powerful infor-
mation technology tool with great potential for extracting previously unknown
and potentially useful information from large databases. Data mining automates
the process of finding relationships and patterns in raw data and delivers results
that can either be utilized in an automated decision support system or assessed by
decision makers. Many successful enterprises practice data mining for intelligent
decision making.1 Data mining allows the extraction of nuggets of knowledge
from business data that can help enhance customer relationship management
(CRM)2 and can help estimate the return on investment (ROI).3 Using power-
ful advanced analytical techniques, data mining enables institutions to turn raw
data into valuable information and thus gain a critical competitive advantage.
With data mining, the possibilities are endless. Although data mining appli-
cations are popular among forward-thinking businesses, other disciplines that
maintain large databases could reap the same benefits from properly carried out
data mining. Some of the potential applications of data mining include charac-
terizations of genes in animal and plant genomics, clustering and segmentations
in remote sensing of satellite image data, and predictive modeling in wildfire inci-
dence databases.
The purpose of this chapter is to introduce data mining concepts, provide some
examples of data mining applications, list the most commonly used data min-
ing techniques, and briefly discuss the data mining applications available in the

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 1 5/18/10 3:36:38 PM


2 ◾ Statistical Data Mining Using SAS Applications

SAS software. For a thorough discussion of data mining concept, methods, and
applications, see the following publications.4–6

1.2 Data Mining: Why it is Successful in the IT World


In today’s world, we are overwhelmed with data and information from various sources.
Advances in the field of IT make the collection of data easier than ever before. A busi-
ness enterprise has various systems such as transaction processing system, HR manage-
ment system, accounting system, and so on, and each of these systems collects huge
piles of data everyday. Data mining is an important part of business intelligence that
deals with how an organization uses, analyzes, manages, and stores data it collects
from various sources to make better decisions. Businesses that have already invested in
business intelligence solutions will be in a better position to undertake right measures
to survive and continue its growth. Data mining solutions provide an analytical insight
into the performance of an organization based on historical data, but the economic
impact on an organization is linked to many issues and, in many cases, to external
forces and unscrupulous activities. The failure to predict this does not undermine the
role of data mining for organizations, but on the contrary, makes it more important,
especially for regulatory bodies of governments, to predict and identify such practices
in advance and take necessary measures to avoid such circumstances in future. The
main components of data mining success are described in the following subsections.

1.2.1 Availability of Large Databases: Data Warehousing


Data mining derives its name from the fact that analysts search for valuable informa-
tion in gigabytes of huge databases. For the past two decades, we have seen a dramatic
increase—at an explosive rate—in the amount of data being stored in electronic
format. The increase in the use of electronic data-gathering devices such as point-
of-sale, Web logging, or remote sensing devices has contributed to this explosion of
available data. The amount of data accumulated each day by various businesses and
scientific and governmental organizations around the world is daunting. With data
warehousing, business enterprises can collect data from any source within or outside
the organization, reorganize the data, and place it in new dynamic storage for effi-
cient utilization. Business enterprises of all kinds now computerize all their business
activities and their abilities to manage their valuable data resources. One hundred
gigabytes of databases are now common, and terabyte (1000 GB) databases are now
feasible in enterprises. Data warehousing techniques enable forward-thinking busi-
nesses to collect, save, maintain, and retrieve data in a more productive way.
Data warehousing (DW) collects data from many different sources, reorga-
nizes it, and stores it within a readily accessible repository that DW should support
relational, hierarchical, and multidimensional database management systems, and
is designed specifically to meet the needs of data mining. A DW can be loosely

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 2 5/18/10 3:36:38 PM


Data Mining ◾ 3

defined as any centralized data repository that makes it possible to extract archived
operational data and overcome inconsistencies between different data formats.
Thus, data mining and knowledge discovery from large databases become feasible
and productive with the development of cost-effective data warehousing.
A successful data warehousing operation should have the potential to integrate
data wherever it is located and whatever its format. It should provide the busi-
ness analyst with the ability to quickly and effectively extract data tables, resolve
data quality problems, and integrate data from different sources. If the quality of
the data is questionable, then business users and decision makers cannot trust the
results. In order to fully utilize data sources, data warehousing should allow you
to make use of your current hardware investments, as well as provide options for
growth as your storage needs expand. Data warehousing systems should not limit
customer choices, but instead should provide a flexible architecture that accommo-
dates platform-independent storage and distributed processing options.
Data quality is a critical factor for the success of data warehousing projects.
If business data is of an inferior quality, then the business analysts who query the
database and the decision makers who receive the information cannot trust the
results. The quality of individual records is necessary to ensure that the data is
accurate, updated, and consistently represented in the data warehousing.

1.2.2 Price Drop in Data Storage and


Efficient Computer Processing
Data warehousing became easier, more efficient, and cost-effective as the cost of
data processing and database development dropped. The need for improved and
effective computer processing can now be met in a cost-effective manner with par-
allel multiprocessor computer technology. In addition to the recent enhancement
of exploratory graphical statistical methods, the introduction of new machine-
learning methods based on logic programming, artificial intelligence, and genetic
algorithms have opened the doors for productive data mining. When data mining
tools are implemented on high-performance parallel-processing systems, they can
analyze massive databases in minutes. Faster processing means that users can auto-
matically experiment with more models to understand complex data. High speed
makes it practical for users to analyze huge quantities of data.

1.2.3 New Advancements in Analytical Methodology


Data mining algorithms embody techniques that have existed for at least 10 years,
but have only recently been implemented as mature, reliable, understandable tools
that consistently outperform older methods. Advanced analytical models and algo-
rithms, including data visualization and exploration, segmentation and cluster-
ing, decision trees, neural networks, memory-based reasoning, and market basket

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 3 5/18/10 3:36:38 PM


4 ◾ Statistical Data Mining Using SAS Applications

analysis, provide superior analytical depth. Thus, quality data mining is now fea-
sible with the availability of advanced analytical solutions.

1.3 Benefits of Data Mining


For businesses that use data mining effectively, the payoffs can be huge. By applying
data mining effectively, businesses can fully utilize data about customers’ buying
patterns and behavior, and can gain a greater understanding of customers’ motiva-
tions to help reduce fraud, forecast resource use, increase customer acquisition, and
halt customer attrition. After a successful implementation of data mining, one can
sweep through databases and identify previously hidden patterns in one step. An
example of pattern discovery is the analysis of retail sales data to identify seem-
ingly unrelated products that are often purchased together. Other pattern discov-
ery problems include detecting fraudulent credit card transactions and identifying
anomalous data that could represent data entry keying errors. Some of the specific
benefits associated with successful data mining are listed here:

◾◾ Increase customer acquisition and retention.


◾◾ Uncover and reduce frauds (determining if a particular transaction is out of the
normal range of a person’s activity and flagging that transaction for verification).
◾◾ Improve production quality, and minimize production losses in manufacturing.
◾◾ Increase upselling (offering customers a higher level of services or products
such as a gold credit card versus a regular credit card) and cross-selling (selling
customers more products based on what they have already bought).
◾◾ Sell products and services in combinations based on market-basket analysis (by
determining what combinations of products are purchased at a given time).

1.4 Data Mining: Users


A wide range of companies have deployed successful data mining applications recently.1
While the early adopters of data mining belong mainly to information-intensive indus-
tries such as financial services and direct mail marketing, the technology is applicable
to any institution looking to leverage a large data warehouse to extract information
that can be used in intelligent decision making. Data mining applications reach across
industries and business functions. For example, telecommunications, stock exchanges,
credit card, and insurance companies use data mining to detect fraudulent use of their
services; the medical industry uses data mining to predict the effectiveness of surgical
procedures, diagnostic medical tests, and medications; and retailers use data mining
to assess the effectiveness of discount coupons and sales’ promotions. Data mining has
many varied fields of application, some of which are listed as follows:

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 4 5/18/10 3:36:38 PM


Data Mining ◾ 5

◾◾ Retail/Marketing : An example of pattern discovery in retail sales is to iden-


tify seemingly unrelated products that are often purchased together. Market-
basket analysis is an algorithm that examines a long list of transactions in
order to determine which items are most frequently purchased together. The
results can be useful to any company that sells products, whether it is in a
store, a catalog, or directly to the customer.
◾◾ Banking : A credit card company can leverage its customer transaction data-
base to identify customers most likely to be interested in a new credit product.
Using a small test mailing, the characteristics of customers with an affinity
for the product can be identified. Data mining tools can also be used to
detect patterns of fraudulent credit card use, including detecting fraudulent
credit card transactions and identifying anomalous data that could represent
data entry keying errors. It identifies “loyal” customers, predicts customers
likely to change their credit card affiliation, determines credit card spend-
ing by customer groups, finds hidden correlations between different financial
indicators, and can identify stock trading rules from historical market data.
It also finds hidden correlations between different financial indicators and
identifies stock trading rules from historical market data.
◾◾ Insurance and health care: It claims analysis—that is, which medical procedures
are claimed together. It predicts which customers will buy new policies, identi-
fies behavior patterns of risky customers, and identifies fraudulent behavior.
◾◾ Transportation: State departments of transportation and federal highway
institutes can develop performance and network optimization models to pre-
dict the life-cycle cost of road pavement.
◾◾ Product manufacturing companies : They can apply data mining to improve
their sales process to retailers. Data from consumer panels, shipments, and
competitor activity can be applied to understand the reasons for brand
and store switching. Through this analysis, manufacturers can select pro-
motional strategies that best reach their target customer segments. The
distribution schedules among outlets can be determined, loading patterns
can be analyzed, and the distribution schedules among outlets can be
determined.
◾◾ Health care and pharmaceutical industries: Pharmaceutical companies can
analyze their recent sales records to improve their targeting of high-value
physicians and determine which marketing activities will have the greatest
impact in the next few months. The ongoing, dynamic analysis of the data
warehouse allows the best practices from throughout the organization to be
applied in specific sales situations.
◾◾ Internal Revenue Service (IRS) and Federal Bureau of Investigation (FBI): The
IRS uses data mining to track federal income tax frauds. The FBI uses data
mining to detect any unusual pattern or trends in thousands of field reports
to look for any leads in terrorist activities.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 5 5/18/10 3:36:38 PM


6 ◾ Statistical Data Mining Using SAS Applications

1.5 Data Mining: Tools


All data mining methods used now have evolved from the advances in computer
engineering, statistical computation, and database research. Data mining meth-
ods are not considered to replace traditional statistical methods but extend the
use of statistical and graphical techniques. Once it was thought that automated
data mining tools would eliminate the need for statistical analysts to build pre-
dictive models. However, the value that an analyst provides cannot be automated
out of existence. Analysts will still be needed to assess model results and validate
the plausibility of the model predictions. Since data mining software lacks the
human experience and intuition to recognize the difference between a relevant
and irrelevant correlation, statistical analysts will remain in great demand.

1.6 Data Mining: Steps


1.6.1 Identification of Problem and Defining
the Data Mining Study Goal
One of the main causes of data mining failure is not defining the study goals based
on short- and long-term problems facing the enterprise. The data mining specialist
should define the study goal in clear and sensible terms of what the enterprise hopes
to achieve and how data mining can help. Well-identified study problems lead to
formulated data mining goals, and data mining solutions geared toward measur-
able outcomes.4

1.6.2 Data Processing
The key to successful data mining is using the right data. Preparing data for mining
is often the most time-consuming aspect of any data mining endeavor. A typical
data structure suitable for data mining should contain observations (e.g., custom-
ers and products) in rows and variables (demographic data and sales history) in
columns. Also, the measurement levels (interval or categorical) of each variable in
the dataset should be clearly defined. The steps involved in preparing the data for
data mining are as follows:

Preprocessing: This is the data-cleansing stage, where certain information that is


deemed unnecessary and may slow down queries is removed. Also, the data is
checked to ensure that a consistent format (different types of formats used in
dates, zip codes, currency, units of measurements, etc.) exists. There is always
the possibility of having inconsistent formats in the database because the data
is drawn from several sources. Data entry errors and extreme outliers should
be removed from the dataset since influential outliers can affect the modeling
results and subsequently limit the usability of the predicted models.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 6 5/18/10 3:36:38 PM


Data Mining ◾ 7

Data integration: Combining variables from many different data sources is an


essential step since some of the most important variables are stored in differ-
ent data marts (customer demographics, purchase data, and business trans-
action). The uniformity in variable coding and the scale of measurements
should be verified before combining different variables and observations from
different data marts.
Variable transformation: Sometimes, expressing continuous variables in stan-
dardized units, or in log or square-root scale, is necessary to improve the
model fit that leads to improved precision in the fitted models. Missing value
imputation is necessary if some important variables have large proportions of
missing values in the dataset. Identifying the response (target) and the predic-
tor (input) variables and defining their scale of measurement are important
steps in data preparation since the type of modeling is determined by the
characteristics of the response and the predictor variables.
Splitting database: Sampling is recommended in extremely large databases
because it significantly reduces the model training time. Randomly splitting
the data into “training,” “validation,” and “testing” is very important in cali-
brating the model fit and validating the model results. Trends and patterns
observed in the training dataset can be expected to generalize the complete
database if the training sample used sufficiently represents the database.

1.6.3 Data Exploration and Descriptive Analysis


Data exploration includes a set of descriptive and graphical tools that allow explora-
tion of data visually both as a prerequisite to more formal data analysis and as an
integral part of formal model building. It facilitates discovering the unexpected as
well as confirming the expected. The purpose of data visualization is pretty simple:
let the user understand the structure and dimension of the complex data matrix.
Since data mining usually involves extracting “hidden” information from a data-
base, the understanding process can get a bit complicated. The key is to put users
in a context they feel comfortable in, and then let them poke and prod until they
understand what they did not see before. Understanding is undoubtedly the most
fundamental motivation to visualizing the model.
Simple descriptive statistics and exploratory graphics displaying the distribution
pattern and the presence of outliers are useful in exploring continuous variables.
Descriptive statistical measures such as the mean, median, range, and standard
deviation of continuous variables provide information regarding their distribu-
tional properties and the presence of outliers. Frequency histograms display the
distributional properties of the continuous variable. Box plots provide an excellent
visual summary of many important aspects of a distribution. The box plot is based
on the 5-number summary plot that is based on the median, quartiles, and extreme
values. One-way and multiway frequency tables of categorical data are useful in

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 7 5/18/10 3:36:38 PM


8 ◾ Statistical Data Mining Using SAS Applications

summarizing group distributions, relationships between groups, and checking for


rare events. Bar charts show frequency information for categorical variables and dis-
play differences among the different groups in them. Pie charts compare the levels
or classes of a categorical variable to each other and to the whole. They use the size
of pie slices to graphically represent the value of a statistic for a data range.

1.6.4 Data Mining Solutions: Unsupervised Learning Methods


Unsupervised learning methods are used in many fields under a wide variety of
names. No distinction between the response and predictor variable is made in unsu-
pervised learning methods. The most commonly practiced unsupervised methods
are latent variable models (principal component and factor analyses), disjoint clus-
ter analyses, and market-basket analysis.

◾◾ Principal component analysis (PCA): In PCA, the dimensionality of multi-


variate data is reduced by transforming the correlated variables into linearly
transformed uncorrelated variables.
◾◾ Factor analysis (FA): In FA, a few uncorrelated hidden factors that explain the
maximum amount of common variance and are responsible for the observed
correlation among the multivariate data are extracted.
◾◾ Disjoint cluster analysis (DCA): It is used for combining cases into groups
or clusters such that each group or cluster is homogeneous with respect to
certain attributes.
◾◾ Association and market-basket analysis: Market-basket analysis is one of the
most common and useful types of data analysis for marketing. Its purpose
is to determine what products customers purchase together. Knowing what
products consumers purchase as a group can be very helpful to a retailer or
to any other company.

1.6.5 Data Mining Solutions: Supervised Learning Methods


The supervised predictive models include both classification and regression models.
Classification models use categorical response, whereas regression models use con-
tinuous and binary variables as targets. In regression, we want to approximate the
regression function, while in classification problems, we want to approximate the
probability of class membership as a function of the input variables. Predictive mod-
eling is a fundamental data mining task. It is an approach that reads training data
composed of multiple input variables and a target variable. It then builds a model that
attempts to predict the target on the basis of the inputs. After this model is developed,
it can be applied to new data that is similar to the training data, but that does not
contain the target.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 8 5/18/10 3:36:39 PM


Data Mining ◾ 9

◾◾ Multiple linear regressions (MLRs): In MLR, the association between the two
sets of variables is described by a linear equation that predicts the continuous
response variable from a function of predictor variables.
◾◾ Logistic regressions: It allows a binary or an ordinal variable as the response
variable and allows the construction of more complex models rather than
straight linear models.
◾◾ Neural net (NN) modeling: It can be used for both prediction and classifica-
tion. NN models enable the construction of train and validate multiplayer
feed-forward network models for modeling large data and complex interac-
tions with many predictor variables. NN models usually contain more param-
eters than a typical statistical model, and the results are not easily interpreted
and no explicit rationale is given for the prediction. All variables are treated
as numeric, and all nominal variables are coded as binary. Relatively more
training time is needed to fit the NN models.
◾◾ Classification and regression tree (CART ): These models are useful in
generating binary decision trees by splitting the subsets of the dataset
using all predictor variables to create two child nodes repeatedly, begin-
ning with the entire dataset. The goal is to produce subsets of the data
that are as homogeneous as possible with respect to the target variable.
Continuous, binary, and categorical variables can be used as response
variables in CART.
◾◾ Discriminant function analysis: This is a classification method used to deter-
mine which predictor variables discriminate between two or more natu-
rally occurring groups. Only categorical variables are allowed to be the
response variable, and both continuous and ordinal variables can be used as
predictors.
◾◾ CHAID decision tree (Chi-square Automatic Interaction Detector): This is a
classification method used to study the relationships between a categorical
response measure and a large series of possible predictor variables, which may
interact among one another. For qualitative predictor variables, a series of chi-
square analyses are conducted between the response and predictor variables
to see if splitting the sample based on these predictors leads to a statistically
significant discrimination in the response.

1.6.6 Model Validation
Validating models obtained from training datasets by independent validation data-
sets is an important requirement in data mining to confirm the usability of the
developed model. Model validation assess the quality of the model fit and protect
against overfitted or underfitted models. Thus, it could be considered as the most
important step in the model-building sequence.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 9 5/18/10 3:36:39 PM


10 ◾ Statistical Data Mining Using SAS Applications

1.6.7 Interpret and Make Decisions


Decision making is one of the most critical steps for any successful business. No
matter how good you are at making decisions, you know that making an intel-
ligent decision is difficult. The patterns identified by the data mining solutions
can be interpreted into knowledge, which can then be used to support business
decision making.

1.7 Problems in the Data Mining Process


Many of the so-called data mining solutions currently available on the market
today either do not integrate well, are not scalable, or are limited to one or two
modeling techniques or algorithms. As a result, highly trained quantitative experts
spend more time trying to access, prepare, and manipulate data from disparate
sources, and less time modeling data and applying their expertise to solve busi-
ness problems. And the data mining challenge is compounded even further as the
amount of data and complexity of the business problems increase. It is usual for the
database to often be designed for purposes different from data mining, so proper-
ties or attributes that would simplify the learning task are not present, nor can they
be requested from the real world.
Data mining solutions rely on databases to provide the raw data for modeling,
and this raises problems in that databases tend to be dynamic, incomplete, noisy,
and large. Other problems arise as a result of the adequacy and relevance of the
information stored. Databases are usually contaminated by errors, so it cannot be
assumed that the data they contain is entirely correct. Attributes, which rely on
subjective or measurement judgments, can give rise to errors in such a way that
some examples may even be misclassified. Errors in either the values of attributes
or class information are known as noise. Obviously, where possible, it is desirable to
eliminate noise from the classification information as this affects the overall accu-
racy of the generated rules. Therefore, adopting a software system that provides a
complete data mining solution is crucial in the competitive environment.

1.8 SAS Software the Leader in Data Mining


SAS Institute,7 the industry leader in analytical and decision-support solutions,
offers a comprehensive data mining solution that allows you to explore large quanti-
ties of data and discover relationships and patterns that lead to proactive decision
making. The SAS data mining solution provides business technologists and quan-
titative experts the necessary tools to obtain the enterprise knowledge for helping
their organizations to achieve a competitive advantage.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 10 5/18/10 3:36:39 PM


Data Mining ◾ 11

1.8.1 SEMMA: The SAS Data Mining Process


The SAS data mining solution is considered a process rather than a set of analytical
tools. The acronym SEMMA8 refers to a methodology that clarifies this process.
Beginning with a statistically representative sample of your data, SEMMA makes it
easy to apply exploratory statistical and visualization techniques, select and trans-
form the most significant predictive variables, model the variables to predict out-
comes, and confirm a model’s accuracy. The steps in the SEMMA process include
the following:

Sample your data by extracting a portion of a large dataset big enough to contain
the significant information, and yet small enough to manipulate quickly.
Explore your data by searching for unanticipated trends and anomalies in order
to gain understanding and ideas.
Modify your data by creating, selecting, and transforming the variables to focus
on the model selection process.
Model your data by allowing the software to search automatically for a combina-
tion of data that reliably predicts a desired outcome.
Assess your data by evaluating the usefulness and reliability of the findings from
the data mining process.

By assessing the results gained from each stage of the SEMMA process, you can
determine how to model new questions raised by the previous results, and thus pro-
ceed back to the exploration phase for additional refinement of the data. The SAS
data mining solution integrates everything you need for discovery at each stage of
the SEMMA process: These data mining tools indicate patterns or exceptions and
mimic human abilities for comprehending spatial, geographical, and visual infor-
mation sources. Complex mining techniques are carried out in a totally code-free
environment, allowing you to concentrate on the visualization of the data, discov-
ery of new patterns, and new questions to ask.

1.8.2 SAS Enterprise Miner for Comprehensive


Data Mining Solution
Enterprise Miner,9,10 SAS Institute’s enhanced data mining software, offers an inte-
grated environment for businesses that need to conduct comprehensive data mining.
Enterprise Miner combines a rich suite of integrated data mining tools, empower-
ing users to explore and exploit huge databases for strategic business advantages.
In a single environment, Enterprise Miner provides all the tools needed to match
robust data mining techniques to specific business problems, regardless of the
amount or source of data, or complexity of the business problem. However, many
small business, nonprofit institutions, and academic universities are still currently

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 11 5/18/10 3:36:39 PM


12 ◾ Statistical Data Mining Using SAS Applications

not using the SAS Enterprise Miner, but they are licensed to use SAS BASE, STAT,
and GRAPH modules. Thus, these user-friendly SAS macro applications for data
mining are targeted at this group of customers. Also, providing the complete SAS
codes for performing comprehensive data mining solutions is not very effective
because a majority of the business and statistical analysts are not experienced SAS
programmers. Quick results from data mining are not feasible since many hours
of code modification and debugging program errors are required if the analysts are
required to work with SAS program code.

1.9 Introduction of User-Friendly SAS


Macros for Statistical Data Mining
As an alternative to the point-and-click menu interface modules, the user-friendly
SAS macro applications for performing several data mining tasks are included in
this book. This macro approach integrates the statistical and graphical tools avail-
able in SAS systems and provides user-friendly data analysis tools that allow the
data analysts to complete data mining tasks quickly without writing SAS programs
by running the SAS macros in the background. Detailed instructions and help files
for using the SAS macros are included in each chapter. Using this macro approach,
analysts can effectively and quickly perform complete data analysis and spend more
time exploring data and interpreting graphs and output rather than debugging
their program errors, etc. The main advantages of using these SAS macros for data
mining are as follows:

◾◾ Users can perform comprehensive data mining tasks by inputting the macro
parameters in the macro-call window and by running the SAS macro.
◾◾ SAS code required for performing data exploration, model fitting, model
assessment, validation, prediction, and scoring are included in each macro.
Thus, complete results can be obtained quickly by using these macros.
◾◾ Experience in SAS output delivery system (ODS) is not required because
options for producing SAS output and graphics in RTF, WEB, and PDF are
included within the macros.
◾◾ Experience in writing SAS programs code or SAS macros is not required to
use these macros.
◾◾ SAS-enhanced data mining software Enterprise Miner is not required to run
these SAS macros.
◾◾ All SAS macros included in this book use the same simple user-friendly format.
Thus, minimum training time is needed to master the usage of these macros.
◾◾ Regular updates to the SAS macros will be posted in the book Web site. Thus,
readers can always use the updated features in the SAS macros by download-
ing the latest versions.

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 12 5/18/10 3:36:39 PM


Data Mining ◾ 13

1.9.1 Limitations of These SAS Macros


These SAS macros do not use SAS Enterprise Miner. Thus, SAS macros are not
included for performing neural net, CART, and market-basket analysis since these
data mining tools require the SAS special data mining software SAS Enterprise
Miner.

1.10 Summary
Data mining is a journey—a continuous effort to combine your enterprise knowl-
edge with the information you extracted from the data you have acquired. This
chapter briefly introduces the concept and applications of data mining techniques;
that is, the secret and intelligent weapon that unleashes the power in your data. The
SAS institute, the industry leader in analytical and decision support solutions, pro-
vides the powerful software called Enterprise Miner to perform complete data min-
ing solutions. However, many small business and academic institutions do not have
the license to use the application, but they have the license for SAS BASE, STAT,
and GRAPH. As an alternative to the point-and-click menu interface modules,
user-friendly SAS macro applications for performing several statistical data mining
tasks are included in this book. Instructions are given in the book for downloading
and applying these user-friendly SAS macros for producing quick and complete
data mining solutions.

References
1. SAS Institute Inc., Customer success stories at http://www.sas.com/success/ (last
accessed 10/07/09).
2. SAS Institute Inc., Customer relationship management (CRM) at http://www.sas.
com/solutions/crm/index.html (last accessed 10/07/09).
3. SAS Institute Inc., SAS Enterprise miner product review at http://www.sas.com/
products/miner/miner_review.pdf (last accessed 10/07/09).
4. Two Crows Corporation, Introduction to Data Mining and Knowledge Discovery, 3rd
ed., 1999 at http://www.twocrows.com/intro-dm.pdf.
5. Berry, M. J. A. and Linoff, G. S. Data Mining Techniques: For Marketing, Sales, and
Customer Support, John Wiley & Sons, New York, 1997.
6. Berry, M. J. A. and Linoff, G. S., Mastering Data Mining: The Art and Science of Customer
Relationship Management, Second edition, John Wiley & Sons, New York, 1999.
7. SAS Institute Inc., The Power to Know at http://www.sas.com.
8. SAS Institute Inc., Data Mining Using Enterprise Miner Software: A Case Study Approach,
1st ed., Cary, NC, 2000.
9. SAS Institute Inc., The Enterprise miner, http://www.sas.com/products/miner/index.
html (last accessed 10/07/09).
10. SAS Institute Inc., The Enterprise miner standalone tutorial, http://www.cabnr.unr.
edu/gf/dm/em.pdf (last accessed 10/07/09).

© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 13 5/18/10 3:36:39 PM


© 2010 by Taylor and Francis Group, LLC

K10535_Book.indb 14 5/18/10 3:36:39 PM


15
16 ◾ Statistical Data Mining Using SAS Applications
Preparing Data for Data Mining ◾ 17
18 ◾ Statistical Data Mining Using SAS Applications
Preparing Data for Data Mining ◾ 19
20 ◾ Statistical Data Mining Using SAS Applications
Preparing Data for Data Mining ◾ 21
Another Random Document on
Scribd Without Any Related Topics
Otro entretenimiento que no debo pasar por alto, pues tuvo cierta
influencia en mi vida: iba á menudo á tomar mate con el viejo
comisario don Sandalio Suárez, en la misma comisaría,
interesándome en la organización de la vigilancia y otros servicios, y,
sobre todo, en los problemas policiales, aunque Sherlock Holmes no
hubiese nacido todavía, ni el genial Poe y el monótono Gaboriau
hubiesen llegado á Los Sunchos. Yo interrogaba al viejo paisano
acerca de las maravillosas facultades investigadoras de los
Rastreadores, y la admirable perspicacia de Facundo, que pinta
Sarmiento.
—Todas esas son camamas—contestaba don Sandalio.—Nadie
descubre á los criminales, cuando no se entregan ellos mismos, y yo,
que te hablo, con todos mis años de policía, no he agarrado á
ninguno, sino en fragante, por casualidad, ó porque, de sonso, se
me entregó él mismo.
Me contaba sus recuerdos, casi todos político-electorales, y varias
veces me invitó á acompañarle en sus pesquisas, en las que yo
colaboraba con entusiasmo. Recuerdo, entre otras cosas, el
asesinato de una mujer, cuyo autor busqué por el buen método,
averiguando á quién podría aprovechar su muerte. Di con el marido,
enamorado de otra, joven y bonita, y lo hice prender. Pero, pocas
noches después, un borracho se jactó en una trastienda de ser el
asesino, y de que nadie sospecharía de él. Detenido é interrogado,
supimos que había asesinado á la mujer por «gusto», sin razón ni
objeto, sólo porque se le ocurrió, estando muy ebrio, al verla
asomada á la puerta de su casa... Este fracaso no me desalentó, y
hasta me propuse perseguir y descubrir á los cuatreros que
infestaban el departamento.
—¡Déjate de cuatreros!—exclamó don Sandalio, cuando le hablé de
mi intención.—Si te metés en eso te va á salir la torta un pan! ¡El
chasco que te darías si los descubrieses y supieses que eran don, y
don, y otros que tampoco te quiero nombrar!
Pero dejemos la policía para seguir el hilo de mi historia.
Celebrábanse entonces, como ahora, en Los Sunchos, al mediar la
primavera, fiestas populares introducidas por los vecinos españoles y
adoptadas con entusiasmo por la población criolla: las Romerías. En
un gran terreno cercano al pueblo alzábanse tinglados, tiendas de
lona, galpones de madera, enramadas, quioscos, improvisándose
una aldea volante, una especie de paradero de indios, que se
adornaba con banderas, follaje, gallardetes, guirnaldas de telas
baratas y churriguerescas, y que habitaban algunos comerciantes
establecidos en el pueblo, y muchos de ocasión, ofreciendo baratijas,
géneros y ropas ya invendibles, y sobre todo, cosas de comer y de
beber, buñuelos, cerveza, tortas fritas, vino carlón, chorizos asados...
En la gran «carpa» de la Sociedad Española se instalaba un bazar de
caridad, atendido por las niñas más conocidas del pueblo, y en el
que se vendían, se remataban ó se rifaban mil «clavos»
generosamente regalados por los comerciantes fuertes. La gente
menuda tenía, como diversión, palo-jabonado, rompecabezas,
calesitas; el populacho, baile al aire libre, al son de gaitas y
tamboriles, rara vez substituídos por la banda de música de Los
Sunchos, que tocaba, sobre todo, en la «carpa» de la Sociedad,
punto de reunión de la gente distinguida. Una atmósfera sensual,
intensificada por todos los efluvios de la primavera, una loca
necesidad de divertirse, de gritar, de moverse, de rozarse, reinaba
en las romerías, y embriagaba á todos, comenzando por la masa
popular, para invadir poco á poco las capas superiores. Más
capitosas que el carnaval, porque reunían á todo el mundo en un
solo sitio, el contagio sexual era en ellas más rápido y avasallador;
pero en la ingenuidad de las costumbres, esto no lo advertían sino el
cura, que predicaba contra los excesos y pedía moderación, y alguno
que otro viejo, cuyas observaciones se tomaban generalmente como
una demostración de envidia de los que ya no pueden divertirse.
Aquel año fuí el asiduo cortejante de Teresa, un poco por iniciativa
propia, un poco porque ella halló manera de cautivarme con sus
monadas, acercándoseme á cada rato, en un principio, con el
pretexto de ofrecerme cedulillas de la rifa, ó artículos del bazar de
Caridad. Bailamos toda la noche, cuantas veces se organizó el baile
para la «gente decente», en un tablado hecho á propósito junto á la
«carpa» de la Sociedad; le di el brazo, acompañándola cuando
ejercía sus funciones de vendedora á través de la multitud acudida
del pueblo y de las aldeas y estancias vecinas, y no desperdicié la
ocasión de decirla mil ternezas que la conmovían y la enajenaban,
hasta el extremo de sentirla temblar, al apoyarse con abandono en
mi brazo.
—¡Pero eres un malo, un perverso!—me decía.—¡No te puedo creer!
¡Si me quisieras de veras no te pasarías los meses enteros sin ir á
verme!
¿Era el cuarto de hora de de Espada d'aprés Rabelais? Así lo creí,
pues le declaré que si no iba á verla era porque «me daba rabia»
hablar con ella, habiendo gente delante, ó con una reja de por
medio.
—Si me esperaras en la huerta, donde podemos conversar á gusto,
yo iría á verte todas las noches.
—¡Pero eso está muy mal hecho!—exclamó.
¿Por qué? ¿Qué había de malo? ¿No tenía confianza en mí? ¿No
estábamos acostumbrados á andar juntos y solos, desde chicos? É
insistí:
—No me digas que sí ni que no. Esta noche iré á la huerta. Si
quieres, me esperas; si no estás, lo sentiré mucho y me volveré á
casa...
Lo dije con un acento de tristeza y terminé con un tono de vaga
amenaza, tales que, vencida, me estrechó el brazo y me miró á los
ojos con la vista turbia. Iría á la huerta, sin duda alguna.
Don Higinio, como es natural, había notado mis asiduidades y la
actitud de Teresa, pero no les dió importancia, ó, más bien dicho, se
felicitó, sin duda, de nuestro acuerdo, que debía conducirnos á la
ejecución de sus proyectos matrimoniales, de larga data planteados.
—¡Ah, pícaro!—me dijo, golpeándome el hombro.—Ya te he visto de
«temporada»... ¡Como ha de ser! Los muchachos se apuran á
ocupar nuestro sitio, y no tienen reparo en dejarnos á un lado...
Me reí, sin contestar, pensando en cuán distintos de los suyos eran
mis planes, y diciéndome: «Si éste piensa en casarme, ya está
fresco. ¡Cualquier día renuncio yo á mi libertad por una cosa que
puedo obtener sin semejante sacrificio!» Sin embargo, me prometí,
tanto si Teresa acudía á la cita, cuanto si me dejaba plantado,
conducirme de allí en adelante con mayor cautela y ocultar en lo
posible nuestros amores, para no dar asidero á don Higinio y rehuir
sus insinuaciones, que no tardarían en ser exigencias.
Teresa me aguardó cuando, al volver de las romerías, todos se
hubieron acostado en su casa. Hablamos largo rato, ella con ternura,
yo con diplomacia, sentados bajo un enorme sauce que había en el
fondo de la huerta. Un momento creí que estaba completamente á
mi discreción, pero á la primera libertad que quise tomarme se
levantó sin aspavientos, y separándose un paso de mí, me dijo con
serenidad y blandura:
—No, eso no, Mauricio. Me has prometido portarte bien, y por eso
estoy aquí. Conversemos cuanto quieras, pero con juicio. Mira que
ya no somos criaturas.
¡Sonsa! ¡Más que sonsa!
Había tanta tranquila resolución en su acento, que me quedé
cortado, sin acertar á decir palabra. La entrevista perdió para mí
todo su encanto. ¿Quién la hacía tan cauta? ¿Cómo, en su inocencia
y en su afecto, real y grande, hallaba, sin embargo, fuerzas para
resistir? No lo sé, aunque me parece efecto de la educación, no de
las lecciones paternas, sino de las charlas íntimas con las amigas
que van revelándose mutuamente la vida y sus peligros. Pensé que
el «cuarto de hora» no había sonado ó había pasado ya, pero,
repuesto de la primera impresión, logré decirla algunas nuevas
ternezas, prometiéndola ser más serio en adelante, no importunarla
en otra cita que pedí para la siguiente noche.
—Sí, vendré. Pero tienes que jurarme que estarás quietito.
Le estreché la mano, y me fuí, rabiando conmigo mismo. Debía
haber sido más audaz, debía... Y me puse á forjar para lo futuro
planes de seducción análogos á los leídos en las novelas, recordando
al propio tiempo el aforismo de de la Espada: «Para conquistar á una
mujer desinteresada, se necesita mucho tiempo y mucha paciencia.
Á su tiempo maduran las uvas, y el pobre porfiado saca mendrugo,
mientras que el exigente se queda afeitado y sin visita». Pero me
parecía que nuestros amores duraban ya tanto, tanto...
—¿Será que no me quiere? ¿Ó tiene la decidida voluntad de que me
case con ella, y sabe que para eso es necesario no ceder? ¡Diablo de
muchacha!... ¡Bah! consultaré á de la Espada, lo haré mi
confidente... ¿Por qué no?... Él sí que tiene experiencia... y no dirá
nada á nadie...
XIII
Al día siguiente, revelé á de la Espada todos mis secretos, sin omitir
ni aun el fracaso de mi última tentativa. Se echó á reir.
—¡No seas tonto!—dijo.—No te aflijas ni te desalientes. La muchacha
está á punto, y sólo te falta la ocasión. ¡No vayas á asustarla! Por el
contrario, inspírale la mayor confianza posible, y espera. La
casualidad te proporcionará, indudablemente, algún momento de
gran emoción para ella. Ése es el bueno, y habrá que aprovecharlo...
Pero ¡ten cuidado! Mira que el padre no es de los que aguantan esas
cosas, y en cuanto llegue á descubrir tus intenciones, ó su
realización, si no te mata es muy capaz de casarte á la fuerza. Tanto
más cuanto que es íntimo amigo de tu padre.
—¡Bah!—repliqué.—Ya veremos lo que se hace. No le tengo miedo al
viejo, y no es el primero que tiene que jorobarse. ¡Cuántos del
pueblo, según tú mismo me has dicho, han tenido que hacerse los
sonsos, para evitar que el escándalo fuese más grande!...
La oportunidad de que hablaba «el galleguito», como le decíamos,
no tardó, efectivamente, en circunstancias trágicas para mí... Había
conversado muchas noches con Teresa, adormeciendo sus recelos,
exasperando su amor, y entre nosotros reinaba la más deliciosa
intimidad. Hablábamos de casarnos... hacíamos proyectos... Ella
quería que viviésemos en casa de su padre, yo fingía exigir que
habitásemos en la nuestra, y sólo se arribaba á un acuerdo, cuando
nos proponíamos hacer una sola de las dos familias, cosa fácil, dada
la amistad que las vinculaba.
—¡Lo malo es que así, nunca estaremos solos!—objetaba yo.—
Siempre tendremos á uno de los viejos pisándonos los talones.
—¿Y eso, qué le hace?—replicaba Teresa.—Si no nos quisiéramos
sería otra cosa, ¡pero nos queremos tanto!...
Pero, vamos al caso. Una tarde, y como solía desde que yo iba
«haciéndome hombre», tatita me invitó á montar á caballo y
acompañarlo hasta una chacra, á dos ó más leguas del pueblo,
donde tenía un negocio pendiente que era preciso arreglar sin
pérdida de tiempo. Su invitación era una orden, y no desagradable,
porque nunca he visto más jovial compañero de viaje, y jamás me
he aburrido á su lado.
No tardaría mucho en hacerse noche, porque habían dado ya las
siete, pero el asunto urgía y ambos estábamos acostumbrados á
recorrer el campo á cualquier hora, sin miedo al rayo del sol de
mediodía, ni á las «luces malas» de la media noche. Llegamos á la
chacra cuando acababa el día, con una puesta de sol admirable que
envolvía la pampa entera en un manto de púrpura. Tatita arregló en
un cuarto de hora ó veinte minutos lo que tenía que arreglar,
apretamos nuevamente la cincha á los caballos y emprendimos el
regreso. Era casi completamente de noche. Sólo una línea pálida, al
Oeste, señalaba el sitio por donde se había marchado el sol. El
crepúsculo, engañoso, nos fingía paisajes desconocidos,
contagiándonos con su propia vacilación. Sin dejar de ver, no
discerníamos la naturaleza de las cosas vistas, y sólo una larga
práctica nos permitía seguir sin desviarnos la cinta descolorida del
camino.
—¡Vamos á llegar muy tarde!—exclamó de pronto tatita.—Cortemos
campo.
—¡Cortemos!—contesté, poniendo la cabeza del caballo en dirección
á Los Sunchos, sin abandonar el galope.
El camino daba un gran rodeo para evitar un bañado intransitable en
la época de las lluvias; aquella larga curva podía acortarse en una
tercera parte tomando la línea recta, la cuerda, como si dijéramos,
pero el trayecto no era muy cómodo, porque el campo, cubierto de
grandes matas de cortadera y de hierbas altas, tenía, además,
vastos limpiones llenos de viscacheras. Afortunadamente la pálida
mancha de estos rompecabezas basta para advertir del peligro á un
jinete experimentado, aun en la obscuridad de la noche, sobre todo
si monta un caballo «vaqueano», uno de nuestros criollos de tan
agudo instinto campero.
Me adelanté, pues, al galope largo, fiándome de mi cabalgadura que
evitaba matorrales y viscacheras atento á todos los detalles,
moviendo sin descanso las orejas, y habría galopado un cuarto de
hora, cuando me pareció oir un grito. Detuve en seco el caballo y
escuché. No oí nada más, ni siquiera el galope del zaino de tatita,
cuyas herraduras debían resonar, sin embargo, en la tierra del
bañado, dura entonces por la sequía como un pavimento de asfalto.
¿Qué significaba aquello? Alarmado volví grupas y corrí hacia atrás á
rienda suelta. Nada veía, nada oía. Mi caballo dió de repente una
terrible espantada junto á una viscachera, y echó á disparar pesando
violentamente sobre el freno. Á duras penas logré contenerlo, y,
acariciándolo le obligué á volver al paso hacia la viscachera, contra
toda su voluntad... ¡Qué espectáculo! Primero entreví, lleno de
susto, la masa del zaino que, con las patas rotas, resollaba y
resoplaba lastimeramente. Un poco más lejos estaba tatita, tendido
en la tierra petrificada de la viscachera. Me tiré del caballo, corriendo
en su auxilio. Una larga herida le cruzaba el cráneo, bañándolo en
sangre. No respiraba; el corazón parecía no latir...
Volví la vista á todos lados. El camino estaba lejos, y por el bañado
no pasaba nadie, sobre todo á aquellas horas. ¿Qué hacer? ¿Dejar á
tatita y correr en busca de socorro, ya que ni agua tenía á mi
alcance para tratar de hacerlo volver en sí? No había otro partido
que tomar. Lo recosté lo mejor que pude, le hice una almohada con
mi blusa y mi poncho, observé de nuevo si respiraba, si se movía, y,
convencido de lo contrario, con el corazón en la boca, monté y
emprendí la más desesperada de las carreras hacia Los Sunchos,
cuyas luces se veían á la distancia.
Azorado y sin poder coordinar bien las ideas, traté, sin embargo, de
reconstruir el accidente: preocupado por un asunto que podía
significarle la pérdida de una crecida suma de dinero, tatita se había
distraído, confiando en el instinto del viejo caballo, que conocía
perfectamente el campo en muchas leguas á la redonda. Pero el
zaino habría tenido también su momento de distracción, bastante
para meter las manos en una cueva de viscacha, «bolearse» y
proyectar á su jinete á varios metros de distancia. El pobre tatita
debió dar con la cabeza en la tosca dura que rodeaba las
viscacheras... ¿Estaría muerto? ¡No! Semejante fin no era el de un
hombre como él. Una simple «rodada» no acaba con los gauchos de
su temple. ¡No! Cuando mucho, sufriría un largo desmayo y la herida
sería fácil de curar... La primera juventud se rebela contra la idea de
la muerte.
Volví con gente que, por fortuna, encontré en las afueras del pueblo,
mientras un hombre corría á avisar al médico y á buscar un coche.
Yo esperaba encontrarlo en su sentido, incorporado y pronto á
emprender la marcha; pero seguía inerte, tibio aún, y no fué posible
hacerle tragar una gota de la ginebra llevada á prevención. El doctor
Merino, que llegó diez minutos después, sólo pudo comprobar el
fallecimiento.
No omitiré aquí un episodio que, pese á las circunstancias trágicas,
me ocupó un instante, produciéndome honda impresión. Fidel
Gomensoro, uno de los paisanos que me habían acompañado,
oyendo que el zaino de tatita resollaba y se quejaba casi como una
persona, se acercó á examinarlo.
—Tiene las dos patas quebradas—dijo.—Hay que despenarlo.
Y, sacando el facón de la cintura, con ademán resuelto, de un solo
tajo lo degolló, consumando así, sin pensarlo, un sacrificio usual en
la tumba de los antiguos señores de la pampa...
El cadáver del pobre tatita fué tendido cuidadosamente en el
carruaje, y yo lo seguí al paso de mi caballo, sin saber lo que me
ocurría, como si yo también hubiese recibido un golpe en la
cabeza... Antes de llegar al pueblo, nuestro pequeño grupo había
aumentado considerablemente, y al pasar por las calles principales,
dirigiéndonos á casa, formábamos ya un imponente cortejo: la
noticia había cundido y todo el mundo acudía, los amigos, los
indiferentes y los enemigos, atraídos por la pena, la curiosidad ó la
disimulada satisfacción. Entretanto, algunas mujeres rodeaban ya á
mamita, preparándola para la horrible sorpresa. Al oirnos llegar, se
precipitó hacia el carruaje, presintiendo que sólo encontraría un
cadáver. La escena fué desgarradora, y entonces comprendí cuánto
amaba mi pobre madre á aquel hombre que había vivido con ella
treinta años de indiferencia y de abandono.
El velorio y los funerales hicieron época en Los Sunchos. Mamita,
incapaz de ocuparse de nada, sino de llorar y rezar junto á su
esposo, dió carta blanca á amigos y sirvientes, y la mesa estuvo
puesta durante treinta y seis horas largas, alternándose el chocolate
con los vinos y licores, los «churrasquitos» con el mate dulce ó
amargo, el puchero con la chatasca, las empanadas, la chanfaina y
las tortas fritas. Una nube de chinas de las casas amigas había ido
«á ayudar» convirtiendo la nuestra en pandemonium, y la sala, el
comedor, las habitaciones de respeto, estaban llenas de visitantes,
hombres y mujeres que hablaban de política, contaban cuentos,
jugaban á las prendas, iniciaban ó continuaban sus intrigas
amorosas... Y esta animada tertulia, en que sólo faltó el baile, se
prolongó hasta la hora de conducir los restos á su última morada.
Yo estaba aturdido. Tatita había sido tan bondadoso, tan camarada,
que lo quería de veras, y su ausencia repentina é irrevocable,
producíame, al propio tiempo que dolor, una rara sensación de
espanto, como si me encontrara de pronto y por primera vez ante lo
desconocido amenazador. Pero todo esto, terror y pena, era vago,
indeciso, como si no me diera, como si no pudiera darme cuenta
exacta del hecho brutal, como si pasara por una confusa y
angustiosa pesadilla...
Hubo discursos junto á la tumba de don Fernando Gómez Herrera,
cuyo ataúd acompañó el pueblo en masa hasta el pobre y
descuidado cementerio de Los Sunchos, cubierto de pasto y poblado
de peludos y de víboras. Don Sócrates Casajuana, el intendente
municipal, dijo que era un prohombre á quien la patria y su partido
debían sacrificios innumerables. Don Temístocles Guerra declaró que
perdíamos en él un vecino progresista y un ciudadano patriota, que
no podría ser reemplazado jamás. El doctor Argüello, senador de la
provincia, que, con el diputado Quintiliano Paz, había ido
expresamente á Los Sunchos, para honrar la memoria de tatita,
habló en nombre del poder ejecutivo y de la legislatura,
recomendando al pueblo que siguiera las admirables huellas del
probo y austero ciudadano, prematuramente desaparecido cuando,
en plena madurez, mayores servicios podía prestar á la patria.
Yo oía todas aquellas frases como quien oye un vago y molesto
zumbido, y no podría reconstituirlas ahora, si después no las hubiera
escuchado cien veces, dichas sobre cien tumbas diferentes, siempre
las mismas, siempre triviales, siempre demostrando un
desconocimiento casi completo de la personalidad á quien se
honraba, siempre sin proporción ni medida, como si todos los
hombres, iguales en la muerte, la hubiesen sido también en la
existencia.
Á la puerta del cementerio, acompañado por el cura, don Genaro
Cecchi, por algunos presuntos parientes de papá ó de mamá, y por
don Higinio Rivas, que lagrimeaba sinceramente, estreché una tras
otra todas aquellas manos indiferentes, y escuché de aquellas bocas
sin emoción las rituales palabras de pésame. Esta larga, esta
interminable ceremonia fué para mí una tortura. Por fin, en el mismo
carruaje que la antevíspera había recogido el cuerpo inanimado de
mi padre, volví á casa, en un estado de estupor, sólo comprensible si
me digo que la naturaleza turba y enajena el cerebro del hombre en
las grandes catástrofes, anestesiándolo en cierto modo, hasta que
empieza á acostumbrarse al dolor. El cura y don Higinio me
acompañaban.
En casa, y con otras señoras y niñas, Teresa trataba de consolar á
mamita que, encerrada en su cuarto, á obscuras, llorando y rezando,
no quería ver á nadie ni dejarse distraer de su pena bajo pretexto
alguno. Me tuvo abrazado largo rato, cubriéndome de besos y
bañándome en sus lágrimas.
Á la hora de comer, todas las visitas se marcharon, excepto Teresa,
que quedó para acompañar á mi madre y manejar la casa, por
indicación de don Higinio.
Por la noche, solos, viendo y compartiendo mi honda aflicción, me
habló más tiernamente que nunca. Embriagados por el dolor, hubo
un instante en que nos abrazamos, perdida la cabeza.
Y este fué el momento de gran emoción de que hablara de la
Espada.
XIV
La muerte de tatita dejaba en manos de don Higinio Rivas los
destinos políticos de Los Sunchos, que había compartido con él. Era
el caudillo único é indiscutible, entre otras cosas porque, conocedor
de los secretos del gobierno de la comuna, tenía á todas las
autoridades como si dijéramos rendidas á discreción. Convencido de
que tarde ó temprano me casaría con Teresa, ignorante del cambio
radical introducido en nuestras relaciones, sabiendo que mi padre
nos había dejado más deudas que bienes, que mamita era incapaz
de salir del atolladero y que yo no sabría manejarme mucho mejor
que ella, me propuso encargarse desinteresadamente de arreglar
nuestros negocios, de modo que nos dieran satisfacción.
—Yo conseguiré que se queden con la chacra y que puedan pagar á
los acreedores por medio de una amortización, arrendando las tres
cuartas partes del terreno, que no les hace falta. Para que vivan,
para el puchero, la ropa y los gastos menudos, no será difícil que el
gobierno de la provincia pase una pensión á la viuda, y yo mismo iré
á la ciudad á trabajar hasta conseguirla. Es lástima que Fernando
haya muerto sin arreglar sus cosas, y que fuese tan despilfarrado,
porque hubiera podido dejarles una fortunita. Pero, ¡no importa! Con
todo, la chacra valdrá mucho á la vuelta de pocos años y podrás
venderla muy ventajosamente cuando mejoren los tiempos. Tu
mamá, entretanto, necesita muy poca cosa, «vos podés» manejarte
con el sueldito de la Municipalidad, que ya te han aumentado dos ó
tres veces, y lo principal es ir viviendo sin que los usureros les claven
las uñas.
Se interrumpió, vaciló un poco, como si le costara lo que iba á decir,
y agregó:
—¡Esto, muchacho, es un secreto para nosotros dos y para tu
mamá, nada más! Fernando tenía mucha confianza en mí, y con
razón, porque siempre fuí muy su amigo... Temiendo que algún día
pudieran obligarlo á vender la chacra en malas condiciones, me pidió
que se la hipotecara con pacto de retroventa. Naturalmente, esto era
«engaña-pichanga». Hicimos en la escribanía el contrato de
hipoteca, y yo le di una contracarta sin fecha, declarando que me ha
pagado y que la propiedad sigue siendo suya: esto para el caso de
que me sucediera una desgracia repentina, porque entre nosotros no
había necesidad de semejante garantía. Esa carta debe estar entre
los papeles del finado. Tráemela y te daré otra para tu resguardo. La
hipoteca vence en estos meses; la renovaremos á tu nombre y al de
tu mamá, con las formalidades de la testamentaría, y así nadie
podrá nunca meter el diente en lo único que les queda.
Se interrumpió, para añadir después, con una risita entre maliciosa y
avergonzada:
—Todo esto no será muy legal; pero, hijito, cada uno se agarra con
las uñas que tiene, y á mí me parece que tu tata tenía mucha razón
de no querer quedarse en camisa y en el medio de la calle, para
pagar á sus acreedores, que son casi todos gente rica, y que no
necesita de esos cobres. Vos, por tu parte, como irás pagando, no
tenés nada que echarte en cara...
Dimos á don Higinio cuantos poderes necesitaba para regir
libremente nuestros asuntos. Arrendó parte de la chacra en buenas
condiciones, obtuvo la pensión del gobierno de la provincia y otra del
nacional para «la viuda é hijo de un guerrero del Paraguay», arregló
con los acreedores exigiéndoles una importante quita y haciéndolos
contentarse con una pequeña amortización anual—«del lobo un
pelo», decía él,—de manera que, en vez de empeorar, nuestra
situación mejoró, porque ya no estaba allí tatita, manirroto á quien
ningún dinero daba abasto, y porque yo no me había acostumbrado
todavía á tirar la plata, gracias á las pocas ocasiones que Los
Sunchos me ofrecían, y gracias, también, á que Teresa tenía aún la
facultad de absorberme. En casa reinaba, pues, la abundancia, y
hubiera reinado la alegría si mamita, como la enredadera que se
encuentra de pronto sin arrimo, aunque sea el rudo y áspero de una
tapia, no se hubiera marchitado y abatido, más silenciosa y solitaria
que nunca.
—Pocos años de vida le quedan á misia María—murmuraba la gente
al verla pasar como un fantasma, sin ser ya ni la sombra de la mujer
de antes, que, taciturna y resignada, tenía, sin embargo,
manifestaciones simpáticas y amables para todos.
—¿Por qué te afliges tanto, mamita?—me atreví á decirla una vez.—
Al fin y al cabo, tatita no te hacía tan feliz...
Me miró espantada, como si acabara de blasfemar, y exclamó:
—¡Mauricio! ¡Era tu padre!
La religión de la familia primaba en ella, sobre cualquier otro
sentimiento, sobre todo raciocinio.
Así fué pasando lenta y monótonamente el tiempo, hasta que don
Inginio quiso un día complementar con un golpe maestro la
magnífica ayuda que nos había prestado, poniendo en marcha de un
modo decisivo su proyecto de «hacerme hombre».
Ocurrió que, en la lista de candidatos oficiales por nuestro
departamento, figuraban dos ó tres que no eran, ni con mucho, de
la devoción de las autoridades sunchalenses. Uno de ellos, sobre
todo, Cirilo Gómez, ex vecino de Los Sunchos, y culpable de una
grave indiscreción sobre el manejo de los fondos municipales y de la
tierra pública, era enemigo personal de Casajuana y de Guerra, que
habían contagiado con su odio á don Sandalio Suárez, el comisario
de policía. Los tres, saliéndose de madre, protestaron violentamente
contra los proyectos electorales de sus jefes (las listas les llegaban
siempre hechas de la ciudad, y ellos las hacían votar á ojos cerrados,
obedeciendo al Gobernador) y declararon que no votarían jamás
aquélla, si no era modificada de acuerdo con sus deseos, eliminando
la candidatura ingrata de Cirilo Gómez; y, llegando en su indignación
á la amenaza, juraron que, en caso de ver desairada su justísima
exigencia, harían abstenerse á «sus amigos», dando el triunfo á la
oposición que se envalentonaría enormemente con ese primer éxito
que le caería de arriba...
Esto agitó hasta la convulsión al pacífico pueblo de Los Sunchos,
desencadenando pasiones y ambiciones. En tan graves
circunstancias, don Higinio asumió su papel de caudillo, predicó la
moderación, el mantenimiento de la disciplina á todo trance, y se
encargó de arreglar personalmente las cosas, de manera que todos
quedaran satisfechos—todos menos el candidato que hoy
llamaríamos boycoteado.—Iría á la ciudad, se pondría de acuerdo
con los jefes del partido oficial, ¡hasta vería al Gobernador si era
preciso! Le dieron plenos poderes, y, preparándose para el viaje y la
campaña política, aquella misma noche me llamó:
—¡Muchacho!—me dijo.—Tengo tu suerte en la mano. No estaba
esperando más que una «bolada» y lo que es ésta no me la quita
nadie. Aunque todavía no tengás la edad, te vamos á hacer
diputado. Así, como suena, diputado.
Me quedé estupefacto. En mis sueños más ambiciosos no me había
atrevido á esperar semejante ganga, sino para muchos años
después, y eso vagamente. De simple empleadillo de la
Municipalidad—pues aunque el sueldo aumentado ya varias veces
era crecido, no se me había dado función alguna, por la sencilla
razón de que no la ejercería,—de simple empleadillo de la
Municipalidad á diputado á la Legislatura de la provincia ¡era tan
grande el salto!...
—¿De veras, don Higinio? ¿No me está «titeando»?—logré preguntar
por fin.—¿Con qué títulos?...
—«Sos» hijo de tu padre y un poco hijo mío, si me salgo con la
mía... que me he de salir. ¡No! si no soy ciego y no tenés para qué
hacer aspavientos. ¡Claro, que si Teresa fuera macho, no te caería la
ganga...! Pero viene á ser lo mismo... Yo me entiendo, y cuando
llegue el momento... La muchacha y «vos» son muy jóvenes
todavía... Bueno, pues, además del nombre de tu tata y de mi
protección, tenés tus trabajos: has escrito en «La Época».
En efecto, con el contagio de la redacción, había garabateado uno
que otro sueltecito, una que otra diatriba más ó menos calumniosa ó
epigramática contra nuestros adversarios.
—De la Espada, como que es gallego, no puede pretender otra cosa
que un poco de platita, y se la daremos. Será el primero en cacarear
que «sos» el alma del diario, y el mejor elemento del partido. En fin,
ésta es cosa mía, y podés estar seguro de que no me la quita nadie.
Yo tenía fiebre. No sabía lo que me pasaba, no podía estarme
quieto, ni hablar; hubiera bailado, chillado, corrido. Entretanto, don
Higinio me reservaba una sorpresa más importante todavía, si se
mira bien.
—Serás diputado—continuó,—y tendrás una fortunita. Vengo
pensando en eso desde hace mucho, y creo que, por fin, he dado en
el clavo. Apenas te sentés en tu banca de la Legislatura, yo haré que
la Municipalidad mande abrir las calles Santo Domingo, Avellaneda,
Pampa, Libertad, Funes y Cadillal, que están cortadas por tu chacra.
Naturalmente habrá que pagarte el valor del terreno que te quiten,
es decir, unas veintitantas mil varas cuadradas, y te las han de pagar
bien. Te quedarán, entonces, nada menos, veintiséis manzanas de
pueblo, en el mismo riñón, como se dice. Siguiendo mi mal consejo,
podés vender dos ó tres de las más afuera para hacer veredas y
tapias con esa platita. Lo que quede, á la larga será toda una
fortuna, aunque ahora valga poco. Si el país sigue adelantando, de
repente vas á ser más rico que Anchorena. Y no te digo más.
Lo abracé, bailando.
—¡Oh, don Higinio, cómo le podré pagar!...
Me apartó, sonriente y meneando su cabeza de león manso, se puso
á armar con cachaza un cigarrillo negro. Después, agregó con calma
un poquito conmovida:
—Yo no te pido nada. Sé lo que valés y te tengo confianza...
Además, también lo hago por Teresa, que te quiere mucho y será
una compañera de mi flor... Eso te lo garanto, porque los Rivas
somos todos como platita labrada, muy «derecho viejo», más leales
que un perro... Y, ahora, muchacho, tené mucha paciencia y estáte
muy calladito la boca, no sea cosa que nos conozcan el juego.
Y me mandó que me fuera, sin querer escuchar mis protestas de
gratitud.
XV
Teresa me contó aquella noche que la casa era una romería desde
que don Higinio se había encargado de arreglar aquel asunto.
Sabiéndolo con una diputación en la mano, chicos y grandes iban á
pedírsela, y lo colmaban de ofrecimientos, de promesas, de
manifestaciones entusiastas. El viejo no soltó prenda. Todos se
marchaban creyendo en la posibilidad de resultar agraciados, pero
sin ninguna palabra decisiva; enumeraba los méritos de cada uno,
en su presencia, alababa los servicios prestados á la causa, decía
con aire protector «veremos lo que piensan en la ciudad», y daba
sendos apretones de mano. Los pechos de todos los ambiciosos de
Los Sunchos palpitaban como el de un solo hombre en vísperas de
un gran acontecimiento feliz, y algunos me hicieron confidente de
sus esperanzas, y hasta solicitaron mi apoyo, suponiendo que tenía
cierta influencia con don Higinio. Este período de satisfacción, de
beatitud, pasó pronto, sin embargo, dando lugar á otro de
irritabilidad é inquina. Despertáronse de pronto los recelos, y Los
Sunchos se convirtió en un semillero de intrigas. Medio pueblo habló
pestes del otro medio, porque cada cual quería despejar de
competidores el campo de la acción. Sólo yo resultaba indemne en
aquella lucha á dentellada limpia, porque nadie me creía con la
menor probabilidad de llevarme la presa.
«La Época», inspirada por don Higinio, dijo que los aspirantes, por
muy legítimas que fueran sus ambiciones, eran demasiado
numerosos, que la ardiente competencia iniciada ponía en peligro la
disciplina del partido, dando un pésimo ejemplo de discordia, y que
se imponía á todos los pretendientes en general, como una prueba
de generosos sentimientos y altas ideas, deponer sus pretensiones
en el sagrado altar de la patria. Agregaba que el nuevo candidato
sería designado por los jefes del partido, es decir, en la capital de la
provincia, porque, dada la disconformidad de las opiniones, algunas
egoístas, fuerza es decirlo, las circunstancias imponían una decisión
completamente imparcial, que sólo allí podría obtenerse. Y así, nadie
tendría, luego, motivo de queja.
En el número siguiente el editorial de de la Espada apareció
doctrinario, sin alusiones á persona alguna, según creyeron los
lectores. Era indudable que, en la perplejidad de la designación, el
diario oficial se daba un compás de espera. Sin embargo, el diario
decía, nada menos, que había llegado el instante histórico de dar
paso á las nuevas generaciones, de llevar al gobierno del país á los
hombres nuevos que habían demostrado amplitud de espíritu,
respeto á las instituciones, aptitudes de iniciativa, amor al progreso.
Cuando los altos puestos públicos, desde la presidencia abajo, estén
refrescados por sangre juvenil, será como si la nación entera
recobrase una nueva y vigorosa juventud. En épocas de revueltas y
trastornos, la experiencia de los ancianos es el mejor instrumento de
Gobierno; en épocas de paz y de prosperidad, el entusiasmo de los
jóvenes es lo que conduce á mayor felicidad y á más riqueza. Nadie
supuso que aquel articulejo preparaba el lanzamiento de mi
candidatura, aunque en Los Sunchos se hilara muy delgado, y fué
porque estas generalizaciones no son para sintetizadas por gente
primitiva y en el fondo candorosa.
Don Higinio se había marchado á la ciudad y me escribía casi
diariamente, enviándome las cartas con el mayoral Contreras, su
hombre de confianza, como lo había sido de tatita. En sus cartas me
señalaba, punto por punto, lo que debía hacer para complementar
sus propios trabajos.
Por indicación suya, los miembros del comité local (vale decir las
autoridades del pueblo), organizaron un mitin para determinar
públicamente cuál iba á ser la actitud del partido. En él se rechazaría
sin apelación la candidatura de Cirilo Gómez, pero, para demostrar
que esto no era una rebelión, sino una desobediencia forzosa, que
en nada menoscababa la disciplina, se declararía solemnemente,
bajo juramento, si se consideraba necesario, que el partido votaría
en masa, como un solo hombre, el nuevo candidato—quienquiera
que fuese,—designado por el comité central. «Sólo así —escribía don
Higinio,—se substituirá fácilmente á Gómez y seguiremos gozando
del favor del Gobierno.»
Aquella mañana, en el vasto corralón de Varela, se reunieron unos
cuantos centenares de personas—gente del campo y peones
municipales, en su mayoría,—capitaneadas por Casajuana, Guerra y
Suárez, á quienes servíamos de tenientes Miró, Valdez, Martirena,
Antonio Casajuana, el doctor Merino, de la Espada, yo y otros. Se
había preparado un asado con cuero—una vaquillona carneada
probablemente en la estancia de algún opositor,—y las damajuanas
de vino y las «frasqueras» de ginebra prometían un gran entusiasmo
popular. En este animado escenario me estrené como orador,
repitiendo, palabra más, palabra menos, algunos editoriales de de la
Espada:
«Hay que sacrificarlo todo generosamente por el bien del país. Las
ambiciones desmedidas de algunos ciudadanos, suelen poner en
peligro la marcha de nuestro partido, el más noble, el más puro, el
más progresista, el único que se ha mostrado capaz de gobernar...
Esas ambiciones deben ser arrancadas de raíz, como la mala hierba.
Si los ambiciosos no renuncian voluntariamente á ellas, los
verdaderos patriotas deben quebrar sus apetitos en sus propias
manos como un arma funesta (frase original, calurosísimamente
aplaudida). Además, ya es hora de que se abra paso á los hombres
nuevos. En la política, como en la milicia, hay una edad para el
retiro, y el Gobierno, como el Ejército, debe completarse con sangre
joven. Y, por último, á nada aspiro personalmente, nada deseo, pero
mi mismo desinterés me autoriza á recomendar á mis
correligionarios la más severa disciplina y la más estricta obediencia
á los mandatos de nuestros jefes. ¡Señores! ¡viva el partido
provincial! ¡Viva el Gobernador de la provincia!»
No insistiré en la ovación que se me hizo ni en las escenas que
siguieron, dignas del mismo Pago Chico, no ya de Los Sunchos. Pero
necesito decir que, al otro día, «La Época» proclamó que me había
revelado orador brillantísimo, pensador profundo, y uno de los
cerebros mejor dotados del país, que de mí debía esperar maravillas.
Los demás «discursantes», que los hubo en gran número y á cual
más ardoroso, se eclipsaron ante el astro nuevo, y en la «alta
sociedad», así como en los modestos corrillos, alguien comenzó á
hablar de Mauricio Gómez Herrera, como de un muchacho de gran
porvenir, que se estaba malgastando en aquel rincón. Como con esto
se tiraba á matar á los «prohombres» de que todo el mundo estaba
harto, la apreciación cundió, especialmente desde que los diarios de
la ciudad, á instancias del viejo Rivas, transcribieron los artículos y
sueltos de «La Época», poniéndome por su cuenta en los cuernos de
la luna.
Tomé con esto, involuntariamente, un aire misterioso, y de la noche
á la mañana me hice un hombre grave, más grave quizá de lo que
conviniese para no dejar traslucir mi secreto. Había adquirido
enorme importancia, y una de las manifestaciones exteriores de ello
era que las principales familias hallaban modo de invitarme á sus
tertulias, á almorzar, á comer, cosa que antes ocurría muy de vez en
cuando. Yo no paraba un momento en casa, con gran pena de
mamita que, si hasta entonces sólo me veía á las horas de comer,
desde entonces ya no me vió á ninguna hora, si no es por las
mañanas, mientras dormía... Aprendí con esto los rudimentos de la
vida social (¡en Los Sunchos!) que tanto debía cultivar más tarde.
Había sido un oso; pero las mujeres son tan amables, cuando
quieren, que me sorprendí de no haber frecuentado más la
sociedad... No; aventuras no tuve. Me faltaba atrevimiento, y, por
otra parte, la bendita chismografía y el santo espionaje de los
pueblos pequeños, como una especie de cinturón de honestidad,
hacen á las mujeres recatadas y hasta virtuosas, mientras no
interviene la verdadera pasión.
En fin, cuando se lanzó mi candidatura, ungida por el mismo
Gobierno, pocos días antes de las elecciones, mi designación
sorprendió á muy poca gente: estaba en el aire, sembrada
esporádicamente por don Higinio, de la Espada y los demás amigos.
La única persona que se sorprendió y se asustó fué mamita. En
cuanto supo mi proclamación, aceptada sin objeciones, con la mayor
disciplina, impulsada por su misticismo iconólatra, empezó á
encender velas ante una imagen de Nuestra Señora de los Dolores,
pero nunca quiso decirme si lo hacía para que saliera ó no saliera
diputado... Sospecho lo último.
La elección fué canónica, porque en Los Sunchos, como en todas
partes, las urnas estaban vedadas á los opositores que, desde
tiempo inmemorial se limitaban á protestar las elecciones ante
escribano público, sin más resultado que dejar un documento para la
historia que probablemente no lo utilizará jamás. Mauricio Gómez
Herrera resultó diputado, como se proclamó aquella misma noche,
calurosa y clara, de un domingo de marzo, entre los estampidos de
las bombas de estruendo y los paso-dobles de la charanga
municipal. En el comité hubo fiesta que se continuó en el club,
donde se destaparon algunas botellas de champaña é innumerables
de cerveza. Yo tuve que brindar con todo el mundo y con todos los
líquidos.
Muy tarde, casi á la madrugada, me vi por fin libre de las amables
impertinencias del triunfo. Muchos me acompañaron hasta la puerta
de la casa, pero, adentro ya, no sé por qué se me ocurrió que Teresa
estaría en la huerta, pese á la hora intempestiva, como una esposa
abnegada que aguarda al marido calavera. Y, en la satisfacción de la
victoria, que ablanda los corazones, quise que, en tal caso, la tonta
fuera feliz. Esperé á que mis acompañantes, que cantaban
entusiasmados, estuvieran lejos, atravesé la calle y entré en la
huerta, casi seguro de no encontrar á nadie, aunque esto hubiera
lastimado hondamente mi amor propio... Pero allí estaba la
muchacha, agitada y nerviosa.
—Ya creí que no vendríaz—me dijo con su voz cantante.—El zeñor
diputado ze hace decear... Tenéz razón... ¡Lo único que ziento ez que
ahora te me iraz!...
—Me iré... Me iré; pero volveré á cada rato. ¡Estamos tan cerca de la
ciudad!
Me había echado los brazos al cuello y se empinaba para, en medio
de la obscuridad, ver y hacerme ver, en mis ojos y en los suyos, el
reflejo de las estrellas que poblaban el cielo, titilantes é
innumerables.
—¿Vendraz á menudo?—preguntó, mimosa.
—Cuantas veces pueda.
—¡Sí! Ez preciso que vengaz—y recalcó exageradamente el «es
preciso».—No zé todavía... Pero me parece que tengo que decirte...
una coza...
Me dió un calofrío, tanto temor y tanta alegría vibraban á la vez en
sus palabras. ¿Sería?...
Pero la insólita entrevista no se prolongó, ni era posible que se
prolongara, porque ya comenzaba á amanecer.
Como si se hubiera puesto de acuerdo con Teresa para darme mala
espina, de la Espada, en medio de las embriagadoras
congratulaciones del día siguiente, en un momento en que nos
quedamos solos, me dijo con una cómica solemnidad que era
exclusivamente suya:
—Mira, chico, yo no quiero meterme en danza; pero debo decirte
una cosa. Se está hablando demasiado de tus relaciones con
Teresita. Ya te han visto entrar muchas veces en su casa, entre otras
anoche mismo, y el «comadreo» es tremendo y va á ser terrible. Yo
no sé, tanto se habla, cómo don Higinio no ha caído en cuenta
todavía... será porque es el más interesado. Pero no te fíes. Mira de
quién se trata y ándate con tiento, si es que no te propones lo
mejor, que sería... santificar las fiestas. Don Higinio no es de los que
se llevan de las narices, y puede darte qué sentir.
La misma perplejidad en que me hallaba me permitió contestar en
broma al «galleguito», negando toda importancia al problema que,
sin embargo, era trascendental y me preocupaba hondamente, hasta
imponerme la obsesión de esta pregunta: «¿Será?»...
Era. Noches después, Teresa me reveló el, para ella, terrible y
encantador secreto.
—Tenemos que casarnos pronto, muy pronto, queridito—me dijo,
acariciándome las mejillas con las palmas de las manos.—Ya no es
posible esperar más, de veras... Después, sería un bochorno... ¡Y
tatita! ¡Qué diría tatita! Sería capaz de matarme... Y yo... yo me
moriría de vergüenza...
Rehuí toda respuesta comprometedora, puse de relieve, como
dificultades, precisamente todas las facilidades del momento—tan
propicio,—pero sin mala intención, aunque nadie lo crea, sin
segunda intención ¡lo juro! sólo por instinto, como un ademán
subconsciente que me defendiera de un peligro imprevisto,
atávicamente revelado á no sé qué parte de mi ser. Y, dominada ó
atontada por mi elocuencia, Teresa se tranquilizó, me abrazó, me
besó, me hizo mil caricias, y, en la cesión completa de su cuerpo y
de su alma, hasta prometió no decir nada á don Higinio, mientras yo
no se lo mandase.
Una vez á solas, me di cuenta del atolladero en que me había
metido. ¡Qué á punto venían las insinuaciones de de la Espada! Si
hubiera hablado meses atrás... Pero, como dicen las comadres:
«Después del niño ahogado... ¡María, tapa el pozo!»... ¡Bah! Todavía
nadie se ha muerto de eso. En el peor de los casos, no tendré de
qué quejarme. Pero...
La verdad, la verdad es que preferiría no casarme, porque aquella
muchacha carecía de atractivos, ó si los tenía eran menores cada
vez. Teresa no me interesaba, ó me interesaba poco, ya sin prestigio
ni misterio, con sus grandes ojos de ternera conmovida, su cutis de
magnolia, su ceceo infantil, su candor de paisanita.
Eso está bueno para pasar un rato ¡pero toda la vida!...
XVI
En la ciudad, alcancé un éxito que no me esperaba. Muchos de los
antiguos condiscípulos que me perseguían en el Colegio, y que
todavía no habían logrado hacerse una posición, ni terminar una
carrera, fueron á visitarme en el Hotel de la Paz, y me colmaron de
felicitaciones, lisonjas y bajezas, tras de las cuales solía
transparentarse la envidia, una envidia rayana en odio. Éste fué el
prefacio de una larga serie de otras visitas y de invitaciones á
fiestas, comidas, tertulias, bailes, en que siempre era yo el niño
mimado por excelencia. Todo el mundo veía despuntar en mí un
astro nuevo, un hombre predestinado por la fortuna para ocupar las
más elevadas posiciones, porque nadie quería creer en mi mérito
excepcional ni en los servicios que pudiera haber prestado al país,
considerándome, sólo, como una criatura nacida de pie. Y una tarde,
¿á quién se dirá que me veo aparecer en el cuarto que me servía de
sala de recibo? ¡Pues, á don Claudio Zapata, en cuerpo y alma! Pero
esto sería bien poco, si tras él no hubiera asomado la soldadesca
figura de misia Gertrudis, con sus alforjas al pecho, y su enorme
masa de cabellos castaños que parecía aplastarle y derretirle la cara,
llena de grandes arrugas reunidas en la antigua papada, que ya no
era sino una especie de vejiga vacía.
—¡Oh! ¡don Claudio! ¡Oh! ¡misia Gertrudis!—exclamé sin poder
contener la risa.—¡Cuánto bueno por acá!
—Hemos venido—dijo ceremoniosamente don Claudio, interpretando
mi hilaridad como manifestación de cariño,—hemos venido, seguros
de que no habrás olvidado á los que te sirvieron de padres, á los
que, educándote, algo severamente, es cierto, te prepararon por eso
mismo para la posición que hoy ocupas.
—¡Oh, don Claudio! ¡y cómo me he de olvidar!
—Eras un muchacho travieso, muy travieso, pero se veía claro que
harías camino—agregó misia Gertrudis.—Siempre se lo he dicho á
Claudio y á tu tata, que esté en gloria. ¡Pobre don Fernando! ¡Quién
había de decir! Todavía tengo su última carta, y la guardo como oro
en paño. ¡Nos afligió tanto su muerte!... Aquí le hemos hecho decir
unas misas...
Á pesar de los recuerdos que evocaban estas frases, la risa me
retozaba pensando en las trenzas y en la cara que habría puesto al
no encontrarlas. Pero, dominándome, dije:
—¡Pues me siento muy honrado con la visita de ustedes! ¡Qué
recuerdos, eh!... ¡Vaya con don Claudio! ¡Vaya con misia Gertrudis!
¡Y qué bien están los dos! Pero háganme el favor de sentarse y
digan si en algo puedo servirlos... Y ante todo, tomarán un matecito.
El mate comenzó á circular. Yo estaba seguro de que llevaban un
propósito interesado, y entre sorbo y sorbo, vencida al parecer por
mis reiteradas instancias, doña Gertrudis consintió, al fin, en decirme
cómo podía pagarles el honor de aquella visita y la refinada
educación que me habían dado: Los tiempos estaban malos; sin
sufrir miseria, lo que se llama miseria, no estaban, tampoco, en la
abundancia ni mucho menos. Don Claudio había prestado, en
diversas ocasiones, grandes servicios al Gobierno, y muchos
personajes, entre ellos tatita, le habían prometido hacer algo por él;
promesas que se había llevado el viento y que sólo mi padre hubiera
cumplido, á no morir de tan trágica manera... Muerto él, á mí, su
hijo y el hijo adoptivo, ó poco menos, de los Zapata, me tocaba esa
herencia. Don Claudio era muy modesto—¡demasiado modesto, por
eso lo dejaban en un rincón!—y se contentaría con una
insignificancia cualquiera. Bastaría, por ejemplo, con que yo,
diputado influyente á quien el Gobierno no podía negar nada, lo
hiciera nombrar juez de paz de su parroquia. El puesto estaba
vacante.
—¡Pero, señora!—objeté por hacerla hablar, —en primer lugar,
todavía no soy diputado, porque las elecciones no han sido
aprobadas.
—¡Oh! ¡eso es una simple formalidad!
—No tan simple... En segundo, no sé si tengo ó no tengo influencia
con el Gobierno, porque todavía no lo he tanteado...
—¡Bah! ¡Eso está visto! ¡Un Gómez Herrera!
—Y en tercero, don Claudio no remediaría nada, pero absolutamente
nada, con el puesto. Las funciones de juez de paz son gratuitas.
Mísia Gertrudis me miró como si quisiera devorarme, y lentamente,
meditando para no decir las atrocidades que pensaba, replicó:
—¡No le hace!... Claro que el puesto en sí no ha de darle un real...
Claudio no es de ésos que aprovechan, ¿no es verdad, Claudio? y
son capaces de quitarles hasta la camisa á los pobres que tienen una
demanda... Pero, como juez de paz tendrá otra espectabilidad, podrá
hacer muchos servicios, y esto le facilitará alguno que otro negocio
que nos saque de apuros.
La escena me divirtió tanto que prometí darles lo que me pedían en
cuanto me fuera posible, si llegaba á tener influencia en el Gobierno.
Y, como quien hace una diablura, meses después di á don Claudio el
nombramiento de juez de paz para gozar con sus sentencias
salomónicas ó sanchescas, y con sus coimas inverosímiles.
Adelantaré aquí, aprovechando la oportunidad, que se hacía pagar
por todo el mundo, por el demandante y el demandado, por el
condenado y por el absuelto, y esta igualdad ante la ley es la mejor
prueba posible de su ecuánime imparcialidad.
No fué tan grato mi primer encuentro con Pedro Vázquez, estudiante
entonces de derecho en la Facultad de una provincia vecina, y que
había ido á la ciudad de paseo. Como todos los demás, me felicitó
por mi rápida carrera, pero con cierto aire burlón, que yo tomé por
crítica ó protesta muda.
—¿Quisieras verte en mi lugar, eh?—le dije, enfadado, con tono de
superioridad hiriente, significándole que debía tener su poco de
envidia.
Welcome to Our Bookstore - The Ultimate Destination for Book Lovers
Are you passionate about books and eager to explore new worlds of
knowledge? At our website, we offer a vast collection of books that
cater to every interest and age group. From classic literature to
specialized publications, self-help books, and children’s stories, we
have it all! Each book is a gateway to new adventures, helping you
expand your knowledge and nourish your soul
Experience Convenient and Enjoyable Book Shopping Our website is more
than just an online bookstore—it’s a bridge connecting readers to the
timeless values of culture and wisdom. With a sleek and user-friendly
interface and a smart search system, you can find your favorite books
quickly and easily. Enjoy special promotions, fast home delivery, and
a seamless shopping experience that saves you time and enhances your
love for reading.
Let us accompany you on the journey of exploring knowledge and
personal growth!

ebookgate.com

You might also like