100% found this document useful (1 vote)
30 views

Get Supervised machine learning: optimization framework and applications with SAS and R First Edition Kolosova PDF ebook with Full Chapters Now

SAS

Uploaded by

aiyazbilaso0
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (1 vote)
30 views

Get Supervised machine learning: optimization framework and applications with SAS and R First Edition Kolosova PDF ebook with Full Chapters Now

SAS

Uploaded by

aiyazbilaso0
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 55

Download the Full Version of textbook for Fast Typing at textbookfull.

com

Supervised machine learning: optimization


framework and applications with SAS and R First
Edition Kolosova

https://textbookfull.com/product/supervised-machine-
learning-optimization-framework-and-applications-with-sas-
and-r-first-edition-kolosova/

OR CLICK BUTTON

DOWNLOAD NOW

Download More textbook Instantly Today - Get Yours Now at textbookfull.com


Recommended digital products (PDF, EPUB, MOBI) that
you can download immediately if you are interested.

Machine Learning Foundations: Supervised, Unsupervised,


and Advanced Learning Taeho Jo

https://textbookfull.com/product/machine-learning-foundations-
supervised-unsupervised-and-advanced-learning-taeho-jo/

textboxfull.com

Fundamentals of optimization theory with applications to


machine learning Gallier J.

https://textbookfull.com/product/fundamentals-of-optimization-theory-
with-applications-to-machine-learning-gallier-j/

textboxfull.com

Fundamentals of optimization theory with applications to


machine learning Gallier J.

https://textbookfull.com/product/fundamentals-of-optimization-theory-
with-applications-to-machine-learning-gallier-j-2/

textboxfull.com

Introduction to machine learning with R rigorous


mathematical analysis First Edition Burger

https://textbookfull.com/product/introduction-to-machine-learning-
with-r-rigorous-mathematical-analysis-first-edition-burger/

textboxfull.com
Applied Analytics through Case Studies Using SAS and R:
Implementing Predictive Models and Machine Learning
Techniques Deepti Gupta
https://textbookfull.com/product/applied-analytics-through-case-
studies-using-sas-and-r-implementing-predictive-models-and-machine-
learning-techniques-deepti-gupta/
textboxfull.com

Supervised Learning with Quantum Computers Maria Schuld

https://textbookfull.com/product/supervised-learning-with-quantum-
computers-maria-schuld/

textboxfull.com

Supervised Machine Learning in Wind Forecasting and Ramp


Event Prediction 1st Edition Harsh S. Dhiman

https://textbookfull.com/product/supervised-machine-learning-in-wind-
forecasting-and-ramp-event-prediction-1st-edition-harsh-s-dhiman/

textboxfull.com

Blockchain, big data and machine learning: trends and


applications First Edition Kumar

https://textbookfull.com/product/blockchain-big-data-and-machine-
learning-trends-and-applications-first-edition-kumar/

textboxfull.com

Teaching Learning Based Optimization Algorithm And Its


Engineering Applications 1st Edition R. Venkata Rao

https://textbookfull.com/product/teaching-learning-based-optimization-
algorithm-and-its-engineering-applications-1st-edition-r-venkata-rao/

textboxfull.com
Supervised Machine
Learning
Supervised Machine
Learning
Optimization Framework and
Applications with SAS and R

Tanya Kolosova PhD


Associates in Analytics Inc., Boca Raton, Florida
Samuel Berestizhevsky MSc
Associates in Analytics Inc., Boca Raton, Florida
First edition published 2021
by CRC Press
6000 Broken Sound Parkway NW, Suite 300, Boca Raton, FL 33487-2742

and by CRC Press


2 Park Square, Milton Park, Abingdon, Oxon, OX14 4RN

© 2021 Taylor & Francis Group, LLC

CRC Press is an imprint of Taylor & Francis Group, LLC

This book contains information obtained from authentic and highly regarded sources. While all
reasonable efforts have been made to publish reliable data and information, neither the author[s]
nor the publisher can accept any legal responsibility or liability for any errors or omissions that may
be made. The publishers wish to make clear that any views or opinions expressed in this book by
individual editors, authors or contributors are personal to them and do not necessarily reflect the
views/opinions of the publishers. The information or guidance contained in this book is intended
for use by medical, scientific or health-care professionals and is provided strictly as a supplement to
the medical or other professional’s own judgement, their knowledge of the patient’s medical history,
relevant manufacturer’s instructions and the appropriate best practice guidelines. Because of the
rapid advances in medical science, any information or advice on dosages, procedures or diagnoses
should be independently verified. The reader is strongly urged to consult the relevant national drug
formulary and the drug companies’ and device or material manufacturers’ printed instructions, and
their websites, before administering or utilizing any of the drugs, devices or materials mentioned in
this book. This book does not indicate whether a particular treatment is appropriate or suitable for
a particular individual. Ultimately it is the sole responsibility of the medical professional to make
his or her own professional judgements, so as to advise and treat patients appropriately. The authors
and publishers have also attempted to trace the copyright holders of all material reproduced in this
publication and apologize to copyright holders if permission to publish in this form has not been
obtained. If any copyright material has not been acknowledged please write and let us know so we
may rectify in any future reprint.

Except as permitted under U.S. Copyright Law, no part of this book may be reprinted, reproduced,
transmitted, or utilized in any form by any electronic, mechanical, or other means, now known or
hereafter invented, including photocopying, microfilming, and recording, or in any information
storage or retrieval system, without written permission from the publishers.

For permission to photocopy or use material electronically from this work, access www.copyright.
com or contact the Copyright Clearance Center, Inc. (CCC), 222 Rosewood Drive, Danvers, MA
01923, 978-750-8400. For works that are not available on CCC please contact mpkbookspermissions@
tandf.co.uk

Trademark notice: Product or corporate names may be trademarks or registered trademarks, and are
used only for identification and explanation without intent to infringe.

ISBN: 978-0-367-27732-1 (hbk)


ISBN: 978-0-367-53882-8 (pbk)
ISBN: 978-0-429-29759-5 (ebk)

Typeset in Palatino
by codeMantra
Dedication

To our children—love and meaning of our lives.


Contents

Acknowledgments .............................................................................................. xiii


Authors ...................................................................................................................xv
Introduction: Challenges in the Application of Machine
Learning Classification Methods ..................................................................... xvii

Part I
1. Introduction to the AI Framework .............................................................. 3
1.1 Components of the AI Framework and Their Interaction...............3
1.2 AI Framework in Detail ....................................................................... 5
1.2.1 Creating Training and Test Datasets..................................... 5
1.2.2 Design of Experiments for a Classifier ................................. 6
1.2.3 Firth Logistic Regression ........................................................6
1.2.4 Data
 Contamination ................................................................6
1.2.5 Best Classifiers .......................................................................... 7
1.3 SAS Procedures for the AI Framework Components ...................... 7
1.4 R Libraries for the AI Framework Components ............................... 7
References .........................................................................................................8

2. Supervised Machine Learning and Its Deployment in SAS and R .....9


2.1 Introduction ...........................................................................................9
2.2 Principles of Supervised Machine Learning .................................. 10
2.3 Neural Network .................................................................................. 12
2.3.1 Introduction ............................................................................ 12
2.3.2 Neural Network Components.............................................. 13
2.3.2.1 Activation Function ............................................... 13
2.3.2.2 Neurons ................................................................... 14
2.3.2.3 Networks ................................................................. 15
2.3.3 R for Neural Networks .......................................................... 16
2.4 Support Vector Machine .................................................................... 16
2.4.1 Introduction
 ............................................................................ 16
2.4.2 Kernel....................................................................................... 18
2.4.3 Margin ..................................................................................... 19
2.4.4 Optimization .......................................................................... 20
2.4.5 Bias–Variance Trade-off and SVM Hyperparameters ...... 20
2.4.6 R for SVM ................................................................................ 21
2.5 SVM Modification Using Firth’s Regression ...................................22
2.5.1 Introduction
 ............................................................................22
2.5.2 Logistic Regression ................................................................ 23
2.5.3 Problem of Separation ........................................................... 23

vii
viii Contents

2.5.4 R for Firth’s Regression ......................................................... 25


2.5.5 SAS for Firth’s Regression..................................................... 25
2.6 Summary
 .............................................................................................. 27
References ....................................................................................................... 27

3. Bootstrap Methods and Their Deployment in SAS and R................... 29


3.1 Introduction ......................................................................................... 29
3.2 Overview of Bootstrap Methods.......................................................30
3.2.1 The Basic Bootstrap ............................................................... 31
3.2.2 Hypothesis Tests, Estimates, and Confidence Intervals... 32
3.2.3 Bias Reduction ........................................................................34
3.2.4 The Parametric Bootstrap ..................................................... 35
3.2.5 m-out-of-n Bootstrap ............................................................. 36
3.2.6 Bootstrap Samples Similarity ............................................... 36
3.3 Implementation of Bootstrap in SAS and R .................................... 37
3.3.1 m-out-of-n in SAS................................................................... 37
3.3.2 m-out-of-n in R ....................................................................... 38
3.4 Summary
 .............................................................................................. 39
References ....................................................................................................... 40

4. Outliers Detection and Its Deployment in SAS and R ......................... 41


4.1 Introduction
 ......................................................................................... 41
4.2 Outliers Detection and Treatment ....................................................42
4.2.1 Minimum Covariance Determinant Method ....................42
4.2.2 MCD in SAS ............................................................................43
4.3 Bias Reduction .....................................................................................44
4.4 Summary .............................................................................................. 45
References ....................................................................................................... 45

5. Design of Experiments and Its Deployment in SAS and R ................. 47


5.1 Introduction
 ......................................................................................... 47
5.2 Application of DoE in AI Framework .............................................. 48
5.2.1 Terminology of DoE .............................................................. 49
5.2.1.1 Experiment .............................................................. 49
5.2.1.2 Experimental Unit .................................................. 49
5.2.1.3 Factor ........................................................................ 49
5.2.1.4 Treatment ................................................................. 49
5.2.2 Principles of DoE.................................................................... 49
5.2.2.1 Randomization ....................................................... 49
5.2.2.2 Statistical Replication............................................. 50
5.2.2.3 Blocking ................................................................... 50
5.2.2.4 Orthogonality ......................................................... 50
5.2.3 Full-Factorial
 Experiment ..................................................... 50
5.2.4 Fractional Factorial Experiment .......................................... 57
5.2.5 Linear Mixed Models ............................................................ 58
Contents ix

5.2.6 Factors and Response Variables in the AI Framework ..... 59


5.2.7 Example ................................................................................... 60
5.2.8 Analysis of Linear Mixed Model Using SAS ..................... 62
5.2.9 Analysis of Linear Mixed Model Using R ..........................65
5.3 Summary .............................................................................................. 66
References ....................................................................................................... 67

Part II

6.1 Principles of Code-Free Design......................................................... 71


6.2 The Data Dictionary Components for the AI Framework ............ 72
6.2.1 Relational Model .................................................................... 72
6.2.2 Table ......................................................................................... 73
6.2.3 Data Aspects ........................................................................... 73
6.2.4 Relational Data Structure ..................................................... 73
6.2.5 Domains .................................................................................. 74
6.2.6 Relations and Tables .............................................................. 74
6.2.7 Functions ................................................................................. 74
6.2.8 One-to-one Relationship ....................................................... 75
6.2.9 One-to-many Relationship ................................................... 75
6.2.10 Primary Key............................................................................ 75
6.2.11 Foreign Key ............................................................................. 75
6.2.12 Missing Values ....................................................................... 75
6.2.13 Data Dictionary ...................................................................... 76
6.3 Properties of the Data Dictionary ..................................................... 76
6.3.1 The Library Table ................................................................... 76
6.3.2 The Object Table .....................................................................77
6.3.3 The Location Table .................................................................77
6.3.4 The Message Table .................................................................77
6.3.5 The Property Table ................................................................ 78
6.3.6 Meaning .................................................................................. 79
6.3.7 The Link Table ........................................................................ 79
6.3.8 Process of Application Data Model Definition .................. 79
6.3.9 Features of the Data Dictionary ...........................................80
6.3.10 The Components of the Optimization Framework
and Their Definitions in the Data Dictionary.................... 81
6.4 Deployment of Code-Free Design with SAS and R........................ 81
6.4.1 How to Generate Application Objects ................................ 81
6.4.2 Generating R Datasets from the Data
Dictionary Metadata..............................................................84
6.4.3 SAS and R Interoperability ................................................... 86
6.5 Summary .............................................................................................. 88
Reference ......................................................................................................... 88
x Contents

7. Input Data Component ................................................................................ 89


7.1 Overview of Data Management ........................................................ 89
7.1.1 Data Dictionary ...................................................................... 89
7.1.1.1 The Input Data Dictionary .................................... 89
7.1.1.2 Input and Structure Tables ...................................90
7.1.1.3 Outlier_Detection and Bias_Correction Tables... 91
7.1.1.4 Bootstrap Table ....................................................... 92
7.1.1.5 Output Table ........................................................... 93
7.1.2 SAS Macro Program .............................................................. 95
7.1.3 R Program ............................................................................... 98
7.2 Summary .............................................................................................. 98

8.1 Data Dictionary ................................................................................... 99


8.1.1 Experiment Table ................................................................. 100
8.1.2 Features Table ....................................................................... 100
8.1.3 Metrics Table ......................................................................... 101
8.1.4 ML_Method Table................................................................ 102
8.1.5 Hyperparameters_Domain Table ...................................... 102
8.1.6 Results Table ......................................................................... 102
8.1.7 Results_Metrics Table .......................................................... 103
8.2 SAS Macro Program ......................................................................... 105
8.3 R  Programs ........................................................................................ 105
8.4 Summary ............................................................................................ 106
Reference ....................................................................................................... 106

9. “Contaminated” Training Datasets Component.................................. 107


9.1 Data Dictionary ................................................................................. 107
9.1.1 Contamination Table ........................................................... 108
9.1.2 Cont_Experiment Table....................................................... 109
9.1.3 Cont_Results Table............................................................... 109
9.1.4 Cont_Metric
 Table ................................................................ 110
9.2 SAS Macro Program ......................................................................... 110
9.3 R  Programs ........................................................................................ 110
9.4 Summary ............................................................................................ 111
Reference ....................................................................................................... 111

Part III

10.1 Introduction
 ....................................................................................... 115
10.2 Review of Underwriters’ Performance .......................................... 116
10.2.1 Metrics of Underwriters’ Performance ............................. 116
10.2.1.1 Hit Ratio ................................................................. 116
Contents xi

10.2.1.2 Conversion
 Rate .................................................... 116
10.2.1.3 Dynamic Conversion Rate .................................. 117
10.2.1.4 Time-to-Deal ......................................................... 118
10.2.2 Analysis of Underwriters’ Performance ........................... 119
10.2.2.1 Data Description................................................... 119
10.2.2.2 Application Flow .................................................. 119
10.2.2.3 Dynamic Conversion Rate per Underwriter .... 121
10.2.2.4 Time-to-Deal per Underwriter ........................... 122
10.3 Traditional Approach to Knowledge Delivery ............................. 123
10.4 Anatomy of Artificial Intelligence Solution .................................. 124

10.4.1 Data Structure ...................................................................... 124
10.4.2 Classification Approach ...................................................... 125
10.4.3 Bias–Variance Trade-Off and SVM Hyperparameters ... 125
10.4.4 Building the Classifier ......................................................... 127
10.4.5 “Contamination” of Training Datasets ............................. 130
10.4.6 Experimental Results .......................................................... 130
10.5 Summary ............................................................................................ 132
References ..................................................................................................... 132

11.1 
Introduction ....................................................................................... 135
11.2 Data ..................................................................................................... 136
11.3 The Cox Model for Claims Event Analysis ................................... 136
11.4 Application of the Cox Model for Claims Analysis ..................... 138
11.4.1 Data Transformation ........................................................... 139
11.4.2 Cox Model Assumption Validation ................................... 141
11.4.3 Bayesian Machine Learning Approach ............................ 144
11.4.4 Deployment with SAS ......................................................... 144
11.4.5 Interpretation of Results ..................................................... 146
11.5 Summary ............................................................................................ 152
References ..................................................................................................... 153

Index ..................................................................................................................... 155


Acknowledgments

Writing this book was a real adventure. It summarizes our experience over
many years of solving problems related to applying machine learning meth-
ods to real-life data. During these years, we met many people who, by sharing
their experience, asking questions, and challenging our solutions, helped to
crystalize this book’s ideas. Among them, Samuel would like to thank Maurice
“Hank” Greenberg for being a unique inspiration and Charles Dangelo for
his expert advice in the insurance domain. Tanya is grateful for the knowl-
edge of the design of experiments shared by Prof. David M. Steinberg from Tel
Aviv University, Israel, and Prof. Carl Schwarz from Simon Fraser University,
Canada. We want to thank the SAS Institute as our long-term software of
choice, as well as the R Core Team and contributors.
We would also like to thank everyone on the Taylor and Francis/CRC
Press team for their support and assistance in preparing this book. Special
thanks to David Grubbs, the acquisition editor, for his great support. Thanks
to Rebecca, Sofia, Varun, and other editorial staff members for helping this
book come to fruition.
Special thanks to our daughter Efrat for her performances of Chopin
and Debussy’s piano works that provided a calming and inspirational
atmosphere.

xiii
Authors

Tanya Kolosova is a statistician, software engineer, educator, and co-author


of two books on statistical analysis and metadata-based applications devel-
opment using SAS. She is an actionable analytics expert and has extensive
knowledge of software development methods and technologies, artificial
intelligence methods and algorithms, and statistically designed experiments.

Samuel Berestizhevsky is a statistician, researcher, and software engineer.


Together with Tanya, Samuel co-authored two books on statistical analy-
sis and metadata-based applications development using SAS. Samuel is an
innovator and expert in the area of automated actionable analytics and arti-
ficial intelligence solutions. His extensive knowledge of software develop-
ment methods, technologies, and algorithms allows him to develop solutions
on the cutting edge of science.

xv
Introduction: Challenges in the
Application of Machine Learning
Classification Methods

According to Bishop (2006), machine learning (ML) is a scientific study of


statistical models and algorithms to help a computing system accomplish
a specific task without using explicit instructions, but relying on patterns
and inference instead. Such patterns and inferences can be extracted from
sample data, also called “training datasets” in the machine learning domain,
using machine learning algorithms.
ML is a subset of artificial intelligence technology. It automatically learns
and improves the performance with the pace of time, interactions, and expe-
riences. Building initial machine learning models, or classifiers, is an itera-
tive process, where we start with initial hypotheses about which data can be
useful and how to structure different sets of features, which machine learn-
ing methods can learn better from our data, and how to “tune” multiple
hyperparameters to achieve robust classification results. The machine learn-
ing development process becomes a nightmare if it does not use a framework
for easy, reliable, meaningful, verifiable, and reproducible development.
A large amount of available ML methods creates a challenge for research-
ers: how to develop, verify, reproduce, and compare models using different
ML methods? Utilizing the same or similar data for modeling by different
methods naturally leads to outcomes that differ in their form or quality or
both. We want to be able to compare results from different models and to
draw conclusions about the utility of using one model over the other. The
design of statistical experiments may work as a framework that helps us to
systematically compare different models. Such experiments, which include
determining which class of models to use and what types of features to
include, produce a number of different results.
Reproducibility is the ability to reproduce the analyses.
Comparability is the ability to compare results produced by different mod-
eling approaches.
In this book, we describe an AI framework that helps developers to achieve
reproducibility and comparability of machine learning experiments and to
define ML development processes in precise, transparent, easily changeable,
and verifiable ways.

xvii
xviii Introduction

Fundamentals of Supervised Classification


Machine learning can be roughly categorized into three types: supervised
learning, unsupervised learning, and reinforcement learning. In this book,
we only deal with supervised machine learning. The most common super-
vised machine learning task is classification.
Supervised classification can be described as the task of automatically
assigning objects to their respective classes on the basis of numerical mea-
surements derived from these objects. Classifiers are the tools that imple-
ment the actual classification from these measurements to the so-called class
labels. The field of supervised classification studies ways of constructing
such classifiers. The main idea behind supervised learning methods is that
of learning from examples: given several so-called training datasets that
describe input–output relations, to what extent can the general mapping be
learned that takes any new and unseen objects to their correct classes?
The basic problem of machine learning is probably the following. We have
a training dataset of cases

( x1 , y1 ) , …, ( xn , yn )
where each case ( xi , y i ) , i = 1, … , n consists of an object xi (a vector of fea-
tures) and its label y i. The problem is to predict the label y n+1 of a new object
xn+1 . Usually, the goal of classification is to produce a prediction ŷ n+1 that is
likely to coincide with the true label y n+1, and this goal should be comple-
mented with some measure of its reliability. There is a clear tradeoff between
accuracy and reliability: we can improve the former by relaxing the latter
and vice versa.

Generalization Problem: Bias–Variance Tradeoff


The quality of a classifier is defined by its ability to correctly classify an input
vector into an appropriate class and is measured by metrics derived from
confusion, or misclassification, matrix. There is no such metric that can mea-
sure a classifier quality alone: at least a pair of metrics should be used. For
example, sensitivity and specificity estimate true positive and true negative
rates, respectively, and we are interested in classifiers with both of these met-
rics approaching 1.
The bias–variance tradeoff is the idea that finding a minimum-risk classi-
fication method involves striking a balance between minimizing bias (being
right on average) and minimizing variance (being stable with respect to
Introduction xix

variation in training datasets). A classification method that performs poorly


due to high variance is said to overfit when presented with data. One that
performs poorly due to high bias is said to underfit.
Low bias means

• the average accuracy metric of classification results is close to the


truth.

High bias means

• the average accuracy metric of classification results is far from the


truth,
• the classification method is not sufficiently flexible, and
• individual results of classification accuracy metric are not adequately
adapted to the data.

Low variance means

• each individual accuracy metric of classification is close to the aver-


age accuracy metric,
• individual accuracy metric tends to be similar to one another, and
• the classification method is “stable” with respect to which dataset
(of all possible datasets) it is applied.

High variance means

• individual accuracy metrics are often far from the average accuracy,
• individual accuracy metrics are quite different from one another,
and
• the classification method is very sensitive to which dataset it is
applied.

The challenge of bias and variance estimation can actually be easily


addressed by applying two readily available statistical methodologies:

• bootstrap and
• mixture experiments.

We demonstrate in this book how the application of m-out-of-n bootstrap


allows creation of thousands of training datasets and in turn how the appli-
cation of the ML method to these datasets allows us to estimate bias and
variance. The statistical approach of the mixture experiment is applied to
xx Introduction

contaminate data and to find the level of contamination that “breaks” the
classifier. This helps to identify robust classifiers that are better positioned
for unseen data.

Challenges of Deployment
The useful life of the machine learning application begins when it is deployed
to production. From this point, application modifications are often required.
These modifications may consume a great deal of effort in recoding and
even redesigning. Generally, the better the machine learning application, the
longer its life. Modifications and maintenance of the application are usually
performed by people other than the original implementers. This problem
is very difficult to solve because the application internals cannot be eas-
ily understood. The code-free framework described in this book addresses
these problems. Generally, the framework outlined in this book addresses
the most fundamental problems of existing machine learning application
development and deployment technologies: the failure to recognize users’
true needs and the inability to develop machine learning solutions quickly
to meet these needs.
Machine learning applications have all the challenges of the traditional
software systems, plus an additional set of machine learning–specific issues –
reproducibility and comparability. These two machine learning–specific
issues can be solved by applying the principles of statistically designed
experiments combined with bootstrap along with testing the robustness
of the machine learning solution through data contamination processes
(flipping or corruption of labels of training dataset). The principles and
applications of designed experiments, bootstrap, and data contamination are
discussed in this book.
Another challenge is the selection of the production classifier. If, for exam-
ple, the criterion of a classifier quality is to maximize sensitivity and specific-
ity, then we may encounter a difficult choice. Let us say, we have classifier A
with a sensitivity of 0.85 and a specificity of 0.88, and classifier B with a sensi-
tivity of 0.87 and a specificity of 0.87 – then which of them should we choose?
In this book, we want to explore a different approach, wherein we do not
need to limit our choice by one classifier. Both classifiers, A and B, have a
very good classification quality. More than that, we can find a tens of clas-
sifiers with very similar sensitivity and specificity. We also know that the
sensitivity and specificity of each classifier will vary depending on the data-
sets they are applied to. So, instead of choosing one classifier, we will use all
classifiers that have high-quality metrics, and the final decision on the classi-
fication result will be based on a voting mechanism using some information
criteria. This approach will immediately improve the classification process.
Introduction xxi

Source Code
The source code for the book can be continuously improved and extended
after the book has been published. The source code is located on GitHub:
https://github.com/smlof/Supervised-Machine-Learning--Optimization-
Framework
Part I
1
Introduction to the AI Framework

The artificial intelligence (AI) framework should be algorithm and tech-


nology agnostic. This means that it should not focus on a specific machine
learning methodology and specific systems or software, but it applies to the
design, application, and use of AI in general.
In this book, we describe the AI framework that helps to create machine
learning classifiers in such a way that they produce a sufficiently good clas-
sification of unseen data. The framework incorporates data dictionaries that
define processes such as statistically designed experiments, bootstrapping,
and data “contamination.” This framework is fully transparent as all data
processes are defined as metadata that ensures comparability and reproduc-
ibility of the results of the supervised classification.
Because the AI framework is fully independent of technology, it can be
implemented using different software platforms. In this book, we present
the implementation of the AI framework using two different software tools:
SAS and R.
SAS is an integrated software system that enables accessing data across
multiple sources, manipulating data, performing sophisticated analyses, and
much more, and is one of the major choices of corporate business, though a
bit costly.
R (R Core Team, 2018) is an open-source programming language devel-
oped by researchers, and many latest statistical and analytical methods are
developed with R. This language has extensive documentation along with
a supportive community and is widely used among statisticians and data
scientists for developing statistical software and data analysis.

1.1 Components of the AI Framework and Their Interaction


The main idea of the AI framework proposed in this book is to create a sys-
tematic approach that resolves the challenges of machine learning modeling.
The process of building a machine learning classifier requires making
choices that very often cannot be informed by intuition, understanding of

3
4 Supervised Machine Learning

a business problem, or pre-analysis of data. For example, making a decision


about the feature subset requires considering different hypotheses, and it is
reasonable to consider several different feature sets. Which one of them to
choose eventually requires to go through the modeling process and com-
parison of classifiers built on different feature sets.
Choosing a machine learning method is challenging as well, and in many
instances, the decision is made based on the convenience of the method and
expected interpretability of the results, rather than based on theoretical and
technical aspects of machine learning methods. If we do not want to limit
ourselves to only one machine learning method, but rather want to try a few
of them, we need to estimate and compare the classifiers built by those meth-
ods. Now we have to keep in mind that the quality of an estimated classifier
depends not only on the machine learning method used, but on the feature
set as well.
For each machine learning method, we need to assign values to the hyper-
parameters of that method, and it is obvious that the values of the hyperpa-
rameters impact the quality of the estimated classifier. Different methods
have different numbers of hyperparameters, and finding an optimal set of
values becomes a very difficult problem.
Figure 1.1 describes some most important components of the AI frame-
work regarding which a decision should be made, but how? The statistical
design of an experiment is a methodology that helps here. It allows us to cre-
ate a plan, execute it, compare the results according to the selected metrics of
the classifier quality, and repeat if needed. It often happens that we end up
with several classifiers that have similar classification quality.

FIGURE 1.1
Components of the AI framework.
Introduction to the AI Framework 5

1.2 AI Framework in Detail


AI framework addresses the challenges of building classifiers. These chal-
lenges include not only the difficulties of making selection of feature sets,
machine learning methods, and values of their hyperparameters based on
the classifier quality, but also the problems that arise during the process of
classifier building. These details are presented in Figure 1.2.

1.2.1 Creating Training and Test Datasets


As a first step, the AI framework deals with creating training and test data-
sets. The familiar approach of dividing available data into two parts, and
being concerned only with a proportion of such a division, e.g., 50-50 and
70-30, has a built-in drawback. It relates to bias and dependency within data.
It also relates to the situation that estimating a classifier on one dataset does
not allow us to measure variance and bias of the classifier quality and does
not allow us to evaluate the classifier robustness. In the developed AI frame-
work, the bootstrap approach is used to address this drawback.

• Bootstrap is used to create multiple—and if data permits, hundreds


or even thousands of—training and test datasets. It allows us to esti-
mate and correct bias in data, increase data variability, and decrease
dependency within data.

FIGURE 1.2
AI framework process.
6 Supervised Machine Learning

• Estimation of a classifier on multiple training datasets produces a


sample of the classifier quality metrics that now allows for a compre-
hensive estimation of the classifier quality.
• Use of multiple, instead of a single, test datasets helps to validate the
ability of the classifier to deal with unseen data.

1.2.2 Design of Experiments for a Classifier


As a next step, the AI framework addresses the question of parameters
­
selection, where the plan is created based on the statistical methodology of
the design of experiments. The plan creates combinations of all parameters of
interest in a way that the results can be analyzed and significant insights can
be drawn. For example, we may consider five possible feature sets, the sup-
port vector machine method with three different kernels, and three intervals
of values for each hyperparameter. The plan (design of experiments) will
define how many different setups should be used to build a classifier and
how many training datasets each setup should be applied to.

1.2.3 Firth Logistic Regression


Classifier results, by the nature of machine learning algorithms, do not have
probabilistic characteristics. This means that if an outcome is predicted as 1,
this prediction is not accompanied by a probability of it being correct. Being
able to associate probabilities with predictions increases the quality of a clas-
sifier. Firth logistic regression is a statistical method that works very well
with classifier prediction, adding to it a probability value.

1.2.4 Data Contamination


One of the most challenging problems of machine learning modeling is
generalization. Building classifiers on multiple training datasets helps to
address bias–variance trade-off, but it still cannot estimate the robustness
of the classifier toward unseen data. Planned contamination of data means
random corruption of labels according to different proportions. For example,
in the case of a binary classifier with labels Yes and No, planned contamina-
tion may look like the following:

1. “Flip” 0.5% of Yes labels to No, and 0.5% of No labels to Yes,


2. “Flip” 0.5% of Yes labels to No, and 1% of No labels to Yes,
3. “Flip” 1% of Yes labels to No, and 0.5% of No labels to Yes,
4. Etc.
Another Random Scribd Document
with Unrelated Content
saarnaamaan. Hän oli partasuu mies, jonka kasvot loistivat melkein
kiihkoa, ja hänen vyötäisillään riippui risti ja helminauha. Hän puhui
heidän köyhyydestään, heidän kadotetuista omaisistaan, heidän
kärsimyksistään, tästä synkästä ajasta, jota he saivat kokea, ja
kuinka oli rukoiltava valtiollisissa vaikeuksissa. Äänettömyys oli
täydellinen kuulijakunnassa, mutta kun pappi sanoi, että Jumala on
lähettänyt heille nämä kärsimykset heidän syntiensä tähden ja että
heidän täytyy tunnustaa syntinsä, joista pyhä äiti, kirkko, voi pelastaa
heidät, silloin syntyi hiljainen hyminä kuulijain kesken.

Rivi rippituoleja oli kirkon kummassakin sivu-osassa, ja kun


saarnaaja kertoi Vapahtajan kärsimyksistä, Hänen tuskastaan,
Hänen verestään, nousivat vaimot ja tytöt ääneen itkien ja menivät
toinen toisensa perästä tunnustamaan syntinsä. Heti kun joku oli
noussut pois, astui toinen sijaan, ja kukin näytti ripin jälkeen tyyneltä
ja rauhalliselta.

Hetken liikutus valtasi Roman kokonaan. Jospa hänkin voisi


tyhjentää sydämensä noin! Jos hän saattaisi päästä päiviensä
tuskista, öiden kärsimyksistä! Kulkiessaan erään rippituolin ohi oli
hän nähnyt papin siellä. Hänellä oli hellät, inhimilliset kasvot. Roma
oli nähnyt ne jossakin ennen, ehkä paavin riemukulussa.

Sillä hetkellä eräs köyhä, huivipää tyttö, joka oli itkien polvistunut
rippituoliin, nousi siitä ylös loistavin silmin. Roma vapisi liikutuksesta.
Vastustamaton halu tunnustaa oli vallannut hänet. Hänen täytyi
tarttua kiinni istuimeen, sillä muuten hän olisi kaatunut. Sitten hän
äkillisen tunnelman valtaamana, jonkinmoisessa huumaustilassa ja
tuskin tietäen mitä teki, heittäytyi samalle paikalle, josta tyttö oli
noussut, ja sanoi sykkivin sydämin ja vapisevalla äänellä pienen
metalliristikon läpi:
»Isä, minä olen suuri syntinen — kuule minua, kuule minua!»

Hän ei voinut hengittääkään, ja papin rauhalliset kasvot katsoivat


noita hehkuvia poskia ja palavia silmiä.

»Odota, tyttäreni, älä kiihoitu liiaksi. Sano tunnustuksesi.»

Roma koetti puhua, mutta sanat tuskin kuuluivat:

»Minä tunnustan… tunnustan… en voi, isä.»

Nuuska putosi vanhan miehen hyppysistä.

»Etkö ole kristitty?»

»En ole kastettu, mutta minut on kasvatettu luostarissa, ja…»

»Sitten en voi kuulla tunnustustasi. Kaste on ovi kirkkoon, ja ilman


sitä…»

»Mutta minä olen suuressa tuskassa. Pyhän Neitsyen tähden,


kuule minua!
Oi, kuule minua, isä, kuule minua!»

Vaikka vanha pappi oli tottunut ihmissydämen kärsimyksiin, valtasi


hänet ääretön sääli, ja hän sanoi ystävällisellä, hellällä äänellä:

»Jatka, tyttäreni. En voi antaa sinulle synninpäästöä, koska et ole


kirkon lapsi, mutta minä olen vanha mies ja jos voin auttaa
sieluparkaasi kantamaan taakkaansa, niin Jumala minua varjelkoon
työntämästä sinua pois.»

Kiihkein sanoin Roma kertoi tuskansa, peittämättä mitään,


lieventämättä mitään ja nimittämättä tai moittimatta ketään. Vihdoin
värisevä, nyyhkyttävä ääni taukosi ja syntyi hetken hiljaisuus, jolloin
äänet kirkossa tuntuivat tulevan kuin etäältä. Sitten lausui
ystävällinen ääni ristikon takaa:

»Tyttäreni, sinä et ole tässä asiassa tehnyt syntiä eikä sinulla ole
mitään kaduttavaa. Se, että tuskat sinua vaivaavat, todistaa, että
sielusi on puhdas ja että elät yhteydessä Jumalan kanssa.
Hermostuminen ja huoli on heikontanut ruumiillista terveyttäsi, ja
siksi on luonnollista, että luulet tehneesi syntiä, vaikka et ole
tehnytkään. Se on suloinen ominaisuus useimmissa naisina, mutta
valitettavasti vain harvoissa miehissä! Synti ei ollut sinun syntisi,
mene siis kotiisi rauhassa, ja Jumala sinua lohduttakoon.»

»Rakas isä… sinä olet niin hyvä, mutta oletko unohtanut…»

»Miehesikö? En! En voi sanoa, pitäisikö sinun kertoa hänelle vai


ei. Omasta puolestani olisin sitä vastaan, sillä miksi rasittaisin hänen
omaatuntoaan ja panisin alttiiksi perheen rauhan? Sinun tuskasi
siksi, että luonto itse tulee asian ilmaisemaan, on perustusta vailla ja
siis perkeleen kiusausta. Ne sinun tulee jättää. Mutta koska
avioliittosi on ainoastaan kirkollinen ja se toinen henkilö (menettelit
oikein, kun et sanonut hänen nimeään, lapseni) voi käyttää
hyväkseen olosuhteita erottaakseen teidät ja koska miehesi voisi
ikipäiviksi kadottaa luottamuksensa sinuun, jos tunnustuksesi tulee
liian myöhään, en osaa neuvoa, mikä olisi parasta turvallisuudellesi
ja mielesi rauhalle. Anna minun kysyä neuvoa viisaammalta. Anna
minun sanoa salaisuutesi korkealle henkilölle, ystävälliselle korvalle,
pyhimyksen sydämelle, vanhalle, pyhälle miehelle. Tule takaisin tai
sano minulle nimesi, jos tahdot, ja jos tuolla pyhällä miehellä on
jotain sanomista sinulle, olen sen ilmoittava. Mene nyt kotiisi
rauhassa, tyttäreni, ja Jumala ottakoon sinut isälliseen syliinsä.»
Kun Roma nousi rippituolista, tunsi hän samaa kuin henkilö, joka
on potenut kovaa tautia ja on paranemaan päin. Koko hänen
olemuksensa oli omituisesti muuttunut. Suuri paino oli pudonnut
pois, hänellä oli uusi sielu, ja hänen ruumiinsakin tuntui kevyeltä kuin
ilma.

Saarnaaja saarnasi vielä värisevällä äänellään, ja vaimot ja tytöt


itkivät vielä kun Roma astui pois kirkosta, mutta nyt hän kuuli kaiken
tuon kuin unessa. Vasta kun hän saapui porttikäytävälle ja sokea
kerjäläinen luetteli huolensa hänelle, hän heräsi lumouksesta. Niin
äkillinen ja salaperäinen oli tuo muutos, kun hän palasi taivaasta
maan päälle.
XII.

Ensimmäisessä postissa aamulla »Sisar Angelica» sai kirjeen


Davido
Rossilta.

»Rakkaani! — Kirjeesi saapui onnellisesti ja tuotti minulle suurta


iloa ja ehkä hiukan suruakin. Paitsi sitä tuskaa, jota aina tunnen
ajatellessani kansaraukkaani, olin hiukan alakuloinen lukiessani
jotain rivien välistä. Teeskenteletkö sinä onnentunnetta minun
rohkeuttani ylläpitääksesi ja estääksesi minua syöksymästä sinun
luoksesi huolimatta kaikesta? Kerran sinä olet tuleva onnelliseksi,
armaani. Silloin saan taas kuulla hopeanheleän naurusi niinkuin
tuona suloisena päivänä Campagnalla. Odotahan vain! Me olemme
nuoria vielä, ja elämä on edessämme.

Rukoile puolestani, oma sydämeni, että kätteni työ onnistuisi.


Olen työssä yöt ja päivät. Kokouksia, toimikuntia, kirjeenvaihtoa
lakkaamatta. Suuria suunnitteluja on tekeillä, armas, ja kohta saat
kuulla kaikki. Olen ylpeä, että arvostelin oikein sinun luonteesi
siveellistä voimaa ja että on mahdollista sanoa sinulle kaikki.
Olemme määränneet keskustoimikunnan ja järjestäneet
yhdistyksemme. Kaikki ovat yhtä mieltä minun kanssani siitä, että
yhteistoiminta on välttämätön. Eurooppa näyttää olevan kypsynyt
täydelliseen muutokseen, mutta ensimmäinen suuri työ on
toimitettava Roomassa. Minä saan kehoituksia kaikkialta. Kansojen
veljellinen yhdistyminen jatkuu jatkumistaan. Voima, joka on
suurempi raakuuden voimaa, leviää yli maailman.

Toisaalta lukemattomat miehet, jotka elävät ristiriidasta, koettavat


tukahduttaa luonnon ja Jumalan äänen. Kirkkokin koettaa jakaa
ihmiskuntaa. Kirjeestäsi päättäen sitä koetetaan tehdä taas
Roomassa. Se on vaarallista. Pappi-raukkoja kiusataan molemmilta
puolin. Toisaalta vallanpitäjät vaativat heitä puoltamaan heidän
valtaansa, olkoonpa se kuinka huono tahansa, ja toisaalta kirkko
vaatii heitä puoltamaan sen ajallisia oikeuksia. Liitän tähän
julistuksen papeille. Ehkä saat vanhan Albert Pellegrinon sen
painattajaksi ja levittäjäksi, kuten edelliselläkin kerralla. Jumala
suokoon, että siitä olisi apua!

Bruno-raukka! Olet epäilemättä oikeassa otaksuessasi, että


häntä kiusataan, jotta hänet saataisiin pettämään minut. En ole
huolissani ainoastaan itseni tähden. Minulle olisi ikuinen suru, jos
hänen mielensä tulisi myrkytetyksi. Koska Charles Minghelli on
vankilassa vangiksi puettuna, voi mitä tahansa tapahtua. Kun se
mies tuli luokseni tultuaan erotetuksi Lontoosta, pyysi hän apua
murhatakseen paronin. Minä epäsin, ja hän liittyi
vastapuolueeseen. Salainen tuomioistuin, jossa asioita
valmistetaan julkista käsittelyä varten, on pirullinen laitos,
julmuuden ja vääryyden pesä. Se on hävitetty melkein kaikista
sivistysmaista, mutta kauniin Italiamme tuomioistuimet ja vankilat
ovat yhä vieläkin salavehkeiden pesäpaikkoja, missä avuttomia,
kurjia olentoja peloitetaan jos jollakin tavalla kaikenlaisten
apumiesten välityksellä, jotka ovat valmiit vaikka mihin. Vanki ei ole
ihminen enää, vaan välittäjä, jonka tehtävänä on syyttää toisia.
Hänen sielunsa turmellaan, hänen petoksestaan maksetaan. Käy
itse tapaamassa Brunoa, jos mahdollista, ja pelasta hänet omalta
itseltään ja noilta ihmisiltä, joiden ainoana toimena elämässä on
saada varmuus rikoksista.

Ja nyt tahtoisin puhua ystävästäsi. Lohduta häntä. Tyttö-raukka


ei ole sen syyllisempi kuin jos veturi olisi ajanut hänen ylitsensä tai
villi peto syössyt hänen kimppuunsa häkistään. Älköön hän
kiusatko itseään enää. Se ei ole oikein, se ei ole hyvin. Ruumiimme
ei ole ainoa osa meissä, joka on taudille altis, sinun täytyy pelastaa
hänen sielunsa taudin uhalta.

Mitä siihen tulee, pitäisikö hänen kertoa siitä miehelleen, on


minulla siitä varma mielipiteeni. Kaikella muotoa hänen tulee se
tehdä. Omantunnon tuomioistuimen edessä synti ei ole ainoastaan
itse teossa. Sellainen teko on annettu anteeksi olipa se sitten
salainen tai julkinen. Jumala antoi sen anteeksi Davidille. Kristus
antoi sen anteeksi Jerusalemin vaimolle. Mutta salaaminen,
valehteleminen ja kaksikielisyys, sitä ei voi antaa anteeksi
ennenkuin se on tunnustettu.

Toinen seikka, jota sinun puhdas mielesi, armas, ei ole tullut


ajatelleeksi. Se toinen mies on olemassa. Ajattele mikä valta
hänellä on ystävääsi. Jos hän kaikesta huolimatta vielä tahtoo
omistaa tytön, hän voi peloittaa häntä ja uhata ilmaista kaiken
hänen miehelleen. Tämä voi saattaa vaimo-paran onnettomaksi ja
aikaa myöten vaimon tahto ehkä murtuu ja hän voi ehkä alistuakin.
Taikka sitten tuo mies voi todellakin kertoa kaiken hänen
miehelleen loukatakseen ja murhatakseen molempien onnen. Miten
käy vaimolle silloin? Uskooko hänen miehensä häntä silloin enää?

Noiden vaarojen välttämiseksi on hänen parasta puhua heti.


Luottakoon hän miehensä rakkauteen ja kertokoon hänelle kaikki.
Jos mies on oikea mies, niin hän ajattelee: »Ainoastaan hänen
puhtautensa on pakottanut hänet kertomaan», ja mies rakastaa
häntä enemmän kuin ennen. Hän ehkä tuntee hetken tuskaa.
Jokainen mies tahtoo mielellään uskoa, että hänen poimimansa
kukka on tahraton. Mutta hänen parempi luontonsa on voittava
hänen turhamaisuutensa ja hän on sanova: »Vaimoni rakastaa
minua, minä rakastan häntä, hän on viaton, ja jos joku isku on
häntä kohtaava, täytyy sen ensin kohdata minua.»

Tervehdykseni sinulle, rakkaani. Ystäväsi on varmaan todellinen


nainen, ja olit oikeassa kohdellessasi häntä hellästi. Mutta olit
myöskin oikeassa ollessasi ankara ja antaessasi hänen kulkea
kiirastulen läpi. Näin hyvät naiset aina menettelevät toisia naisia
kohtaan. Se on jonkinmoinen todistus heidän puhtaudestaan ja se
on myöskin heidän vahva turvansa, vaikka ajattelemattomat voivat
puhua toisin. Minä rakastan sinua ankaruutesi tähden tuota
vääryyttä kärsinyttä kyyhkysparkaa kohtaan, armaani, juuri yhtä
paljon kuin rakastan sinua hellyytesi tähden. Se on todistuksena
minulle, kuinka oikein arvostelin sielusi ylevyyttä, sen puhtautta ja
henkesi tulta sekä sydämesi kultaa. Kunnes tapaamme jälleen,
oma armaani.

Sinun D. R.»

Myötäliitetty »Julistus papeille» oli näin kuuluva:


»Ei ainoastaan Italiassa ja Irlannissa, vaan myöskin Venäjällä,
Ranskassa, Amerikassa ja koko maailmassa katolisen kirkon papit
nousevat kansan seasta. Miksi siis papit niin usein kansan
taisteluissa valtoja vastaan asettuvat kansaa sortamaan, sen intoa
sammuttamaan ja sen toiveita tukahduttamaan?

Veljet! Vastaus ei ole kaukana. On olemassa kirkon sielu ja on


olemassa kirkon ruumis. Kirkon sielu on taivaallinen, erehtymätön,
muuttumaton ja elää iankaikkisesti. Kirkon ruumis on inhimillinen,
rajoitettu ja katoava. Kirkon sielu on nöyrä ja polvistuu ristin
juureen. Kirkon ruumis on ylpeä ja istuu ruhtinaitten valtaistuimien
ääressä.

Kirkon papit! Piispanne sanovat teille, että kansan pyrinnöt ovat


Jumalan pilkkaamista ja kymmenen käskyn rikkomista. Tuo vanha
huuto
on kohonnut kaikkien ihmiskunnan marttyyrien ajamia muutoksia
vastaan
Kristuksen päivistä alkaen.

Mutta jos kansan pyrinnöt eivät ole sopusoinnussa uskonnon


kanssa ja jos heidän johtajansa ovat jumalattomia miehiä, on teidän
velvollisuutenne pelastaa kansa noista molemmista vaaroista.
Älkää antako kenenkään enää sanoa, että kirkko on ainoastaan
vanhentunut ilmiö ihmiskunnan kehityskulussa ja kaiken edistyksen
esteenä. Tulkoon ihmiskunnan pelastus kirkon papistosta, niin
häviävät kaikki uskonnottomat ja jumalattomat.

Mutta ovatko kansan pyrinnöt ristiriidassa uskonnon kanssa?


Kuunnelkaa ääniä, jotka värähtelevät läpi maailman. Kansat
puhuvat helluntaikielillä kaikkialla maailmassa. Sosialismi,
kommunismi ja ehkä anarkismikin! Mutta nämä ovat toiveita, ei
systeemejä, ne ovat sairauden ilmaisumuotoja, ei parannuskeinoja.
Ja eräs vaatimus on yhteinen kaikille — ihmiskunnan yhteyden
vaatimus! Se on se ääni, joka kaikuu kaikkialla, ja minä pyydän
teitä miettimään, eikö se ole Jeesuksen ääni.

Jeesuksen papit! Avatkaa evankeliumi ja sanokaa, eikö Kristus


opettanut, että me olemme yksi ainoa lauma, jolla on yksi ainoa
paimen, ja että kaikki ihmiset ovat Jumalan poikia ja veljiä
Hänessä?

Taivaassako vain ihmisperheen tulee toteuttaa tätä? Tarkoittiko


hän, että maan päällä on oleva ankaraa erotusta ja kauhistuttavaa
epätasaisuutta ja että luonto ja Jumala selvästi osoittavat
tahtovansa sitä ja luovansa sitä? Miksi hän siis opetti meitä
rukoilemaan »Lähestyköön Sinun valtakuntasi niin maan päällä
kuin taivaassa?»

Mutta vaikka taivaan valtakunta maan päällä olisikin


saavuttamaton tuhatvuotinen valtakunta, ette te Jeesuksen papit
tahtone kieltää Hänen lapsiltaan tuon unelman lohdutusta. Minä
uneksin kirkosta, joka ei huoli maallisista oikeuksistaan, mitkä
houkuttelevat sen jakamaan ihmiset kahteen luokkaan, rikkaisiin ja
köyhiin, moneen kansakuntaan, ystäviin ja vihollisiin. Minä uneksin
kansojen Pyhästä Isästä, joka tehdään maailman henkiseksi
hallitsijaksi, ei siten että Pyhä Henki vaikuttaa seitsemään
kardinaaliin suljettujen ovien takana, vaan siten, että se vaikuttaa
koko maailmaan taivaan valossa. Se on se korkea kirkko ja korkea
paavi, josta uneksin, ja jos Jumala tahtoo, olen ne myöskin kerran
näkevä.

Davido Rossi.»
XIII.

»Rakas Davido Rossi! — Koko päivän olen kantanut kirjettäsi kuin


pyhimyslipasta, joskus pikkuisen kurkistaen sitä ajaessani
vaunuissa tai omnibusseissa, vieläpä joskus kadullakin. Olen juuri
palannut kirjapainosta. Vanha Albert on humbugi. Hän keksi jos
jonkinlaisia esteitä. Entisestä julistuksesta muka hänellä oli hyvin
paljon huolta. Hän on joka hetki pelännyt vangitsemista, ja se, joka
ne naulasi ilmoituspilareihin, on kärsinyt samanlaisia tuskia.

Johtopäätös: lisää rahaa. Sitä hän sai, ja kaikki on nyt hyvin.

Se, mitä sanoit Brunosta, on saattanut minut vallan kuumeeseen,


ja minä olen kirjoittanut kenraalitirehtöörille ja pyytänyt saada
tavata häntä. Asiamiehemme Napoleon on myöskin nyt sitä mieltä,
että Bruno on salaisen inkvisitsionin uhri. Ei mikään pyhä
inkvisitsioni ole koskaan enemmän ylenkatsonut keinojen
valikoimista. Asianajaja N. sanoo, että Italian viranomaiset ovat
perineet huonon hallituksen paheet. Kamalaa on, että tehdään
väärin sen varjolla, että muka estettäisiin toisia tekemästä väärin.
Mutta tässä tapauksessa tehdään väärin siksi, että estettäisiin
toisia tekemästä oikein. Olen varma, että Brunoa koetetaan
houkutella sinun pettäjäksesi. Jospa saisin olla hänen sijassaan!
Voisivatkohan heidän juonensa vaikuttaa minuun? Ennen kuolisin.

Ja nyt tahtoisin puhua siitä ystävästäni. Tuskin voin pitää kynää


sormissani, kun kirjoitan hänestä. Sinä puhuit niin hyvästi ja jalosti.
Olisihan minun pitänyt tietää mitä sinä ajattelit ja kumminkin…

Armas, kuinka minä saatan jatkaa? Etkö voi arvata, mitä tahtoisin
sanoa sinulle? Kirjeesi pakottaa minut tunnustamaan. Tulkoon mitä
tahansa, en voi vaieta enää. Etkö arvannut kuka ystäväraukkani
on? Arvelin, että muistaisit edellisen kirjeenvaihtomme, kun sinä olit
rakastavinasi jotakin toista. Sinä et nähtävästi ole ajatellut sitä, ja
se on taas todistus — katkera ja suloinen todistus rakkaudestasi ja
luottamuksestasi minuun. Sinä asetit minut niin korkealle, ettet
ollenkaan epäillytkään, että puhuisin itsestäni. Niin oli kumminkin
laita, ja ystäväraukkani olen minä itse.

Kärsin koko ajan, kun näin millaiselle puhtauden patsaalle sinä


minut asetit. Kirjeesi, jotka kirjoitit ennenkuin ilmoitit rakkautesi,
siihen aikaan, jolloin koetit vastustaa tunnottasi, saattoivat minut
häpeämään, koska tiesin, etten ansainnut kiintymystäsi. Useinkin
täytyi minun olla katsomatta silmiisi, kun sanoit minua hyväksi.
Olisin tahtonut itkeä ja huutaa »ei, ei, ei!» ja musertaa palasiksi
sinun luomasi kuvan. Mutta kuinka minä olisin hennonut? Kuka
rakastava nainen voi särkeä ihannoidun kuvansa miehen
sydämestä? Hän voi ainoastaan koettaa kohoutua tuon kuvan
tasalle. Sitä olen koettanut, eikä ole minun syyni, etten ole
onnistunut.

Minussa on paljon moitittavaa. Oli hetkiä, jolloin velvollisuuden


olisi pitänyt pakottaa minut puhumaan. Semmoinen hetki oli juuri
avioliittomme edellä. Muistatko, että koetin sanoa sinulle jotain?
Sinä olit ystävällinen etkä tahtonut kuunnella. »Mennyt on
mennyttä», sanoit, ja minä olin hyvin iloinen, kun pääsin siitä. Sinä
et tiennyt, mitä tahdoin sanoa, muutoin et olisi pyytänyt minua
vaikenemaan. Mutta minä tiesin, mitä se oli, ja siitä lähtien olen
lakkaamatta kärsinyt. Ja nyt minusta tuntuu kuin olisin pettänyt
sinut. Olen saattanut sinut puhumaan ja toimimaan toisin kuin ehkä
muutoin olisit toiminut. Anna minulle anteeksi! En tahdo pitää sinua
kiinni missään suhteessa. Ota kaikki antamasi takaisin, minulla ei
ole oikeutta valittaa.

Paitsi sitä oli omassa asiassani puolia, joista en kertonut


puhuessani »ystävästäni». Pelkäsin asian tulevan tunnetuksi.
Armas, minä en saa piiloutua sen suloisen puolustuksen taakse,
jonka sinä keksit minulle. Minä todellakin ajattelin sitä toista miestä.
Minä en pelännyt, että hän uhkauksillaan turmelisi rakkauteni, sillä
sitä ei mikään maailman mahtavuus voisi tehdä. Mutta minä
pelkäsin, että hän kertoisi kertomuksensa ennen minua ja siten
saisi sinut työntämään minut pois luotasi. Se tuotti minulle tuskia
yöt päivät, ja nyt minä tunnustan tunnustettavani, ettet luulisi minua
paremmaksi kuin olen.

On toinenkin asia, jota et tietänyt. Rakas, antaisin elämäni, jos


minun ei tarvitsisi sitä kertoa, mutta minun täytyy tunnustaa sinulle
kaikki. Sinä tiedät, kuka se mies on, ja Jumalan edessä vakuutan,
että hänessä yksin oli syy. Mutta oma syyni tuli jälestäpäin. Sen
sijaan, että olisin lopettanut kaiken yhteyden hänen kanssaan, elin
ystävällinen hänelle ja vastaanotin isäni tiloista tulevat tulot, jotka
hän minulle antoi, sekä ajattelin häntä tulevana miehenänikin. Ja
kun sinun puheesi piazzalla näytti saattavan toiveeni
vaaranalaiseksi, päätin masentaa sinut.
Se on hirveätä. Kuinka minä voin sen kertoa sinulle kuolematta
häpeästä? Nyt tiedät, kuinka paljon petin sinua, ja tarkoitukseni
ilkeys vie minulta rohkeuden pyytää sinulta anteeksi. Voitko
ajatella, että minä en ollut ollenkaan parempi kuin Delila
tavatessani sinut ensi kerran! Mutta taivas tuli avuksi ja pelasti
sinut. Kuinka sinä vaikutit minuun! Ensin sinä loit uudestaan isäni
minulle, ja minä näin hänet sellaisena kuin hän todella oli enkä
sellaisena, jommoiseksi häntä oli minulle ennen kuvattu. Sitten sinä
annoit minulle sielun, ja minä näin itseni. Rakas, älä vihaa minua.
Sinun suuri sydämesi ei voisi olla niin julma, jos tietäisit kuinka olen
kärsinyt.

Vihdoin tuli rakkaus, ja minä tahdoin pitää siitä kiinni. Voi kuinka
hartaasti tahdoin! Siitä syystä en kertonut sinulle. Se oli
jonkinmoista peliä, se oli huumausta. Kaikkea, mitä tapahtui, pidin
rangaistuksena. Tulipa köyhyys, häpeä, kurjuus, entä sitten! Se
puhdistaisi vain syntistä entisyyttäni ja veisi minut lähemmäksi
sinua. Mutta kun vihdoin hän, joka oli loukannut minua, uhkasi
loukata sinua minun kauttani, jouduin epätoivoon. Sinä et aavista,
mitä aikeita silloin haudoin. Aioin surmatakin itseni saadakseni
kaikki loppumaan. Mutta minä en hennonut särkeä sydäntäsi siten.
Paitsi sitä tuo teko jo olisi ilmaissut sinulle jotain, ja minua hirvitti
ajatus, että sinä minun kuoltuani saisit tietää koko kurjan kohtaloni.

Nyt tiedät kaikki, armas. En ole salannut mitään. Kuten näet, en


ole ainoastaan ystävä-raukkani, vaan jotain vielä pahempaa —
oma itseni. Voitko antaa minulle anteeksi? En uskalla pyytää sitä.
Mutta älä anna minun olla epäilyksessä. Kirjoita. Tai vielä
mieluummin, sähkötä. Yksi ainoa sana vain. Siinä kyllin.
Tahtoisin lähettää sinulle rakastavan tervehdykseni, mutta tänä
iltana en uskalla. Olen rakastanut sinua ensi hetkestä asti enkä
koskaan voi lakata sinua rakastamasta, tapahtuipa mitä tahansa.
Minusta tuntuu kuin antaisit minulle anteeksi, jos käsittäisit, että
olen maailmassa ainoastaan rakastaakseni sinua ja että pahin
rikokseni syntyi siten, että rakastin sinua enemmän kuin järkeä ja
kunniaakin. Päätä kuinka tahansa, olen sinun ja voin uhrata
elämäni ainoastaan sinulle.

Päivä koittaa ja pyhän Pietarin risti hohtaa lumivalkeana


aamusumun läpi. Onhan se toivon merkki? Päivä koittaa kaakossa,
ja se saapuisi nopeammin luoteeseen, jos se rakastaisi sinua yhtä
paljon kuin minä. Olen kirjoittanut tämän kirjeen yhä uudestaan
pitkin yötä. Muistatko sitä kirjettä, joka minun piti polttaa, koska se
sisälsi salaisuutesi? Tässä on kirje, joka sisältää minun salaisuuteni
— mutta kuinka paljon kurjempi ja tuhoisampi tämä on! — Sinun
onneton tyttö-raukkasi

Roma.»
XIV.

Roma asettui asumaan Rossin huoneistoon. Kun hän iäksi


neuvottelemaan vanhuksien kanssa ja näyttämään heille Rossin
sähkösanomaa, olivat he onnellisia kuin lapset. Vanha kuuro vaimo
puheli lakkaamatta. Elena ei ollut lähettänyt mitään tietoja, ja ajatus,
että hän oli mennyt luostariin, näytti mahdottomalta, mutta he
rukoilivat joka päivä pyhää Antoniusta. Eilen oli kulunut kuukausi
pojan kuolemasta, ja he olivat vieneet orvokkivihon Campo Santoon,
mutta siellä oli jo kaunis seppele ennestään — pyhä Neitsyt oli
muistanut pikku Giuseppea.

Brunoko? Niin, he olivat kuulleet hänestä ja käyneet häntä


tervehtimässäkin. Mutta hän oli ollut hyvin omituinen, hyvin jäykkä ja
kova. Kun he puhkesivat itkuun nähdessään hänen vankipukunsa,
oli hän käskenyt heitä vaikenemaan eikä saattamaan häntä
naurunalaiseksi. Hän tahtoi ainoastaan puhua Elenasta. Joku oli
kertonut hänelle, että Elena oli mennyt pois, ja kun he viittasivat
sinne päin, että hän ehkä oli luostarissa, niin Bruno vain nauroi ja
kirosi.

Seuraavana päivänä Roma muutti uuteen asuntoonsa. Hän ei


tuonut mukanaan muuta kuin muutamia kirstuja, joissa oli hänen
tärkeimmät tavaransa sekä hänen isänsä kuva ja Elenan antama
Madonna. Panttilainaaja eli ottanut haltuunsa loput hänen
omaisuudestaan ja maksanut niistä rahasumman. Useimmat
kipsimallit ateljeessa rikottiin ja vietiin pois. Suihkukaivo, joka oli
marmorista, pantiin pimeään kellariin vanhan garibaldilaisen
asunnon alle. Ainoastaan yksi osa kannettiin yläkertaan. Siinä oli
Davido Rossin veistokuvan malli ja marmorilohkare Kristuksen päätä
varten.

Paitsi koiraansa ei Roma tuonut ketään mukanaan Piazza


Navonalle. Felice oli palannut paronin luo ja Nattalina oli erotettu.
Vanhan eukon piti siivota huoneet ja keittää ruoka, ja Roman piti itse
käydä ostoksilla. Naapurit ymmärsivät kohta asian laidan. Hän oli
Rossin vaimo. He rupesivat kutsumaan häntä signoraksi.

Romasta tuntui hyvin suloiselta asua Rossin huoneissa. Ne


ikäänkuin henkivät hänen läsnäoloaan. Vastaanottohuone, jossa oli
piano ja fonografi sekä kuvat seininä, toi Roman mieleen jokaisen
Rossin äänen värähdyksen. Makuuhuone oli ensin pyhättö, jota
Roma ei tahtonut käyttää, ennenkuin hän oli asettanut pienen
Madonnansa sinne. Sitten se muuttui hänen pieneksi majakseen, ja
kun hän nukkui siellä, tunsi hän outoa värähdystä, jommoista hän ei
koskaan ennen ollut tuntenut.

Nyt, kun hän asui Rossin ympäristössä, tuntui hänestä kuin hän
huomaisi jotain uutta Rossissa joka hetki. Katolla hyppelevät oravat
toivat mieleen Rossin pienenä poikana, ja lintuset, jotka juuri pesivät
ja siitä syystä laulelivat pitkin päivää, panivat Roman ajattelemaan
sykkivin sydämin heitä molempia. Lahjat, joita toiset naiset olivat
antaneet Rossille, herättivät Romassa melkein kuumemaista
uteliaisuutta. Muutamat olivat Englannista, toiset Amerikasta, ja
monet olivat naisilta, jotka eivät koskaan olleet Davido Rossia
nähneetkään. Ne tekivät Roman onnelliseksi ja ylpeäksi, mutta
myöskin hiukan mustasukkaiseksi.

Ensimmäisinä päivinä Piazza Navonalla hän uskotteli itselleen,


että tässä kaupunginosassa asuminen oli mitä hauskinta. Ensiksikin
siellä oli nuo taiteelliset, kapeat kadut ja vanhat pihat, veistetyt kivet
ja pienet lamput Madonnan kuvien edessä. Sitten siellä oli aina
ihmispäitä ikkunoissa, jäätelöveden myyjiä katukäytävillä, kirkuvia
aaseja ja huutavia, leikkiviä lapsia.

Kaikki oli luonnollista ja hauskaa. Roma eli ensi kertaa


ihmistoveriensa parissa, ja kun hänen hajuaistinsa joskus kärsi
likaisten ihmisten läheisyydestä, koetti hän sanoa itselleen, että se
oli vain väärää hienoutta tuo, joka saattoi hänet kärsimään.

Ennen kaikkea häntä liikutti ihmisten köyhyys, sillä se lähensi


häntä eniten Davido Rossiin. Tuolla oli majatalo, jossa köyhät miehet
saivat vuoteen kymmenestä pennistä, ja locande, jossa he viidestä
pennistä saivat nojata käsivartensa nuoraan. Tuolla oli
kuninkaallinen Monte di Pietà, valtion panttilaitos, ja kuninkaallinen
Ranco del Lotto, valtion arpajaislaitos. Tuolla oli rattaat, jotka ajoivat
ympäri katuja kooten almuja köyhille helposti liikutettujen
roomalaisten heitellessä vaatekappaleita ikkunoista. Tuolla oli
sairaus ja köyhyys, pellagra, joka tarttuu pelkällä maissilla elävään
kansaan. Tuolla kulkivat Punaisen Ristin sisaret sairaiden seassa,
tohtorit jakelivat unijuomaa kuoleville, ja kuolema nukutti heidät
ikuiseen uneen.

Trinità dei Montilta Roma oli katsellut kaikkea tuota kuin aitiosta
katsellaan näyttämöä, mutta nyt hän oli itse sen keskellä. Tässä
samassa ilmanalassa Davido Rossi eli. Rossi oli ehkä pakosta
joutunut siihen, mutta hän jäi sinne vapaasta tahdosta. Nuori
arkatuntoinen, hienostunut nainen kärsi siellä tuskia, mutta hän
luulotteli olevansa tyytyväinen.

Kaikkialla oli Rossi ja yhä vain Rossi! Joka ilta, kun Roma meni
levolle köyhässä asunnossaan, hänen viimeinen ajatuksensa oli
rakkauden sanelema rukous yön pimeydessä. Tuo rukous oli hyvin
yksinkertainen ja lapsellinen ja sisälsi sen, että Rossi aina rakastaisi
häntä, olipa hän minkälainen tahansa ja sanoipa maailma mitä
tahansa ja tekivätpä pahat ihmiset mitä tahansa.

Tätä mielialaa kesti viikon verran, mutta sitten se alkoi masentua.


Kaiken onnen takana piili pelko kirjeestä. Roma laski tunnit, jotka
olivat kuluneet siitä asti, kun hän pani sen postiin, ja kuinka kauan
viipyisi, ennenkuin hän saisi vastauksen. Jos Rossi sähköttäisi, voisi
vastaus tulla kolmessa päivässä. Mutta hän ei saanut mitään
vastausta.

»Hänestä on varmaan parempi kirjoittaa», sanoi Roma itselleen.


Tietysti hän kirjoittaa heti, ja viiden päivän perästä saan vastauksen.
Viidentenä päivänä hän meni tapaamaan luostarin portinvartijaa,
mutta tällä ei ollut mitään »sisar Angelicalle».

»Alpeilla on ehkä lunta ja postijunat ovat myöhästyneet», ajatteli


hän, ja sitten hän läksi Pialelle, jossa sähkösanomat ovat yleisön
nähtävinä. Sveitsissä oli todellakin lunta. Juuri sitähän Roma oli
otaksunut, ja siis Rossin kirje saapuisi seuraavana aamuna. Mutta
se ei saapunut silloinkaan.

»Kuinka tuhma minä olen! Kirjeeni tietysti tuli sunnuntaina


Lontooseen!» Hän ei ollut ajatellut, kuinka englantilaiset ovat
järjestäneet postinkulkunsa sunnuntaina. Vielä päivä, yksi ainoa
päivä, niin hän saisi sanoman Rossilta ja tulisi onnelliseksi.

Mutta päivä kului ja vielä toinenkin eikä mitään kirjettä kuulunut.


Roman mieli alkoi masentua, ja kirkas sateenkaari hänen elämänsä
taivaalla kalpeni. Katolta kuuluva laulu kiusasi häntä nyt. Kuinka ne
saattoivatkaan kiusata kurkkuaan noin? Ulkona satoi ja taivas oli
pimeä.

Sitten vanha garibaldilainen ja hänen vaimonsa tulivat pelokkaan


näköisinä ja asiapaperi kädessä yläkertaan. Heidät oli kutsuttu
todistajiksi Brunon asiassa. Tutkimus oli tapahtuva kolmen päivän
perästä.

»Minä olen, luojan kiitos, kuuro, eivätkä he voi paljoa minua


kiusata», sanoi vanha vaimo.

Roma pukeutui yksinkertaiseen mustaan olkihattuun, jonka sivuun


oli pistetty höyhen, ja läksi asianajaja Napoleon Fusellin toimistoon.

»Aioin juuri kirjoittaa teille, hyvä neiti», sanoi tuo suuri mies
vaipuen tuoliinsa. »Ikävä kyllä on työni ollut turha. Ei maksa vaivaa
jatkaa. Mies on tunnustanut.»

»Tunnustanut?» Roma puristi takkinsa rintamusta.

»Tunnustanut ja ilmaissut liittolaisensa.»

»Liittolaisensa?»

»Erikoisesti Rossin, jota hän on syyttänyt osallisuudesta


vaaralliseen salaliittoon.»
Welcome to our website – the ideal destination for book lovers and
knowledge seekers. With a mission to inspire endlessly, we offer a
vast collection of books, ranging from classic literary works to
specialized publications, self-development books, and children's
literature. Each book is a new journey of discovery, expanding
knowledge and enriching the soul of the reade

Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.

Let us accompany you on the journey of exploring knowledge and


personal growth!

textbookfull.com

You might also like