Data Analytics Models and Algorithms for Intelligent Data Analysis 1st Edition Thomas A. Runkler (Auth.) download
Data Analytics Models and Algorithms for Intelligent Data Analysis 1st Edition Thomas A. Runkler (Auth.) download
https://ebookultra.com/download/data-analytics-models-and-
algorithms-for-intelligent-data-analysis-1st-edition-thomas-a-
runkler-auth/
https://ebookultra.com/download/data-analytics-with-hadoop-an-
introduction-for-data-scientists-1st-edition-benjamin-bengfort/
https://ebookultra.com/download/hydrogeological-conceptual-site-
models-data-analysis-and-visualization-neven-kresic/
https://ebookultra.com/download/java-collections-an-introduction-to-
abstract-data-types-data-structures-and-algorithms-1st-edition-david-
a-watt/
https://ebookultra.com/download/big-data-analytics-2016th-edition-
radha-shankarmani/
Azure Storage Streaming and Batch Analytics A Guide for
Data Engineers 1st Edition Richard L. Nuckolls
https://ebookultra.com/download/azure-storage-streaming-and-batch-
analytics-a-guide-for-data-engineers-1st-edition-richard-l-nuckolls/
https://ebookultra.com/download/fraud-and-fraud-detection-website-a-
data-analytics-approach-1st-edition-sunder-gee/
https://ebookultra.com/download/latent-markov-models-for-longitudinal-
data-1st-edition-francesco-bartolucci/
https://ebookultra.com/download/big-data-analytics-volume-33-1st-
edition-venu-govindaraju/
https://ebookultra.com/download/growing-algorithms-and-data-
structures-4th-edition-david-scuse/
Data Analytics Models and Algorithms for Intelligent
Data Analysis 1st Edition Thomas A. Runkler (Auth.)
Digital Instant Download
Author(s): Thomas A. Runkler (auth.)
ISBN(s): 9783834825896, 3834825891
Edition: 1
File Details: PDF, 2.54 MB
Year: 2012
Language: english
Data Analytics
Thomas A. Runkler
Data Analytics
Vieweg+Teubner
© Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden 2012
This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of
the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation,
broadcasting, reproduction on microfilms or in any other physical way, and transmission or information
storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology
now known or hereafter developed. Exempted from this legal reservation are brief excerpts in connection
with reviews or scholarly analysis or material supplied specifically for the purpose of being entered and exe-
cuted on a computer system, for exclusive use by the purchaser of the work. Duplication of this publication
or parts thereof is permitted only under the provisions of the Copyright Law of the Publisher s location,
in its current version, and permission for use must always be obtained from Springer. Permissions for use
may be obtained through RightsLink at the Copyright Clearance Center. Violations are liable to prosecution
under the respective Copyright Law.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
While the advice and information in this book are believed to be true and accurate at the date of publication,
neither the authors nor the editors nor the publisher can accept any legal responsibility for any errors or
omissions that may be made. The publisher makes no warranty, express or implied, with respect to the
material contained herein.
The information in the world doubles every 20 months. Important data sources are
business and industrial processes, text and structured data bases, image and biomed-
ical data. Many applications show that data analytics can provide huge benefits. We
need models and algorithms to collect, preprocess, analyze, and evaluate data, from
various fields such as statistics, system theory, machine learning, pattern recogni-
tion, or computational intelligence. With this book you will learn about the most
important methods and algorithms for data analytics. You will be able to choose
appropriate methods for specific tasks and apply these in your own data analytics
projects. You will understand the basic concepts of the growing field of data analyt-
ics, which will allow you to keep pace and to actively contribute to the advancement
of the field.
This text is designed for undergraduate and graduate courses on data analytics
for engineering, computer science, and math students. It is also suitable for prac-
titioners working on data analytics projects. The book is structured according to
typical practical data analytics projects. Only basic mathematics is required. This is
the third edition of a book that has been used for more than ten years in numerous
courses at the Technical University of Munich, Germany, in short courses at several
other universities, and in tutorials at international scientific conferences. Much of
the content is based on the results of industrial research and development projects
at Siemens.
The author wishes to express his sincere appreciation to everybody who has sup-
ported this work, in particular Wilfried Brauer, Jim Bezdek, Javier Esparza, Ralph
Grothmann, Hans Hellendoorn, Jürgen Hollatz, Eyke Hüllermeyer, Uzay Kaymak,
Jim Keller, Frank Klawonn, Rudolf Kruse, Rainer Palm, Bernd Schürmann, João
Sousa, and Hans-Georg Zimmermann, the reviewers and students for pointing out
errors and suggesting improvements, and the editorial and publisher team for their
professional collaboration.
v
Contents
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 It’s All About Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Data Analytics, Data Mining, and Knowledge Discovery . . . . . . . . . . 2
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1 Error Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Error Handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Filtering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4 Data Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.5 Data Merging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4 Data Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1 Diagrams . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Principal Component Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.3 Multidimensional Scaling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Sammon Mapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
vii
viii Contents
4.5 Auto-Associator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.6 Histograms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7 Spectral Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5 Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1 Linear Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Correlation and Causality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3 Chi-Square Test for Independence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.1 Linear Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2 Linear Regression with Nonlinear Substitution . . . . . . . . . . . . . . . . . . 67
6.3 Robust Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.4 Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5 Radial Basis Function Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.6 Cross-Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.7 Feature Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
7 Forecasting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.1 Finite State Machines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.2 Recurrent Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Autoregressive Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
8 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.1 Classification Criteria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.2 Naive Bayes Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
8.3 Linear Discriminant Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.5 Nearest Neighbor Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.6 Learning Vector Quantization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
8.7 Decision Trees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Contents ix
9 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.1 Cluster Partitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.2 Sequential Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
9.3 Prototype-Based Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
9.4 Fuzzy Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
9.5 Relational Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
9.6 Cluster Tendency Assessment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
9.7 Cluster Validity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
9.8 Self-Organizing Map . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Chapter 1
Introduction
Abstract This book deals with models and algorithms for the analysis of data sets,
for example industrial process data, business data, text and structured data, im-
age data, and biomedical data. We define the terms data analytics, data mining,
knowledge discovery, and the KDD and CRISP-DM processes. Typical data analy-
sis projects can be divided into several phases: preparation, preprocessing, analysis,
and postprocessing. The chapters of this book are structured according to the main
methods of data preprocessing and data analysis: data and relations, data preprocess-
ing, visualization, correlation, regression, forecasting, classification, and clustering.
The focus of this book is the analysis of large data sets, for example:
• Industrial process data: An increasing amount of data is acquired, stored and
processed in order to automate and control industrial production, manufacturing,
distribution, logistics and supply chain processes. Data are used on all levels of
the automation pyramid: sensors and actuators at the field level, control signals at
the control level, operation and monitoring data at the execution level, schedules
and indicators at the planning level. The main purpose of data analysis in industry
is to optimize processes and to improve the competitive position of the company.
• Business data: Data of business performance are analyzed to better understand
and drive business processes. Important business domains to be analyzed include
customers, portfolio, sales, marketing, pricing, financials, risk, and fraud. An ex-
ample is shopping basket analysis that finds out which products customers pur-
chase at the same time. This analysis aims to improve cross selling and thus
increases sales. Another example for business data analysis is customer segmen-
tation for tailored advertising and sales promotions.
• Text and structured data: The analysis of numerical data has been the focus of
mathematical statistics for centuries. Today, text and structured data also serve
The term data mining dates back to the 1980s [3]. The goal of data mining is to
extract knowledge from data [1]. In this context, knowledge is defined as interest-
ing patterns that are generally valid, novel, useful, and understandable to humans.
Whether or not the extracted patterns are interesting depends on the particular appli-
cation and needs to be verified by application experts. Based on expert feedback the
knowledge extraction process is often interactively refined. The term data analytics
became popular in the early 2000s [2, 6]. Data analytics is defined as the application
of computer systems to the analysis of large data sets for the support of decisions.
Data analytics is a very interdisciplinary field that has adopted aspects from many
other scientific disciplines such as statistics, signal theory, pattern recognition, com-
putational intelligence, machine learning, and operations research.
Typical data analysis projects can be divided into several phases. Data are as-
sessed and selected, cleaned and filtered, visualized and analyzed, and the analysis
results are finally interpreted and evaluated. The knowledge discovery in databases
(KDD) process [1] comprises the six phases selection, preprocessing, transforma-
tion, data mining, interpretation, and evaluation. The cross industry standard pro-
cess for data mining (CRISP-DM) [5] comprises the six phases business under-
standing, data understanding, data preparation, modeling, evaluation, and deploy-
ment. For simplicity we distinguish only four phases here: preparation, preprocess-
ing, analysis, and postprocessing (Fig. 1.1). The main focus of this book is data
preprocessing and data analysis. The chapters are structured according to the main
methods of preprocessing and analysis: data and relations, data preprocessing, visu-
alization, correlation, regression, forecasting, classification, and clustering.
This book gives a clear and concise overview of the most important methods and
algorithms of data analysis. It enables the reader to gain a complete and compre-
References 3
hensive understanding of data analysis, to apply data analysis methods to his or her
own projects, and to contribute to the progress of the field.
A large number a software tools for data mining are available today. Popular
commercial software tools include MATLAB, SPSS, SAS, and STATISTICA. Pop-
ular free and open-source software tools include R, Rapid Miner, and WEKA. This
book does not present, compare, or recommend any data mining software tools. For
a comprehensive overview of current data mining software tools please refer to [4].
References
Abstract The popular Iris benchmark set is used to introduce the basic concepts
of data analysis. Data scales (nominal, ordinal, interval, ratio) must be accounted
for because certain mathematical operations are only appropriate for specific scales.
Numerical data can be represented by sets, vectors, or matrices. Data analysis is of-
ten based on dissimilarity measures (like inner product norms, Lebesgue/Minkowski
norms) or on similarity measures (like cosine, overlap, Dice, Jaccard, Tanimoto).
Sequences can be analyzed using sequence relations (like Hamming, Levenshtein,
edit distance). Data can be extracted from continuous signals by sampling and quan-
tization. The Nyquist condition allows sampling without loss of information.
To introduce the basic concepts of data analysis we consider one of the most popular
historic benchmark data sets: the Iris data set [1]. The Iris data set was originally
created in 1935 by the American botanist Edgar Anderson who examined the ge-
ographic distribution of Iris flowers on the Gaspé peninsula in Quebec (Canada).
In 1936, Sir Ronald Aylmer Fisher used Anderson’s Iris data set as an example for
multivariate discriminant analysis [4] (see chapter 8). Subsequently, the Iris data
set became one of the most frequently used reference data set in statistics and data
analysis.
The Iris data set comprises measurements from 150 Iris flower samples: 50 from
each of the three species Iris Setosa, Iris Virginica, and Iris Versicolor. For each
of the 150 flowers, values of four numerical features chosen by Anderson were
measured: the length and the width of sepal and petal leaves in centimeters. For
illustration, Table 2.1 shows the complete Iris data set. Notice that several distinct
replicates of the original Iris data set have been used and published, so in experi-
ments with this data set the version should be carefully checked [2]. The Iris data
set as well as many other popular data sets are available, for example, through the
machine learning data base at the University of California at Irvine (UCI).
In data analysis we call each of the 150 Iris flowers an object, each of the three
species a class, and each of the four dimensions a feature. Here is a list of typical
questions that we try to answer by data analysis:
• Which of the data might contain errors or false class assignments?
• What is the error caused by rounding the data off to one decimal place?
• What is the correlation between petal length and petal width?
• Which pair of dimensions is correlated most?
• None of the flowers in the data set has a sepal width of 1.8 centimeters. Which
sepal length would we expect for a flower that did have 1.8 cm as its sepal width?
• Which species would an Iris with a sepal width of 1.8 centimeters belong to?
• Do the three species contain sub-species that can be identified from the data?
In this book you will find numerous methods and algorithms to answer these and
other data analysis questions. For a better understanding of these data analysis meth-
ods and algorithms we first define and examine the fundamental properties of data
and their relations.
Numerical measurements may have different semantic meanings, even if they are
represented by the same numerical data. Depending on the semantic meaning dif-
ferent types of mathematical operations are appropriate. For the semantic meaning
of numerical measurement Stevens [7] suggested the four different scales that are
shown in Table 2.2. For nominal scaled data (first row) only tests for equality or in-
equality are valid. Examples for nominal features are names of persons or codes of
objects. Data of a nominal feature can be represented by the mode which is defined
as the value that occurs most frequently. For ordinal scaled data (second row) the
operations ”greater than” and ”less than” are valid. For each scale level the opera-
tions and statistics of the lower scale levels are also valid, so for the ordinal scale
we have equality, inequality, and the combinations ”greater than or equal” (≥) and
”less than or equal” (≤). The relation ”less than or equal” (≤) defines a total or-
der, such that for any x, y, z we have (x ≤ y) ∧ (y ≤ x) ⇒ (x = y) (antisymmetry),
(x ≤ y) ∧ (y ≤ z) ⇒ (x ≤ z) (transitivity), and (x ≤ y) ∨ (y ≤ x) (totality). Examples
for ordinal features are school grades. Data of an ordinal feature can be represented
by the median which is defined as the value for which (almost) as many smaller as
8 2 Data and Relations
Table 2.3 Computation of the median petal width of the Iris data set.
value frequency accumulated frequency value frequency accumulated frequency
0.1 5 5 2.5 3 3
0.2 29 34 2.4 3 6
0.3 7 41 2.3 8 14
0.4 7 48 2.2 3 17
0.5 1 49 2.1 6 23
0.6 1 50 2 6 29
0.7 0 50 1.9 5 34
0.8 0 50 1.8 12 46
0.9 0 50 1.7 2 48
1 7 57 1.6 4 52
1.1 3 60 1.5 12 64
1.2 5 65 1.4 8 72
1.3 10(13) 75 1.3 3(13) 75
larger values exist. The mean is not valid for ordinal features, so for example it does
not make sense to say that the average school grade is C. For interval scaled data
(third row) addition and subtraction are valid. Interval scaled features have arbitrary
zero points. Examples are years in the Anno Domini dating system or temperatures
in degrees Celcius (centigrade) or Fahrenheit, so for example it does not make sense
to say that 40◦C is twice as high as 20◦C. Data of an interval scaled feature, for
example, a set of values X = {x1 , . . . , xn }, can be represented by the (arithmetic)
mean
1 n
x̄ = ∑ xk (2.1)
n k=1
For ratio scaled data (fourth row) multiplication and division are valid. Examples
for ratio scaled features are time differences like ages or temperatures on the Kelvin
scale. Data of an interval scaled feature can be represented by the generalized mean
1 n
mα (X) = α ∑ xαk (2.2)
n k=1
with the parameter α ∈ R, which includes the special cases minimum (α → −∞),
harmonic mean (α = −1), geometric mean (α → 0), arithmetic mean (α = 1),
quadratic mean (α = 2), and maximum (α → ∞).
The features of the Iris data set are on ratio scale. For example, we can approxi-
mately estimate the sepal surface area by multiplying the sepal length and the sepal
width. Hence, we can compute the mode, median, mean and generalized mean of
each of the features of the Iris data set. Table 2.3 illustrates this for the petal width
(fourth feature). The Iris data set contains petal widths between 0.1 and 2.5 centime-
ters. The most frequent value of the petal width is 0.2 centimeters, which occurs 29
times, so the mode is 0.2 centimeters. To compute the median we can accumulate
the numbers of occurences of the values for 0.1 centimeters, 0.2 centimeters, and so
on, until we reach half of the number of objects (75). This algorithm yields a me-
2.3 Set and Matrix Representations 9
dian petal width of 1.3 centimeters. The accumulation of the frequencies can also be
done in reverse order (right view of Table 2.3). The complexity of this algorithm is
O(n log n). Notice, however, and this is surprising even to many scientists, that the
median can be efficiently computed in linear time using selection algorithms [3].
Finally, the mean petal width can be computed as about x̄(4) ≈ 1.19933.
The majority of methods presented in this book use addition, subtraction, multi-
plication, or division of feature values and are therefore suitable only for interval and
ratio scaled data. To analyze nominal and ordinal data we define relations between
pairs of such data, that can be analyzed using specific relational methods.
X = {x1 , . . . , xn } ⊂ R p (2.3)
Language: Italian
VOLI DI GUERRA
IMPRESSIONI DI UN GIORNALISTA PILOTA
MILANO
Fratelli Treves, Editori
1918.
PROPRIETÀ LETTERARIA.
I diritti di riproduzione e di traduzione sono riservati
per tutti i paesi, compresi la Svezia, la Norvegia e
l'Olanda.
Milano — Tip. Treves.
INDICE
Dal giornalismo all'aviazione.
★
Più è prossimo il momento di volare per la prima volta e tanto
maggiormente la sensibilità dell'allievo si paralizza. Pochi istanti
prima di salire sull'apparecchio, il novizio, non avvertendo più alcuna
emozione, confonde questo stato d'animo con la tranquillità:
viceversa è l'effetto di una tensione nervosa, la quale si trasforma in
un fenomeno di serena voluttà non appena l'apparecchio si è librato.
L'esordiente ha l'illusione che non sia l'apparecchio a sollevarsi, ma il
panorama ad abbassarsi, a roteargli lentamente intorno. Una
improvvisa, assoluta fiducia lo sorregge: una fiducia ispirata dalla
stabilità dell'apparecchio che in volo si rivela solido, imperioso,
sonoro e perde l'aspetto fragile osservato da terra. La velocità non è
percettibile; pare che l'idrovolante si regga su un solido pernio
invisibile. Il vuoto non esiste che per lo sguardo: l'atmosfera si
manifesta anche al neofita un elemento consistente, soffice ma
tenace, in cui l'apparecchio morde e si regge vittorioso. Ma quando
l'idrovolante s'inclina per iniziare la discesa, il novizio si turba. Un
rimescolìo passeggero agli intestini, somigliante a quello che dà
l'altalena, lo coglie all'improvviso. Il silenzio che segue al fragore del
motore — perchè il motore viene fermato o ridotto a una velocità
minima — determina una forma d'ansietà. La visione panoramica,
che prima era preclusa in parte notevole al neofita dalla punta dello
scafo protesa in alto, ora che lo scafo è inclinato, appare in tutta la
sua vastità, come osservata da un altissimo balcone, e rivela la
quota raggiunta. Si mostra come un'immensa carta geografica a
rilievo. Lo specchio d'acqua appare come una enorme lastra
metallica bruna e s'avvicina con crescente velocità. Quando mancano
pochi metri da esso e l'apparecchio si dispone a posarvisi, si rivela
fulminea la rapidità dell'apparecchio stesso: lo specchio gli sfugge di
sotto vertiginosamente e il neofita trattiene il respiro in cospetto di
questo imprevisto epilogo. Un lieve fruscìo, un impercettibile colpetto
sotto lo scafo: l'apparecchio ha preso contatto con l'acqua, solleva
intorno biancori di spuma e s'arresta rapidamente.
L'allievo confonde l'ammirazione per il volo con la gioia di averlo
condotto a termine: certo è raggiante. Difficilmente le sue
impressioni sono da lui espresse in modo genuino, perchè non ha
saputo analizzare sè stesso o perchè ritiene obbligatorio ricorrere a
una di queste due opposte frasi: «Nessuna impressione» oppure
«Impressione straordinaria» accompagnate da un prolungato sorriso
ufficiale finchè egli si vede scrutato dai colleghi. Effetti fisici generali:
ronzìo alle orecchie paragonabile all'uniforme canto dei grilli,
appetito accentuato e richiesta da parte dei colleghi di una
bicchierata per festeggiare il primo volo.
Nei voli successivi l'allievo ammesso ad abbozzare tentativi di
manovra accanto al maestro, acquista l'improvvisa persuasione che
per manovrare siano sufficienti le risorse dell'istinto. La sua
convinzione di riuscire diviene tanto più fiera quanto prima dei voli
era esitante. Si delinea in lui l'esuberante spirito d'iniziativa: egli
scambia per aquilina audacia la propria ignoranza sulle difficoltà del
volo. I suoi tentativi di manovra sono senza sfumature. Se il maestro
lo frena, egli insiste per ottenere una maggiore autonomia. Non esita
ad affermare in piena buona fede che si sentirebbe di volare da solo.
Naturalmente pretende di figurare tra gli anziani. In cospetto dei
nuovi aspiranti si comporta da vecchio falco, spiega con degnazione
annoiata la manovra, concludendo: — È semplicissima!
Ma quando l'istruttore gli affida realmente la manovra, l'allievo entra
nella fase di depressione. Egli registra le nuove difficoltà nel suo
diario: quasi tutti gli allievi conservano un diario con il numero e le
caratteristiche dei loro voli. Oltre occuparsi delle condizioni
dell'atmosfera, del motore, dell'acqua, lo scolaro osserva: «Oggi il
maestro mi ha dichiarato che se egli non interveniva in tempo ci si
infilava nell'acqua». — «Ho osservato che quando reggo io il volante,
l'apparecchio disegna le montagne russe; non appena il maestro
riprende il volante, l'apparecchio torna in linea di volo. Dunque non è
il vento. Il maestro dice che il vento lo faccio io». — «Quando
correggo uno sbandamento ne produco uno maggiore. Il maestro
dice che faccio fare all'apparecchio ciò che fa il cane quando è gaio;
mena la coda a destra e a sinistra».
Se l'idrovolante giunto presso all'acqua non è posto in tempo in linea
di volo, toccando l'acqua rimbalza in aria come un ciottolo a forma di
piastrella lanciato parallelamente alla distesa liquida. Di qui la
denominazione di piastrella a questo tipo di amérissage imperfetto.
La piastrella è l'incubo dell'allievo il quale ricorre ai più ricercati
sofismi per ripudiarne la paternità. Generalmente spiega che è
derivata da un complesso di combinazioni: acqua poco visibile, colpo
di vento, vicinanza di una barca, occhiali appannati....
A traverso queste prime esperienze l'entusiasmo del discepolo perde
effervescenza: diviene solida meditazione. L'allievo non ha più
baldanza loquace, superficiale, nè severità di giudizi. Tace ed
osserva. Segue i voli con sguardo da iniziato, rimugina le
osservazioni fatte pilotando. Dal modo come si comporta un
apparecchio in aria indovina chi lo guida. Anche in aviazione, la
personalità, lo stile esistono. L'allievo comincia a comprendere che la
manovra non è dettata dall'istinto, ma dalla fulminea entrata in
azione di abitudini contratte studiando il volo. È un ricamo di
innumerevoli eccezioni intorno a un semplice concetto fondamentale.
Ma per conseguire questo senso della manovra occorre vivere la vita
dell'apparecchio, occorre che pilota e idrovolante compongano una
cosa sola.
La spirale: altra causa di crisi momentanea. L'istruttore la fa
conoscere all'allievo d'improvviso ed eccezionalmente stretta per
misurare la sua presenza di spirito. L'allievo vede il panorama
inclinarsi e sollevarsi obliquamente come agitato da una danza
diabolica, vede lago, fiumi, paesi, colli, monti roteare, sovrapporsi
quasi fosse giunta la fine del mondo. Quando la spirale cessa di
fatto, nella testa dell'allievo continua. Egli rimane rigido, in
atteggiamento di difesa, trattenendo il respiro. Scendendo reca il
sospetto di non avere attitudine per l'aviazione, ma negli esperimenti
successivi si comporta, anche intimamente, con assai maggiore
disinvoltura fino a divenire egli stesso un abile autore di spirali, per
quanto ampie e caute.
★
Affermano in maggioranza i piloti che la loro più acuta soddisfazione
derivò dal loro primo volo senza istruttore. Si giunge a questa prova
sospinti da un bisogno imperioso di liberarsi dal controllo
dell'istruttore. È un'apparente forma d'ingratitudine che ricopre una
sostanza di rinascente idoneità. Quando l'allievo in volo si sente
spersonalizzato, prova la luminosa illusione di aver sempre volato,
considera normale la visione dall'alto del panorama ed è insofferente
degl'interventi nella manovra del suo maestro, è evidente che la
convinzione di poter volare solo, matura in lui. Ciò che importa assai
è la convinzione di poter condurre un apparecchio, tanto è vero che i
capi-piloti fingono di mostrarsene increduli per accertarsi, traverso le
proteste dell'allievo, ch'essa esiste veramente.
Se le discussioni in terra sono spesso vane, in cielo sono addirittura
dannose. È necessario in volo perseguire un'idea unica, precisa,
ferma. Due idee avverse nella testa di un pilota producono il
medesimo disordine di due donne in una casa. Purtroppo l'allievo nel
suo primo volo da solo reca due, tre idee per ogni fenomeno nuovo
che lo interessa. Il suo è il volo dei dubbii. I fenomeni nuovi sono: il
motore, l'orientamento e la solitudine. Quando l'allievo volava col
maestro questi si occupava di regolare il motore, di indicare la rotta,
e con la sua presenza aboliva la solitudine. Accade che l'allievo,
dovendo introdurre nella sua psicologia queste nuove responsabilità,
smarrisca momentaneamente l'esatto senso del solo elemento di cui
era sicuro: la manovra. Assalito da nuove preoccupazioni, diffida
anche delle regole che già applicava con disinvoltura da tempo. Le
impiega precipitosamente e provoca nell'apparecchio oscillazioni
ch'egli si affretta ad attribuire al vento. Tutti i reduci del primo volo
affermano che spirava un vento eccezionale.
Ma la crisi culminante del primo volo è provocata dalla discesa: —
Quando spengo il motore? — comincia a chiedersi il neo pilota. —
Adesso. No, è presto. Toccherei acqua troppo lontano dalla scuola.
Però attento a non scendere contro gli hangars. Spengo adesso. No.
Sì. No.
Intanto l'apparecchio, quasi avesse udito il dibattito del suo incerto
pilota, si è abbassato per conto suo; l'allievo, allarmato, fa uno
sforzo togliendo una mano dal volante per chiudere la manetta della
benzina, e riportandola urgentemente al volante. Con l'indice destro
cerca il bottoncino del magnete, per togliere la corrente elettrica, ed
ha l'impressione di non trovarlo. Eccolo. Preme. Il motore tace.
L'allievo inclina l'apparecchio. Troppo. Lo richiama. Teme di scivolar
d'ala. Ripicchia. Teme d'imbarcarsi: — Calma, calma, se no va a finir
male — raccomanda a sè stesso. La discesa finalmente procede
regolare con buona velocità. S'avvicina lo specchio d'acqua.
Comincia la preoccupazione per l'amérissage. Si tratta di attenuare
l'inclinazione dell'apparecchio, ma con dolcezza, con sfumature quasi
impercettibili. Viceversa il reduce richiama a sè il volante troppo
sollecitamente: è ancora a sei metri dall'acqua. Respinge il volante
ma deve richiamarlo quasi subito perchè è ormai a un metro.
Qualche esitazione ancora, poi alla fine l'idrovolante tocca l'acqua,
un po' bruscamente e inelegantemente, ma senza eccessivi guai.
Lungo respiro di soddisfazione dell'allievo il quale, riacceso il motore,
fa ritorno alla scuola salutato dai colleghi che sulla rotonda lo hanno
seguìto in volo: — Bene, bravo, — gli gridano. Ognuno vuole
stringergli la mano. Il trionfatore diventa insincero. Poichè lo lodano,
egli assume l'atteggiamento di chi si merita la lode guardandosi dal
denunciare gli errori commessi, anche perchè ha la coscienza di non
ripeterli più.
— Quali impressioni? — gli chiedono.
— Mi sono trovato molto bene.
— Si vola meglio senza maestro?
— Non c'è paragone.
In questa fase di ascensione, caratterizzata da prove di crescente
portata, il neo pilota è suscettibile di impressioni esagerate che
derivano dal consumo eccezionale di energie quando ancora i suoi
centri nervosi non sono sufficientemente sviluppati. Ma lo sviluppo
nervoso nell'allievo di solida costituzione è alacre e gli consente di
superare prove che pensate prima gli apparivano insormontabili. Un
allievo che scende esausto da un esperimento non raggiunto, porta
nel segreto della sua anima uno sconforto che non sa confidare e
che ha il colore della sconfitta. Ma all'indomani le sue forze sono
gagliarde in una misura insperata. L'esperienza del giorno
precedente, anzichè essergli nemica, gli è alleata.
La notevole altezza e la resistenza di volo sono sopratutto un
risultato dell'amor proprio. La volontà ferma, orgogliosa di
raggiungere la quota designata e di rimanere in aria per una durata
stabilita è indispensabile come la benzina al motore. Essa servirà a
neutralizzare gli effetti demoralizzanti del freddo, delle inquietudini
atmosferiche, del vuoto sempre più profondo e vasto, delle nubi e
della solitudine.
In altri ambienti amiamo vincere oltre che per noi stessi anche per il
prossimo, ma in aviazione si vince sopratutto per noi stessi. Un pilota
che dovesse cedere al vento, recherebbe con sè un incubo che
graverebbe nei suoi successivi cimenti. Perciò il volo è un efficace
mezzo per misurare, oltre le qualità tecniche, le risorse morali
dell'allievo. La cartina del barografo riproduce le peripezie
psicologiche dell'allievo. Quella linea che s'innalza sicura, regolare,
leggermente incurvata sino a una data quota — 1500 metri, 2000
metri — poi prosegue in una alternativa di tratti rettilinei, gobbe
concave e convesse e finalmente ridiscende con una rapida obliqua,
narra una serie di emozioni in contrasto: serena conquista della
quota di metri 2000, poi lotta col vento, incertezze del motore,
soggezione della solitudine, tentazione di scendere, reazione
dell'amor proprio e finalmente discesa definitiva.
★
Talvolta la sensibilità dell'allievo viene sottoposta a una prova
singolare durante una traversata di nubi, l'incontro con le quali
presenta varie caratteristiche e non sempre uguali. Può risultare
abbastanza placido se sono nubi bianche, i carri, ma spesso è
preceduto da un avvicinarsi scapigliato di folate vaporose, dal gelo,
dalla rarefazione dell'atmosfera, dall'incrociarsi volubile di raffiche.
Poi penetrato l'apparecchio in questo mondo latteo, invisibile,
misterioso, il motore diviene asmatico, il pilota perde il senso
dell'orientamento.
Splendido è il momento in cui si esce da questa prigionia: splendido
dal punto di vista tecnico ed estetico. Ci si accorge che l'apparecchio
era sbandato malamente, troppo sollevato; ristabilitolo nelle
condizioni normali si può ammirare a rapidi sguardi la nuovissima
visione: un mare di immobili onde candide, compatte, raggianti,
preceduto da lontani cirri solitari che fanno pensare alle avanguardie
di un esercito fantastico. Ma la sensazione del bello è quasi
paralizzata dal problema di tornare fra le nubi: problema che si
risolve con una discesa a forte velocità, preferibilmente dove s'apre
Welcome to our website – the ideal destination for book lovers and
knowledge seekers. With a mission to inspire endlessly, we offer a
vast collection of books, ranging from classic literary works to
specialized publications, self-development books, and children's
literature. Each book is a new journey of discovery, expanding
knowledge and enriching the soul of the reade
Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.
ebookultra.com