0% found this document useful (0 votes)
2 views

Data Analytics Models and Algorithms for Intelligent Data Analysis 1st Edition Thomas A. Runkler (Auth.) download

The document is a digital download link for the book 'Data Analytics Models and Algorithms for Intelligent Data Analysis' by Thomas A. Runkler, which covers essential models and algorithms for data analytics. It is intended for students and practitioners in engineering, computer science, and mathematics, providing practical insights into data analytics projects. The book includes various topics such as data preprocessing, visualization, and correlation, making it a comprehensive resource for understanding data analytics.

Uploaded by

sandilnukic67
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
2 views

Data Analytics Models and Algorithms for Intelligent Data Analysis 1st Edition Thomas A. Runkler (Auth.) download

The document is a digital download link for the book 'Data Analytics Models and Algorithms for Intelligent Data Analysis' by Thomas A. Runkler, which covers essential models and algorithms for data analytics. It is intended for students and practitioners in engineering, computer science, and mathematics, providing practical insights into data analytics projects. The book includes various topics such as data preprocessing, visualization, and correlation, making it a comprehensive resource for understanding data analytics.

Uploaded by

sandilnukic67
Copyright
© © All Rights Reserved
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 44

Data Analytics Models and Algorithms for

Intelligent Data Analysis 1st Edition Thomas A.


Runkler (Auth.) download

https://ebookultra.com/download/data-analytics-models-and-
algorithms-for-intelligent-data-analysis-1st-edition-thomas-a-
runkler-auth/

Explore and download more ebooks or textbooks


at ebookultra.com
We have selected some products that you may be interested in
Click the link to download now or visit ebookultra.com
for more options!.

Data Analytics with Hadoop An Introduction for Data


Scientists 1st Edition Benjamin Bengfort

https://ebookultra.com/download/data-analytics-with-hadoop-an-
introduction-for-data-scientists-1st-edition-benjamin-bengfort/

Hydrogeological Conceptual Site Models Data Analysis and


Visualization Neven Kresic

https://ebookultra.com/download/hydrogeological-conceptual-site-
models-data-analysis-and-visualization-neven-kresic/

Java Collections An Introduction to Abstract Data Types


Data Structures and Algorithms 1st Edition David A. Watt

https://ebookultra.com/download/java-collections-an-introduction-to-
abstract-data-types-data-structures-and-algorithms-1st-edition-david-
a-watt/

Big data analytics 2016th Edition Radha Shankarmani

https://ebookultra.com/download/big-data-analytics-2016th-edition-
radha-shankarmani/
Azure Storage Streaming and Batch Analytics A Guide for
Data Engineers 1st Edition Richard L. Nuckolls

https://ebookultra.com/download/azure-storage-streaming-and-batch-
analytics-a-guide-for-data-engineers-1st-edition-richard-l-nuckolls/

Fraud and Fraud Detection Website A Data Analytics


Approach 1st Edition Sunder Gee

https://ebookultra.com/download/fraud-and-fraud-detection-website-a-
data-analytics-approach-1st-edition-sunder-gee/

Latent Markov Models for Longitudinal Data 1st Edition


Francesco Bartolucci

https://ebookultra.com/download/latent-markov-models-for-longitudinal-
data-1st-edition-francesco-bartolucci/

Big Data Analytics Volume 33 1st Edition Venu Govindaraju

https://ebookultra.com/download/big-data-analytics-volume-33-1st-
edition-venu-govindaraju/

Growing Algorithms and Data Structures 4th Edition David


Scuse

https://ebookultra.com/download/growing-algorithms-and-data-
structures-4th-edition-david-scuse/
Data Analytics Models and Algorithms for Intelligent
Data Analysis 1st Edition Thomas A. Runkler (Auth.)
Digital Instant Download
Author(s): Thomas A. Runkler (auth.)
ISBN(s): 9783834825896, 3834825891
Edition: 1
File Details: PDF, 2.54 MB
Year: 2012
Language: english
Data Analytics
Thomas A. Runkler

Data Analytics

Models and Algorithms


for Intelligent Data Analysis
Prof. Dr. Thomas A. Runkler
Siemens AG, München und Technische Universität München
Germany

ISBN 978-3-8348-2588-9 ISBN 978-3-8348-2589-6 (eBook)


DOI 10.1007/978-3-8348-2589-6

Library of Congress Control Number: 2012912256

Vieweg+Teubner
© Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden 2012

This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of
the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation,
broadcasting, reproduction on microfilms or in any other physical way, and transmission or information
storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology
now known or hereafter developed. Exempted from this legal reservation are brief excerpts in connection
with reviews or scholarly analysis or material supplied specifically for the purpose of being entered and exe-
cuted on a computer system, for exclusive use by the purchaser of the work. Duplication of this publication
or parts thereof is permitted only under the provisions of the Copyright Law of the Publisher s location,
in its current version, and permission for use must always be obtained from Springer. Permissions for use
may be obtained through RightsLink at the Copyright Clearance Center. Violations are liable to prosecution
under the respective Copyright Law.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
While the advice and information in this book are believed to be true and accurate at the date of publication,
neither the authors nor the editors nor the publisher can accept any legal responsibility for any errors or
omissions that may be made. The publisher makes no warranty, express or implied, with respect to the
material contained herein.

Printed on acid-free paper

Springer Vieweg is part of Springer Science+Business Media (www.springer-vieweg.de)


Preface

The information in the world doubles every 20 months. Important data sources are
business and industrial processes, text and structured data bases, image and biomed-
ical data. Many applications show that data analytics can provide huge benefits. We
need models and algorithms to collect, preprocess, analyze, and evaluate data, from
various fields such as statistics, system theory, machine learning, pattern recogni-
tion, or computational intelligence. With this book you will learn about the most
important methods and algorithms for data analytics. You will be able to choose
appropriate methods for specific tasks and apply these in your own data analytics
projects. You will understand the basic concepts of the growing field of data analyt-
ics, which will allow you to keep pace and to actively contribute to the advancement
of the field.
This text is designed for undergraduate and graduate courses on data analytics
for engineering, computer science, and math students. It is also suitable for prac-
titioners working on data analytics projects. The book is structured according to
typical practical data analytics projects. Only basic mathematics is required. This is
the third edition of a book that has been used for more than ten years in numerous
courses at the Technical University of Munich, Germany, in short courses at several
other universities, and in tutorials at international scientific conferences. Much of
the content is based on the results of industrial research and development projects
at Siemens.
The author wishes to express his sincere appreciation to everybody who has sup-
ported this work, in particular Wilfried Brauer, Jim Bezdek, Javier Esparza, Ralph
Grothmann, Hans Hellendoorn, Jürgen Hollatz, Eyke Hüllermeyer, Uzay Kaymak,
Jim Keller, Frank Klawonn, Rudolf Kruse, Rainer Palm, Bernd Schürmann, João
Sousa, and Hans-Georg Zimmermann, the reviewers and students for pointing out
errors and suggesting improvements, and the editorial and publisher team for their
professional collaboration.

Munich, August 2012 Thomas Runkler

v
Contents

1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 It’s All About Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Data Analytics, Data Mining, and Knowledge Discovery . . . . . . . . . . 2
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Data and Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5


2.1 The Iris Data Set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Data Scales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Set and Matrix Representations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4 Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5 Dissimilarity Measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.6 Similarity Measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.7 Sequence Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.8 Sampling and Quantization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1 Error Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Error Handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Filtering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4 Data Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.5 Data Merging . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4 Data Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.1 Diagrams . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Principal Component Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.3 Multidimensional Scaling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Sammon Mapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

vii
viii Contents

4.5 Auto-Associator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.6 Histograms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7 Spectral Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5 Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.1 Linear Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Correlation and Causality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.3 Chi-Square Test for Independence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.1 Linear Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2 Linear Regression with Nonlinear Substitution . . . . . . . . . . . . . . . . . . 67
6.3 Robust Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.4 Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5 Radial Basis Function Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.6 Cross-Validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.7 Feature Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

7 Forecasting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.1 Finite State Machines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.2 Recurrent Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7.3 Autoregressive Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

8 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.1 Classification Criteria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
8.2 Naive Bayes Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
8.3 Linear Discriminant Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.5 Nearest Neighbor Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
8.6 Learning Vector Quantization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
8.7 Decision Trees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Contents ix

9 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.1 Cluster Partitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.2 Sequential Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
9.3 Prototype-Based Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
9.4 Fuzzy Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
9.5 Relational Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
9.6 Cluster Tendency Assessment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
9.7 Cluster Validity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
9.8 Self-Organizing Map . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Problems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

A Brief Review of Some Optimization Methods . . . . . . . . . . . . . . . . . . . . . . 123


A.1 Optimization with Derivatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
A.2 Gradient Descent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
A.3 Lagrange Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

Solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

List of Symbols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Chapter 1
Introduction

Abstract This book deals with models and algorithms for the analysis of data sets,
for example industrial process data, business data, text and structured data, im-
age data, and biomedical data. We define the terms data analytics, data mining,
knowledge discovery, and the KDD and CRISP-DM processes. Typical data analy-
sis projects can be divided into several phases: preparation, preprocessing, analysis,
and postprocessing. The chapters of this book are structured according to the main
methods of data preprocessing and data analysis: data and relations, data preprocess-
ing, visualization, correlation, regression, forecasting, classification, and clustering.

1.1 It’s All About Data

The focus of this book is the analysis of large data sets, for example:
• Industrial process data: An increasing amount of data is acquired, stored and
processed in order to automate and control industrial production, manufacturing,
distribution, logistics and supply chain processes. Data are used on all levels of
the automation pyramid: sensors and actuators at the field level, control signals at
the control level, operation and monitoring data at the execution level, schedules
and indicators at the planning level. The main purpose of data analysis in industry
is to optimize processes and to improve the competitive position of the company.
• Business data: Data of business performance are analyzed to better understand
and drive business processes. Important business domains to be analyzed include
customers, portfolio, sales, marketing, pricing, financials, risk, and fraud. An ex-
ample is shopping basket analysis that finds out which products customers pur-
chase at the same time. This analysis aims to improve cross selling and thus
increases sales. Another example for business data analysis is customer segmen-
tation for tailored advertising and sales promotions.
• Text and structured data: The analysis of numerical data has been the focus of
mathematical statistics for centuries. Today, text and structured data also serve

T. A. Runkler, Data Analytics, DOI 10.1007/978-3-8348-2589-6_1, 1


© Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden 2012
2 1 Introduction

as important information sources: text documents, electronic messages (like e-


mail), web documents, or web based data bases (the so-called deep web). The
analysis of text and structured data helps to filter, search, extract, and structure
information. Structured data (as opposed to unstructured text) uses particular or-
ganizational criteria such as record fields or object structures which are often
enhanced by semantic and ontological models.
• Image data: An increasing number of image sensors ranging from smartphone
cameras to satellite cameras provides large amounts of 2D and also 3D image
data. Image data analysis finds and recognizes objects, analyzes and classifies
scenes, and relates image data with other information sources.
• Biomedical data: Data from laboratory experiments are used to analyze, under-
stand and exploit biological and medical processes, for example to analyze DNA
sequences, to understand and annotate genome functions, to analyze gene and
protein expressions or to model regulation networks.

1.2 Data Analytics, Data Mining, and Knowledge Discovery

The term data mining dates back to the 1980s [3]. The goal of data mining is to
extract knowledge from data [1]. In this context, knowledge is defined as interest-
ing patterns that are generally valid, novel, useful, and understandable to humans.
Whether or not the extracted patterns are interesting depends on the particular appli-
cation and needs to be verified by application experts. Based on expert feedback the
knowledge extraction process is often interactively refined. The term data analytics
became popular in the early 2000s [2, 6]. Data analytics is defined as the application
of computer systems to the analysis of large data sets for the support of decisions.
Data analytics is a very interdisciplinary field that has adopted aspects from many
other scientific disciplines such as statistics, signal theory, pattern recognition, com-
putational intelligence, machine learning, and operations research.
Typical data analysis projects can be divided into several phases. Data are as-
sessed and selected, cleaned and filtered, visualized and analyzed, and the analysis
results are finally interpreted and evaluated. The knowledge discovery in databases
(KDD) process [1] comprises the six phases selection, preprocessing, transforma-
tion, data mining, interpretation, and evaluation. The cross industry standard pro-
cess for data mining (CRISP-DM) [5] comprises the six phases business under-
standing, data understanding, data preparation, modeling, evaluation, and deploy-
ment. For simplicity we distinguish only four phases here: preparation, preprocess-
ing, analysis, and postprocessing (Fig. 1.1). The main focus of this book is data
preprocessing and data analysis. The chapters are structured according to the main
methods of preprocessing and analysis: data and relations, data preprocessing, visu-
alization, correlation, regression, forecasting, classification, and clustering.
This book gives a clear and concise overview of the most important methods and
algorithms of data analysis. It enables the reader to gain a complete and compre-
References 3

preparation preprocessing analysis postprocessing

planning cleaning visualization interpretation


data collection filtering correlation documentation
feature generation completion regression evaluation
data selection correction forecasting
standardization classification
transformation clustering

Fig. 1.1 Phases of data analysis projects.

hensive understanding of data analysis, to apply data analysis methods to his or her
own projects, and to contribute to the progress of the field.
A large number a software tools for data mining are available today. Popular
commercial software tools include MATLAB, SPSS, SAS, and STATISTICA. Pop-
ular free and open-source software tools include R, Rapid Miner, and WEKA. This
book does not present, compare, or recommend any data mining software tools. For
a comprehensive overview of current data mining software tools please refer to [4].

References

1. U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy. Advances in Knowledge


Discovery and Data Mining. AAAI Press, Menlo Park, 1996.
2. R. Kohavi, N. J. Rothleder, and E. Simoudis. Emerging trends in business analytics. Commu-
nications of the ACM, 45(8):345–48, 2002.
3. M. C. Lovell. Data mining. Review of Economics and Statistics, 65(1):1–11, 1983.
4. R. Mikut and M. Reischl. Data mining tools. Wiley Interdisciplinary Reviews: Data Mining
and Knowledge Discovery, 1(5):431–443, 2011.
5. C. Shearer. The CRISP-DM model: The new blueprint for data mining. J Data Warehousing,
5(4):13–22, 2000.
6. S. Tyagi. Using data analytics for greater profits. Journal of Business Strategy, 24(3):12–14,
2003.
Chapter 2
Data and Relations

Abstract The popular Iris benchmark set is used to introduce the basic concepts
of data analysis. Data scales (nominal, ordinal, interval, ratio) must be accounted
for because certain mathematical operations are only appropriate for specific scales.
Numerical data can be represented by sets, vectors, or matrices. Data analysis is of-
ten based on dissimilarity measures (like inner product norms, Lebesgue/Minkowski
norms) or on similarity measures (like cosine, overlap, Dice, Jaccard, Tanimoto).
Sequences can be analyzed using sequence relations (like Hamming, Levenshtein,
edit distance). Data can be extracted from continuous signals by sampling and quan-
tization. The Nyquist condition allows sampling without loss of information.

2.1 The Iris Data Set

To introduce the basic concepts of data analysis we consider one of the most popular
historic benchmark data sets: the Iris data set [1]. The Iris data set was originally
created in 1935 by the American botanist Edgar Anderson who examined the ge-
ographic distribution of Iris flowers on the Gaspé peninsula in Quebec (Canada).
In 1936, Sir Ronald Aylmer Fisher used Anderson’s Iris data set as an example for
multivariate discriminant analysis [4] (see chapter 8). Subsequently, the Iris data
set became one of the most frequently used reference data set in statistics and data
analysis.
The Iris data set comprises measurements from 150 Iris flower samples: 50 from
each of the three species Iris Setosa, Iris Virginica, and Iris Versicolor. For each
of the 150 flowers, values of four numerical features chosen by Anderson were
measured: the length and the width of sepal and petal leaves in centimeters. For
illustration, Table 2.1 shows the complete Iris data set. Notice that several distinct
replicates of the original Iris data set have been used and published, so in experi-
ments with this data set the version should be carefully checked [2]. The Iris data
set as well as many other popular data sets are available, for example, through the
machine learning data base at the University of California at Irvine (UCI).

T. A. Runkler, Data Analytics, DOI 10.1007/978-3-8348-2589-6_2, 5


© Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden 2012
6 2 Data and Relations

Table 2.1 The Iris data set (from [1])


Setosa Versicolor Virginica
sepal petal sepal petal sepal petal
length width length width length width length width length width length width
5.1 3.5 1.4 0.2 7 3.2 4.7 1.4 6.3 3.3 6 2.5
4.9 3 1.4 0.2 6.4 3.2 4.5 1.5 5.8 2.7 5.1 1.9
4.7 3.2 1.3 0.2 6.9 3.1 4.9 1.5 7.1 3 5.9 2.1
4.6 3.1 1.5 0.2 5.5 2.3 4 1.3 6.3 2.9 5.6 1.8
5 3.6 1.4 0.2 6.5 2.8 4.6 1.5 6.5 3 5.8 2.2
5.4 3.9 1.7 0.4 5.7 2.8 4.5 1.3 7.6 3 6.6 2.1
4.6 3.4 1.4 0.3 6.3 3.3 4.7 1.6 4.9 2.5 4.5 1.7
5 3.4 1.5 0.2 4.9 2.4 3.3 1 7.3 2.9 6.3 1.8
4.4 2.9 1.4 0.2 6.6 2.9 4.6 1.3 6.7 2.5 5.8 1.8
4.9 3.1 1.5 0.1 5.2 2.7 3.9 1.4 7.2 3.6 6.1 2.5
5.4 3.7 1.5 0.2 5 2 3.5 1 6.5 3.2 5.1 2
4.8 3.4 1.6 0.2 5.9 3 4.2 1.5 6.4 2.7 5.3 1.9
4.8 3 1.4 0.1 6 2.2 4 1 6.8 3 5.5 2.1
4.3 3 1.1 0.1 6.1 2.9 4.7 1.4 5.7 2.5 5 2
5.8 4 1.2 0.2 5.6 2.9 3.6 1.3 5.8 2.8 5.1 2.4
5.7 4.4 1.5 0.4 6.7 3.1 4.4 1.4 6.4 3.2 5.3 2.3
5.4 3.9 1.3 0.4 5.6 3 4.5 1.5 6.5 3 5.5 1.8
5.1 3.5 1.4 0.3 5.8 2.7 4.1 1 7.7 3.8 6.7 2.2
5.7 3.8 1.7 0.3 6.2 2.2 4.5 1.5 7.7 2.6 6.9 2.3
5.1 3.8 1.5 0.3 5.6 2.5 3.9 1.1 6 2.2 5 1.5
5.4 3.4 1.7 0.2 5.9 3.2 4.8 1.8 6.9 3.2 5.7 2.3
5.1 3.7 1.5 0.4 6.1 2.8 4 1.3 5.6 2.8 4.9 2
4.6 3.6 1 0.2 6.3 2.5 4.9 1.5 7.7 2.8 6.7 2
5.1 3.3 1.7 0.5 6.1 2.8 4.7 1.2 6.3 2.7 4.9 1.8
4.8 3.4 1.9 0.2 6.4 2.9 4.3 1.3 6.7 3.3 5.7 2.1
5 3 1.6 0.2 6.6 3 4.4 1.4 7.2 3.2 6 1.8
5 3.4 1.6 0.4 6.8 2.8 4.8 1.4 6.2 2.8 4.8 1.8
5.2 3.5 1.5 0.2 6.7 3 5 1.7 6.1 3 4.9 1.8
5.2 3.4 1.4 0.2 6 2.9 4.5 1.5 6.4 2.8 5.6 2.1
4.7 3.2 1.6 0.2 5.7 2.6 3.5 1 7.2 3 5.8 1.6
4.8 3.1 1.6 0.2 5.5 2.4 3.8 1.1 7.4 2.8 6.1 1.9
5.4 3.4 1.5 0.4 5.5 2.4 3.7 1 7.9 3.8 6.4 2
5.2 4.1 1.5 0.1 5.8 2.7 3.9 1.2 6.4 2.8 5.6 2.2
5.5 4.2 1.4 0.2 6 2.7 5.1 1.6 6.3 2.8 5.1 1.5
4.9 3.1 1.5 0.2 5.4 3 4.5 1.5 6.1 2.6 5.6 1.4
5 3.2 1.2 0.2 6 3.4 4.5 1.6 7.7 3 6.1 2.3
5.5 3.5 1.3 0.2 6.7 3.1 4.7 1.5 6.3 3.4 5.6 2.4
4.9 3.6 1.4 0.1 6.3 2.3 4.4 1.3 6.4 3.1 5.5 1.8
4.4 3 1.3 0.2 5.6 3 4.1 1.3 6 3 4.8 1.8
5.1 3.4 1.5 0.2 5.5 2.5 4 1.3 6.9 3.1 5.4 2.1
5 3.5 1.3 0.3 5.5 2.6 4.4 1.2 6.7 3.1 5.6 2.4
4.5 2.3 1.3 0.3 6.1 3 4.6 1.4 6.9 3.1 5.1 2.3
4.4 3.2 1.3 0.2 5.8 2.6 4 1.2 5.8 2.7 5.1 1.9
5 3.5 1.6 0.6 5 2.3 3.3 1 6.8 3.2 5.9 2.3
5.1 3.8 1.9 0.4 5.6 2.7 4.2 1.3 6.7 3.3 5.7 2.5
4.8 3 1.4 0.3 5.7 3 4.2 1.2 6.7 3 5.2 2.3
5.1 3.8 1.6 0.2 5.7 2.9 4.2 1.3 6.3 2.5 5 1.9
4.6 3.2 1.4 0.2 6.2 2.9 4.3 1.3 6.5 3 5.2 2
5.3 3.7 1.5 0.2 5.1 2.5 3 1.1 6.2 3.4 5.4 2.3
5 3.3 1.4 0.2 5.7 2.8 4.1 1.3 5.9 3 5.1 1.8
2.2 Data Scales 7

Table 2.2 Scales for numerical measurements.


scale operations example statistics
nominal = = Alice, Bob, Carol mode
ordinal > < A, B, C, D, F median
interval + − 2015 A.D., 20◦C mean
ratio · / 21 years, 273◦ K generalized mean

In data analysis we call each of the 150 Iris flowers an object, each of the three
species a class, and each of the four dimensions a feature. Here is a list of typical
questions that we try to answer by data analysis:
• Which of the data might contain errors or false class assignments?
• What is the error caused by rounding the data off to one decimal place?
• What is the correlation between petal length and petal width?
• Which pair of dimensions is correlated most?
• None of the flowers in the data set has a sepal width of 1.8 centimeters. Which
sepal length would we expect for a flower that did have 1.8 cm as its sepal width?
• Which species would an Iris with a sepal width of 1.8 centimeters belong to?
• Do the three species contain sub-species that can be identified from the data?
In this book you will find numerous methods and algorithms to answer these and
other data analysis questions. For a better understanding of these data analysis meth-
ods and algorithms we first define and examine the fundamental properties of data
and their relations.

2.2 Data Scales

Numerical measurements may have different semantic meanings, even if they are
represented by the same numerical data. Depending on the semantic meaning dif-
ferent types of mathematical operations are appropriate. For the semantic meaning
of numerical measurement Stevens [7] suggested the four different scales that are
shown in Table 2.2. For nominal scaled data (first row) only tests for equality or in-
equality are valid. Examples for nominal features are names of persons or codes of
objects. Data of a nominal feature can be represented by the mode which is defined
as the value that occurs most frequently. For ordinal scaled data (second row) the
operations ”greater than” and ”less than” are valid. For each scale level the opera-
tions and statistics of the lower scale levels are also valid, so for the ordinal scale
we have equality, inequality, and the combinations ”greater than or equal” (≥) and
”less than or equal” (≤). The relation ”less than or equal” (≤) defines a total or-
der, such that for any x, y, z we have (x ≤ y) ∧ (y ≤ x) ⇒ (x = y) (antisymmetry),
(x ≤ y) ∧ (y ≤ z) ⇒ (x ≤ z) (transitivity), and (x ≤ y) ∨ (y ≤ x) (totality). Examples
for ordinal features are school grades. Data of an ordinal feature can be represented
by the median which is defined as the value for which (almost) as many smaller as
8 2 Data and Relations

Table 2.3 Computation of the median petal width of the Iris data set.
value frequency accumulated frequency value frequency accumulated frequency
0.1 5 5 2.5 3 3
0.2 29 34 2.4 3 6
0.3 7 41 2.3 8 14
0.4 7 48 2.2 3 17
0.5 1 49 2.1 6 23
0.6 1 50 2 6 29
0.7 0 50 1.9 5 34
0.8 0 50 1.8 12 46
0.9 0 50 1.7 2 48
1 7 57 1.6 4 52
1.1 3 60 1.5 12 64
1.2 5 65 1.4 8 72
1.3 10(13) 75 1.3 3(13) 75

larger values exist. The mean is not valid for ordinal features, so for example it does
not make sense to say that the average school grade is C. For interval scaled data
(third row) addition and subtraction are valid. Interval scaled features have arbitrary
zero points. Examples are years in the Anno Domini dating system or temperatures
in degrees Celcius (centigrade) or Fahrenheit, so for example it does not make sense
to say that 40◦C is twice as high as 20◦C. Data of an interval scaled feature, for
example, a set of values X = {x1 , . . . , xn }, can be represented by the (arithmetic)
mean
1 n
x̄ = ∑ xk (2.1)
n k=1
For ratio scaled data (fourth row) multiplication and division are valid. Examples
for ratio scaled features are time differences like ages or temperatures on the Kelvin
scale. Data of an interval scaled feature can be represented by the generalized mean

1 n
mα (X) = α ∑ xαk (2.2)
n k=1

with the parameter α ∈ R, which includes the special cases minimum (α → −∞),
harmonic mean (α = −1), geometric mean (α → 0), arithmetic mean (α = 1),
quadratic mean (α = 2), and maximum (α → ∞).
The features of the Iris data set are on ratio scale. For example, we can approxi-
mately estimate the sepal surface area by multiplying the sepal length and the sepal
width. Hence, we can compute the mode, median, mean and generalized mean of
each of the features of the Iris data set. Table 2.3 illustrates this for the petal width
(fourth feature). The Iris data set contains petal widths between 0.1 and 2.5 centime-
ters. The most frequent value of the petal width is 0.2 centimeters, which occurs 29
times, so the mode is 0.2 centimeters. To compute the median we can accumulate
the numbers of occurences of the values for 0.1 centimeters, 0.2 centimeters, and so
on, until we reach half of the number of objects (75). This algorithm yields a me-
2.3 Set and Matrix Representations 9

dian petal width of 1.3 centimeters. The accumulation of the frequencies can also be
done in reverse order (right view of Table 2.3). The complexity of this algorithm is
O(n log n). Notice, however, and this is surprising even to many scientists, that the
median can be efficiently computed in linear time using selection algorithms [3].
Finally, the mean petal width can be computed as about x̄(4) ≈ 1.19933.
The majority of methods presented in this book use addition, subtraction, multi-
plication, or division of feature values and are therefore suitable only for interval and
ratio scaled data. To analyze nominal and ordinal data we define relations between
pairs of such data, that can be analyzed using specific relational methods.

2.3 Set and Matrix Representations

We denote numerical feature data as the set

X = {x1 , . . . , xn } ⊂ R p (2.3)

with n elements, where each element is a p-dimensional real-valued feature vector,


where n and p are positive integers. For p = 1 we call X a scalar data set. As an
alternative to the set representation, numerical feature data are also often represented
as a matrix ⎛ ⎞
(1) (p)
x1 · · · x1
⎜ . . . ⎟
X =⎜ ⎝ .. . . .. ⎠
⎟ (2.4)
(1) (p)
xn · · · xn
so the vectors x1 , . . . , xn are row vectors. Although it is a bit sloppy, data sets and data
matrices are commonly used as equivalent data representations. Fig. 2.1 illustrates
the common terms and notations of a data matrix. Each row of the data matrix
corresponds to an element of the data set. It is called feature vector or data point
xk , k = 1, . . . , n. Each column of the data matrix corresponds to one component of
all elements of the data set. It is called ith feature or ith component x(i) , i = 1, . . . , p.
In this book we distinguish rows and columns by using subscripts for rows and
bracketed superscripts for columns. Alternative notations in the literature are x(k, .)
and x(., i), for example. A single matrix element is a component of an element of
(i)
the data set. It is called datum or value xk , k = 1, . . . , n, i = 1, . . . , p.
The Iris data set can be written as a data matrix with 150 rows and 4 columns,
where each row represents one object (flower) and each column represents one fea-
ture (dimension). The Iris data matrix can be obtained by vertical concatenation of
the three portions shown in Table 2.1. The class information (Setosa, Versicolor,
Virginica) can be interpreted as a fifth feature, on nominal scale.
Random documents with unrelated
content Scribd suggests to you:
The Project Gutenberg eBook of Voli di guerra:
Impressioni di un giornalista pilota
This ebook is for the use of anyone anywhere in the United States
and most other parts of the world at no cost and with almost no
restrictions whatsoever. You may copy it, give it away or re-use it
under the terms of the Project Gutenberg License included with this
ebook or online at www.gutenberg.org. If you are not located in the
United States, you will have to check the laws of the country where
you are located before using this eBook.

Title: Voli di guerra: Impressioni di un giornalista pilota

Author: Otello Cavara

Release date: September 25, 2018 [eBook #57977]

Language: Italian

Credits: Produced by Barbara Magni and the Online Distributed


Proofreading Team at http://www.pgdp.net (This file was
produced from images made available by The Internet
Archive)

*** START OF THE PROJECT GUTENBERG EBOOK VOLI DI GUERRA:


IMPRESSIONI DI UN GIORNALISTA PILOTA ***
VOLI DI GUERRA.
Queste impressioni recate dalle alte quote
dell'atmosfera e dello spirito, io dedico a Nello Cavara,
fratello mio ventunenne, che a maggiore e perenne
altezza giunse, morendo in combattimento sulle Alpi.
OTELLO CAVARA

VOLI DI GUERRA
IMPRESSIONI DI UN GIORNALISTA PILOTA

MILANO
Fratelli Treves, Editori
1918.
PROPRIETÀ LETTERARIA.
I diritti di riproduzione e di traduzione sono riservati
per tutti i paesi, compresi la Svezia, la Norvegia e
l'Olanda.
Milano — Tip. Treves.
INDICE
Dal giornalismo all'aviazione.

Anche quando il giornalista vola da solo, le personalità a bordo del


suo apparecchio sono due: il pilota e l'osservatore; l'uno agisce e
l'altro nota. Se il fenomeno non gravita sulla portanza
dell'apparecchio, raddoppia però il lavoro del singolare aviatore il
quale, oltre provvedere alla manovra, all'orientamento, all'azione
bellica, avverte i moti psicologici dai quali sgorga tale operosità,
raccoglie con una preoccupazione di esattezza impressioni
panoramiche, e procura di vivere nella sua totalità missioni anche se
estese ad aeroplani, navi, truppe. Le abitudini acquisite in numerosi
anni di vita giornalistica — immediata ricerca nell'attualità di cause e
studio di effetti — lo accompagnano pure in volo, mentre in terra si
esplicano in implacabili interviste ch'egli infligge ai più esperti perchè
la scienza acquisita in terra lo aiuti ad eliminare sorprese in cielo.
Si riesce aviatori, gli eroi per esperimentare primi le macchine di volo
divinate dal loro genio; gli studiosi di meccanica e di aeronautica per
amore di motori e di apparecchi; gli appassionati dello sport per il
gusto di maggiori cimenti; i guerrieri per la voluttà delle battaglie
individuali; i giornalisti per conoscere il meglio, il nuovo della vita e
partecipare alla buona guerra nostra tra bagliori inauditi di bellezza e
costumi superstiti di cavalleria.
Un pubblicista non giunge generalmente impreparato al pilotaggio di
aeroplani. L'autore di queste note fu, come redattore del Corriere
della Sera, in alta montagna a famigliarizzarsi con l'orrore del vuoto,
con le vertigini, con le temperature rigide e con l'ostinazione fisica;
fu in aerostato a proclamare dalla quota di 4500 metri la decadenza
delle proporzioni geografiche e il miglioramento dell'umanità ridotta
a puntini; fu in dirigibile per la gioia di andare, almeno in aria, dove
gli pareva; fu in aeroplano a constatare in sè una embrionale
vocazione di pilota perchè negli sbandamenti si spostava con la
persona per ristabilire l'equilibrio, nelle spirali storceva persino la
bocca in fuori per non scivolare in dentro e raccomandava in silenzio,
durante i viraggi, «attenti nelle voltate». Con tali precedenti si può
quasi asserire che il giornalismo, stazione di transito per le più
brillanti carriere, lo è pure per l'aviazione.
Esistono varie egregie letterature d'aviazione; tra queste una minima
di coloro che volano e una massima di coloro che non volano. Alla
prima appartengono frasi estremamente laconiche: «Nessuna
impressione. — Tutto bene. — Nulla di straordinario». La seconda è
un inno: «Sorprendenti acrobazie. — Esseri d'eccezione — ....»
Tra l'una e l'altra s'insinuano queste note di un giornalista-pilota il
quale fra l'altro confesserà d'avere sofferto, tra sensazioni epiche e
leggiadre, gravi apprensioni durante certi impicci nei quali procedeva
avanti perchè era rassegnato e deciso a non tornare più indietro. Ma
la sensazione che maggiormente lo sorprendeva all'insperato ritorno
era il desiderio cocente di riprovare l'avventura. Durante il volo
drammatico aveva temuto di scendere psicologicamente diminuito, e
a terra si scopriva aumentato.
Di qui il dovere del giornalista, proveniente da una professione che è
già scuola del carattere, di rendere omaggio, con questi appunti
sinceri, a un'altra eccellente scuola del carattere: l'aviazione di
guerra.
Come si diventa piloti.

Forse l'allievo pilota vive il momento più emozionante quando


presenta la domanda per essere ammesso a una scuola d'aviazione.
Egli non reca in sè che un elemento certo: la decisa volontà di
riuscire. Ma l'attitudine a volare è per lui un'incognita la quale lo
pone fra l'avidità di provarsi e il dubbio di fallire nel tentativo.
La guerra ha creato un tipo speciale di volontario dell'aviazione: il
pacifico borghese del tempo beato in cui non si credeva alla
conflagrazione mondiale, pacifico borghese che dovendo in
occasione della guerra assumersi la sua parte di azione e di pericolo,
e avendo una predilezione per gli atti che derivano direttamente
dalla responsabilità individuale, sceglie l'aviazione conscio di rendere
un servizio militare non meno prezioso e periglioso d'ogni altro, e
conscio di valorizzare al massimo grado le proprie attitudini morali e
fisiche in un'arma di straordinaria bellezza.
Ed è per ciò che oggi l'aviazione militare aduna rappresentanti d'ogni
ambiente, d'ogni cultura e d'ogni mentalità. Diversi per il loro
passato, gli allievi si identificano nell'esuberanza delle loro energie,
nella dedizione completa ai cimenti aviatorii, nella fraternità che
deriva dal comune mistero della loro sorte. Essi più o meno passano
traverso le medesime fasi psicologiche: trepidazioni e speranze della
vigilia; incosciente disinvoltura durante i primi voli; poi una
successione crescente di depressioni e di rivincite al contatto di
difficoltà sempre più intense.
L'allievo giungendo alla scuola è curioso d'ogni particolare. I
motoscafi e gli autocarri che recano gl'istruttori e gli scolari,
sembrano colmi di gitanti spensierati: e in realtà costoro si accingono
ad effettuare i quotidiani voli con la medesima disinvoltura con cui
s'intraprende una passeggiata. La scuola aspetta con i capannoni
spalancati innanzi all'ampio specchio d'acqua su cui dovranno
svolgersi i voli. Gli idrovolanti sono allineati lungo la riva, ciascuno
sulla propria pista di legno che dal capannone scende nell'acqua.
Maestri e allievi vanno a fare toilette. Ognuno ha i propri indumenti
di volo. Chi indossa lo scafandro o la pelliccia, chi un maglione, chi
s'avvolge il collo d'una sciarpa, chi s'applica un passamontagna, chi il
casco. Tutti fanno uso di occhiali e guanti. La trasformazione è
sensibile. Le fisionomie scompaiono sotto le maschere e le lenti.
Eleganti ufficiali assumono aspetti strani, apparenze grottesche di
palombari, di clowns, le loro linee svelte si ricoprono — specialmente
dopo l'applicazione del salvagente — di gonfie gibbosità.
Ad ogni apparecchio corrisponde un istruttore ed una sezione di
allievi. Il primo allievo cui spetta di volare — si segue un turno a
rotazione — s'ingolfa nella complicazione di fili dell'idrovolante e
scende nello scafo, sedendo a destra dell'istruttore dopo aver messo
in movimento il motore con giri di manovella. L'apparecchio si stacca
dalla riva e l'allievo, afferrato il suo volante e occupati i pedali, si
accinge a manovrare. Il maestro ha pure il suo volante e controlla la
manovra del suo vicino intervenendo con cenni della mano o con
dirette correzioni ogni qualvolta lo scolaro tarda, precipita o
confonde i suoi movimenti. Gli idrovolanti partono ad uno ad uno
striando lo specchio di spuma, oscillando per sollevare i galleggianti
e la coda, poi raggiunta la velocità voluta, saltellano e spiccano il
volo. Al ritorno, l'istruttore spiega gli errori commessi dal discepolo e
questi li attenua affermando che sono passeggeri e promettendone
solennemente la sparizione per il volo successivo. Anche gli altri
allievi della sezione presenziano al colloquio per immagazzinare
esperienza a spese degli errori altrui.
Il nuovo arrivato osserva i colleghi più progrediti come esseri dotati
di misteriose facoltà del cui segreto si vuole impossessare.
Timidamente egli procede alla personale conoscenza
dell'apparecchio introducendosi nello scafo: con circospezione afferra
il volante, lo rigira, lo attrae a sè, lo respinge volgendosi a osservare
alle estremità delle ali e della coda i movimenti degli aleroni e del
timone di profondità. Si stupisce che i colleghi i quali lo hanno
preceduto, spieghino la manovra come una funzione semplice. Poi
rimane interdetto udendo il linguaggio d'aviazione fiorito di
francesismi. Decollare: manovra per condurre l'apparecchio a
staccarsi dallo specchio d'acqua; virare: mutamento di direzione
durante il volo; picchiare: abbassare l'apparecchio pure durante il
volo; ammarare: far riprendere all'apparecchio il contatto con
l'acqua.
Intanto il novizio sente parlare con rispettosa preoccupazione della
manovella, il fatale istrumento che serve a mettere in funzione il
motore e ad imporre soggezione al novizio: — Attenti ai contraccolpi
— lo avvertono gravemente i colleghi che all'esordio conobbero il
medesimo patema. — Bada che già vari si sono fratturati il braccio....
— Comincia così la mobilitazione dell'amor proprio: il neofita
s'attacca all'insidiosa manovella, non riesce, ritenta e finalmente
consegue la sua prima vittoria, girando la nemica con esuberanza
trionfale.


Più è prossimo il momento di volare per la prima volta e tanto
maggiormente la sensibilità dell'allievo si paralizza. Pochi istanti
prima di salire sull'apparecchio, il novizio, non avvertendo più alcuna
emozione, confonde questo stato d'animo con la tranquillità:
viceversa è l'effetto di una tensione nervosa, la quale si trasforma in
un fenomeno di serena voluttà non appena l'apparecchio si è librato.
L'esordiente ha l'illusione che non sia l'apparecchio a sollevarsi, ma il
panorama ad abbassarsi, a roteargli lentamente intorno. Una
improvvisa, assoluta fiducia lo sorregge: una fiducia ispirata dalla
stabilità dell'apparecchio che in volo si rivela solido, imperioso,
sonoro e perde l'aspetto fragile osservato da terra. La velocità non è
percettibile; pare che l'idrovolante si regga su un solido pernio
invisibile. Il vuoto non esiste che per lo sguardo: l'atmosfera si
manifesta anche al neofita un elemento consistente, soffice ma
tenace, in cui l'apparecchio morde e si regge vittorioso. Ma quando
l'idrovolante s'inclina per iniziare la discesa, il novizio si turba. Un
rimescolìo passeggero agli intestini, somigliante a quello che dà
l'altalena, lo coglie all'improvviso. Il silenzio che segue al fragore del
motore — perchè il motore viene fermato o ridotto a una velocità
minima — determina una forma d'ansietà. La visione panoramica,
che prima era preclusa in parte notevole al neofita dalla punta dello
scafo protesa in alto, ora che lo scafo è inclinato, appare in tutta la
sua vastità, come osservata da un altissimo balcone, e rivela la
quota raggiunta. Si mostra come un'immensa carta geografica a
rilievo. Lo specchio d'acqua appare come una enorme lastra
metallica bruna e s'avvicina con crescente velocità. Quando mancano
pochi metri da esso e l'apparecchio si dispone a posarvisi, si rivela
fulminea la rapidità dell'apparecchio stesso: lo specchio gli sfugge di
sotto vertiginosamente e il neofita trattiene il respiro in cospetto di
questo imprevisto epilogo. Un lieve fruscìo, un impercettibile colpetto
sotto lo scafo: l'apparecchio ha preso contatto con l'acqua, solleva
intorno biancori di spuma e s'arresta rapidamente.
L'allievo confonde l'ammirazione per il volo con la gioia di averlo
condotto a termine: certo è raggiante. Difficilmente le sue
impressioni sono da lui espresse in modo genuino, perchè non ha
saputo analizzare sè stesso o perchè ritiene obbligatorio ricorrere a
una di queste due opposte frasi: «Nessuna impressione» oppure
«Impressione straordinaria» accompagnate da un prolungato sorriso
ufficiale finchè egli si vede scrutato dai colleghi. Effetti fisici generali:
ronzìo alle orecchie paragonabile all'uniforme canto dei grilli,
appetito accentuato e richiesta da parte dei colleghi di una
bicchierata per festeggiare il primo volo.
Nei voli successivi l'allievo ammesso ad abbozzare tentativi di
manovra accanto al maestro, acquista l'improvvisa persuasione che
per manovrare siano sufficienti le risorse dell'istinto. La sua
convinzione di riuscire diviene tanto più fiera quanto prima dei voli
era esitante. Si delinea in lui l'esuberante spirito d'iniziativa: egli
scambia per aquilina audacia la propria ignoranza sulle difficoltà del
volo. I suoi tentativi di manovra sono senza sfumature. Se il maestro
lo frena, egli insiste per ottenere una maggiore autonomia. Non esita
ad affermare in piena buona fede che si sentirebbe di volare da solo.
Naturalmente pretende di figurare tra gli anziani. In cospetto dei
nuovi aspiranti si comporta da vecchio falco, spiega con degnazione
annoiata la manovra, concludendo: — È semplicissima!
Ma quando l'istruttore gli affida realmente la manovra, l'allievo entra
nella fase di depressione. Egli registra le nuove difficoltà nel suo
diario: quasi tutti gli allievi conservano un diario con il numero e le
caratteristiche dei loro voli. Oltre occuparsi delle condizioni
dell'atmosfera, del motore, dell'acqua, lo scolaro osserva: «Oggi il
maestro mi ha dichiarato che se egli non interveniva in tempo ci si
infilava nell'acqua». — «Ho osservato che quando reggo io il volante,
l'apparecchio disegna le montagne russe; non appena il maestro
riprende il volante, l'apparecchio torna in linea di volo. Dunque non è
il vento. Il maestro dice che il vento lo faccio io». — «Quando
correggo uno sbandamento ne produco uno maggiore. Il maestro
dice che faccio fare all'apparecchio ciò che fa il cane quando è gaio;
mena la coda a destra e a sinistra».
Se l'idrovolante giunto presso all'acqua non è posto in tempo in linea
di volo, toccando l'acqua rimbalza in aria come un ciottolo a forma di
piastrella lanciato parallelamente alla distesa liquida. Di qui la
denominazione di piastrella a questo tipo di amérissage imperfetto.
La piastrella è l'incubo dell'allievo il quale ricorre ai più ricercati
sofismi per ripudiarne la paternità. Generalmente spiega che è
derivata da un complesso di combinazioni: acqua poco visibile, colpo
di vento, vicinanza di una barca, occhiali appannati....
A traverso queste prime esperienze l'entusiasmo del discepolo perde
effervescenza: diviene solida meditazione. L'allievo non ha più
baldanza loquace, superficiale, nè severità di giudizi. Tace ed
osserva. Segue i voli con sguardo da iniziato, rimugina le
osservazioni fatte pilotando. Dal modo come si comporta un
apparecchio in aria indovina chi lo guida. Anche in aviazione, la
personalità, lo stile esistono. L'allievo comincia a comprendere che la
manovra non è dettata dall'istinto, ma dalla fulminea entrata in
azione di abitudini contratte studiando il volo. È un ricamo di
innumerevoli eccezioni intorno a un semplice concetto fondamentale.
Ma per conseguire questo senso della manovra occorre vivere la vita
dell'apparecchio, occorre che pilota e idrovolante compongano una
cosa sola.
La spirale: altra causa di crisi momentanea. L'istruttore la fa
conoscere all'allievo d'improvviso ed eccezionalmente stretta per
misurare la sua presenza di spirito. L'allievo vede il panorama
inclinarsi e sollevarsi obliquamente come agitato da una danza
diabolica, vede lago, fiumi, paesi, colli, monti roteare, sovrapporsi
quasi fosse giunta la fine del mondo. Quando la spirale cessa di
fatto, nella testa dell'allievo continua. Egli rimane rigido, in
atteggiamento di difesa, trattenendo il respiro. Scendendo reca il
sospetto di non avere attitudine per l'aviazione, ma negli esperimenti
successivi si comporta, anche intimamente, con assai maggiore
disinvoltura fino a divenire egli stesso un abile autore di spirali, per
quanto ampie e caute.


Affermano in maggioranza i piloti che la loro più acuta soddisfazione
derivò dal loro primo volo senza istruttore. Si giunge a questa prova
sospinti da un bisogno imperioso di liberarsi dal controllo
dell'istruttore. È un'apparente forma d'ingratitudine che ricopre una
sostanza di rinascente idoneità. Quando l'allievo in volo si sente
spersonalizzato, prova la luminosa illusione di aver sempre volato,
considera normale la visione dall'alto del panorama ed è insofferente
degl'interventi nella manovra del suo maestro, è evidente che la
convinzione di poter volare solo, matura in lui. Ciò che importa assai
è la convinzione di poter condurre un apparecchio, tanto è vero che i
capi-piloti fingono di mostrarsene increduli per accertarsi, traverso le
proteste dell'allievo, ch'essa esiste veramente.
Se le discussioni in terra sono spesso vane, in cielo sono addirittura
dannose. È necessario in volo perseguire un'idea unica, precisa,
ferma. Due idee avverse nella testa di un pilota producono il
medesimo disordine di due donne in una casa. Purtroppo l'allievo nel
suo primo volo da solo reca due, tre idee per ogni fenomeno nuovo
che lo interessa. Il suo è il volo dei dubbii. I fenomeni nuovi sono: il
motore, l'orientamento e la solitudine. Quando l'allievo volava col
maestro questi si occupava di regolare il motore, di indicare la rotta,
e con la sua presenza aboliva la solitudine. Accade che l'allievo,
dovendo introdurre nella sua psicologia queste nuove responsabilità,
smarrisca momentaneamente l'esatto senso del solo elemento di cui
era sicuro: la manovra. Assalito da nuove preoccupazioni, diffida
anche delle regole che già applicava con disinvoltura da tempo. Le
impiega precipitosamente e provoca nell'apparecchio oscillazioni
ch'egli si affretta ad attribuire al vento. Tutti i reduci del primo volo
affermano che spirava un vento eccezionale.
Ma la crisi culminante del primo volo è provocata dalla discesa: —
Quando spengo il motore? — comincia a chiedersi il neo pilota. —
Adesso. No, è presto. Toccherei acqua troppo lontano dalla scuola.
Però attento a non scendere contro gli hangars. Spengo adesso. No.
Sì. No.
Intanto l'apparecchio, quasi avesse udito il dibattito del suo incerto
pilota, si è abbassato per conto suo; l'allievo, allarmato, fa uno
sforzo togliendo una mano dal volante per chiudere la manetta della
benzina, e riportandola urgentemente al volante. Con l'indice destro
cerca il bottoncino del magnete, per togliere la corrente elettrica, ed
ha l'impressione di non trovarlo. Eccolo. Preme. Il motore tace.
L'allievo inclina l'apparecchio. Troppo. Lo richiama. Teme di scivolar
d'ala. Ripicchia. Teme d'imbarcarsi: — Calma, calma, se no va a finir
male — raccomanda a sè stesso. La discesa finalmente procede
regolare con buona velocità. S'avvicina lo specchio d'acqua.
Comincia la preoccupazione per l'amérissage. Si tratta di attenuare
l'inclinazione dell'apparecchio, ma con dolcezza, con sfumature quasi
impercettibili. Viceversa il reduce richiama a sè il volante troppo
sollecitamente: è ancora a sei metri dall'acqua. Respinge il volante
ma deve richiamarlo quasi subito perchè è ormai a un metro.
Qualche esitazione ancora, poi alla fine l'idrovolante tocca l'acqua,
un po' bruscamente e inelegantemente, ma senza eccessivi guai.
Lungo respiro di soddisfazione dell'allievo il quale, riacceso il motore,
fa ritorno alla scuola salutato dai colleghi che sulla rotonda lo hanno
seguìto in volo: — Bene, bravo, — gli gridano. Ognuno vuole
stringergli la mano. Il trionfatore diventa insincero. Poichè lo lodano,
egli assume l'atteggiamento di chi si merita la lode guardandosi dal
denunciare gli errori commessi, anche perchè ha la coscienza di non
ripeterli più.
— Quali impressioni? — gli chiedono.
— Mi sono trovato molto bene.
— Si vola meglio senza maestro?
— Non c'è paragone.
In questa fase di ascensione, caratterizzata da prove di crescente
portata, il neo pilota è suscettibile di impressioni esagerate che
derivano dal consumo eccezionale di energie quando ancora i suoi
centri nervosi non sono sufficientemente sviluppati. Ma lo sviluppo
nervoso nell'allievo di solida costituzione è alacre e gli consente di
superare prove che pensate prima gli apparivano insormontabili. Un
allievo che scende esausto da un esperimento non raggiunto, porta
nel segreto della sua anima uno sconforto che non sa confidare e
che ha il colore della sconfitta. Ma all'indomani le sue forze sono
gagliarde in una misura insperata. L'esperienza del giorno
precedente, anzichè essergli nemica, gli è alleata.
La notevole altezza e la resistenza di volo sono sopratutto un
risultato dell'amor proprio. La volontà ferma, orgogliosa di
raggiungere la quota designata e di rimanere in aria per una durata
stabilita è indispensabile come la benzina al motore. Essa servirà a
neutralizzare gli effetti demoralizzanti del freddo, delle inquietudini
atmosferiche, del vuoto sempre più profondo e vasto, delle nubi e
della solitudine.
In altri ambienti amiamo vincere oltre che per noi stessi anche per il
prossimo, ma in aviazione si vince sopratutto per noi stessi. Un pilota
che dovesse cedere al vento, recherebbe con sè un incubo che
graverebbe nei suoi successivi cimenti. Perciò il volo è un efficace
mezzo per misurare, oltre le qualità tecniche, le risorse morali
dell'allievo. La cartina del barografo riproduce le peripezie
psicologiche dell'allievo. Quella linea che s'innalza sicura, regolare,
leggermente incurvata sino a una data quota — 1500 metri, 2000
metri — poi prosegue in una alternativa di tratti rettilinei, gobbe
concave e convesse e finalmente ridiscende con una rapida obliqua,
narra una serie di emozioni in contrasto: serena conquista della
quota di metri 2000, poi lotta col vento, incertezze del motore,
soggezione della solitudine, tentazione di scendere, reazione
dell'amor proprio e finalmente discesa definitiva.


Talvolta la sensibilità dell'allievo viene sottoposta a una prova
singolare durante una traversata di nubi, l'incontro con le quali
presenta varie caratteristiche e non sempre uguali. Può risultare
abbastanza placido se sono nubi bianche, i carri, ma spesso è
preceduto da un avvicinarsi scapigliato di folate vaporose, dal gelo,
dalla rarefazione dell'atmosfera, dall'incrociarsi volubile di raffiche.
Poi penetrato l'apparecchio in questo mondo latteo, invisibile,
misterioso, il motore diviene asmatico, il pilota perde il senso
dell'orientamento.
Splendido è il momento in cui si esce da questa prigionia: splendido
dal punto di vista tecnico ed estetico. Ci si accorge che l'apparecchio
era sbandato malamente, troppo sollevato; ristabilitolo nelle
condizioni normali si può ammirare a rapidi sguardi la nuovissima
visione: un mare di immobili onde candide, compatte, raggianti,
preceduto da lontani cirri solitari che fanno pensare alle avanguardie
di un esercito fantastico. Ma la sensazione del bello è quasi
paralizzata dal problema di tornare fra le nubi: problema che si
risolve con una discesa a forte velocità, preferibilmente dove s'apre
Welcome to our website – the ideal destination for book lovers and
knowledge seekers. With a mission to inspire endlessly, we offer a
vast collection of books, ranging from classic literary works to
specialized publications, self-development books, and children's
literature. Each book is a new journey of discovery, expanding
knowledge and enriching the soul of the reade

Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.

Let us accompany you on the journey of exploring knowledge and


personal growth!

ebookultra.com

You might also like