0% found this document useful (0 votes)
1 views

Bioinformatics And Medical Applications Big Data Using Deep Learning Algorithm A Suresh pdf download

The document discusses the book 'Bioinformatics and Medical Applications: Big Data Using Deep Learning Algorithms' edited by A. Suresh and others, published in 2022. It includes various chapters on topics such as machine learning algorithms for health predictions, cancer detection, and deep learning applications in medical informatics. The book serves as a comprehensive resource for advancements in bioinformatics and its applications in healthcare.

Uploaded by

esmiklohja
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
1 views

Bioinformatics And Medical Applications Big Data Using Deep Learning Algorithm A Suresh pdf download

The document discusses the book 'Bioinformatics and Medical Applications: Big Data Using Deep Learning Algorithms' edited by A. Suresh and others, published in 2022. It includes various chapters on topics such as machine learning algorithms for health predictions, cancer detection, and deep learning applications in medical informatics. The book serves as a comprehensive resource for advancements in bioinformatics and its applications in healthcare.

Uploaded by

esmiklohja
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 77

Bioinformatics And Medical Applications Big Data

Using Deep Learning Algorithm A Suresh download

https://ebookbell.com/product/bioinformatics-and-medical-
applications-big-data-using-deep-learning-algorithm-a-
suresh-42455422

Explore and download more ebooks at ebookbell.com


Here are some recommended products that we believe you will be
interested in. You can click the link to download.

Roughfuzzy Pattern Recognition Applications In Bioinformatics And


Medical Imaging Pradipta Maji

https://ebookbell.com/product/roughfuzzy-pattern-recognition-
applications-in-bioinformatics-and-medical-imaging-pradipta-
maji-4311682

Symmetrical Analysis Techniques For Genetic Systems And Bioinformatics


Advanced Patterns And Applications Premier Reference Source 1st
Edition Sergey Petoukhov

https://ebookbell.com/product/symmetrical-analysis-techniques-for-
genetic-systems-and-bioinformatics-advanced-patterns-and-applications-
premier-reference-source-1st-edition-sergey-petoukhov-1373342

Probabilistic Modeling In Bioinformatics And Medical Informatics Dirk


Husmeier Richard Dybowski Stephen Roberts

https://ebookbell.com/product/probabilistic-modeling-in-
bioinformatics-and-medical-informatics-dirk-husmeier-richard-dybowski-
stephen-roberts-4106214

Soft Computing And Medical Bioinformatics 1st Ed Naresh Babu


Muppalaneni

https://ebookbell.com/product/soft-computing-and-medical-
bioinformatics-1st-ed-naresh-babu-muppalaneni-7157048
Medical Biotechnology Biopharmaceutics Forensic Science And
Bioinformatics Hajiya Mairo Inuwa

https://ebookbell.com/product/medical-biotechnology-biopharmaceutics-
forensic-science-and-bioinformatics-hajiya-mairo-inuwa-46969346

Medical Device Data And Modeling For Clinical Decision Making Artech
House Series Bioinformatics Biomedical Imaging 1st Edition John R
Zaleski

https://ebookbell.com/product/medical-device-data-and-modeling-for-
clinical-decision-making-artech-house-series-bioinformatics-
biomedical-imaging-1st-edition-john-r-zaleski-2357318

Bioinformatics And Machine Learning For Cancer Biology Yiping Fan

https://ebookbell.com/product/bioinformatics-and-machine-learning-for-
cancer-biology-yiping-fan-44874538

Bioinformatics And Human Genomics Research Diego A Forero

https://ebookbell.com/product/bioinformatics-and-human-genomics-
research-diego-a-forero-46667884

Bioinformatics And Biomedical Engineering 9th International


Workconference Iwbbio 2022 Maspalomas Gran Canaria Spain June 2730
2022 Proceedings Part I Ignacio Rojas Editor

https://ebookbell.com/product/bioinformatics-and-biomedical-
engineering-9th-international-workconference-iwbbio-2022-maspalomas-
gran-canaria-spain-june-2730-2022-proceedings-part-i-ignacio-rojas-
editor-47223554
Bioinformatics and
Medical Applications
Scrivener Publishing
100 Cummings Center, Suite 541J
Beverly, MA 01915-6106

Publishers at Scrivener
Martin Scrivener ([email protected])
Phillip Carmical ([email protected])
Bioinformatics and
Medical Applications

Big Data Using Deep


Learning Algorithms

Edited by
A. Suresh
S. Vimal
Y. Harold Robinson
Dhinesh Kumar Ramaswami
and
R. Udendhran
This edition first published 2022 by John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030, USA
and Scrivener Publishing LLC, 100 Cummings Center, Suite 541J, Beverly, MA 01915, USA
© 2022 Scrivener Publishing LLC
For more information about Scrivener publications please visit www.scrivenerpublishing.com.

All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted, in any form or by any means, electronic, mechanical, photocopying, recording, or other-
wise, except as permitted by law. Advice on how to obtain permission to reuse material from this title
is available at http://www.wiley.com/go/permissions.

Wiley Global Headquarters


111 River Street, Hoboken, NJ 07030, USA

For details of our global editorial offices, customer services, and more information about Wiley prod-
ucts visit us at www.wiley.com.

Limit of Liability/Disclaimer of Warranty


While the publisher and authors have used their best efforts in preparing this work, they make no rep­
resentations or warranties with respect to the accuracy or completeness of the contents of this work and
specifically disclaim all warranties, including without limitation any implied warranties of merchant-­
ability or fitness for a particular purpose. No warranty may be created or extended by sales representa­
tives, written sales materials, or promotional statements for this work. The fact that an organization,
website, or product is referred to in this work as a citation and/or potential source of further informa­
tion does not mean that the publisher and authors endorse the information or services the organiza­
tion, website, or product may provide or recommendations it may make. This work is sold with the
understanding that the publisher is not engaged in rendering professional services. The advice and
strategies contained herein may not be suitable for your situation. You should consult with a specialist
where appropriate. Neither the publisher nor authors shall be liable for any loss of profit or any other
commercial damages, including but not limited to special, incidental, consequential, or other damages.
Further, readers should be aware that websites listed in this work may have changed or disappeared
between when this work was written and when it is read.

Library of Congress Cataloging-in-Publication Data

ISBN 978-1-119-79183-6

Cover image: Pixabay.Com


Cover design by Russell Richardson

Set in size of 11pt and Minion Pro by Manila Typesetting Company, Makati, Philippines

Printed in the USA

10 9 8 7 6 5 4 3 2 1
Contents

Preface xv
1 Probabilistic Optimization of Machine Learning Algorithms
for Heart Disease Prediction 1
Jaspreet Kaur, Bharti Joshi and Rajashree Shedge
1.1 Introduction 2
1.1.1 Scope and Motivation 3
1.2 Literature Review 4
1.2.1 Comparative Analysis 5
1.2.2 Survey Analysis 5
1.3 Tools and Techniques 10
1.3.1 Description of Dataset 11
1.3.2 Machine Learning Algorithm 12
1.3.3 Decision Tree 14
1.3.4 Random Forest 15
1.3.5 Naive Bayes Algorithm 16
1.3.6 K Means Algorithm 18
1.3.7 Ensemble Method 18
1.3.7.1 Bagging 19
1.3.7.2 Boosting 19
1.3.7.3 Stacking 19
1.3.7.4 Majority Vote 19
1.4 Proposed Method 20
1.4.1 Experiment and Analysis 20
1.4.2 Method 22
1.5 Conclusion 25
References 26

v
vi Contents

2 Cancerous Cells Detection in Lung Organs of Human Body:


IoT-Based Healthcare 4.0 Approach 29
Rohit Rastogi, D.K. Chaturvedi, Sheelu Sagar, Neeti Tandon
and Mukund Rastogi
2.1 Introduction 30
2.1.1 Motivation to the Study 30
2.1.1.1 Problem Statements 31
2.1.1.2 Authors’ Contributions 31
2.1.1.3 Research Manuscript Organization 31
2.1.1.4 Definitions 32
2.1.2 Computer-Aided Diagnosis System (CADe or CADx) 32
2.1.3 Sensors for the Internet of Things 32
2.1.4 Wireless and Wearable Sensors for Health Informatics 33
2.1.5 Remote Human’s Health and Activity Monitoring 33
2.1.6 Decision-Making Systems for Sensor Data 33
2.1.7 Artificial Intelligence and Machine Learning for
Health Informatics 34
2.1.8 Health Sensor Data Management 34
2.1.9 Multimodal Data Fusion for Healthcare 35
2.1.10 Heterogeneous Data Fusion and Context-Aware
Systems: A Context-Aware Data Fusion Approach
for Health-IoT 35
2.2 Literature Review 35
2.3 Proposed Systems 37
2.3.1 Framework or Architecture of the Work 38
2.3.2 Model Steps and Parameters 38
2.3.3 Discussions 39
2.4 Experimental Results and Analysis 39
2.4.1 Tissue Characterization and Risk Stratification 39
2.4.2 Samples of Cancer Data and Analysis 40
2.5 Novelties 42
2.6 Future Scope, Limitations, and Possible Applications 42
2.7 Recommendations and Consideration 43
2.8 Conclusions 43
References 43
3 Computational Predictors of the Predominant Protein Function:
SARS-CoV-2 Case 47
Carlos Polanco, Manlio F. Márquez and Gilberto Vargas-Alarcón
3.1 Introduction 48
3.2 Human Coronavirus Types 49
Contents vii

3.3 The SARS-CoV-2 Pandemic Impact 50


3.3.1 RNA Virus vs DNA Virus 51
3.3.2 The Coronaviridae Family 51
3.3.3 The SARS-CoV-2 Structural Proteins 52
3.3.4 Protein Representations 52
3.4 Computational Predictors 53
3.4.1 Supervised Algorithms 53
3.4.2 Non-Supervised Algorithms 54
3.5 Polarity Index Method® 54
3.5.1 The PIM® Profile 54
3.5.2 Advantages 55
3.5.3 Disadvantages 55
3.5.4 SARS-CoV-2 Recognition Using PIM® Profile 55
3.6 Future Implications 59
3.7 Acknowledgments 60
References 60
4 Deep Learning in Gait Abnormality Detection: Principles
and Illustrations 63
Saikat Chakraborty, Sruti Sambhavi and Anup Nandy
4.1 Introduction 63
4.2 Background 65
4.2.1 LSTM 65
4.2.1.1 Vanilla LSTM 65
4.2.1.2 Bidirectional LSTM 66
4.3 Related Works 67
4.4 Methods 68
4.4.1 Data Collection and Analysis 68
4.4.2 Results and Discussion 69
4.5 Conclusion and Future Work 71
4.6 Acknowledgments 71
References 71
5 Broad Applications of Network Embeddings in
Computational Biology, Genomics, Medicine, and Health 73
Akanksha Jaiswar, Devender Arora, Manisha Malhotra,
Abhimati Shukla and Nivedita Rai
5.1 Introduction 74
5.2 Types of Biological Networks 76
5.3 Methodologies in Network Embedding 76
5.4 Attributed and Non-Attributed Network Embedding 82
viii Contents

5.5 Applications of Network Embedding in


Computational Biology 83
5.5.1 Understanding Genomic and Protein Interaction
via Network Alignment 83
5.5.2 Pharmacogenomics 84
5.5.2.1 Drug-Target Interaction Prediction 84
5.5.2.2 Drug-Drug Interaction 84
5.5.2.3 Drug-Disease Interaction Prediction 85
5.5.2.4 Analysis of Adverse Drug Reaction 85
5.5.3 Function Prediction 86
5.5.4 Community Detection 86
5.5.5 Network Denoising 87
5.5.6 Analysis of Multi-Omics Data 87
5.6 Limitations of Network Embedding in Biology 87
5.7 Conclusion and Outlook 89
References 89
6 Heart Disease Classification Using Regional Wall Thickness
by Ensemble Classifier 99
Prakash J., Vinoth Kumar B. and Sandhya R.
6.1 Introduction 100
6.2 Related Study 101
6.3 Methodology 103
6.3.1 Pre-Processing 103
6.3.2 Region of Interest Extraction 104
6.3.3 Segmentation 105
6.3.4 Feature Extraction 106
6.3.5 Disease Classification 107
6.4 Implementation and Result Analysis 108
6.4.1 Dataset Description 108
6.4.2 Testbed 108
6.4.3 Discussion 108
6.4.3.1 K-Fold Cross-Validation 110
6.4.3.2 Confusion Matrix 110
6.5 Conclusion 115
References 115
7 Deep Learning for Medical Informatics and Public Health 117
K. Aditya Shastry, Sanjay H. A., Lakshmi M. and Preetham N.
7.1 Introduction 118
7.2 Deep Learning Techniques in Medical Informatics
and Public Health 121
Contents ix

7.2.1 Autoencoders 122


7.2.2 Recurrent Neural Network 123
7.2.3 Convolutional Neural Network (CNN) 124
7.2.4 Deep Boltzmann Machine 126
7.2.5 Deep Belief Network 127
7.3 Applications of Deep Learning in Medical Informatics
and Public Health 128
7.3.1 The Use of DL for Cancer Diagnosis 128
7.3.2 DL in Disease Prediction and Treatment 129
7.3.3 Future Applications 133
7.4 Open Issues Concerning DL in Medical Informatics
and Public Health 135
7.5 Conclusion 139
References 140
8 An Insight Into Human Pose Estimation and Its Applications 147
Shambhavi Mishra, Janamejaya Channegowda
and Kasina Jyothi Swaroop
8.1 Foundations of Human Pose Estimation 147
8.2 Challenges to Human Pose Estimation 149
8.2.1 Motion Blur 150
8.2.2 Indistinct Background 151
8.2.3 Occlusion or Self-Occlusion 151
8.2.4 Lighting Conditions 151
8.3 Analyzing the Dimensions 152
8.3.1 2D Human Pose Estimation 152
8.3.1.1 Single-Person Pose Estimation 153
8.3.1.2 Multi-Person Pose Estimation 153
8.3.2 3D Human Pose Estimation 153
8.4 Standard Datasets for Human Pose Estimation 154
8.4.1 Pascal VOC (Visual Object Classes) Dataset 156
8.4.2 KTH Multi-View Football Dataset I 156
8.4.3 KTH Multi-View Football Dataset II 156
8.4.4 MPII Human Pose Dataset 157
8.4.5 BBC Pose 157
8.4.6 COCO Dataset 157
8.4.7 J-HMDB Dataset 158
8.4.8 Human3.6M Dataset 158
8.4.9 DensePose 158
8.4.10 AMASS Dataset 159
8.5 Deep Learning Revolutionizing Pose Estimation 159
x Contents

8.5.1 Approaches in 2D Human Pose Estimation 159


8.5.2 Approaches in 3D Human Pose Estimation 163
8.6 Application of Human Pose Estimation in Medical Domains 165
8.7 Conclusion 166
References 167
9 Brain Tumor Analysis Using Deep Learning: Sensor
and IoT-Based Approach for Futuristic Healthcare 171
Rohit Rastogi, D.K. Chaturvedi, Sheelu Sagar, Neeti Tandon
and Akshit Rajan Rastogi
9.1 Introduction 172
9.1.1 Brain Tumor 172
9.1.2 Big Data Analytics in Health Informatics 172
9.1.3 Machine Learning in Healthcare 173
9.1.4 Sensors for Internet of Things 173
9.1.5 Challenges and Critical Issues of IoT in Healthcare 174
9.1.6 Machine Learning and Artificial Intelligence for
Health Informatics 174
9.1.7 Health Sensor Data Management 175
9.1.8 Multimodal Data Fusion for Healthcare 175
9.1.9 Heterogeneous Data Fusion and Context-Aware Systems
a Context-Aware Data Fusion Approach for Health-IoT 176
9.1.10 Role of Technology in Addressing the Problem
of Integration of Healthcare System 176
9.2 Literature Survey 177
9.3 System Design and Methodology 179
9.3.1 System Design 179
9.3.2 CNN Architecture 180
9.3.3 Block Diagram 181
9.3.4 Algorithm(s) 181
9.3.5 Our Experimental Results, Interpretation,
and Discussion 183
9.3.6 Implementation Details 183
9.3.7 Snapshots of Interfaces 184
9.3.8 Performance Evaluation 186
9.3.9 Comparison with Other Algorithms 186
9.4 Novelty in Our Work 186
9.5 Future Scope, Possible Applications, and Limitations 188
9.6 Recommendations and Consideration 188
9.7 Conclusions 188
References 189
Contents xi

10 Study of Emission From Medicinal Woods to Curb Threats


of Pollution and Diseases: Global Healthcare Paradigm Shift
in 21st Century 191
Rohit Rastogi, Mamta Saxena, Devendra Kr. Chaturvedi,
Sheelu Sagar, Neha Gupta, Harshit Gupta, Akshit Rajan Rastogi,
Divya Sharma, Manu Bhardwaj and Pranav Sharma
10.1 Introduction 192
10.1.1 Scenario of Pollution and Need to Connect with
Indian Culture 192
10.1.2 Global Pollution Scenario 192
10.1.3 Indian Crisis on Pollution and Worrying Stats 193
10.1.4 Efforts Made to Curb Pollution World Wide 194
10.1.5 Indian Ancient Vedic Sciences to Curb Pollution
and Related Disease 196
10.1.6 The Yajna Science: A Boon to Human Race
From Rishi-Muni 196
10.1.7 The Science of Mantra Associated With Yajna
and Its Scientific Effects 197
10.1.8 Effect of Different Woods and Cow Dung Used
in Yajna 197
10.1.9 Use of Sensors and IoT to Record Experimental Data 198
10.1.10 Analysis and Pattern Recognition by ML and AI 199
10.2 Literature Survey 200
10.3 The Methodology and Protocols Followed 201
10.4 Experimental Setup of an Experiment 202
10.5 Results and Discussions 202
10.5.1 Mango 202
10.5.2 Bargad 203
10.6 Applications of Yagya and Mantra Therapy in Pollution
Control and Its Significance 207
10.7 Future Research Perspectives 207
10.8 Novelty of Our Research 208
10.9 Recommendations 208
10.10 Conclusions 209
References 209
11 An Economical Machine Learning Approach for Anomaly
Detection in IoT Environment 215
Ambika N.
11.1 Introduction 215
11.2 Literature Survey 218
xii Contents

11.3 Proposed Work 229


11.4 Analysis of the Work 230
11.5 Conclusion 231
References 231
12 Indian Science of Yajna and Mantra to Cure Different
Diseases: An Analysis Amidst Pandemic With a Simulated
Approach 235
Rohit Rastogi, Mamta Saxena, Devendra Kumar Chaturvedi,
Mayank Gupta, Puru Jain, Rishabh Jain, Mohit Jain,
Vishal Sharma, Utkarsh Sangam, Parul Singhal
and Priyanshi Garg
12.1 Introduction 236
12.1.1 Different Types of Diseases 236
12.1.1.1 Diabetes (Madhumeha) and Its Types 236
12.1.1.2 TTH and Stress 237
12.1.1.3 Anxiety 237
12.1.1.4 Hypertension 237
12.1.2 Machine Vision 237
12.1.2.1 Medical Images and Analysis 238
12.1.2.2 Machine Learning in Healthcare 238
12.1.2.3 Artificial Intelligence in Healthcare 239
12.1.3 Big Data and Internet of Things (IoT) 239
12.1.4 Machine Learning in Association with
Data Science and Analytics 239
12.1.5 Yajna Science 240
12.1.6 Mantra Science 240
12.1.6.1 Positive Impact of Recital of Gayatri
Mantra and OM Chanting 241
12.1.6.2 Significance of Mantra on Indian
Culture and Mythology 241
12.1.7 Usefulness and Positive Aspect of Yoga Asanas
and Pranayama 241
12.1.8 Effects of Yajna and Mantra on Human Health 242
12.1.9 Impact of Yajna in Reducing the Atmospheric
Solution 242
12.1.10 Scientific Study on Impact of Yajna on
Air Purification 243
12.1.11 Scientific Meaning of Religious and Manglik Signs 244
12.2 Literature Survey 244
12.3 Methodology 246
Contents xiii

12.4 Results and Discussion 249


12.5 Interpretations and Analysis 250
12.6 Novelty in Our Work 258
12.7 Recommendations 259
12.8 Future Scope and Possible Applications 260
12.9 Limitations 261
12.10 Conclusions 261
12.11 Acknowledgments 262
References 262
13 Collection and Analysis of Big Data From Emerging
Technologies in Healthcare 269
Nagashri K., Jayalakshmi D. S. and Geetha J.
13.1 Introduction 269
13.2 Data Collection 271
13.2.1 Emerging Technologies in Healthcare
and Its Applications 271
13.2.1.1 RFID 272
13.2.1.2 WSN 273
13.2.1.3 IoT 274
13.2.2 Issues and Challenges in Data Collection 277
13.2.2.1 Data Quality 277
13.2.2.2 Data Quantity 277
13.2.2.3 Data Access 278
13.2.2.4 Data Provenance 278
13.2.2.5 Security 278
13.2.2.6 Other Challenges 279
13.3 Data Analysis 280
13.3.1 Data Analysis Approaches 280
13.3.1.1 Machine Learning 280
13.3.1.2 Deep Learning 281
13.3.1.3 Natural Language Processing 281
13.3.1.4 High-Performance Computing 281
13.3.1.5 Edge-Fog Computing 282
13.3.1.6 Real-Time Analytics 282
13.3.1.7 End-User Driven Analytics 282
13.3.1.8 Knowledge-Based Analytics 283
13.3.2 Issues and Challenges in Data Analysis 283
13.3.2.1 Multi-Modal Data 283
13.3.2.2 Complex Domain Knowledge 283
13.3.2.3 Highly Competent End-Users 283
xiv Contents

13.3.2.4 Supporting Complex Decisions 283


13.3.2.5 Privacy 284
13.3.2.6 Other Challenges 284
13.4 Research Trends 284
13.5 Conclusion 286
References 286
14 A Complete Overview of Sign Language Recognition
and Translation Systems 289
Kasina Jyothi Swaroop, Janamejaya Channegowda
and Shambhavi Mishra
14.1 Introduction 289
14.2 Sign Language Recognition 290
14.2.1 Fundamentals of Sign Language Recognition 290
14.2.2 Requirements for the Sign Language Recognition 292
14.3 Dataset Creation 293
14.3.1 American Sign Language 293
14.3.2 German Sign Language 296
14.3.3 Arabic Sign Language 297
14.3.4 Indian Sign Language 298
14.4 Hardware Employed for Sign Language Recognition 299
14.4.1 Glove/Sensor-Based Systems 299
14.4.2 Microsoft Kinect–Based Systems 300
14.5 Computer Vision–Based Sign Language Recognition
and Translation Systems 302
14.5.1 Image Processing Techniques for Sign Language
Recognition 302
14.5.2 Deep Learning Methods for Sign Language
Recognition 304
14.5.3 Pose Estimation Application to Sign Language
Recognition 305
14.5.4 Temporal Information in Sign Language
Recognition and Translation 306
14.6 Sign Language Translation System—A Brief Overview 307
14.7 Conclusion 309
References 310
Index 315
Preface

This book features bioinformatics applications in the medical field that


employ deep learning algorithms to analyze massive biological datasets
using computational approaches and the latest cutting-edge technolo-
gies to capture and interpret biological data. In addition to delivering the
various bioinformatics computational methods used to identify diseases
at an early stage, it also collects cutting-edge resources in a single source
designed to enlighten the reader with topics centered on computer science,
mathematics, and biology. Since bioinformatics is critical for data man-
agement in the current fields of biology and medicine, this book explains
the important tools used by bioinformaticians and examines how they are
used to evaluate biological data in order to advance disease knowledge.
As shown in the chapter-by-chapter synopsis that follows, the editors
of this book have curated a distinguished group of perceptive and con-
cise chapters that reflect the current state of medical treatments and sys-
tems and offer emerging solutions for a more personalized approach to the
healthcare field. Since applying deep learning techniques for data-driven
solutions in health information allows automated analysis, this method can
be more advantageous in addressing the problems arising from medical-
and health-related information.

–– Chapter 1, “Probabilistic Optimization of Machine Learning


Algorithms for Heart Disease Prediction,” discusses the
ensemble learning that overcomes the limitations of a single
algorithm, such as bias and variance, by using a multitude of
algorithms. It highlights the importance of ensemble tech-
niques in improving the forecast accuracy and displaying an
acceptable performance in disease prediction. Additionally,
the authors have worked on a procedure to further improve
the accuracy of the ensemble method post application
by focusing on the wrongly classified records and using
probabilistic optimization to select pertinent columns by

xv
xvi Preface

increasing their weight and doing a reclassification which


would result in further improved accuracy.
–– Chapter 2, “Cancerous Cells Detection in Lung Organs of
the Human Body: IoT-Based Healthcare 4.0 Approach,” ana-
lyzes three types of cancer—squamous cell carcinoma, ade-
nocarcinoma, and large cell carcinoma—derived from lung
tissue, and investigates how AI can customize treatment
choices for lung cancer patients.
–– Chapter 3, “Computational Predictors of the Predominant
Protein Function: SARS-CoV-2 Case,” describes the main
molecular features of SARS-CoV-2 that cause COVID-
19 disease, as well as a high-efficiency computational pre-
diction called the polarity index method. Furthermore, it
presents a molecular classification of the RNA-virus and
DNA-virus families with results obtained by the proposed
non-supervised method focusing on the linear representa-
tion of proteins.
–– Chapter 4, “Deep Learning in Gait Abnormality Detection:
Principles and Illustrations,” discusses cerebral palsy, a med-
ical condition which is marked by weakened muscle coordi-
nation and other dysfunctions. This chapter proposes a deep
learning technique, including support vector machines,
multilayer perceptron, vanilla long short-term memory, and
bi-directional LSTM, to diagnose cerebral palsy gait.
–– Chapter 5, “Broad Applications of Network Embeddings in
Computational Biology, Genomics, Medicine, and Health,”
mainly focuses on the current traditional development of
network or graph embedding and its application in com-
putational biology, genomics, and healthcare. As biological
networks are very complex and hard to interpret, a signifi-
cant amount of progress is being made towards a graph or
network embedding paradigm that can be used for visual-
ization, representation, interpretation, and their correlation.
Finally, to gain more biological insight, further quantifica-
tion and evaluation of the network embedding technique
and the key challenges are addressed.
–– Chapter 6, “Heart Disease Classification Using Regional
Wall Thickness by Ensemble Classifier,” focuses on the car-
diac magnetic resonance images that are formed using radio
waves and an influential magnetic field to produce images
showing detailed structure within and around the heart.
Preface xvii

These images can be used to identify cardiac disease through


various learning techniques employed to evaluate the heart’s
anatomy and function in patients. In this chapter, an ensem-
ble classification model is used to classify the type of heart
disease.
–– Chapter 7, “Deep Learning for Medical Informatics and
Public Health,” highlights deep learning drawbacks related
to data (higher number of features, dissimilar data, reliance
on time, unsupervised data, etc.) and model (dependabil-
ity, understandability, likelihood, scalability) for real-world
applications. It emphasizes the DL techniques applied in
medical informatics and recent public health case studies
related to the application of deep learning and certain criti-
cal research questions.
–– Chapter 8, “An Insight into Human Pose Estimation and Its
Applications,” discusses human pose estimation and exam-
ines potential deep learning algorithms in great detail, as
well as the benchmarking datasets. Recent important deep
learning-based models are also investigated.
–– Chapter 9, “Brain Tumor Analysis Using Deep Learning:
Sensor and IoT-Based Approach for Futuristic Healthcare,”
proposes an approach for the prediction of brain tumors.
–– Chapter 10, “Study of Emission from Medicinal Woods to
Curb Threats of Pollution and Diseases: Global Healthcare
Paradigm Shift in the 21st Century,” focuses on techniques
to prevent pollution-related diseases.
–– Chapter 11, “An Economical Machine Learning Approach
for Anomaly Detection in IoT Environment,” presents an
improved version of the previous machine learning archi-
tecture for ransomware assault in the IoT since it could
be more destructive and hence might influence the entire
security administration scenario. Therefore, precautions
are to be taken to secure the devices as well as data that is
being transmitted among themselves, and threats have to be
detected at an earlier stage to ensure complete security of the
communication. The work proposed in this chapter analyzes
the communicating data between these devices and aids in
choosing an economically appropriate measure to secure the
system.
–– Chapter 12, “Indian Science of Yajna and Mantra to Cure
Different Diseases: An Analysis Amidst Pandemic with a
xviii Preface

Simulated Approach,” discusses deep Yagya training, which


is an amazingly practical application that is easy to use and
exciting, and has a great impact on delicate thinking and
emotions.
–– Chapter 13, “Collection and Analysis of Big Data from
Emerging Technologies in Healthcare,” discusses the fact
that new diseases, such as COVID-19, are constantly being
discovered. Since this results in a tremendous surge in data
being generated and a huge burden falling on medical per-
sonnel, this is an area in which automation and emerging
technologies can contribute significantly. Since combining
big data with emerging healthcare technologies is the need
of the hour, this chapter focuses on the collection of big data
using emerging technologies like radio frequency identi-
fication (RFID), wireless sensor networks (WSN), and the
internet of things (IoT), and their applications in the medi-
cal field. After discussing different data analysis approaches,
the challenges and issues that arise during data analysis
are explored and current research trends in the field are
summarized.
–– Chapter 14, “A Complete Overview of Sign Language
Recognition and Translation Systems,” discusses the use of
human body pose and hand pose estimation. Sign language
recognition has been conventionally performed by some
preliminary sensors and later evolved to various advanced
deep learning-based computer vision systems. This chap-
ter deals with the past, present, and future of sign language
recognition systems. Sign language translation is also briefly
discussed, providing insights into the natural language pro-
cessing techniques used to accurately convert sign language
to translated sentences.

The editors thank the contributors most profoundly for their time and
effort.

A. Suresh
S. Vimal
Y. Harold Robinson
Dhinesh Kumar Ramaswami
R. Udendhran
February 2022
1
Probabilistic Optimization of
Machine Learning Algorithms
for Heart Disease Prediction
Jaspreet Kaur1*, Bharti Joshi2 and Rajashree Shedge2

Ramrao Adik Institute of Technology, Nerul, Navi Mumbai, India


1

2
Department of Computer Engineering Ramrao, Adik Institute of
Technology Nerul, Navi Mumbai, India

Abstract
Big Data and Machine Learning have been effectively used in medical management
leading to cost reduction in treatment, predicting the outbreak of epidemics,
avoiding preventable diseases, and, improving the quality of life.
Prediction begins with the machine learning patterns from several existing known
datasets and then applying something very similar to an obscure dataset to check
the result. In this chapter, we investigate Ensemble Learning which overcomes the
limitations of a single algorithm such as bias and variance by using a multitude of
algorithms. The focus is not solely increasing the accuracy of weak classification algo-
rithmic programs however additionally implementing the algorithm on a medical
dataset wherever it is effectively used for analysis, prediction, and treatment. The
consequence of the investigation indicates that ensemble techniques are powerful in
improving the forecast accuracy and displaying an acceptable performance in disease
prediction. Additionally, we have worked on a procedure to further improve the accu-
racy post applying ensemble method by focusing on the wrongly classified records
and using probabilistic optimization to select pertinent columns by increasing their
weight and doing a reclassification which would result in further improved accuracy.
The accuracy hence achieved by our proposed method is, by far, quite competitive.

Keywords: Kaggle dataset, machine learning, probabilistic optimization,


decision tree, random forest, Naive Bayes, K means, ensemble method,
confusion matrix, probability, Euclidean distance

*Corresponding author: [email protected]

A. Suresh, S. Vimal, Y. Harold Robinson, Dhinesh Kumar Ramaswami and R. Udendhran (eds.)
Bioinformatics and Medical Applications: Big Data Using Deep Learning Algorithms, (1–28)
© 2022 Scrivener Publishing LLC

1
2 Bioinformatics and Medical Applications

1.1 Introduction
Healthcare and biomedicine are increasingly using big data technologies
for research and development. Mammoth amount of clinical data have
been generated and collected at an unparalleled scale and speed. Electronic
health records (EHR) store large amounts of patient data. The quality of
healthcare can be greatly improved by employing big data applications to
identify trends and discover knowledge. Details generated in the hospitals
fall in the following categories.

• Clinical data: Doctor’s notes, prescription data, medical imag-


ing reports, laboratory, pharmacy, and insurance related data.
• Patient data: EHRs related to patient admission details, diag-
nosis, and treatment.
• Machine generated/sensor data: Data obtained from mon-
itoring critical symptoms, emergency care data, web-based
media posts, news feeds, and medical journal articles.

The pharmaceutical companies, for example, can effectively utilize this


data to identify new potential drug candidates and predictive data model-
ing can substantially decrease the expenses on drug discovery and improve
the decision-making process in healthcare. Predictive modeling helps in
producing a faster and more targeted research with respect to drugs and
medical devices.
AI depends on calculations that can gain from information without
depending on rule-based programming while big data is the type of data
that can be supplied to analytical systems so that a machine learning model
could learn or, in other words, improve the accuracy of its predictions.
Machine learning algorithms is classified in three sorts, particularly super-
vised, unsupervised, and reinforcement learning.
Perhaps, the most famous procedure in information mining is cluster-
ing which is the method of identifying similar groups of data. The groups
are created in a manner wherein entities in one group are more similar to
each other than to those belonging to the other groups. Although it is an
unsupervised machine learning technique, such collections can be used as
features in supervised AI model.
Coronary illness, the primary reason behind morbidness and fatality
globally, was responsible for more deaths annually compared to any other
cause [1]. Fortunately, cardiovascular failures are exceptionally prevent-
able and straightforward way of life alterations alongside early treatment
incredibly improves the prognosis. It is, nonetheless, hard to recognize
Probabilistic Optimization of ML for HDP 3

high-risk patients because of the presence of different factors that add to


the danger of coronary illness like diabetes, hypertension, and elevated
cholesterol. This is where information mining and AI have acted the hero
by creating screening devices. These devices are helpful on account of their
predominance in pattern recognition and classification when contrasted
with other conventional statistical methodologies.
For exploring this with the assistance of machine learning algorithms,
we gathered a dataset of vascular heart disease from Kaggle [3]. It consists
of three categories of input features, namely, objective consisting of real
statistics, examination comprising of results of clinical assessment, and
subjective handling patient related information.
Based on this information, we applied various machine learning algo-
rithms and analyzed the accuracy achieved by each of the methods. For
this report, we have used Naive Bayes, Decision Tree, Random Forest,
and various combinations of using these algorithms in order to further
improve the accuracy. Numerous scientists have just utilized this data-
set for their examination and delivered their individual outcomes. The
target of gathering and applying methods on this dataset is to improve
the precision of our model. For this reason, we gave different algorithms
a shot on this dataset and successfully improved the accuracy of our
model.
We suggested using the ensemble method [2] which is the process of
solving a particular computer intelligence problem by strategically com-
bining multiple models, such as classifiers or experts. Additionally, we
have take the wrongly classified records by all the methods and tried to
understand the reason for wrong classification and modify it mathemat-
ically in order to give accurate results and improve model performance
continuously.

1.1.1 Scope and Motivation


Exploring different classification and integration algorithms to perceive
teams in an exceedingly real-world health record data stored electronically
having high dimension capacity and find algorithms that detect clusters
within reasonable computation time and ability to scale with increasing
data size/features while giving the highest possible accuracy. Diagnosis is
a challenging process that, as of today, involves many human-to-human
interactions. A machine would increase the speed of giving a diagnosis and
lead to a more rapid treatment decision and would be able to detect rare
events easier than humans.
4 Bioinformatics and Medical Applications

1.2 Literature Review


Over the years, many strategies have been used regarding data pro-
cessing and model variability in the field of cardiovascular diagnostics.
Authors in [4] show that splitting the data into 70:30 ratio using for
tutoring and examination purpose and 10-fold cross proofing putting
logistic regression into operation improved the accuracy of the UCI
dataset to 87%.
Authors in [5] have used ensemble classification techniques using mul-
tiple classifiers followed by score level ensemble for improving the pre-
diction accuracy. They pointed out that maximum voting produces the
highest level of development. This functionality is enhanced by using fea-
ture selection.
Hybrid approach has been proposed in [6] by consolidating Random
Forest along with Linear method leading to a precision of around 90%.
In [7], Vertical Hoeffding Decision Tree (VHDT) was used accuracy of
85.43% using 10-fold cross-validation.
Authors in [8] outline a multi-faceted voting system that can anticipate
the conceivable presence of coronary illness in humans. It employs four
classifiers which are SGD, KNN, Random Forest, and Logistic Regression
and joins them in a consolidated way where group formation is performed
by a large vote of the species making 90% accuracy.
The strategy utilized in [9] finds these features by way of correlation
which can help enhanced prediction results. UCI coronary illness dataset
is used to evaluate the result with [6]. Their proposed model accomplished
precision of 86.94% which outflanks Hoeffding tree technique which
reported accuracy of 85.43%.
Different classifiers, mainly, Decision Tree, NB, MLP, KNN, SCRL,
RBF, and SVM have been utilized in [10]. Moreover, integrated methods
of bagging, boosting, and stacking have been applied to the database.
The results of the examination demonstrate that the SVM strategy uti-
lizing the boosting procedure outflanks the other previously mentioned
techniques.
It was exhibited in [11] after various analyses that, if we increase the
feature space of RF algorithm while using forecasts and probability of a
tuple to belong to a particular class from Naive Bayes model, then we could
increase the precision achieved in identifying the categories, by and large.
Studies in [12] suggested that Naive Bayes gives best result when combined
with Random Forest. Also, when KNN is combined with RF or RF+NB, the
errors remain same suggesting that it is the dominating method.
Probabilistic Optimization of ML for HDP 5

Authors in [13] compared the precision of various models in classifica-


tion of coronary disease taking Kaggle dataset of 70,000 records as input. The
algorithms used were Random Forest, Naive Bayes, Logistic Regression, and
KNN among whom Random Forest was the winner with an accuracy of 73%.
Creators in [14] have fused the results of the AI examination applied on
different informational collections focusing on the CAD illness. Common
features are compared and extracted from different datasets, and advanced
concepts such as fast decision trees and pruned C4.5 tree are administered
on it resulting in higher classification accuracy.
Ensemble Optimization is applied in [15] wherein fuzzy logic is used for
extraction of features, Genetic Algorithm for reducing them and Neural
Network for classifying them. The results have been tested on a sample of
size 30 and accuracy achieved is 99.97%
Based on the detailed research discussed above, we analyze by compar-
ing different strategies suggested by different authors in their respective
papers. This helps us to quickly understand where we stand presently with
respect to these techniques and how they need to mature further.

1.2.1 Comparative Analysis


Please refer to Table 1.1 to get a comparative study of the methods and
understand the strengths and weakness of each. This helped us immensely
in designing our prototype.

1.2.2 Survey Analysis


Analyzing the literature, we came to know the scope and limitations of
prediction techniques. In present days, heart disease rate has significantly
increased and the reason behind deaths in the United States. National
Heart, Lung, and Blood Institute states that cardiovascular breakdown is a
problem in the typical electrical circuit of the heart and siphoning power.
The incorporation of methodologies with respect to information
enhancement and model variability has been coordinating preparing and
testing of AI model, Cleveland dataset from the UCI file utilized a ton of
time since that is a checked dataset and is generally utilized in the prepa-
ration and testing of ML models. It has 303 tuples and 14 attributes that
depend on the factors that are believed to be associated with an increased
risk of cardiovascular illness. Additionally, the Kaggle dataset of coronary
illness containing records of 70,000 and 12 patient attributes is also used
for the purpose of training and assessment.
6
Table 1.1 Comparative analysis of prediction techniques.
Title Problem Solution Result
“Machine Learning Inspect and look at the precision Logistic regression, support Ten-fold cross-validation
Algorithms with ROC of four diverse AI calculations vector machine, stochastic applied to maximize
Curve for Predicting which take ROC curve for gradient boosting, and ROC. Logistic regression
and Diagnosing the anticipating and diagnosing random forest are applied performs the best with
Heart Disease” [4] cardiovascular ailment on UCI dataset and accuracy 87% accuracy.
analyzing the 14 indicators of was compared using ROC
the UCI Cardiac Dataset. curve.
“Improving the accuracy 1. Increase the efficiency of weak Research is done on ensemble 1. Majority voting produces
of prediction of heart classification algorithms. techniques such as bagging, highest improvement in
disease risk based on 2. Usage on clinical dataset to boosting, majority vote, accuracy.
ensemble classification show utility to foresee illness and stacking, and results are 2. Feature FS2 along with
techniques” [5] at beginning stage. assessed. They are further majority voting yields best
upgraded by using feature results.
selection.
Bioinformatics and Medical Applications

“Effective heart disease Improve precision in forecast of Presented a method called the HRFLM ended up being
prediction using hybrid cardiovascular illness Hybrid Random forest with quite precise in the
machine learning Linear Model (HRFLM). prediction of heart illness.
techniques” [6] It utilizes ANN with back
propagation taking as input
13 clinical features
(Continued)
Table 1.1 Comparative analysis of prediction techniques. (Continued)
Title Problem Solution Result
“A classification for Characterize information Hoeffding tree deals with Results exhibit an accuracy
patients with heart for patients with coronary increasing tree proofs and of around 85% and the
disease based on sickness and assessment of the capacity to gain from processing error value of
Hoeffding tree” [7] models used to foresee steam of huge information 14%.
coronary disease patients. assuming that the
distribution sample remains
constant with time.
“Heart Disease Detection Give more certainty and Data was divided in 80:20 A precision of 90% was
Using Machine precision to the Specialist’s ratio for training and testing achieved based on the hard
Learning Majority analysis considering the face and a combination of four voting ensemble model.
Voting Ensemble that the model is prepared algorithms (SGD, KNN,
Method” [8] using real information of RF, and LR) was used by
healthy and sick patients. majority voting method.
“Robust Heart Disease Coronary illness prediction with Selected significant attributes Achieved accuracy
Prediction: A Novel accessible clinical information by using correlation of 86.94% which
Approach based on is one of the huge difficulties accompanied with RF outperforms the 85%
Significant Feature and for scientists. and Stratified K-fold precision reported by
Ensemble Learning cross-validation. Hoeffding tree method.
Model” [9]
Probabilistic Optimization of ML for HDP

(Continued)
7
8
Table 1.1 Comparative analysis of prediction techniques. (Continued)
Title Problem Solution Result
“A Comprehensive Compare the accuracy of Various classifiers, namely, SVM method using the
Investigation and different data mining DT, NB, MLP, KNN, SCRL, boosting technique
Comparison of classification schemes, RBF, and SVM, have been outperforms the other
Machine Learning employing Ensemble Machine employed. aforementioned methods.
Techniques in the Learning Techniques, for
Domain of Heart forecasting heart ailments.
Disease” [10]
“Increasing Diversity in Improve the classification Enhanced variety of Random Proposed method works
Random Forests Using accuracy. Forests put forward that more efficiently in
Naive Bayes” [11] was constructed by pseudo comparison to other
randomly picking up certain advanced ensemble
attributes and incorporating methods.
Naive Bayes estimation into
the training and segregation
Bioinformatics and Medical Applications

category.
“Improved Classification Increase classification accuracy. Utilized average class Naive Bayes combined with
Techniques by probabilities to concatenate Random Forest has ended
Combining KNN Naive Bayes, KNN, and up being the ideal blend.
and Random Forest Random Forest.
with Naive Bayesian
Classifier” [12]
(Continued)
Table 1.1 Comparative analysis of prediction techniques. (Continued)
Title Problem Solution Result
“Comparison of Machine Examination of ML models on Used Cross Industry Standard Random Forest outperforms
Learning Models forecast of cardiovascular Process for Data Mining and other models by achieving
in Prediction of illness utilizing patients’ four algorithms, namely, an accuracy of 73%,
Cardiovascular Disease cardiovascular hazard factors. RF, NB, LR, and KNN, were sensitivity of 65%, and
Using Health Record used. specificity of 80%.
Data” [13]
“Feature Analysis of Combine results of the AI Common features are Precision of the collected
Coronary Artery Heart examination applied on compared and extracted dataset is around 80%.
Disease Data Sets” [14] various datasets centering on from different datasets
CAD. and fast decision trees
and pruned C4.5 tree are
administered on it.
“Cardio Vascular Disease To construct the detection system Dataset is categorized via the The accuracy is elevated up
Classification Ensemble based on fuzzy logic algorithm usage of fuzzy logic, genetic to 99.97% and the error
Optimization Using for extraction of features algorithm, and, moreover, rate is decreased to 0.987%.
Genetic Algorithm and making use of neural network training is performed by
Neural Network”[15] classifier of heart disease. neural network by the
extracting features.
Probabilistic Optimization of ML for HDP
9
10 Bioinformatics and Medical Applications

Experimental testing and the use of AI indicate that supervised learning


is certain calculation exceeds an alternate calculation for a particular issue
or for a specific section of the input dataset; however, it is not phenomenal
to discover an independent classifier that accomplishes excellent perfor-
mance the domain of common problems.
Ensembles of classifiers are therefore produced using many techniques
such as the use of separate subset of coaching dataset in a sole coaching
algorithm, utilizing distinctive coaching on a solitary coaching algorithm
or utilizing multiple coaching strategies. We learnt about the various tech-
niques employed in ensemble method like bagging, boosting, stacking,
and majority voting and their affect on the performance improvement.
We also learned about Hoeffding Tree which is the first distributed algo-
rithm for studying decision trees. It incorporates a novel way of dissecting
decision trees with vertical parallelism. The development of effective inte-
gration methods is an effective research field in AI. Classifier ensembles
are by and large more precise than the individual hidden classifiers. This
is given the fact that several learning algorithms use local optimization
methods that can be traced to local optima.
A few methodologies find those features by relationship which can help
successful predictive results. This used in combination with ensemble tech-
niques achieves best results. Various combinations have been tried and
tested and none is the standardized/best approach. Each technique tries
to achieve a better accuracy than the previous one and the race continues.

1.3 Tools and Techniques


Machine learning and information gathering utilizes ensembles on one or
more learning algorithms to get different arrangement of classifiers with
the ability to improve performance. Experimental studies have time and
again proven that it is unusual to get one classifier which will perform the
best on the general problem domain. Hence, ensemble of classifiers is often
produced using any of the subsequent methods.

• Splitting the data and using various chunks of the training


data for single machine learning algorithm.
• Training one learning algorithm using multiple training
parameters.
• Using multiple learning algorithms.

Key ideas such as the data setup, data classification, data mining models,
and techniques are described below.
Probabilistic Optimization of ML for HDP 11

1.3.1 Description of Dataset


The source of data is Kaggle dataset for cardiovascular diseases which
contains 70,000 records with patient information. The attributes include
objective information, subjective information, and results of medical
examination. Table 1.2 enumerates the 12 attributes.
A heatmap is a clear representation of data where data values are rep-
resented as colors. It is used to get a clear view of the relationship between
the features. The coefficient of relationship is a factual proportion of the
strength of the association between the general developments of two fac-
tors with values going between −1.0 and 1.0. A determined number more
prominent than 1.0 or less than −1.0 indicates a slip-up in the relationship
estimation. Figure 1.1 represents the heat map for the input parameters of
the defined dataset.

Table 1.2 Dataset attributes.


Feature name Variable name Value type
Age Age No. of days
Height Height Centimeters
Weight Weight Kilograms
Gender Gender Categories
Systolic blood pressure Ap_hi Integer
Diastolic blood pressure Ap_lo Integer
Cholesterol Cholesterol 1: Standard; 2: Above standard;
3: Well above standard.
Glucose Glu 1: Standard; 2: Above standard;
3: Well above standard.
Smoking Smoke Dual
Alcohol intake Alco Dual
Physical activity Active Dual
Presence or absence of cardio Dual
CVDs
12 Bioinformatics and Medical Applications

1.0
age 1 –0.023 –0.0056 0.054 0.021 0.018 0.15 0.099 –0.048 –0.03 –0.01 0.24

gender –0.023 1 0.023 0.16 0.006 0.015 –0.036 –0.02 0.34 0.17 0.0058 0.0081

height –0.056 0.023 1 –0.009 –2e-05 –0.00011–0.0038 –0.0022 0.0056 0.0025 0.0016 –0.0042 0.8

weight 0.054 0.16 –0.009 1 0.031 0.044 0.14 0.11 0.068 0.067 –0.017 0.18

ap_hi 0.021 0.006 –2e-05 0.031 1 0.016 0.024 0.012 –0.00092 0.0014 –3.7e-05 0.054 0.6

ap_lo 0.018 0.015 –0.00011 0.044 0.016 1 0.024 0.011 0.0052 0.011 0.0048 0.066

cholesterol 0.15 –0.036 –0.0038 0.14 0.024 0.024 1 0.45 0.01 0.036 0.01 0.22
0.4
gluc 0.099 –0.02 –0.0022 0.11 0.012 0.011 0.45 1 –0.0047 0.011 –0.0067 0.089

smoke –0.048 0.34 0.0056 0.068 –0.00092 0.0052 0.01 –0.0047 1 0.34 0.026 –0.016
0.3
alco –0.03 0.17 0.0025 0.067 0.0014 0.011 0.036 0.011 0.34 1 0.025 –0.0073

active –0.01 0.0059 0.0016 –0.017 –3.7e-05 0.0048 0.01 –0.0067 0.026 0.025 1 –0.036

cardio 0.24 0.0081 –0.0042 0.18 0.054 0.066 0.22 0.089 –0.016 –0.0073 –0.036 1 0.0

age gender height weight ap_hi ap_lo cholesterol gluc smoke alco active cardio

Figure 1.1 Heatmap of input attributes.

Figures 1.2, 1.3, 1.4, and 1.5 display the distribution of some of the input
values such as age, gender, presence of cardiovascular disease, and choles-
terol type.

1.3.2 Machine Learning Algorithm


Post analysis of the data, it was broken up into training (80%) and testing
(20%) sets, respectively. This is necessary to accept the power of the model
to summarize new details. A few classifier models have been tested which
have been explained as follows.

age in days

0.00025

0.00020

0.00015

0.00010

0.00005

0.00000
10000 12000 14000 16000 18000 20000 22000 24000
age

Figure 1.2 Age distribution.


Probabilistic Optimization of ML for HDP 13

0.0 35014
1.0 34977
Name: cardio, dtype: int64

35000

30000

25000

20000
count

15000

10000

5000

0
0.0 1.0
cardio

Figure 1.3 Presence of cardiovascular disease.

30000
Frequency of with and without disease

cardio
0.0
1.0
25000

20000

15000

10000

5000

0
1.0 2.0 3.0
Cholesterol type

Figure 1.4 Cholesterol type distribution.

0.5

0.4
cardio

0.3

0.2

0.1

0.0
1 2
gender

Figure 1.5 Gender distribution.


14 Bioinformatics and Medical Applications

1.3.3 Decision Tree


Decision Trees are amazing and well-known devices which are used for
classification and forecasting. It is a tree based classifier wherein nodes rep-
resent a test on one attribute, leaves indicate the worth of the target attri-
bute, edge represents split of 1 attribute and path is a dis junction of test to
form the ultimate decision.
The current implementation offers two stages of impurity (Gini impu-
rity and entropy) and one impurity measure for regression (variability).
Gini’s impurity refers to the probability of a misdiagnosis of a replacement
variate, if that condition is new organized randomly in accordance with
the distribution of class labels from the information set. Bound by 0 occurs
when data contains only one category. Gini Index is defined by the formula
c

IG = 1 − ∑p
j =1
2
j

Entropy is defined as
c

IH = − ∑ P log
j =1
j 2 pj

where pj is the proportion of samples that belong to class c for a specific node.
Gini impurity and entropy are used as selection criterion for decision
trees. Basically, they assist us with figuring out what is a decent split point
for root/decision nodes on classification/regression trees. Decision trees
utilizes the split point to split on the feature resulting in the highest infor-
mation gain (IG) for a given criteria which is referred to as Gini or entropy.
It is based on the decrease in entropy after a dataset is split on an attribute.
A number of the benefits of decision tree are as follows:

• It requires less effort to process data while it is done in advance.


• It does not require standardization and data scaling.
• Intuitive and simple to clarify.

However, it has some disadvantages too, as follows:

• Minor changes in the data can cause major structural


changes leading to instability.
Probabilistic Optimization of ML for HDP 15

• Sometimes math can be very difficult in some algorithms.


• It usually involves more time for training.
• It is very expensive as the complexity and time taken is too
much.
• Not adequate on regression and predicting continuous values.

1.3.4 Random Forest


The Random Forest, just as its name infers, increases the number of indi-
vidual decision trees that work in conjunction. The main idea behind a
random forest is the wisdom of the masses. An enormous number of mod-
erately unrelated trees functioning as a council will surpass any existing
models. Random Forest allows us to change the contributions by tuning
the boundaries like basis, depth of tree, and maximum and minimum
leaf. It is a supervised machine learning algorithm, used for both classi-
fication and regression. It makes use of bagging and feature randomness
while assembling each singular tree to try to make an uncorrelated forest
whose expectation is to be more precise than that of any individual tree.
The numerical clarification of the model is as given:

1. Let D be a collection of dataset used for purpose of training


D = (x1, y1) … (xn, yn).
2. Let w = w1(x); w2(x) … wk(x) be an ensemble of weak
classifiers.
3. If every wk is a decision tree, then the parameters of the tree
are described as

θ = θ k1 ,θ k2 ,θ kp

4. Output of each decision tree is a classifier wk(x) = w(x|θk).


5. Hence, Final Classification f(x) = Majority Voting of wk(X).

Figure 1.6 gives a pictorial representation of the working of random


forest.
Some of the advantages of Random Forest algorithm are as follows:

• Reduces overfitting problem.


• Solves both clasification and regression problems.
• Handles missing values automatically.
• Stable and robust to outliers.
16 Bioinformatics and Medical Applications

Training Training Training


Data Data Data
1 2 n

Training
set
Decision Decision Decision
Tree Tree Tree
1 2 n

Voting
Test Set (averaging)

Prediction

Figure 1.6 Random forest algorithm.

Some of the disadvantages are as follows:


• Complexity
• Longer training period.

1.3.5 Naive Bayes Algorithm


Naive Bayes is a fantastic AI calculation utilized for prediction which
depends on Bayes Theorem. Bayes Theorem expresses that given a theory
H and proof E, the relationship between possibility of pre-proof likelihood
P(H) and the possibility of the following theoretical evidence P (H|E) is

P( E|H ) ∗ P( H )
P( H|E ) =
P( E )

Assumption behind Naive Bayes classifiers is that the estimation of a


unique element is not dependent on the estimation of some different ele-
ment taking the class variable into consideration. For instance, a product
may be regarded as an apple if possibly it is red in color, round in shape,
and around 10 cm wide.
A Naive Bayes classifier looks at all these highlights to offer inde-
pendently to the chances that this product is an apple, although there is a
potential relationship between shading, roundness, and dimension high-
lights. They are probabilistic classifiers and, subsequently, will compute the
Probabilistic Optimization of ML for HDP 17

likelihood of every classification utilizing Bayes’ hypothesis, and the classi-


fication with the most elevated likelihood will be the yield.
Let D be the training dataset, y be the variable for class and the attributes
represented as X hence according to Bayes theorem

P( X|y ) ∗ P( y )
P( y|X ) =
P( X )

where

X = (x1, x2, …. xn)

So, replacing the X and applying the chain rule, we get

P( x1|y ) ∗ P( x 2|y ) ∗……∗ P( xn |y ) ∗ P( y )


P( y|X ) =
P( X )

Since the denominator remains same, removing it from the dependency


n
P( y|x1 ,x 2 ,xn )α P( y ) iΠ=1 P( xi |y )

Therefore, to find the category y with high probability, we use the fol-
lowing function:
n
y = arg max P( y )iΠ=1 P( xi |y )

Some of the advantages of Naive Bayes algorithm are as follows:

• Easy to execute.
• Requires a limited amount of training data to measure
parameters.
• High computational efficiency.

However, there are some disadvantages too, as follows:

• It is thought that all aspects are independent and equally


important which is virtually impossible in real applications.
• The tendency to bias when increasing the number of train-
ing sets.
18 Bioinformatics and Medical Applications

1.3.6 K Means Algorithm


K means, an unsupervised algorithm, endeavors to iteratively segment the
dataset into K pre-characterized and nonoverlapping data groups with
the end goal that one data point can have a place with just one bunch. It
attempts to make the intra-group data as similar as could reasonably be
expected while keeping the bunches as various (far) as could be expected
under the circumstances. It appoints data points to a cluster with the end
goal that the entirety of the squared separation between the data points
and the group’s centroid is at the minimum. The less variety we have inside
bunches, the more homogeneous the data points are inside a similar group.

1.3.7 Ensemble Method


Ensemble method is the process by which various models are created and
consolidated in order to understand a specific computer intelligence prob-
lem. This prompts better prescient performance than could be acquired
from any of the constituent learning models alone. Fundamentally, an
ensemble is a supervised learning method for joining various weak learners/
models to deliver a strong learner. Ensemble model works better, when we
group models with low correlation. Figure 1.7 gives the various ensemble
methods which are in use. Following are some of the techniques used for
ensemble.

Stacking
ex. Voting
Ensemble

Use : improve predictions

Ensemble
learnings

Sequential Parallel
Ensemble Ensemble
learning learning
(Boosting) (Bragging)
Ex. Adaboost, Ex. Random Forest,
Stochastic Gradient Bagged Decision
Boosting Trees, Extra Trees

Use : Reduce the bias Use : Decrease variance

Figure 1.7 Ensemble methods.


Probabilistic Optimization of ML for HDP 19

1.3.7.1 Bagging
Bagging or bootstrap aggregation assigns equal weights to each model in the
ensemble. It trains each model of the ensemble separately using random sub-
set of training data in order to promote variance. Random Forest is a classi-
cal example of bagging technique where multiple random decision trees are
combined to achieve high accuracy. Samples are generated in such a manner
that the samples are different from each other and replacement is permitted.

1.3.7.2 Boosting
The term “Boosting” implies a gathering of calculations which changes a
weak learner to strong learner. It is an ensemble technique for improving
the model predictions of some random learning algorithm. It trains weak
learners consecutively, each attempting to address its predecessor. There
are three kinds of boosting in particular, namely, AdaBoost that assigns
more weight to the incorrectly classified data that would be passed on to
the next model, Gradient Boosting which uses the residual errors made by
previous predictor to fit the new predictor, and Extreme Gradient Boosting
which overcomes drawbacks of Gradient Boosting by using parallelization,
distributed computing, out-of-core computing, and cache optimization.

1.3.7.3 Stacking
It utilizes meta-learning calculations to discover how to join the forecasts
more readily from at least two basic algorithms. A meta model is a two-level
engineering with Level 0 models which are alluded to as base models and
Level 1 model which are alluded to as Meta model. Meta-model depends
on forecasts made by basic models on out of sample data. The yields from
the base models utilized as contribution to the meta-model might be in the
form of real values in the case of regression and probability values in the
case of classification. A standard method for setting up a meta-model train-
ing database is with k-fold cross-validation of basic models.

1.3.7.4 Majority Vote


Each model makes a forecast (votes) in favor of each test occurrence and
the final output prediction is the one that gets the greater part of the votes.
Suppose for a specific order issue we are given three diverse classification
rules, c1(X); c2(X); c3(X), we join these rules by majority voting as

C(X) = mode(c1(X); c2(X); c3(X))


20 Bioinformatics and Medical Applications

1.4 Proposed Method


1.4.1 Experiment and Analysis
Naive Bayes multi-model decision-making system, which is our proposed
method uses ensemble method of type majority voting using a combina-
tion of Naive Bayes, Decision Tree, and Random Forest for analytics in the
database of heart disease patients and attains an accuracy that outperforms
any of the individual methods. Additionally, it uses K means along with the
combination of the above methods for further increase the accuracy.
The data pertains to Kaggle dataset for cardiovascular disease which
contains 12 attributes. Whether or not cardiovascular disease is present is
contained in column carrying target value which is a binary type having
values 0 and 1 indicating absence or presence respectively. There are a total
of 70,000 records having attributes for age, tallness, weight, gender, systolic
and diastolic blood pressure, cholesterol, glucose, smoking, alcohol intake,
and physical activity.
Training and testing data is divided in the ratio 70:30. During training
and testing, we tried various combinations to see their effect of accuracy of
predictions. Also, we took data in chunks of 1000, 5000, 10,000, 50,000 and
70,000, respectively, and observed the change in patterns. We tried various
combinations to check on the accuracy.

• NB: Only Naive Bayes algorithm is applied.


• DT: Only Decision Tree algorithm is applied.
• RF: Only Random Forest algorithm is applied.
• Serial: Naive Bayes followed by Random Forest followed by
Decision tree (in increasing order of individual accuracy).
• Parallel: All three algorithms are applied in parallel and
maximum voting is used.
• Prob 60 SP: If probability calculated by Naive Bayes is greater
than 60% apply serial method else apply parallel.
• PLS: First parallel then serial is applied for wrong classified
records.
• SKmeans: Combination of Serial along with K means.
• PKmeans: Combination of Parallel along with K means.

From this analysis, we found the PKmeans method to be the most effi-
cient. Though serial along with K means achieves the best accuracy for
training data, it is not feasible for real data where target column is not
present. The reliability on any single algorithm is not possible for correctly
Probabilistic Optimization of ML for HDP 21

classifying all the records; hence, we use more suitable ensemble method
which utilizes the wisdom of the crowd. It uses the ensemble method of
the type majority voting which includes adding the decisions in favor of
crisp class labels from different models and foreseeing the class with the
most votes.
Our goal is to achieve the best possible accuracy which surpasses the
accuracy achieved by the individual methods. Figures 1.8 to 1.11 show the
confusion matrix plotted by Naive Bayes, Random Forest, and Decision
Tree individually as well as their ROC curve.

Naive bayes_cm

9234 1251
0

7355 3158
1

0 1

Figure 1.8 NB confusion matrix.

random forest tree_cm

7687 2798
0

3207 7306
1

0 1

Figure 1.9 RF confusion matrix.


22 Bioinformatics and Medical Applications

decision Tree_cm

6654 3831
0

3880 6633
1

0 1

Figure 1.10 DT confusion matrix.

ROC Curve Analysis


1.0

0.9
0.8

0.7
True Positive Rate

0.6
0.5

0.4

0.3
0.2
GaussianNB, AUC=0.691
0.1 DecisionTreeClassif ier, AU=0.632
0.0 RandomForestClassif ier, AU=0.775

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
False Positive Rate

Figure 1.11 ROC curve analysis.

1.4.2 Method
We observed that by applying ensemble method of type majority voting on
the algorithms Decision tree, Random Forest, Naive Bayes, and K means,
we could achieve an accuracy of 91.56%. To additionally improve the pre-
cision, we proposed the following algorithm. The design of the proposed
method is as given in Figure 1.12.
Probabilistic Optimization of ML for HDP 23

Dataset Parrellley
Random Forest

A C B Serially
Check with all algorithm
NBpred<-naive bayes,
K-means clustering Naive bayes Decision Tree Random forest DTpred<=decision<-random forest
prediction, kmeansPred<=kmeans
Apply
prediction
naive
bayes

Voting with
classif ication
Apply algorithm on dataset . calculate accuracy. winner will
Check
output with be the max
dataset Yes value of
No classif ication

1 2 3
Classify Classify
Apply 3
Apply DT Apply RF K-means
2
1 Calculate accuracy

Figure 1.12 Proposed architecture.

Algorithm 1.1 Probabilistic optimization.

initialization
d ← dataset
a1 ← Naive_Bayes_output ← ApplyNaiveBayes(d)
a2 ← Decision_tree_output ← ApplyDesisionTree(d)
a3 ← Random_tree_output ← ApplyRandomForest(d)
a4 ← K_Means_output ← ApplyKmeans(d)
winner(0,1) ← Voting(a1, a2, a3, a4)
op ← winner_of_max_count(0,1)
if op ≠ desired_output then
Probability_calculation of each column with output 0 or 1

ci ← probability(0,1)
end

For each value in ci


count ← ci/2
For k to count
Add the probability (Find the max column with which proba-
bility matches)
Number of columns selected as ti
24 Bioinformatics and Medical Applications

wi ← Weightage of selected columns


αi ← Append the weightage with the input of data

Find mean square error with the training and find lowest (MSE) parame-
ter. Calculate the Euclidean distance

( xi − x j )2 + ( zi − z j )2

Find the minimum distance using this formula.


If probability of data > 0.5 and MSE < 0.5 and ED < 0.2
Classify as 1
else
Classify as 0

The following block diagram explains the flow of Algorithm 1.1.

Kaggle Dataset for Cardiovascular Disease

Apply Ensemble of 4 algorithms by majority voting

Store wrongly classif ied records in separate dataset

Probability of each column with output stored

Select columns with maximum probability

Calculate and append weights of the columns

Using probability, MSE and ED classify record as 0 or 1

Enhanced Accuracy
Probabilistic Optimization of ML for HDP 25

The working of the algorithm is explained briefly as follows.

1. The ensemble method of the four algorithms (Decision Tree,


Random Forest, Naive Bayes, and K Means) is applied by
majority voting and classification is obtained on presence or
absence of cardiopathy.
2. The wrongly classified records are stored in a separate
dataset.
3. The probability of each column with output is calculated and
stored. For example, considering age, the probability of heart
disease for age greater than 45 is more than otherwise.
4. We calculate those columns for which probability is
maximum.
5. Only select these columns for further analysis.
6. Calculate the weights of these columns using formula y =
mx + c for linear data using Multiple linear regression.
7. For non-linear data wherein the chances of misclassification
are more, more complex functions such as tanh, sigmoid,
and relu are used for calculating the weights.
8. Append the weights to the column at the time of classification.
9. Calculate the mean square error and Euclidean distance.
10. Finally, based on probability, mean square error and
Euclidean distance, we classify the records as 1 or 0 which
indicates presence/absence of heart disease.
11. Hence, accuracy achieved is higher than using the classical
ensemble method.

Hence, our proposed methodology achieves a precision that not only


surpasses the individual methods but also overshoots the combination
method and the precision achieved thus is quite competitive.

1.5 Conclusion
An ensemble of classifiers is a collection of classification models whose
singular forecasts are joined, by means of weighted or unweighted casting
a ballot to dole out a classification mark to each new pattern. There is no
single best method of creating successful ensemble methods and is being
actively researched. Predicting heart disease has been a topic of interest
for researchers for a long time. We therefore check the accuracy of the
heart disease prediction using an ensemble of classifiers. For our study, we
26 Bioinformatics and Medical Applications

chose the best performing algorithms whose individual predictions made


them classify as strong classifiers. We used a combination of Decision Tree,
Naive Bayes, Random Forest, and K means algorithm. Since no single algo-
rithm can guarantee maximum performance under all circumstances, we
use the majority voting method to best classify the records. The dataset
used for this purpose was Kaggle dataset for cardiovascular disease which
has 70,000 records on which we achieved an accuracy of 91.56%.
However, we realized the potential of further increasing the accuracy
by analyzing those records which were wrongly classified by all/most of
the algorithms. The reason for it could be high bias, high variance, low
precision, or low recall. So, we identified those columns/attributes which
were causing the data to be misclassified by assigning probabilities to each
tuple in the column and combining those probabilities by using condi-
tional probability. Hence, we focused only on those columns which would
result in accurate prediction by increasing the weight of those columns and
feature reduction. Hence, by using the probabilistic approach, we could
effectively remove the anomalies and increase the prediction accuracy.

References
1. Heart Disease Facts Statistics, Centers for Disease Control and Prevention,
[Online], Available: https://www.cdc.gov/heartdisease/facts.htm. [Accessed:
27-Apr-2019].
2. Thenmozhi, K. and Deepika, P., Heart disease prediction using classification
with different decision tree techniques. Int. J. Eng. Res. Gen. Sci., 2, 6, 6–11,
2014.
3. Kaggle Dataset, Cardiovascular Disease dataset, Available: https://www.kaggle.
com/sulianova/cardiovascular-disease-dataset.
4. Kannan, R. and Vasanthi, V., Machine learning algorithms with ROC curve
for predicting and diagnosing the heart disease, in: Soft Computing and
Medical Bioinformatics, pp. 63–72, Springer Singapore, Jun 2018.
5. Latha, C.B.C. and Jeeva, S.C., Improving the accuracy of prediction of heart
disease risk based on ensemble classification techniques. Inform. Med.
Unlocked, 16, 100203, 2019.
6. Mohan, S., Thirumalai, C., Srivastava, G., Effective heart disease prediction
using hybrid machine learning techniques. IEEE Access, 7, 81542–81554,
2019.
7. Thaiparnit, S., Kritsanasung, S., Chumuang, N., A classification for patients
with heart disease based on hoeffding tree, in: 2019 16th International Joint
Conference on Computer Science and Software Engineering (JCSSE), Jul 2019,
IEEE.
Probabilistic Optimization of ML for HDP 27

8. Atallah, R. and Al-Mousa, A., Heart Disease Detection Using Machine


Learning Majority Voting Ensemble Method. 2019 2nd International
Conference on new Trends in Computing Sciences (ICTCS), 9-11 Oct. 2019.
9. Alim, M.A. and Habib, S., Robust Heart Disease Prediction: A Novel
Approach based on Significant Feature and Ensemble learning Model. 2020
3rd International Conference on Computing, Mathematics and Engineering
Technologies (iCoMET).
10. Pouriyeh, S., A Comprehensive Investigation and Comparison of Machine
Learning Techniques in the Domain of Heart Disease. 22nd IEEE Symposium
on Computers and Communication (ISCC 2017): Workshops - ICTS4eHealth,
2017.
11. Aridas, C., Kotsiantis, S., Vrahatis, M., Increasing Diversity in Random
Forests Using Naive Bayes. IFIP International Conference on Artificial
Intelligence Applications and Innovations, September 2016.
12. Gayathri Devi, R. and Sumanjani, P., Improved classification techniques by
combining KNN and Random Forest with Naive Bayesian Classifier. IEEE
International Conference on Engineering and Technology (ICETECH), 20th
March 2015.
13. Maiga, J., Hungilo, G.G., Pranowo, Comparison of Machine Learning Models
in Prediction of Cardiovascular Disease Using Health Record Data. 2019
International Conference on Informatics, Multimedia, Cyber and Information
System (ICIM-CIS).
14. EI-Bialy, R., Salamay, M.A., Karam, O.H., Khalifa, M.E., Feature analysis of
coronary artery heart disease data sets. Proc. Comput. Sci., 65, 459–68, 2015.
15. Jagwant, S. and Rajinder, K., Cardiovascular disease classification ensem-
ble optimization using genetic algorithm and neural network. Indian J. Sci.
Technol., 9, S1, 2016.
2
Cancerous Cells Detection in
Lung Organs of Human Body:
IoT-Based Healthcare 4.0 Approach
Rohit Rastogi1*, D.K. Chaturvedi2, Sheelu Sagar3, Neeti Tandon4
and Mukund Rastogi5

Department of CSE, ABES Engineering College Ghaziabad, U.P., India


1

Dept. of Electrical Engineering, Dayalbagh Educational Institute, Agra, India


2

3
Amity International Business School, Amity Univ., Noida, U.P., India
4
Vikram University, Ujjain, M.P., India
5
BTech CSE Third Year, Department of CSE, ABES Engineering College Ghaziabad,
U.P., India

Abstract
Old age cancer was the cause of death. Forty percent of cancers are found in people
over the age of 65. Lung cancer is one of these potentially deadly cancers. Young-,
middle-, and old-aged patients, men who are chronic smokers or women who
have never smoked are all victims of the disease. Therefore, a classification of lung
cancer based on the associated risks (high risk, low risk, high risk) is required.
The study was conducted using a lung cancer classification scheme by study-
ing micrographs and classifying them into a deep neural network using machine
learning (ML) framework. Tissue microscopy images are based on the risk of
using deep concealed neural networks. Neural Networks–Deep Conversion Deep
Neural Networks are only used for classification (photo search) based on primary
image (for example, displayed name) and similarity.
After that, scene recognition is performed on the stage. These algorithms help
to recognize faces, tumors, people, road signs, plastics, and different perspec-
tive of visual information. The productivity of circular networks in image detec-
tion is one of the primary causes why the world has stirred to proficiency. Their
in-depth learning is a major advance in computer vision (CV) that has important

*Corresponding author: [email protected]

A. Suresh, S. Vimal, Y. Harold Robinson, Dhinesh Kumar Ramaswami and R. Udendhran (eds.)
Bioinformatics and Medical Applications: Big Data Using Deep Learning Algorithms, (29–46)
© 2022 Scrivener Publishing LLC

29
30 Bioinformatics and Medical Applications

applications in car driving, robotics, drones, security, medical diagnostics, and


treatment of blindness.

Keywords: Deep neural network, lung cancer, CellProfiler, CADe Server,


big data analytics in healthcare

2.1 Introduction
NSCLC includes three types of cancer: squamous cell carcinoma, ade-
nocarcinoma, and large cell carcinoma derived from lung tissue.
Adenocarcinoma is a slow-growing cancer that first appears in the outer
region of the lung. Lung cancer is more common in smokers, but the most
well-known sort of lung cancer in nonsmokers. Squamous cell carcinoma
is more normal in the focal point of the lung and all the more generally in
smokers, but large cell carcinoma can be found anywhere in the lung tissue
and grows faster than adenomas and lung cancer [9, 20].
According to Choi, H. and his team members, lung cancer risk classifi-
cation models with gene expression function are very interesting. Change
previous models based on individual symptomatic genes.
They have revealed that the aim to develop a risk classification model
was developed based on a novel level of gene expression network that was
performed using multiple microarrays of lung adenocarcinoma, and gene
convergence network investigation was carried out to recognize endurance
networks. Genes representing these networks have been used to develop
depth-based risk classification models. This model has been approved in
two test sets. The efficiency of the model was strongly related to patient
survival in the two sets of experiments and training. In multivariate analy-
sis, this model was related with persistent anticipation and autonomous of
other clinical and neurotic highlights.
The researchers have shown that how the gene structures and expres-
sions can be useful in early detection of the cancer and suitable steps can
be taken to cure the patients with higher probability of saving the lives [4].

2.1.1 Motivation of the Study


The medical service industry is confronted with the test of the quick
improvement of a lot of medical services data. The field of big data inves-
tigation is extending—you can leverage your healthcare system to provide
valuable insights. As mentioned above, most of the data produced by this
system is digitally printed and stored.
Another Random Document on
Scribd Without Any Related Topics
ποιήματα του «Ομήρου» και του «Ησιόδου» είναι ταρχαιότατα
λογοτεχνικά ημών μνημεία.

Παν έμμετρον περί μύθου έργον είναι κατ' ανάγκην ολιγώτερον


παλαιόν ή αυτός ο μύθος. Αλλά και κάτι άλλο είναι φανερόν, ότι η
σωζόμενη Ιλιάς, η Οδύσσεια, τα Έργα και η Θεογονία, δεν είναι ούτε
τα πρώτα, ούτε τα δεύτερα, ούτε τα δωδέκατα τοιαύτα
δημιουργήματα. Διότι τα προφανώς πανάρχαια ταύτα ποιήματα
δεικνύουσι μήκος και πλοκήν συνθέσεως τοιαύτην, οποία δύναται ν'
αποτελεσθή μόνον μετά καλλιτεχνικάς προσπαθείας πολλών γενεών.
Η δε γλώσσα των είναι όλως άσχετος προς τον συνήθη λόγον και
πλήρης λησμονημένων σημασιών και εικόνων παρωχημένης
κοινωνικής καταστάσεως· ποιητική γλώσσα, προφανώς
καταρτιζομένη και ρυθμιζομένη κατά τας εκάστοτε ανάγκας του
εξαμέτρου στίχου. Υπήρξαν άρα εξάμετρα ποιήματα προ της
ημετέρας Ιλιάδος. Αλλά και αυτό το εξάμετρον είναι υψηλόν και
σύνθετον επιγέννημα πολλών απλουστέρων μέτρων, οποία φαίνεται
ότι περιεβάλλοντο οι μύθοι εν Ελλάδι, καθώς και εν Ινδική, Γερμανία
και Σκανδιναυία. Αλλ' εάν έχωμεν ανάγκην αποδείξεως ότι τα
παλαιότατα ημών μνημεία είναι σχετικώς μεταγενέστερα, ταύτην
παρέχει αυτός Όμηρος, οσάκις αναφέρει την προ αυτού ποιητικόν
πλούτον και εκφράζει την κοινήν γνώμην ότι επί των ημερών του
επαλαιώθησαν πλείστα θέματα μεγάλα (45).

Τα πρόσωπα των υποτιθεμένων ποιητών των διαφόρων επών ή


επυλλίων κείνται όλως πέρα των ιστορικών γνώσεων ημών. Ως επί το
πλείστον δε έχουσι κάτι φανταστικόν ή μυθικόν. Ο Ορφεύς π. χ. ως
μυθική μορφή διεπλάσθη υπό των Ελλήνων αλλ' ως προσθήκαι,
προσθήκη δε φαίνεται και η εν τοις Έργοις μνεία του Ησιόδου. Οι
πραγματικοί «βάρδοι» (46) της παλαιάς Ελλάδος πάντες ήσαν
ανώνυμοι και απρόσωποι· και γινώσκομεν ακριβώς τον χρόνον, ότε ο
ποιητής αρχίζει ως άτομον να παρουσιάζη εαυτόν ήτο η περίοδος
των λυρικών ποιητών και των Ιώνων φιλοσόφων. Τα χωρία δε ταύτα
δεν μαρτυρούσι, τι ο Ησίοδος και ο Όμηρος είπον περί εαυτών, αλλά
τι η κατά τον έκτον αιώνα παράδοσις εμυθολόγει περί εκείνων.
Αλλά μόνον αμυδρώς δυνάμεθα να διακρίνωμεν την αρχήν της
παραδόσεως. Βεβαίως υπόκειται ιστορική τις αλήθεια. Διότι αι
βιογραφίαι και αι μνείαι του Ομήρου, καίπερ διαφωνούσαι κατά
τάλλα, συμφωνούσι κατά τούτο, ότι κατήγετο εξ Ιωνίας.
Συγκεντρούνται δε εις δύο πόλεις, την Σμύρνην και την Χίον· εν
εκατέρα αιολικός λαός υπέκειτο εις ιωνικόν, εν Χίω δε υπήρχε και
γένος «Ομηριδών». Θα ίδωμεν δε ότι εάν «γέννησιν του Ομήρου»
εννοούμεν την γένεσιν των ομηρικών ποιημάτων, η παράδοσις κατά
τούτο αληθεύει. Επίσης δε παριστάνουσα τον Ησίοδον και τον
πατέρα αυτού ερχομένους εκ της Ασιατικής Κύμης εις την Βοιωτίαν,
αληθεύει κατά τούτο, ότι η Ησιόδειος ποίησις είναι κατ' ουσίαν η
Ομηρική, εφαρμοσθείσα εις επιχώριον Βοιωτικόν θέμα.

Ο Όμηρος λοιπόν ελέγετο Χίος ή Σμυρναίος διά λόγους ιστορικούς·


αλλά διατί ήτο τυφλός; Ίσως έχομεν ενταύθα αμυδράν ανάμνησιν
αρχαϊκής τινος περιόδου, ότε πάντες οι αρτιμελείς ήσαν πολεμισταί,
οι χωλοί αλλά δυνατοί ήσαν χαλκείς, οι δε τυφλοί, εις ουδέν άλλο
χρήσιμοι, ήσαν απλοί αοιδοί. Αλλά πιθανωτέραν ερμηνείαν παρέχει
αυτός ο μύθος, συνήθως παριστάνων τυφλούς τους μεγάλους
ποιητάς και μάντεις και κατόπιν αυτούς μίαν οικογένειαν, καθώς
εξευρέθησαν ο Δώρος, ο Ίων και ο Έλλην, και καθώς οι Αμφικτίονες,
ήτοι κατοικούντες πέριξ των Θερμοπυλών, ανεκάλυψαν κοινόν
πρόγονον καλούμενον Αμφικτύονα. Τοιαύτη εικασία ερμηνεύει το
όνομα «Όμηρος», αφήνει όμως ανερμήνευτον το «Ομηρίδαι». Αλλ'
εάν τούτο είναι, όπως φαίνεται, πατρωνυμικόν (υιοί του Ομήρου),
είν' εύκολον να φαντασθώμεν κατάστασιν κοινωνίας, όπου οι υιοί
των ομήρων, μη μαχόμενοι, εχρησίμευον ως αοιδοί. Επίσης δε όμως
δύναται να είναι σύνθετον (ομή αρ-) σημαίνον «συναρμοστάς» μετά
καταλήξεως μετασχηματισθείσης εις πατρωνυμικήν, αφ' ότου οι
αοιδοί ήρχισαν ν' αποτελώσιν εταιρείαν και να ζητώσι πρόγονον
κοινόν.

Είναι αληθινόν, ότι έχομεν πολλούς εκ παραδόσεως «βίους» των


προϊστορικών ποιητών και διήγησιν περί αγώνος Ομήρου και
Ησιόδου, διασκευήν αντιγραφείσαν εκ της περί το 400 π. Χ. υπό του
σοφιστού Αλκιδάμαντος συντεθείσης, όστις επίσης διεσκεύασε
προϋπάρχοντά τινα θρύλον. Και αυτά τα έπη παρέχουσι κατά το
φαινόμενον προσωπικάς των ποιητών ειδήσεις· ούτως αναφέρεται το
όνομα του Ησιόδου εν τω προλόγω της Θεογονίας, εν δε τοις Έργοις
(στ. 633 κεξ.) λέγεται ότι ο πατήρ του είχε μετοικήσει εκ της Κύμης
εις την Άσκραν. Ο δε εις τον Δήλιον Απόλλωνα ομηρικός ύμνος
καταλήγει εις παράκλησιν του ποιητού προς τας ακροωμένας
παρθένους να μη λησμονήσωσιν αυτόν και αν κανείς τας ερωτήση

ω κούραι, τις δ' ύμμιν ανήρ ήδιστος αοιδών;

{ who is the sweetest of singers ?}

ν' απαντήσωσιν ευφήμως

τυφλός ανήρ, οικεί δε Χίω ενι παιπαλοέσση.

{ ’Tis a blind man; he dwells in craggy Chios}

Αλλά δυστυχώς ταύτα είναι μόνον προσωποποιίαι. Ο απαγγέλλων


τους στίχους τούτους ραψωδός δεν ενόει ότι αυτός ήτο τυφλός Χίος
και ότι τα ιδικά του έπη ήσαν τα ήδιστα· ενόει μόνον ότι το
απαγγελλόμενον ποίημα ήτο έργον του τυφλού Ομήρου, του
ηδίστου των αοιδών. Αληθώς, και τα δύο ταύτα χωρία και ο
πρόλογος της Θεογονίας είναι προφανώς μεταγενέστεραι
εμπνεόμενος εκ της τυφλότητος αυτών. Ο Όμηρος είναι ο
Δημόδοκος του μύθου (θ. 63),

τον πέρι μούσα φίλησε, δίδου δ' αγαθόν τε


κακόν τε·
οφθαλμών μεν άμερσε, δίδου δ' ηδείαν αοιδήν.

{whom the Muse greatly loved, and gave him both good and evil ;
she took away his eyes and gave him sweet minstrelsy.}

Ούτος είναι καθαρός θρύλος, ο αυτός θρύλος, ο εμπνεύσας την εν


τω Μουσείω της Νεαπόλεως εξαισίαν του Ομήρου προτομήν· ο
θρύλος, όν αισθανόμεθα εν τω θαυμαστώ εις Λουτρά της Παλλάδος
ύμνω του Καλλιμάχου, όπου ο Τειρεσίας, μάντις αυτός και ουχί
ποιητής, αποβάλλει την όρασιν. Άλλα δε της παραδόσεως σημεία
έχουσιν ομοίαν αφορμήν, είτε δηλαδή την προς τον άγνωστον
επαίτην κατά τα γαμήλια συμπόσια περιφρόνησιν, μέχρις ού
εγειρόμενος ούτος απήγγελλεν, είτε την προς τους Κυμαίους χλεύην,
ότι εξεδίωξαν τον ποιητήν. Κατ' άλλον δε θρύλον διά των *Κυπρίων,
του μόνου έπους, όπερ ήτο κατώτερον της ποιήσεως αυτού,
επροίκισε τάχα την κόρην του πλουσίως.

ΤΑ ΟΜΗΡΙΚΑ ΕΠΗ

Αν ήδη ζητήσωμεν, τίνα ποιήματα εθεωρούντο ως έργα του Ομήρου


κατά τας αρχάς της σωζομένης παραδόσεως, θα εύρωμεν ότι
εθεωρούντο πάντα όσα ήσαν «ομηρικά» ή «ηρωικά», δηλαδή πάντα
τα επικώς πραγματευόμενα τους δύο κυρίους μυθικούς κύκλους, τον
Τρωικόν και τον Θηβαϊκόν. Διότι η παλαιοτάτη περί Ομήρου μνεία
είναι η υπό του ποιητού Καλλίνου (περί τα 660 π. Χ.) όστις
μνημονεύει την *Θηβαΐδα ως έργον αυτού· η δε μετ' αυτήν είναι
πιθανώς (47) η υπό του Αμοργίνου Σημωνίδου (περί τα 630 π. Χ.),
όστις αναφέρει ως λόγους «Χίου ανδρός» παροιμιώδη φράσιν
απαντώσαν εν τη ημετέρα Ιλιάδι [Ζ 146]

οίη περ φύλλων γενεή, τοίη δε και ανδρών.

{As the passing of leaves is, so is the passing of men}

Ο Σημωνίδης ηδύνατο να εννοή ωρισμένον τινά Χίον, η δε φράσις


της Ιλιάδος ίσως ήτο απλώς περιφερομένη παροιμία, παραληφθείσα
εις το έπος· αλλά πιθανώτερον είναι ότι ο Αμοργίνος ανέφερε τον
διασωθέντα στίχον. Ο δε Κείος Σιμωνίδης, ένα όλον αιώνα κατόπιν
(556-468 π. Χ.) λαλών περί Μελεάγρου
ός δουρί πάντας
νίκασε νέους δινάεντα βαλών
Άναυρον ύπερ πολυβότρυος εξ Ιωλκού,

{conquered all youths in spear-throwing across the wild Anauros}

επιλέγει

ούτω γαρ Όμηρος ηδέ Στασίχορος άεισε λαοίς.

Αλλά τούτο δεν ευρίσκεται εν τη ημετέρα Ιλιάδι ή Οδυσσεία και


αδύνατον είναι ν' ανακαλύψωμεν έκ τινος ποιήματος πηγάζει. Ολίγον
δε κατόπιν ο Πίνδαρος μνημονεύει πολλάκις του Ομήρου. Ψέγει
αυτόν, ότι επαινεί τον Οδυσσέα [Νεμ. ζ' 21] — εννοών την
Οδύσσειαν, — αλλά εγκωμιάζει αυτόν [Ισθμ. γ' 55] ότι ετίμησε τον
Αίαντα, «αυτού πάσαν ορθώσαις αρετάν κατά ράβδον» {straightly by
rod and plummet the whole prowess of Aias} ιδίως δε, ως φαίνεται,
διά την διάσωσιν του σώματος του Αχιλλέως, την περιγραφομένην
υπό δύο απολομένων επών, της *Μικράς Ιλιάδος και της *Αιθιοπίδος.
Τέλος ο Πίνδαρος λέγει [Πυθ. δ' 278).

Των δ' Ομήρου και τόδε συνθέμενος


ρήμα πάρσυν'· άγγελον εσλόν έφα τιμάν
μεγίσταν πράγματι
παντί φέρειν.

{remember Homer’s word : A good messenger brings honour to any


dealing}

ρητόν, όπερ ο ημέτερος Όμηρος ουδαμού λέγει· και αναφέρει [Νεμ.


β' 1] τους Ομηρίδας

ραπτών επέων τα πόλλ' αοιδούς.

{Homeridæ, singers of stitched lays}


Εάν δε πράγματι ο Αισχύλος ωνόμασέ ποτε τας τραγωδίας του
«τεμάχη των Ομήρου μεγάλων δείπνων», (48) τα δείπνα εκείνα
φαίνεται ότι θα ήσαν πολύ πλουσιώτερα των εις ημάς προσιτών.
Διότι μεταξύ των 90 αυτού δραμάτων μόλις επτά ευρίσκομεν
απορρέοντα εκ του σωζομένου Ομήρου, συμπεριλαμβανομένων και
των Χοηφόρων και του Αγαμέμνονος (49), ήτοι δραμάτων, άπερ
μόνον παραδοξολόγος τις δύναται να ονομάση «τεμάχη» της
Οδυσσείας. Λέγων άρα Όμηρον ο Αισχύλος ενόει καθόλου τους
ηρωικούς μύθους. Και ο Σοφοκλής, ο επονομαζόμενος
Ομηρικώτατος, κατά τον Αθήναιον (Ζ' σελ. 277 ε,) έχαιρε «τω επικώ
κύκλω ως και όλα δράματα ποιήσαι, κατακολουθών τη εν τούτω
μυθοποιία» {rejoice in the epic cycle and make whole dramas out of
it}, δηλαδή επραγματεύετο τους επικούς εκείνους μύθους, ούς ο
Αθηναίος εγίνωσκε μόνον εκ των «κύκλων», ήτοι εγχειριδίων, άπερ
συνέταξε κάποιος Διονύσιος κατά τον β' αιώνα π. Χ. και ο
Απολλόδωρος κατά τον α'. Ο Ξενοφάνης (κατά τον ς' αιώνα)
«Όμηρον και Ησίοδον» εννοεί πάσαν την επικήν παράδοσιν, τους
μύθους και τας θεογονίας, ομοίως δε και ο Ηρόδοτος, λέγων (Β' 53)
«ούτοι δε εισι οι ποιήσαντες θεογονίαν Έλλησι και τοίσι θεοίσι τας
επωνυμίας δόντες και τιμάς τε και τέχνας διελόντες και είδεα αυτών
σημήναντες». {made the Greek religion, and distributed to the gods
their titles and honours and crafts, and described what they were
like.} Ο Ηρόδοτος εκφράζει την καθιερωμένην γνώμην, αλλ' έχει και
ιδικήν του κριτικήν, διαφωνούσαν προς αυτήν· θεωρεί αδιστάκτως
τον Όμηρον ως ποιητήν της Ιλιάδος και της Οδυσσείας· και
αμφιβάλλει μεν [Δ' 32] περί των Επιγόνων, αν τω όντι ο Όμηρος
εποίησε τα έπη ταύτα, αλλ' είναι βέβαιος [Β' 117] ότι τα *Κύπρια δεν
είναι του Ομήρου, αφού διαφωνούσι προς την Ιλιάδα. Τούτο είναι το
πρώτον ίχνος της εν τέλει κρατησάσης θεωρίας. Ο δε Θουκυδίδης [Α'
3,3. 9,3. 10,3. Γ' 104,4] ρητώς θεωρεί την Ιλιάδα, τον εις Απόλλωνα
ύμνον και την Οδύσσειαν ως έργα του Ομήρου. Ο Αριστοτέλης
[Ποιητ. Δ' σελ. 1448 β 34 και αλλ.] ουδέν άλλο αποδίδει εις αυτόν
παρά την Ιλιάδα, την Οδύσσειαν και το κωμικόν έπος Μαργίτην. Αι
παραπομπαί του Πλάτωνος δεν εκτείνονται πέρα της Ιλιάδος και της
Οδυσσείας, και μόνα τα δύο ταύτα ποιήματα εγένοντο δεκτά υπό του
μεγάλου γραμματικού της Αλεξανδρείας Αριστάρχου (περί τα 160 π.
Χ.) και παρέμειναν έκτοτε ως «Ομηρικά».

Αλλά διατί εξ αρχής τα δύο ταύτα εξεχωρίσθησαν ως «Όμηρος»; Και


διατί παρά πάσας τας ουσιώδεις μεταξύ των διαφοράς,
εξηκολούθησαν ομού να θεωρώνται ως γνήσια του Ομήρου έργα,
ενώ τόσα άλλα έπη κατ' ολίγον απεσπάσθησαν απ' αυτού; Τούτο
γίνεται μάλλον άξιον απορίας, όταν ενθυμηθώμεν ότι αι διαφοραί και
ανακολουθίαι αυτών κατεδείχθησαν ήδη κατά τους Πτολεμαϊκούς
χρόνους υπό των «χωριζόντων», του Ξένωνος και του Ελλανίκου.

ΙΛΙΑΣ ΚΑΙ ΟΔΥΣΣΕΙΑ. — Η ΚΑΤΑ ΤΑ ΠΑΝΑΘΗΝΑΙΑ


ΡΑΨΩΔΙΑ

Μία παράδοσις έρχεται εις βοήθειαν ημών, ερμηνευομένη διαφόρως


υπό των διαφόρων κριτικών, ήτοι ο θρύλος περί αναγραφής των
επών υπό του Πεισιστράτου, του τυράννου των Αθηνών κατά μέσα
του έκτου π. Χ. αιώνος. Αύτη καλείται υπό του Wolf «vox totius
antiquitatis», μνημονεύεται δε διαφόρως υπό του Κικέρωνος, του
Παυσανίου, του Αιλιανού και του Ιωσήπου· αναφέρεται δε ως
πασίγνωστον γεγονός εν μεταγενεστέρω επιγράμματι, όπερ φέρεται
ως επιγραφή ανδριάντος του Πεισιστράτου [Ανθολ. ΙΑ' 442]

ός τον Όμηρον
ήθροισα σποράδην το πριν αειδόμενον

{who collected Homer, formerly sung in fragments.}

του δε Κικέρωνος η φράσις [de orat. 3, 34, 137] λέγει ότι ο


Πεισίστρατος κατέταξε κατά την παρούσαν τάξιν τα βιβλία του
Ομήρου, «προτού συγκεχυμένα» (confusos antea). Ο Βυζάντιος
Τζέτζης — το όνομα τούτο είναι κατά προφοράν γραφή του Cæcius
— διακοσμεί την παράδοσιν διά προσθηκών και σφαλμάτων, λέγων
ότι ο Πεισίστρατος κατώρθωσε το εγχείρημα διά «τεσσάρων . . .
συνθέντων τον Όμηρον, οίτινές εισιν ούτοι· Επικόγχυλος,
Ονομάκριτος Αθηναίος, Ζώπυρος Ηρακλεώτης και Ορφεύς
Κροτωνιάτης». Αλλ' ο Επικόγκυλος είναι βεβαίως κακή ανάγνωσις
των λέξεων «επικόν κύκλον»! Και η όλη επιτροπεία έχει χροιάν
μυθώδη και φαίνεται μάλλον πτολεμαϊκή ή πεισιστράτειος.
Αξιοσημείωτον δε είναι ότι τα σχόλια, τα απορρέοντα εκ των
Αλεξανδρέων γραμματικών και ιδία του Αριστάρχου, δεν
μνημονεύουσι τον Πεισίστρατον ως προηγούμενον εκδότην.

Η περί τούτου σιγή των Αλεξανδρέων εθεωρείτο συνήθως ως πλήρης


απόδειξις, ότι ο περί Πεισιστράτου λόγος ήτο τότε ανύπαρκτος. Αλλ'
ήδη ανευρέθησαν αμυδρά αυτού ίχνη, ανερχόμενα μέχρις αυτού του
τετάρτου π Χ. αιώνος. Και ήτο μεν ανέκαθεν γνωστόν ότι Μεγαρεύς
τις Διευχίδας είχε κατηγορήσει τον Πεισίστρατον ως παρεγγράψαντα
στίχους εις τον Όμηρον προς όφελος των Αθηνών, τούτο δε
προφανώς εσήμαινεν ότι ο Πεισίστρατος είχεν έλεγχόν τινα επί του
κειμένου. Αλλά πρώτος ο Βιλαμόβιτζ έδειξεν ότι ο Διευχίδας ήτο
συγγραφεύς πολύ παλαιότερος των Αλεξανδρέων γραμματικών, και
ότι είχεν αφορμήν προς τοιαύτην κατηγορίαν (50). Αύτη αποτελεί
μέρος ευρυτέρας κατά των Αθηνών γραμματολογικής συκοφαντίας,
δι' ής τα Μέγαρα εξεδικούντο κατά τον τέταρτον αιώνα π. Χ. το
παρακμάζον άστυ· ότι δηλ. την κωμωδίαν εύρον όχι αι Αθήναι, αλλά
τα Μέγαρα· την δε τραγωδίαν εύρεν η Σικυών· αι Αθήναι είχον μόνον
παραχαράξει και διαφθείρει κείμενα. Εάν ο Διευχίδας εξέφερε τα περί
Πεισιστράτου ως γεγονός κοινώς παραδεκτόν, ή απλώς ως υπόθεσιν,
είναι άδηλον. Φαίνεται όμως ότι δεν ηδύνατο να εύρη προς απόδειξιν
κείμενα μη αττικά, και προς υπόδειξιν της γνησίας γραφής έπρεπε να
καταφύγη εις τα ιδικά του φώτα. Εκείνος εύρε την υποτιθεμένην
αρχικήν μορφήν του παραποιηθέντος χωρίου της Ιλιάδος, Β 671· και
πιθανώς εκείνος εφαντάσθη την ύπαρξιν Σπαρτιατικής εκδόσεως του
Ομήρου υπό του Λυκούργου, κειμένου αδιαφθόρου, όπερ τάχα
πιστώς είχον αντιγράψει οι τίμιοι Δωριείς!
Ο λόγος λοιπόν ότι ο Πεισίστρατος είχε παραχαράξει τον Όμηρον
περιεφέρετο προ των Πτολεμαϊκών χρόνων. Αλλά τότε διατί ο
Αρίσταρχος δεν εμνημόνευσε το πράγμα; Δύσκολος η απάντησις.
Ίσως και εκείνος εξελάμβανε τούτο ως γνωστόν, όπως ο ποιητής του
επιγράμματος. Αλλ' οπωςδήποτε βέβαιον είναι ότι ο Αρίσταρχος
ωβέλιζε διά λόγους τινάς πλείστους των στίχων, ούς οι νεώτεροι
θεωρούσιν ως «αθηναϊκάς παραχαράξεις», και τούτο έπραξεν όχι διά
λόγους εσωτερικούς, αφού παραδόξως επίστευεν ότι αυτός ο
Όμηρος ήτο Αθηναίος. Περίεργον δε είναι ότι η περί Πεισιστράτου
μαρτυρία του Κικέρωνος φαίνεται προερχομένη εκ της Περγαμηνής
σχολής, ής ο ιδρυτής Κράτης ήτο σχεδόν ο μόνος επιτυχώς
πολεμήσας το κύρος του Αριστάρχου. Είναι λοιπόν πιθανόν ότι ο
Αρίσταρχος επεζήτει να περιορίση την ερμηνευτικήν μέθοδον, της
οποίας έκαμε κατάχρησιν η αντίζηλος σχολή.

Ο Διευχίδας λοιπόν εγνώριζεν ότι ο Πεισίστρατος είχεν οπωσδήποτε


διαφθείρει τα ομηρικά έπη. Άλλοι όμως Μεγαρείς κατά τον
Πλούταρχον (Σόλωνι 10) έλεγον ότι ο Σόλων παρενέβαλεν «έπος εις
νεών κατάλογον», πασίγνωστος δε παράδοσις απέδιδεν εις αυτόν
ειδικόν νόμον περί της απαγγελίας των Ομηρικών επών κατά τας
εορτάς των Παναθηναίων. Εξ άλλου ο νόμος εκείνος απεδίδετο εις
τον Ίππαρχον εν τω φερωνύμω ψευδοπλατωνικώ διαλόγω (51),
όστις δεν είναι νεώτερον του τρίτου αιώνος έργον, υπό δε
Λυκούργου του ρήτορος απλώς εις τους προγόνους (52), και εκεί
πρέπει και ημείς ν' αφήσωμεν αυτόν διότι αφού εψηφίζετο νόμος τις
εν Αθήναις, έτεινε να νομισθή αμέσως ως του Σόλωνος, του μεγάλου
«νομοθέτου». Εάν δε ο Πεισίστρατος ή ο Ίππαρχος εθεωρούντο
συμμέτοχοι του νόμου, τούτο προήρχετο αφ' ενός μεν επειδή
ανεμειγνύοντο και φήμαι περί παραποιήσεως, αφ' ετέρου δε διότι
πάντοτε οι τύραννοι συνεδέοντο μετά των Παναθηναίων.

Αλλά τι έλεγεν ο νόμος; Είναι φανερόν ότι η απαγγελία των


Ομηρικών επών ήτο μέρος της εορτής και είναι πιθανόν ότι υπήρχε
και αγών. Εξ άλλου δε γινώσκομεν ότι ερραψωδούντο κατ' ίδιον τινα
τρόπον. Αλλά πώς άρα γε; εξ υποβολής, δηλαδή εξ οιουδήποτε
προτεινομένου στίχου, — πράγμα σχεδόν απίστευτον, — ή εξ
υπολήψεως, δηλαδή αρχομένου του επομένου ραψωδού εκείθεν,
όπου κατέληξεν ο προ αυτού; Διογένης ο Λαέρτιος [Α' β' 9] λέγει εξ
υποβολής και κατόπιν ερμηνεύει «οίον όπου ο πρώτος έληξεν,
εκείθεν άρχεσθαι τον εχόμενον»!

Καθόλου λοιπόν έχομεν μαρτυρίας πρώτον μεν περί των εξής· ότι εν
Αθήναις υπήρχεν έθος, τουλάχιστον από των αρχών του πέμπτου π.
Χ. αιώνος, καθ' ό τα Ομηρικά έπη απηγγέλλοντο δημοσία κατά τάξιν
ωρισμένην και ότι η αρχή του έθους απεδίδετο εις νόμον της
πολιτείας. Έπειτα δε βλέπομεν ότι κατά πάντας τους μέχρι του
Πινδάρου γράψαντας, τους μη Αθηναίους, «Όμηρος» φαίνεται
καλούμενος ο ποιητής επών πολύ περισσοτέρων ή όσα κατέχομεν
ημείς, — πιθανώς πάντων των Τρωικών και Θηβαϊκών επών — ενώ
εν τη αττική λογοτεχνία από του πέμπτου αιώνος και εξής Όμηρος
είναι μόνον ο ποιητής της Ιλιάδος και της Οδυσσείας, τα δε λοιπά
έπη κατ' αρχάς μεν εθεωρήθησαν ως αμφίβολα, έπειτα δ'
ερρίφθησαν εις την λήθην. Ενθυμούμενοι δε, ότι πάντες οι περί
Παναθηναίων γράψαντες λέγοντες «Όμηρον» εννοούσιν απλώς ως
πράγμα αυτόδηλον την Ιλιάδα και την Οδύσσειαν, συμπεραίνομεν
αμέσως, ότι μόνα τα δυο ταύτα ποιήματα είχον τότ' εκλεγή προς
απαγγελίαν και ότι ακριβώς η απαγγελία εκείνη εγέννησε την
εξαιρετικήν υπόληψιν, ότι ταύτα είναι ο «γνήσιος» Όμηρος.

Αλλά διατί εξελέγησαν αυτά; Τούτο δεν είναι εντελώς φανερόν. Αλλά
πρώτον παραβολή εν γένει του ύφους των αποδοκιμασθέντων επών
προς τα δύο διασωθέντα δεικνύει ότι ταύτα είναι πολύ πλέον
επεξειργασμένα ή εκείνα· έχουσι μεγαλυτέραν ενότητα, φαινόμενα
πολύ ολιγώτερον εκείνων ως απλαί ραψωδίαι, δυνατώτερον
δραματικόν πάθος και περισσότερον ρητορικόν διάκοσμον. Προς
ταύτα έν μόνον έπος ηδύνατο να παραβληθή, το και πρώτον
μνημονευόμενον ως έργον του Ομήρου, η * Θηβαΐς· αλλ' η δόξα των
Θηβών ήτο βεβαίως το πάντων ήκιστα ευάρεστον εις τους Αθηναίους
θέμα· αι Αθήναι δηλαδή θ' απέρριπτον αυτό μάλλον αδιστάκτως ή
όσον απέρριψεν η Σικυών τον «Όμηρον», τον εγκωμιάσαντα το
Άργος (53).
Τοιουτοτρόπως ορίζομεν σπουδαιότατον εν τη ιστορία των επών
σταθμόν, υπολείπεται δε να διαγράψωμεν τον προτού και τον
κατόπιν δρόμον. Αρχόμενοι δε από των κατόπιν, παρατηρούμεν ότι η
παραδιδομένη ερμηνεία του Ομήρου απορρέει από των γραμματικών
της Αλεξανδρείας, των ακμασάντων κατά τον τρίτον και τον
δεύτερον αιώνα π. Χ., ήτοι Ζηνοδότου του Εφεσίου (γεννηθέντος
περί τα 325), Αριστοφάνους του Βυζαντίου (γεννηθέντος περί τα
257) και ιδίως Αριστάρχου του εκ Σαμοθράκης (215-145), του
εγκυροτάτου περί της πρώτης εις τους αρχαίους γνωστής ποιήσεως
κριτικού. Αλλ' η περί αυτού γνώσις ημών προέρχεται εξ επιτομής των
έργων τεσσάρων μεταγενεστέρων λογίων, ήτοι του περί της
Αρισταρχείου διορθώσεως έργου του Διδύμου, της περί σημείων
Ιλιάδος και Οδυσσείας πραγματείας του Αριστονίκου (ήτοι των
σημείων, άπερ μετεχειρίσθη ο Αρίσταρχος) της Ιλιακής προσωδίας
του Ηρωδιανού και του περί της στιγμής της παρ' Ομήρω έργου του
Νικάνορος. Τούτων ο Δίδυμος και ο Αριστόνικος ήκμαζον επί
Αυγούστου, η δε επιτομή απετελέσθη κατά τον τρίτον μ. Χ. αιώνα·
το χειρόγραφον εν ώ σώζεται, είναι ο περίφημος Ενετικός (Α) κώδιξ
της δεκάτης εκατονταετηρίδος, ο περιέχων την Ιλιάδα, ουχί δε και
την Οδύσσειαν.

Δυνάμεθα λοιπόν να είπωμεν αρκετά περί της καταστάσεως των


Ομηρικών επών κατά τον δεύτερον π. Χ. αιώνα, και να ελπίζωμεν ότι
θα αποκαταστήσωμεν μετά μικρών μόνον σφαλμάτων το «κατ'
Αρίσταρχον» κείμενον αυτών, δηλαδή κείμενον, όπερ θα ηδύνατο
οπωςδήποτε να εγκρίνη και ο δοκιμώτατος εκείνος κατά την ακμήν
της ελληνικής κριτικής γραμματικός. Αλλ' όμως οφείλομεν να
προχωρήσωμεν και περαιτέρω, εκτός αν θέλωμεν να φανώμεν
ανάξιοι του Αριστάρχου οπαδοί και αδιάφοροι προς την Φιλολογίαν.
Και εν πρώτοις, εάν τα σχόλια ημών προέρχονται από του
Αριστάρχου, πόθεν έρχεται το κείμενον ημών; Βεβαίως εκ του
Αριστάρχου, αλλ' εκ του παραδεδομένου κειμένου, — της
«βουλγάτας» των ημερών αυτού — προς διόρθωσιν του οποίου
εξέδωκε τας δύο του εκδόσεις και επί του οποίου ούτ' εκείνος ούτε
άλλος ουδείς ηδυνήθη να επιθέση αυθεντικήν σφραγίδα. Ουδέ
μετέβαλε τολμηρώς το κείμενον ο Αρίσταρχος· απ' εναντίας, σπανίως
ή ουδέποτε «διώρθωσεν» εξ απλής εικασίας, και ηθέτησε μεν
πολλούς στίχους ως νόθους, αλλά δεν εξέβαλεν αυτούς. Ούτως αι
μέγισται μεταξύ της Αρισταρχείου. και των κοινών εκδόσεων
διαφοραί δεν είναι ουδέ τόσον μεγάλαι, όσον αι μεταξύ των εις
τέταρτον και των εις φύλλον εκδόσεων του Αμλέτου του Σαιξπήρου.

Βλέπομεν όμως ότι ο Αρίσταρχος είχε πολλάς ενώπιόν του εκδόσεις ή


«διορθώσεις», διαφερούσας από τε της «κοινής» και απ' αλλήλων·
διότι αναφέρει τρεις τάξεις αυτών, τας κατ' άνδρα, περιεχούσας
αναγνώσεις ή σημειώσεις ποιητών, ως ο Αντίμαχος και ο Ριανός, ή
λογίων, ως ο Ζηνόδοτος· τας κατά πόλεις, προερχομένας εκ
Μασσαλίας, Χίου, Άργους, Σινώπης και καθόλου πανταχόθεν πλην
των Αθηνών, της πατρίδος του κοινού κειμένου· και τέλος εκείνας,
άς αποκαλεί τετριμμένας, δημώδεις, ή εικαιοτέρας, εις άς ασφαλώς
δυνάμεθα να κατατάξωμεν την πολύστιχον.

Των διαφορών τούτων την έκτασιν και τα όρια δεικνύουσιν αι εκ του


Ομήρου περικοπαί των προ των γραμματικών της Αλεξανδρείας
συγγραφέων. Και δη μαρτυρούσι πρώτον ότι και εν Αθήναις το
κοινόν κείμενον δεν είχεν ασφαλώς αποκατασταθή προ του 300
έτους π. Χ. Διότι ο Αισχίνης, ανήρ λόγιος, όχι μόνον ισχυρίζεται (54)
ότι η φράσις «φήμη δ ες στρατόν ήλθεν» απαντά «πολλάκις εν τη
Ιλιάδι», ενώ είναι ανύπαρκτος εν τοις ημετέροις κειμένοις, αλλά και
παραθέτει αυτολεξεί χωρία του Θ και του Ψ μετά στίχων όλως
διαφόρων. Το αυτό δε μαρτυρούσι και οι του τρίτου αιώνος πάπυροι,
και μάλιστα το απόσπασμα του Λ, όπερ εδημοσίευσε τω 1891 ο
καθηγητής Mahaffy (55) και το εκ της αυτής ραψωδίας απόσπασμα,
όπερ εδημοσίευσε τω 1894 ο κ. Nicole (56). Το πρώτον λόγου χάριν,
περιέχον τας αρχάς ή τα τέλη 38 στίχων του Λ μεταξύ 502 και 537,
παραλείπει ένα των ημετέρων στίχων, περιλαμβάνει τέσσαρας ξένους
και έχει δύο άλλους διαφόρους των ημετέρων, περιέχει δηλαδή
σπουδαίας διαφοράς εντός χώρου τόσον μικρού. Εξ άλλου όμως αι
διαφοραί και τούτου και των λοιπών παπύρων φαίνονται μόνον
λεκτικαί. Πραγματικάς διαφοράς ουδέν του τετάρτου αιώνος
κείμενον παρέχει.
Το πόρισμα της μαρτυρίας ταύτης δεικνύει τους δύο τελευταίους
σταθμούς των Ομηρικών επών. Η κανονική αφήγησις των γεγονότων
και η τάξις των επεισοδίων καθωρίσθη βαθμηδόν, κυρία δε αρχή του
καθορισμού τούτου υπήρξεν η κατά τα Παναθήναια ραψωδία των
επών (57). Η δε λέξις του κειμένου καθ' έκαστον στίχον
απεκρυσταλλώθη διά της συνεχούς σχολικής επαναλήψεως και των
ιδιαιτέρων αναγνώσεων και διά φιλολογικών σπουδών, ών κορωνίς
υπήρξεν η λεπτομερής κριτική του Ζηνοδότου και των εν τω
Μουσείω διαδόχων αυτού.

Στρεφόμενοι δε προς τα οπίσω, εκπλησσόμεθα παρατηρούντες ότι


ενώ αι ομηρικαί περικοπαί των πλείστων συγγραφέων του τετάρτου
και πέμπτου π. Χ. αιώνος, και αυτού του Αριστοτέλους λόγου χάριν,
διαφέρουσιν ικανώς του ημετέρου κειμένου, αι παρά Πλάτωνι
συμφωνούσι προς αυτό σχεδόν κατά λέξιν (58). Αναγκαίως λοιπόν
αγόμεθα εις το εξ άλλης αφορμής συμπέρασμα του Grote, ότι
Δημήτριος ο Φαληρεύς, προςκληθείς υπό Πτολεμαίου του α' να
συστήση την εν Αλεξανδρεία βιβλιοθήκην, μετεχειρίσθη τας υπό του
Πλάτωνος εις την Ακαδήμειαν κληροδοτηθείσας βίβλους (59).

Η ανάλυσις αύτη επαναφέρει ημάς εις την κατά τα Παναθήναια


ραψωδίαν των επών. Καθώς είδομεν, ταύτης αποτέλεσμα η
καθιέρωσις της Ιλιάδος και της Οδυσσείας ως του κατ' εξοχήν
«Ομήρου», ο καθορισμός της τάξεως των επεισοδίων και, εννοείται,
η διαφύλαξις αυτού ως ιερού κειμηλίου των Αθηνών. Αλλά πότε
ενομοθετήθη τούτο; Και ήτο πράγματι νόμος ή απλώς βαθμιαία
πρόοδος, ήν η παράδοσις κατά το σύνηθες παρέστησεν ως νόμον;

Και περί μεν του χρόνου, βεβαίως η καθιέρωσις του εθίμου δεν ήτο
παλαιοτέρα του Ιππάρχου, του τελευταίου των ανδρών, εις ούς
αποδίδεται· επεκράτησε δηλαδή τούτο ουχί πριν ο Ιππίας
τυραννεύση, πιθανώς δε και μετά την κατάλυσιν της τυραννίδος.
Αλλ' η καθιέρωσις των έργων του μεγάλου Ίωνος ποιητού ως
σπουδαίου μέρους της σεμνοτάτης θρησκευτικής τελετής των
Αθηνών ήτο γεγονός, δυνάμενον να συμβή μόνον κατά περίοδον
πλήρους αδελφώσεως μετά της Ιωνίας. Τοιαύτη δε τάσις αρχίζει εν
Αθήναις από της επαναστάσεως των Ιώνων διότι προ του 500 π. Χ.
οι Αθηναίοι περιεφρόνουν τους υποτιθεμένους εκείνους συγγενείς, ο
δε Κλεισθένης είχε καταργήσει και τα Ιωνικά των φυλών ονόματα.
Το έτος 499 είναι η αρχή της μεγάλης πανιωνικής περιόδου της
Αθηναϊκής πολιτικής, ότε αι Αθήναι αναδέχονται την θέσιν
μητροπόλεως και προστάτιδος της Ιωνίας, ασπάζονται την ιωνικήν
παιδείαν, και ανέρχονται εις την πνευματικήν ηγεμονίαν της Ελλάδος.
Παιδεία και γράμματα φαίνεται ότι κατέλιπον τότε την Μίλητον, όπως
κατέλιπον την Κωνσταντινούπολιν μετά τα 1453, φυσικόν δε
καταφύγιον αυτών υπήρξαν αι Αθήναι. Κατωτέρω θα γνωρίσωμεν
τους μεγάλους άνδρας, και τους σπουδαίους νεωτερισμούς, όσοι
τότε επέρασαν εκ της Ασίας εις τας Αθήνας· εκ τούτων ήτο και η
παραδοχή του ιωνικού αλφαβήτου υπό των ιδιωτών και των
λογογράφων.

Το μεν αττικόν αλφάβητον ήτο αρχαϊκόν και άκομψον, στερούμενον


διπλών συμφώνων και μακρών φωνηέντων, το δε ιωνικόν είναι
περίπου τα και νυν εύχρηστα κεφαλαία. Ενώ δ' επισήμως δεν έγινε
δεκτόν εν Αθήναις προ του 404 — τα δημόσια ψηφίσματα διετήρουν
το αρχαϊκόν μεγαλείον — ήδη κατά τα Μηδικά εχρησιμοποιείτο υπό
των ιδιωτών (60)· ήλθε δηλαδή ότε αι Αθήναι ανεδείχθησαν
μητρόπολις της Ιωνίας και παρέλαβον την ιωνικήν ποίησιν ως μέρος
του ιερού των θησαυρού. Αλλ' όμως εδώ προκύπτει παράδοξος
δυσκολία. Ο Όμηρος εν Ιωνία εγράφετο βεβαίως διά ιωνικού
αλφαβήτου. Η δε ημετέρα παράδοσις, υποστηριζομένη ρητώς υπό
πολλών μαρτυριών των Αλεξανδρέων, και διά κριτικών εκ του
κειμένου εικασιών (61), δεικνύει σταθερώς ότι τα παλαιά του Ομήρου
κείμενα ήσαν γραμμένα δι' Αττικού αλφαβήτου. Αλλ' αν ο Όμηρος
προσήλθεν εις τα Παναθήναια ακριβώς ότε και το νέον Ιωνικόν
αλφάβητον ήλθεν εις τας Αθήνας, διατί μετεγράφη από της
τελειοτέρας γραφής εις την ατελεστέραν; Η απάντησις δεν είναι
δύσκολος, λύει δε και άλλο ζήτημα, άλυτον προτού. Αντίγραφα του
Ομήρου εγράφησαν διά του επισήμου αττικού αλφαβήτου, καθόσον
η κατά τα Παναθήναια ραψωδία των επών ήτο τελετή επίσημος,
νομίμως καθωρισμένη (62).
Yπήρχεν άρα γραπτός νόμος, σύμπτωμα της καθόλου ιωνιζούσης
διαθέσεως των πρώτων δεκαετηρίδων του πέμπτου π. Χ. αιώνος.
Αλλά δυνάμεθα να διακρίνωμεν ακριβέστερον ταποτελέσματα του
νόμου τούτου;

Βεβαίως διέγραφε τάξιν τινά και υπήρξεν αφορμή προς καταρτισμόν


επισήμου κειμένου. Είναι δε φανερόν ότι προσήλωσις εις μεν τας
λέξεις δεν ήτο αναγκαία, αλλ' εις την ύλην ήτο. Φαίνεται δε σχεδόν
βέβαιον ότι η επιβληθείσα τάξις δεν ήτο νέα τις και αυθαίρετος, αλλά
ήδη γνωστή και αγαπητή εις τους Αθηναίους· εννοείται δ' όμως ότι
δυνατόν να ήτο απλώς και μία των ποικίλων εκδόσεων των
φερομένων ανά τα διάφορα Ομηρικά κέντρα της Ιωνίας, αλλά
πιθανώς ουδαμού υποχρεωτική και δεσπόζουσα· οπωςδήποτε τούτο
είναι βέβαιον, ότι ο νόμος εκείνος ήτο σπουδαία αρχή, όπως
οριστικώς αφαιρεθή το έπος εκ των χειρών των ραψωδών.

Γινώσκομεν ότι κάτοχοι του έπους εν τη Ιωνία ήσαν οι «Ομηρίδαι» ή


«ραψωδοί», και έχομεν τεκμήρια, ότι ούτοι απετέλουν εταιρείας ή
σχολάς (63). Γινώσκομεν δε καθόλου πώς απήγγελλεν ο ραψωδός·
ηδύνατο δηλαδή να εκλέξη το θέμα του εξ οιουδήποτε μύθου, καθώς
οι αοιδοί της Οδυσσείας (64)· είχε δε πιθανώς στίχους τινάς ως
εισαγωγήν — τούτο λέγει ο Πίνδαρος, οι δε Ομηρικοί ύμνοι
δεικνύουσι τι εννοεί — και πιθανώς στίχους τινάς ως τέλος. Πάντως
δε θα εδοκίμαζε να παρεμβάλη στίχους ιδίους και επεισόδια, διά να
καταστήση την ραψωδίαν του τερπνήν όσον ήσαν και των άλλων.
Ώστε θ' απέρριπτε παν καθωρισμένον κείμενον, και θ' απέκρουε
πάσαν υποταγήν των μερών εις έν όλον.

Τα σωζόμενα έπη γέμουσι τοιούτων ιχνών των ραψωδών· ταύτα


είναι αναπτύξεις των απαγγελλομένων μύθων και όπου δεν υπάρχει
αρκετή ενότης και συνοχή, έχουσι πολλά τα τρωτά. Ούτω λόγου
χάριν, εν τω Ε η υπεράνθρωπος αριστεία του Διομήδους επισκιάζει
τον Αχιλλέα και διασπά την πλοκήν της Ιλιάδος. Αλλά τι έμελε τούτο
τον ραψωδόν, τον επιζητούντα επευφημίας και αποτεινόμενον προς
ακροατάς, αγαπώντας τον Διομήδη; Η Δολώνεια του Κ εκεί, όπου
ευρίσκεται, δεν είναι δυνατή· διότι όχι μόνον παρατείνει τεραστίως
μίαν νύκτα, αλλά και διχοτομεί συνεχή διήγησιν. Αλλά χωριστή θα
ήτο θαυμασία. Άλλο παράδειγμα είναι η περιγραφή καθαράς νυκτός,
καθ' ήν υπάρχει νηνεμία

εκ τ' έφανεν πάσαι σκοπιαί και πρώονες άκροι


και νάπαι· ουρανόθεν δ' άρ' υπερράγη άσπετος
αιθήρ.

{when all the high peaks stand out, and the jutting promontories
and glens; and above the sky the infinite heaven breaks open!}

Ταύτα υπάρχουσιν εν τω θ 557, όπου αι πυραί των Τρώων


παραβάλλονται προς άστρα· αλλ' υπάρχουσι και εν τω Π 299, όπου η
στενοχωρία των Δαναών παρέρχεται ως νεφέλη, αφήνουσα καθαράν
νύκτα. Οι σχολιασταί διαφωνούσι πού ήτο η αρχική θέσις. Πανταχού
και οπουδήποτε. Τοιούτοι ωραίοι στίχοι, άπαξ ακουόμενοι, ήσαν
πειρασμός παντός ραψωδού και ήτο επόμενον να ευρίσκωνται όπου
εδίδετο αφορμή. Το αυτό και περί των πολλαπλών παρομοιώσεων
του Β 455 κεξ., δηλαδή δεν απηγγέλλοντο πάσαι ομού, αλλ' εξ αυτών
ο ραψωδός εξέλεγε την αρέσκουσαν.

Αλλά και όπου η σύνθεσις φαίνεται άψογος, αι μεταξύ των


επεισοδίων συνεκτικαί φράσεις «ως οι μεν τοιαύτα προς αλλήλους
αγόρευαν» «ως έφατ' ευχόμενος» {Thus then did they fight, Thus
then did they pray} και αι αρχαί άλλων θεμάτων διά φράσεων, ως
«ήμος δ' ηριγένεια φάνη», {Thus rose Dawn from her bed}
υποδηλούσιν ότι άλλος ραψωδός ήρχιζεν εκ του μέσου ενός επικού
συνόλου, τα δε προηγούμενα και τα επόμενα εθεωρούντο
οπωςδήποτε γνωστά εις τους ακροατάς.

Αλλά περί των σωζομένων ομηρικών επών το θαυμαστόν είναι όχι ότι
έχουσιν ίχνη των χειρών των ραψωδών, αλλά ότι δεν έχουσι και
περισσότερα. Όπως ευρίσκονται σήμερον, δεν είναι κατάλληλα εις
ραψωδίαν. Διότι ως σύνολα είναι παραπολύ μακρά προς απαγγελίαν,
πλην εξαιρετικής τινος ευκαιρίας, ως η τότε νομοθετηθείσα, και
αρκετά συμπαγή, ώστε δυσκόλως να καταμερίζωνται εις
αποσπάσματα στρογγύλα, είναι δε απίθανον ότι ο νόμος προςέδωκεν
εις αυτά την παρούσαν μορφήν διά μιας. Απέβλεπε μάλλον εις την
ορθήν συνέχειαν της αληθινής αφηγήσεως. Δεχόμενος δε ραψωδούς
(65), επέτρεπε πιθανώς εις αυτούς ελευθερίαν εις τον διάκοσμον, και
δεν επέβαλλε την προςκόλλησιν εις τας λέξεις του κειμένου.

Την ταξινόμησιν ταύτην μαρτυρεί η όλη ιστορία των επών κατά τον
τέταρτον π. Χ. αιώνα, σπουδαίον δε είναι, ότι ταύτα όπως είναι
σήμερον οργανικώς αδιαίρετα, προσαρμόζονται μάλλον εις τας
απαιτήσεις αναγνωστών· αναγνώστας δε πολλούς ούτε αι Αθήναι,
ούτε η Ιωνία είχε περί το 470 π. Χ. Τότε ο μεν Αναξίμανδρος έγραψε
τα σοφά του διδάγματα χάριν ολίγων μαθητών, όπως
απομνημονεύσωσιν αυτά, ο δε Ξενοφάνης απετείνετο κυρίως διά
στίχων εις τα ώτα· μόλις 40 έτη βραδύτερον ο μεν Ηρόδοτος
συνέπηξε τας διηγήσεις του εις βιβλίον χάριν των φιλομούσων προς
ιδιαιτέραν ανάγνωσιν, ο δ' Ευριπίδης ήρχισε να συνάγη βιβλία.

Τούτο συντελεί όπως εννοήσωμεν πώς έζη και πώς ανεπτύσσετο το


ιωνικόν έπος, πριν μεταφυτευθή. Δηλαδή απηγγέλλετο, δεν
ανεγινώσκετο· τα επεισόδια της Ιλιάδος και της Οδυσσείας είχον
κατά το πλείστον την υπάρχουσαν τάξιν, και τα έπη είχον περίπου το
σημερινόν μάκρος, αν και βεβαίως υπήρχον Ιλιάδες χωρίς Κ και
Οδύσσειαι, λήγουσαι εκεί, όπου και ο Αρίσταρχος επέραινε το έπος,
παραλείπων 1 1/2 ραψωδίαν, ήτοι εις το ψ 296. Αλλά το
σπουδαιότερον, η Ιλιάς δεν έληγε κατ' ανάγκην εις την ταφήν του
Έκτορος. Διότι γινώσκομεν έκδοσιν, εξακολουθούσαν μετά τον
τελευταίον ημών στίχον

Ως οί γ' αμφίεπον τάφον Έκτορος, ήλθε δ'


Αμαζών (66)

{So dealt they with the burying of Hector; but there came the
Amazon, daughter of Ares, great-hearted slayer of men}

και διηγουμένην τον έρωτα του Αχιλλέως προς την Αμαζόνα, τον
φόνον αυτής υπ' αυτού, ίσως δε και τον ανδρείον θάνατον και
τούτου. Διότι ο θάνατος του Αχιλλέως, καθώς ενόησεν ο Γκαίτε, είναι
το απαιτούμενον τέλος της σωζομένης Ιλιάδος. Ότε ο αθάνατος
ίππος Ξάνθος και ο αποθνήσκων Έκτωρ προλέγουσιν αυτόν,
αισθανόμεθα ότι οι λόγοι των πρέπει να επαληθεύσωσι, διότι άλλως ο
μύθος δεν έχει έννοιαν. Και αν ήτο πράγματι κανείς εκ των
επιφανεστέρων Ομηριδών ο απεικονίσας το τελευταίον εκείνο
ψυχορράγημα, ότε όχι πλέον ο Κεβριόνης ή ο Πάτροκλος, αλλ' αυτός
ο Αχιλλεύς

κείτο μέγας μεγαλωστί, λελασμένος


ιπποσυνάων,

{under the blind dust-storm, the mighty limbs flung mightily, and the
riding of war forgotten,}

Ο κόσμος πρέπει να μνησικακή κατ' εκείνων, οίτινες εξ υπερβολικής


φιλοπατρίας δεν ηνείχοντο τέλος του εθνικού έπους, καταλήγον εις
θρίαμβον των Τρώων.

Εννοείται ότι ο ιωνικός Όμηρος δεν είχεν «Αθηναϊκάς παρεμβολάς»


ήτοι χωρία ως το εγκώμιον του Μενεσθέως, η περί Σαλαμίνος
αξίωσις, η μνεία του Θησέως, της Φαίδρας και της Αριάδνης και
τέλος των Αθηναίων, οίτινες καταλέγονται ως «Ιάονες ελκεχίτωνες»
{ long-robed Ionians}, πολεμούντες ως πεζικόν τάγμα (Ν 685). Προ
πάντων δε η γλώσσα του έπους, ει και μη καθαρά, ήτο τουλάχιστον
αρκετά διάφορος του κοινού ημών κειμένου· ήτο δηλαδή
απηλλαγμένη αττικισμών.

Η ΕΠΙΚΗ ΔΙΑΛΕΚΤΟΣ

Πρέπει ν' αναλύσωμεν την διάλεκτον ταύτην και να ίδωμεν την


ιστορικήν αυτής ανάπτυξιν.
Αρχαία και μυκτηρισθείσα διαίρεσις της ελληνικής γλώσσης ήτο η εις
τέσσαρας διαλέκτους, ιωνικήν, αιολικήν, δωρικήν και «επικήν».
Τούτων αι μεν τρεις πρώται, σημαίνουσιν ή εμφαίνουσιν
πραγματικάς φυλετικάς διακρίσεις, η δ' «επική» είναι προδήλως
τεχνητόν όνομα. Αλλά και το δηλούμενον πράγμα είν' επίσης
τεχνητόν — γλώσσα, ήν ούτε οι Ίωνες, ούτε οι Δωριείς, ούτε οι
Αιολείς ελάλησάν ποτε· πλουσία γλώσσα, ρυθμική και κινητική,
πολυσύνθετόν τι όργανον προς έκφρασιν του ηρωικού μύθου·
διάλεκτος, ως ελέχθη, υποκειμένη καθ' εκάστην φράσιν εις τας
απαιτήσεις του επικού μέτρου· τα στερεότυπα αυτών επίθετα, οι
φραστικοί τύποι, αι τροπαί του λόγου οιονεί βαίνουσιν επί του
εξαμέτρου. Αλλά ενώ υπό μίαν έποψιν είναι τεχνητή, εξ άλλου
εμποιεί την εντύπωσιν αυτής της φύσεως λαλούσης. Κοιναί και
τυχαίαι φράσεις

[Λ 492] ως δ' οπότε πλήθων ποταμός πεδίονδε


κάτεισιν . . . .

{ down from the hills on their head}

[Ο 626]. . . ανέμοιο δε δεινός αήτη| ιστίω


εμβρέμεται

{high West wind shouting over a wine-faced sea}

φαίνονται ζωνταναί· δεν αποδίδουσι μεν τον θόρυβον ακριβώς ή τον


ήχον, αλλά την όλην αισθητικήν εντύπωσιν χειμάρρου και ανέμου. Αι
δε περί ανθρωπίνων αισθημάτων εκφράσεις είν' έτι μαγικώτεραι·

[τ,18] τέτλαθι δη, κραδίη, και κύντερον άλλο


ποτ έτλης.

{Bear, O my heart, thou hast borne yet a harder thing.}

Δεν υποβιβάζομεν λοιπόν την επικήν διάλεκτον, λέγοντες ότι, όπως


έχει, δεν είναι γλώσσα, αλλά μείγμα γλωσσικώς ασυμφύλων τύπων,
νεωτέρων και πρωτογενών.
Υπάρχουσι πρώτον αττικισμοί. Τύποι καθώς Τυδή, έως, νικώντες
μόνον επί αττικής γης ηδύναντο να ειςχωρήσωσιν εις τα έπη και
μάλιστα όχι πολύ προ του 500 π. Χ. Τουλάχιστον ταποσπάσματα των
νόμων του Σόλωνος φαίνονται εν τω συνόλω αρχαϊκώτερα. Αλλά
χάριν ακριβολογίας πρέπει να διακρίνωμεν πρώτον μεν τους
αντικαταστατούς αττικισμούς — π. χ. υπάρχουσι στίχοι αρχόμενοι
από του έως και μετρικώς επανορθούμενοι μόνον διά του Ιωνικού
ήος, είναι δηλ. κατά τάλλα δόκιμοι ιωνικοί στίχοι, ο δε αττικός τύπος
απλούν σφάλμα του Αθηναίου βιβλιογράφου, — έπειτα δε τους
αναποσπάστους αττικισμούς, δηλ. στίχους, μετρικώς ορθούς, όπως
ευρίσκονται, αλλά χωλαίνοντας, εάν οι τύποι τραπώσιν εις ιωνικούς·
οι στίχοι ούτοι βεβαίως είναι μεταγενέστεροι, συντεθέντες εν τη
Αττική, αφού αι Αθήναι παρέλαβον το έπος.

Υπάρχουσι δε και πολυάριθμοι τύποι νόθοι — δηλαδή απόπειραι,


γενόμεναι υπό Αθηναίου ραψωδού ή βιβλιογράφου προς
συνδυασμόν δυσνοήτου Ιωνικού τύπου και του ιδίου αττικού, οσάκις
ο αττικός δεν ήρμοζεν εις το μέτρον. π.χ. ο ιωνικός ήτο ορέοντες, ο
δε αττικός ορώντες, ήτοι τρεις συλλαβαί αντί τεσσάρων· τα ημέτερα
κείμενα παρέχουσιν ορόωντες, δηλαδή διέστρεψαν τον αττικόν
τύπον διά παρατάσεως του ω. Ομοίως το σπείους είναι απόπειρα
προς αντικατάστασιν του ασυναιρέτου σπέεος διά του αττικού
σπέους και το ευχετάασθαι είναι παράτασις του ευχετάσθαι. Η γραφή
βεβαίως ηκολούθει την προφοράν· ο γραφεύς δηλ. έγραφεν ό,τι
έλεγεν ο απαγγέλλων.

Αι τοιαύται μεταβολαί θα συνέβησαν μόνον ότε αι Αθήναι δεν


ηδύναντο ν' αποβλέψωσιν αλλού προς ακριβεστέραν πληροφορίαν,
ότε δηλαδή δεν υπήρχον ιωνιστί λαλούντες αοιδοί, ώστε να
διορθώσωσι τους Αθηναίους βιβλιογράφους. Μερικοί μάλιστα τότε
μόνον δεν θα εφαίνοντο ανόητοι, ότε η κοινή λεγομένη διάλεκτος
ήρχισε να συγχέη τα πραγματικά ιδιώματα και να δανείζεται τα πάντα
εκ της αττικής, δηλαδή θα επλάσθησαν περί τα τέλη του τετάρτου π.
Χ. αιώνος.
Και ο μεν αποχωρισμός των αττικών τύπων είναι ευκολώτατος·
υπάρχει όμως και άλλο μη ιωνικόν στοιχείον της Ομηρικής γλώσσης,
πάντοτε αναγνωρισθέν, αλλ' από των αρχαίων ήδη χρόνων διαφόρως
εκτιμώμενον, όπερ φαίνεται ότι ανήκεν εις το σύμπλεγμα των
διαλέκτων, των λαλουμένων εν Θεσσαλία, Λέσβω και τη Αιολική
παραλία της Ασίας, περιλαμβανομένης και της Τρωάδος. Τύποι,
καθώς Ατρείδαο, Μουσάων, κεν αντί αν, πίσυρες αντί τέσσαρες,
σύνθετα διά του ερι- , επίθετα εις -εννος και πολλαί ρημάτων
εγκλίσεις απεδείχθησαν αιολικαί, επίσης δε και πολλαί λέξεις, ως
πολυπάμμονος, Θερσίτης, άμυδις.

Αλλ' υπάρχει και άλλη πρωιμωτέρα τάξις «νόθων τύπων», ούτ'


αιολικών, ούτε ιωνικών, αλλ' εξηγουμένων μόνον εκ της αναμείξεως
αμφοτέρων. Π. χ. το κεκληγώτες δεν είναι γνήσιον· είναι το αρχικώς
αιολικόν κεκλήγοντες συνδυαζόμενον καθόσον επιτρέπει το μέτρον
προς το ιωνικόν κεκληγότες. Το ηπύτα κήρυξ είναι το αιολικόν
άπυτα, συνδυαζόμενον κατά το μέτρον προς το ιωνικόν ηπύτης.
Σπουδαιοτάτη δε πασών είναι η χρήσις του F, δίγαμμα ή βαυ, ήχου
παρομοίου προς το αγγλικόν W, όστις ηφανίσθη εκ της ιωνικής και
της αττικής διαλέκτου και εν τω μέσω λέξεως (ως εις το αγγλικόν
Νorwich, Berwich) και εν τη αρχή (όπως εις το who και το
λαγκαστριανόν 'ooman). Επέζησεν όμως εν ταις δωρικαίς επιγραφαίς,
και όπου της Αιολίδος δεν κατίσχυσεν η ιωνική, μέχρι του πέμπτου
και ενιαχού του τετάρτου π. Χ. αιώνος· υπό δε των αρχαίων
ωνομάζετο «αιολικόν γράμμα». Υπάρχουσι λοιπόν 3354 χωρία των
επών, απαιτούντα την αποκατάστασιν του δίγαμμα — , δηλ. οι στίχοι
χωλαίνουσιν άνευ αυτού· εξ άλλου υπάρχουσιν 617 χωρία, όπου
κατά την αρχαίαν αιολικήν έπρεπε να υπάρχη, αλλά το μέτρον δεν
επιτρέπει τούτο. Δηλαδή το μέγα μέρος των επών εφύλαξε την
συνήθειαν και την παράδοσιν της αιολικής προφοράς, μικρόν δε
μόνον μέρος την ιωνικήν.

Τα γεγονότα ταύτα συνεζητήθησαν σφοδρότατα· αλλ' ο μόνος


τρόπος προς ελάττωσιν της σημασίας αυτών είναι ν' αποδειχθή ότι
πάντα δεν είναι αιολικά λείψανα του εβδόμου αιώνος, αλλά
πανάρχαιοι ελληνικοί τύποι ανερχόμενοι εις χρόνους, ότε τα επί της
Welcome to our website – the perfect destination for book lovers and
knowledge seekers. We believe that every book holds a new world,
offering opportunities for learning, discovery, and personal growth.
That’s why we are dedicated to bringing you a diverse collection of
books, ranging from classic literature and specialized publications to
self-development guides and children's books.

More than just a book-buying platform, we strive to be a bridge


connecting you with timeless cultural and intellectual values. With an
elegant, user-friendly interface and a smart search system, you can
quickly find the books that best suit your interests. Additionally,
our special promotions and home delivery services help you save time
and fully enjoy the joy of reading.

Join us on a journey of knowledge exploration, passion nurturing, and


personal growth every day!

ebookbell.com

You might also like