(Ebook) An Introduction to Spatial Data Science with GeoDa: Volume 2 – Clustering Spatial Data by Luc Anselin ISBN 9781032713021, 103271302Xpdf download
(Ebook) An Introduction to Spatial Data Science with GeoDa: Volume 2 – Clustering Spatial Data by Luc Anselin ISBN 9781032713021, 103271302Xpdf download
https://ebooknice.com/product/an-introduction-to-spatial-data-science-with-
geoda-volume-2-clustering-spatial-data-56921558
https://ebooknice.com/product/spatial-analysis-using-big-data-methods-and-
urban-applications-spatial-econometrics-and-spatial-statistics-38430000
https://ebooknice.com/product/principles-of-modeling-uncertainties-in-
spatial-data-and-spatial-analyses-1901536
https://ebooknice.com/product/spatial-data-infrastructures-at-work-
analysing-the-spatial-enablement-of-public-sector-processes-5219044
(Ebook) Displaying Time Series, Spatial, and Space-Time Data
with R, Second Edition by Oscar Perpinan Lamigueiro ISBN
9781138089983, 1138089982
https://ebooknice.com/product/displaying-time-series-spatial-and-space-
time-data-with-r-second-edition-10815792
https://ebooknice.com/product/displaying-time-series-spatial-and-space-
time-data-with-r-second-edition-37579272
https://ebooknice.com/product/building-european-spatial-data-
infrastructures-51371242
https://ebooknice.com/product/introduction-to-data-science-data-analysis-
and-prediction-algorithms-with-r-11731248
https://ebooknice.com/product/spatial-data-analysis-theory-and-
practice-2093338
An Introduction to Spatial
Data Science with GeoDa
Volume 2 – Clustering Spatial Data
This book is the second in a two-volume series that introduces the field of spatial data sci-
ence. It moves beyond pure data exploration to the organization of observations into meaningful
groups, i.e., spatial clustering. This constitutes an important component of so-called unsuper-
vised learning, a major aspect of modern machine learning.
The distinctive aspects of the book are both to explore ways to spatialize classic clustering meth-
ods through linked maps and graphs, as well as the explicit introduction of spatial contiguity
constraints into clustering algorithms. Leveraging a large number of real-world empirical il-
lustrations, readers will gain an understanding of the main concepts and techniques and their
relative advantages and disadvantages. The book also constitutes the definitive user’s guide for
these methods as implemented in the GeoDa open-source software for spatial analysis.
It is organized into three major parts, dealing with dimension reduction (principal components,
multidimensional scaling, stochastic network embedding), classic clustering methods (hierar-
chical clustering, k-means, k-medians, k-medoids and spectral clustering) and spatially con-
strained clustering methods (both hierarchical and partitioning). It closes with an assessment of
spatial and non-spatial cluster properties.
The book is intended for readers interested in going beyond simple mapping of geographical
data to gain insight into interesting patterns as expressed in spatial clusters of observations.
Familiarity with the material in Volume 1 is assumed, especially the analysis of local spatial au-
tocorrelation and the full range of visualization methods.
Luc Anselin is the Founding Director of the Center for Spatial Data Science at the University
of Chicago, where he is also Stein-Freiler Distinguished Service Professor of Sociology and the
College, as well as a member of the Committee on Data Science. He is the creator of the GeoDa
software and an active contributor to the PySAL Python open-source software library for spatial
analysis. He has written widely on topics dealing with the methodology of spatial data analysis,
including his classic 1988 text on Spatial Econometrics. His work has been recognized by many
awards, such as his election to the U.S. National Academy of Science and the American Academy
of Arts and Science.
Taylor & Francis
Taylor & Francis Group
http://taylorandfrancis.com
An Introduction to Spatial
Data Science with GeoDa
Volume 2 – Clustering Spatial Data
Luc Anselin
Designed cover image: © Luc Anselin
Reasonable efforts have been made to publish reliable data and information, but the author and publisher cannot as-
sume responsibility for the validity of all materials or the consequences of their use. The authors and publishers have
attempted to trace the copyright holders of all material reproduced in this publication and apologize to copyright holders
if permission to publish in this form has not been obtained. If any copyright material has not been acknowledged please
write and let us know so we may rectify in any future reprint.
Except as permitted under U.S. Copyright Law, no part of this book may be reprinted, reproduced, transmitted, or
utilized in any form by any electronic, mechanical, or other means, now known or hereafter invented, including pho-
tocopying, microfilming, and recording, or in any information storage or retrieval system, without written permission
from the publishers.
For permission to photocopy or use material electronically from this work, access www.copyright.com or contact the
Copyright Clearance Center, Inc. (CCC), 222 Rosewood Drive, Danvers, MA 01923, 978-750-8400. For works that are
not available on CCC please contact [email protected]
Trademark notice: Product or corporate names may be trademarks or registered trademarks and are used only for iden-
tification and explanation without intent to infringe.
DOI: 10.1201/9781032713175
List of Figures xi
Preface xvii
Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii
1 Introduction 1
1.1 Overview of Volume 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Sample Data Sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I Dimension Reduction 5
2 Principal Component Analysis (PCA) 7
2.1 Topics Covered . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Matrix Algebra Review . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Eigenvalues and eigenvectors . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Matrix decompositions . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Principal Components . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.1 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.2 Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Visualizing principal components . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.1 Scatter plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.2 Multivariate decomposition . . . . . . . . . . . . . . . . . . . . . . . 20
2.5 Spatializing Principal Components . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.1 Principal component map . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.2 Univariate cluster map . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.3 Principal components as multivariate cluster maps . . . . . . . . . . 22
vii
viii Contents
II Classic Clustering 63
5 Hierarchical Clustering Methods 65
5.1 Topics Covered . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.2 Dissimilarity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.3 Agglomerative Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.3.1 Linkage and Updating Formula . . . . . . . . . . . . . . . . . . . . . 69
5.3.2 Dendrogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.4 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.4.1 Variable Settings Dialog . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.4.2 Ward’s method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5.4.3 Single linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.4.4 Complete linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.4.5 Average linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.4.6 Sensitivity Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
IV Assessment 189
12 Cluster Validation 191
12.1 Topics Covered . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
12.2 Internal Validity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
12.2.1 Traditional Measures of Fit . . . . . . . . . . . . . . . . . . . . . . . 193
12.2.2 Balance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
12.2.3 Join Count Ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
12.2.4 Compactness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
12.2.5 Connectedness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
12.2.6 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
12.3 External Validity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
12.3.1 Classic Measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
12.3.2 Visualizing Cluster Match . . . . . . . . . . . . . . . . . . . . . . . . 200
12.4 Beyond Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
Bibliography 205
Index 211
List of Figures
xi
xii List of Figures
12.1 Clusters > Cluster Match Map | Make Spatial | Validation . . . . . . . . 192
12.2 Hierarchical Clustering – Ward’s method, Ceará . . . . . . . . . . . . . . . 196
12.3 Internal Validation Measures . . . . . . . . . . . . . . . . . . . . . . . . . . 196
12.4 Internal Validation Result – Hierarchical Clustering . . . . . . . . . . . . . 197
12.5 Internal Validation Result – AZP with Initial Region . . . . . . . . . . . . 198
12.6 Adjusted Rand Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
12.7 Normalized Information Distance . . . . . . . . . . . . . . . . . . . . . . . 200
12.8 K-Means and SKATER overlap . . . . . . . . . . . . . . . . . . . . . . . . . 201
12.9 SCHC and REDCAP overlap . . . . . . . . . . . . . . . . . . . . . . . . . . 201
12.10 Cluster Match Map – SKATER and K-MEANS . . . . . . . . . . . . . . . 202
Taylor & Francis
Taylor & Francis Group
http://taylorandfrancis.com
Preface
In contrast to the materials covered in Volume 1, this second volume has no precedent in
an earlier workbook. Much of its contents have been added in recent years to the GeoDa
documentation pages, as the topics were gradually included into my Introduction to Spatial
Data Science course and implemented in GeoDa. At one point, the material became too much
to constitute a single course and was split off into a separate Spatial Clustering course. The
division of the content between the two volumes follows this organization.
In contrast to the first volume, where the focus is almost exclusively on data exploration,
here attention switches to the delineation of groupings of observations, i.e., clusters. Both
traditional and spatially constrained methods are considered. Again, the emphasis is on how
a spatial perspective can contribute to additional insight, both by considering the spatial
aspects explicitly (as in spatially constrained clustering) as well as through spatializing
classic techniques.
Compared to Volume 1, the treatment is slightly more mathematical and familiarity with the
methods covered in the first volume is assumed. As before, extensive references are provided.
However, in contrast to the first volume, several methods included here are new and have
not been treated extensively in earlier publications. They were typically introduced as part
of the documentation of new features in GeoDa.
The empirical illustrations use the same sample data sets as in Volume 1. These are included
in the software.
All applications are based on Version 1.22 of the software, available in Summer 2023. Later
versions may include slight changes as well as additional features, but the treatment provided
here should remain valid. The software is free, cross-platform and open source, and can be
downloaded from https://geodacenter.github.io/download.html.
Acknowledgments
This second volume is based on enhancements in the GeoDa software implemented in the
past five or so years, with Xun Li as the lead software engineer and Julia Koschinsky as
a constant source of inspiration and constructive comments. The software development
received institutional support by the University of Chicago to the Center for Spatial Data
Science.
Help and suggestions with the production process from Lara Spieker of Chapman & Hall is
greatly appreciated.
As for the first volume, Emily has been patiently living with my GeoDa obsession for many
years. This volume is also dedicated to her.
Shelby, MI, Summer 2023
xvii
Taylor & Francis
Taylor & Francis Group
http://taylorandfrancis.com
About the Author
Luc Anselin is the Founding Director of the Center for Spatial Data Science at the University
of Chicago, where he is also Stein-Freiler Distinguished Service Professor of Sociology and the
College. He previously held faculty appointments at Arizona State University, the University
of Illinois at Urbana-Champaign, the University of Texas at Dallas, the Regional Research
Institute at West Virginia University, the University of California, Santa Barbara, and The
Ohio State University. He also was a visiting professor at Brown University and MIT. He
holds a PhD in Regional Science from Cornell University.
Over the past four decades, he has developed new methods for exploratory spatial data
analysis and spatial econometrics, including the widely used local indicators of spatial
autocorrelation. His 1988 Spatial Econometrics text has been cited some 17,000 times. He
has implemented these methods into software, including the original SpaceStat software, as
well as GeoDa, and as part of the Python PySAL library for spatial analysis.
His work has been recognized by several awards, including election to the U.S. National
Academy of Sciences and the American Academy of Arts and Sciences.
xix
Random documents with unrelated
content Scribd suggests to you:
Jim Airth istui sokeasti Myrasta kauimpana olevalle tuolille, laski
kyynärpäät polvilleen ja painoi kasvot käsiinsä.
Jim Airthilla oli vain yksi kysymys kysyttävänä. Hän lausui sen
kohottamatta päätään.
"Kun ensin sain kuulla sinun tulleen sodasta, kun käsitin että olet
varmaankin tuntenut Mikaelin, ylistin tohtorin viisautta siinä että hän
oli saanut minut luopumaan omasta nimestäni. Murgatroyditkin
olisivat heti tunteneet sen, eikä minulla olisi ollut mitään rauhaa. Nyt
tuli Amelia Murgatroyd vain sattumalta puhuneeksi
seurusteluhuoneessa 'suloisesta lady Ingleby-raukasta', antaen
meidän ymmärtää hänen olevan läheisesti tuttu hänen kanssaan. Ja
sitten — oi, Jim! — kun tulin tuntemaan 'maailmanrannan cowboyni',
kun hän kertoi minulle vihaavansa arvonimiä ja kaikkea niihin
kuuluvaa, silloin minä todella siunasin hetkeä, jolloin olin merkinnyt
itseni vieraskirjaan yksinkertaisesti 'rouva O'Maraksi', ja päätin olla
ilmaisematta hänelle arvonimeäni ennenkuin vasta sitten, kun hän
rakastaisi minua kyllin paljon ollakseen siitä piittaamatta tai kaipaisi
minua kyllin paljon muuttaakseen minut lady Inglebystä
yksinkertaiseksi mrs Jim Airthiksi — vaihtaen kotini Shenstonen
linnasta minne ikinä hän haluaisi!"
Myra oli syvästi loukkaantunut, mutta hän oli nainen ja hän rakasti
Jimiä. Hän odotti kärsivällisenä nähdäkseen hänen rakkautensa
häneen kohoavan voitokkaana arvottoman ylpeyden yläpuolelle.
"En voi kestää sitä vielä", hän virkkoi hitaasti. "Minun täytyy olla
yksinäni. Minun olisi pitänyt tietää heti alusta, että sinä olit — olet —
lady Ingleby. Olen hyvin pahoillani että sinun on kärsittävä
sellaisesta mihin itse et ole syyllinen. Minun täytyy — nyt — lähteä.
Neljänkolmatta tunnin kuluttua tulen takaisin puhumaan tästä
enemmän."
Seitsemästoista luku.
"TIESITTE KAI?"
Hänestä oli ollut mieluista kutsua Jim Airthia cowboyksi. Hän tiesi
hänen olevan tunnustetusti maailmanrantalaisen. Mutta oliko hän
myöskin halpamaisen ylpeyden orja? Jos hän itse oli pelkkä Jim
Airth, katsoiko hän karsaasti jalosyntyisyyden ja vanhan sukupuun
takia niihin, joille ne oikeudenmukaisesti kuuluivat? Jos hän ilmotti
halveksivansa arvonimiä, antoiko hän todella niille niin liiotellun
suuren merkityksen, että hän kääntyisi pois siitä naisesta, jonka hän
aikoi ottaa vaimokseen, vain sen vuoksi että tällä oli arvonimi, kun
hänellä itsellään taas ei sellaista ollut?
"Te rakkaat pojat!" sanoi hän. "En ole milloinkaan ollut sen
iloisempi teitä tavatessani! Painakaa puuta; vai oletteko tulleet
pelaamaan tennistä?"
"Siinä tapauksessa", sanoi Billy, "hän on sama mies, joka tuli meitä
vastaan karaten asemalle päin ikäänkuin kaikki raivottaret olisivat
olleet hänen kintereillään. Hän ei katsonut oikealle eikä vasemmalle
eikä paljon eteensäkään, niin että meidän metsästysvaunujemme
täytyi väistyä tiepuoleen! Niinmuodoin hän ei nähnyt kahta vanhaa
toveriaan eikä kuullut heidän huutoaan. Mutta ei voi olla mahdollista
että hän olisi paennut teidän arvonimeänne, rakas lady, enempää
kuin omaisuuttannekaan, sillä hänen oma arvonimensä on vanhimpia
mitä Skotlannin historia tuntee, ja tiluksensa käsittävät
peninkulmittain kankaita ja virtoja ja metsiä. Tiesitte kai, että tämä
mies, joka kutsui itseään 'Jim Airthiksi' ollessaan karjafarmin
omistajana Lännessä ja vieläkin käyttää sitä kirjailijanimenään, on
kotioloissaan James, Airthin ja Monteithin jaarli; hienoin Skotlannin
vanhoista aatelisnimistä!"
Kahdeksastoista luku.
Myra oli nyt mielessään varma siitä että syy oli hänen, ja hän kärsi
siitä vähemmän kuin luullessaan Jimiä syylliseksi. Kuitenkin hän oli
kovasti ymmällä. Sillä jos Airthin ja Monteithin jaarli voi kirjottaa
nimekseen "Jim Airth" Moorheadin majatalon päiväkirjaan tulematta
moitteenalaiseksi, miksi ei silloin lady Ingleby Shenstonen linnasta
voinut ottaa yhtä yksinkertaista nimeä tekemättä itseään syypääksi
anteeksiantamattomaan rikokseen?
*****
"Kuule, Billy! Sinähän tunnet naiset." Ensi kerran Ronnie nyt teki
tämän myönnytyksen. "Etkö luule, että jos — jos nainen kääntyisi
kammoten pois rakastamastaan miehestä, hän saattaisi — jos toinen
olisi tahdikkaasti saapuvilla — kääntyä tuon toisen puoleen, joka jo
kauan on häntä rakastanut ja josta hän epäilemättä on pitänyt."
*****
"Lady Ingleby", sanoi hän; "on eräs asia, joka meidän molempien,
Ronnien ja minun, mielestä teidän tulisi tietää."
"Se mies, joka teki erehdyksen", sanoi hän, "ja laukaisi miinan
liian aikaisin; se mies, joka vahingossa surmasi lordi Inglebyn, oli
sama jota te kutsutte Jim Airthiksi."
Yhdeksästoista luku.
Kun hetki läheni, hän soitti kelloa. "Groatley", sanoi hän kun
kellarimestari astui sisään, "Airthin jaarli, joka oli täällä eilen, tulee
jälleen käymään täällä nyt iltapäivällä. Kun hänen armonsa tulee,
voitte ohjata hänet tänne. En ole kotona kellekään muulle. Teidän ei
tarvitse tuoda teetä ennenkuin soitan." Sitten hän istuutui levollisesti
odottaen. Hän oli jälleen pukeutunut surupukuun, joka tilapäisesti oli
ollut syrjäytettynä. Musta puku riippui hänen ympärillään pehmein
laahustavin laskoksin, lisäten hänen solakan vartalonsa sulavaa
pituutta. Valkeat leskeyden merkit kaulassa ja ranteilla antoivat
hänen tavattomalle kauneudelleen liikuttavan surumielisyyden ja
yksinäisyyden leiman. Hänen kasvonsa olivat hyvin kalpeat;
sinertävät varjot väsyneitten silmien alla olivat merkkinä kyynelistä ja
unettomuudesta. Mutta suloisten silmien tyyni ja varma katse ilmaisi
kaikista epäilyksistä vapaata mieltä ja täysin levollista sydäntä.
Askeleita hallissa.
"Billy kertoi minulle. Hän ja Ronald Ingram tulivat tänne eilen, pian
sen jälkeen kun sinä olit lähtenyt. He olivat tulleet sinua vastaan
tiellä. He ajattelivat että minun pitäisi tulla tietämään. Ja siksi Billy
kertoi."
"Olen tullut sanomaan hyvästi, Myra. Siinä on kaikki mitä nyt enää
on sanottavana."
Jim Airth istui — sille tuolille, joka oli jäänyt tyhjäksi lordi
Inglebyltä ja pikku Petteriltä.
"Myra, minä olisin antanut koko elämäni, jos olisin sillä saanut
takaisin tuon ainoan minuutin. Ja hulluksi olin tulla kun tiesin, että
räjähdyksen olisi aivan hyvin voinut toimittaa jotain vanhaa
sytytyslankaa käyttämällä. Mutta me olimme niin innostuneet uuteen
merkinantojärjestelmäämme ja kannettavaan sähköpatteriimme! Oi
hyvä Jumala! Mitä epätoivon tuskia tunsinkaan noina päivinä ja öinä!
Olin kuumehoureissa, ja ne korjasivat luotani miekkani, ampuma-
aseet ja partaveitset. En voinut ymmärtää, minkätähden. En
epätoivoisenakaan turvautuisi semmoisiin keinoihin. Jos kuka
hyvänsä olisi tullut telttaani ja sanonut minulle: 'Et ole lainkaan
surmannut Inglebytä. Hän on elossa ja voi hyvin!' niin olisin ilolla
antanut elämäni sen hetken suloisuudesta. Mutta mikään myöhempi
katumus ei voi tehdä aikaisempaa erehdystä olemattomaksi."
Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.
ebooknice.com