Linked Data: Introductie

Jun 22, 2020Download as PPTX, PDF0 likes477 views

Bart Hanssens

Korte, niet al te technische, inleiding tot linked data

Probleem
2
Hoe kunnen we
het WWW
verstaanbaarder
maken voor
machines ?

Wat wij op websites lezen (en begrijpen)
3

Wat een machine ziet (en maar deels begrijpt)
4

(Een) oplossing
5
Unieke ID’s en
gestandaardiseerde
beschrijvingen, die
makkelijk op te
zoeken zijn via het
web: linked data

6
Hoe linked data aanmaken ?
Bedoeling dat systemen
dit zelf aanmaken
Geen extra werk
creëren
Kan ook vanuit
“klassieke” databases
Genereren, mappen

7
Unieke identifiers of keys
Makkelijk opzoeken en verwijzen
Wereldwijd uniek
“Decentraal” beheer
Beheren zonder lange
en zware procedures

8
Gestandaardiseerde beschrijvingen
“Vocabularies” of “ontologies”
Elk veld (eigenschap)
heeft ook een unieke ID
Kan dus ook verder
beschreven / gelinkt
worden
Internationaal, of zelf op te stellen

9
Waar zijn vocabularies te vinden ?
https://schema.org
(Google, Microsoft…)
https://www.w3.org
(internationale web organisatie)
https://semic.eu
(EC ISA2 programma)
Andere initiatieven op Vlaams, Federaal niveau,
andere organisaties…

10
Machines laten “nadenken”
Gegevens “verrijken” door te linken naar
andere bronnen
Nieuwe informatie
afleiden uit modellen en
gegevens
“Iets met pagina’s” is
een Boek, geen
Persoon

12
Bestaande ID-systemen
Telefoonnummers: +32 2 345 67 89
ISBN: 123-4-56-123456-7
Linken: http://belgium.be/nl/nieuws

13
Linken: URL ? URI ?
Linken (URLs) zijn een soort URIs (IDs)
ID moet stabiel blijven
Kan omgeleid worden
naar andere pagina
Bij voorkeur: ook
machine-begrijpbare
pagina’s
Mensen zien HTML,
machines een ander
formaat

14
Machine-begrijpbare pagina’s: “Content Negotiation”

15
Machine-begrijpbare pagina’s: “embedding”

17
Zoekmachine “begrijpt” =/= webwinkels
Wat is de titel, prijs…
Maakt vergelijken en snel bestellen
mogelijk

BOSA.be
@BartHanssens
bart.hanssens@bosa.fgov.be
Bedankt !

This document discusses OpenFed, a Drupal distribution created by BOSA, the Belgian Federal Public Service Policy and Support, to help administrations set up Drupal sites more easily. OpenFed is a selection of compatible modules that avoid maintenance issues and focus on features like multilingual support and privacy. BOSA hosts the sites, while external companies handle development and configuration. The distribution and BOSA's service model can be reused by other administrations. The document also briefly mentions Data.gov.be and exchanging data between portals using DCAT metadata standards.

Open Summer of Code in BelgiumBart Hanssens

More Related Content

More from Bart Hanssens (20)

OpenFed, a Drupal distributionBart Hanssens

Open Summer of Code in BelgiumBart Hanssens

Open Belgium 2022: Prepare To CodeBart Hanssens

Werkgroep metadata: INSPIRE - DCAT-AP mappingBart Hanssens

Overzicht DCAT-APBart Hanssens

Quarkus, Jib én OpenJ9Bart Hanssens

Open Data at the Federal Level 2021Bart Hanssens

This document summarizes Belgium's efforts around open data and data portals at the federal level. It discusses: 1) The Open Data Task Force consisting of FPS BOSA DG DT and DAV/ASA that manages Data.gov.be and seeks to revamp it in 2021/22. 2) Other Belgian data portals including SODHA for social science data, a national transport data portal, and Statbel's data lab for beta datasets. 3) Available open data resources like the BeST address database and upcoming open datasets on election results, judicial maps, and cadastral statistics. 4) Initiatives around open government, reusable APIs, and encouraging sharing of open data

Open Data workshop Agoria ICTBart Hanssens

Atelier Open Data / Agoria ICTBart Hanssens

Open Source and Open DataBart Hanssens

Données ouvertesBart Hanssens

Open DataBart Hanssens

Open Community ProjectsBart Hanssens

This document discusses several open community projects including Wikipedia, Wikimedia Commons, Wikidata, OpenStreetMap, Wheelmap, Telraam, Weather Observations Website, GitHub curated lists, Common Voice, and others. It provides brief descriptions of each project, what opportunities they present for public administrations and organizations, and encourages contributions to help document government data and services.

From webform to API using microframeworksBart Hanssens

This document discusses converting a webform into an API using microframeworks like Quarkus and libraries such as Jsoup and WireMock. It notes that while microframeworks allow rapid prototyping with few lines of code and fast development, the resulting API can be brittle and break if the underlying form or responses change. The document provides links to the Quarkus, Jsoup, Jib, and WireMock open source projects discussed.

JavaVMs en GraalVMBart Hanssens

Open data, what's cooking at the federal level 2020Bart Hanssens

BOSA DG DT: opendata et intégrateur de servicesBart Hanssens

Local and Regional digital transformation in BelgiumBart Hanssens

Presentatie data.gov.beBart Hanssens

Graphs, Stores and APIBart Hanssens

This document provides an overview and discussion of graph databases, property graphs, semantic graphs using RDF, and the relationships between them. It discusses different file formats, query languages, APIs, and database models that can be used with each. While property graphs and semantic graphs have similarities in representing nodes, edges, and properties, the main differences are that property graphs do not natively support metadata on relationships or semantics, whereas semantic graphs in RDF do. The document considers when each may be suitable and how they are used in practice.

OpenFed, a Drupal distributionBart Hanssens

Open Summer of Code in BelgiumBart Hanssens

Open Belgium 2022: Prepare To CodeBart Hanssens

Werkgroep metadata: INSPIRE - DCAT-AP mappingBart Hanssens

Overzicht DCAT-APBart Hanssens

Quarkus, Jib én OpenJ9Bart Hanssens

Open Data at the Federal Level 2021Bart Hanssens

Open Data workshop Agoria ICTBart Hanssens

Atelier Open Data / Agoria ICTBart Hanssens

Open Source and Open DataBart Hanssens

Données ouvertesBart Hanssens

Open DataBart Hanssens

Open Community ProjectsBart Hanssens

From webform to API using microframeworksBart Hanssens

JavaVMs en GraalVMBart Hanssens

Open data, what's cooking at the federal level 2020Bart Hanssens

BOSA DG DT: opendata et intégrateur de servicesBart Hanssens

Local and Regional digital transformation in BelgiumBart Hanssens

Presentatie data.gov.beBart Hanssens

Graphs, Stores and APIBart Hanssens

Linked Data: Introductie

1. BOSA.be 2020-06 Bart Hanssens FOD BOSA Digitale Transformatie Linked Data Introductie

2. Probleem 2 Hoe kunnen we het WWW verstaanbaarder maken voor machines ?

3. Wat wij op websites lezen (en begrijpen) 3

4. Wat een machine ziet (en maar deels begrijpt) 4

5. (Een) oplossing 5 Unieke ID’s en gestandaardiseerde beschrijvingen, die makkelijk op te zoeken zijn via het web: linked data

6. 6 Hoe linked data aanmaken ? Bedoeling dat systemen dit zelf aanmaken Geen extra werk creëren Kan ook vanuit “klassieke” databases Genereren, mappen

7. 7 Unieke identifiers of keys Makkelijk opzoeken en verwijzen Wereldwijd uniek “Decentraal” beheer Beheren zonder lange en zware procedures

8. 8 Gestandaardiseerde beschrijvingen “Vocabularies” of “ontologies” Elk veld (eigenschap) heeft ook een unieke ID Kan dus ook verder beschreven / gelinkt worden Internationaal, of zelf op te stellen

9. 9 Waar zijn vocabularies te vinden ? https://schema.org (Google, Microsoft…) https://www.w3.org (internationale web organisatie) https://semic.eu (EC ISA2 programma) Andere initiatieven op Vlaams, Federaal niveau, andere organisaties…

10. 10 Machines laten “nadenken” Gegevens “verrijken” door te linken naar andere bronnen Nieuwe informatie afleiden uit modellen en gegevens “Iets met pagina’s” is een Boek, geen Persoon

11. Gelinkte gegevens 11

12. 12 Bestaande ID-systemen Telefoonnummers: +32 2 345 67 89 ISBN: 123-4-56-123456-7 Linken: http://belgium.be/nl/nieuws

13. 13 Linken: URL ? URI ? Linken (URLs) zijn een soort URIs (IDs) ID moet stabiel blijven Kan omgeleid worden naar andere pagina Bij voorkeur: ook machine-begrijpbare pagina’s Mensen zien HTML, machines een ander formaat

14. 14 Machine-begrijpbare pagina’s: “Content Negotiation”

15. 15 Machine-begrijpbare pagina’s: “embedding”

16. 16 Voorbeeld: zoeken naar een boek

17. 17 Zoekmachine “begrijpt” =/= webwinkels Wat is de titel, prijs… Maakt vergelijken en snel bestellen mogelijk

18. BOSA.be @BartHanssens [email protected] Bedankt !

Editor's Notes

#2: Hallo, mijn naam is Bart Hanssens en ik werk bij de FOD BOSA DG DT Deze infosessie is een introductie tot linked data.
#3: Het probleem dat we met linked data willen oplossen is: hoe kunnen we het web verstaanbaarder maken voor machines ?
#4: Mensen die naar wikipedia surfen, begrijpen namelijk de verschillende elementen die op een pagina worden getoond. We kennen het verschil tussen een logo en een portret, tussen postcodes en jaartallen.
#5: Maar machines zien hier alleen een reeks algemene HTML-codes die ze maar beperkt "begrijpen".
#6: Een manier om dit op te lossen, is het gebruiken van unieke IDs, en van gestandaardiseerde, logische beschrijvingen, die makkelijk op te zoeken zijn via het web: linked data.
#7: Het is de niet de bedoeling om beheerders van data of websites extra werk te geven. Linked data moet door de systemen zelf gegenereerd worden, en sommige systemen doen dit effectief al. Zulke systemen kunnen ook "klassieke" databases zijn, maar dat is iets voor een volgende infosessie.
#8: Het is dus de bedoeling dat IDs wereldwijd uniek zijn, maar toch ook decentraal beheerd kunnen worden, dus zonder zware procedures om nieuwe IDs te maken. Het moet ook makkelijk zijn om deze IDs op te zoeken, en ernaartoe te verwijzen.
#9: Gestandardiseerde beschrijvingen, worden ook wel "vocabularies" of "ontologies" genoemd. Bij voorkeur wordt er een vocabulary gebruikt die al internationaal gekend is, maar het is ook mogelijk om zelf een vocabulary te maken en te publiceren. Belangrijk is dat elk veld, elke beschreven eigenschap, ook een unieke ID krijgt, en een korte omschrijving. Op die manier is het duidelijk wat er precies beschreven is.
#10: Enkele populaire vocabularies zoals deze op schema.org, en bij het internationale W3C, worden ontwikkeld door grote IT-bedrijven. Maar ook de Europese Commissie publiceert op de Semic website een reeks vocabularies, maar dan vooral bedoeld voor overheidsdiensten. Op Vlaams en federaal niveau, zijn er eveneens initiatieven.
#11: Bedoeling van dit alles is om machines te laten "nadenken". Door gegevens van verschillende bronnen te linken, en de hulp van gestandaardiseerde beschrijvingen, zullen machines uiteindelijk bijkomende informatie afleiden, zoals een mens dat zou doen. Als er bijvoorbeeld op het web iets staat over "Cleopatra" en "aantal pagina's", dan gaat het over een boek en niet over de Egyptische koningin zelf.
#12: Hier zien we zo'n schema van gelinkte gegevens. De Persoon Quetelet is geboren in de Locatie Gent. Gent ligt in een andere Locatie, namelijk België. Quetelet was professor aan de Universiteit KMS.
#13: Er bestaan natuurlijk tal van internationale ID-systemen, zoals telefoonnummers en het ISBN systeem voor boeken, maar ook linken zijn eigenlijk unieke IDs.
#14: Net zoals andere IDs, is het de bedoeling dat een URI steeds stabiel blijft, en dus blijft bestaan, ook als bijvoorbeeld de organisatie van naam verandert. Deze URI kan wel naar een nieuwe pagina verwijzen, of naar een locatie van een machine-begrijpbare pagina.
#15: Dit schema legt uit hoe "content-negotiation" werkt. Als een browser een link opent, dan vraagt de browser daarbij een HTML pagina. Een machine die dezelfde link opent, kan vragen naar een machine-begrijpbare variant. Als die beschikbaar is, dan stuurt de server deze variant.
#16: Een andere manier is het "embedden" van gegevens in de HTML pagina zelf, zonder dat deze zichtbaar zijn voor de gewone gebruiker. Browsers tonen dan gewoon de HTML-opmaak, en machines verwerken de niet-zichtbare data van dezelfde pagina.
#17: Een voorbeeld hiervan is het zoeken naar een boek via Google. Webshops die extra gegevens in hun pagina's verwerken - dus machine-begrijpbare data "embedden" - scoren beter.
#18: Zoekmotoren kunnen hierdoor gegevens zoals titel en prijs beter presenteren, en het voor de gebruiker makkelijker maken om te vergelijken en meteen te bestellen.
#19: Bedankt alvast om deze infosessie te volgen.

Linked Data: Introductie

Recommended

More Related Content

Similar to Linked Data: Introductie (20)

More from Bart Hanssens (20)

Linked Data: Introductie

Editor's Notes