Voordeel halen uit zoekmachines en semantic webBart Hanssens
Hoe kan gestructureerde, semantische opmaak en machineleesbare content ervoor zorgen dat zoekmachines websites beter gaan "begrijpen".
Presentatie tijdens het "Make your website great again" event.
Breng je informatie waar de klanten zijn! : Papieren Tijgers presentatieGuus van den Brekel
Een Heterdaad sessie in de CMB van het UMCG over de Bibliotheek Toolbar, Netvibes en méér ... Lees meer op
http://www.digitalespin.nl/DS/KC_mini-sites/Artikelen/2010/3/4_Univ._Medisch_Centrum_Groningen.html
Lees ook het verslag: http://www.digitalespin.nl/DS/KC_mini-sites/Artikelen/2010/3/4_Univ._Medisch_Centrum_Groningen.html
Dit is een begeleidende presentatie bij het hoofdstuk 6.4 van het Sleutelboek Computernetwerken. Deze presentatie mag vrij worden gebruikt, aangepast en verspreid.
Meer informatie over het Sleutelboek Computernetwerken is beschikbaar op www.sleutelboek.eu.
Presentatie van Stefaan Renard (VUB) en Filip Trenson (Infor) op VVBAD-studiedag Federated Search Engines, 22 januari 2010 in Erasmushogeschool Brussel
Presentatie PCDB overleg Utrecht 28 juni 2016Enno Meijers
Presentatie die in gaat op het toepassen van Linked Data om de zichtbaarheid van bibliotheekcollecties te verbeteren en duidelijk maakt de Koninklijke Bibliotheek hier de komende jaren op in zal zetten.
This PLDN presentation (in Dutch) gives an introduction on the main concepts of Linked Data and of the activities of the open network community Platform Linked Data Netherlands (PLDN). This presentation was used during the Jaarcongres ECP on November 14th at the Fokker Terminal in The Hague at the PLDN information booth.
Presentatie behorende bij paper 'Find the Expert', te downloaden via http://dl.dropbox.com/u/3796100/BiebmiepLeen/Culturele%20Informatiewetenschap/Paper_FindTheExpert.pdf
This document discusses OpenFed, a Drupal distribution created by BOSA, the Belgian Federal Public Service Policy and Support, to help administrations set up Drupal sites more easily. OpenFed is a selection of compatible modules that avoid maintenance issues and focus on features like multilingual support and privacy. BOSA hosts the sites, while external companies handle development and configuration. The distribution and BOSA's service model can be reused by other administrations. The document also briefly mentions Data.gov.be and exchanging data between portals using DCAT metadata standards.
Open Summer of Code is organized by Open Knowledge Belgium and sponsored by public and private sectors to have students get paid to work for about 3 weeks on real projects in teams of 3-5 people focusing on fields like ICT, communications, and design. The program emphasizes community, teamwork, coaching, project pitches, and training.
Dit is een begeleidende presentatie bij het hoofdstuk 6.4 van het Sleutelboek Computernetwerken. Deze presentatie mag vrij worden gebruikt, aangepast en verspreid.
Meer informatie over het Sleutelboek Computernetwerken is beschikbaar op www.sleutelboek.eu.
Presentatie van Stefaan Renard (VUB) en Filip Trenson (Infor) op VVBAD-studiedag Federated Search Engines, 22 januari 2010 in Erasmushogeschool Brussel
Presentatie PCDB overleg Utrecht 28 juni 2016Enno Meijers
Presentatie die in gaat op het toepassen van Linked Data om de zichtbaarheid van bibliotheekcollecties te verbeteren en duidelijk maakt de Koninklijke Bibliotheek hier de komende jaren op in zal zetten.
This PLDN presentation (in Dutch) gives an introduction on the main concepts of Linked Data and of the activities of the open network community Platform Linked Data Netherlands (PLDN). This presentation was used during the Jaarcongres ECP on November 14th at the Fokker Terminal in The Hague at the PLDN information booth.
Presentatie behorende bij paper 'Find the Expert', te downloaden via http://dl.dropbox.com/u/3796100/BiebmiepLeen/Culturele%20Informatiewetenschap/Paper_FindTheExpert.pdf
This document discusses OpenFed, a Drupal distribution created by BOSA, the Belgian Federal Public Service Policy and Support, to help administrations set up Drupal sites more easily. OpenFed is a selection of compatible modules that avoid maintenance issues and focus on features like multilingual support and privacy. BOSA hosts the sites, while external companies handle development and configuration. The distribution and BOSA's service model can be reused by other administrations. The document also briefly mentions Data.gov.be and exchanging data between portals using DCAT metadata standards.
Open Summer of Code is organized by Open Knowledge Belgium and sponsored by public and private sectors to have students get paid to work for about 3 weeks on real projects in teams of 3-5 people focusing on fields like ICT, communications, and design. The program emphasizes community, teamwork, coaching, project pitches, and training.
This document summarizes Belgium's efforts around open data and data portals at the federal level. It discusses:
1) The Open Data Task Force consisting of FPS BOSA DG DT and DAV/ASA that manages Data.gov.be and seeks to revamp it in 2021/22.
2) Other Belgian data portals including SODHA for social science data, a national transport data portal, and Statbel's data lab for beta datasets.
3) Available open data resources like the BeST address database and upcoming open datasets on election results, judicial maps, and cadastral statistics.
4) Initiatives around open government, reusable APIs, and encouraging sharing of open data
This document summarizes a presentation about open source and open data. It discusses key topics like open source licenses and business models, how to evaluate healthy open source projects, and examples of open data types and licensing. Open communities and initiatives are also covered, such as OpenSummerOfCode which funds students to build open source projects using open data.
This document discusses several open community projects including Wikipedia, Wikimedia Commons, Wikidata, OpenStreetMap, Wheelmap, Telraam, Weather Observations Website, GitHub curated lists, Common Voice, and others. It provides brief descriptions of each project, what opportunities they present for public administrations and organizations, and encourages contributions to help document government data and services.
From webform to API using microframeworksBart Hanssens
This document discusses converting a webform into an API using microframeworks like Quarkus and libraries such as Jsoup and WireMock. It notes that while microframeworks allow rapid prototyping with few lines of code and fast development, the resulting API can be brittle and break if the underlying form or responses change. The document provides links to the Quarkus, Jsoup, Jib, and WireMock open source projects discussed.
This document provides an overview and discussion of graph databases, property graphs, semantic graphs using RDF, and the relationships between them. It discusses different file formats, query languages, APIs, and database models that can be used with each. While property graphs and semantic graphs have similarities in representing nodes, edges, and properties, the main differences are that property graphs do not natively support metadata on relationships or semantics, whereas semantic graphs in RDF do. The document considers when each may be suitable and how they are used in practice.
5. (Een) oplossing
5
Unieke ID’s en
gestandaardiseerde
beschrijvingen, die
makkelijk op te
zoeken zijn via het
web: linked data
6. 6
Hoe linked data aanmaken ?
Bedoeling dat systemen
dit zelf aanmaken
Geen extra werk
creëren
Kan ook vanuit
“klassieke” databases
Genereren, mappen
7. 7
Unieke identifiers of keys
Makkelijk opzoeken en verwijzen
Wereldwijd uniek
“Decentraal” beheer
Beheren zonder lange
en zware procedures
9. 9
Waar zijn vocabularies te vinden ?
https://schema.org
(Google, Microsoft…)
https://www.w3.org
(internationale web organisatie)
https://semic.eu
(EC ISA2 programma)
Andere initiatieven op Vlaams, Federaal niveau,
andere organisaties…
10. 10
Machines laten “nadenken”
Gegevens “verrijken” door te linken naar
andere bronnen
Nieuwe informatie
afleiden uit modellen en
gegevens
“Iets met pagina’s” is
een Boek, geen
Persoon
13. 13
Linken: URL ? URI ?
Linken (URLs) zijn een soort URIs (IDs)
ID moet stabiel blijven
Kan omgeleid worden
naar andere pagina
Bij voorkeur: ook
machine-begrijpbare
pagina’s
Mensen zien HTML,
machines een ander
formaat
#2: Hallo, mijn naam is Bart Hanssens
en ik werk bij de FOD BOSA DG DT
Deze infosessie is een introductie
tot linked data.
#3: Het probleem dat we met linked data
willen oplossen is: hoe kunnen we
het web verstaanbaarder maken
voor machines ?
#4: Mensen die naar wikipedia surfen,
begrijpen namelijk de verschillende
elementen die op een pagina worden
getoond.
We kennen het verschil
tussen een logo en een portret,
tussen postcodes en jaartallen.
#5: Maar machines zien hier alleen
een reeks algemene HTML-codes
die ze maar beperkt "begrijpen".
#6: Een manier om dit op te lossen,
is het gebruiken van unieke IDs,
en van gestandaardiseerde,
logische beschrijvingen,
die makkelijk op te zoeken zijn
via het web: linked data.
#7: Het is de niet de bedoeling
om beheerders van data of
websites extra werk te geven.
Linked data moet door de
systemen zelf gegenereerd
worden, en sommige systemen
doen dit effectief al.
Zulke systemen kunnen ook
"klassieke" databases zijn,
maar dat is iets voor een
volgende infosessie.
#8: Het is dus de bedoeling dat
IDs wereldwijd uniek zijn,
maar toch ook decentraal
beheerd kunnen worden,
dus zonder zware procedures
om nieuwe IDs te maken.
Het moet ook makkelijk zijn
om deze IDs op te zoeken,
en ernaartoe te verwijzen.
#9: Gestandardiseerde beschrijvingen,
worden ook wel "vocabularies"
of "ontologies" genoemd.
Bij voorkeur wordt er een
vocabulary gebruikt die al
internationaal gekend is,
maar het is ook mogelijk om
zelf een vocabulary te maken
en te publiceren.
Belangrijk is dat elk veld,
elke beschreven eigenschap,
ook een unieke ID krijgt,
en een korte omschrijving.
Op die manier is het duidelijk
wat er precies beschreven is.
#10: Enkele populaire vocabularies
zoals deze op schema.org,
en bij het internationale W3C,
worden ontwikkeld door grote
IT-bedrijven.
Maar ook de Europese Commissie
publiceert op de Semic website
een reeks vocabularies,
maar dan vooral bedoeld voor
overheidsdiensten.
Op Vlaams en federaal niveau,
zijn er eveneens initiatieven.
#11: Bedoeling van dit alles is
om machines te laten "nadenken".
Door gegevens van verschillende
bronnen te linken, en de hulp van
gestandaardiseerde beschrijvingen,
zullen machines uiteindelijk
bijkomende informatie afleiden,
zoals een mens dat zou doen.
Als er bijvoorbeeld op het web
iets staat over "Cleopatra" en
"aantal pagina's", dan gaat het
over een boek en niet over de
Egyptische koningin zelf.
#12: Hier zien we zo'n schema
van gelinkte gegevens.
De Persoon Quetelet is geboren
in de Locatie Gent.
Gent ligt in een andere Locatie,
namelijk België.
Quetelet was professor
aan de Universiteit KMS.
#13: Er bestaan natuurlijk tal van
internationale ID-systemen,
zoals telefoonnummers en
het ISBN systeem voor boeken,
maar ook linken zijn eigenlijk
unieke IDs.
#14: Net zoals andere IDs,
is het de bedoeling dat
een URI steeds stabiel blijft,
en dus blijft bestaan,
ook als bijvoorbeeld de
organisatie van naam verandert.
Deze URI kan wel naar een
nieuwe pagina verwijzen,
of naar een locatie van
een machine-begrijpbare pagina.
#15: Dit schema legt uit hoe
"content-negotiation" werkt.
Als een browser een link opent,
dan vraagt de browser daarbij
een HTML pagina.
Een machine die dezelfde link
opent, kan vragen naar een
machine-begrijpbare variant.
Als die beschikbaar is, dan
stuurt de server deze variant.
#16: Een andere manier is het
"embedden" van gegevens in
de HTML pagina zelf, zonder
dat deze zichtbaar zijn voor
de gewone gebruiker.
Browsers tonen dan gewoon de
HTML-opmaak, en machines
verwerken de niet-zichtbare
data van dezelfde pagina.
#17: Een voorbeeld hiervan
is het zoeken naar een boek
via Google.
Webshops die extra gegevens
in hun pagina's verwerken -
dus machine-begrijpbare data
"embedden" - scoren beter.
#18: Zoekmotoren kunnen hierdoor
gegevens zoals titel en prijs
beter presenteren, en het
voor de gebruiker makkelijker
maken om te vergelijken en
meteen te bestellen.