Les standards en biodiversité1er juillet 2010Natural Solutionsjulie_chabalier@natural-solutions.eu
Ma donnéeUn gobe-mouche gris à Natural Solutions,  Donnée :  Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc.Identifié par Amandine avec des jumelles Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
Partager ma donnée (1)TaxonscientificName : Muscicapastriataclass:Avesorder : Passeriformes genus:MuscicapaLocation          country:  FrancecountryCode: FR           locality: MarseillesdecimalLatitude:  43.17203          decimalLongitude:  5.22445  Vocabulaire commun
 Reconnu par la communauté Comprendre et utiliser la donnée Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes. Standard de données
Partager ma donnée (2) Utiliser la donnée au sein au sein d’un programme / système informatique <dwc:Taxon><dwc:scientificName>Muscicapastriata</dwc:scientificName><dwc:class>Aves</dwc:class>                  <dwc:order>Passeriformes </dwc:order><dwc:genus>Muscicapa</dwc:genus></dwc:Taxon>< dcterms:Location > 	 < dwc:country > France < dwc:country > 	 < dwc:countryCode > FR < dwc:countryCode >  	 < dwc:locality > Marseille < dwc:locality >  < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude > 	 < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >  </dcterms:Location > Implémentation XML
Partager ma donnée (3)< protocol  id =NSprotocol.1 >< title> Identification in a corridor </title>< creator>< individualName >< surName > Sahl </ surName ></ individualName ></ creator>	< proceduralStep > 	< description > 			 < para>Bird identification on a working place</ para > </ description > < instrumentation > binocular</ instrumentation > 	</proceduralStep></protocol> Standard de metadonnées
Partager ma donnée (4) Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
3 groupes de standardsLes standards de métadonnées   Comment sont mes données?Dublin CoreEMLLes standard de données  Quelles sont les données à partager?DwCABCD TCSLes protocoles d’échangeComment je partage les données ?TAPIR LSID IPT…
Les standards de métadonnéesProblématiqueDifférents types de données de biodiversitéStockagesvariésEchellesdifférentesDonnées disperséesObjectifAccéder aux jeux de données de biodiversité sur le WebQuellessont les donnéesdisponibles?Comment accéder à cesdonnées ?
DéfinitionsLes métadonnéesdécrivent les ressources et leuraccessibilitéidentificationqualitécontexte spatialdistribution des jeux de donnéesUtiliser un standard de métadonnéesuneterminologie communeun ensemble de définitionEviteruneperte du sens original des données
Dublin CoreStandard de metadonnées le mieux connu actuellementInitié en 1995Objectif : découvrir les ressourcesdocumentaires du Web15 descripteurs minimumsImplémentation XMLhttp://dublincore.org/
Exemple
EcologicalMetadataLanguageStandard de metadonnéesdéveloppé par la communautéécologiqueInitié en 1997 par « Ecological Society of America »  Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifiquetrèsbienstructuré avec de nombreuxdescripteursImplémentation XML1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.)http://knb.ecoinformatics.org/
Organisation EMLDescripteursorganisés en classes décrivant : le jeu de données (dataset) l’origine des données (citation)la structure des données (software)les méthodes de création du jeu de données (protocol)l’accessibilité des données (access)
Les standards en biodiversité
Exemplehttp://harvardforest.fas.harvard.edu
Standard de données de biodiversitéStandard de données ≈ Format de données ≈ Schéma de donnéesEchange de donnéesd’occurrenced’espècesSpécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses)Observations des organismesvivantssur le terrain2 standardsDarwin CoreABCD schema
TDWGTaxonomicDatabaseWorking GroupBiodiversity Information StandardsUneorganisationinternationale à but non lucratifDéveloppe des standards et des protocoles pour partager les données de biodiversitéwww.tdwg.org
HistoriqueTDWG/CODATA (Committee on Data for Science and Technology)Sous groupe  «  Access to Biological Collections Data »2000 Protocole de recherche des données de biodiversitéSpécification des données des collections biologiquesProjet BioCaseDwC + protocole DIGIRABCD SchemaGBIFProtocole BioCase
DarwinCoreDéfinition d’un ensemble d’éléments de données (data element)  Unitéd’information de base : sens unique + valeursdistinctesNorme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des donnéesAttributs/champs  de base de donnéesObjectif : partage et intégration des donnéesd’observationprimairesInitialement : organisation des collections de specimens Extensible (ajoutd’éléments de données) : fct des besoinsspécifiqueshttp://rs.tdwg.org/dwc/
Les catégories 172 éléments de données Organisés en 8 catégories/classestaxonIDscientificNameIDtaxonConceptIDscientificNamekingdomphylumclassorderfamilygenussubgenustaxonRankscientificNameAuthorshipvernacularNamenomenclaturalCodetaxonomicStatusnomenclaturalStatustaxonRemarks…Dublin Core
Des metadonnées?Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude donnéesinstitutionIDcollectionIDdatasetIDinstitutionCodecollectionCodedatasetNameownerInstitutionCodebasisOfRecordinformationWithhelddataGeneralizationsdynamicPropertiesDarwin Core Type Vocabulary Valeur de l’élément de donnéesNature des données Occurrence EventLocation TaxonPreservedSpecimenFossilSpecimenLivingSpecimenHumanObservationMachineObservationNomenclaturalChecklist
Le partageTous les termessontassignés à une URIoccurenceID  :  http://rs.tdwg.org/dwc/terms/occurrenceIDimplementation XML + XML/RDF
ExtensionsInformation spécifique à une discipline GeospatialDecimalLatitude- DecimalLongitude – VerbatimCoordinates - …PaleontologieEarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - …	Nettoyage ( Curation )IdentifiedBy- DateIdentified -  FieldNotes - …
Simple Darwin Core Sous ensemble de 46 éléments de donnéesAttributs des tableurs et bases de donnéesPas les termesreprésentant les différentescatégories (liste plate)Partage simple des donnéestaxonomiques et de leurs occurrences
Exemple<dwc:Taxon><dwc:scientificName>Anthuscorrendera</dwc:scientificName><dwc:class>Aves</dwc:class><dwc:genus>Anthus</dwc:genus><dwc:specificEpithet>correndera</dwc:specificEpithet> <dwc:occurrenceID>urn:catalog:AUDCLO:EBIRD:OBS64515286</dwc:occurrenceID></dwc:Taxon>
UtilisationLargement utiliséGBIF  (Global Biodiversity information facility) www.gbif.orgOBIS  (OceanBiogeographic Information System) www.iobis.orgALA (Atlas of Living Australia) 	www.ala.org.auInventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour…
ABCD schemaSchémahierarchique de spécification de donnéesEchange des données de collections SpecimensObservationsCompletdonccomplexe 1200 éléments de donnéesCapable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiquesSuffisammentd’éléments de données pour être compatible avec beaucoup de standards Implémentation XMLwww.tdwg.org/activities/abcd/
ExtraitMetadonnées?
Exemple
Visualiser ABCD schemahttp://www.bgbm.org/scripts/ASP/TDWG/frame.asp?config=0&configurl=http://www.bgbm.org/TDWG/CODATA/Schema/schemaviewer_configs/conf_abcd_206.xml
ExtensionsExtension pour les Geosciences (EFG) http://www.geocase.eu/Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
MappingDwC – ABCD schema
UtilisationLargement utilisé aussi (par les mêmes?)GBIFALA…
Taxon Concept schema(Taxonomic taxon transfert schema)ProblématiqueDonnées de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomiquePartager les donnéesnécessitentd’utiliser la mêmetaxonomiewww.tdwg.org/standards/117/
ObjectifsDévelopper un modèleabstrait de concepts taxonomiquesEtablir des relations entre les concepts taxonomiques des fournisseurs de donnéesStandard XML pour faciliterl’échange de données entre les différentsfournisseursfaciliterl’interrogation des données
Définitions TCS est un format d’échange de donnéesun moyend’annoter les donnéestaxonomiquescommuniquées2 élémentsclés<TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons<TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
Extrait
Exemple (1)<TaxonNames> 	<TaxonName id="123" nomenclaturalCode="Botanical"> 	<Simple>Dianthus</Simple> 	<Rank code="gen">genus</Rank> </TaxonName> <TaxonName id="124" nomenclaturalCode="Botanical"> 	<Simple>DianthusgratianopolitanusVill.</Simple> 	<Rank code="sp">species</Rank> 	<CanonicalName> 	<Simple>Dianthusgratianopolitanus</Simple> 	<Genusref="123">Dianthus</Genus> 	</CanonicalName> </TaxonName> 	<TaxonName id="125" nomenclaturalCode="Botanical"> 	<Simple>Dianthuscaesius Sm.</Simple> 	<Rank code="sp">species</Rank> 	<CanonicalName> 	<Simple>Dianthuscaesius</Simple> 	<Genusref="123">Dianthus</Genus> 	<SpecificEpithet>caesius</SpecificEpithet> </CanonicalName> 	</TaxonName>
Exemple (2)<TaxonConcepts>                          <TaxonConcept id="988">                       <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name>                       <AccordingTo>                                     <AccordingToSimple> Clapham, Tutin &amp; Moore (1987)                                       </AccordingToSimple>                         </AccordingTo>             <TaxonRelationships>                       <TaxonRelationship type="has synonym">                       <ToTaxonConceptref="989"/>                        </TaxonRelationship>            </TaxonRelationships>              </TaxonConcept>            <TaxonConcept type="nominal" id="989">            		< Name scientific="true" ref="125">Dianthus caesius</Name>             </TaxonConcept>
UtilisationGBIF dans son projet de « Global Names Architecture »TCS est utilisé pour faciliter l’échange des données taxonomiques.
Conclusion sur les standards de donnéesDwC, ABCD schema et TSC spécifiques aux collectionsMoinsappropriés (pour l’instant) aux observations– Protocoles ?– Données manquantes ?– Regroupementautrequetaxonomique ?– Attributs spatiaux ?En cours d’évolution
Utilisation conjointe avec les standards de métadonnéesEt après?Modèles de données ≠ standards de donnéesBesoin de transformation des modèlesou de mise en relation (mapping) avec les standardsespèce = SpecificEpithetalt m = MinimumElevationInMeters•  Manipulation des donnéespeutêtrenécessairesConcatenationParsingChangement de granularité Protocoles d’échange de données
Les protocolesProtocole = comment lierouéchanger les données• Protocoles existants– TAPIRLSID & RDF– DwC-AIPT
TAPIRProtocole pour interroger les bases de données existantesRemplace :DiGIR (utilisant DwC comme standard)BioCASe (utilisant ABCD schema comme standard)Indépendant du standard, mais un standard de donnéesestnécessaireUtilisé principalement par GBIFwww.tdwg.org/activities/tapir
TAPIR
TAPIR
TAPIR
TAPIR
TAPIR
LSID & RDFLSID = Life Science IdentifierType de GUID = Global Unique IdentifierLSID = chaîne de caractères + formaturn:lsid:ubio.org:namebank:11815http://lsids.sourceforge.net/
LSID & RDFUtilisation :Identification d’un objetRetrouver les metadonnées associées (standard)RDF = Resource Description FrameworkRDF = Format de réponse des requêtes sur le LSIDNombreuxoutils pour résoudre et échanger les LSID http://lsid.tdwg.org/
LSID & RDFhttp://lsid.tdwg.org/urn:lsid:ubio.org:namebank:11815
Darwin Core archivePas vraiment un protocoleMoyen de publier les données au sein du GBIFDwC-A contient un jeu de donnéesentierbasésur des fichierstextesLe format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions Une archive = un ensemble de fichiertexteszippés
Dwc-A
IntegratedPublishingToolkitIPT = Une application webPublier 3 types de données de biodiversité 	Données primaires	Information sur les espèces	Métadonnées sur les ressourcesÀ partir d’une source de données Fichier platBase de donnéesPour rendre ces données visibles sur le réseau distribué du GBIF
IPT-Portails de données-Réseaux distribués-Accès aux enregistrements individuels-Clients GIS-GeoPortalsCatalogues de Métadonnées-Transport rapide des   données-Création d’index

Contenu connexe

PPTX
Geo web standards for biodiversity
PPTX
Bid CE Workshop 1 session 06 - Data quality during digitization
PPTX
BID CE workshop 1 session 05 - Origins of Biodiversity Data
PPTX
PPTX
BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality
PPTX
ÉTS - Cours GES840 - Atelier de recherche de brevets
PPTX
ÉTS - Recherche avancée de documentation scientifique
PPTX
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Geo web standards for biodiversity
Bid CE Workshop 1 session 06 - Data quality during digitization
BID CE workshop 1 session 05 - Origins of Biodiversity Data
BID CE Workshop 1 - session 11 - Basic concepts about biodiversity data quality
ÉTS - Cours GES840 - Atelier de recherche de brevets
ÉTS - Recherche avancée de documentation scientifique
Les entrepôts de données ou comment rendre les données trouvables accessibles...

En vedette (20)

PPTX
Chapitres 8 9-10 - étude du vivant
PPS
Le japonais et le riz
PDF
Ch35 23
PPT
Perfection.prof bouctouche.aout2011
PPT
Pratiques écologiques
PPT
Google Scholar : un moteur de recherche pour l'information scientifique
PDF
Inteligencia Competitiva
PPT
Fabulas presentacion
DOC
Trabajo de red inalámbrica
PDF
PLAN ORGÁNICO INSPECTORIAL 2010 - 2014
PPS
Ce pc8 guia9
PPT
Valijas viajera ppt
PPS
Ghandi paz
PPT
Aplicaciones
PDF
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
PPT
Mon idole. ana
PPSX
Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...
PPTX
Bloque cero pacie
PPTX
Carnes
Chapitres 8 9-10 - étude du vivant
Le japonais et le riz
Ch35 23
Perfection.prof bouctouche.aout2011
Pratiques écologiques
Google Scholar : un moteur de recherche pour l'information scientifique
Inteligencia Competitiva
Fabulas presentacion
Trabajo de red inalámbrica
PLAN ORGÁNICO INSPECTORIAL 2010 - 2014
Ce pc8 guia9
Valijas viajera ppt
Ghandi paz
Aplicaciones
Ley de-planes-reguladores.-decreto-que-faculta-al-poder-ejecutivo-para-formul...
Mon idole. ana
Proyecto de Capacitación Fatla Grupo U, CAPACITACIÓN VIRTUAL EN EL USO DE LA ...
Bloque cero pacie
Carnes
Publicité

Similaire à Les standards en biodiversité (20)

PDF
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
PDF
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
PDF
Cours_Databasesless-Partie_I[partie1}.pdf
PPTX
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
PPTX
Publication de données d'observation dans le Web de données - Retour d'expéri...
PDF
Databases for Bioinformatics
PDF
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
PDF
Introduction à l'informatique documentaire
PDF
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
PPTX
quand le lien fait sens
PPT
Calames - presentation à l'ecole des chartes
PPT
Gestion des métadonnées. ANR PADOUE
PPTX
Métadonnées de thèse
PPT
le web sémantique : un web de métadonnées
PDF
JIES 2014 A. Giordan - Introduction
PPT
Presentation Dess Ebi
PPT
CRFCB AMU_evolutions-catalogage_091213_RDA
PPT
Metadonnees Introduction
PDF
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
PDF
Présentation genève 20130617
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Cours_Databasesless-Partie_I[partie1}.pdf
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Publication de données d'observation dans le Web de données - Retour d'expéri...
Databases for Bioinformatics
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Introduction à l'informatique documentaire
JABES 2017 - L'histoire d'un document dans la plate-forme ISTEX
quand le lien fait sens
Calames - presentation à l'ecole des chartes
Gestion des métadonnées. ANR PADOUE
Métadonnées de thèse
le web sémantique : un web de métadonnées
JIES 2014 A. Giordan - Introduction
Presentation Dess Ebi
CRFCB AMU_evolutions-catalogage_091213_RDA
Metadonnees Introduction
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Présentation genève 20130617
Publicité

Plus de jchabalier (8)

PDF
ecoOnto - une ontologie pour la biodiversité
PDF
Thesauform - ecoOnto meeting
PDF
Presentation Natura 2000 - ecoOnto meeting
PDF
Les mesures de biodiversite - ecoOnto meeting
PDF
Transformation de modèles - ecoOnto meeting
PDF
Ontologies introduction - ecoOnto meeting
PDF
Le projet EcoOnto - avancees.
PDF
Projet ecoOnto
ecoOnto - une ontologie pour la biodiversité
Thesauform - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meeting
Transformation de modèles - ecoOnto meeting
Ontologies introduction - ecoOnto meeting
Le projet EcoOnto - avancees.
Projet ecoOnto

Les standards en biodiversité

  • 1. Les standards en biodiversité1er juillet 2010Natural [email protected]
  • 2. Ma donnéeUn gobe-mouche gris à Natural Solutions,  Donnée : Elément d'information décrivant de façon élémentaire un objet, une transaction, un événement, etc. Une donnée sert de base à une recherche, un raisonnement, etc.Identifié par Amandine avec des jumelles Métadonnée : Donnée décrivant des caractéristiques d'une donnée, e.g. propriété, contenu, qualité (conditions, précision, etc.), date de saisie, etc.
  • 3. Partager ma donnée (1)TaxonscientificName : Muscicapastriataclass:Avesorder : Passeriformes genus:MuscicapaLocation  country: FrancecountryCode: FR   locality: MarseillesdecimalLatitude: 43.17203  decimalLongitude: 5.22445  Vocabulaire commun
  • 4. Reconnu par la communauté Comprendre et utiliser la donnée Standard : format reconnu par une autorité ou majoritairement utilisé. Un standard permet la compatibilité des systèmes. Standard de données
  • 5. Partager ma donnée (2) Utiliser la donnée au sein au sein d’un programme / système informatique <dwc:Taxon><dwc:scientificName>Muscicapastriata</dwc:scientificName><dwc:class>Aves</dwc:class> <dwc:order>Passeriformes </dwc:order><dwc:genus>Muscicapa</dwc:genus></dwc:Taxon>< dcterms:Location >  < dwc:country > France < dwc:country >  < dwc:countryCode > FR < dwc:countryCode >   < dwc:locality > Marseille < dwc:locality > < dwc:decimalLatitude > 43.17203 < dwc:decimalLatitude >  < dwc:decimalLongitude > 5.22445 < dwc:decimalLongitude >  </dcterms:Location > Implémentation XML
  • 6. Partager ma donnée (3)< protocol id =NSprotocol.1 >< title> Identification in a corridor </title>< creator>< individualName >< surName > Sahl </ surName ></ individualName ></ creator> < proceduralStep > < description >  < para>Bird identification on a working place</ para > </ description > < instrumentation > binocular</ instrumentation >  </proceduralStep></protocol> Standard de metadonnées
  • 7. Partager ma donnée (4) Protocole d’échange : les méthodes d'échange de données numériques entre plusieurs postes informatiques
  • 8. 3 groupes de standardsLes standards de métadonnées  Comment sont mes données?Dublin CoreEMLLes standard de données  Quelles sont les données à partager?DwCABCD TCSLes protocoles d’échangeComment je partage les données ?TAPIR LSID IPT…
  • 9. Les standards de métadonnéesProblématiqueDifférents types de données de biodiversitéStockagesvariésEchellesdifférentesDonnées disperséesObjectifAccéder aux jeux de données de biodiversité sur le WebQuellessont les donnéesdisponibles?Comment accéder à cesdonnées ?
  • 10. DéfinitionsLes métadonnéesdécrivent les ressources et leuraccessibilitéidentificationqualitécontexte spatialdistribution des jeux de donnéesUtiliser un standard de métadonnéesuneterminologie communeun ensemble de définitionEviteruneperte du sens original des données
  • 11. Dublin CoreStandard de metadonnées le mieux connu actuellementInitié en 1995Objectif : découvrir les ressourcesdocumentaires du Web15 descripteurs minimumsImplémentation XMLhttp://dublincore.org/
  • 13. EcologicalMetadataLanguageStandard de metadonnéesdéveloppé par la communautéécologiqueInitié en 1997 par « Ecological Society of America »  Objectif : fournirsuffisamentd’information pour être capable de réutiliser les donnéesd’unemanièrescientifiquetrèsbienstructuré avec de nombreuxdescripteursImplémentation XML1500 projets, 65 milliards d’observations de tout types (i.e. organismes, climat, etc.)http://knb.ecoinformatics.org/
  • 14. Organisation EMLDescripteursorganisés en classes décrivant : le jeu de données (dataset) l’origine des données (citation)la structure des données (software)les méthodes de création du jeu de données (protocol)l’accessibilité des données (access)
  • 17. Standard de données de biodiversitéStandard de données ≈ Format de données ≈ Schéma de donnéesEchange de donnéesd’occurrenced’espècesSpécimensdans les collections d’histoirenaturelle et herbiers (collections vivantesincluses)Observations des organismesvivantssur le terrain2 standardsDarwin CoreABCD schema
  • 18. TDWGTaxonomicDatabaseWorking GroupBiodiversity Information StandardsUneorganisationinternationale à but non lucratifDéveloppe des standards et des protocoles pour partager les données de biodiversitéwww.tdwg.org
  • 19. HistoriqueTDWG/CODATA (Committee on Data for Science and Technology)Sous groupe «  Access to Biological Collections Data »2000 Protocole de recherche des données de biodiversitéSpécification des données des collections biologiquesProjet BioCaseDwC + protocole DIGIRABCD SchemaGBIFProtocole BioCase
  • 20. DarwinCoreDéfinition d’un ensemble d’éléments de données (data element) Unitéd’information de base : sens unique + valeursdistinctesNorme ISO ISO/IEC 11179 : lisibilitéet l’interchangeabilité des donnéesAttributs/champs de base de donnéesObjectif : partage et intégration des donnéesd’observationprimairesInitialement : organisation des collections de specimens Extensible (ajoutd’éléments de données) : fct des besoinsspécifiqueshttp://rs.tdwg.org/dwc/
  • 21. Les catégories 172 éléments de données Organisés en 8 catégories/classestaxonIDscientificNameIDtaxonConceptIDscientificNamekingdomphylumclassorderfamilygenussubgenustaxonRankscientificNameAuthorshipvernacularNamenomenclaturalCodetaxonomicStatusnomenclaturalStatustaxonRemarks…Dublin Core
  • 22. Des metadonnées?Un ensemble complémentaire de termes - Record-level Terms – pour caractériserle jeude donnéesinstitutionIDcollectionIDdatasetIDinstitutionCodecollectionCodedatasetNameownerInstitutionCodebasisOfRecordinformationWithhelddataGeneralizationsdynamicPropertiesDarwin Core Type Vocabulary Valeur de l’élément de donnéesNature des données Occurrence EventLocation TaxonPreservedSpecimenFossilSpecimenLivingSpecimenHumanObservationMachineObservationNomenclaturalChecklist
  • 23. Le partageTous les termessontassignés à une URIoccurenceID : http://rs.tdwg.org/dwc/terms/occurrenceIDimplementation XML + XML/RDF
  • 24. ExtensionsInformation spécifique à une discipline GeospatialDecimalLatitude- DecimalLongitude – VerbatimCoordinates - …PaleontologieEarliestEonOrLowestEonothem – LatestEonOrHighestEonothem - EarliestEraOrLowestErathem - … Nettoyage ( Curation )IdentifiedBy- DateIdentified - FieldNotes - …
  • 25. Simple Darwin Core Sous ensemble de 46 éléments de donnéesAttributs des tableurs et bases de donnéesPas les termesreprésentant les différentescatégories (liste plate)Partage simple des donnéestaxonomiques et de leurs occurrences
  • 27. UtilisationLargement utiliséGBIF (Global Biodiversity information facility) www.gbif.orgOBIS (OceanBiogeographic Information System) www.iobis.orgALA (Atlas of Living Australia) www.ala.org.auInventaires : ATBI (All Taxa Biodiversity Inventories and Monitoring) Mercantour…
  • 28. ABCD schemaSchémahierarchique de spécification de donnéesEchange des données de collections SpecimensObservationsCompletdonccomplexe 1200 éléments de donnéesCapable d’intégrer des donnéesdétaillées, de sources trèsdifferentes et de domainestrèsspécifiquesSuffisammentd’éléments de données pour être compatible avec beaucoup de standards Implémentation XMLwww.tdwg.org/activities/abcd/
  • 32. ExtensionsExtension pour les Geosciences (EFG) http://www.geocase.eu/Extension pour les données moléculaires (ADN) http://www.dnabank-network.org/Extension pour les herbiers http://hiscom.chah.org.au/wiki/HISPID_5
  • 34. UtilisationLargement utilisé aussi (par les mêmes?)GBIFALA…
  • 35. Taxon Concept schema(Taxonomic taxon transfert schema)ProblématiqueDonnées de biodiversité des fournisseursbaséesgénéralementsur un seulréférentieltaxonomiquePartager les donnéesnécessitentd’utiliser la mêmetaxonomiewww.tdwg.org/standards/117/
  • 36. ObjectifsDévelopper un modèleabstrait de concepts taxonomiquesEtablir des relations entre les concepts taxonomiques des fournisseurs de donnéesStandard XML pour faciliterl’échange de données entre les différentsfournisseursfaciliterl’interrogation des données
  • 37. Définitions TCS est un format d’échange de donnéesun moyend’annoter les donnéestaxonomiquescommuniquées2 élémentsclés<TaxonConcept> : monde réel, exprimeune opinion sur le taxon et ses relations avec d’autrestaxons<TaxonName> : nomenclature abstraite, encapsule les règles des différentes nomenclatures
  • 39. Exemple (1)<TaxonNames> <TaxonName id="123" nomenclaturalCode="Botanical"> <Simple>Dianthus</Simple> <Rank code="gen">genus</Rank> </TaxonName> <TaxonName id="124" nomenclaturalCode="Botanical"> <Simple>DianthusgratianopolitanusVill.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthusgratianopolitanus</Simple> <Genusref="123">Dianthus</Genus> </CanonicalName> </TaxonName> <TaxonName id="125" nomenclaturalCode="Botanical"> <Simple>Dianthuscaesius Sm.</Simple> <Rank code="sp">species</Rank> <CanonicalName> <Simple>Dianthuscaesius</Simple> <Genusref="123">Dianthus</Genus> <SpecificEpithet>caesius</SpecificEpithet> </CanonicalName> </TaxonName>
  • 40. Exemple (2)<TaxonConcepts> <TaxonConcept id="988"> <Name scientific="true" ref="124">Dianthus gratianopolitanusVill.</Name> <AccordingTo> <AccordingToSimple> Clapham, Tutin &amp; Moore (1987) </AccordingToSimple> </AccordingTo> <TaxonRelationships> <TaxonRelationship type="has synonym"> <ToTaxonConceptref="989"/> </TaxonRelationship> </TaxonRelationships> </TaxonConcept> <TaxonConcept type="nominal" id="989"> < Name scientific="true" ref="125">Dianthus caesius</Name> </TaxonConcept>
  • 41. UtilisationGBIF dans son projet de « Global Names Architecture »TCS est utilisé pour faciliter l’échange des données taxonomiques.
  • 42. Conclusion sur les standards de donnéesDwC, ABCD schema et TSC spécifiques aux collectionsMoinsappropriés (pour l’instant) aux observations– Protocoles ?– Données manquantes ?– Regroupementautrequetaxonomique ?– Attributs spatiaux ?En cours d’évolution
  • 43. Utilisation conjointe avec les standards de métadonnéesEt après?Modèles de données ≠ standards de donnéesBesoin de transformation des modèlesou de mise en relation (mapping) avec les standardsespèce = SpecificEpithetalt m = MinimumElevationInMeters• Manipulation des donnéespeutêtrenécessairesConcatenationParsingChangement de granularité Protocoles d’échange de données
  • 44. Les protocolesProtocole = comment lierouéchanger les données• Protocoles existants– TAPIRLSID & RDF– DwC-AIPT
  • 45. TAPIRProtocole pour interroger les bases de données existantesRemplace :DiGIR (utilisant DwC comme standard)BioCASe (utilisant ABCD schema comme standard)Indépendant du standard, mais un standard de donnéesestnécessaireUtilisé principalement par GBIFwww.tdwg.org/activities/tapir
  • 46. TAPIR
  • 47. TAPIR
  • 48. TAPIR
  • 49. TAPIR
  • 50. TAPIR
  • 51. LSID & RDFLSID = Life Science IdentifierType de GUID = Global Unique IdentifierLSID = chaîne de caractères + formaturn:lsid:ubio.org:namebank:11815http://lsids.sourceforge.net/
  • 52. LSID & RDFUtilisation :Identification d’un objetRetrouver les metadonnées associées (standard)RDF = Resource Description FrameworkRDF = Format de réponse des requêtes sur le LSIDNombreuxoutils pour résoudre et échanger les LSID http://lsid.tdwg.org/
  • 54. Darwin Core archivePas vraiment un protocoleMoyen de publier les données au sein du GBIFDwC-A contient un jeu de donnéesentierbasésur des fichierstextesLe format DwC-A fournit un moyen simple de publiersesdonnées au format DwC + extensions Une archive = un ensemble de fichiertexteszippés
  • 55. Dwc-A
  • 56. IntegratedPublishingToolkitIPT = Une application webPublier 3 types de données de biodiversité Données primaires Information sur les espèces Métadonnées sur les ressourcesÀ partir d’une source de données Fichier platBase de donnéesPour rendre ces données visibles sur le réseau distribué du GBIF
  • 57. IPT-Portails de données-Réseaux distribués-Accès aux enregistrements individuels-Clients GIS-GeoPortalsCatalogues de Métadonnées-Transport rapide des données-Création d’index
  • 58. ConclusionPartager les données de biodiversité :Utiliser un standard de donnéesUtiliser un standard de metadonnéesUtiliser un protocole d’échangeApplications