Aufbau eines zentralen Indexes  im GBV Till Kinstler,  [email_address] http://twitter.com/tillk Verbundzentrale des GBV (VZG)
Wir haben im zentralen  Metadatenmanagementsystem  des GBVs (CBS) rund 100 Millionen interessante Datensätze: klassische OPAC-Daten (GVK), Online Contents (OLC), Nationallizenzen, … Und was machen wir damit?
 
 
 
 
 
„ In addition, we have also found that the  poor usability, high complexity, and lack of integration  of many electronic resource discovery systems, have raised the entry threshold of information technology literacy. This acts as a barrier to information search and retrieval. […] Users find database structures hinder . They have to learn the procedural knowledge for using a particular database as well as have some basic knowledge of how the data table is organised and what subject matter the built-in thesauri refers to; both have limited transferability. The participants did not appear to lack information technology or digital literacy, as they had demonstrated they were able to use other internet-based search and retrieval tools.“ (Wong, W. ; Stelmaszewska, H. ; Barn, B. ; Bhimani, N. ; Barn, S.: JISC User Behaviour Observational Study: User Behaviour in Resource Discovery. Final Report / JISC. Version: November 2009.  http://www.jisc.ac.uk/media/documents/publications/programme/2010/ubirdfinalreport.pdf )
Idee: Nur noch ein Zugangspunkt für alle Bestände (und Dienste ?!?) einer Bibliothek im Web
-> große, aggregierte / integrierte Suchindexe (die alle Bestände einer Bibliothek abbilden: Monographien, Artikel, elektronische Bestände, Webseiten, ...)
-> „einfach“ zu benutzende Oberflächen
-> fehlt oft: gute Integration aller angebotenen Dienste (Ausleihe, Fernleihe, elektronischer Zugang,...) Konsequenzen
Konsequenzen Endlich Abkehr vom Paradigma exakter, boolescher Suche: „The conventional Boolean retrieval methodology is not well adapted to the information retrieval task“ (Gerard Salton, 1984)
Stattdessen einfache, „best match“ Suche („wie im Web“): „A best match search matches the set of query stems against the sets of stems corresponding to each of the documents in the database, calculates a measure of similarity between the query and each document, and then  sorts the documents into order of decreasing similarity with the query .“ (Peter Willett, 1988)
-> „unpräzise“ Suche (egal ob [Nachname, Vorname] oder [Vorname Nachname], Stemming, nur ein Teil der Suchbegriffe muss vorkommen, automatische Erweiterung der Suchanfrage, ...)
-> Relevanzsortierung (-> was ist Relevanz?)
-> Möglichkeiten zum Browsen, Verfeinern, Entdecken (Facetten, „ähnliche Treffer“, Vorschläge/Recommendations), ...

Weitere ähnliche Inhalte

ODP
Kooperativer Aufbau zentraler Lucene-Indices für lokale Portale
PDF
VuFind - Ein Open Source Projekt
PDF
Einheitliche Normdatendienste der VZG
PPT
(2) Von der Hofbibliothek zum digitalen Medienzentrum
PDF
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
PPTX
RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...
PDF
Wikidata (für Archive)
PDF
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Kooperativer Aufbau zentraler Lucene-Indices für lokale Portale
VuFind - Ein Open Source Projekt
Einheitliche Normdatendienste der VZG
(2) Von der Hofbibliothek zum digitalen Medienzentrum
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
RFID: Umstieg auf das Dänische Datenmodell und neue Selbstverbucher an TU und...
Wikidata (für Archive)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)

Was ist angesagt? (20)

PDF
Entdecken Sie Deutschlands Datenschätze! (03/2014)
PPT
Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
ODP
Mit Webservices zum Katalog 2.0
PPT
Österreich liest Vortrag zum Web@rchiv Österreich
PPT
TextGrid 2.0 @ Bibliothekartag 2012
PDF
Bam Clio
PDF
2022_46.OpenDataMeetup_MA13.pdf
PDF
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
PDF
Open Access auf Länderebene - das Beispiel Baden-Württemberg
PDF
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
PDF
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
PPT
EconStor - ein vernetztes Fach-Repositorium
PPT
Informationsbeschaffung in Bibliotheken
PDF
E-Content & Open Access 2008
PDF
2022_46.OpenDataMeetUp.pdf
PDF
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
PPT
Bibliotheken @ Google
PDF
OpenData und Lokaljournalismus | Scoopcamp HH 2010
PPT
Wie verbreitet sich die digitale Publikation im Netz?
PDF
Google als Partner schätzen lernen: Austrian Books Online
Entdecken Sie Deutschlands Datenschätze! (03/2014)
Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Mit Webservices zum Katalog 2.0
Österreich liest Vortrag zum Web@rchiv Österreich
TextGrid 2.0 @ Bibliothekartag 2012
Bam Clio
2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
Open Access auf Länderebene - das Beispiel Baden-Württemberg
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
EconStor - ein vernetztes Fach-Repositorium
Informationsbeschaffung in Bibliotheken
E-Content & Open Access 2008
2022_46.OpenDataMeetUp.pdf
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Bibliotheken @ Google
OpenData und Lokaljournalismus | Scoopcamp HH 2010
Wie verbreitet sich die digitale Publikation im Netz?
Google als Partner schätzen lernen: Austrian Books Online
Anzeige

Andere mochten auch (13)

PDF
Leaving Blackboxes Behind - ELAG 2016
PDF
Sortierung von Suchergebnissen
PDF
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
PDF
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
ODP
Open Source Software in Bibliotheken
PPT
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
PDF
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
PDF
Seige arndt-lightning talk swib13
PDF
Torsten Grote: Freie Software
PDF
Ohne offenes wissen keine informationelle Selbstbestimmung
PDF
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
PDF
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
PPTX
WTF - Why the Future Is Up to Us - pptx version
Leaving Blackboxes Behind - ELAG 2016
Sortierung von Suchergebnissen
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Open Source Software in Bibliotheken
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Seige arndt-lightning talk swib13
Torsten Grote: Freie Software
Ohne offenes wissen keine informationelle Selbstbestimmung
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
WTF - Why the Future Is Up to Us - pptx version
Anzeige

Ähnlich wie Aufbau eines zentralen Indexes im GBV (19)

PPS
Neue Kataloge – wo geht die Reise hin?
PPS
Die Zukunft der Portale - Kataloge der nächsten Generation
PDF
Resource Discovery - Sacherschließung am Ende?
PDF
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
PPT
Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
PDF
Discovery-Systeme - die OPACs der Zukunft?
PPT
Arbeitsgruppe Fachreferat Naturwissenschaften
PDF
Resource Discovery: Herausforderung und Chance für die Sacherschließung
PDF
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
PPT
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
PPT
Fit für die digitale Bibliothek? (2007)
PDF
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
PPTX
Seige finc 103. Bibliothekartag 2014 Discovery System Project
PPTX
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
PPTX
Informationskompetenz 1
ODP
Dynamische Kataloganreicherung mit Webservices
PPTX
Einführung in Fachrecherche
PDF
Aufbau eines Institutsgesamtkatalogs aus OpenSource-Komponenten am Beispiel d...
Neue Kataloge – wo geht die Reise hin?
Die Zukunft der Portale - Kataloge der nächsten Generation
Resource Discovery - Sacherschließung am Ende?
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
Discovery Systeme - Fluch oder Segen für BibliothekarInnen?
Discovery-Systeme - die OPACs der Zukunft?
Arbeitsgruppe Fachreferat Naturwissenschaften
Resource Discovery: Herausforderung und Chance für die Sacherschließung
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Fit für die digitale Bibliothek? (2007)
E-LIB Bremen - Inhaltserschließung als Navigationspunkte für den Suchprozess:...
Seige finc 103. Bibliothekartag 2014 Discovery System Project
Verarbeitung von Sacherschließungselementen - GfKl_Hildesheim 2012
Informationskompetenz 1
Dynamische Kataloganreicherung mit Webservices
Einführung in Fachrecherche
Aufbau eines Institutsgesamtkatalogs aus OpenSource-Komponenten am Beispiel d...

Aufbau eines zentralen Indexes im GBV

  • 1. Aufbau eines zentralen Indexes im GBV Till Kinstler, [email_address] http://twitter.com/tillk Verbundzentrale des GBV (VZG)
  • 2. Wir haben im zentralen Metadatenmanagementsystem des GBVs (CBS) rund 100 Millionen interessante Datensätze: klassische OPAC-Daten (GVK), Online Contents (OLC), Nationallizenzen, … Und was machen wir damit?
  • 3.  
  • 4.  
  • 5.  
  • 6.  
  • 7.  
  • 8. „ In addition, we have also found that the poor usability, high complexity, and lack of integration of many electronic resource discovery systems, have raised the entry threshold of information technology literacy. This acts as a barrier to information search and retrieval. […] Users find database structures hinder . They have to learn the procedural knowledge for using a particular database as well as have some basic knowledge of how the data table is organised and what subject matter the built-in thesauri refers to; both have limited transferability. The participants did not appear to lack information technology or digital literacy, as they had demonstrated they were able to use other internet-based search and retrieval tools.“ (Wong, W. ; Stelmaszewska, H. ; Barn, B. ; Bhimani, N. ; Barn, S.: JISC User Behaviour Observational Study: User Behaviour in Resource Discovery. Final Report / JISC. Version: November 2009. http://www.jisc.ac.uk/media/documents/publications/programme/2010/ubirdfinalreport.pdf )
  • 9. Idee: Nur noch ein Zugangspunkt für alle Bestände (und Dienste ?!?) einer Bibliothek im Web
  • 10. -> große, aggregierte / integrierte Suchindexe (die alle Bestände einer Bibliothek abbilden: Monographien, Artikel, elektronische Bestände, Webseiten, ...)
  • 11. -> „einfach“ zu benutzende Oberflächen
  • 12. -> fehlt oft: gute Integration aller angebotenen Dienste (Ausleihe, Fernleihe, elektronischer Zugang,...) Konsequenzen
  • 13. Konsequenzen Endlich Abkehr vom Paradigma exakter, boolescher Suche: „The conventional Boolean retrieval methodology is not well adapted to the information retrieval task“ (Gerard Salton, 1984)
  • 14. Stattdessen einfache, „best match“ Suche („wie im Web“): „A best match search matches the set of query stems against the sets of stems corresponding to each of the documents in the database, calculates a measure of similarity between the query and each document, and then sorts the documents into order of decreasing similarity with the query .“ (Peter Willett, 1988)
  • 15. -> „unpräzise“ Suche (egal ob [Nachname, Vorname] oder [Vorname Nachname], Stemming, nur ein Teil der Suchbegriffe muss vorkommen, automatische Erweiterung der Suchanfrage, ...)
  • 16. -> Relevanzsortierung (-> was ist Relevanz?)
  • 17. -> Möglichkeiten zum Browsen, Verfeinern, Entdecken (Facetten, „ähnliche Treffer“, Vorschläge/Recommendations), ...
  • 18. Suchtechnik: Oft basierend auf Vektorraummodell (-> Termstastistik als Grundlage der Sortierung), z.B. Lucene/Solr/ElasticSearch/..., Xapian, …
  • 19. Salton, Gerard (1984): The Use of Extended Boolean Logic in Information Retrieval, in: Proceedings of the 1984 ACM SIGMOD International Conference on Management of Data, ACM Press, 277.
  • 20. Willett, Peter (1988): Document retrieval systems, Vol. 3, Foundations of Information Science, Taylor Graham.
  • 21. Aggregierte Suchindexe Kommerzielle Angebote: Serials Solutions Summon, ExLibris Primo Central, EBSCO Discovery Service, WorldCat local metasearch, … Projekte/DIY: Suchkiste (Nationallizenzen), Swissbib (schweizer Bibliotheken), ETH Knowledge Portal (gesamter Bestand der Bibliothek plus Webseiten), The European Library (europäische Nationalbibliotheken), Hathi Trust (US-amerikanische Digitalisierungsprojekte), ...
  • 23. Zentraler GBV Index Inhalt: GVK (33 Mio. Titel) ÖVK (6 Mio. Titel) Online Contents OLC (33 Mio. Aufsätze aus ca. 27000 Zeitschriften seit 1993) Fachausschnitte OLC Nationallizenzen (23 Mio. Aufsätze, 0,4 Mio. E-Books) Bibliografien: BMS, WAO, u.w. nationale Projekte: VD17, IKAR, usw.
  • 24. Zentraler GBV Index Suchmaschine: Solr/Lucene (Open Source): http://lucene.apache.org/solr/ Indexierung von MARC21-Daten aus CBS mittels solrmarc (Open Source): http://code.google.com/p/solrmarc/ Suche über „Solr-Protokoll“ (-> beliebige Oberflächen mit Schnittstellen zu Solr nutzbar, z.B. OCLC Touchpoint, VuFind, ExLibris Primo, Blacklight...) Support der Verbundzentrale für OCLC Touchpoint, VuFind
  • 25. Flexible Sichten, individuelle Ausschnitte (bibliotheks- oder nutzerspezifisch, lizenzspezifisch, thematisch, ...) auf Index mittels Filter
  • 26. Derzeit Testbetrieb in zwei Installationen TUBfind, TU Hamburg-Harbug (VuFind) TouchPoint UB Weimar
  • 27. Problemchen Datenhandling (Normalisierung, Austausch, Anreicherung, Deduplizierung,...)
  • 28. Akzeptanz: „In both cases, the recall-oriented Solr has proven to be a very disruptive indexing technology for librarians accustomed to traditional indexes.“ (Garrison, Boston, Bair 2011)
  • 29. Integration bestehender Infrastruktur (Dienste!) -> Weiterdenken: Discovery findet eh „überall“ statt. Angebot von Bibliotheken ist der Zugang zu entdeckten Ressourcen. Also Zugang statt „Suche“ optimieren? Garrison, Scott; Boston, George; Bair, Sheila (2011): Taming Lightning in More Than One Bottle: Implementing a Local Next-Generation Catalog Versus a Hosted Web-Scale Discovery Service, in: Proceedings of the ACRL 2011 Conference, http://www.ala.org/ala/mgrps/divs/acrl/events/national/2011/papers/taming_lightning.pdf
  • 30. Foto von http://de.wikipedia.org/wiki/Datei:Fleischwolf.ganz.jpg Till Kinstler [email_address] http://twitter.com/tillk

Hinweis der Redaktion

  • #2: Was ist VuFind? („Villanova University Find“) - „Next Generation Catalog“/„Katalog 2.0“/„Discovery Interface“ für alle Ressourcen einer Bibliothek - Ziel: einfach zu benutzen! -> professionelles Oberflächendesign! - begonnen an der Falvey Memorial Library der Villanova University, PA, seit 2007 als OS-Projekt Erste Installation in Betrieb: NLA Mittlerweile mindestens 50 Installationen im Produktivbetrieb weltweit, vorwiegend in USA und Australien