SlideShare a Scribd company logo
EDISCOVERY
EN BIG DATA
29 OKTOBER 2019
PROGRAMMA
Opening
Bregje Pieters, opleidingsmanager HBO-Rechten
Welkom
Illona van Opdorp, voorzitter bestuur Legal Tech Alliantie
Keynotespreker
Jan Scholtes Chief Strategy Officer ZyLAB & Hoogleraar Text-Mining
Universiteit van Maastricht.
2
LEGAL BIG DATA
eDiscovery for Legal Fact Finding & Handling Information Requests
LegalTech Alliance
29 oktober 2019
Prof dr ir Jan C. Scholtes
https://www.linkedin.com/in/jscholtes/
https://textmining.nu
 Waarom eDiscovery?
 De cursus eDiscovery zoals ontwikkeld voor en met de HvA.
 Q&A.
AGENDA
SLIDE / 6
THE WORLD IS RADICALLY CHANGING
CHANGES AND NEED TO ADOPT ARE FASTER THAN EVER
SLIDE / 7
FOR PEOPLE TO BE WILLING TO CHANGE REQUIRES TRANSPARENCY AND TRUST
SLIDE / 9
MORE REGULATIONS TO PROTECT US FROM TECHNOLOGY
CCPA
SLIDE / 10
INFORMATION REQUESTS ARE PART OF THE TRUST AND OF
ENFORCEMENT BY THE REGULATORS
• FOIA (WOB)
• Audits
Internal Investigations
• Litigation
• Arbitration
• Regulatory Requests
• Subject Access
Requests
eDiscovery
 Juridisch feitenonderzoek zal in de toekomst plaatsvinden in electronische
dataset (email, telefoons, tablets, hard disken, USB storage, cloud, social media,
sharepoint, …) en steeds minder (of helemaal niet meer) op papier.
 Informatie verzoeken van derden zullen gaan over de inhoud van dat soort
electronische data sets.
 De jurist van de toekomst zal voor deze toepassingen om moeten kunnen gaan
met (grote) electronische data verzamelingen.
Neem beslissingen op basis van feiten en niet op basis van
veronderstellingen en aannames!
Wees in staat om op tijd en volledig aan informatie verzoeken te voldoen!
WAAROM EDISCOVERY VOOR DE JURIST VAN DE TOEKOMST?
SLIDE / 11
DE CURSUS LEGAL BIG DATA
4 uur hoorcollege en 4 uur hands-on op ZyLAB ONE
Optioneel certificering van studenten op ZyLAB ONE
Slide deck
Aanvullende achtergrond documentatie
Aanvullende oefeningen voor project groepen
SLIDE / 12
 Alles lezen is nog mogelijk
 Bladeren geeft je een goede indruk van de inhoud van het
dossier
 De kans dat je belangrijke feiten over het hoofd ziet is klein
eDiscovery software helpt je om overzicht te houden, data te
organiseren, gevoelige gegevens te beschermen en de data op
een verantwoordelijke manier met derden te delen.
EDISCOVERY OP EEN KLEINE DATA SET (TIENTALLEN
DOCUMENTEN)
 Alles lezen is onmogelijk
 Bladeren is doodvermoeiend en duurt te lang
 Te grote kans dat je belangrijke feiten over het hoofd ziet
Dus we gaan zoeken op combinaties van trefwoorden.
Dat heet ook wel Full-Text Search, Boolean Search of
Information Retrieval
EDISCOVERY OP 10.000 DOCUMENTEN
 Booleaans Zoeken werkt niet meer:
 Je weet niet precies waar (op welke onderwerpen) je op moet zoeken
 Je weet niet welke trefwoorden je moet gebruiken
 Booleans zoeken leidt tot ”Feast or Famine”. Je vind alles (OR) of je vind ineens niets meer (NOT, AND, W/4).
 Zelfs met een hele goede query krijg je duizenden hits die je allemaal moet doorlezen
 Je weet nooit precies welk deel van de relevante documenten je gevonden hebt.
 Hele grote kans dat je belangrijke feiten over het hoofd ziet en dat je beslisingen neemt op basis
van onvolledige informatie.
 Het maken van queries is lasting werk voor juristen.
Dus we gaan zoeken met behulp van AI en Machine Learning (active learning in het bijzonder). We
gaan de computer leren wat relevant is en wat niet.
Dat heet ook wel Technology Assisted Review (TAR), Contious Active Learning (CAL),
Predictive Coding of Machine Assisted Review (allemaal marketing termen uit de wereld van de
LegalTech).
EDISCOVERY OP 100.000 DOCUMENTEN
3x more relevant
documents than Boolean
search
Nocomplex queries, just review
documents
2x total number of
relevant documents is
all that need to be
reviewed
Estimateaccurately
percentage of all relevant
documents found at end
Teach the computer what to look for …
Zoekvraag
 PERSON
 TITLE
Resultaat
Een zogenoemde no-dealbrexit
wordt per dag waarschijnlijker,
waarschuwde EU-
hoofdonderhandelaar voor de
brexit Michel Barnier
dinsdagochtend op een
conferentie in Brussel. In geen
geval wordt de principe-deal van
premier Theresa May met de EU
heronderhandeld, aldus Barnier.
SLIDE / 17
NAMEN EN TITELS LAKKEN VOOR DE WOB
Juridisch zoeken is anders:
 Transparantie van technology
 Reproduceerbaarheid van technologie
 Documenatie: Chain of Custody
 Jurisprudentie over gebruik technologie
 …
SLIDE / 18
JURIDISCHE VERDEDIGBAARHEID & TRANSPARANTIE
SLIDE / 19
Q&A
https://www.linkedin.com/in/jscholtes/
Workshop ronde 1
MLH 07A16
Burgervriendelijke data-communicatie
MLH 07A20
eDiscovery en big data in de minoren van HBO-Rechten Amsterdam
Workshop ronde 2
MLH 07A24
Wat is big data en het recht?
MLH 07A20
eDiscovery en big data in de afstudeerfase van HBO-Rechten
Amsterdam 21

More Related Content

PDF
Darwin 5 juni olaf van haperen
PPTX
Full presentation LOD Masterclass ESI HHS PZH Kadaster
PDF
Samenspraak jaargang 3 editie 2 2011
PPT
GDPR. Wat kan je in extremis nog doen?
PPT
PPTX
GDPR Webinar NextConomy
PDF
Omdat Informatie Rijkdom Is
PDF
Ricoh mds brochure_200x200_online versie_lossep
Darwin 5 juni olaf van haperen
Full presentation LOD Masterclass ESI HHS PZH Kadaster
Samenspraak jaargang 3 editie 2 2011
GDPR. Wat kan je in extremis nog doen?
GDPR Webinar NextConomy
Omdat Informatie Rijkdom Is
Ricoh mds brochure_200x200_online versie_lossep

Similar to LegalTech Alliance eDiscovery keynote Scholtes (20)

ODP
Verhalen uit de loopgraven - Workshop Security & privacy
PPTX
Presentatie Innovatie en Legal Tech, gemeente Arnhem
PDF
Gemeente Utrecht bereidt zich voor op de disruptieve toekomst
PPT
Presentatie Landelijke Praktijkdag Functioneel Beheer 2009
PPT
Presentatie Landelijke Praktijkdag Functioneel Beheer 2009
ODP
Werken aan je (digitale) toekomst ?
PDF
[Idm e] c&t - open data college 3
PDF
Overleeft de manager de digitale economie
PDF
69736_CDPO_web
PPTX
20181209 gastles HoGent digital marketing
PDF
De ware aard van kennis - Gebruik uw kennis zonder programmeren - Interview P...
PDF
171031 fex - op tijd compliant met gdpr - presentatie valid
PDF
Overzicht workshops sebyde academy
PPTX
Big data, wat kun je ermee?
PDF
Producten en diensten Jolanda ter Maten
PPT
Zorgbelang Nederland Halen&Brengen
PDF
Praktijkcursus WBP en Masterclass Europese Privacyverordening
PDF
GELDT DE GDPR OOK VOOR MIJN ORGANISATIE?
PDF
Verborgen kapitaal zichtbaar maken op de balans
Verhalen uit de loopgraven - Workshop Security & privacy
Presentatie Innovatie en Legal Tech, gemeente Arnhem
Gemeente Utrecht bereidt zich voor op de disruptieve toekomst
Presentatie Landelijke Praktijkdag Functioneel Beheer 2009
Presentatie Landelijke Praktijkdag Functioneel Beheer 2009
Werken aan je (digitale) toekomst ?
[Idm e] c&t - open data college 3
Overleeft de manager de digitale economie
69736_CDPO_web
20181209 gastles HoGent digital marketing
De ware aard van kennis - Gebruik uw kennis zonder programmeren - Interview P...
171031 fex - op tijd compliant met gdpr - presentatie valid
Overzicht workshops sebyde academy
Big data, wat kun je ermee?
Producten en diensten Jolanda ter Maten
Zorgbelang Nederland Halen&Brengen
Praktijkcursus WBP en Masterclass Europese Privacyverordening
GELDT DE GDPR OOK VOOR MIJN ORGANISATIE?
Verborgen kapitaal zichtbaar maken op de balans
Ad

More from jcscholtes (16)

PDF
Legal tech Alliance Workshop 20191029
PDF
Text mining scholtes - big data congress utrecht 2019
PDF
Target-Based Sentiment Anaysis as a Sequence-Tagging Task
PDF
Ai and applications in the legal domain studium generale maastricht 20191101
PDF
Augmented intelligence and the impact on your world in 2030
PDF
Text mining voor Business Intelligence toepassingen
PDF
How can text-mining leverage developments in Deep Learning? Presentation at ...
PDF
Hogeschool Den Haag Legal Analytics
PDF
HvA Legaltech Lab Opening
PDF
Big Data en Data Science en de Rechtspraak
PDF
How can Artificial Intelligence help me on the Battlefield?
PDF
Big data analytics for legal fact finding
PDF
Text mining scholtes - big data congress utrecht 2018
PDF
How new ai based analytics ignite a productivity revolution in e discovery-final
PDF
Efficiently Handling Subject Access Requests
PDF
Waarom LegalTech de toekomst heeft
Legal tech Alliance Workshop 20191029
Text mining scholtes - big data congress utrecht 2019
Target-Based Sentiment Anaysis as a Sequence-Tagging Task
Ai and applications in the legal domain studium generale maastricht 20191101
Augmented intelligence and the impact on your world in 2030
Text mining voor Business Intelligence toepassingen
How can text-mining leverage developments in Deep Learning? Presentation at ...
Hogeschool Den Haag Legal Analytics
HvA Legaltech Lab Opening
Big Data en Data Science en de Rechtspraak
How can Artificial Intelligence help me on the Battlefield?
Big data analytics for legal fact finding
Text mining scholtes - big data congress utrecht 2018
How new ai based analytics ignite a productivity revolution in e discovery-final
Efficiently Handling Subject Access Requests
Waarom LegalTech de toekomst heeft
Ad

LegalTech Alliance eDiscovery keynote Scholtes

  • 2. PROGRAMMA Opening Bregje Pieters, opleidingsmanager HBO-Rechten Welkom Illona van Opdorp, voorzitter bestuur Legal Tech Alliantie Keynotespreker Jan Scholtes Chief Strategy Officer ZyLAB & Hoogleraar Text-Mining Universiteit van Maastricht. 2
  • 3. LEGAL BIG DATA eDiscovery for Legal Fact Finding & Handling Information Requests LegalTech Alliance 29 oktober 2019
  • 4. Prof dr ir Jan C. Scholtes https://www.linkedin.com/in/jscholtes/ https://textmining.nu
  • 5.  Waarom eDiscovery?  De cursus eDiscovery zoals ontwikkeld voor en met de HvA.  Q&A. AGENDA
  • 6. SLIDE / 6 THE WORLD IS RADICALLY CHANGING
  • 7. CHANGES AND NEED TO ADOPT ARE FASTER THAN EVER SLIDE / 7
  • 8. FOR PEOPLE TO BE WILLING TO CHANGE REQUIRES TRANSPARENCY AND TRUST
  • 9. SLIDE / 9 MORE REGULATIONS TO PROTECT US FROM TECHNOLOGY CCPA
  • 10. SLIDE / 10 INFORMATION REQUESTS ARE PART OF THE TRUST AND OF ENFORCEMENT BY THE REGULATORS • FOIA (WOB) • Audits Internal Investigations • Litigation • Arbitration • Regulatory Requests • Subject Access Requests eDiscovery
  • 11.  Juridisch feitenonderzoek zal in de toekomst plaatsvinden in electronische dataset (email, telefoons, tablets, hard disken, USB storage, cloud, social media, sharepoint, …) en steeds minder (of helemaal niet meer) op papier.  Informatie verzoeken van derden zullen gaan over de inhoud van dat soort electronische data sets.  De jurist van de toekomst zal voor deze toepassingen om moeten kunnen gaan met (grote) electronische data verzamelingen. Neem beslissingen op basis van feiten en niet op basis van veronderstellingen en aannames! Wees in staat om op tijd en volledig aan informatie verzoeken te voldoen! WAAROM EDISCOVERY VOOR DE JURIST VAN DE TOEKOMST? SLIDE / 11
  • 12. DE CURSUS LEGAL BIG DATA 4 uur hoorcollege en 4 uur hands-on op ZyLAB ONE Optioneel certificering van studenten op ZyLAB ONE Slide deck Aanvullende achtergrond documentatie Aanvullende oefeningen voor project groepen SLIDE / 12
  • 13.  Alles lezen is nog mogelijk  Bladeren geeft je een goede indruk van de inhoud van het dossier  De kans dat je belangrijke feiten over het hoofd ziet is klein eDiscovery software helpt je om overzicht te houden, data te organiseren, gevoelige gegevens te beschermen en de data op een verantwoordelijke manier met derden te delen. EDISCOVERY OP EEN KLEINE DATA SET (TIENTALLEN DOCUMENTEN)
  • 14.  Alles lezen is onmogelijk  Bladeren is doodvermoeiend en duurt te lang  Te grote kans dat je belangrijke feiten over het hoofd ziet Dus we gaan zoeken op combinaties van trefwoorden. Dat heet ook wel Full-Text Search, Boolean Search of Information Retrieval EDISCOVERY OP 10.000 DOCUMENTEN
  • 15.  Booleaans Zoeken werkt niet meer:  Je weet niet precies waar (op welke onderwerpen) je op moet zoeken  Je weet niet welke trefwoorden je moet gebruiken  Booleans zoeken leidt tot ”Feast or Famine”. Je vind alles (OR) of je vind ineens niets meer (NOT, AND, W/4).  Zelfs met een hele goede query krijg je duizenden hits die je allemaal moet doorlezen  Je weet nooit precies welk deel van de relevante documenten je gevonden hebt.  Hele grote kans dat je belangrijke feiten over het hoofd ziet en dat je beslisingen neemt op basis van onvolledige informatie.  Het maken van queries is lasting werk voor juristen. Dus we gaan zoeken met behulp van AI en Machine Learning (active learning in het bijzonder). We gaan de computer leren wat relevant is en wat niet. Dat heet ook wel Technology Assisted Review (TAR), Contious Active Learning (CAL), Predictive Coding of Machine Assisted Review (allemaal marketing termen uit de wereld van de LegalTech). EDISCOVERY OP 100.000 DOCUMENTEN
  • 16. 3x more relevant documents than Boolean search Nocomplex queries, just review documents 2x total number of relevant documents is all that need to be reviewed Estimateaccurately percentage of all relevant documents found at end Teach the computer what to look for …
  • 17. Zoekvraag  PERSON  TITLE Resultaat Een zogenoemde no-dealbrexit wordt per dag waarschijnlijker, waarschuwde EU- hoofdonderhandelaar voor de brexit Michel Barnier dinsdagochtend op een conferentie in Brussel. In geen geval wordt de principe-deal van premier Theresa May met de EU heronderhandeld, aldus Barnier. SLIDE / 17 NAMEN EN TITELS LAKKEN VOOR DE WOB
  • 18. Juridisch zoeken is anders:  Transparantie van technology  Reproduceerbaarheid van technologie  Documenatie: Chain of Custody  Jurisprudentie over gebruik technologie  … SLIDE / 18 JURIDISCHE VERDEDIGBAARHEID & TRANSPARANTIE
  • 21. Workshop ronde 1 MLH 07A16 Burgervriendelijke data-communicatie MLH 07A20 eDiscovery en big data in de minoren van HBO-Rechten Amsterdam Workshop ronde 2 MLH 07A24 Wat is big data en het recht? MLH 07A20 eDiscovery en big data in de afstudeerfase van HBO-Rechten Amsterdam 21