SlideShare a Scribd company logo
!
Trend Analysis @ SenTaClAus!
Pisa – Dipartimento di Informatica!
23/03/2015!
!
Luca De Santis – desantis@netseven.it - @lucadex!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
Conce&o	
  X	
   Conce&o	
  Z	
  
!
Il lavoro in SenTaClAus!
•  Estensioni della Trend Analysis!
–  Miglioramenti nell’efficacia, grazie alle corrispondenti evoluzioni nella
Text Analysis!
–  Nuove analisi (e corrispondenti interfacce grafiche)!
•  Link Analysis!
•  Analisi geografiche!
•  Analisi degli Influencers!
•  Sperimentazioni sulla Sentiment Analysis!
–  Si sfrutta la logica di elaborazione “a catena di montaggio” dell’ESB!
! Enterprise	
  Service	
  Bus	
  
Immagini © http://ecquire.com/blog/social-media-sales-funnel/ - http://rvtechsolutions.com/socialmediabreakfast/willmar-lakes-area/
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Ricerca #serviziopubblico!
Ricerca #serviziopubblico!
Ricerca #serviziopubblico!
Disambiguazione hashtags !
Link Analysis!
Link Analysis!
Mappe!
Mappe!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Architettura Software!
•  Architettura
Multilayer!
–  Data Layer: !
•  MariaDB!
•  Solr!
–  Presentation!
•  PHP/
Symfony!
–  Business!
•  ESB !
•  Java!
•  Enterprise
Integration
Pattern!
Logica di elaborazione “a catena di
montaggio”!
Logica di elaborazione “a catena di
montaggio”!
Logica di elaborazione “a catena di
montaggio”!
!
Validazione!
•  3 tipologie di focus group !
•  Funzionale!
–  Questionario sui servizi del sistema!
–  Target: utenti, clienti!
•  Architetturale!
–  Evoluzioni, in particolare in ottica di
elaborazione di Big Data!
–  Partner tecnici per possibili progetti!
•  Marketing!
–  Modalità di proposizione del servizio, analisi
della concorrenza!
–  Consulenti aziendali!
!
Lessons Learned!
•  Punti di forza!!
•  Posizionamento non ottimale!
–  Report finale più apprezzato di piattaforma di analisi!
•  Architettura facilmente estendibile per processare grandi quantità
di dati!
–  Da ESB ad Apache Storm!
–  Da DB relazionali a DB NOSQL!
–  Da Solr ad ElasticSearch!
•  Sentiment is… King!!
!
http://www.netseven.it!
!
http://spaziodati.eu!
!
http://www.studioflu.it/!
!
http://acube.di.unipi.it/!

More Related Content

PDF
I servizi semantici di analisi testuale nel progetto SenTaClAus
PPTX
Presentazione
PDF
SpazioDati presents dataTXT - SenTaClAus project - 2nd open day
PDF
Social Media Analysis... according to Net7
PDF
Come le IT aiutano le imprese a controllare meglio la gestione e a prendere d...
PPTX
Poffino
PDF
Oracle Business Analytics & Alfa Sistemi
PPT
Owasp parte1-rel1.1
I servizi semantici di analisi testuale nel progetto SenTaClAus
Presentazione
SpazioDati presents dataTXT - SenTaClAus project - 2nd open day
Social Media Analysis... according to Net7
Come le IT aiutano le imprese a controllare meglio la gestione e a prendere d...
Poffino
Oracle Business Analytics & Alfa Sistemi
Owasp parte1-rel1.1

Viewers also liked (9)

PPTX
Project work ipe pw c
PDF
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
PDF
Digital Innovation for Pharma & Healthcare - Overview and Portfolio
PPTX
IDC Big Data & Analytics Conference 2014
PPT
Data Mining and Big Data Analytics in Pharma
PDF
Big Data in Pharma - Overview and Use Cases
PDF
Assignment Advance Quantitative Methods Casolat
PDF
Healthcare and disintermediation: the opportunity
PPTX
Analytics in Pharmaceutical Industry
Project work ipe pw c
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Digital Innovation for Pharma & Healthcare - Overview and Portfolio
IDC Big Data & Analytics Conference 2014
Data Mining and Big Data Analytics in Pharma
Big Data in Pharma - Overview and Use Cases
Assignment Advance Quantitative Methods Casolat
Healthcare and disintermediation: the opportunity
Analytics in Pharmaceutical Industry
Ad

Similar to Trend Analysis sui Social Network - I risultati del progetto SenTaClAus (20)

PDF
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
PDF
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
PDF
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
PPTX
Presentazione Cama_Primiceri_Atro
PPTX
Semantic Search Engine
PDF
Il web intelligente
PDF
SEO & Editoria
PDF
Smau Milano 2016 - Sara Borghi
PDF
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
PDF
C'è semantica in questo web
PDF
Anahita jd10 it
PPTX
Antichi Generazione Web - part 5 Tools Aggregare risorse
PDF
Ascoltere la rete: la sentiment analysis
PPT
Web 2.0 & Library 2.0: un'introduzione
PPTX
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
PPTX
LinkedIn per giornalisti
PDF
Social Network: guida ad un utilizzo consapevole
PPT
Lezione sul Web content management
KEY
BibliotecaAccessibile
PPT
educare alla ricerca
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
Presentazione Cama_Primiceri_Atro
Semantic Search Engine
Il web intelligente
SEO & Editoria
Smau Milano 2016 - Sara Borghi
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
C'è semantica in questo web
Anahita jd10 it
Antichi Generazione Web - part 5 Tools Aggregare risorse
Ascoltere la rete: la sentiment analysis
Web 2.0 & Library 2.0: un'introduzione
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
LinkedIn per giornalisti
Social Network: guida ad un utilizzo consapevole
Lezione sul Web content management
BibliotecaAccessibile
educare alla ricerca
Ad

More from Net7 (20)

PDF
E-RIHS Heritage Hub
PDF
Net7 @ Master Big Data 2017
PPTX
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
PDF
iAnnotate 2016 - Demo Pundit web annotator
PDF
Pundit at Digital Humanities Austria 2015
PDF
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
PDF
Muruca at DiXiT Convention 1: Technology, Software, Standards
PDF
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
PDF
Pundit at DiXiT Convention 1: Technology, Software, Standards
PDF
Word Embedding e word2vec: Introduzione ed Esperimenti Preliminari
PDF
Io sono qui per voi - Giulio Andreini
PDF
Rethinking the Role of SSH - Culture and Creativity
PDF
Pundit at 3rd DBpedia Community Meeting 2015
PDF
Lod portal and pundit @ Humanities Hack london2014
PDF
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
PPTX
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
PDF
Pundit @ Vienna 2014
PPTX
Apache Solr + ajax solr
PDF
2014 09-18 pundit@dariah2014
PDF
DM2E project - All WP Meeting 5, Bergen - WP3
E-RIHS Heritage Hub
Net7 @ Master Big Data 2017
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
iAnnotate 2016 - Demo Pundit web annotator
Pundit at Digital Humanities Austria 2015
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
Muruca at DiXiT Convention 1: Technology, Software, Standards
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
Pundit at DiXiT Convention 1: Technology, Software, Standards
Word Embedding e word2vec: Introduzione ed Esperimenti Preliminari
Io sono qui per voi - Giulio Andreini
Rethinking the Role of SSH - Culture and Creativity
Pundit at 3rd DBpedia Community Meeting 2015
Lod portal and pundit @ Humanities Hack london2014
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Pundit @ Vienna 2014
Apache Solr + ajax solr
2014 09-18 pundit@dariah2014
DM2E project - All WP Meeting 5, Bergen - WP3

Trend Analysis sui Social Network - I risultati del progetto SenTaClAus

  • 1. ! Trend Analysis @ SenTaClAus! Pisa – Dipartimento di Informatica! 23/03/2015! ! Luca De Santis – [email protected] - @lucadex!
  • 2. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 3. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 4. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 5. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 6. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 7. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 8. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 9. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 10. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 11. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 12. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 13. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 14. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?! Conce&o  X   Conce&o  Z  
  • 15. ! Il lavoro in SenTaClAus! •  Estensioni della Trend Analysis! –  Miglioramenti nell’efficacia, grazie alle corrispondenti evoluzioni nella Text Analysis! –  Nuove analisi (e corrispondenti interfacce grafiche)! •  Link Analysis! •  Analisi geografiche! •  Analisi degli Influencers! •  Sperimentazioni sulla Sentiment Analysis! –  Si sfrutta la logica di elaborazione “a catena di montaggio” dell’ESB! ! Enterprise  Service  Bus   Immagini © http://ecquire.com/blog/social-media-sales-funnel/ - http://rvtechsolutions.com/socialmediabreakfast/willmar-lakes-area/
  • 16. Esempi di Trend Analysis: menzioni @Unipisa!
  • 17. Esempi di Trend Analysis: menzioni @Unipisa!
  • 18. Esempi di Trend Analysis: menzioni @Unipisa!
  • 19. Esempi di Trend Analysis: menzioni @Unipisa!
  • 28. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 29. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 30. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 31. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 32. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 33. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 34. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 35. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 36. ! Architettura Software! •  Architettura Multilayer! –  Data Layer: ! •  MariaDB! •  Solr! –  Presentation! •  PHP/ Symfony! –  Business! •  ESB ! •  Java! •  Enterprise Integration Pattern!
  • 37. Logica di elaborazione “a catena di montaggio”!
  • 38. Logica di elaborazione “a catena di montaggio”!
  • 39. Logica di elaborazione “a catena di montaggio”!
  • 40. ! Validazione! •  3 tipologie di focus group ! •  Funzionale! –  Questionario sui servizi del sistema! –  Target: utenti, clienti! •  Architetturale! –  Evoluzioni, in particolare in ottica di elaborazione di Big Data! –  Partner tecnici per possibili progetti! •  Marketing! –  Modalità di proposizione del servizio, analisi della concorrenza! –  Consulenti aziendali!
  • 41. ! Lessons Learned! •  Punti di forza!! •  Posizionamento non ottimale! –  Report finale più apprezzato di piattaforma di analisi! •  Architettura facilmente estendibile per processare grandi quantità di dati! –  Da ESB ad Apache Storm! –  Da DB relazionali a DB NOSQL! –  Da Solr ad ElasticSearch! •  Sentiment is… King!!