SlideShare a Scribd company logo
Działaj globalnie, czyli Topicmarks w Dolinie Krzemowej Jaromir Działo
Agenda Intro Problem Rozwiązanie Dlaczego Dolina Krzemowa? Działaj globalnie Q&A
 
 
 
Dziennie powstaje: 60,000  nowych website’ów 1,5 milionów  artykułów na blogach   10 milionów  postów na tumblr   140 miliony  tweetów 1,5 miliarda  różnego rodzaju wpisów na facebooku
 
Problem
Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie, szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens.  Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie ,  szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
Rozwiązanie .. niech komputer pomoże nam czytać
Topicmarks  can  semantically summarize ,  tag ,  find relations   and   organize large collections  of   document s   automagically. It decomposes a document   into semantic relations to create multiple, alternative personalized views of content. It allows extracted knowledge to be re-used, namely in the construction of   concept maps ,  documents ,  presentations   and so on
Product
Product
Product
Product Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children
Product
Engine Client e.g. portal,  browser  extension,  rest API sentence splitter tokenizer  (sentence into words) sentence parser fact generation   (building semantic  relations f r om parsed sentences) terms extraction semantic document representation Distributed on (1..n) servers Knowledge base storage semantic  data model indexing text search engine Cluster of DB servers RDF model Front-end servers wrapper induction PDF Wrapper HTML Wrapper Custom Wrapper e.g. WIKIPEDIA Upload DOC Wrapper Text processing pipeline there are over 30 processors implemented  in the grammar analyzer pipeline,  switched on/off when needed cache
Architektura Technology difficult to duplicate ~20,000 engineering hours investe d Solves hard natural language processing problems Advanced string and graph-theoretic algorithms Requires large system architecture design  Harnesses web intelligence via Web2.0/3.0 APIs Makes advanced human-machine collaboration  A ccessible to the casual user Published USPO patent Title: "Method and System for Generating a Document Representation" Filed March 5, 2010; priority March 6, 2009 Total number of claims: 42 The many engineering hours invested, proprietary algorithms and a patent make duplication unrealistic
Zastosowania Analiza dokumentów WikiLeaks Procesowanie kanałów RSS Analiza Press Releasów giełdowych Feedback użytkowników: student dziękował za "5-tkę", którą otrzymał za wygenerowane streszczenie blogger używał Topicmarks do procesowania swoich artykułów pod kątem zrozumiałości – "jeśli maszyna to zrozumie, to może większość ludzi też" ktoś generował meta tagi pod SEO ktoś przeprocesował list miłosny od swojej dziewczyny.. i dziękował, że tylko dzięki temu go zrozumiał (?!)
Seedcamp “ Topicmarks .. a  real need for millions” May 2010, a winner of
Dlaczego  Dolina Krzemowa?
Capital  is liquid.   Capitalists  are not.
 
Silicon Valley inwestorzy: nie tylko „Sand Hill Road”  co-working spaces: Pier38, SOMACentral, PariSoma media w co drugim (ponieważ same też często są startupem) spotkania branżowe prawnicy pracujący „za darmo” (do momentu zdobycia finansowania)
Heaven & Hell Wyjątkowy pomysł? Niekoniecznie.  Odpowiedni moment wejścia na rynek? Bardziej.  Znajomości?  Przede wszystkim.
Winning Efforts Grand Prize Winner by 66% audience vote and 88% jury points “ Potentially huge—Jeff Clavier” “ Solving a very interesting problem” “ Nerdy winner of the night” Thought through very well” “ A ripe acquisition target”
:) “ Made for […] denser documents” “ Find a new friend in Topicmarks”
Działaj globalnie?
Bilans 6 inwestorów oraz 5 advisorów, wśród nich: Aaron Patzer (Mint .com [$170m] =>  Intui t ) Adeo Ressi (Founder Institute) Peter Berger II (Silicon Valley Semantic Technology Forum) Jeannie Kahwajy (Adviser to Hillary Clinton) koncepcja nowego produktu bezcenne kontakty współpraca przy procesowaniu repozytoriów Cloud (Evernote, Google Docs, Dropbox, BOX.net)
Bilans Biuro Topicmarks w San Francisco a „za ścianą” mamy: Twitter Mashable Wordpress Zite Socialize oraz Stadion  Baseballa    GO GIANTS!!
Nowy Produkt
Nowy Produkt
Nowy Produkt
Bilans Topicmarks obecnie: używany w 160+ krajach procesuje ok. 2 miliony dokumentów tygodniowo 35.000 użytkowników.. ..którzy mówią 62 językami promowany na Evernote 40.000.000 rekordów w indeksie operuje na rynku zarzadzania informacjami w cloudzie, szacowanym na $1mld ($5.5b w 2015)
Bilans Potential B2B B2C Deal in place
Bilans Organizing information on the cloud is growing 74% per year into a $5.5b market Cloud storage is exploding into a $33b market in 2015 Sources: OECD, Accenture, IDC IT Cloud Services Forecast, team analysis. Spending on organizing and retrieving research is worth $139b in 2015 CAGR 11% CAGR 58% Digitization of paper sources Multiple devices Remote collaboration Better backups Mainstreaming of research Information explosion Independent contracting Knowledge-based competitiveness CAGR 74% People organizing information through cloud storage will be a $5.5b market in 2015
.PL Mamy najlepszych programistów na świecie .. czas na NASZE globalne produkty
Pytania?
Jaromir Działo [email_address] twitter: @jaromirdzialo

More Related Content

PPT
8 jaromir dzialo
PPTX
KrakSpot #13 Piotr Peszko - Dobry, zły i brzydki - słów kilka na temat mobile...
PPT
KrakSpot #13 Karol Paciorek, Włodek Markowicz - Pokaż, że ci zależy
PPTX
Ks11 d biesiada
PDF
Jakub Krzych - Estimote - Poland - Stanford Engineering - Jan 26 2015
PPTX
PocketPill
PPT
Jak wdrożyć wiki w firmie?
PPT
Jak wdrożyć wiki w firmie - Tomasz Karwatka, Divante
8 jaromir dzialo
KrakSpot #13 Piotr Peszko - Dobry, zły i brzydki - słów kilka na temat mobile...
KrakSpot #13 Karol Paciorek, Włodek Markowicz - Pokaż, że ci zależy
Ks11 d biesiada
Jakub Krzych - Estimote - Poland - Stanford Engineering - Jan 26 2015
PocketPill
Jak wdrożyć wiki w firmie?
Jak wdrożyć wiki w firmie - Tomasz Karwatka, Divante

Similar to KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie krzemowej (20)

PPT
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
PDF
Zasady technicznej organizacji projektów programistycznych
PDF
Metadane i społeczeństwo a zarządzanie wiedzą
PPT
BiznesWiki - zarządzanie wiedzą w stylu web 2.0
PDF
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
PPT
Zarządzanie wiedzą w organizacji - Tomek Karwatka
PPT
Zarządzanie wiedzą w organizacji
PPTX
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
PDF
Poradnictwo na odleglosc narzedzia i zakres pomocy (2)
PDF
Html5 i css3
PDF
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
PPT
Rewolucja w sieciach społecznych czyli jak wyciąć pośrednika
PPT
Rewolucja W Sieciach Społecznych
 
PDF
PLNOG 5: Janusz Dziemidowicz - OpenSocial w nk.pl
PPT
Społecznościowe zarządzanie wiedzą i wsparcie dla innowacji
PPT
Uczący się sklep - systemowe podejście do rozwoju eCommerce
PPT
Kreoaula: Badania usability
PPT
Kreoaula: Badania usability
PPTX
Jak budujemy inteligentnego asystenta biznesowego
PPT
Tworzenie społeczności opartych na wiedzy
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
Zasady technicznej organizacji projektów programistycznych
Metadane i społeczeństwo a zarządzanie wiedzą
BiznesWiki - zarządzanie wiedzą w stylu web 2.0
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
Zarządzanie wiedzą w organizacji - Tomek Karwatka
Zarządzanie wiedzą w organizacji
PRZEGLĄD NARZĘDZI W WARSZTACIE OTWARTEGO NAUKOWCA
Poradnictwo na odleglosc narzedzia i zakres pomocy (2)
Html5 i css3
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Rewolucja w sieciach społecznych czyli jak wyciąć pośrednika
Rewolucja W Sieciach Społecznych
 
PLNOG 5: Janusz Dziemidowicz - OpenSocial w nk.pl
Społecznościowe zarządzanie wiedzą i wsparcie dla innowacji
Uczący się sklep - systemowe podejście do rozwoju eCommerce
Kreoaula: Badania usability
Kreoaula: Badania usability
Jak budujemy inteligentnego asystenta biznesowego
Tworzenie społeczności opartych na wiedzy
Ad

KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie krzemowej

  • 1. Działaj globalnie, czyli Topicmarks w Dolinie Krzemowej Jaromir Działo
  • 2. Agenda Intro Problem Rozwiązanie Dlaczego Dolina Krzemowa? Działaj globalnie Q&A
  • 3.  
  • 4.  
  • 5.  
  • 6. Dziennie powstaje: 60,000 nowych website’ów 1,5 milionów artykułów na blogach 10 milionów postów na tumblr 140 miliony tweetów 1,5 miliarda różnego rodzaju wpisów na facebooku
  • 7.  
  • 9. Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie, szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
  • 10. Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie , szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
  • 11. Rozwiązanie .. niech komputer pomoże nam czytać
  • 12. Topicmarks can semantically summarize , tag , find relations and organize large collections of document s automagically. It decomposes a document into semantic relations to create multiple, alternative personalized views of content. It allows extracted knowledge to be re-used, namely in the construction of concept maps , documents , presentations and so on
  • 16. Product Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children
  • 18. Engine Client e.g. portal, browser extension, rest API sentence splitter tokenizer (sentence into words) sentence parser fact generation (building semantic relations f r om parsed sentences) terms extraction semantic document representation Distributed on (1..n) servers Knowledge base storage semantic data model indexing text search engine Cluster of DB servers RDF model Front-end servers wrapper induction PDF Wrapper HTML Wrapper Custom Wrapper e.g. WIKIPEDIA Upload DOC Wrapper Text processing pipeline there are over 30 processors implemented in the grammar analyzer pipeline, switched on/off when needed cache
  • 19. Architektura Technology difficult to duplicate ~20,000 engineering hours investe d Solves hard natural language processing problems Advanced string and graph-theoretic algorithms Requires large system architecture design Harnesses web intelligence via Web2.0/3.0 APIs Makes advanced human-machine collaboration A ccessible to the casual user Published USPO patent Title: "Method and System for Generating a Document Representation" Filed March 5, 2010; priority March 6, 2009 Total number of claims: 42 The many engineering hours invested, proprietary algorithms and a patent make duplication unrealistic
  • 20. Zastosowania Analiza dokumentów WikiLeaks Procesowanie kanałów RSS Analiza Press Releasów giełdowych Feedback użytkowników: student dziękował za "5-tkę", którą otrzymał za wygenerowane streszczenie blogger używał Topicmarks do procesowania swoich artykułów pod kątem zrozumiałości – "jeśli maszyna to zrozumie, to może większość ludzi też" ktoś generował meta tagi pod SEO ktoś przeprocesował list miłosny od swojej dziewczyny.. i dziękował, że tylko dzięki temu go zrozumiał (?!)
  • 21. Seedcamp “ Topicmarks .. a real need for millions” May 2010, a winner of
  • 22. Dlaczego Dolina Krzemowa?
  • 23. Capital is liquid. Capitalists are not.
  • 24.  
  • 25. Silicon Valley inwestorzy: nie tylko „Sand Hill Road” co-working spaces: Pier38, SOMACentral, PariSoma media w co drugim (ponieważ same też często są startupem) spotkania branżowe prawnicy pracujący „za darmo” (do momentu zdobycia finansowania)
  • 26. Heaven & Hell Wyjątkowy pomysł? Niekoniecznie. Odpowiedni moment wejścia na rynek? Bardziej. Znajomości? Przede wszystkim.
  • 27. Winning Efforts Grand Prize Winner by 66% audience vote and 88% jury points “ Potentially huge—Jeff Clavier” “ Solving a very interesting problem” “ Nerdy winner of the night” Thought through very well” “ A ripe acquisition target”
  • 28. :) “ Made for […] denser documents” “ Find a new friend in Topicmarks”
  • 30. Bilans 6 inwestorów oraz 5 advisorów, wśród nich: Aaron Patzer (Mint .com [$170m] => Intui t ) Adeo Ressi (Founder Institute) Peter Berger II (Silicon Valley Semantic Technology Forum) Jeannie Kahwajy (Adviser to Hillary Clinton) koncepcja nowego produktu bezcenne kontakty współpraca przy procesowaniu repozytoriów Cloud (Evernote, Google Docs, Dropbox, BOX.net)
  • 31. Bilans Biuro Topicmarks w San Francisco a „za ścianą” mamy: Twitter Mashable Wordpress Zite Socialize oraz Stadion Baseballa  GO GIANTS!!
  • 35. Bilans Topicmarks obecnie: używany w 160+ krajach procesuje ok. 2 miliony dokumentów tygodniowo 35.000 użytkowników.. ..którzy mówią 62 językami promowany na Evernote 40.000.000 rekordów w indeksie operuje na rynku zarzadzania informacjami w cloudzie, szacowanym na $1mld ($5.5b w 2015)
  • 36. Bilans Potential B2B B2C Deal in place
  • 37. Bilans Organizing information on the cloud is growing 74% per year into a $5.5b market Cloud storage is exploding into a $33b market in 2015 Sources: OECD, Accenture, IDC IT Cloud Services Forecast, team analysis. Spending on organizing and retrieving research is worth $139b in 2015 CAGR 11% CAGR 58% Digitization of paper sources Multiple devices Remote collaboration Better backups Mainstreaming of research Information explosion Independent contracting Knowledge-based competitiveness CAGR 74% People organizing information through cloud storage will be a $5.5b market in 2015
  • 38. .PL Mamy najlepszych programistów na świecie .. czas na NASZE globalne produkty
  • 40. Jaromir Działo [email_address] twitter: @jaromirdzialo

Editor's Notes

  • #3: Jestesmy firma z Krakowa zajmujaca sie analiza i procesowaniem tekstu. Chcialbym przedstawic Panstwu droge, ktora niedawno przeszlismy. Ktoś mi niedawno zasugerował, dobra prezentacja, podobnie jak i dobry film, powinna zaczac sie od trzesienia ziemii, po czym napiecie ma rosnac.. A skoro tematem jest również Kalifornia, prosze Panstwa, oto największe katastrofy naturalne ostatniego stulecia:
  • #4: [trzesienie ziemi w Kaliforni]
  • #5: [trzesienie ziemi w San Francisco 1906]
  • #6: [czy chocby niedawne wstrzasy na wschodnim wybrzezu USA]
  • #7: Wszystko to jest jednak niczym wobec ofiar lawiny informacji, która czyha na nas ze wszystkich stron. Dziennie powstaje..... Naukowcy obliczyli, ze gbydy te wszystkie informacje upakowac do cieniutkiej rurki, to.. wszyscy znaja ten kawal.
  • #8: Czy ktoś z Państwa zgadnie czyje biuro przedstawione jest na zdjęciu? Hint: jest to jeden z najbardziej znanych ekologów.. co mozna poznac raczej wylacznie po żabie na scianie..
  • #10: Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać.
  • #11: Prosty test – czy ktoś z Panstwa dotarl do tego miejsca?
  • #13: Topicmarks potrafi podsumowac tekst, otagowac, znalezc relacje oraz zorganizowac stosy dokumentow.
  • #14: Przyklad: artykul o klockach Lego
  • #16: Fakty: Lego Tetrix jest w pelni kompatybilne z Lego Technic Zabawki Lego sa lubiane zarowno przez chlopcow jak i dziewczynki
  • #17: Fakty: Lego Tetrix jest w pelni kompatybilne z Lego Technic Zabawki Lego sa lubiane zarowno przez chlopcow jak i dziewczynki
  • #22: W maju 2010 nasz produkt został zwycięzcą Seedcampu, edycji w Kopenhadze. Dlugo zastanawialismy sie, w ktorym kierunku dalej sie rozwijac..
  • #23: I tak dochodzimy do pytania: Dlaczego Dolina Krzemowa? Teraz zadam panstwu pytanie. Kto z Państwa: Jest w jakikolwiek sposób powiązany ze startupem. Nawet jeśli szwagier robił .. lub szwagier widział, jak ktos robił .. też się liczy Jest wspołtwórcą startupu Jest inwestorem ? Zatem mamy odpowiedź.
  • #24: Kapitał jest płynny, mobilny.. Kapitalisci.. NIE. Dlaczego Dolina Krzemowa? Duzo mozna by mowic. W skrocie, pojechalismy tam, cytujac klasyka: „bo tam były pieniądze”
  • #25: Trzeba było wyjść z biura.
  • #27: Za sukcesami najbardziej znanych i podziwianych firm internetowych na świecie stoi grupa inwestorów, o których można powiedzieć, że zjedli ze sobą beczkę soli. Każdy z każdym już pracował lub inwestował, zarówno odnosząc sukcesy, jak i ponosząc porażki. Bez nich nie byłoby Facebooka, Twittera, YouTube, Zyngi czy LinkedIn,
  • #28: Krok 1: Wygraj pare konkursow. My wygralismy ich 5, z czego najbardziej prestizowy byl chyba Founder Showcase
  • #29: Krok 2: pozwol napisac o sobie.
  • #30: Mogliśmy działać nadal z Krakowa, .. Ale postanowilismy powalczyc „o zloty medal” i wyjsc poza granice, z produktem globalnym. Otwarcie się bardziej na swiat nie ukrywam bylo nieco kosztowne, ale..
  • #31: Uważamy, że było warto. Podam moze konkretne przyklady, co my zyskalismy.
  • #32: Uważamy, że było warto. Podam moze konkretne przyklady, co my zyskalismy.
  • #39: .. Czy jest na sali tegoroczny mistrz swiata w programowaniu?