6. Dziennie powstaje: 60,000 nowych website’ów 1,5 milionów artykułów na blogach 10 milionów postów na tumblr 140 miliony tweetów 1,5 miliarda różnego rodzaju wpisów na facebooku
9. Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie, szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
10. Problem Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać. Naszym zadaniem jest odpowiedź na pytanie, co robić po znalezieniu ciekawych dokumentów, kiedy nadal jest zbyt dużo do przeczytania. W zbyt gęsto upakowanym tekście można zgubić sens. Badania wykazały, że niektórzy z Państwa całkowicie pominą to ostatnie, długie zdanie , szczególnie, jeśli niepoprawne formatowanie sprawi, że będzie wyglądać nieatrakcyjnie, i to pomimo, że jest dłuższe niż poprzednia część tekstu. Mamy zbyt dużo do przeczytania ..
12. Topicmarks can semantically summarize , tag , find relations and organize large collections of document s automagically. It decomposes a document into semantic relations to create multiple, alternative personalized views of content. It allows extracted knowledge to be re-used, namely in the construction of concept maps , documents , presentations and so on
16. Product Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children Facts Lego Tetrix is fully compatible with Lego Technic Mindstorms is part of Lego’s broader educational efforts Lego WeDo set is aimed at elementry school age children
18. Engine Client e.g. portal, browser extension, rest API sentence splitter tokenizer (sentence into words) sentence parser fact generation (building semantic relations f r om parsed sentences) terms extraction semantic document representation Distributed on (1..n) servers Knowledge base storage semantic data model indexing text search engine Cluster of DB servers RDF model Front-end servers wrapper induction PDF Wrapper HTML Wrapper Custom Wrapper e.g. WIKIPEDIA Upload DOC Wrapper Text processing pipeline there are over 30 processors implemented in the grammar analyzer pipeline, switched on/off when needed cache
19. Architektura Technology difficult to duplicate ~20,000 engineering hours investe d Solves hard natural language processing problems Advanced string and graph-theoretic algorithms Requires large system architecture design Harnesses web intelligence via Web2.0/3.0 APIs Makes advanced human-machine collaboration A ccessible to the casual user Published USPO patent Title: "Method and System for Generating a Document Representation" Filed March 5, 2010; priority March 6, 2009 Total number of claims: 42 The many engineering hours invested, proprietary algorithms and a patent make duplication unrealistic
20. Zastosowania Analiza dokumentów WikiLeaks Procesowanie kanałów RSS Analiza Press Releasów giełdowych Feedback użytkowników: student dziękował za "5-tkę", którą otrzymał za wygenerowane streszczenie blogger używał Topicmarks do procesowania swoich artykułów pod kątem zrozumiałości – "jeśli maszyna to zrozumie, to może większość ludzi też" ktoś generował meta tagi pod SEO ktoś przeprocesował list miłosny od swojej dziewczyny.. i dziękował, że tylko dzięki temu go zrozumiał (?!)
25. Silicon Valley inwestorzy: nie tylko „Sand Hill Road” co-working spaces: Pier38, SOMACentral, PariSoma media w co drugim (ponieważ same też często są startupem) spotkania branżowe prawnicy pracujący „za darmo” (do momentu zdobycia finansowania)
26. Heaven & Hell Wyjątkowy pomysł? Niekoniecznie. Odpowiedni moment wejścia na rynek? Bardziej. Znajomości? Przede wszystkim.
27. Winning Efforts Grand Prize Winner by 66% audience vote and 88% jury points “ Potentially huge—Jeff Clavier” “ Solving a very interesting problem” “ Nerdy winner of the night” Thought through very well” “ A ripe acquisition target”
28. :) “ Made for […] denser documents” “ Find a new friend in Topicmarks”
30. Bilans 6 inwestorów oraz 5 advisorów, wśród nich: Aaron Patzer (Mint .com [$170m] => Intui t ) Adeo Ressi (Founder Institute) Peter Berger II (Silicon Valley Semantic Technology Forum) Jeannie Kahwajy (Adviser to Hillary Clinton) koncepcja nowego produktu bezcenne kontakty współpraca przy procesowaniu repozytoriów Cloud (Evernote, Google Docs, Dropbox, BOX.net)
31. Bilans Biuro Topicmarks w San Francisco a „za ścianą” mamy: Twitter Mashable Wordpress Zite Socialize oraz Stadion Baseballa GO GIANTS!!
35. Bilans Topicmarks obecnie: używany w 160+ krajach procesuje ok. 2 miliony dokumentów tygodniowo 35.000 użytkowników.. ..którzy mówią 62 językami promowany na Evernote 40.000.000 rekordów w indeksie operuje na rynku zarzadzania informacjami w cloudzie, szacowanym na $1mld ($5.5b w 2015)
37. Bilans Organizing information on the cloud is growing 74% per year into a $5.5b market Cloud storage is exploding into a $33b market in 2015 Sources: OECD, Accenture, IDC IT Cloud Services Forecast, team analysis. Spending on organizing and retrieving research is worth $139b in 2015 CAGR 11% CAGR 58% Digitization of paper sources Multiple devices Remote collaboration Better backups Mainstreaming of research Information explosion Independent contracting Knowledge-based competitiveness CAGR 74% People organizing information through cloud storage will be a $5.5b market in 2015
#3:Jestesmy firma z Krakowa zajmujaca sie analiza i procesowaniem tekstu. Chcialbym przedstawic Panstwu droge, ktora niedawno przeszlismy. Ktoś mi niedawno zasugerował, dobra prezentacja, podobnie jak i dobry film, powinna zaczac sie od trzesienia ziemii, po czym napiecie ma rosnac.. A skoro tematem jest również Kalifornia, prosze Panstwa, oto największe katastrofy naturalne ostatniego stulecia:
#6:[czy chocby niedawne wstrzasy na wschodnim wybrzezu USA]
#7:Wszystko to jest jednak niczym wobec ofiar lawiny informacji, która czyha na nas ze wszystkich stron. Dziennie powstaje..... Naukowcy obliczyli, ze gbydy te wszystkie informacje upakowac do cieniutkiej rurki, to.. wszyscy znaja ten kawal.
#8:Czy ktoś z Państwa zgadnie czyje biuro przedstawione jest na zdjęciu? Hint: jest to jeden z najbardziej znanych ekologów.. co mozna poznac raczej wylacznie po żabie na scianie..
#10:Ludzie mają znacznie więcej dokumentów, niż są w stanie przeczytać lub efektywnie nimi zarządzać.
#11:Prosty test – czy ktoś z Panstwa dotarl do tego miejsca?
#16:Fakty: Lego Tetrix jest w pelni kompatybilne z Lego Technic Zabawki Lego sa lubiane zarowno przez chlopcow jak i dziewczynki
#17:Fakty: Lego Tetrix jest w pelni kompatybilne z Lego Technic Zabawki Lego sa lubiane zarowno przez chlopcow jak i dziewczynki
#22:W maju 2010 nasz produkt został zwycięzcą Seedcampu, edycji w Kopenhadze. Dlugo zastanawialismy sie, w ktorym kierunku dalej sie rozwijac..
#23:I tak dochodzimy do pytania: Dlaczego Dolina Krzemowa? Teraz zadam panstwu pytanie. Kto z Państwa: Jest w jakikolwiek sposób powiązany ze startupem. Nawet jeśli szwagier robił .. lub szwagier widział, jak ktos robił .. też się liczy Jest wspołtwórcą startupu Jest inwestorem ? Zatem mamy odpowiedź.
#24:Kapitał jest płynny, mobilny.. Kapitalisci.. NIE. Dlaczego Dolina Krzemowa? Duzo mozna by mowic. W skrocie, pojechalismy tam, cytujac klasyka: „bo tam były pieniądze”
#27:Za sukcesami najbardziej znanych i podziwianych firm internetowych na świecie stoi grupa inwestorów, o których można powiedzieć, że zjedli ze sobą beczkę soli. Każdy z każdym już pracował lub inwestował, zarówno odnosząc sukcesy, jak i ponosząc porażki. Bez nich nie byłoby Facebooka, Twittera, YouTube, Zyngi czy LinkedIn,
#28:Krok 1: Wygraj pare konkursow. My wygralismy ich 5, z czego najbardziej prestizowy byl chyba Founder Showcase
#30:Mogliśmy działać nadal z Krakowa, .. Ale postanowilismy powalczyc „o zloty medal” i wyjsc poza granice, z produktem globalnym. Otwarcie się bardziej na swiat nie ukrywam bylo nieco kosztowne, ale..
#31:Uważamy, że było warto. Podam moze konkretne przyklady, co my zyskalismy.
#32:Uważamy, że było warto. Podam moze konkretne przyklady, co my zyskalismy.
#39:.. Czy jest na sali tegoroczny mistrz swiata w programowaniu?