SlideShare a Scribd company logo
Проект общедоступного многопользовательского корпуса Проблемы и перспективы Дмитрий Грановский
Зачем ещё один? У существующих корпусов: Авторские права На текст На разметку Административные ограничения Недоступна сама разметка
Что будет уметь? Просмотр  и редактирование  разметки (многопользовательский)  Возможность скачивания в разных форматах Встроенный поиск по популярным запросам Обработка «тяжёлых» запросов
Кто будет делать? Техническая часть – группа разработчиков Наполнение –  пользователи
Откуда брать тексты? Тексты с истекшим авторским правом Тексты, на которые авторское право не распространяется Тексты под свободной лицензией ( e.g.  Википедия) Остальное – по договорённости с правообладателем
Задачи инструментария Редактирование Хранение Поиск
Как можно использовать? Статистические исследования Машинное обучение (как обучающий корпус) Тестовый корпус для других ресурсов
Проблемы Почему эта модель доступа должна работать? Как обеспечить совместную работу многих людей?  ( многопользовательский ) Как обеспечить целостность данных?
Проблемы Откуда взять столько квалифицированных редакторов? Как бороться с ошибками редактирования? Как не делать разметку с нуля? Как унифицировать разметку?
Ваши вопросы
СПАСИБО! http://mathlingvo.ru Дмитрий Грановский [email_address]

More Related Content

PPTX
facetuber
yankovich1986
 
ODP
shvabrashvabr
Denis Lapenko
 
PPT
инструменты построения информационных систем на основе Wiki технологии и онто...
Yury Katkov
 
PPT
Rassirenie vozmownosti blodwer_vnesnimi_servisami
Dmitry Gorlin
 
PPTX
документирование долгоживущих веб проектов. г. белогорцев. зал 3
rit2011
 
PDF
База знаний - пользуемся чужими наработками или изобретаем велосипед
SQALab
 
PPTX
Cредства визуального представления информации в сети Интернет
Pasha Ladisov
 
PPTX
Retrospectiva
Florin Stoica
 
facetuber
yankovich1986
 
shvabrashvabr
Denis Lapenko
 
инструменты построения информационных систем на основе Wiki технологии и онто...
Yury Katkov
 
Rassirenie vozmownosti blodwer_vnesnimi_servisami
Dmitry Gorlin
 
документирование долгоживущих веб проектов. г. белогорцев. зал 3
rit2011
 
База знаний - пользуемся чужими наработками или изобретаем велосипед
SQALab
 
Cредства визуального представления информации в сети Интернет
Pasha Ladisov
 
Retrospectiva
Florin Stoica
 

Viewers also liked (17)

PDF
Maker Art: How to Create a Wonderbox
Green Change
 
PPT
Presentation Ketnet Kick Gaming Community Creativity
VanLier
 
PPT
Mobilmob
guesta05243
 
PPT
Alcohol and Drugs in the Workplace
Andrew Schwartz
 
PPT
Harry Pictures
경용 박
 
PDF
M1. sem web & ontology introd
Michele Missikoff
 
PPT
Key to success
Neelanjan Bhattacharyya
 
PDF
Leading Without Being In Charge
Selena Deckelmann
 
PPT
Blog Google Attention 200512
osamuh
 
PPT
Communicative verbs and constructions as markers
Lidia Pivovarova
 
PDF
2008 MHSAA Division 4 Girls Tennis Finals May 30-31
Cindy Kendall
 
PPT
Oppekavaarenduse mudel
kiq
 
PPT
Knowledge management: Inspire Part 3
MattthewParsons
 
PPT
Open House
ghstryder
 
PPT
Departamento De CirugíA Y TraumatologíA Bucal Y Maxilofacial
susanaencina
 
PPT
Salik
eka
 
Maker Art: How to Create a Wonderbox
Green Change
 
Presentation Ketnet Kick Gaming Community Creativity
VanLier
 
Mobilmob
guesta05243
 
Alcohol and Drugs in the Workplace
Andrew Schwartz
 
Harry Pictures
경용 박
 
M1. sem web & ontology introd
Michele Missikoff
 
Key to success
Neelanjan Bhattacharyya
 
Leading Without Being In Charge
Selena Deckelmann
 
Blog Google Attention 200512
osamuh
 
Communicative verbs and constructions as markers
Lidia Pivovarova
 
2008 MHSAA Division 4 Girls Tennis Finals May 30-31
Cindy Kendall
 
Oppekavaarenduse mudel
kiq
 
Knowledge management: Inspire Part 3
MattthewParsons
 
Open House
ghstryder
 
Departamento De CirugíA Y TraumatologíA Bucal Y Maxilofacial
susanaencina
 
Salik
eka
 
Ad

More from Lidia Pivovarova (20)

PDF
Classification and clustering in media monitoring: from knowledge engineering...
Lidia Pivovarova
 
PDF
Convolutional neural networks for text classification
Lidia Pivovarova
 
PDF
Grouping business news stories based on salience of named entities
Lidia Pivovarova
 
PDF
Интеллектуальный анализ текста
Lidia Pivovarova
 
PPTX
AINL 2016: Yagunova
Lidia Pivovarova
 
PDF
AINL 2016: Kuznetsova
Lidia Pivovarova
 
PPT
AINL 2016: Bodrunova, Blekanov, Maksimov
Lidia Pivovarova
 
PDF
AINL 2016: Boldyreva
Lidia Pivovarova
 
PPTX
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
Lidia Pivovarova
 
PDF
AINL 2016: Kozerenko
Lidia Pivovarova
 
PDF
AINL 2016: Shavrina, Selegey
Lidia Pivovarova
 
PDF
AINL 2016: Khudobakhshov
Lidia Pivovarova
 
PDF
AINL 2016: Proncheva
Lidia Pivovarova
 
PPTX
AINL 2016:
Lidia Pivovarova
 
PPTX
AINL 2016: Bugaychenko
Lidia Pivovarova
 
PDF
AINL 2016: Grigorieva
Lidia Pivovarova
 
PDF
AINL 2016: Muravyov
Lidia Pivovarova
 
PDF
AINL 2016: Just AI
Lidia Pivovarova
 
PPTX
AINL 2016: Moskvichev
Lidia Pivovarova
 
PDF
AINL 2016: Goncharov
Lidia Pivovarova
 
Classification and clustering in media monitoring: from knowledge engineering...
Lidia Pivovarova
 
Convolutional neural networks for text classification
Lidia Pivovarova
 
Grouping business news stories based on salience of named entities
Lidia Pivovarova
 
Интеллектуальный анализ текста
Lidia Pivovarova
 
AINL 2016: Yagunova
Lidia Pivovarova
 
AINL 2016: Kuznetsova
Lidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
Lidia Pivovarova
 
AINL 2016: Boldyreva
Lidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
Lidia Pivovarova
 
AINL 2016: Kozerenko
Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
Lidia Pivovarova
 
AINL 2016: Khudobakhshov
Lidia Pivovarova
 
AINL 2016: Proncheva
Lidia Pivovarova
 
AINL 2016:
Lidia Pivovarova
 
AINL 2016: Bugaychenko
Lidia Pivovarova
 
AINL 2016: Grigorieva
Lidia Pivovarova
 
AINL 2016: Muravyov
Lidia Pivovarova
 
AINL 2016: Just AI
Lidia Pivovarova
 
AINL 2016: Moskvichev
Lidia Pivovarova
 
AINL 2016: Goncharov
Lidia Pivovarova
 
Ad

Free Corpus I M S