Разработка кроссплатформенной библиотеки морфологического анализа текстов на русском языке для использования в промышленных системах (Екатерина Полицына, SECR-2018)
Материал из 0x1.tv
- Докладчик
- Екатерина Полицына
Потребность в автоматизации обработки больших объемов текстовых данных приводит к необходимости использования инструментов компьютерной лингвистики в прикладных промышленных системах разной направленности (системах документооборота, электронной коммерции и др.), что накладывает дополнительные требования к средствам автоматического анализа текста.
В отличие более мягких требований к исследовательским инструментам, для использования в промышленных системах необходимы библиотеки, отвечающие требованиям производительности, надежности, совместимости с современными современными языками программирования, сборки проектов и т.д.
В докладе предлагается новая кроссплатформенная библиотека морфологического анализа текстов на русском языке с открытым исходным кодом, которая может быть полезна разработчикам информационных систем и исследователям в области компьютерной лингвистики для получения начальных форм слова или генерации нужной формы по заданным морфологическим характеристикам.
Видео
Посмотрели доклад? Понравился? Напишите комментарий! Не согласны? Тем более напишите.
Презентация
Примечания и ссылки
Plays:55 Comments:1