Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021)

Материал из 0x1.tv

Версия от 08:01, 23 ноября 2021; StasFomin (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Докладчик
Алексей Андреев.jpg
Алексей Андреев

ОС Аврора является POSIX-совместимым дистрибутивом Linux, спроектированным для решения корпоративных и бизнес-задач. Основная область применений устройств на ОС Аврора — это корпорации в России. Например, такие устройства используются полевыми сотрудниками для получения задач и отправки отчётов. Формирование подобных отчётов происходит с помощью заполнения сложных форм с большим количеством полей ввода и опций для выбора. Распознавание речи позволяет существенно ускорить этот процесс.

Есть и другие задачи, которые требуется решать разработчикам корпоративного прикладного ПО для мобильных устройств. На их основе можно сформулировать пользовательские требования к решениям: поддержка нескольких языков (по крайней мере, русский и английский языки), распознавание речи на устройстве (без необходимости использования сторонних серверов), скорость распознавания, не уступающая ручному вводу. Для реализации подобных функций в прикладном ПО удобно использовать готовые решения для распознавания речи.

Для POSIX-совместимых операционных систем доступны несколько СПО-библиотек, предоставляющих функции распознавания речи. Учитывая необходимость их использования, в том числе, в коммерческих проектах для ОС Аврора, сформулирован ряд дополнительных требований, связанных с инструментами сборки, особенностями хранения модели данных, активностью проекта и лицензией, допускающей достаточно свободное использование.

Удобным решением для задачи, удовлетворяющим критериям, является движок Kaldi. Однако, он зависит от математических библиотек, написанных на языке Fortran. А актуальные версии ОС Аврора на данный момент не поддерживает этот язык программирования в силу оптимизаций инструментов сборки. Требования к Fortran появляются, например, при использовании математических библиотек, таких как LAPACK или OpenBLAS. Другие популярные проекты, которые от них зависят: PyTorch и TensorFlow.

Поэтому потребовалось разработать способ, который позволяет использовать зависимости Kaldi, реализованные на Fortran, в окружении, которое его не поддерживает. В докладе предлагается подход, позволяющий собрать программное обеспечение сторонним набором инструментов, и описываются ограничения по интеграции в окружение ОС Аврора.

Предложенный способ позволяет в сторонних решениях реализовывать распознавание речи на мобильных устройствах с помощью библиотеки Kaldi. Полученное решение удовлетворяет как пользовательским, так и техническим требованиям. Кроме того, предложенный подход может быть использован и в других случаях, когда Fortran требуется для сборки или запуска ПО, но окружение операционной системы или инструменты сборки не предоставляют возможности его использовать.

Видео[править вики-текст]

on youtube

Презентация[править вики-текст]

Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf
Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021)!.jpg

Примечания и ссылки[править вики-текст]

Plays:1   Comments:0