Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021)

Материал из 0x1.tv

Докладчик
Алексей Андреев.jpg
Алексей Андреев

ОС Аврора является POSIX-совместимым дистрибутивом Linux, спроектированным для решения корпоративных и бизнес-задач. Основная область применений устройств на ОС Аврора — это корпорации в России. Например, такие устройства используются полевыми сотрудниками для получения задач и отправки отчётов. Формирование подобных отчётов происходит с помощью заполнения сложных форм с большим количеством полей ввода и опций для выбора. Распознавание речи позволяет существенно ускорить этот процесс.

Есть и другие задачи, которые требуется решать разработчикам корпоративного прикладного ПО для мобильных устройств. На их основе можно сформулировать пользовательские требования к решениям: поддержка нескольких языков (по крайней мере, русский и английский языки), распознавание речи на устройстве (без необходимости использования сторонних серверов), скорость распознавания, не уступающая ручному вводу. Для реализации подобных функций в прикладном ПО удобно использовать готовые решения для распознавания речи.

Для POSIX-совместимых операционных систем доступны несколько СПО-библиотек, предоставляющих функции распознавания речи. Учитывая необходимость их использования, в том числе, в коммерческих проектах для ОС Аврора, сформулирован ряд дополнительных требований, связанных с инструментами сборки, особенностями хранения модели данных, активностью проекта и лицензией, допускающей достаточно свободное использование.

Удобным решением для задачи, удовлетворяющим критериям, является движок Kaldi. Однако, он зависит от математических библиотек, написанных на языке Fortran. А актуальные версии ОС Аврора на данный момент не поддерживает этот язык программирования в силу оптимизаций инструментов сборки. Требования к Fortran появляются, например, при использовании математических библиотек, таких как LAPACK или OpenBLAS. Другие популярные проекты, которые от них зависят: PyTorch и TensorFlow.

Поэтому потребовалось разработать способ, который позволяет использовать зависимости Kaldi, реализованные на Fortran, в окружении, которое его не поддерживает. В докладе предлагается подход, позволяющий собрать программное обеспечение сторонним набором инструментов, и описываются ограничения по интеграции в окружение ОС Аврора.

Предложенный способ позволяет в сторонних решениях реализовывать распознавание речи на мобильных устройствах с помощью библиотеки Kaldi. Полученное решение удовлетворяет как пользовательским, так и техническим требованиям. Кроме того, предложенный подход может быть использован и в других случаях, когда Fortran требуется для сборки или запуска ПО, но окружение операционной системы или инструменты сборки не предоставляют возможности его использовать.

Видео

Презентация

Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021).pdf
Распознавание речи на мобильных устройствах, управляемых Linux, на примере ОС Аврора (Алексей Андреев, OSSDEVCONF-2021)!.jpg

Примечания и ссылки

Plays:1   Comments:0

[ Хронологический вид ]Комментарии

(нет элементов)

Войдите, чтобы комментировать.