Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSSDEVCONF-2022)

Материал из 0x1.tv

Докладчик
Николай Шмырёв

Библиотека для распознавания речи «Воск» поддерживает более 20 языков и диалектов. Работает без доступа к сети на серверах и мобильных устройствах, поддерживает платформы Raspberry Pi, Android, iOS.

Как создатели библиотеки мы хотим описать текущее состояние и перспективы развития небольших проектов машинного обучения.

Видео

Презентация

Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf

Thesis

Современную историю проектов машинного обучения можно разделить на следующие этапы:

  • академические проекты (2000—2010);
  • академические проекты в сотрудничестве с индустрией (2010—2017);
  • крупные индустриальные проекты (2018—2022).

В настоящее время самые значительные проекты в машинном обучении создают крупные организации с мощными вычислительными возможностями: Facebook, Google, Microsoft, Baidu. Академическая разработка переживает кризис из-за ограниченного доступа к вычислениям, для исследований нужны мощные суперкомпьютеры с десятками GPU карт.

С другой стороны, из-за доступности данных и технологий появляются десятки открытых проектов от небольших компаний и команд, решающих сходную задачу. В области распознавания речи компании создают десятки систем распознавания речи, диалоговых систем, систем компьютерного зрения, этим занимаются крупные компании: Google, Facebook, Nvidia, Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так далее.

В таких условиях мы видим перспективу развития небольших проектов в следующих областях:

  • Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
  • Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
  • Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.


Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022)!.jpg

Примечания и ссылки