Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSSDEVCONF-2022) — различия между версиями

Материал из 0x1.tv

 
(не показана одна промежуточная версия этого же участника)
;{{SpeakerInfo}}: {{Speaker|Николай Шмырёв}}
<blockquote>
Библиотека для распознавания речи «Воск» поддерживает более 20 языков и
диалектов. Работает без доступа к сети на серверах и мобильных
устройствах, поддерживает платформы Raspberry Pi, Android, iOS.

Как создатели библиотеки мы хотим описать текущее состояние и перспективы
развития небольших проектов машинного обучения.
</blockquote>

{{VideoSection}}
{{vimeoembed|989843521|800|450}}
{{youtubelink|}}
|cx-BeIkIjbQ}}
{{SlidesSection}}
[[File:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf|left|page=-|300px]]

{{----}}

== Thesis ==

* http://alphacephei.com

Современную историю проектов машинного обучения можно разделить на
следующие этапы:

* академические проекты (2000—2010);
* академические проекты в сотрудничестве с индустрией (2010—2017);
* крупные индустриальные проекты (2018—2022).

В настоящее время самые значительные проекты в машинном обучении создают
крупные организации с мощными вычислительными возможностями: Facebook,
Google, Microsoft, Baidu. Академическая разработка переживает кризис
из-за ограниченного доступа к вычислениям, для исследований нужны мощные
суперкомпьютеры с десятками GPU карт.

С другой стороны, из-за доступности данных и технологий появляются
десятки открытых проектов от небольших компаний и команд, решающих
сходную задачу. В области распознавания речи компании создают десятки
систем распознавания речи, диалоговых систем, систем компьютерного
зрения, этим занимаются крупные компании: Google, Facebook, Nvidia,
Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так
далее.

В таких условиях мы видим перспективу развития небольших проектов
в следующих областях:

* Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
* Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
* Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.



{{----}}
[[File:{{#setmainimage:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022)!.jpg}}|center|640px]]
{{LinksSection}}
<!-- <blockquote>[©]</blockquote> -->

<references/>

[[Категория:OSSDEVCONF-2022]]
[[Категория:Draft]]

Текущая версия на 15:54, 2 августа 2024

Докладчик
Николай Шмырёв

Библиотека для распознавания речи «Воск» поддерживает более 20 языков и диалектов. Работает без доступа к сети на серверах и мобильных устройствах, поддерживает платформы Raspberry Pi, Android, iOS.

Как создатели библиотеки мы хотим описать текущее состояние и перспективы развития небольших проектов машинного обучения.

Видео

on youtube

Презентация

Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf

Thesis

Современную историю проектов машинного обучения можно разделить на следующие этапы:

  • академические проекты (2000—2010);
  • академические проекты в сотрудничестве с индустрией (2010—2017);
  • крупные индустриальные проекты (2018—2022).

В настоящее время самые значительные проекты в машинном обучении создают крупные организации с мощными вычислительными возможностями: Facebook, Google, Microsoft, Baidu. Академическая разработка переживает кризис из-за ограниченного доступа к вычислениям, для исследований нужны мощные суперкомпьютеры с десятками GPU карт.

С другой стороны, из-за доступности данных и технологий появляются десятки открытых проектов от небольших компаний и команд, решающих сходную задачу. В области распознавания речи компании создают десятки систем распознавания речи, диалоговых систем, систем компьютерного зрения, этим занимаются крупные компании: Google, Facebook, Nvidia, Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так далее.

В таких условиях мы видим перспективу развития небольших проектов в следующих областях:

  • Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
  • Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
  • Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.


Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022)!.jpg

Примечания и ссылки