Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSSDEVCONF-2022) — различия между версиями
Материал из 0x1.tv
StasFomin (обсуждение | вклад) |
StasFomin (обсуждение | вклад) |
||
| (не показаны 2 промежуточные версии этого же участника) | |||
;{{SpeakerInfo}}: {{Speaker|Николай Шмырёв}}
<blockquote>
Библиотека для распознавания речи «Воск» поддерживает более 20 языков и
диалектов. Работает без доступа к сети на серверах и мобильных
устройствах, поддерживает платформы Raspberry Pi, Android, iOS.
Как создатели библиотеки мы хотим описать текущее состояние и перспективы
развития небольших проектов машинного обучения.
</blockquote>
{{VideoSection}}
{{vimeoembed|989843521|800|450}}
{{youtubelink|}}
|cx-BeIkIjbQ}}
{{SlidesSection}}
[[File:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf|left|page=-|300px]]
{{----}}
== Thesis ==
* http://alphacephei.com
Современную историю проектов машинного обучения можно разделить на
следующие этапы:
* академические проекты (2000—2010);
* академические проекты в сотрудничестве с индустрией (2010—2017);
* крупные индустриальные проекты (2018—2022).
В настоящее время самые значительные проекты в машинном обучении создают
крупные организации с мощными вычислительными возможностями: Facebook,
Google, Microsoft, Baidu. Академическая разработка переживает кризис
из-за ограниченного доступа к вычислениям, для исследований нужны мощные
суперкомпьютеры с десятками GPU карт.
С другой стороны, из-за доступности данных и технологий появляются
десятки открытых проектов от небольших компаний и команд, решающих
сходную задачу. В области распознавания речи компании создают десятки
систем распознавания речи, диалоговых систем, систем компьютерного
зрения, этим занимаются крупные компании: Google, Facebook, Nvidia,
Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так
далее.
В таких условиях мы видим перспективу развития небольших проектов
в следующих областях:
* Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
* Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
* Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.
{{----}}
[[File:{{#setmainimage:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022)!.jpg}}|center|640px]]
{{LinksSection}}
<!-- <blockquote>[©]</blockquote> -->
<references/>
[[Категория:OSSDEVCONF-2022]]
[[Категория:Draft]] | |||
Текущая версия на 15:54, 2 августа 2024
- Докладчик
- Николай Шмырёв
Библиотека для распознавания речи «Воск» поддерживает более 20 языков и диалектов. Работает без доступа к сети на серверах и мобильных устройствах, поддерживает платформы Raspberry Pi, Android, iOS.
Как создатели библиотеки мы хотим описать текущее состояние и перспективы развития небольших проектов машинного обучения.
Содержание
Видео
Презентация
Thesis
Современную историю проектов машинного обучения можно разделить на следующие этапы:
- академические проекты (2000—2010);
- академические проекты в сотрудничестве с индустрией (2010—2017);
- крупные индустриальные проекты (2018—2022).
В настоящее время самые значительные проекты в машинном обучении создают крупные организации с мощными вычислительными возможностями: Facebook, Google, Microsoft, Baidu. Академическая разработка переживает кризис из-за ограниченного доступа к вычислениям, для исследований нужны мощные суперкомпьютеры с десятками GPU карт.
С другой стороны, из-за доступности данных и технологий появляются десятки открытых проектов от небольших компаний и команд, решающих сходную задачу. В области распознавания речи компании создают десятки систем распознавания речи, диалоговых систем, систем компьютерного зрения, этим занимаются крупные компании: Google, Facebook, Nvidia, Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так далее.
В таких условиях мы видим перспективу развития небольших проектов в следующих областях:
- Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
- Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
- Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.