Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSSDEVCONF-2022) — различия между версиями
Материал из 0x1.tv
StasFomin (обсуждение | вклад) |
StasFomin (обсуждение | вклад) |
||
(не показана одна промежуточная версия этого же участника) | |||
;{{SpeakerInfo}}: {{Speaker|Николай Шмырёв}} <blockquote> Библиотека для распознавания речи «Воск» поддерживает более 20 языков и диалектов. Работает без доступа к сети на серверах и мобильных устройствах, поддерживает платформы Raspberry Pi, Android, iOS. Как создатели библиотеки мы хотим описать текущее состояние и перспективы развития небольших проектов машинного обучения. </blockquote> {{VideoSection}} {{vimeoembed|989843521|800|450}} {{youtubelink|}} |cx-BeIkIjbQ}} {{SlidesSection}} [[File:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022).pdf|left|page=-|300px]] {{----}} == Thesis == * http://alphacephei.com Современную историю проектов машинного обучения можно разделить на следующие этапы: * академические проекты (2000—2010); * академические проекты в сотрудничестве с индустрией (2010—2017); * крупные индустриальные проекты (2018—2022). В настоящее время самые значительные проекты в машинном обучении создают крупные организации с мощными вычислительными возможностями: Facebook, Google, Microsoft, Baidu. Академическая разработка переживает кризис из-за ограниченного доступа к вычислениям, для исследований нужны мощные суперкомпьютеры с десятками GPU карт. С другой стороны, из-за доступности данных и технологий появляются десятки открытых проектов от небольших компаний и команд, решающих сходную задачу. В области распознавания речи компании создают десятки систем распознавания речи, диалоговых систем, систем компьютерного зрения, этим занимаются крупные компании: Google, Facebook, Nvidia, Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так далее. В таких условиях мы видим перспективу развития небольших проектов в следующих областях: * Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр. * Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения. * Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество. {{----}} [[File:{{#setmainimage:Перспективы развития открытых проектов в области машинного обучения (Николай Шмырёв, OSEDUCONF-2022)!.jpg}}|center|640px]] {{LinksSection}} <!-- <blockquote>[©]</blockquote> --> <references/> [[Категория:OSSDEVCONF-2022]] [[Категория:Draft]] |
Текущая версия на 15:54, 2 августа 2024
- Докладчик
- Николай Шмырёв
Библиотека для распознавания речи «Воск» поддерживает более 20 языков и диалектов. Работает без доступа к сети на серверах и мобильных устройствах, поддерживает платформы Raspberry Pi, Android, iOS.
Как создатели библиотеки мы хотим описать текущее состояние и перспективы развития небольших проектов машинного обучения.
Содержание
Видео
Презентация
Thesis
Современную историю проектов машинного обучения можно разделить на следующие этапы:
- академические проекты (2000—2010);
- академические проекты в сотрудничестве с индустрией (2010—2017);
- крупные индустриальные проекты (2018—2022).
В настоящее время самые значительные проекты в машинном обучении создают крупные организации с мощными вычислительными возможностями: Facebook, Google, Microsoft, Baidu. Академическая разработка переживает кризис из-за ограниченного доступа к вычислениям, для исследований нужны мощные суперкомпьютеры с десятками GPU карт.
С другой стороны, из-за доступности данных и технологий появляются десятки открытых проектов от небольших компаний и команд, решающих сходную задачу. В области распознавания речи компании создают десятки систем распознавания речи, диалоговых систем, систем компьютерного зрения, этим занимаются крупные компании: Google, Facebook, Nvidia, Microsoft, Mozilla, Baidu, Bytedance, Tencent, Clova, Сбербанк и так далее.
В таких условиях мы видим перспективу развития небольших проектов в следующих областях:
- Интеграция и упаковка существующих решений. Из-за разнообразия огромное значение приобретает предоставление единого интерфейса для использования существующих библиотек. Важна и интеграция c другими программными компонентами, например, телефонией, веб-конференциями, средами разработки игр.
- Специализация в предметных областях и использование дополнительной информации для более эффективного решения предметных задач. Большинство современных подходов направлены на создание наиболее общих решений, требующих серьёзных вычислительных затрат, что позволяет получать результаты в более специализированных подходах. Здесь же стоит рассмотреть специализированные аппаратно-программные решения.
- Поддержка распространённых мировых языков. Большинство российских и китайских проектов ориентированы на внутреннее применение, что существенно снижает их потенциал. Западные проекты концентрируются на малых языках и специальных применениях, также ограничивая свою применимость. Проекты, поддерживающие основные языки, получают уникальное преимущество.