Применение QGIS и GNU R в исследованиях распространения микроорганизмов, устойчивых к антимикробным препаратам (Иван Хахаев, OSEDUCONF-2021)

Материал из 0x1.tv

(перенаправлено с «20210616F»)
Докладчик
Иван Хахаев.jpg
Иван Хахаев

Рассматривается применение свободных пакетов программ QGIS и GNU R для анализа и визуализации данных по распространению инфекций животных.

Показано, что такие пакеты могут успешно применяться в научных исследованиях и в учебном процессе в области ветеринарии и эпизоотологии.

Видео

Презентация

Thesis

В настоящее время распространение штаммов микроорганизмов, устойчивых (резистентных) к антимикробным препаратам (АМП) носит глобальный характер, и надзор за резистентностью становится всё более актуальным как для медицины в целом, так и для ветеринарии в частности.

Была сформирована база данных, включающая результаты изучения чувствительности к АМП 207 штаммов Salmonella, выделенных на территории Ленинградской области с 2004 по 2016 гг. от больных, павших и вынужденно убитых продуктивных животных, из продукции животноводства и кормов. Для вариантов вирусов Salmonella был введён обобщённый критерий устойчивости (резистентности) к набору из 8 групп антимикробных препаратов (АМП): чувствительные (группа 1), устойчивые к 1-2 группам АМП (группа 2), полирезистентные (группа 3), в том числе экстремально резистентные (чувствительные не более чем к 2-м группам АМП, группа 4).

Проводился анализ количества случаев выявления штаммов сальмонелл с различной устойчивостью к АМП, отдельно для каждого года анализируемого периода по районам Ленинградской области.

Данные наблюдений за 2009 год
Данные наблюдений за 2009 год
Данные наблюдений за 2015 год
Данные наблюдений за 2015 год

Для статистической обработки данных был использован пакет GNU R с библиотеками ggplot2 , plotrix и riverplot. При использовании базовых возможностей QGIS и открытых данных по административно-территориальному делению Российской Федерации в формате ESRI shape из проекта OpenStreetMap (OSM) на карту Ленинградской области, разделённой на районы, были нанесены данные по случаям выявления штаммов сальмонелл с различной устойчивостью к АМП, отдельно для каждого года анализируемого периода. Для каждого гола формировался отдельный слой. В стилях слоя различными цветами обозначались категории штаммов: чувствительные, резистентные к 1-2 группам АМП, полирезистентные, экстремально резистентные. Отдельным цветом обозначались районы области, в которых сальмонеллы в текущем году не были обнаружены . Для каждого района указывался штамм с наибольшей резистентностью и источник выделения штамма на основе атрибутов записи в данных слоя QGIS. Для публикации полученных карт использовались возможности создания макетов карт. Примеры карт показаны на рис:.

Корреляционная матрица наблюдений по группам резистентности штаммов
Корреляционная матрица наблюдений по группам резистентности штаммов
Штаммы Salmonella птицы и продукции птицеводства
Штаммы Salmonella птицы и продукции птицеводства

С помощью библиотеки ggplot2 была построена корреляционная матрица для групп штаммов по резистентности к АМП, в качестве независимой переменной x используются годы наблюдений (рис. «Корреляционная матрица наблюдений по группам резистентности штаммов»). В соответствии со шкалой Чеддока корреляцию между общими количеством штаммов (g_all на рис. «Корреляционная матрица наблюдений по группам резистентности штаммов») и годом наблюдения можно оценить как среднюю, а корреляцию между общими количеством штаммов и количеством полирезистентных штаммов можно оценить как высокую. Также имеется корреляция между количеством полирезистентных штаммов и годом наблюдения, которую можно оценить как среднюю. Библиотека plotrix обеспечивает расширенные варианты визуализации результатов статистической обработки данных в R. На рис. «Штаммы Salmonella птицы и продукции птицеводства» и «Штаммы Salmonella продукции животноводства» показаны варианты диаграмм, полученных с помощью функции pyramid.plot().

Штаммы Salmonella продукции животноводства
Штаммы Salmonella продукции животноводства

Применение библиотеки riverplot позволило показать, как перетекает максимальный уровень резистентности основных вариантов штаммов от одного источника обнаружения (выделения) к другому по годам наблюдений (так называемая Sankey diagram, рис. «Распределение основных штаммов по источникам выделения»).

Распределение основных штаммов по источникам выделения
Распределение основных штаммов по источникам выделения

Таким образом, возможности свободных программ QGIS и GNU R в полной мере обеспечивают потребности визуализации данных в эпизоотологии и могут быть использованы в мониторинге ситуации, научных исследованиях и при подготовке специалистов.

Примечания и ссылки


  • Свидетельство о государственной регистрации базы данных № 2020620404 Российская Федерация. База данных «Salmonella, выделенные от животных, из продукции животноводства и кормов» : № 2020620231 : заявл. 20.02.2020 : опубл. 03.03.2020 / А. В. Забровская, Л. А. Кафтырева, В. А. Кузьмин [и др.].
  • А. В. Забровская, И. А. Хахаев, В. А. Кузьмин, Л. А. Кафтырева. Пространственная визуализация данных по выделению и чувствительности к антмикробным препаратам штаммов сальмонелл. Вопросы нормативно-правового регулирования в ветеринарии. — 2018. — № 1. — С. 43-45.
  • R Core Team (2019). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org/ H. Wickham.
  • ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016. J L (2006).
  • «Plotrix: a package in the red light district of R.» R-News, 6(4), 8-12.
  • Елисеева, И. И. Эконометрика: учебник / И. И. Елисеева [и др.]; под ред. И. И. Елисеевой. 2-е изд., перераб. и доп. М.: Финансы и статистика, 2007. — 576 с.
  • Sankey diagram. https://en.wikipedia.org/wiki/Sankey_diagram

Plays:0   Comments:0