Применение QGIS и GNU R в исследованиях распространения микроорганизмов, устойчивых к антимикробным препаратам (Иван Хахаев, OSEDUCONF-2021)
Материал из 0x1.tv
- Докладчик
- Иван Хахаев
Рассматривается применение свободных пакетов программ QGIS и GNU R для анализа и визуализации данных по распространению инфекций животных.
Показано, что такие пакеты могут успешно применяться в научных исследованиях и в учебном процессе в области ветеринарии и эпизоотологии.
Содержание
Видео
Презентация
Thesis
В настоящее время распространение штаммов микроорганизмов, устойчивых (резистентных) к антимикробным препаратам (АМП) носит глобальный характер, и надзор за резистентностью становится всё более актуальным как для медицины в целом, так и для ветеринарии в частности.
Была сформирована база данных, включающая результаты изучения чувствительности к АМП 207 штаммов Salmonella, выделенных на территории Ленинградской области с 2004 по 2016 гг. от больных, павших и вынужденно убитых продуктивных животных, из продукции животноводства и кормов. Для вариантов вирусов Salmonella был введён обобщённый критерий устойчивости (резистентности) к набору из 8 групп антимикробных препаратов (АМП): чувствительные (группа 1), устойчивые к 1-2 группам АМП (группа 2), полирезистентные (группа 3), в том числе экстремально резистентные (чувствительные не более чем к 2-м группам АМП, группа 4).
Проводился анализ количества случаев выявления штаммов сальмонелл с различной устойчивостью к АМП, отдельно для каждого года анализируемого периода по районам Ленинградской области.
Для статистической обработки данных был использован пакет GNU R с библиотеками ggplot2 , plotrix и riverplot. При использовании базовых возможностей QGIS и открытых данных по административно-территориальному делению Российской Федерации в формате ESRI shape из проекта OpenStreetMap (OSM) на карту Ленинградской области, разделённой на районы, были нанесены данные по случаям выявления штаммов сальмонелл с различной устойчивостью к АМП, отдельно для каждого года анализируемого периода. Для каждого гола формировался отдельный слой. В стилях слоя различными цветами обозначались категории штаммов: чувствительные, резистентные к 1-2 группам АМП, полирезистентные, экстремально резистентные. Отдельным цветом обозначались районы области, в которых сальмонеллы в текущем году не были обнаружены . Для каждого района указывался штамм с наибольшей резистентностью и источник выделения штамма на основе атрибутов записи в данных слоя QGIS. Для публикации полученных карт использовались возможности создания макетов карт. Примеры карт показаны на рис:.
С помощью библиотеки ggplot2 была построена корреляционная матрица для групп штаммов по резистентности к АМП, в качестве независимой переменной x используются годы наблюдений (рис. «Корреляционная матрица наблюдений по группам резистентности штаммов»). В соответствии со шкалой Чеддока корреляцию между общими количеством штаммов (g_all на рис. «Корреляционная матрица наблюдений по группам резистентности штаммов») и годом наблюдения можно оценить как среднюю, а корреляцию между общими количеством штаммов и количеством полирезистентных штаммов можно оценить как высокую. Также имеется корреляция между количеством полирезистентных штаммов и годом наблюдения, которую можно оценить как среднюю. Библиотека plotrix обеспечивает расширенные варианты визуализации результатов статистической обработки данных в R. На рис. «Штаммы Salmonella птицы и продукции птицеводства» и «Штаммы Salmonella продукции животноводства» показаны варианты диаграмм, полученных с помощью функции pyramid.plot().
Применение библиотеки riverplot позволило показать, как перетекает максимальный уровень резистентности основных вариантов штаммов от одного источника обнаружения (выделения) к другому по годам наблюдений (так называемая Sankey diagram, рис. «Распределение основных штаммов по источникам выделения»).
Таким образом, возможности свободных программ QGIS и GNU R в полной мере обеспечивают потребности визуализации данных в эпизоотологии и могут быть использованы в мониторинге ситуации, научных исследованиях и при подготовке специалистов.
Примечания и ссылки
- Свидетельство о государственной регистрации базы данных № 2020620404 Российская Федерация. База данных «Salmonella, выделенные от животных, из продукции животноводства и кормов» : № 2020620231 : заявл. 20.02.2020 : опубл. 03.03.2020 / А. В. Забровская, Л. А. Кафтырева, В. А. Кузьмин [и др.].
- А. В. Забровская, И. А. Хахаев, В. А. Кузьмин, Л. А. Кафтырева. Пространственная визуализация данных по выделению и чувствительности к антмикробным препаратам штаммов сальмонелл. Вопросы нормативно-правового регулирования в ветеринарии. — 2018. — № 1. — С. 43-45.
- R Core Team (2019). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. https://www.R-project.org/ H. Wickham.
- ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016. J L (2006).
- «Plotrix: a package in the red light district of R.» R-News, 6(4), 8-12.
- Елисеева, И. И. Эконометрика: учебник / И. И. Елисеева [и др.]; под ред. И. И. Елисеевой. 2-е изд., перераб. и доп. М.: Финансы и статистика, 2007. — 576 с.
- Sankey diagram. https://en.wikipedia.org/wiki/Sankey_diagram
Plays:0 Comments:0