Бенчмаркинг коллекций научных журналов (Федор Краснов, SECR-2019) — различия между версиями
Материал из 0x1.tv
StasFomin (обсуждение | вклад) |
StasFomin (обсуждение | вклад) |
||
<!-- <blockquote>[©]</blockquote> --> {{vklink|1484}} {{fblink|2491163234470016}} <references/> <!-- topub --> [[Категория:SECR-2019]] [[Категория:Natural Language Processing]] [[Категория:Machine Learning]] {{stats|disqus_comments=0|refresh_time=2020-017-28T10:56:3505T23:25:55.459547873655|vimeo_plays=57|youtube_comments=0|youtube_plays=0}}13}} |
Версия 20:25, 5 июля 2020
- Докладчик
- Федор Краснов
Доклад о применении интеллектуального анализа текста для решения задач издательского бизнеса. Поиск постановки задачи, методов анализа, построения моделей, оптимизация свободных параметров и подготовка для создания продукта.
Польза доклада в том, что постановку задачи всегда нужно искать самому, т.к. ждать, что кто-то поставит задачу, подготовит данные – не продуктивно. Фундаментальное понимание работы моделей необходимо, но важнее уметь применять модели к нестандартным ситуациям.
Сейчас можно получить работу, умея лишь запустить стандартный метод из открытой библиотеки. Но через 5 лет уже будет не так. Нужно будет понимать формулы за этим методом, уметь придумать и написать нестандартную нормализацию или нестандартную cost function для этого случая и многое другое.
Авторами предложена новая методика для парного сравнения коллекций научных статей с помощью тематической модели.
Разработанная методика получила название Сравнительного Тематического Анализа (СТА). СТА позволяет получить не только количественную оценку похожести коллекций, но и структурные различия сравниваемых коллекций, как в количественном виде, так и с помощью средств визуализации, разработанных авторами.
В данном исследовании проведено сравнение существующих подходов к тематическому моделированию применительно к рассматриваемой задаче сравнения коллекций научных статей. Рассмотрены вероятностные и генеративные тематические модели.
Видео
Посмотрели доклад? Понравился? Напишите комментарий! Не согласны? Тем более напишите.
Презентация
Примечания и ссылки
Plays:20 Comments:0