Отрывок: Метод k-средних разделяет X документов на k кластеров (k ≤ X) , чтобы минимизировать суммарное квадратичное отклонение точек кластеров от центроидов этих кластеров [8]. Минимальное суммарное отклонение рассчитывается по формуле 4. min [∑ ∑ ‖𝑥(𝑗) − 𝑢𝑖‖ 2 𝑥(𝑗)∈𝑆𝑖 𝑘 𝑖=1 ] (4) где ui - центроид для кластера Si 5. Формирование научных групп по заданной тематике. Для реализации предложенного алгоритма был разработа...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorДырночкин А. А.ru
dc.contributor.authorМошкин В. С.ru
dc.coverage.spatialанализ текстаru
dc.coverage.spatialвекторизация текстовru
dc.coverage.spatialкластеризация k-meansru
dc.coverage.spatialкластеризация библиографической информацииru
dc.coverage.spatialизвлечение библиографической информацииru
dc.coverage.spatialнаукометрический анализ публикацийru
dc.coverage.spatialпарсинг веб-страницru
dc.creatorДырночкин А. А., Мошкин В. С.ru
dc.date.issued2022ru
dc.identifierRU\НТБ СГАУ\491071ru
dc.identifier.citationДырночкин, А. А. Подход к извлечению и кластеризации библиографической информации / А. А. Дырночкин, В. С. Мошкин // Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. / М-во науки и образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - фил. ФНИЦ "Кристаллография и фотоника" РАН. - Самара : Изд-во Самар. ун-та, 2022Т. 4: Искусственный интеллект / под ред. А. В. Никонорова. - 2022. - С. 041172.ru
dc.description.abstractВ данной статье представлена система извлечения библиографической информации для последующего наукометрического анализа публикаций. Описан алгоритм загрузки и предобработки статей. Предложен подход для формирования научных групп по заданной тематике посредством кластеризации текстов аннотаций статей. Также в работе представлены результаты экспериментов с данными по статьям из научной библиотеки elibrary.ru
dc.language.isorusru
dc.relation.ispartofИнформационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. -ru
dc.sourceИнформационные технологии и нанотехнологии (ИТНТ-2022). - Т. 4 : Искусственный интеллектru
dc.titleПодход к извлечению и кластеризации библиографической информацииru
dc.typeTextru
dc.citation.spage041172ru
dc.citation.volume4ru
dc.textpartМетод k-средних разделяет X документов на k кластеров (k ≤ X) , чтобы минимизировать суммарное квадратичное отклонение точек кластеров от центроидов этих кластеров [8]. Минимальное суммарное отклонение рассчитывается по формуле 4. min [∑ ∑ ‖𝑥(𝑗) − 𝑢𝑖‖ 2 𝑥(𝑗)∈𝑆𝑖 𝑘 𝑖=1 ] (4) где ui - центроид для кластера Si 5. Формирование научных групп по заданной тематике. Для реализации предложенного алгоритма был разработа...-
Располагается в коллекциях: Информационные технологии и нанотехнологии




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.