2019 №2 - перейти к содержанию номера...

Постоянный адрес этой страницы - https://esj.today/90itvn219.html

Полный текст статьи в формате PDF (объем файла: 415.1 Кбайт)


Ссылка для цитирования этой статьи:

Телевной А.Д., Иванов С.Е. Гибридный метод кластеризации данных при анализе социальных сетей // Вестник Евразийской науки, 2019 №2, https://esj.today/PDF/90ITVN219.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.


Гибридный метод кластеризации данных при анализе социальных сетей

Телевной Андрей Дмитриевич
ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и оптики», Санкт-Петербург, Россия
Аспирант
E-mail: adtelev@mail.ru

Иванов Сергей Евгеньевич
ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и оптики», Санкт-Петербург, Россия
Доцент
Кандидат физико-математических наук
E-mail: serg_ivanov@corp.ifmo.ru

Аннотация. Объектом исследования являются данные агентов социальных сетей (как пользователей, так и онлайн-сообществ). Предметом исследования являются методы кластеризации данных социальных сетей. Особое внимание уделяется анализу научных публикаций, посвященных уже существующим методам кластеризации данных. Сформулированы особенности проведения кластерного анализа данных в социальных сетях, которым не соответствует большинство используемых исследователями методов кластеризации. Результаты применения «гибридного» метода кластеризации визуализированы программными средствами языка программирования R с помощью графа Coreness, также был построен структурный профиль одного из онлайн-сообществ социальной сети «ВКонтакте».

Произведен анализ научных публикаций в области кластеризации данных социальных сетей. В результате анализа публикаций по теме исследования, авторами был сделан вывод о том, что большинство исследователей социальных сетей пользуется уже разработанными методами кластеризации, которые не могут считаться специализированными для анализа социальных сетей, так как не отражают характерных особенностей исследований данной области.

Предпочтительный выбор методов, основанных на мере центральности, объясняется тем, что мера центральности может рассматриваться не только как отражение потенциальной активности объекта социальной сети в графе, но и как возможность управления передачей информации (через частоту прохождения кратчайших путей между парами вершин в связанном графе).

Сформулирован алгоритм предложенного «гибридного» метода кластеризации данных, представлены характеристики используемых метрик центральности. Осуществлено моделирование структурных показателей выбранного для исследования онлайн-сообщества, а также представлены показатели количественного расчета метрик центральности, выбранных для исследования.

Авторами был предложен «гибридный» метод кластеризации данных, обладающий такими преимуществами, как возможность самостоятельного определения пользователем количества кластеров и оптимизация вычислительных ресурсов при анализе социальных сетей, что является важным достоинством с учетом активно возрастающих объемов данных.

Ключевые слова: анализ социальных сетей; онлайн-сообщество; метрика центральности; метод кластеризации; кластеризация данных; графовая модель; структурный профиль онлайн-сообщества; особенности кластерного анализа

Скачать

Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2588-0101 (Online)

Уважаемые читатели! Комментарии к статьям принимаются на русском и английском языках.
Комментарии проходят премодерацию, и появляются на сайте после проверки редактором.
Комментарии, не имеющие отношения к тематике статьи, не публикуются.

Добавить комментарий