2019. — Т 11. — №2 - перейти к содержанию номера...

Постоянный адрес этой страницы - https://esj.today/102itvn219.html

Полный текст статьи в формате PDF (объем файла: 573.6 Кбайт)


Ссылка для цитирования этой статьи:

Хлопотов, М. В. Исследование кластеров кинолюбителей и их тематических сообществ в социальных сетях / М. В. Хлопотов, Н. В. Старцева, А. А. Макаренко // Вестник Евразийской науки. — 2019. — Т 11. — №2. — URL: https://esj.today/PDF/102ITVN219.pdf (дата обращения: 25.04.2024).


Исследование кластеров кинолюбителей и их тематических сообществ в социальных сетях

Хлопотов Максим Валерьевич
ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и оптики», Санкт-Петербург, Россия
Доцент
Кандидат технических наук
E-mail: khlopotov@corp.ifmo.ru

Старцева Наталья Владимировна
ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и оптики», Санкт-Петербург, Россия
Магистрант
E-mail: st.natalie.eilatan@gmail.com
SCOPUS: http://www.scopus.com/authid/detail.url?authorId=57195920234

Макаренко Анастасия Александровна
ФГАОУ ВО «Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и оптики», Санкт-Петербург, Россия
Магистрант
E-mail: AnastasiaMakarenko95@yandex.ru

Аннотация. В статье описано исследование предпочтений наиболее активных пользователей «Кинопоиска» и процесс выявления их взаимосвязей с тематическими сообществами таких пользователей в сети «ВКонтакте».

Для проведения исследования были собраны данные об оценках кинолюбителей на сайте «Кинопоиск». Были использованы лишь оценки для недавно вышедших картин для поддержания актуальности данных. Более десяти тысяч полученных профилей пользователей были поделены на группы с помощью различных алгоритмов кластеризации. Для определения оптимального числа кластеров был использован пакет NbClust, применяющий 30 разных методов для определения количества подгрупп данных. Большинство алгоритмов выбора оптимального числа кластеров выбрали число 3 как наилучший вариант.

Для измерения эффективности кластеризации была использована метрика силуэта. Данная метрика показала, что наиболее эффективным алгоритмом является алгоритм k-средних. Таким образом, итоговая модель кластеризации делила набор данных на 3 группы и была построена при помощи k-средних.

Для пользователей выборки были собраны сообщества с прикрепленной страницы «ВКонтакте», если таковая имелась. При анализе наиболее популярных сообществ среди кластеров были исключены сообщества кинолюбителей, поскольку они присутствовали в каждом кластере и были помехой при определении специфики подгруппы. Таким образом, анализ групп «ВКонтакте» и самых высоко оцененных фильмов помог выявить тенденции тематик каждого кластера. Среди пользователей были выделены три группы – группа «фанатов комиксов», группа «интеллектуалов» и группа «юмористов». Результаты исследования могут быть использованы при разработке маркетинговых стратегий и персонализации.

Ключевые слова: анализ социальных сетей; онлайн-сообщество; кластеризация; k-средних; силуэт; анализ данных; Кинопоиск; ВКонтакте

Скачать

Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2588-0101 (Online)

Уважаемые читатели! Комментарии к статьям принимаются на русском и английском языках.
Комментарии проходят премодерацию, и появляются на сайте после проверки редактором.
Комментарии, не имеющие отношения к тематике статьи, не публикуются.

Добавить комментарий