Статья:

АНАЛИЗ И ИССЛЕДОВАНИЕ ПОЛЬЗОВАТЕЛЬСКОГО ПОВЕДЕНИЯ НА ВЕБ-ПЛАТФОРМЕ С ПРИМЕНЕНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Журнал: Научный журнал «Студенческий форум» выпуск №20(371)

Рубрика: Экономика

Выходные данные
Томилов Д.Е. АНАЛИЗ И ИССЛЕДОВАНИЕ ПОЛЬЗОВАТЕЛЬСКОГО ПОВЕДЕНИЯ НА ВЕБ-ПЛАТФОРМЕ С ПРИМЕНЕНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ // Студенческий форум: электрон. научн. журн. 2026. № 20(371). URL: https://nauchforum.ru/journal/stud/371/187547 (дата обращения: 21.06.2026).
Журнал опубликован
Мне нравится
на печатьскачать .pdfподелиться

АНАЛИЗ И ИССЛЕДОВАНИЕ ПОЛЬЗОВАТЕЛЬСКОГО ПОВЕДЕНИЯ НА ВЕБ-ПЛАТФОРМЕ С ПРИМЕНЕНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Томилов Дмитрий Евгеньевич
магистрант, Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского, РФ, г. Нижний Новгород

 

Современные веб-платформы формируют значительный объем пользовательских данных: сведения о сессиях, поисковых запросах, просмотрах документов, переходах между разделами и взаимодействии с рекомендательными блоками. Эти данные важны не только для подсчета посещаемости, но и для понимания того, насколько удобно пользователям работать с цифровым сервисом. Поэтому в задачах прикладной информатики возрастает роль интеллектуальной веб-аналитики, основанной на сочетании систем аналитики и методов машинного обучения.

Целью статьи является рассмотрение подхода к анализу пользовательского поведения на веб-платформе с применением методов машинного обучения. В качестве источников данных могут использоваться журналы пользовательских событий, отчеты Google Analytics 4 и Яндекс.Метрики. Google Analytics 4 удобен для построения событийной модели, поскольку позволяет настраивать пользовательские события [1]. Яндекс.Метрика дополняет такой анализ визуальными инструментами, включая карту кликов и средства изучения взаимодействия пользователя с интерфейсом [2].

В предлагаемом подходе пользовательское поведение рассматривается как последовательность событий, объединенных в сессии. Для каждой сессии рассчитывается набор признаков: продолжительность взаимодействия, глубина просмотра, количество действий, число поисковых запросов, повторное посещение, переходы к связанным материалам и клики по рекомендациям. Эти признаки позволяют перейти от общей статистики посещаемости к анализу пользовательских сценариев.

Первым этапом обработки данных является preprocessing. На этом этапе удаляются дублирующиеся записи, технические события, некорректные временные метки и неполные сессии. Затем отдельные действия пользователя преобразуются в показатели уровня сессии: общее количество событий, число уникальных страниц, длительность взаимодействия и интенсивность поиска. Такая подготовка важна, поскольку качество модели машинного обучения напрямую зависит от корректности входных данных.

Для первичного анализа аудитории может использоваться кластеризация пользователей. Один из распространенных методов - K-Means, который группирует объекты по близости признаков и отличается высокой скоростью работы на практических наборах данных [3]. В задачах веб-аналитики кластеризация позволяет выделить пользователей с низкой активностью, стабильным поведением и высокой вовлеченностью. Для каждой группы могут быть предложены разные решения: упрощение навигации, настройка подсказок, изменение структуры поиска или развитие рекомендательных блоков.

Для прогнозирования уровня вовлеченности целесообразно применять модели классификации. В практических задачах хорошо зарекомендовали себя алгоритмы ансамблевого обучения, в том числе XGBoost. Данный подход основан на градиентном бустинге деревьев решений и применяется для построения масштабируемых моделей машинного обучения [4]. Для веб-платформы такая модель может прогнозировать, относится ли пользовательская сессия к низкому, среднему или высокому уровню вовлеченности.

Сравнение данных Google Analytics 4 и Яндекс.Метрики позволяет получить более полную картину поведения пользователей. GA4 полезен при настройке событийной модели и экспорте данных для аналитической обработки. Яндекс.Метрика удобна для проверки гипотез о проблемных зонах интерфейса: например, если пользователи часто возвращаются к поиску или прекращают работу после просмотра одной страницы.

Таким образом, применение методов машинного обучения позволяет расширить возможности традиционной веб-аналитики. Вместо анализа только посещаемости становится возможным исследовать пользовательские сценарии, выявлять группы пользователей, прогнозировать уровень вовлеченности и формировать рекомендации по развитию интерфейса.

 

Список литературы:
1. Google Analytics. Set up events [Электронный ресурс]. URL: https://developers.google.com/analytics/devguides/collection/ga4/events (дата обращения: 28.05.2026).
2. Яндекс.Метрика. Карта кликов [Электронный ресурс]. URL: https://yandex.com/support/metrica/en/behavior/click-map (дата обращения: 28.05.2026).
3. Scikit-learn. KMeans [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html (дата обращения: 28.05.2026).
4. Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // KDD. 2016. P. 785-794.