Социальные сети — очень популярный канал продаж товаров и услуг. Из-за этого часто возникает необходимость анализировать аудиторию лидеров общественного мнения, у которых бренды покупают рекламные посты. Для компаний важно оценить эффект интеграции рекламы у лидера общественного мнения в качественном и количественном выражении. Примером оценки может служить тональность комментариев. Для этого разрабатывается приложение, которая поможет определить качество комментариев под рекламными постами.
Ключевые слова: социальные сети, качество комментариев, анализ целевой аудитории.
Социальные сети пользуются огромной популярностью и поэтому стали одним из главных каналов продаж товаров и услуг. Это вызывает необходимость в анализе аудитории лидеров мнений, у которых бренды покупают рекламные посты. Для компаний важно оценить эффект от рекламы у лидеров мнений, в качественном и количественном выражении. Лучшим примером такой оценки может послужить отслеживание тональности комментариев под рекламными постами.
Лидеры мнений, имеют потребность в автоматическом вычислении релевантности комментариев под постами для корректной оценки стоимости рекламных интеграций. Бизнес же заинтересован в том, чтобы знать мнение аудитории о рекламном продукте и как она реагирует на разную тональность поста. Для решения описанных выше проблем, разрабатывается приложение, которая поможет быстро измерить тональность и качество комментариев аудитории, а также отсеять “спам” комментарии. Приложение должно помочь рекламодателям правильно оценивать рекламную интеграцию с лидером мнений.
Back-end приложения разрабатываются на языке программирования Python. Также использована сторонняя библиотека Sentimental, для анализа тональности текста, и несколько различных библиотек для выгрузки комментариев с различных социальных сетей. Front-end приложения разрабатывается с использованием библиотеки React [1].
Для начала приложение определяет спам-комментарии, которые не несут никакой важности. Для этого потребовалось найти размеченный датасет спама. На русском языке таких датасетов нет, поэтому было принято решение использовать датасет на английском языке. Так как пользователя приложения могут интересовать комментарии на определенном языке, а датасет представлен на английском, то необходимо переводить комментарии на английский язык, для этого используется API Яндекс.Переводчика. Далее все комментарии классифицируются наивным Байесовским классификатором. После классификации приложение уже может отбросить комментарии, отнесенные к спаму и не учитывать их в итоговой оценке.
После первичной обработки комментариев, приложение переходит к следующему шагу, в котором происходит непосредственно анализ оставшихся комментариев. Для определения тональности также понадобилось найти размеченный датасет на английском языке. Тональность комментариев определяется с помощью библиотеки Sentimental. Библиотеку Sentimental использует другую библиотеку Scikit-learn, для простого анализа настроений в текстовых данных [2]. Sentimental определяет положительную, отрицательную или нейтральное настроение текстовых данных, основываясь на предоставленных датасетах, а также определяет вероятность отнесения текстовых данных в определенную группу.
Для того чтобы проверить точность оценки комментариев, были вручную проанализированы комментарии под различными рекламными постами с разной тематикой. В зависимости от того какая тематика была у исходного поста, точность оценки составляла от 90 до 98 %. Пример интерфейса приложения при оценке тональности комментариев у лидера общественного мнения представлен на рисунке 1.
Рис. 1. Пример интерфейса приложения
Таким образом удалось определить, что для будущего развития приложения имеет смысл найти больше датасетов для разных тематик, либо составить их вручную, что помогло бы увеличить точность.
Данное приложение представляет собой самостоятельное решение. Но также планируется использовать наработки из него, для создания приложения, помогающего в сборе, анализе и прогнозировании данных в воронках продаж [3].
Литература:
1. Мартин, Р. Чистая архитектура. Искусство разработки программного обеспечения / Р. Мартин. — СПБ: Питер, 2018. — 352 c. — Текст: непосредственный.
2. Sentimental — Sentiment analysis made easy; built on top off solid libraries. — Текст: электронный // GitHub: [сайт]. — URL: https://github.com/ErikGartner/sentimental (дата обращения: 22.08.2022).
3. Грива, Е. В. Разработка информационной системы для сбора, анализа и представления данных о воронках продаж / Е. В. Грива. — Текст: непосредственный // Материалы международной научно-практическая конференции «Электронные средства и системы управления» (МНПК ЭСиСУ-2021). — Томск: B-Спектр, 2021. — С. 163–165.