Статья посвящена анализу данных пользователя социальной сети «Вконтакте» на основании информации, указанной на странице пользователя, а также по средствам анализа связей с другими пользователями.
Ключевые слова: Интернет, социальные сети, информация
В настоящее время развитие информационных технологий оказывает влияние и охватывает все сферы деятельности человека: политику, экономику, культуру, науку и другие. Информатизация общества приносит значительную пользу, расширяет и открывает новые возможности. Особую значимость приобретает развитие и использование Всемирной сети Интернет, что открывает перед человечеством безграничные возможности, связанные с поиском, передачей и распространением информации.
В современном информационном обществе Интернет является одной из возможных площадок для самовыражения личности. Особую популярность приобрели социальные сети. Социальная сеть — это интернет-площадка, сайт, который позволяет зарегистрированным на нем пользователям размещать информацию о себе и коммуницировать между собой, устанавливая социальные связи. Контент на этой площадке создается непосредственно самими пользователями [1].
Первая крупная социальная сеть Facebook появилась в США. В мире наиболее распространены сети MySpace, Facebook, Twitter, LinkedIn, Google + [2]. Самыми известными и популярными социальными сетями в России являются ВКонтакте, Одноклассники.ru, Мой Мир, Facebook, Twitter, набирает обороты Google +.
Анализ данных социальных сетей стремительно набирает обороты, так как социальные сети являются уникальным источником личных данных и интересов реальных людей. Это открывает безграничные возможности для решения разного рода исследовательских и бизнес-задач [3].
В данной статье рассматривается анализ страницы пользователя социальной сети на примере самой популярной в России сети — «Вконтакте». Сам Процесс анализа страницы пользователя представлен на Рисунке 1. Остановимся подробнее на каждом элементе анализа.
Аватар. Одним из главных и самых заметных элементов страницы, а также главным инструментом самопрезентации пользователя является «Аватар», то есть основная фотография пользователя. Благодаря аватару существует возможность установить соответствие между внешностью пользователя и его данными, идентифицировать пользователя на других фотографиях. Также с помощью аватара и любой другой фотографии, опубликованной в социальной сети, есть возможность определить место, в котором сделана фотография исходя из геопозиции, а также время, в которое она была сделана исходя из свойств jpeg файла. Анализ всех фотографий, на которых присутствует пользователь (как опубликованных самим пользователем, так и его друзьями) позволяет выяснить, какие места он чаще всего посещает и, в какое время это, обычно, происходит.
Статус пользователя. Исходя их статуса, можно судить о настроении пользователя. Нередко, пользователи публикуют в статусе цитаты из книг/фильмов/песен, что позволяет сделать вывод о литературных/кинематографических/музыкальных и прочих предпочтениях. Также в «Вконтакте» есть возможность дублировать проигрываемые музыкальные композиции в статус, что также говорит о музыкальных предпочтениях.
Друзья. Количество друзей свидетельствует об общительности или, напротив, отстраненности. Оценив соотношение друзей и подписчиков, можно сделать вывод о том, насколько пользователь общителен, предпочитает общаться с реальными друзьями или открыт для новых знакомств, насколько он популярен. Значительную часть информации, которую пользователь не указал на своей странице можно почерпнуть исходя из анализа страниц его друзей. Например, если большая часть друзей в графе родной город указало «Москва», вероятнее и сам пользователь проживает в Москве или если значительная часть друзей студенты, то логично предположить, что пользователь также является студентом и его возраст колеблется между 18 и 25 годами.
Информация опользователе. Всоциальной сети «Вконтакте» каждый пользователь может поместить личную информацию о себе на своей страничке. К личной информации относятся все текстовые данные, расположенные на странице. Информация о пользователе включает следующие разделы:
- Основное (ФИО, пол, семейное положение и т. д.).
- Контактная информация (страна, город, адрес, телефоны, почта, сайты, другие социальные сети и т. д.).
- Интересы (деятельность, интересы, любимые фильмы/книги/музыка и т. д.).
- Образование (школа, данные о среднем и высшем образовании и т. д.).
- Карьера (место работы, должность и т. д.).
- Служба (войсковая часть и т. д.).
- Жизненная позиция (политические предпочтения, мировоззрение, отношение к алкоголю/курению и т. д.).
Все эти разделы заполняются при регистрации пользователя и могут быть отредактированы. Наполнение страницы данными облегчает идентификацию и поиск, однако, заполнять все пункты не обязательно, а также, есть возможность скрыть личную информации от других пользователей.
Рис. 1. Анализ страницы пользователя социальной сети «Вконтакте»
Лайки, комментарии, подарки. Исследователи социальной сети Facebook выяснили, что наибольшую активность пользователь проявляет, находясь в хорошем расположении духа. Поэтому обильное проставление лайков свидетельствует о хорошем настроении пользователя в конкретный день, а отсутствие активности, по сравнению с другими днями, напротив, говорит о плохом настроении. Исходя из того на чьих фотографиях пользователь чаще всего проставляет лайки можно выяснить круг общения пользователя, его близких, друзей, родственников и пр. Помимо фотографий других пользователей лайки проставляются под постами, аудиозаписями, видеозаписями и пр. Это говорит о вкусах пользователя, а оставленные комментарии, помогут сделать вывод о его мнении на различные темы, а также о его стиле общения, степени грамотности и др.
Музыка, видео, группы. Аудио и видеозаписи, опубликованные пользователем, а также группы, в которых он состоит, могут свидетельствовать о его вкусах и увлечениях. Например, если человек подписан на 5 групп о компьютерных технологиях, вероятнее всего такой человек разбирается или учиться разбираться в компьютерах, увлекается техникой, и, возможно, работает в соответствующей области. Также группы могут подтверждать некоторую информацию, указанную на странице, например, если пользователь указал, что учиться в университете, наверняка, среди его групп можно найти группу, связанную с учебным заведением.
Приватность страницы. В «Вконтакте» есть возможность ограничить доступ к своей странице, а также к конкретным данным, ограничить возможность отправки сообщений, оставление записей на стене и пр. В зависимости от того установлены ли настройки приватности можно судить о том, открыт ли пользователь для общения или менее общителен в соц. сетях. Стремится ли он скрыть информацию о себе или предоставляет всем открытый доступ к своей странице.
Исходя из представленной схемы анализа страницы пользователя, а также описания данного алгоритма, можно сделать вывод о том, что социальные сети содержат в себе огромное количество данных множества людей, активно их использующих. Анализ социальных сетей представляет собой эффективную систему для обнаружения и интерпретации личных данных, также интересы, предпочтений, убеждений, сделать вывод о взаимоотношениях с другими пользователями. Благодаря социальным сетям есть возможность получать информацию в режиме реального времени, а данные, представленные на страницах, актуализируются за счёт стараний самих пользователей.
Литература:
- Антон Коршунов. Задачи и методы определения атрибутов пользователей социальных сетей // Труды 15-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» — RCDL’2013Второй источник.
- Сергей Бартунов, Антон Коршунов. Идентификация пользователей социальных сетей в Интернет на основе социальных связей // Доклады Всероссийской научной конференции «Анализ изображений, сетей и текстов» — АИСТ'2012. Екатеринбург, 16–18 марта 2012 г.
- Вэй Тан, Брайан Блейк, Иман Салех. Аналитика Больших Данных и социальные сети // Открытые системы.СУБД. — 2013. — № 8. — С. 37–41.