Система комплексного анализа ссылочного профиля сайтов | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Авторы: , ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №17 (151) апрель 2017 г.

Дата публикации: 30.04.2017

Статья просмотрена: 32 раза

Библиографическое описание:

Майоров, К. Н. Система комплексного анализа ссылочного профиля сайтов / К. Н. Майоров, И. М. Григорьев, Т. С. Кочарян. — Текст : непосредственный // Молодой ученый. — 2017. — № 17 (151). — С. 20-23. — URL: https://moluch.ru/archive/151/42888/ (дата обращения: 18.12.2024).



Рассматривается система комплексного анализа ссылочного профиля сайтов. Система предназначена для исследования ссылочного профиля сайта, позволяющая по большому количеству факторов определить являются ли входящие ссылки сайта естественными или оплаченными.

Ключевые слова: система комплексного анализа ссылок, ссылочный профиль, ссылочные факторы

Complex analysis system of site link profile is being considered. The system is designed to review site link profile. It affords to decide by variety of factors, are those links natural or paid.

Keywords: Complex analysis system of site link profile, link profile, link factors

Ссылки — важнейшая составляющая интернета. Они связывают между собой страницы всемирной паутины и являются тропинками, по которым ходят пользователи.

Поисковые системы ценят ссылки, которые ставятся для того, чтобы помочь посетителям сайта. Те же ссылки, которые появляются на сайтах за определенную плату (особенно когда они размещаются с использованием ссылочных бирж и предназначены для поисковых систем, а не посетителей сайта), мешают поисковым системам корректно определять степень доверия к сайтам и их релевантность запросам пользователей. Поисковые системы стараются не учитывать купленные ссылки, а при их большом количестве могут даже наложить на сайт определенные санкции и понизить его в поисковом рейтинге.

Поэтому сегодня для успешного продвижения сайта на первую страницу поисковой выдачи просто необходимо понимать, что из себя представляет ссылочный профиль сайта, насколько он отличается от профиля сайтов, находящихся на первой странице поисковой выдачи, какие ссылки являются естественными, а какие куплены.

В данной работе рассматривается система, разработанная для комплексного анализа ссылочного профиля исследуемого сайта. Система предназначена для получения рекомендаций по улучшению ссылочного профиля, на основе сопоставления с ссылочными профилями конкурентов, находящихся на первой странице поисковой выдачи.

Задача по анализу ссылочного профиля не является новой. Существуют различные программные решения по анализу ссылок Ahrefs, Majestik SEO, Check Trust. Однако данные программы не позволяют оценить естественность ссылок, а также не обладают возможностью генерировать рекомендации по улучшению ссылочного профиля. Следовательно, реализация системы комплексного анализа ссылочного профиля является вполне оправданной.

Исходя из поставленной цели, в работе решались следующие задачи:

‒ построить модель ссылочного профиля;

‒ разработка алгоритма идентификации тематики сайта-донора и страницы со ссылкой;

‒ разработка алгоритма классификации ссылок по естественности;

‒ разработка ПО для генерации рекомендаций по улучшению ссылочного профиля.

Классификация ссылок на предмет естественности происходит из учета большого количества факторов (Рис.1). К таким факторам можно отнести: расположение ссылки в теле страницы, тип анкора, схожесть тематик страниц, схожесть тематик сайтов, наличие переходов пользователей по этой ссылке и других.

Рис. 1. Ссылочные факторы

Каждый фактор имеет свой вес, который формируется в процессе обучения системы на обучающих выборках.

Входными сигнала нейронной сети являются различные ссылочные факторы, описанные выше. Каждый входной сигнал имеет свой вес wnn, который передается в скрытый слой S1..Sn. Каждый скрытый слов также имеет свой вес Wnn. На выходе мы получаем класс ссылки: естественная или купленная.

Алгоритм feedforward (прямопроходящий) в цикле обходит все узлы скрытого слоя и для каждого из них вычисляет сумму величин выходных сигналов от узлов входного слоя, помноженных на вес соответствующей связи. Выходной сигнал каждого скрытого узла — это результат применения функции тангенса к взвешенной сумме входных сигналов. Этот сигнал передается на выходной уровень. Выходной уровень делает то же самое — умножает полученные от предыдущего уровня сигналы на веса связей и применяет функцию тангенса для получения окончательного результата.

E:\Учеба\магистратура\Диссертация\нейросеть.png

Рис. 2. Схема нейронной сети для классификации ссылки

Система разработана в виде веб-приложения, что делает ее очень мобильной и позволяет получить доступ к информации, где бы пользователь не находился.

Для разработки системы используется язык Python. Этот язык, позволяет качественно и на достаточном уровне выполнить систему необходимой сложности, а также обладает богатым набором библиотек для работы с веб-страницами. Для управления данными применяется фреймворк Django.

В качестве СУБД используется свободная система управления базами данных PostgreSQL. PostgreSQL — это свободно распространяемая объектно-реляционная система управления базами данных (ORDBMS), наиболее развитая из открытых СУБД в мире и являющаяся реальной альтернативой коммерческим базам данных.

В качестве веб-сервера выбран Apache 2.2 HTTP — сервер, принадлежащий к категории свободного ПО. Основными достоинствами Apache считаются надёжность и гибкость конфигурации. Он позволяет подключать внешние модули для предоставления данных, использовать СУБД для аутентификации пользователей, модифицировать сообщения об ошибках.

Литература:

  1. Марк Саммерфилд. Программирование на Python 3. Подробное руководство. М.: Издательство «Символ-Плюс», 2009.
  2. Малыхина М. П. Базы данных: основы, проектирование, использование. С.-П.: БХВ-Петербург, 2004.
  3. Скот Хоккинс. Администрирование web-сервера Apache. М.: Издательский дом «Вильямс», 2001.
  4. Каллан Р. Основные концепции нейронных сетей = The Essence of Neural Networks First Edition. — М.: Вильямс, 2001. — 288 с. — ISBN 5–8459–0210-X.
Основные термины (генерируются автоматически): ссылочный профиль, система, комплексный анализ, поисковая выдача, HTTP, ORDBMS, SEO, выходной уровень, нейронная сеть, ссылочный профиль сайта.


Ключевые слова

система комплексного анализа ссылок, ссылочный профиль, ссылочные факторы

Похожие статьи

Проектирование информационной системы управления интернет-магазином и разработка рекомендательного алгоритма

В статье рассматривается проектирование ИС, настройка взаимодействия через API и разработка item-based алгоритма.

Использование метода анализа иерархий при выборе антивирусного продукта

При построении и эксплуатации системы информационной безопасности есть необходимость выбора средств защиты информации. Необходимо отметить, что данная задача является многокритериальной, так как каждое из рассматриваемых средств имеет набор значимых ...

Идентификация и аутентификация пользователей для автоматизированных систем высших учебных заведений

Статья посвящена организации идентификации и аутентификации пользователей в автоматизированной системе вуза. Показано, что результаты, достигнутые на текущий момент в решении задач интеллектуального анализа данных идентификации и аутентификации польз...

Принципы разработки и создания структуры базы данных

В данная статья посвящена проектированию и разработке структуры базы данных информационной системы по поведенческому аудиту безопасности.

Семантика в задачах автоматической обработки данных

В данной статье рассматриваются методы повышения качества и эффективности решения поисково-аналитических за счёт разработки и применения метода оценки сходства текстов, учитывающего лексико-морфологическую, синтаксическую и семантическую информацию, ...

Исследование и разработка модели оценки информационной безопасности объекта

В статье проведен анализ качественного, количественного и комплексного подходов для минимизации угрозы информационной безопасности, выбран наилучший. На основании проведенного анализа строится математическая модель и алгоритм модели оценки информацио...

Программный модуль моделирования атак в сегменте корпоративной сети с учетом оценки риска

Разработан программный модуль анализа атак в корпоративной сети на основе оценки рисков. В основу данного модуля положен новый метод на основе уязвимостей каждого элемента сети.

Методы верификации программного обеспечения

В статье идет речь об исследовании и классификации методов верификации программного обеспечения (ПО). Осуществлен обзор имеющихся статических методов верификации, исследованы характеристики методов и осуществлено исследование на обнаружение зависимос...

Информационная система «Оценка рисков проекта»

В статье рассматривается разработанная информационная система «Оценка рисков проекта», которая позволит автоматизировать процесс аналитика по информационной безопасности.

Анализ эффективности алгоритмов сортировки и вcтроенных реализаций на примере языка программирования Java

В данной статье показана значительная роль проведения анализа работы алгоритмов сортировки на массивах данных различной размерности. Рассмотрены актуальные алгоритмы и стандартные реализации сортировки в языке программирования Java.

Похожие статьи

Проектирование информационной системы управления интернет-магазином и разработка рекомендательного алгоритма

В статье рассматривается проектирование ИС, настройка взаимодействия через API и разработка item-based алгоритма.

Использование метода анализа иерархий при выборе антивирусного продукта

При построении и эксплуатации системы информационной безопасности есть необходимость выбора средств защиты информации. Необходимо отметить, что данная задача является многокритериальной, так как каждое из рассматриваемых средств имеет набор значимых ...

Идентификация и аутентификация пользователей для автоматизированных систем высших учебных заведений

Статья посвящена организации идентификации и аутентификации пользователей в автоматизированной системе вуза. Показано, что результаты, достигнутые на текущий момент в решении задач интеллектуального анализа данных идентификации и аутентификации польз...

Принципы разработки и создания структуры базы данных

В данная статья посвящена проектированию и разработке структуры базы данных информационной системы по поведенческому аудиту безопасности.

Семантика в задачах автоматической обработки данных

В данной статье рассматриваются методы повышения качества и эффективности решения поисково-аналитических за счёт разработки и применения метода оценки сходства текстов, учитывающего лексико-морфологическую, синтаксическую и семантическую информацию, ...

Исследование и разработка модели оценки информационной безопасности объекта

В статье проведен анализ качественного, количественного и комплексного подходов для минимизации угрозы информационной безопасности, выбран наилучший. На основании проведенного анализа строится математическая модель и алгоритм модели оценки информацио...

Программный модуль моделирования атак в сегменте корпоративной сети с учетом оценки риска

Разработан программный модуль анализа атак в корпоративной сети на основе оценки рисков. В основу данного модуля положен новый метод на основе уязвимостей каждого элемента сети.

Методы верификации программного обеспечения

В статье идет речь об исследовании и классификации методов верификации программного обеспечения (ПО). Осуществлен обзор имеющихся статических методов верификации, исследованы характеристики методов и осуществлено исследование на обнаружение зависимос...

Информационная система «Оценка рисков проекта»

В статье рассматривается разработанная информационная система «Оценка рисков проекта», которая позволит автоматизировать процесс аналитика по информационной безопасности.

Анализ эффективности алгоритмов сортировки и вcтроенных реализаций на примере языка программирования Java

В данной статье показана значительная роль проведения анализа работы алгоритмов сортировки на массивах данных различной размерности. Рассмотрены актуальные алгоритмы и стандартные реализации сортировки в языке программирования Java.

Задать вопрос