Применение алгоритма PageRank для определения весов web-страниц | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Авторы: ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №22 (102) ноябрь-2 2015 г.

Дата публикации: 19.11.2015

Статья просмотрена: 156 раз

Библиографическое описание:

Хайитова, И. И. Применение алгоритма PageRank для определения весов web-страниц / И. И. Хайитова, И. М. Низомаддинов. — Текст : непосредственный // Молодой ученый. — 2015. — № 22 (102). — С. 31-33. — URL: https://moluch.ru/archive/102/23433/ (дата обращения: 18.12.2024).



 

В данной работе рассматривается алгоритм ранжирования PageRank как фактор, определяющий при поиске порядок выдачи необходимой информации. Также были рассмотрены все аспекты работы данного алгоритма, его значимость и особенности. Представлен порядок ранжирования страницы и алгоритм расчета передачи веса страниц сайта. Рассмотрен пример увеличения веса страницы.

Ключевые слова: алгоритм PageRank, поисковая система, поисковая пессимизация, вес страницы, ранжирование.

При запросе в поисковых системах наблюдается повышение интереса пользователей к качеству информации, ее точности и достоверности выводимых результатов. Интернет огромен, web-страниц в нём большое количество, многие из них обладают похожим содержимым. Обычному пользователю сети Интернет приходится выуживать по частям информацию с разных сайтов, но собрать всё воедино оказывается достаточно проблематично. Существуют такие сайты, которые полностью бы удовлетворили запрос пользователя, но поиск информации непосредственно в первых отобразившихся ссылках далеко не всегда приводит к нужному результату. При запуске поисковой системы Google одни web-страницы появляются в самом верху списка, другие в самом низу, но по какому принципу миллиарды существующих и еще миллионы создающихся каждый день страниц располагаются относительно друг друга? Ответ на этот вопрос заложен в реализации алгоритма PageRank. PageRank является одним из ключевых моментов в работе поисковой машины Google, В интернете используется ссылочная структура для расчета рейтинга каждой web-страницы. Этим рейтингом и является PageRank. Знание работы данного алгоритма необходимо как для понимания процесса поиска, так и для использования оптимизаторами при продвижении своих сайтов в поисковой системе. PageRank статическая величина, предназначенная для оценки качества страниц. Она не зависит от каких-либо запросов [3]. Таким образом, можно сказать, что она представляет собой «глобальную ценность» каждой страницы. Порядок ранжирования страницы представляется следующим образом:

1)        найти все страницы, соответствующие ключевым словам поиска;

2)        «отранжировать» соответственно «страничным факторам», таким, как слова;

3)        учесть текст ссылок на страницы;

4)        откорректировать результаты данными PageRank.

Результаты скорректируются так, что более «важные» сайты будут находиться соответственно выше остальных результатов поиска на странице пользователя. Как определяется сам PageRank? Если страница А ссылается на страницу Б, значит страница А считает, что страница Б — важная страница. Отметим тот факт, что PageRank вычисляется не для сайта целиком, а для отдельно взятой страницы. Может произойти так, что один из документов на web-сервере будет иметь более высокий PageRank, чем домашняя страница, к которой он принадлежит. Схема передачи веса страниц сайта Итераций по перерасчету веса много, и с увеличением времени вес будет только расти, если будут увеличиваться веса доноров и их количество. Можно предположить, что чем больше по ссылке кликают, тем больше веса она передает [1]. Но официальных подтверждений тому, что на текущий момент «кликабельность» определяет вес ссылки, нет. Текст ссылки не используется в PageRank, это придает ему независимость. Учитывается только общее число ссылок и их вес, поэтому никаких штрафных санкций при наличии ссылок с «неправильных» страниц не применяется. PageRank учитывает не все ссылки, он отфильтровывает их с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но отрицательно сказаться на ранжировании ссылающегося сайта. Такой эффект называется поисковой пессимизацией. Также PageRank влияет на важность ссылок, но не все ссылки одинаково влияют на PageRank. Значимость каждого отдельного фактора в алгоритмах поисковой системы зависит от качества информации, которое он обеспечивает. Важно помнить, что в настоящее время ссылка уже не является точным признаком рекомендации. Сегодня ссылка представляет собой, скорее всего, лицензионное требование, или даже ответную услугу, чем истинную рекомендацию. Если люди смогут воздействовать на ссылки, они перестанут быть рекомендациями, нельзя допустить создания такой поисковой машины [2]. Тем не менее, у PageRank есть одно реабилитирующее его свойство. На него труднее влиять, чем на любой другой фактор ранжирования. Это дает ему преимущество перед конкурентами, когда он использован в комбинации с другими приемами оптимизации для поисковых машин. Исходя из фактов о PageRank, можно сказать, что есть возможность легко рассчитать, с каких ссылок можно ссылаться и сколько нужно ссылок, чтобы получить тот или иной PageRank. Если взять немного математики, то еще один из важных выводов можно описать так: если мы имеем новый сайт со страницами более 10000, они правильно перелинкованы и каждая ссылается на главную страницу, то главная страница получит хороший вес от этих ссылок. Важно понимать, что если размещать на страницах сайтов уникальную и актуальную информацию, то можно повысить вес PageRank. Но, к сожалению, данный метод не будет способствовать быстрому росту веста страницы. В данном случае, необходимо будет использовать форумы, порталы, и публикации огромного количества постов. Быстрее всего повысить вес страницы позволят полученные ссылки с сайтов с высоким PageRank, только эти ссылки должны быть качественными. Количество играет свою роль, вес распределяется поровну между всеми ссылками. Здесь можно использовать такие средства, как прессрелизы, социальные сети, каталоги, блоги и другие типы сайтов. Указанный метод представляет естественный путь увеличения PageRank. Максимальный поток посетителей приходит с самых популярных поисковых систем интернета. Вывод один — для успешного развития своего web-проекта нужно именно «дружить» с поисковыми системами Яндекс, Google и т. д. А вот величину «дружбы» можно измерить уровнем доверия, который измеряется рейтингом проекта — PageRank. Этот показатель имеет определенные рамки: от 0 до 10, в этом и заключается одно из главных отличий от индекса цитирования, наращивание которого не знает границ и может быть очень большим. Таким образом, при проведении мероприятий по раскрутке и продвижению сайта важно учитывать такие показатели как индекс цитирования и PageRank. В противном случае будет чрезвычайно сложно вывести требуемый сайт в ТОП-10 по поисковым запросам.

 

Литература:

 

  1.                Оптимизация структуры сайта [Электронный ресурс]. — Режим доступа: http://www.onlinesem.ru/seo-lessons-and-tutorials/pagerank-optimizer/.
  2.                Райдингс К. Растолкованный PageRank [Электронный ресурс]. — Режим доступа: http://digits.ru/articles/promotion/pagerank.html.
  3.                SEO. Поисковая оптимизация [Электронный ресурс]. — Режим доступа: http://creng.ru/seo/. — (Дата обращения: 30.09.2014)
Основные термины (генерируются автоматически): ссылка, поисковая система, вес страницы, главная страница, индекс цитирования, качество информации, поисковая машина, порядок ранжирования страницы, страница А, страница Б.


Задать вопрос