КАК ВЫСЧИТЫВАЕТСЯ PAGERANK?

Чтобы высчитать PageRank страницы, во внимание берутся все внутренние ссылки. Это ссылки изнутри сайта, а также снаружи сайта.

PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

Это уравнение, которое подсчитывает PageRank страницы. Это уравнение было опубликовано, когда PageRank был разработан, и вероятно Google использует его вариант, однако они не говорят нам, какой именно. Все же это не важно, так как это уравнение достаточно хорошее.

В уравнении ‘t1 — tn’ — это страницы со ссылкой на страницу A, ‘C’ – это количество исходящих ссылок, которыми обладает страница, а ‘d’ – это фактор ослабления, обычно равный 0.85.

Это можно представить и в более простом виде:-

PageRank страницы = 0.15 + 0.85 * («доля» PageRank каждой страницы, которая на нее ссылается)

«доля» = PageRank страницы со ссылкой, поделенный на количество исходящих ссылок на странице.

Страница «заявляет» о размере PageRank на каждой странице, которая ссылается на нее. Размер PageRank, о котором она заявляет, немногим меньше, чем ее собственное значение PageRank (собственное значение — * 0.85). Это значение равным образом разделяется между страницами, на которые она ссылается.

Отсюда мы можем сделать вывод, что ссылка со страницы с PR4 и 5 исходящих ссылок стоят больше, чем ссылка со страницы с PR8 и 100 исходящих ссылок. PageRank страницы, которая ссылается на вашу, важен, однако количество ссылок на этой странице также важно. Чем больше ссылок на странице, тем меньше значение PageRank, которое ваша страница получит от него.

Если бы разницы значений PageRank между PR1, PR2,…..PR10 были равными, то этот вывод имел бы силу, но многие люди считают, что значения между PR1 и PR10 (максимум) устанавливаются на логарифмической шкале, и есть очень хорошая причина в это верить. Никто за пределами Google не знает наверняка, но шансы того, что шкала логарифмическая, высоки. Если это так, то странице требуется много дополнительного PageRank, чтобы перейти на следующий уровень PageRank, столько же, сколько потребовалось для перехода с предыдущего уровня PageRank. Результат таков, что он переворачивает с ног на голову предыдущий вывод, так что ссылка со страницы PR8, которая имеет множество исходящих ссылок, важнее, чем ссылка со страницы PR4, которая имеет лишь несколько исходящих ссылок.

Какую бы шкалу не использовал Google, мы можем быть уверены в одном. Ссылка с другого сайта повышает PageRank нашего сайта. Просто помните, что нужно избегатьссылок из хранилищ ссылок.

Заметьте, что когда страница заявляет о своем значении PageRank другим страницам, ее собственный PageRank не снижается на то значение, о котором она заявляет. Страница, которая делает заявление не теряет свой PageRank. Это не передача PageRank. Это просто голос согласно значения PageRank страницы. Это похоже на встречу акционеров, когда каждый акционер голосует согласно количеству удерживаемых акций, но сами акции не отбираются. Даже если и так, страницы теряют PageRank косвенным образом, что мы и увидим в дальнейшем.

Пока все понятно? Хорошо. Теперь давайте посмотрим, как происходит подсчет.

Для подсчета страницы ее существующий PageRank (если он есть) полностью опускается, и производиться новый подсчет, в котором сайт полагается только на PageRank «заявленный» текущими исходящими ссылками, чье количество могло измениться со времени последнего подсчет PageRank страницы.

Уравнение четко показывает, как получается PageRank страницы. Но очевидно то, что оно не работает, если вычисление было выполнено лишь один раз. Предположим, у нас есть две страницы, A и B, которые ссылаются друг на друга, и ни одна из них не имеет ссылок другого вида. Вот что получается:-

ШАГ 1: ВЫЧИСЛЕНИЕ PAGERANK СТРАНИЦЫ A ПО КОЛИЧЕСТВУ ЕЕ ИСХОДЯЩИХ ССЫЛОК

Страница A теперь имеет новое значение. При вычислении использовалось новое значение PageRank с исходящей ссылкой со страницы B. Но страница B имеет исходящую ссылку (со страницы A) и ее новое значение PageRank еще не вычислено, поэтому новое значение PageRank страницы A основано на неточных данных и не может быть точным.

ШАГ 2: ВЫЧИСЛЕНИЕ PAGERANK СТРАНИЦЫ B ПО КОЛИЧЕСТВУ ЕЕ ИСХОДЯЩИХ ССЫЛОК

Страница B теперь имеет новое значение PageRank, но оно не точное, потому что при вычислении использовалось новое значение PageRank с исходящей ссылкой со страницы A, которое было неточным.

Это парадоксальная ситуация. Мы не может вычислить значение PageRank страницы A, пока не узнаем PageRank страницы B, и мы не можем вычислить PageRank страницы B, пока не узнаем PageRank страницы A.

Теперь, когда обе страницы имеют заново вычисленные значения PageRank, не можем ли мы заново запустить вычисления, что получить точные значения? Нет. Мы может запустить вычисления заново при помощи новых значений, и результаты будут более точными, но в этих вычислениях мы будем всегда использовать неточные значения, поэтому и результаты всегда будут неточными.

Проблема решается при множественных вычислениях. Каждое новое вычисление предлагает все более точные результаты. Фактически, стопроцентная точность не может быть достигнута, потому что вычисления всегда основаны на неточных значениях. 40-50 повторений достаточно, чтобы достичь того положения, когда дальнейшие вычисления не приведут к каким-либо значительным изменениям значений. Это именно то, что делает Google при обновлении, и именно поэтому обновление занимает столько времени.

В голове нужно держать то, что результаты, которые мы получаем из вычислений —пропорции. Значения должны быть наложены на шкалу (известную только Google) для достижения реального PageRank каждой страницы. Даже в этом случае мы можем использовать вычисления для передачи PageRank внутри сайта по всем страницам, чтобы конкретные страницы получили большую пропорцию, чем все остальные.

ПРИМЕЧАНИЕ:

Вы можете встретить объяснения PageRank, где заявлено это же уравнение, но результат каждого изменения вычисления добавляется к существующему PageRank страницы. Новое значение (результат + существующий PageRank) затем используется при передаче PageRank на другие страницы. Эти объяснения неверны по следующим причинам:-

1. Они публикуют то же уравнение, а затем меняют его

с PR(A) = (1-d) + d(……) на PR(A) = PR(A) + (1-d) + d(……)

Это неверно, и в этом нет необходимости.

2. Мы будем смотреть на то, как организованы ссылки, так что конкретные страницы получают большие пропорции PageRank, чем другие. Добавление к существующему PageRank страницы через изменение приводит к разным пропорциям, когда используется опубликованное уравнение. Так как добавление – это не часть опубликованного уравнения, результаты неверны и пропорции не точные.

Согласно опубликованному уравнению вычисление страницы начинается с нуля при каждом изменении. Оно полагается только на исходящие ссылки. Идея добавления к существующему PageRank этого не делает, поэтому его результаты будут обязательно неверными.