Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Теперь давайте рассмотрим непосредственно формулу алгоритма

 

PR(A) = (1-d) + d (PR(T1)/C(T1)+ ...+ PR(Tn)/C(Tn))

На вид ужасная, но по сути очень простая.

По данной формуле рассчитывается вес страницы, т.е. PR(A) - это вес акцептора.

Вот эта часть:

PR(T1)/C(T1) — это вес донора, деленный на все его ссылки. Это и есть вес, передаваемый по ссылке.

(PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) — вот это у нас сумма всех весов, передаваемых по ссылкам, от доноров к акцептору. Мы взяли каждого донора, разделили его вес на общее количество исходящих с донора ссылок и получили вес, передаваемый по ссылке от донора к акцептору. Далее мы суммировали все эти веса.

d – это так называемый коэффициент затухания. В вероятностной модели он подразумевал, что пользователь не пойдет по ссылке вообще, а просто закроет браузер. Вероятность такого события положили равным 15%. Остальные 85% отдали ссылкам.

d – это константа, равная 0,85

(1-d) — эта часть нужна для того, чтобы формула не занулилась, если вес доноров будет равен нулю. Для нас это означает, что даже самая захудалая страничка может передать какой-то минимальный вес по ссылке.

 

Итак. Формулу можно записать словами:

Вес страницы равен сумме весов, передаваемых по ссылкам от доноров к акцептору.
Вес, передаваемый по ссылке, равен весу донора, деленному на все его ссылки.

Вот эти две фразы нужно выучить наизусть и помнить всегда и везде. Данные формулировки помогут вам не только при построении внутренней перелинковки сайта, но и при покупке внешних ссылок на сайт.

Теперь давайте посчитаем простенький пример.

Допустим, у нас есть три страницы: А, В, С.
А ссылается на В, В ссылается на С. Положим начальный вес этих страниц равным единице.
А=1
В=1
С=1

Сначала посчитаем вес по цепочке, переходя от страницы к странице.

А сослалась на В, т.е. в данной ситуации у нас страница А - донор, страница В - акцептор. Для того, чтобы посчитать сколько у нас будет весить акцептор, мы должны узнать сколько веса по ссылке перейдет от донора. Для этого вес донора (страница А) мы делим на одну единственную исходящую ссылку.

Получаем:
В = 1 + (1-0,85) + 0,85*(1/1)
Где:
первая единица — это собственный вес страницы В. К нему мы прибавляем вес, полученный по ссылке от А — (1/1).

Напоминаю, что 0,85 - это d (коэффициент затухания), и он всегда равен 0,85.

Получилось:
В = 1+0,15+0,85=2

Почему я прибавил вес страницы В, хотя в формуле его нет? В статье, ссылку на которую приводил выше, в примерах идет именно суммирование собственного веса страниц с весом, передаваемым по ссылкам от доноров. Подобный подход позволяет более наглядно показать зависимость веса страниц от входящих ссылок. Позже мы уберем из расчетов это суммирование и посмотрим, что у нас получится. Ну а пока складываем веса :)

Итак, мы получили веса страниц нашей модели:
А=1
В=2
С=1

Теперь посчитаем сколько будет весить С после того, как на неё сошлется В.

Страница В у нас содержит две ссылки. Одну входящую и одну исходящую. Но напомню, что при расчете веса мы берем только исходящие ссылки страницы! Поэтому вес страницы В мы делим на одну единственную- исходящую — ссылку:

С = 1 + (1-0,85) + 0,85(2/1) = 2,85

Получили:
А = 1
В = 2
С = 2,85

Усложним модель. Сошлемся с С на А, т.е. замкнем наши страницы в кольцо. Посчитаем, сколько теперь будет весить А:

А = 1 + (1-0,85) + 0,85(2,85/1) = 3,57

Получили:
А = 3,57
В = 2
С = 2,85

Вам не кажется, что здесь что-то не так? Мы взяли три одинаковых страницы, сослались по кругу на каждую из них, поставив по одной ссылке, и получили совершенно разные веса. С точки зрения простой человесческой логики это выглядит несколько подозрительно :)

Кроме того, мы начали считать с пары А-В. Но если бы начали считать с пары В-С, то все веса у нас бы съехали, и мы бы получили совершенно другой результат при тех же начальных условиях:
А = 2,85
В = 3,57
С = 2
Что уже совсем ни в какие ворота не лезет :)

Вот поэтому поисковики не считают по цепочке от страницы к странице. Поисковики сначала рассчитывают вес, передаваемый по ссылкам от доноров к акцепторам по всей сети сразу, и только после этого подставляют результат.

В нашем примере это выглядит так:
Мы сначала должны посчитать сколько веса перейдет в каждой паре донор-акцептор.
А-В
В-С
С-А
Т.к. начальные условия одинаковы — каждая страница весит единицу и содержит одну исходящую ссылку, то в каждой паре перейдет вес (1/1) = 1
Теперь получаем конечный результат:
А = 1 + (1-0,85) + 0,85(1/1) = 2
В = 1 + (1-0,85) + 0,85(1/1) = 2
С = 1 + (1-0,85) + 0,85(1/1) = 2

Теперь одинаковые страницы, поставленные в одинаковые условия, получили одинаковый вес. Это уже похоже на правду. Кроме того, с какой бы пары мы ни начали считать, мы всегда получим один и тот же результат.

Однако, как мы видим, вес страниц у нас вырос. И чтобы удостовериться в правильности результата, мы должны посчитать еще раз. Только теперь в качестве стартовых значений возьмем полученный нами вес.


А = 2 + (1-0,85) + 0,85(2/1) = 3,85
В = 2 + (1-0,85) + 0,85(2/1) = 3,85
С = 2 + (1-0,85) + 0,85(2/1) = 3,85

Веса опять увеличились. Считаем еще раз:
А = 3,85 + (1-0,85) + 0,85(3,85/1) = 7,27
В = 3,85 + (1-0,85) + 0,85(3,85/1) = 7,27
С = 3,85 + (1-0,85) + 0,85(3,85/1) = 7,27

Мы можем считать до бесконечности, и каждый раз веса будут увеличиваться. Вот один такой круг расчета называетсяитерацией. Чем больше итераций, тем ниже погрешность расчетов.

На нашей простой модели этого не видно, но давайте возьмем любой пример из статьи. В каждом примере считают по две итерации. Посчитайте самостоятельно третью и четвертую итерации. Но для начала зафиксируйте соотношение весов двух любых страниц. Просто возьмите вес одной страницы и разделите его на вес другой страницы. Зафиксируйте полученное значение. Посчитайте третюю итерацию и опять разделите веса этих двух страниц. Зафиксируйте значение. Посчитайте четвертую итерацию и опять возмите соотношение весов. Вы увидите, что это соотношение с каждой итерацией будет меняться все меньше и меньше. Это и есть снижение погрешности.

Однако в сети огромное количество ссылок. Если начнем считать все, да по несколько итераций, то получим просто невообразимые значения.

Чтобы не ворочать огромными цифрами, поисковики не суммируют вес, полученный по ссылкам, с собственным весом страниц, а заменяют его. Опять же в статье об этом есть комментарий №8 от Садовского.

Он гласит:
Одно из основных отличий демонстрационного MiniRank от настоящего PageRank в том, что вычисленный на новой итерации вес добавляется к весу страницы, полученному во время предыдущей итерации, в то время как в PageRank новый вес заменяет старый.

То есть поисковики вес, полученный на предыдущей итерации, попросту выкидывают, а на его место подставляют вес, полученный на текущей итерации.

Как это выглядит в нашем примере:
Мы посчитали, что на первой итерации в каждой паре передается единица веса. Теперь мы стартовый вес выкидываем и на его место подставляем вес, полученный по ссылкам:


А = (1-0,85) + 0,85(1/1) = 1
В = (1-0,85) + 0,85(1/1) = 1
С = (1-0,85) + 0,85(1/1) = 1

А теперь сравните этот расчет с предыдущим:
А = 1 + (1-0,85) + 0,85(1/1) = 2
В = 1 + (1-0,85) + 0,85(1/1) = 2
С = 1 + (1-0,85) + 0,85(1/1) = 2

У нас из расчета исчез собственный вес страницы. Таким образом, мы вернулись к изначальному виду формулы:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

Сколько бы итераций мы ни считали, мы всегда будем получать единицу. Поскольку результат у нас всегда остается одним и тем же, то его можно считать верным.

При замене веса от итерации к итерации формула получает свойство, именуемое «сходимость». Это значит, что результат расчета всегда будет стремиться к определенному значению.

Скачайте файл «Расчет с суммированием и без».
В файле представлена простая модель, состоящая из 4 страниц и два варианта расчета.

В колонке «начальные значения» попробуйте поочередно менять единицы на 2, 3, 4... 100.
И смотрите как меняются веса при разных вариантах расчета.
При суммировании веса постоянно растут, а при замене - стремятся к 0,26

Таким образом получается, что с какого бы места мы ни считали, с какими бы стартовыми значениями ни начинали расчет, мы всегда придем к определенному значению.

Такой подход дает возможность поисковикам не только избавиться от многозначных чисел в расчетах, но и позволяет обсчитывать сеть кусками и потом эти куски «склеивать».

На этом с теорией покончили :) Если у вас остались вопросы, просто что-то непонятно, то вы всегда можете обратиться ко мне за помощью


 

Практическое занятие №1

Переходим к практике

Скачайте бесплатную программу Page Weight Lite (даже если у вас уже есть более продвинутая версия Desktop, то все равно скачайте).

Теперь скачайте учебный файл example_1 и откройте его в программе. Перед вами появится скан сайта:

Немного о структуре данного сайта. Есть несколько страниц (строки с 1 по 9), ссылки на которые присутствуют в сквозном меню.

Сквозная ссылка - это ссылка, которая идет «насквозь» через весь сайт, т.е. она присутствует на каждой странице сайта. Соответственно, сквозное меню - это меню, состоящее из сквозных ссылок. Как правило, сквозным является меню с навигацией по основным страницам сайта - «Главная», «Контакты», «Услуги» и т.п.

Есть каталог статей — 10 строка, который ссылается непосредственно на сами статьи — строки с 11 и ниже. Статьи, в свою очередь, содержат ссылки сквозного меню.

Рассчитаем вес. Жмем кнопку «Расчет веса», выставляем 6 итераций и считаем. Количество итераций может быть любое. Уже на двух итерациях видно разницу в весе. Но чем больше итераций, тем ниже погрешность. Шесть итераций — оптимально достаточное количество.

Итак, расчитали веса. Как видим, наибольший вес приходится на страницы сквозного меню. Это логично — на них ведет наиболее количество ссылок.
На данном сайте продвигалась главная страница. Но большой вес имеют и страницы, которые, с точки зрения продвижения, нам не нужны. Например, страница «Контакты». Попробуем отнять у неё вес.

Двойной клик по 9 строке. В открывшемся окне - слева вверху - список страниц, которые ссылаются на страницу «Контакты». Выделяем все ссылки, кроме ссылки с главной страницы, и жмем delete на клавиатуре. При выделении не цепляйте крайний левый столбец, иначе удалить не получится.

После удаления жмем кнопку «Закрыть». Теперь у нас на страницу «Контакты» ведет только одна ссылка с главной страницы. Эту ссылку мы оставили для того, чтобы роботы поисковиков смогли найти и проиндексировать эту страницу.

Рассчитаем вес опять. Не забудьте выставить 6 итераций при расчете.
То, что мы сейчас сделали, называется «режим моделирования». Мы внесли изменения в ссылочную структуру сайта, не внося изменений на сам сайт. Соответственно, колонки «Условный вес» и «Условный вес 2» - это веса до и после моделирования.

Сравниваем значения в этих двух колонках. Во-первых, смотрим как изменился вес страницы «Контакты». Он упал, и упал значительно. Со 150 единиц до 19, что логично: мы сняли почти все ведущие на страницу ссылки. Далее смотрим, как изменился вес главной страницы, вес на статьях - на всех страницах вес увеличился. Таким образом, тот вес, который мы отняли у «Контактов», пропорционально растекся по всему сайту.

ВНИМАНИЕ! Обязательно сохраните получившийся результат под новым именем! Он нам понадобится на следующем практическом занятии.


 

Практическое занятие №2

Эксперимент номер два. Попробуем часть статей залинковать в кольцо.

Откройте файл, который вы сохранили после первого эксперимента.


Двойной клик по 11 строке. В открывшемся окне - слева внизу - выпадающий список: «Добавить ссылку со страницы», «Куда».
Там выбираем следующую 12 строку - «С чего начинается ремонт» ( S-chego-nachinaetsya-remont.shtml).

Жмем кнопки «Добавить» и «Закрыть»

Теперь у нас в колонке «Ссылки, ведущие со страницы» в 11 строке стоит 10 ссылок.

Теперь точно так же ставим ссылки с 12 на 13, с 13 на 14, с 14 на 15 строки. А вот с 15 ставим обратно на 11. Должно получиться так:

Считаем вес и сравниваем колонки «Условный вес 2» и «Условный вес 3». Не забудьте при расчете выставить 6 итераций!

Как видим, вес страниц, залинкованных в кольцо, вырос. Вместе с ним немного подрос вес страниц сквозного меню. А вот вес остальных статей, начиная с 16 строки и ниже, упал.
Получается, что залинковав страницы в кольцо мы оттянули вес с других страниц сайта.

То, что мы сейчас наблюдали, называется «эффект обратной связи». Сайт как дерево — дергаешь за одну ветку, а качаться начинают все. Только где-то это ярко выражено, а где-то почти незаметно.

Так и тут, добавляя или удаляя всего одну ссылку, мы влияем на распределение веса по всему сайту. Собственно, перелинковка - это не ссылки как таковые и не схемы.

ПЕРЕЛИНКОВКА - ЭТО ПРОЦЕСС ПЕРЕРАСПРЕДЕЛЕНИЯ ВЕСА.Мы нагоняем вес на продвигаемые страницы, так или иначе снимая его со страниц, которые в целях продвижения нам не нужны.

Главное правило перелинковки:

Как бы мы ни линковали, суммарный вес всех страниц сайта остается неизменным при условии, что неизменным остается и количество страниц.Если где-то вес прибавился, то где-то он обязательно упадет.
Не зная или игнорируя это правило, очень часто получают просадку в ТОПе, просто случайно сняв вес с продвигаемых страниц.


 

Практическое занятие №3

И так, напомню еще раз:

ПЕРЕЛИНКОВКА - ЭТО ПРОЦЕСС ПЕРЕРАСПРЕДЕЛЕНИЯ ВЕСА.Мы нагоняем вес на продвигаемые страницы, так или иначе снимая его со страниц, которые в целях продвижения нам не нужны.

Главное правило перелинковки:

Как бы мы ни линковали, суммарный вес всех страниц сайта остается неизменным при условии, что неизменным остается и количество страниц.Если где-то вес прибавился, то где-то он обязательно упадет.
Не зная или игнорируя это правило, очень часто получают просадку в ТОПе, просто случайно сняв вес с продвигаемых страниц.

Чтобы убедиться в этом, давайте проведем третий эксперимент. Откройте в программе заново файл example_1 и сделайте начальный расчет на 6 итерациях. Если вы сохранили этот файл с предыдущими расчетами, то просто скачайте его заново. Нам нужен «чистый лист».

Если в первом эксперименте мы отнимали вес у страницы «Контакты», то сейчас поступим наоборот — перенаправим весь вес этой страницы на главную.

Двойной клик по 9 строке. В открывшемся окне - справа вверху - список исходящих ссылок страницы «Контакты». Удаляем все ссылки, кроме ссылки на главную.

Опять считаем на 6 итерациях и сравниваем веса.

По сравнению с первым экспериментом, мы получили гораздо больший прирост веса на главной странице. Однако вес остальных страниц упал. И если бы мы двигали не только главную страницу, но и какую-либо из внутренних, то получили бы просадку этих страниц в ТОПе.

Откровенно говоря, предсказать изменение веса при добавлении или удалении ссылок почти невозможно. Именно поэтому и создавалась в свое время программа — чтобы наглядно видеть, как меняется вес, куда он перетекает и какой эффект это дает. Например в третьем эксперименте, когда мы статьи залинковали в кольцо, вес главной у нас подрос. Это скорее исключение. Как правило, при линковке нижних уровней вес верхних падает.

Поэтому, прежде чем что-либо линковать на сайте, настоятельно советую сделать модель и посчитать её в программе. И когда модель будет вас удовлетворять, то можно переносить её на сайт.

И если в программе мы просто добавляем и удаляем ссылки, то при работе с сайтом есть некоторые правила, о которых вы узнаете из следующего урока.


 

 

Последнее изменение этой страницы: 2016-07-23

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...