Интернет (материалы сборника “Бизнес, Секс, Автомобиль...”)

Google Dance

 

Google Dance.


Что такое Google Dance? Примерно раз в месяц Google обновляет свой индекс путем пересчета PageRank каждой страницы. Период, в течение которого происходит обновление, называют Google Dance. В связи с особенностями строения PageRank, расчеты необходимо производить около 40 раз, а так как индекс очень большой, требуется несколько дней для того, чтобы завершить расчеты.

В течение этого периода результаты поиска изменчивы; иногда изменения происходят каждую минуту. Именно из-за этих колебаний был введен термин Google Dance. Обычно Google "танцует" где-то в последней трети каждого месяца.

У Google есть еще два сервера, которые можно использовать для поиска. Результаты поиска по этим серверам также изменяются во время ежемесячного обновления, и они тоже являются частью танца Google. В остальное время в результатах поиска тоже иногда бывают колебания, но не путайте их с настоящим танцем. Эти изменения происходят в связи с "добавочным танцем" (Fresh Crawl) Google и тем, что известно как "Everflux" ("Вечное движение").

На период проверки новых рейтингов во время танца, у Google есть два других поисковых сервера, кроме www.google.com. Это www2.google.com и www3.google.com. Большую часть времени результаты на всех трех серверах одинаковы, но во время танца они отличаются. В течение большей части танца, рейтинги, показываемые на www2 и www3, - это новые рейтинги, которые перейдут на www, когда танец закончится.

Несмотря на то, что расчеты проводятся около 40 раз, окончательные рейтинги можно будет увидеть уже скоро. Причина в том, что во время нескольких первых циклов цифры приближаются к окончательным данным. Это можно увидеть в калькуляторе PageRank, проверив ячейку данных и произведя некоторые расчеты. После нескольких первых циклов результаты поиска на www2 и www3 могут все еще отличаться, но незначительно. Во время танца результаты с www2 и www3 будут иногда появляться на www сервере, но только кратковременно. Новые результаты на www2 и www3 могут ненадолго исчезать. В конце Google Dance результаты на www будут соответствовать результатам на www2 и www3. Здесь есть удобный инструмент для одновременного просмотра результатов со всех трех серверов.

При проверке новых PageRank во время танца, у Google есть семь информационных центров, в любом из которых можно найти PageRank любой страницы. По мере развития танца, информационные центры по очереди обновляются. Перед началом танца все они показывают одно и то же, текущее значение PageRank для данной страницы, но во время танца они по очереди обновляются новыми значениями PageRank. При проверке каждого центра во время танца обнаруживаются новые значения PageRank, по мере их поступления. Если PageRank страницы не меняется, центры, естественно, показывают те же значения.

Как отправить запрос в информационный центр.

Для этого необходимо, чтобы была установлена панель инструментов Google (Toolbar) и включен индикатор PageRank. Каждый раз, когда браузер принимает страницу, Toolbar запрашивает ее PageRank в одном из информационных центров Google. Информация подается в виде текстового файла одной строкой и помещается в папку временных файлов (Temporary Internet Files). URL запроса Toolbar включает URL страницы, для которой необходимо определить PageRank (целевая страница), и контрольную сумму, соответствующую этому URL. Естественно, контрольная сумма должна соответствовать URL целевой страницы.

Пример URL типичного запроса Toolbar:

http://216.239.33.102/search?client=navclient-auto&ch=5150615727&features=Rank:FVN&q
=info:http%3A%2F%2Fwww%2Eexampledomain%2Ecom%2F.

Если вы скопируете и вставите этот URL в ваш браузер, вы получите "запрещенную" страницу Google. Это произойдет потому, что целевая страница и контрольная сумма не соответствуют друг другу - это просто пример URL запроса.

Обратите внимание, что целевая страница в переключенном формате - некоторые знаки представлены шестнадцатеричными кодами (напр., %2F). Чтобы получить новый PageRank для конкретной страницы, необходимо сделать такой же запрос, который делает Toolbar. Т.е., вам нужен URL, который использует Toolbar. К тому же, вам нужно запросить PageRank во всех семи информационных центрах Google. Такой метод занимает больше времени, но он срабатывает. Вот как это делать:

Откройте в браузере какую-нибудь страницу. Это нужно для подтверждения того, что страница и запрос Toolbar по поводу PageRank помещены в папку Temporary Internet Files. Это не нужно делать все время - достаточно одного раза.

Откройте файл index.dat из папки Temporary Internet Files при помощи текстового редактора и произведите в нем поиск целевой страницы. Вы обнаружите весь URL, подобный приведенному выше, на запрос Toolbar по поводу PageRank. ВНИМАНИЕ: поскольку целевая страница утеряна в этом URL, ищите только неутерянную часть, напр. "exampledomain".

Найдя URL, скопируйте его и вставьте в адресную строку браузера, а затем нажмите Return или кликните Go. Если страница находится в директории Google, в полученной строке будет содержаться путь директории. Последний элемент в первой части строки - это значение PageRank на Toolbar для целевой страницы. Чтобы увидеть, как новый PageRank страницы передается по центрам во время Google Dance, используйте тот же URL, но замените IP-адрес каждым из семи информационных центров. Это также неплохой способ проследить развитие танца в общем.

Информационные центры.

216.239.33.100
216.239.35.100
216.239.37.100
216.239.39.100
216.239.51.100
216.239.53.100
216.239.55.100

СОВЕТ: Если хотите проверять эти же страницы во время следующих танцев, сохраните URLы в текстовом документе, чтобы не нужно было каждый раз снова искать их в папке Temporary Internet Files.

Танец Google

Автор: Фил Крэвин - Webworkshop
Перевод: WebmasterPro

Оставьте свой комментарий к статье!


Комментарии:

Комментариев еще нет. Вы будете первым!



Ваш комментарий к статье: Правила комментирования:

Имя (обязательно)
E-mail (не показывается, обязательно)
Защита от спама: введите сумму цифр 8+7= ? (обязательно)


Поиск по сайту:







[ В раздел ]

[ Главная ] [ Разделы сборника ] [ Контакты ]
Copyright © 2007 - 2024 by Геннадий Нестеров