Релевантность (от англ. relevancy) - это степень соответствия документа запросу. Релевантность не является чем-то, что живет в документе само по себе.
Каждая поисковая система определяет релевантность документа запросу пользователя в соответствии с заложенным в нее алгоритмом. И, хотя алгоритмы у всех разные, ищут поисковые машины примерно одинаково, так как алгоритмы построены на общих принципах.
Основные отличия поисковых машин заключаются не в алгоритмах определения релевантности, а в способах их реализации.
В каталогах сортировку ресурсов обеспечивают люди (модераторы), в их задачу также входит ранжирование ресурсов в соответствии с внутренними правилами каталога. Пример - Яндекс.Каталог, где при ранжировании используется Тематический Индекс Цитирования (тИЦ).
При запросе пользователя поисковая машина каталога определяет релевантность сайтов, исходя из их описания, а затем ранжирует выдачу с учётом оценок модераторов.
На оценку же собственно поисковой системы влияют десятки различных факторов, начиная с имени домена и заканчивая качеством каналов связи.
Факторы, поддающиеся влиянию
Тег <Title>
МЕТА теги, <Keywords>, <Description>
МЕТА тег <Robots>, файл robots.txt (или его отсутствие)
МЕТА тег <Refresh>, при значении близком к нулю
Размер HTML-кода, стоящего перед текстом
Ошибки в коде
Ошибки в тексте
Объем текста
Количество ключевых слов в HTML-документе
Частота вхождения ключевых слов в текст страницы
Удаление ключевых слов от начала текста
Кучность ключевых слов
Точное соответствие ключевой фразе
Выделение ключевых слов. Теги <B>, <H1> – <H6>, <STRONG>
Теги <AREA>, <IMG>
Тег <A>
Теги <STYLE>, <BODY>, <FONT>, <TABLE>
Количество документов на сервере
Количество "качественных" документов на сервере
Количество "мусора" на сервере
Организация ссылок внутри сервера (глубина, охват, количество)
Внешние ссылки на страницы сервера (качество, количество)
Рейтинг и соответствие теме сайтов, с которых идут внешние ссылки
Время жизни сервера (страницы), чем больше, тем лучше
Качество виртуального сервера, на котором размещен ресурс (ограничения трафика, надежность)
Неуправляемые, но важные факторы
Уровень конкуренции по выбранной тематике
Популярность конкурирующих ресурсов
Качество ресурсов по выбранной тематике
Популярность выбранной тематики
Количество спаммеров, атакующих поисковую систему по выбранной тематике
Источник данной информации мне неизвестен. Если Вы знаете автора статьи или сами им являетесь - прошу Вас связаться со мной через страницу "Контакты".
На странице "Книги - бесплатно" Вы можете СВОБОДНО скачать некоторые материалы раздела "Бонус" немедленно.
Комментарии:
Пишет киссельгоф от 2010-12-12, в 05:32:40
Написано просто, ясно, убедительно. Информация к действию...
Ваш комментарий к статье:Правила комментирования:
Поиск по сайту:
Новые статьи прямо в Ваш почтовый ящик!
В каждом выпуске ссылка на БЕСПЛАТНОЕ скачивание одной из книг раздела "Бонус".
Информация к действию...