Дизайн - Meta-тэги
Любая поисковая система представляет собой огромное хранилище информации. Собирают эту информацию специальные роботы - так называемые Spiders (пауки-ползуны) или Bots. Они ползают по узлам всемирной паутины и собирают информацию о каждом из них. Периодически робот возвращается на свой сервер и отдает ему собранную информацию. Там эта информация приводится в надлежащий вид, заносится в специальную базу данных и после этого может быть найдена пользователем поисковой системы.
Собственно говоря, сама регистрация в поисковике заключается в том, что робот получает приказ в ближайшее время проиндексировать данные о вашей странице. Иногда для этого требуется достаточно длительное время - до месяца.
Любой робот, как известно, - туповатое создание, поэтому вам необходимо оказать ему посильную помощь. Делается это посредством параметров "KEYWORDS" и "DESCRIPTION" тэга META. Вы должны вставить в HTML код страницы такие примерно строки:
<HEAD>
.......
<META NAME="KEYWORDS"
CONTENT="Здесь указываются (через запятую)
ключевые слова">
< META NAME="DESCRIPTION"
CONTENT="Здесь содержится краткое описание
вашего сайта">
.......
</HEAD>
Ключевые слова повышают вероятность того, что "паук" внесет в базу данных поисковой машины не первые предложения или какой-либо другой кусок текста с ваших страниц, а именно те слова, которые вы напишете и которые в наибольшей степени будут соответствовать содержанию вашей страницы. Рекомендуется вводить не более 20-30 ключевых слов.
Основная проблема поисковых систем - в их базах данных содержатся сотни тысяч документов. В результате после каждого запроса пользователю выдается огромный список сайтов, в которых найдено что-либо общее с его запросом. Вероятность же того, что ваш ресурс будет находиться в начале этого списка, обычно чрезвычайно мала, а кто же станет искать вас в гуще многочисленных документов, если вы значитесь там, скажем, под номером 2999? Таким образом, ваша задача - добиться того, чтобы ваш ресурс показывался одним из первых.
Что для этого нужно? Вот список советов по этому поводу:
- Ваши ключевые слова должны быть уникальными, т.е. не общеупотребительными. Например, не следует писать слова "сайт", "интернет", "Россия" и тому подобное. И наоборот, например, слово "экскаватор" будет очень полезно :) Если хотите, сходите на www.rambler.ru/top.shtml.ru или www.agama.ru/WINP/aport/wrd100.htm - там вывешены 100 самых популярных слов в поисковых запросах Рамблера и Апорта. Конечно, народу больше всего интересен секс и порно, но есть и популярные "приличные" слова - например реферат, москва, работа, знакомство, и т.п.
- Если тема вашего сайта никак не связана с вашими ключевыми словами, вы рискуете своей репутацией и в конечном итоге - количеством постоянных посетителей. Поэтому вводите только слова "по теме"
- Обратите внимание на заголовок своего сайта, т.е. то, что содержится между тэгами <TITLE> .... </TITLE>. Для всех поисковых систем этот тэг пользуется приоритетом перед keywords и description. Это значит, что если, допустим, слово "бесплатно" расположено в заголовке, то такой сайт появится в списке ресурсов, выдаваемых при запросе со словом "бесплатно", раньше сайта, у которого слово "бесплатно" указано в ключевых словах, но не указано в заголовке. Поэтому позаботьтесь о том, чтобы наиболее полно описать свой сайт уже в заголовке и даже поместить туда основные ключевые слова. Только не стоит делать его слишком длинным, подумайте о тех пользователях, которые сделают закладку на вас у себя в браузере.
- Некоторые поисковые системы, кстати, в их числе и известный всем Рамблер, вообще не обращают внимания на META-тэги. Вместо этого они заносят в свои базы данных несколько первых фраз индексируемых страниц. Поэтому рекомендуется дать наиболее полное описание свему сайту уже с первых слов описания. По той же причине не следует увлекаться JavaScript'ами в начале документа - существует неприятный вариант, когда в качестве описания вашей страницы пойдут цитаты из скрипта :)
- Обратите внимание на заголовки, т. е. тэги <H1> - <H6>, а также <B> и поля ALT - после тэга <TITLE> в индексы будут включены именно они
- Существует вариант, когда можно писать общеупотребительные слова. Но тогда обязательно необходимо специально "конфигурировать" содержание сайта и META-тэгов под одно конкретное слово. Тут на первое место выходит то, насколько часто встречается это слово в описании вашего документа. Мы рекомендуем вводить такое слово во все возможные места, которые могут быть внесены в индекс поисковой машины. Обычно это (в порядке убывания значимости) <TITLE>, <H1>-<H6>, <META> keywords, <META> description, <B> дальше идет непосредственно текст страницы. Пример сайтов, сконфигуренных под конкретное слово, можете посмотреть в Рамблере, введя в качестве запроса слово "халява", "работа", или "деньги"
- Можно ввести одно из слов несколько раз. Но более 5-6 одинаковых слов вводить не рекомендуется, так как некоторые поисковые системы удаляют из своих баз данных те сайты, на которых одни и те же ключевые слова используются много раз. В "поисковом мире" такое называется СПАМ поисковых систем. К нему же относятся невидимые надписи (под цвет фона) в начале страниц
- И последнее - лучшим примером правильно зарегистрированного сайта (особенно в Рамблере) является каталог List.ru. Если что-то непонятно, загружайте List и смотрите его HTML-код
Существует еще один специализированный параметр тэга META, который служит для управления маршрутом "паука". Это параметр "ROBOTS", он может принимать значения index/noidex, folow/nofollow: index/noindex индексировать/не индексировать текст документа; follow/nofollow следовать/не следовать далее по ссылкам, содержащимся в документе.
Например
<HEAD>
........
<META NAME="ROBOTS" CONTENT="index,nofollow">
........
<HEAD>
В этом случае "паук" проиндексирует содержание страницы, и не пойдет дальше ни по одной из ссылок с данной страницы. Зачем это надо? Ну, например, на данной странице расположены ссылки на полезные ресурсы, которые на вашем сервере не лежат. Неужели вы хотите, чтобы робот ушел по одной из них и тем самым не стал индексировать ваш сайт? Ответ понятен... Словом, тэг этот весьма и весьма полезен. Большинство самых популярных (хотя и не все) поисковых машин его поддерживают.
Упомянем о еще одной тонкости. Некоторые поисковые роботы, например, робот Lycos, не проиндексируют ваш сайт, если в вашей корневой директории нет файла с именем "robots.txt". В таких файлах обычно хранятся "спецуказания" для роботов. Например, если на вашем локальном диске есть некоторые директории, которые индексировать точно не надо, например, /cgi-bin/ и /basedocs/, вы можете сделать себе такой robots.txt:
User-Agent: *
Disallow: /cgi-bin/
Disallow: /basedocs/
В этом случае все роботы (звездочка после Юзерагента, можно написать и конкретого робота) должны будут индексировать ваш сайт, кроме директорий /cgi-bin/ и /basedocs/. Если вам нужно проиндексировать весь сайт целиком, оставьте пустое место после DisAllow: . На естественный вопрос, зачем вообще нужен robots.txt, по нашему разумению, существует такой ответ: некоторые сервера не нуждаются в индексации их содержимого, поскольку иногда присутствие поискового робота мешает обычным пользователям обращаться к серверу. Или как уже было сказано, вам совершенно не нужно, чтобы индексировалась ваша база данных, CGI директория или страница, содержимое которой постоянно обновляется.
Таким образом, теперь вы знаете, как правильно зарегистрироваться в поисковой машине.
Стоит упомянуть о том, что на некоторых сайтах вам предлагают, заполнив одну форму, зарегистрировать вашу страничку во многих поисковиках сразу. Например это можно сделать на сайте Артемия Лебедева http://www.design.ru/free/addurl/. Хотя этот способ наименее трудоемкий, он не даст таких же результатов, какие вы получите, зарегистрировав свою страничку самостоятельно. Объясняется это тем, что большинство искалок плохо относится к такому добавлению.
Идеальный вариант - зарегистрировать каждую страницу своего сайта во всех поисковиках "вручную". Хотя многие поисковые системы обещают, что достаточно ввести только адрес первой страницы сайта, а затем робот проиндексирует все остальные, но реально роботы иногда не доходят до отдельных страниц вашего сайта и их не регистрируют.
|