Что любят поисковые машины – подготовка сайта к индексированию

Общие принципы подготовки документов

Сегодня на многочисленных сайтах, посвященных вопросам поисковой оптимизации, регулярно встречаются советы по оформлению страниц сайтов с целью повысить их ранг в поисковиках. При всем обилии таких советов практически не встречаются какие-либо обобщенные рекомендации. Большинство вебмастеров, как правило, не придерживаются таких правил – причиной тому, как правило, возможности визуализации, предоставляемые действующими стандартами HTML, которые заслоняют для неискушенного человека выгоды следования определённым стандартам оформления.

Как правило, на подобные советы вебмастер начинает обращать внимание уже после создания дизайна сайта и возникает ситуация, не раз описывавшаяся на форумах и хорошо знакомая оптимизаторам – дизайн сайта, в лучшем случае, предусматривает размещение нескольких баннеров для баннерообмена, но не абсолютно не приспособлен для размещения ссылок или каких-то специальных тегов, которые бы помогли продвижению сайта в поисковиках.

Между тем основные принципы подготовки документов для «хорошей» их индексации поисковыми машинами вовсе не предполагают уродования «крутого» дизайна сайта. Более того, как правило, они помогают улучшить usability дизайна.
Добавлю, что эти принципы имеют хорошо известный аналог, не относящийся к языку гипертекстовой разметки, и давно преподающийся в той или иной форме студентам технических вузов. Я имею в виду стандарты подготовки технической и научной документации.

Давайте сравним некоторые принципы оформления научных документов с принципами подготовки веб-страниц.

Как правило, научный труд имеет название, чётко и полно отражающее его содержание. Для оптимизаторов это принцип номер один - использовать ключевые слова в теге <title>

Любая научная статья начинается с введения, в котором излагаются основные проблемы, рассмотренные в ней, и декларируются методы их решения.

Оптимизаторам давно известно, что использование ключевых слов в первой трети документа положительно влияет на релевантность страницы запросу.

Любой научный труд разделяется на подразделы, каждому из которых даётся свое название, также чётко отражающее содержание раздела. Более того, как правило, такое название выделяется шрифтом. У оптимизаторов есть аналог и для этого принципа -использование тегов Heading.

Наконец, любой научный труд снабжается списком использованной литературы, а ни для кого не секрет, что идея Link Popularity появилась именно для реализации этого принципа среди веб-сайтов.

Косвенным доказательством справедливости этих выводов могут служить факты появления в результатах поиска даже по многим конкурентным запросам старых страниц, созданных в т.н. «академическом» стиле, который представляет собой как раз классическую схему оформления научных документов.

Полагаю, что правомерным будет сделать вывод о полной применимости указанных принципов в оптимизации страниц для поисковиков.


Основные элементы документа, оформление которых может повлиять на его ранжирование

Перейдем к анализу структуры документа. При проведении этого анализа будут выделены основные элементы страницы, которые могут (обращаю внимание, что только могут) повлиять на её ранжирование в результатах поиска.

Условно говоря, html-документ состоит из следующих элементов:

  • заголовка страницы;
  • служебных тегов (обычно их называют мета-тегами);
  • заголовков блоков текста;
  • текста страницы;
  • изображений;
  • ссылок, как внутренних, так и внешних. Рассмотрим эти элементы по отдельности.

Заголовок страницы

Речь идет о содержимом тега <title>. В рассмотренной нами аналогии - это заголовок документа, статьи. Отсюда и главное требование к его составлению - содержимое тега должно чётко и полно отражать содержание документа. Опытные оптимизаторы знают – кто на личном опыте, кто благодаря анализу поисковых систем, что употребление оригинальных заголовков, составленных в газетном стиле, зачастую не только не даёт требуемого эффекта, но, напротив, только ухудшает ситуацию. В самом деле, заголовок типа «Невиданный прорыв в экономике державы» действует на читателя, но находимости документа скорее поможет текст «Рост ВВП за год составил 10%».

По статистике, примерно половина страниц, выводимых поисковиками на первой странице результатов поиска, имеет ключевое слово в заголовке страницы, что только доказывает, насколько это может помочь ранжированию документа.

Обычно, прикрываясь требованиями usability, рекомендуют прописывать в теге <title>, помимо названия документа, название раздела, в котором находится документ, и название сайта. Я бы воздержался от этого, если только название раздела или сайта не содержит ключевого слова, необходимого в заголовке этой страницы.

Дело в том, что длина заголовка, отображаемого в заголовке окна браузера, ограничена, и, если вы превысите это число, то ревностное соблюдение принципов usability, которые иногда трактуют как необходимость показать пользователю, где он находится, превратится в формальность – ни один пользователь не увидит полного текста заголовка. Показать пользователю, где он находится, следует навигацией на странице – в заголовке же имеет смысл сконцентрироваться на составлении чёткой и, по возможности, краткой фразы.

Рекомендуемая частота употребления ключевого слова в теге <title> – от 10 до 35%, потому не стоит засорять тег лишними словами. В случае же, когда необходимо прописать дополнительную информацию в тег, поставьте основное ключевое слово первым.

Не стоит также сознательно удлинять содержимое тега, заполняя его множеством слов. Это производит плохое впечатление на пользователей и легко вылавливается поисковым сервером – после чего всерьез на хорошее положение страницы можно не рассчитывать.

Служебные теги

Обычно их называют мета-тегами. Я остановлюсь здесь только на двух таких тегах – keywords и description. Остальные, несмотря на уверения большинства начинающих вебмастеров, никогда полнотекстовыми поисковиками не учитывались.

Тег keywords в последнее время стал героем не одной дискуссии на специализированных форумах и в изданиях. Общее мнение в настоящий момент таково, что этот тег перестал учитываться практически всеми полнотекстовыми поисковиками. Вместе с тем, некоторые поисковики, в частности, Яндекс и Altavista, всё же учитывают содержимое этого тега, при условии употребления искомых ключевых слов в тексте страницы.


Общие рекомендации при использовании этого тега таковы:

  • не следует употреблять одно и то же слово несколько раз в этом теге. 1-2 раза будет вполне достаточно;
  • рекомендуемая частота употребления ключевого слова – 5-10%;
  • как и в случае с <title>, слово, для которого оптимизируется страница желательно ставить в начале тега;
  • в общем случае, не следует употреблять слова, не встречающиеся на странице. Вряд ли последуют какие-то меры со стороны поисковика, но плотность ключевых слов всё же должна выдерживаться.

Тег description гораздо более интенсивно используется поисковиками. Во многих поисковых системах именно его содержимое выводится в качестве аннотации страницы, следовательно, есть смысл составить его так, чтобы привлечь внимание пользователя. Общие рекомендации примерно аналогичны рекомендациям для тега keywords, однако есть и отличия. Поскольку здесь используются связные предложения, рекомендуется привести одно-два предложения, общей длиной до 25 слов.

Заголовки блоков текста

Речь идет об использовании для разметки страницы тегов Heading. Давно известно, что поисковики с вниманием относятся к словам, оформленным как заголовки и, в рамках нашей концепции использования стандартов, это неудивительно. Использование заголовков позволяет структурировать текст, улучшить его читаемость. Кроме того, попросту логично в самом начале страницы привести полное название документа, оформленное тегом заголовка высшего уровня, т.е. <H1>. Хотелось бы отметить, что этот тег сам по себе меньше влияет на релевантность, чем &lttitle>, но совпадение его содержимого с содержимым заголовка страницы может очень серьёзно помочь странице занять достойное место в результатах поиска.

Теги более низких уровней логично использовать для разметки названий подразделов документа – в этом случае, текст, оформленный ими, будет учитываться с меньшим весом, чем <H1>, но с большим, чем обычный текст параграфа.

Текст страницы

Выше уже говорилось о принципах правильного построения текста. Два основных требования к тексту страницы:

  • необходимо использовать ключевые слова в первой трети страницы – аналог Введения в научном тексте. Не помешает начать текст с употребления нужного слова;
  • средняя частота употребления ключевого слова в тексте – 3-5%.

Точных данных о размере страницы, разумеется, нет. В данном случае рекомендуется сохранять размер страницы порядка 15-25 килобайт, употребляя от 1500 до 4000 слов в видимой части (т.е. в чистом тексте страницы, без учёта кода разметки).

Иногда встречаются советы использовать для изготовления дорвеев программы автоматической генерации текста с заданной частотой ключевых слов. Механизм их работы прост – в определённый текст вставляется заданное слово, а частота выбирается в зависимости от поисковика. Не советую следовать таким советам – подобные страницы очень легко вылавливаются из общей массы благодаря своей искусственности. Попросту говоря, в тексте, сгенерированном такой программой, ключевое слово будет встречаться с равной частотой в любой части текста – в то время, как в тексте, написанном человеком, частота ключевого слова в разных частях документа будет меняться.

Изображения

Несмотря на существование специализированных поисковых систем для изображений, я вовсе не собираюсь в данный момент акцентировать ваше внимание на их возможности в части привлечения посетителей на сайт. Как правило, доля такого трафика мизерна. Здесь я лишь хочу напомнить о необходимости оформлять изображения на страницах так, чтобы они тоже работали на общую идею оптимизации страницы. В первую очередь, это касается оформления параметра alt для тега <img>.

Нередко приходится встречать изображения, в которых этот параметр либо не прописан вовсе, либо заполнен непродуманно. Между тем, пользуясь нашей аналогией с научным текстом, параметр alt является аналогом названия иллюстрации, которое, в соответствии со стандартом, должно отражать смысл изображения. Не стоит также оставлять без внимания графические элементы страницы, не несущие смысловой нагрузки. Для примера – оптимизация тега <title> и прописывание параметров alt у графических элементов позволили сайту searchengines.ru по запросу «search engines optimization» вот уже несколько месяцев находиться в результатах поиска Google, Yahoo, AOL – в первой тридцатке, в AllTheWeb, Lycos – в числе первых пятнадцати, а в Teoma и WiseNut – в первой десятке сайтов. Причем в Teoma – на втором месте. Разумеется, такое положение сайта не обусловлено только этими факторами, но такой эффект был достигнут только в результате описанных мер.

Потому можно сделать однозначный вывод – пренебрегать содержимым параметра alt в теге <img> нельзя. Составляйте его либо релевантным описанием иллюстрации, к которой он относится, либо повторите в нём содержимое <title>.

Ссылки

Ссылки являются очень важным элементом документа с точки зрения SEO. Именно они обеспечивают перетекания взвешенной ссылочной популярности – будь то ВИЦ или PageRank, – по страницам сайта и по всем документам в WWW. Кроме этого, текст ссылок непосредственно влияет на релевантность запросам той страницы, на которую они ведут. И, наконец, ссылки обеспечивают навигацию по сайтам и поэтому, с точки зрения usability, должны иметь адекватное описание (текст ссылки).

Если исходить из принципов usability, то число ссылок на странице должно быть ограниченным. Подходя к этому вопросу с точки зрения ссылочной популярности, мы обнаружим, что данный вывод справедлив и здесь – меньшее количество ссылок на другие страницы сайта увеличивают долю популярности, которую они получают благодаря этим ссылкам. Поэтому немаловажной для продвижения сайта являются схема навигации по нему, количество разделов на вновь построенном сайте, т.е. структурированность сайта. Этот вопрос будет рассмотрен в следующем разделе, здесь же отметим, что основной рекомендацией в отношении проставления ссылок будет следующая – ссылки должны иметь релевантное описание (т.е. текст ссылки). Это не помешает ранжированию страницы, на которой они находятся, и определённо поможет ранжированию страниц, на которые они ведут.

Организация структуры сайта

Если вебмастер проделал всю работу над документами сайта в соответствии с рекомендациями, приведенными в предыдущем разделе, то результатом его труда станет набор документов – элементов сайта, – подготовленных к индексации поисковыми системами. Следующая задача – собрать эти документы в единое целое, называемое веб¬-сайтом.

На самом деле, как и структура научной работы, так и структура сайта разрабатываются задолго до разработки отдельных их составляющих. Собственно, с разработки структуры сайта и начинается работа над ним.

Продолжая нашу аналогию с научной работой, необходимо сказать, что хорошо спроектированный сайт вполне похож на неё. Он состоит из разделов, внутри которых могут быть подразделы, в свою очередь, последние могут состоять из более мелких логических единиц. Документ, т.е. страница, в данном случае будет выступать элементарной логической единицей.

Вместе с тем, такая структура сайта больше влияет на удобство пользования им. Нас же больше интересует файловая структура, т.е. организация отдельных документов в каталоги и подкаталоги.

Для самых простых сайтов-визиток нет необходимости заводить отдельную директорию для каждого раздела - как правило, раздел состоит из одного документа. Кроме того, ещё действует правило, согласно которому поисковые машины отдают предпочтение документам, если они находятся ближе к корневой директории сайта.

Если же количество документов в разделе увеличивается, или с самого начала составляет число, большее одного или двух, то имеет смысл поместить их в отдельный каталог. Этим достигаются сразу две цели:

  1. Увеличивается удобство навигации по сайту для пользователя - попав в подкаталог, он невольно усваивает систему организации сайта и при затруднениях может просто вводить адрес в строке браузера. Впрочем, это подробно рассмотрено в одной из статей «Руководства» Артемия Лебедева.
  2. Увеличивая путь к документу, мы вовсе не ухудшаем его положение в поисковых системах, напротив, название раздела, соответствующим образом подобранное, может увеличить релевантность страницы целевому запросу.

Следующий совет является развитием предыдущего - организовывая файловую структуру сайта, аккуратно используйте ключевые слова в именах файлов, содержащих документы, и именах каталогов. Наличие ключевых слов в адресе (URL) документа способно повлиять на ранжирование страницы в поисковой системе. Кроме того, осмысленное, имеющее отношение к теме раздела или страницы имя файла или каталога, поможет пользователю при навигации по сайту.

Иногда встречается заблуждение, что увеличение вложенности каталогов сайта отрицательно влияет на величину ссылочной популярности страниц, находящихся в них. Разумеется, это не так. Ссылочная популярность не зависит от глубины вложенности каталогов, она вообще никак не зависит от файловой структуры сайта. Как и полагается, величина ссылочной популярности передаётся по ссылкам, таким образом, если на страницу имеется ссылка с главной страницы сайта, то, независимо от местонахождения страницы физически на сервере, ей передастся максимально возможное значение ссылочной популярности.

Напротив, если между главной страницей сайта и другой страницей минимальный путь состоит из пяти - десяти переходов по ссылкам, то даже нахождение в корневой директории сайта не поможет последней получить значимую ссылочную популярность.

Упомянутое заблуждение во многом вызвано особенностями работы Google Toolbar -небольшого плагина к Интернет Эксплореру, показывающего условное значение PageRank для каждой страницы. Каждый может с лёгкостью убедиться, что при прохождении вглубь каталогов на сайте, индикатор PageRank, как правило, показывает стабильное уменьшение условного значения - так, если на главной странице сайта оно равно 6/10, то в первом подкаталоге его значение уменьшится до 5/10, и так далее. Однако заблуждаться в данном случае не следует. Дело в том, что страница подраздела, для которой Toolbar показывает уменьшенное относительно главной страницы значение PageRank необязательно известна поисковой системе и необязательно имеет рассчитанное для неё точное значение PageRank. Это легко проверить, создав новую тему на любом форуме на основе скрипта UBB -страница темы только что создана, однако Toolbar уже демонстрирует для неё определённое значение PageRank, хотя очевидно, что страница ещё неизвестна Google. В таких случаях Toolbar, как правило, показывает предполагаемое значение PageRank, основываясь как раз на том предположении, что большая глубина вложенности каталогов означает продвижение вглубь логической структуры сайта.

Небольшое замечание, вытекающее из предыдущих выводов: создавая новый раздел, особенно, если в нём мало материалов, не стоит создавать главную страницу раздела, всё содержание которой сведется к паре ссылок на материалы раздела. Эта страница в таком случае станет лишь дополнительным барьером, как для перетекания ссылочной популярности, так и для пользователя. Удобнее и грамотнее будет на первой же странице раздела начать публикацию материалов, а впоследствии реорганизовать раздел по всем правилам.

Хотелось бы также предостеречь от очень частой ошибки при организации структуры сайта – устройства редиректа с index.html на собственно первую страницу сайта. Как правило, это случается, когда используется готовое решение для динамического управления контентом сайта или в случае, когда сайт разрабатывается для красоты, а не для реального продвижения. Подобный приём моментально разоблачает неумение работать с сервером и непродуманность самого сайта. Нет ничего проще использования всего одной директивы сервера для установки в качестве индексной начальной страницы скрипта, но сплошь и рядом используется meta refresh, что приводит к ухудшению впечатления от сайта и не улучшает его положения в поисковых системах. Вывод абсолютно однозначный – первая страница сайта должна выдаваться сразу, без редиректов на стороне клиента, по крайней мере.

Заключение – лучше делать всё правильно с самого начала.
Итак, после выполнения всех рекомендаций, изложенных в данном докладе, мы получим грамотно спроектированный сайт, каждый элемент которого оптимизирован, как для повышения позиций сайта в поисковых системах, так и для повышения удобства им пользования для посетителей.

Осталось лишь добавить – всё вышесказанное является руководством к действию до начала разработки сайта. Переделка готового сайта в лучшем случае выльется в потерю времени и денег, потенциально же неправильно разработанный сайт может даже нанести ущерб имиджу фирмы, а попытки, невзирая ни на что, его раскрутить лишь довершат начатое.






Если вы хотите разместить свою статью или новость - присылайте ее по адресу .