Google Sitemap
21 Авг 2007Google Sitemap — это один из довольно интересных инструментов от Google для веб-разработчиков, позволяющих в какой-то степени влиять на индексацию своих сайтов. Про то, что это такое и зачем это надо подробно написано самими разработчиками. «Скормить» sitemap консоли Google можно в четырёх форматах:
- Sitemap. Это созданный Google открытый XML-протокол.
- OAI-PMH — это инфраструктура взаимодействия на основе сбора метаданных. Не стоит это курить, я думаю.
- RSS-поток — каналы в формате RSS 2.0 и Atom 0.3.
- TXT — простой текстовый файл, содержащий один URL в каждой строке.
Сам Google рекомендует использовать первый вариант, так как он наиболее информативен для его пауков. Текстовый файл несет слишком мало информации, а OAI-PMH это что-то сугубо спецефическое. Интерес представляет возможность обработки RSS, особенно в свете покупки Google сервиса FeedBurner, обрабатывающего RSS-потоки.
Об этом сейчас ведутся очень активные обсуждения, ставятся эксперименты, но делать выводы пока рано. Хотя быстрая индексация страниц сайта, отправленных RSS-потоком в FeedBurner, была замечена многими. Но тут есть один момент: для больших сайтов не получится транслировать в RSS все страницы, обычно это делается только для новых. Поэтому оптимальным мне кажется использование RSS одновременно с традиционным Sitemap.
Простейший файл с одним элементом и без необязательных параметров в формате Google Sitemap выглядит так:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://zhilinsky.ru/</loc>
</url>
</urlset>
Для его автоматического создания есть большое количество онлайн-сервисов. Например, довольно простые пауки:
Комплексный онлайн-сервис с максимальной функциональностью:
А вообще есть официальный Sitemap-генератор от Google почему-то на языке Python и его неофициальный порт на язык PHP — PhpSiteMapNG. Для многих CMS существуют соответствующие плагины, Google Sitemaps для WordPress, например.
Причем есть мнение, что лучше использовать именно rss-канал, нежели google sitemap, ибо первый индексится быстрее. Пока не проверял, но думаю стоит попробовать.
RSS — быстрее, а Sitemap — полнее, поэтому и пишу, что лучше заюзать всё ;-)
Отлично, интересно, захватывающи :)
Но не забывай что помимо сервисом есть ещё сами языки на которых делают сайт, вот про них бы чего написал :) гы — как из далеко подошел к просьбе написать пару постов про АЯКС + ПХП :)
Да уже не знаешь чтор и писать про них — иногда кажется, что всё уже сказано =)
Да и я перегружен сейчас — переезд + Chaos Constructions + новые проекты на работе, на которых на Xhtml + JS приходится писать больше, чем на PHP…
Оффтоп:
Зачем такие ужасные ссылки, через http://zhilinsky.ru/out.php, неужели жалко PR для сайтов и сервисов о которых пишите? Благодаря всплывающей подсказке это сразу бросается в глаза.
Это своего рода эксперимент на самом деле. Попытка контроллировать баланс ссылок на странице.
А делиться пока нечем =)
Надо наверное скрыть это в подсказках ;-)
О, готово :-D
> Попытка контроллировать баланс ссылок на странице.
Я чесно говоря не понял, что это значит, но контролировать ссылки имхо лучше с помощью Google Analytics, в том числе и внешние, посмотрите статью: Продвинутое использование Google Analytics.
Уведомление на email мне так и не пришло, почему-то, хотя сейчас отображается «Управление подпиской».
Предварительный просмотр комментариев не помешал бы, могу поделиться своим, если делать не хочется.
Под контролировать я имел в виду учитывать баланс входящих и исходящих, не позволяя утекать с блога всем показателям и оптимизируя процесс раскрутки.
А статью я конечно читал, хотя есть на этот счёт соображения, связанные с производительностью и скоростью работы сайта с такими фокусами :-D
Сорри, уведомление нашел, GMail отфильтровал его как спам.
Если будет время проведу измерения, но визуально разницы не заметно, какой именно момент вызывает ваши подозрения.
[…] Как скормить страницы вашего сайта поисковым системам? Об технологиях создания карт сайтов, а именно о работе с инструментом Google Sitemap и сопутствующими инструментами. http://zhilinsky.ru/2007/08/21/sitemap/ […]
А можно ли в файл помимо ссылки добавить описание странички как на это отреагирует бот ?
Тогда лучше ему не sitemap отдавать а RSS-ленту. Реагирует имхо одинаково пофигистично =)
[…] Инструкция по работе с Google Sitemap. […]
Простой и удобный «рускоговорщий» генератор SiteMap: http://htmlweb.ru/analiz/sitemap.php
А как скормить googlю rss канал? В инструментах вебмастера не видел такого окна!
Господа, теперь и Яндекс принимает Sitemap!
Хочу попробовать это все установить на полу-готовом портале только не знаю как. Хотелось бы найти полный мануальчик по ним. А то генерируешь на каком-то веб генераторе и получаешь файл сайт-меп но с кучей непонятных ссылок, которые к твоему сайту не имеют никакого отношения. — Хочу разобраться в самой кодировке протокола сайт-меп. Если есть сбросте ссылку [email protected] — заранее спасибо.