Делаем правильную карту сайта sitemap.xml

Создаем карту сайта sitemap.xml

Что такое sitemap.xml?

Sitemap.xml — это файл формата xml, содержащий в себе информацию о структуре сайта. Располагается он в корневой папке сайта наряду с robots.txt и доступен по ссылке example.ru/sitemap.xml.

Расположение sitemap.xml

Зачем нужна карта сайта?

Карта сайта нужна исключительно для поисковых систем. При обращении к сайту, индексирующий робот загружает sitemap.xml и получает список страниц, которые необходимо занести в базу. Для того, что бы краулеру проще было найти карту, ссылка на нее добавляется в robots.txt в инструкцию «Sitemap:».

Ссылка на карту сайта

Кроме списка страниц, робот также получает информацию о последнем изменении и приоритете. Это позволяет сократить время сканирования и практически исключить ошибки.

В последних версиях Яндекс Вебмастера карте сайта уделяется особое внимание. При ее отсутствии или наличии ошибки появляется предупреждение.

Ошибки в sitemap.xml

Создаем корректный sitemap.xml

Существует три варианта создания sitemap.xml — вручную, при помощи online-генератора и автоматически используя плагин.

  • Создание вручную.

    Самый олдскульный метод. Карта создается в обычном текстовом редакторе, после чего сохраняется в формате xml. Все страницы, даты и приоритеты выбираются самостоятельно.

    Плюсы: Добавление в карту только того, что Вы считаете нужным. «Уверенность в каждой строчке»;

    Минусы: Большой объем работы. Есть вероятность что-то забыть. Риск синтаксических ошибок;

  • Используем online генератор.

    Существуют онлайн генераторы, которые создают карту автоматически. Они чем то похожи на индексирующего робота, который обходит сайт и собирает страниц. При этом  учитываются все инструкции robots.txt. В итоге Вы получаете файл формата .xml со всеми разделами, которые не запрещены к индексации.

    Приоритеты в таком случае расставляются в зависимости от вложенности страницы. Дата изменения, обычно, у всех одна и соответствует времени создания карты.

    К подобным сервисам можно отнести такие сайты, как: www.mysitemapgenerator.com, www.cy-pr.com/tools/sitemap.

    Плюсы: Экономит время. Исключает синтаксические ошибки;

    Минусы: Зачастую собирает много «мусора», который не должен быть в индексе. Необходимо вручную размещать на сайте;

  • Используем плагин.

    Наверное, самый удобный и технически корректный способ. Смысл его заключается в том, что в систему управления устанавливается плагин/виджет/модуль, который автоматически генерирует sitemap.xml.

    Плюсы: Карту не нужно загружать, она автоматически обновляется при создании новых разделов. Вы можете выставить вручную приоритет для каждой страницы во время ее создания. Корректная дата изменения страницы;

    Минусы: Плагины есть не для всех CMS;

    К подобным плагинам можно отнести XML Sitemap & Google News feeds. (для WordPress)

А теперь подробнее рассмотрим процесс создания карты.

Обратите особое внимание! Если сайт имеет защищенное соединение, то URL в карте сайта должны быть обязательно с https.

Из чего состоит sitemap.xml

Sitemap состоит из структурированных xml данных и содержит в себе несколько параметров.

  1. URL раздела;

    Заключается в теги <loc></loc> и является обязательным для любой карты.

  2. Дата последнего изменения;

    Заключается в теги <lastmod></lastmod> и является необязательным параметром.

  3. Вероятная частота изменения;

    Заключается в теги <changefreq></changefreq> и является необязательным параметром. Имеет несколько значений: alwayshourlydailyweeklymonthlyyearly и never. Если перевести значения с английского, то сразу станет понятным, какое нужно именно Вам.

  4. Приоритетность;

    Заключается в теги <priority></priority> и является необязательным параметром. Принимает значения от 1.0 до 0.1.

Все эти данные должны находится внутри инкапсулирующего тега <urlset></urlset>, который указывает на стандарт протокола.

После вышеупомянутого тега идет <url></url>. Он является родительским элементом для каждого URL.

Выглядит это следующим образом:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>https://dh-agency.ru/</loc>
      <lastmod>2016-12-23</lastmod>
      <changefreq>daily</changefreq>
      <priority>1.0</priority>
   </url>
   <url>
      <loc>https://dh-agency.ru/perevod-na-https/</loc>
      <lastmod>2017-04-08</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.9</priority>
   </url>
</urlset>

На примере мы указали данные для двух конкретных URL.

Какие страницы добавлять

Добавлять в карту необходимо только те страницы, которые Вы хотите видеть в индексе. Нельзя допускать попадание:

  • дубликатов URL;

  • пустых страниц;

  • разделов находящихся в разработке;

  • другого «мусора».

Если Вы сомневаетесь, должна ли находится страница в поиске, лучше повременить с ее размещением в sitemap.xml.

Какие приоритеты выставлять

Приоритеты выставляются в зависимости от «важности» страниц внутри сайта. Обычно, посадочные страницы имеют самый высокий приоритет (0,9-0,8). Категории ценятся ниже, так как не несут уникальной информации. Их значение обычно варьируется от 0,7 до 0,5. Все что меньше, дается архивам или записям потерявшим актуальность.

Не стоит присваивать всем страницам одинаково высокий приоритет. Это никак не поможет индексации и не повлияет на позиции. Но вот робота Вы можете слегка «запутать».

Что нужно знать о дате изменения страницы

Дата изменения страницы очень важна для поисковой системы. Во многом именно по ней оценивается актуальность материала. Не стоит прописывать одинаковую дату для всех страниц, как это может сделать online сервис.

Всегда указывайте настоящую дату обновления материала.

Понравилась статья? Сделай репост

Добавить комментарий

Войти с помощью: