SEO Sitemap

Предполагам, че сте чували думата сайтмап (анг. sitemap – карта на сайта). Сайтмап е списък със страниците на даден уеб сайт. Картата на сайта е изключително важна предпоставка за по-лесното и по-бързо индексиране на страниците в сайта. Използвайки sitemap вие помагате на търсещите машини да открият страниците от вашия сайт и да ги вкарат в техния индекс.

Сайтмап-а е  документ със специфично описание на всеки URL (страница) от вашия сайт. Използвайки го търсещите машини могат да достигнат до страници и ресурси, които не са достъпни по нормалния начин, чрез браузване или ресурси, към които водят различни скриптове, неразбираеми за търсещите машини.

Структура на сайтмап

Структурата на сайтмапа като XML документ е следната:

sitemap

Елементи на сайтмапа

<urlset> – присъствието на това поле в сайтмапа е задължително. То съдържа всичката информация за сайтмапа освен xml версията на документа т.е. цялата информация в сайтмапа с изключение на  „xml version“ тага трябва да е затворена между таговете <urlset> и </urlset>.

<url> – Този таг е родителския таг за всеки URL описан в сайтмапа, като всички останали тагове за всеки URL са затворени между <url> и </url>. Този таг задължително трябва да присъства в сайтмапа за всеки от описаните URL-и.

<loc> – Задължителен таг, който съдържа информацията за тoчния адрес на дадената страница(URL). Също така този таг съдържа и протокола, по който се намира страницата например http://, https:// и т.н, както и някои специфични знаци например наклонената черта на края на URL-а ако хостинг доставчика го изисква. Максималната дължина на съдържанието на този таг е 2048 знака.

<lastmod> – Това е първия незадължителен таг за всяка страница описана в сайтмапа като той описва кога последно е променена конкретната страница, като формата на датата може да бъде, както точния ден и час на промяна така и просто датата, на която документа(страницата, файла) е променен.

<changefreq> – Този таг не е задължителен и е индикатор колко често се променя описваната страница. Например ако страницата, която описваме се променя веднъж седмично то стойността на този таг ще бъде weekly, докато ако документа се променя всеки път, когато някой го отовори тогава стойноста на тага ще бъде always. Този таг описва честотата на обновяване на страниците като той служи като ориентир за търсещите машини за да могат те да не обикалят по много пъти едни и същи страници, които така и така няма да бъдат променени. Възможните стойности на този таг са:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

<priority> – Този таг определя приоритета на описваната страница спрямо другите страници от същия сайт. Това е в помощ на уебмастърите, защото по този начин те могат да определят и да подскажат на търсачките кои от описаните страници са по-важни за индексиране по-напред и кои могат да почакат. Този таг не е задължителен.

Сайтмап индекс файл

Сайтмап индекс файла има разширени функции и позволява в него да бъдат описани и събрани на едно място няколко сайтмапа например от различни поддомейни на един главен домейн. Максималният размер на сайтмап индекс файла е 10 MB (мегабайта) или 50 000 URL-а(описани страници), като това е много подходящо за използване при големи сайтове с много страници и поддомейни. При сайтове с много поддомейни сайтмап индекс файла е от много голяма помощ като използван в комбинация с файла robots.txt той позволява да бъдат индексирани отделните сайтмап-ове от различните поддомейни.

Други формати за сайтмап

Сайтмапа може да бъде и обикновен текстов файл с връзки, към страниците на сайта, който искаме да бъде индексиран, като за този текстов файл важат изискванията описани по-горе за xml сайтмап. Важно е да се знае,че енкодинга на сайтмап файла трябва да бъде UTF-8 и както описахме по-горе трябва да се спазват изискванията за големина и брой описани URL-и.

Хранилка за синдикиране

Хранилката за синдикиране е сходна на хранилката за новини, просто през нея се подават URL-ите за синдикиране.

Сайтмап и robots.txt

При използването на сайтмап една от тънкостите, които можете да използвате за по-лесното намиране на сайтмапа от търсещите машини е добавянето на адреса на сайтмапа във файла robots.txt, който се намира в главната директория на вашия сайт. Добавянето става като на нов ред в robots.txt напишете следното:

sitemap: http://adresa-na-vashia-sait.com/adresa-na-saitmapa.xml  или един по-разбираем пример

sitemap: http://dir.bg/sitemap.xml

След като създадете seo sitemap за своя сайт за да е по-лесно за търсещите машини да намерят самия сайтмап, както и последващото намиране и индексиране на страниците от вашия сайт е да добавите адреса към своя генериран сайтмап на нужните места в търсачките:

Адрес за добавяне на сайтмап в Google.com – http://www.google.com/webmasters/tools/ping?sitemap={адреса на вашия сайтмап}

Адрес за добавяне на сайтмап в Yahoo.com – https://developer.yahoo.com/api/{адреса на вашия сайтмап}

Адрес за добавяне на сайтмап в Ask.com – http://submissions.ask.com/ping?sitemap={адреса на вашия сайтмап}

След като добавите вашия сайтмап в търсещите машини те го изтеглят и според алгоритмите си индексират страниците описани в него. Хубавото на Google Webmaster Tools е, че при открита грешка в sitemap ви известява и можете на време да предприемете нужните действия за да може всички адреси от сайтмапа ви да бъдат индексирани.  Друг плюс на същото приложение е, че можете да въведете повече от един сайтмап за един и същи сайт, което значително облечкава работата със поддомейни и работата на сайтове с много страници. В този случай – Google Webmaster Tools играе ролята на сайтмап индекс и вие просто трябва да добавите адресите към вече генерираните файлове.

Никъде няма писано правило, че един сайт задължително трябва да има сайтмап, но за всеки професионален seo оптимизатор сайтмапа трябва да бъде задължителен инструмент за подобряване на оптимизацията на сайта, по който се работи.

В зависимост от платформата на вашия сайт – визирам joomla, wordpress и други готови системи има различни инструменти плъгини, добавки и т.н. за генериране на сайтмап. Единственото, за което трябва да внимавате, когато си избирате добавки за генериране на сайтмап е дали програмата, плъгина, добавката и т.н. поддържат кирилица, защото от опит мога да ви кажа,че при работа с Joomla,  някои от добавките за генериране не се държат много добре с URL-и на кирилица. Също при Joomla ако се използва sh4040SEF трябва да внимавате и да инсталирате нужния плъгин за екстеншъна за сайтмап, който ползвате. Ако използвате WordPress за платформа на вашия сайт добавката, която мога да ви препоръчам и използвам на собствените си сайтове за генериране на карта на сайта е Google XML Sitemaps можете да си свалите добавката от тук –  http://www.arnebrachhold.de/redir/sitemap-home/ до тук не съм имал проблеми от никакво естество с нея – просто качвате плъгина, активирате и това е.

Ето и няколко полезни връзки свързани със сайтмап:

Безплатно генериране на xml сайтмап – http://www.xml-sitemaps.com/

Безплатна програмка за генериране на сайтмап –   http://gsitecrawler.com/en/download/

Разнообразни програми за генериране на сайтмап – https://code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki