XML-sitemap

Vad är en XML-sitemap, hur använder man den och vad är den bra för? I den här artikeln går vi igenom vad en sitemap är och hur den fungerar, förklarar vad XML står för och hur du skapar en sitemap till din sajt.

Vad är en XML-sitemap (webbplatskarta)?

En XML-sitemap, på svenska webbplatskarta, är en fil som innehåller och listar viktiga sidor på en webbplats. En sitemap underlättar för sökmotorer att upptäcka nya sidor och filer att genomsöka och indexera i sökresultaten. I webbplatskartan kan sökmotorn även få ytterligare information om sidorna, som när de senast uppdaterades och om det finns några alternativa språkversioner.

Webbplatskartan är inget som syns för vanliga användare på webbplatsen utan det är en fil som ligger i roten på servern. Filnamnet på en sitemap kan vara vad som helst, men det vanligaste är att den heter sitemap.xml och återfinns på URL:en: domän.se/sitemap.xml.

En vanlig missuppfattning är att det har en direkt påverkan på ranking att ha en XML-sitemap. Det stämmer inte, utan webbplatskartan är som sagt bara en hjälp för att visa för sökmotorer vilka sidor man tycker är viktiga och som man vill ska synas i sökresultaten.

Vad betyder XML?

XML står för extensible markup language och är ett universellt kodspråk som används inom programmering. XML-formatet omges av taggar (< >) som definierar strukturen och innebörden av data, i det här fallet webbplatsens struktur genom att lista alla URL:er. Nedan följer ett exempel på hur detta kan se ut:

Exempel på en XML-sitemap

För att göra det ännu tydligare så kan vi ta ett annat exempel; nämligen skillnaden mellan HTML och XML. HTML innehåller också data som omges av taggar, men till skillnad från XML så anger HTML utseendet av datan i form av element och attribut. XML anger enbart innehållet i textform.

Med hjälp av XML kan man alltså utväxla data mellan olika informationssystem genom att formatera data till ren text. Det underlättar för sökmotorn att hitta sidorna snabbt och enkelt.

Vad innehåller en XML-sitemap?

Webbplatskartans primära uppgift är att lista viktiga URL:er som man vill att sökmotorer ska hitta, genomsöka och indexera. Tillsammans med URL:en kan man skicka med ytterligare information till sökmotorerna. De vanligaste taggarna som förekommer i sitemaps är:

  • <loc> – Anger URL:en till en resurs
  • <lastmod> – Anger när resursen senast uppdaterades.
  • <changefreq> – Anger med vilken frekvens resursen vanligtvis uppdateras.
  • <priority> – Anger vilken prioritet resursen har.

Det kan vara värt att nämna att Google ignorerar taggarna <changefreq> och <priority>, men använder <lastmod> om datumet är korrekt och verifierbart.

Behöver man verkligen en sitemap?

Det är framför allt stora och komplexa sajter som behöver en XML-sitemap och det är inte säkert att sökmotorn genomsöker och indexerar alla sidor trots att de finns med i en webbplatskarta. De flesta sajter har dock nytta av en XML-sitemap för att säkerställa en effektiv genomsökning av sajtens sidor och filer.

Nedan listar vi några generella riktlinjer från Google kring vilka sidor som kan tänkas behöva en XML-sitemap och vilka som eventuellt inte behöver det.

Behöver sannolikt en XML-sitemap

  • Stora sajter. En webbplats med väldigt många sidor har generellt sett svårare att garantera en optimal internlänkning till alla sidor på sajten. Det kan leda till att Google får svårare att hitta och genomsöka nya sidor om det inte finns en sitemap.
  • Nya sajter med få externa länkar. Google och andra sökmotorer genomsöker webben genom att följa länkar mellan webbsidor. Om det inte finns några länkar till din webbplats så är det inte säkert att Google hittar ditt innehåll.
  • Sajter med mycket medieinnehåll och som använder Google News. Om du har mycket innehåll i form av video och bilder som du vill indexera och ge Google extra information om, samt om du vill synas i Google News så behöver du en sitemap.

Behöver sannolikt inte en XML-sitemap

  • Små sajter. Om din webbplats är liten (färre än 500 sidor som du vill indexera), så kommer sökmotorer sannolikt att hitta och genomsöka alla dina sidor trots att du inte har en webbplatskarta.
  • Sajter med bra internlänkstruktur. Om du kan säkerställa att alla dina webbsidor är internlänkade till varandra på ett fullgott sätt, så kommer sökmotorer hitta dina sidor genom länkarna.

Fastän det inte är kritiskt för alla sajter att ha en webbplatskarta, så är vår rekommendation ändå att alltid ha en. Det är helt enkelt bäst att vara på den säkra sidan när det kommer till att få sitt innehåll genomsökt och indexerat. Webbplatskartan kan också skynda på processen för sökmotorn att hitta och indexera nytt innehåll, vilket ofta är eftersträvansvärt.

Hur skapar man en sitemap?

De flesta moderna CMS har inbyggd funktionalitet för att generera en dynamisk XML-sitemap. Det vill säga att systemet skapar en fil som innehåller de sidor man skapat och om man tar bort en sida så försvinner den även från webbplatskartan.

Om funktionaliteten saknas i CMS:ens standardutförande så går det ofta att implementera stödet med hjälp av plugins. Ett exempel är Yoast SEO-plugin till WordPress som kommer med sitemap-funktioner.

Om möjligheterna saknas helt och hållet till att generera en sitemap i systemet, så går det att manuellt skapa en XML-fil och ladda upp på webbservern. Det finns externa verktyg som hjälper dig formatera filen på ett korrekt sätt. Det enda du behöver ha är en komplett lista på de sidor som du vill inkludera i webbplatskartan.

Med en manuellt hanterad sitemap är det viktigt att hålla den uppdaterad med nya sidor som läggs till, att ta bort eventuella sidor som raderas samt att ta bort URL:er som inte kan eller bör indexeras.

Checklista med viktiga saker att tänka på

  • Lista enbart sidor som du vill ska indexeras.
  • Uteslut alla sidor som av olika skäl inte kan indexeras (t.ex. URL:er med status 404, ompekade URL:er, URL:er som inte är den kanoniska versionen, eller URL:er som är blockerade i robots.txt).
  • Säkerställ att alla viktiga sidor finns med.
  • Ange olika språkversioner av en URL med <xhtml:link>-taggen.
  • Länka till din sitemap i robots.txt.
  • En XML-sitemap får maximalt innehålla 50 000 URL:er och inte vara större än 50 MB. Dela upp sajten i flera webbplatskartor vid behov.
  • Håll listan uppdaterad om en sida publiceras eller raderas på sajten.
  • Google kan hitta webbplatskartan själv, men det är bäst att skicka in den i Google Search Console för att få information om hur Google hanterar den och URL:erna som är listade.

Sammanfattning

Att lista en URL i en sitemap är ingen garanti för att sökmotorer kommer att genomsöka och indexera den. En URL kan dessutom genomsökas och indexeras utan att finnas med i webbplatskartan. En XML-sitemap är helt enkelt endast ett verktyg för att underlätta och snabba upp processen för sökmotorer att hitta de viktiga URL:er som du vill indexera.

Behovet av en XML-sitemap är som störst på väldigt stora och komplexa sajter, men även mindre sajter kan ha nytta av en.

Vi har med det här inlägget förklarat vad XML-sitemap är och varför den har en betydelse för din webbplats. Är du nyfiken på att veta mer om SEO eller om du behöver hjälp så tveka inte att kontakta oss här!