I. Introduction

Comme son nom l'indique, le Google SiteMap ou Plan SiteMap est un système créé et développé par Google. À ce jour, toujours en bêta, il est accessible via l'interface Webmaster Tools (Outils Google à l'attention des webmasters) de Google. Dans cet article, nous allons découvrir comment créer et optimiser un Plan SiteMap.

I-A. Pourquoi Google SiteMap ?

L'indexation des pages de votre site, d'autant plus lorsqu'il est récemment créé, peut être un processus extrêmement long. Les Google Bot (robots de Google) doivent tout d'abord trouver une URL via un lien provenant d'un autre site. Un fois cette page analysée, les robots iront alors à la découverte de votre site. L'analyse complète de votre site peut prendre énormément de temps, notamment si celui-ci est « gros ».

I-B. Google SiteMap, c'est quoi ?

Le plan SiteMap est un fichier XML représentant l'arborescence de votre site qui doit être transmis à Google. C'est un moyen simple et beaucoup plus rapide qui permet au moteur de mieux connaître toutes les URL de votre site qu'il doit référencer, notamment pour les pages qui n'ont pas beaucoup de liens pointant vers elle.

II. Créer son SiteMap

II-A. Fonctionnement de Google SiteMap

Le fonctionnement de Google SiteMap est très simple et se déroule en trois étapes :

  1. créer un ou des fichiers XML spécifiques contenant les URL de votre site ;
  2. placer le fichier XML sur votre site en respectant les contraintes d'emplacements et de tailles ;
  3. soumettre votre fichier SiteMap à Google.

II-B. Le fichier XML

Votre fichier XML doit ressembler à celui-ci, nous le détaillerons ensuite.

 
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://brys.developpez.com</loc>
        <lastmod>2006-10-15</lastmod>
        <changefreq>monthly</changefreq>
        <priority>0.8</priority>
    </url>
    <url>
        <loc>http://brys.developpez.com/articles/google-sitemap/</loc>
        <lastmod>2006-10-25</lastmod>
        <changefreq>yearly</changefreq>
        <priority>0.7</priority>
    </url>
</urlset>

II-B-1. Détaillons le XML

Le fichier XML, doit débuter par l'entête suivant :

L'en-tête
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">

Chaque URL doit être définie comme suit :

Une URL
Sélectionnez
<url>
    ... [paramètre de l’URL] ...
</url>

Dans les balises URL, un seul des paramètres est obligatoire, location (« endroit » en français), représenté par la balise loc. Il s'agit de l'URL que vous souhaitez faire connaître à Google.

Une URL définie
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://brys.developpez.com</loc>
    </url>
</urlset>

Les url qui seront transmises à Google doivent-être encodées (par exemple en PHP, url_encode)

Les trois autres paramètres, optionnels ceux la, sont :

  • lastmod représente la date de dernière modification de l'URL. Sa valeur sera définie sous le format date validée pas le W3C (AAAA-MM-JJ) ;
  • changefreq, représente la fréquence à laquelle cette URL sera susceptible de changer. Les valeurs suivantes sont possible :
  • always (Tout le temps),
  • hourly (Toutes les heures),
  • daily (Tous les jours),
  • weekly (Toutes les semaines),
  • monthly (Tous les mois),
  • yearly (Tous les ans),
  • never (Jamais) ;
  • priority représente la priorité que vous souhaitez donner à cette URL. la valeur doit être comprise entre 0.1 et 1.0. Si vous ne spécifiez pas ce paramètre, la valeur par défaut sera 0.5.

II-B-2. Exemple et explication

Reprenons l'exemple ci dessus et détaillons-le.

 
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    [...]
    <url>
        <loc>http://brys.developpez.com/articles/google-sitemap/</loc>
        <lastmod>2006-10-25</lastmod>
        <changefreq>yearly</changefreq>
        <priority>0.7</priority>
    </url>
    [...]
</urlset>

Dans cet exemple, nous souhaitons soumettre à Google l'URL http://brys.developpez.com/articles/google-sitemap/.

Nous savons que la date de dernière modification est le 25/10/2006, nous l'indiquons donc au format date du W3C, c'est à dire 2006-10-25.

Nous définissons une fréquence de changement « tous les ans » car cet article n'est pas amené à changer souvent.

Pour terminer nous fixons la priorité à 0.7.

II-C. Emplacement et taille du fichier Google SiteMap

II-C-1. L'emplacement du fichier Google SiteMap

Il n'est pas obligatoire de placer le SiteMap à la racine du site. Cependant, l'emplacement du fichier SiteMap est important ! En effet, seules les URL contenues dans le fichier appartenant au dossier où se situe le fichier sur votre site seront prises en compte. (je sais c'est lourd et incompréhensible, mais avec des exemples ça sera plus clair :) )

Les exemples suivants vous expliqueront ce qu'il peut être ou ne pas être fait.

Pour ce premier exemple, supposons que le XML est placé à la racine du site (http://brys.developpez.com/fichier_sitemap.xml).

URL acceptée
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://brys.developpez.com/articles/google-sitemap/</loc>
    </url>
    <url>
        <loc>http://brys.developpez.com/index.php</loc>
    </url>
    <url>
        <loc>http://brys.developpez.com/autre-rep/autre-rep2/une-page.php</loc>
    </url>
</urlset>
URL refusée
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>https://brys.developpez.com/index.php</loc>
    </url>
    <url>
        <loc>http://www.developpez.com/autre-rep/autre-rep2/une-page.php</loc>
    </url>
</urlset>

Pour ce second exemple, supposons que le XML est placé dans un répertoire du site (http://brys.developpez.com/articles/fichier_sitemap.xml).

URL acceptée
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://brys.developpez.com/articles/index.php</loc>
    </url>
    <url>
        <loc>http://brys.developpez.com/articles/google-sitemap/</loc>
    </url>
    <url>
        <loc>http://brys.developpez.com/articles/autre-rep/autre-rep2/une-page.php</loc>
    </url>
</urlset>
URL refusée
Sélectionnez
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>https://brys.developpez.com/index.php</loc>
    </url>
    <url>
        <loc>https://brys.developpez.com/articles/index.php</loc>
    </url>
    <url>
        <loc>http://brys.developpez.com/autre-rep/autre-rep2/une-page.php</loc>
    </url>
</urlset>

II-C-1-a. Taille et poids du fichier Google SiteMap

Le fichier XML généré et non compressé ne doit pas dépasser 10 Mo ou contenir plus de 50 000 URL. Dans le cas contraire, rien ne vous interdit de créer plusieurs fichiers XML distincts.

III. Soumettre votre fichier à Google

Une fois votre fichier Google SiteMap créé et mis en ligne, il ne vous reste plus qu'à le soumettre à Google. Pour cela, il vous suffit de vous connecter à l'interface Webmaster Tools, d'ajouter votre site (si cela n'est pas déjà fait) et d'y ajouter l'URL de votre SiteMap.

Image non disponible

Il est conseillé, lorsqu'une modification est faite dans votre SiteMap, de le soumettre de nouveau à Google via l'URL suivante http://www.google.com/webmasters/sitemaps/ping?sitemap=URL_DE_VOTRE_XML_GOOGLE_SITEMAP

IV. Conclusion

Pour conclure, si vous souhaitez optimiser l'indexation de votre site web sur Google, le Google SiteMap est exactement ce qu'il vous faut.

En revanche, ce qu'il faut bien comprendre, c'est que ce système est un plus et non une fin en soit.

Je vous conseille avant de mettre en pratique ce qui vient d'être dit, de bien lire et comprendre l'Introduction à la SEO.

IV-A. Liens