dimanche, mai 25 2008, 20:09
L'indexation des fiches d'eFlore
Par Jean-Pascal MILCENT - Informatique et Systématique - Lien permanent
Les fiches sur les taxons présentent dans l'interface web eFlore sont très peu référencées dans Google et les autres moteurs de recherches. Ceci est dû à plusieurs problèmes :
- des pages dynamiques accessibles via un formulaire
- des adresses web ayant une forme suggérant que la page html est dans un dossier profond du site (plus de deux dossiers) : http://www.tela-botanica.org/eflore/BDNFF/4.02/nn/68767
- pas de nom latin dans l'adresse web
Pour résoudre ce problème nous allons tenter l'utilisation de fichiers sitemap. Sitemap est un protocole utilisé par les principaux moteurs de recherche pour découvrir les pages qu'ils peuvent explorer, leurs fréquences de mise à jour, leurs dates de dernière modification... Si Sitemap n'était pas suffisant, nous envisagerons la modification des URLs d'eFlore. Bien entendu, nous préserverons l'accès via les liens actuels par un mécanisme de redirection transparent pour l'utilisateur.
Mise à jour du 27 mai 2008
Voilà, les fichiers Sitemap sont en place sur le serveur de Tela Botanica. Ils ont été enregistrés auprès de Google, Yahoo, LiveSearch (Mircrosoft) et Ask.com.
Le fichier robots.txt qui fournit des informations aux robots qui indexent le web indique aussi la présence de ces fichiers.
L'ensemble des fiches des taxons pour les projets BDNFF, BDAFN, BDNBE et BDNFM sont indiquées. Cela représente pas moins de 265 595 pages!
Ils nous restent maintenant plus qu'à attendre et voir...
un commentaire
Ce problème d'indexation est TRES IMPORTANT pour la visibilité du site. Il faudra maintenant voir l'efficacité du système sitemap. J'ai testé sur quelques noms, ce n'est pas encore "visible"....
Ex : Argyrolobium zanonii : nous arrivons en 9 ème position seulement. (Je note à ce sujet, que ce taxon n'a pas d'illustration affichée alors qu'il en existe une dans notre base photo)