Publié le 31/05/2014
Auteur Fobec
Réseaux sociaux
0 partages
0 tweets
0 plus
0 commentaires

Comment est percu le site par les moteurs de recherche

Les moteurs de recherche crawlent des millions de pages internet chaque jour pour ensuite sélectionner les sites web à afficher aux internautes. Comme chacun le sait, ces classements fluctuent chaque jour et les webmasters n'ont de cesse à améliorer leur position dans les Serp.
Quelles sont les critères de sélection sur nos sites web et surtout comment améliorer la position de son site ?

Cas concret sur le site Fobec.com

Depuis un bout de temps, nous sommes surpris par le choix des pages explorées par le bot de Google, notamment des URL qui n'existent plus depuis de nombreuses années. Ces informations sont résumées par l'outil de back office basé sur les logs Apache.
A priori, les moteurs de moteur sont loin d'être idiot (encore que !!!) et le plan d'analyse de nos sites se doit d?être. En y réfléchissant, il y a probablement une raison à ces crawl. Avant de passer à l'amélioration du site, essayons de comprendre
Comment Google voit le site Fobec.com ?

Le site Fobec.com se compose d'environ 400 000 pages internet, réparties entre les codes sources, le forum et les applications en ligne. Pour y voir clair, nous avons créer notre propre robot de crawl qui extrait les liens des pages puis les parcourt au fur et à mesure.

Maillage internet et externe

La première évaluation a pour but de vérifier la structure des liens du site internet:
lien interne: lien hypertexte vers une rubrique ou une autre page du site,
lien externe: lien vers un autre site internet ou les réseaux sociaux.

Quel fut le résultat du crawl ? ... euh ... oups
En effet, le site est ancien, voila plus de 15 ans que Fobec.com existe. L'arborescence a été revue plusieurs fois au fil des années et les liens externes redirigent bien souvent vers une nouvelle URL.

Balisage sémantique

Au deuxième passage, nous avons ajouter un parseur pour extraire des balises HTML utiles à l'identification d'une page internet:
le titre: nombre de caractère de la balise Title,
balise H1: balise h1 du document,
mot clé: algorithme simple sur les mots clés de la page

Le résultat fut conforme aux attentes, le balisage est bon dans l'ensemble. Les points à améliorer sont la taille des titres.

Contenu des pages

Quel est le nombre de mots idéale pour un article ?
Les avis des spécialistes SEO varient sur le nombre de caractères à produire, par contre il semble admis par tous que 500 mots / page est un minimum. Les pages du site sont classées en 4 catégories:
moins de 200 mots: pages à petit contenu,
de 200 à 500 mots: page à faible contenu,
de 500 à 1000 mots: article correcte,
plus de 1000 mots: page à fort contenu.

Suite à l'exploration des pages, il s'avère que sur l'ensemble du site, le moyenne est de 496 mots par page. Dans les mois à venir, nous allons pousser l'analyse en comparant le nombre de mots sur une page et le trafic des moteurs de recherche.

Poursuite du projet

Le projet est né du constat que les bots sont discrets et communiquent peu sur les faiblesses d'un site internet. Par exemple, WebmasterTools de Google reprend peu de critères énumérés ci-dessus dans son interface et bien souvent les données datent de plusieurs semaines.
Dans les semaines à venir, nous allons améliorer bon nombre de points quant à la qualité du site Fobec.com. Nous vous tiendrons au courant de l'impact sur le trafic issu des Serp.
Nous rejoindre: le crawler est en version beta et en constante évolution. Si le projet vous intéresse, veuillez nous laisser un message pour participer aux algo ou analyser son site internet.

Ajouter un commentaire

Les champs marqués d'un * sont obligatoires, les adresses emails se sont pas publiées.

A lire aussi

Réseaux sociaux
Présentation de l'article
Catégorie
news - nos-realisations
Mise a jour
31/05/2014
Visualisation
vu 4389 fois
Public
Internaute
Auteur de la publication
Fobec
Admin
Auteur de 267 articles
|BIO_PSEUDO|
Commentaires récents

Publié par fredouille dans java

Il ne faut pas oublier de mettre aussi System.setErr(printStream); pour ne pas oublier les printStackTrace() declenches par le catch

Publié par Kal747 dans php5

Merci pour l'info !

Publié par neuro dans CMS

exemple edifaint et trés interessant

Publié par Kader dans java

Tres interessant. Merci Bien! Est ce possible de mettre la couleur sur toute la ligne au lieu de la cellule?

Publié par Ba Mohamed dans java

merci pour ce tuto, ca m'a beaucoup aider