Publié le 31/05/2014
Auteur Fobec
Réseaux sociaux
0 partages
0 tweets
2 plus
0 commentaires

Comment est percu le site par les moteurs de recherche

Les moteurs de recherche crawlent des millions de pages internet chaque jour pour ensuite sélectionner les sites web à afficher aux internautes. Comme chacun le sait, ces classements fluctuent chaque jour et les webmasters n'ont de cesse à améliorer leur position dans les Serp.
Quelles sont les critères de sélection sur nos sites web et surtout comment améliorer la position de son site ?

Cas concret sur le site Fobec.com

Depuis un bout de temps, nous sommes surpris par le choix des pages explorées par le bot de Google, notamment des URL qui n'existent plus depuis de nombreuses années. Ces informations sont résumées par l'outil de back office basé sur les logs Apache.
A priori, les moteurs de moteur sont loin d'être idiot (encore que !!!) et le plan d'analyse de nos sites se doit d?être. En y réfléchissant, il y a probablement une raison à ces crawl. Avant de passer à l'amélioration du site, essayons de comprendre
Comment Google voit le site Fobec.com ?

Le site Fobec.com se compose d'environ 400 000 pages internet, réparties entre les codes sources, le forum et les applications en ligne. Pour y voir clair, nous avons créer notre propre robot de crawl qui extrait les liens des pages puis les parcourt au fur et à mesure.

Maillage internet et externe

La première évaluation a pour but de vérifier la structure des liens du site internet:
lien interne: lien hypertexte vers une rubrique ou une autre page du site,
lien externe: lien vers un autre site internet ou les réseaux sociaux.

Quel fut le résultat du crawl ? ... euh ... oups
En effet, le site est ancien, voila plus de 15 ans que Fobec.com existe. L'arborescence a été revue plusieurs fois au fil des années et les liens externes redirigent bien souvent vers une nouvelle URL.

Balisage sémantique

Au deuxième passage, nous avons ajouter un parseur pour extraire des balises HTML utiles à l'identification d'une page internet:
le titre: nombre de caractère de la balise Title,
balise H1: balise h1 du document,
mot clé: algorithme simple sur les mots clés de la page

Le résultat fut conforme aux attentes, le balisage est bon dans l'ensemble. Les points à améliorer sont la taille des titres.

Contenu des pages

Quel est le nombre de mots idéale pour un article ?
Les avis des spécialistes SEO varient sur le nombre de caractères à produire, par contre il semble admis par tous que 500 mots / page est un minimum. Les pages du site sont classées en 4 catégories:
moins de 200 mots: pages à petit contenu,
de 200 à 500 mots: page à faible contenu,
de 500 à 1000 mots: article correcte,
plus de 1000 mots: page à fort contenu.

Suite à l'exploration des pages, il s'avère que sur l'ensemble du site, le moyenne est de 496 mots par page. Dans les mois à venir, nous allons pousser l'analyse en comparant le nombre de mots sur une page et le trafic des moteurs de recherche.

Poursuite du projet

Le projet est né du constat que les bots sont discrets et communiquent peu sur les faiblesses d'un site internet. Par exemple, WebmasterTools de Google reprend peu de critères énumérés ci-dessus dans son interface et bien souvent les données datent de plusieurs semaines.
Dans les semaines à venir, nous allons améliorer bon nombre de points quant à la qualité du site Fobec.com. Nous vous tiendrons au courant de l'impact sur le trafic issu des Serp.
Nous rejoindre: le crawler est en version beta et en constante évolution. Si le projet vous intéresse, veuillez nous laisser un message pour participer aux algo ou analyser son site internet.

Ajouter un commentaire

Les champs marqués d'un * sont obligatoires, les adresses emails se sont pas publiées.

A lire aussi

Réseaux sociaux
Présentation de l'article
Catégorie
news - nos-realisations
Mise a jour
31/05/2014
Visualisation
vu 3633 fois
Public
Internaute
Auteur de la publication
Fobec
Admin
Auteur de 261 articles
|BIO_PSEUDO|
Commentaires récents

Publié par makanaki dans logiciel

je veux essayer ce logiciel pour tester les jeux de loto de chez nous

Publié par Altair dans tuto

Bonjour, cette solution fonctionne-t-elle également sur les serveurs mutualisés Amen svp ?

Publié par Fobec dans news

Votre message a ete deplace sur le forum, ce sera plus facile pour en discuter.
http://www.fobec.com/forum/correspondance-entre-adresse-ipv4-adresse-ipv6-t1146.html

Publié par MasterMbg dans java

Salut! merci pour le code, si tu y ajoutais des commentaires avant chaque module ce serait encore plus facilitant! merci infiniment...

Publié par ric dans CMS

c\'est la première fois que j\'utilise ce logiciel