Algoritme du Pagerank

optimisation, moteur de recherche, seminaires seo, conférence, outils seo, diagnostic seo, seo services, google seo, seo links, seo compagnie, technologie seo, ranking metric, specialistes, nouvelles..

Algoritme du Pagerank

Messagede Patrice Tremblay » Lun Avr 09, 2007 2:16 pm

Explications:

Nous assumons qu’une page A reçoit des liens (ou "votes") émis par les pages T1...Tn.

Le paramètre d est un facteur d’amortissement pouvant être ajusté entre 0 et 1.

Nous donnons généralement à d la valeur 0.85.

De même, C(A) est défini comme le nombre de liens émis par la page A (liens sortants). Le PageRank de la page A est défini comme suit :
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Le PageRank peut être calculé en utilisant un simple algorithme itératif, et correspond au vecteur propre principal de la matrice normalisée des liens du Web.

Tout cela est bien moins compliqué qu’il n’y paraît, essayons de disséquer l’expression.

Pour ce faire, voici l’explication de la notation utilisée :

-PR(A) le PageRank de la page A
-PR(Tn) le PageRank de la page Tn
-C(Tn) le nombre de liens émis sur la page Tn
-d tous les « votes » sont additionnés, mais pour en limiter l’importance, le total est multiplié par ce coefficient d’amortissement (0.85)
1 - d Un petit peu de « magie mathématique » qui permet de garantir que la moyenne des PageRank de l’ensemble des pages du Web sera de 1.

L’examen de cette formule permet de voir que le PageRank d’une page n’ayant aucun lien entrant sera de 0.15 ,
soit : (1 - 0.85) + 0.85*(0) = 0.15

Et là apparaît la cause de la confusion la plus répandue au sujet du PageRank :

Que vient faire ici cette valeur fractionnaire alors que la toolbar n’affiche que des valeurs entières ?

Oublions la toolbar quelques instants !

Il est généralement admis que l’échelle du PageRank est logarithmique, sans que ceci ne soit officiellement confirmé. Pour cette raison, la base utilisée ne peut qu’être estimée.

Il est de même raisonnable de penser que cette base évolue dans le temps.

Prenons une échelle logarithmique de base 10 pour simplifier nos calculs, le raisonnement restant valable quelle que soit le base choisie.

PageRank Affiché
(log base 10) PageRank réel
(calculé)
PR0 0 ≤ PR < 1
PR1 1 ≤ PR < 10
PR2 10 ≤ PR < 100
PR3 100 ≤ PR < 1000
PR4 1000 ≤ PR < 10000

et ainsi de suite jusqu’au PR10 pour les plus heureux.

On voit ici, que chaque niveau de PageRank est 10 fois plus élevé que le niveau précédent. Ce qui signifie en clair qu’il est 10 fois plus ardu de passer de PR4 à PR5 que de passer de PR3 à PR4 (pour mémoire, la base 10 a été choisie arbitrairement dans notre exemple).

Une des raisons pour lesquelles on estime que l’échelle évolue dans le temps, est que le PageRank maximum n’est calculé que lorsque Google fait sa mise à jour de l’index, et que le nombre de pages indexées est en constante augmentation.

Cette évolution de l’échelle expliquerait pourquoi certaines pages voient leur PageRank diminuer au fil des indexations, alors que le nombre de liens entrant reste inchangé.

En reprenant l’exemple de la page sans lien entrant donné précédemment (PR=0.15), nous voyons que la toolbar nous affichera bien la valeur 0.

Comment le PageRank est-il calculé ?

C’est ici que les choses se compliquent un petit peu.

Nous avons vu que le PageRank d’une page A dépend du PageRank des pages T1...Tn qui émettent un lien vers A, et ne peut donc pas être déterminé sans connaître le PR de ces dernières, et de toutes celles qui émettent un lien vers elles, et ainsi de suite...

Lorsqu’on réalise que les liens inter pages peuvent boucler, cela ressemble bien à « mission impossible ».

Reprenons la publication de Google décrivant le PageRank :

Le PageRank peut être calculé en utilisant un simple algorithme itératif, et correspond au vecteur propre principal de la matrice normalisée des liens du Web

Ceci signifie que le calcul du PageRank d’une page peut être effectué sans connaître le PR final des pages émettant un lien vers elle.
Cela peut sembler paradoxal, mais chaque itération fait converger les résultats vers une valeur de plus en plus précise. La seule chose à faire, est de retenir la valeur obtenue pour pouvoir démarrer l’itération suivante avec cette dernière.

Ce sera plus simple avec quelques exemples :
Réinventons le Web dans sa forme la plus simple : 2 pages A et B pointant l’une vers l’autre.
Chaque page a un lien sortant, donc C(A) = C(B) = 1


Source:

http://www.webmaster-hub.com/publication/L-algorithme-du-PageRank-explique.html
Avatar de l’utilisateur
Patrice Tremblay
Site Admin
 
Messages: 268
Inscription: Mer Mai 26, 2010 9:32 am

Messagede Saguenay SEO » Jeu Mai 31, 2007 11:31 am

Je préfère ne pas trop me casser la tête et utiliser un logiciel qui calcule ca pour moi!!

:P
Saguenay SEO
 
Messages: 161
Inscription: Mar Avr 03, 2007 1:04 am

Messagede Patrice Tremblay » Mer Oct 31, 2007 11:42 pm

C'est sûr que c'est complexe un peu mais tu aurrais tout intérêt à comprendre cet algorithme..

:wink:
Avatar de l’utilisateur
Patrice Tremblay
Site Admin
 
Messages: 268
Inscription: Mer Mai 26, 2010 9:32 am

Messagede Tommyknocker » Ven Juin 06, 2008 10:17 am

Oui, c'est complexe mais si on s'y attelle, ca permet de comprendre pas mal de chose, notamment les fuites de PageRank :wink:
Avatar de l’utilisateur
Tommyknocker
 
Messages: 49
Inscription: Sam Mai 24, 2008 7:40 am
Localisation: Marseille, France

Messagede Saguenay SEO » Mar Juin 10, 2008 6:32 pm

moi et les mathematiques ......
Saguenay SEO
 
Messages: 161
Inscription: Mar Avr 03, 2007 1:04 am

Messagede Tommyknocker » Sam Juin 14, 2008 12:53 pm

Et en même temps, c'est plein de logique :wink:
Avatar de l’utilisateur
Tommyknocker
 
Messages: 49
Inscription: Sam Mai 24, 2008 7:40 am
Localisation: Marseille, France

Messagede StayFan » Ven Juin 20, 2008 2:29 am

[quote="Tommyknocker"]ca permet de comprendre pas mal de chose, notamment les fuites de PageRank..


Que veux-tu dire par "fuites" ?
StayFan
 
Messages: 59
Inscription: Mer Déc 05, 2007 4:31 pm

Messagede Tommyknocker » Sam Juin 21, 2008 5:12 am

Le Pagerank représente la popularité de ton site internet.
Si ton site est populaire, tu as de nombreux liens qui pointent dessus, c'est ainsi que tu peux monter ta valeur de Pagerank.
Le référencement te permet d'optimiser ton site sur de nombreux points.
:wink:
Avatar de l’utilisateur
Tommyknocker
 
Messages: 49
Inscription: Sam Mai 24, 2008 7:40 am
Localisation: Marseille, France

Messagede StayFan » Dim Juin 29, 2008 1:08 am

Oui je comprend ce qu'est le pagerank mais tu as parlé de fuite et je me questionnait sur le terme.
StayFan
 
Messages: 59
Inscription: Mer Déc 05, 2007 4:31 pm

Messagede Tommyknocker » Dim Juin 29, 2008 4:55 am

oui, si tu donnes plus que tu reçois, tu auras une fuite de Pagerank :wink:

Il faut cependant émettre des réserves car j'ai remarqué que certaines pages sur lesquelles j'avais placés beaucoup de lien que les autres étaient positionnées en page 1 sur des recherches concurrentielles (ex "Marseille Films X" : je suis en page 1 sur google alors que c'est une page qui présente tous mes Référencements et que je n'ai pas référencé mon site du tout pour monter à Films X. :shock:

C'est donc l'interet du contenu qui influence également google lors de l'indexation pour référencer un site internet :wink:
Avatar de l’utilisateur
Tommyknocker
 
Messages: 49
Inscription: Sam Mai 24, 2008 7:40 am
Localisation: Marseille, France


Retourner vers Seo

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

cron