Depuis une dizaine de jours, j’ai ajouté un petit robot à bonVote qui recherche dans les posts de tous les blogs référencés quelques termes chargés politiquement. Résultat, il est facile de savoir de qui on parle, c’est-à-dire de mesurer le buzz, sans qu’on sache s’il est positif ou négatif. Sans vouloir concurrencer buzz-blog ou politibuzz, j’obtiens en temps réel, par exemple, un classement de nos hommes politiques.

Il sera amusant de voir si les petits candidats apparaissent dans le top 10 et de comparer ce graphique avec les résultats des sondages. Nous pourrons ainsi savoir si les blogueurs sont en phase ou non avec les autres Français. Je ne crois pas que ce graphique nous permettra d’aller beaucoup plus loin. C’est un gadget de plus lancé dans la blogosphère.

11
Ne manquez aucun article
Soutenez mon travail en achetant mes livres.

11 comments

  1. Jack Lang tire profit de sa rencontre de Bachar al Assad à Damas qui a été bcp relayée sur les blogs, comme tous les sujets liés au Liban en ce moment.
    Ces “top” sont intéressants, mais il faut espérer qu’ils ne vont pas inciter encore plus les hommes politiques à faire des coups sensationnels, sans lendemain, juste pour créer du buzz au jour le jour sur Internet.
    La bonne politique n’est pas forcément liée à l’événementiel et au visible.

    En gros il suffit d’une centaine de mentions nominales par jour pour être numéro un. Un petit candidat, voire un candidat totalement inconnu, pourrait s’organiser avec une dizaine de sites amis pour mentionner son nom 10 fois par jour sur chacun des 10 sites, et il se verrait numéro un, joli coup de pub pour un coup financier nul.

  2. Nicolas says:

    de petits pas en petit pas ton outil devient une perle 😉

  3. José says:

    Ayant plus évoqué le Liban, ces derniers jours, que commenté Bové ou Villepin, mon “contenu politique“ a été ramené à zéro sur “Bon Vote“. Ce que je récuse, évidemment. Du coup, je te propose d’enrichir ton dictionnaire de mots liés à la politique.

    Je te suggère, par exemple, les directions suivantes :

    – mots liés à l’activité politique : Etat, parti politique, syndicat, collectivités locales, collectivités territoriales, commune, département, région, réforme, révolution, guerre, environnement, changements climatiques, réchauffement…

    – mots liés à l’activité économique : économie, capitalisme, finances, social, budget, pétrole, baril de pétrole, énergie,

    – noms de pays : Etats-Unis, Afghanistan, Irak, Iran, France, Israël, Palestine, Liban, Arabie Saoudite, Syrie, Chine, Russie, Vénézuéla, Cuba, Japon, Allemagne, Espagne, Italie, Grande-Bretagne, Royaume-Uni, Angleterre…

    – noms de personnalités ou d’organisations internationales : Bush, Hillary, Clinton, Bernanke, Cheney, Hezbollah, Tsahal, Europe, Union européenne, ONU, OTAN, ONG, MSF, Al Qaeda…

    Autre chose, Thierry : Agoravox et Loïc Le Meur apparaissent en tête chaque jour. Mais l’un n’est pas un blog (mais un site et, dans ce cas, pourquoi Le Monde, le Figaro ou l’Huma ne sont-ils pas répertoriés) et l’autre a un contenu très peu “politique“. Comptes-tu changer quelque chose à ça ?

  4. Je vais ajouter tes suggestions au dico… Pour Lemeur, difficile de l’écarter. Il parle un peu de politique tout de même, voir sa courbe de politisation. Et faut pas oublier que c’est lui qui a lancé la vague des podcasts politiques. Mais je sais que le plus souvent son blog n’a aucun rapport. Tout classement est nécessairement un peu arbitraire. Il faudrait que la teneur politique entre dans la note d’influence (qui, elle-même, entre dans celle de la teneur… mais cette boucle ne pose pas de problème technique ou logique). J’introduirai cette nuance dès que le dico politique sera plus riche. Et on verra où l’algorithme placera Lemeur. Pour Agoravox ce sera la même chose. Laissons l’algorithme décider.

    Maintenant, c’est vrai qu’on pourrait ajouter des tonnes de sites. Mais je crois qu’il faut écarter ceux qui ne sont pas purement Web comme ceux des journaux ou TV (tout le monde connait leur influence et ils ne sont pas des émanations citoyennes, ce qu’est Agoravox). Il faut aussi écarter les sites par trop généralistes. Tout cela restera éternellement un peu subjectif.

    On en revient à l’impossibilité de définir. Il y a des sites faciles à sélectionner, d’autres faciles à écarter, et d’autres sur la frontière. Ils forcent à questionner la définition. Mais toute remise en cause de la définition ne fait que décaler le problème et le porter sur d’autres sites (depuis que je fais bonWeb on est sans cesse confronté à ce problème). La perpétuelle survenue du problème de classement peut être démontrée à l’aide du théorème de Gödel.

  5. José says:

    Merci, Thierry, pour la prise en compte des mots du dictionnaire. Si tu en veux d’autres, je peux réfléchir à enrichir cette proposition.

    Quant à la présence en tête de BonVote de loïc LeMeur (contre qui je n’ai rien personnellement : c’est un de mes fournisseurs ;), je pense qu’elle décrédibilise l’ensemble. S’il est présent en tête, c’est notamment parce qu’il poste comme un fou sur des sujets qui n’ont rien de politique. Le voir devant Sarko, DSK ou Ségolène en tant que blog politique relève de la galéjade.

    S’agisssant d’AgoraVox, ce n’est certainement pas une “émanation citoyenne“ : c’est une entreprise en développement qui a choisi de se positionner en donnant la parole à qui veut la prendre.

    Donc soit tu le mets hors concours (car, avec plus de 3000 collaborateurs, personne ne peut le matcher) ; soit tu choisis de faire sa promo parce que tu collabores à AgoraVox, ou parce que c’est des potes et dans ce cas tu le dis ; soit tu considères que classer des poires avec des navets est de bonne méthodologie. Et là, personne de sérieux ne peut te suivre.

    Je te suggère de faire un classement séparé pour les sites ? blogs ? collectifs ou collaboratifs ayant vocation à être des médias de grande diffusion. Ça aurait l’avantage de la cohérence. Et dans ce cas, la présence du Monde, de TF1, de L’huma, de l’Obs, du Figaro, etc, qui existent aussi sur le net, se justifierait pleinement.

    De manière générale, je trouve que BonVote est une excellente idée, mais qui suppose beaucoup de rigueur.

    Le mot “influence“, par exemple, mérite d’être questionné. Ce n’est pas parce que je poste deux fois par jour et que je me suis inscrit à Technorati, que je suis plus influent que Tartempion, ancien ministre, qui poste une fois tous les huit jours et qui ignore l’existence de Technorati.

    Que j’aie un désir d’être influent, peut-être. Que je le sois, j’en doute un peu. En tout cas, ce n’est pas à moi d’en décider, mais à celles ou ceux qui sont susceptibles d’être influencés. Or de ceux-là, il est impossible d’avoir une trace quantifiable.

    Le mot “actif“ (que tu réserves aux blogs les plus mis à jour) conviendrait mieux que le mot “influent“ pour qualifier tout ça. Qu’en penses-tu ?

  6. http://carnetsdenuit.typepad.com/ :

    “Ces derniers jours, le contenu politique de ce blog était considéré comme proche du néant, par certains moteurs de recherche, puisque je n’ai pas utilisé les mots suivants :

    Socialiste, Président, Communiste, Politique, Ministre, Élections, Gauche, ATTAC, Centre, Jack Lang, Élu,Nicolas Sarkozy, Présidentielle, UMP, Maire, Droite, Alter, François Hollande, Jacques Chirac, Citoyen, Député, Dominique de Villepin, Municipale,Verts, Libéraux, Écologiste, Front National, Climat, Ségolène Royal, Lionel Jospin, Radicaux, Laurent Fabius, Jean-Marie Le Pen, UDF, Pollution, José Bové, Philippe De Villiers, LCR, Dominique Strauss-Kahn, Marie-Georges Buffet, Francois Bayrou, MRC, Olivier Besancenot, MPF, Arlette Laguiller, Dominique Voynet, Noël Mamère, Freemen, Corinne Lepage, Lutte Ouvrière, Michèle Alliot-Marie, Sympatisant.

    Bon, ben ça, c’est fait !:))”

    C’est franchement amusant. 🙂

    Et cela pose une très bonne question. A mesure que Bonvote.com deviendra, non pas simplement un outil pour les mordus de politique, mais quelque chose comme Google pouvant générer de forts traffics de visiteurs, il faudra se poser la question à laquelle est confronté Google : comment éviter les truquages?

    C’est capital pour la crédibilité du classement.

    De ce point de vue, est-il judicieux de livrer publiquement le dictionnaire des termes qui entrent en compte dans les calculs du moteur?

    Ce n’est pas fantasmer que de penser que pas mal de gens vont bourrer leurs blogs de ces termes, et alors, non seulement ça fausse le classement, mais, bien plus grave, cela devient complètement fou : le blog n’existe plus par son contenu pour s’exprimer de façon pertinente, mais pour coller aux critères du moteur de Bonvote et parvenir en tête de classement.

    Le truquage peut porter sur :

    – une activité artificielle du site. On ne poste plus un article parce qu’il est intéressant, mais parce qu’on sait qu’en postant 15 articles par jour on arrive dans les premiers.

    – des mots clé artificiels. On glisse les mots clé du dictionnaire de Bonvote. Là encore un article n’est plus écrit pour ce qu’il apporte en soi, mais pour son lien de pertinence avec le Top Bonvote.

    – des liens artificiels sur Technorati, d’autant plus que Bonvote ne prend pas en compte la qualité des liens. Il suffit alors de se faire recenser sur des blogs à la con, même s’ils n’ont aucun visiteur, du moment qu’ils sont sur Technorati, pour progresser en influence dans le classement.

  7. A mon avis, pour éviter ces trucages, il faudrait une sorte de “modération humaine”, complétant le robot, appliquée aux 10 premiers sites du classement (ceux qui soulèvent le plus d’enjeu, et parce qu’il est impossible de modérer humainement 1000 sites chaque jour).

    Avec tous les problèmes d’objectivité que cela poserait, mais pas pires que les trucages permis par le robot.

    Pour les 10 premiers sites du classement, une équipe humaine évaluerait leur pertinence politique, la présence ou non d’articles et de termes manifestement postés uniquement pour progresser dans le classement. Elle tenterait, avec autant d’objectivité que possible, d’écarter des premières places les sites gonflés artificiellement. le système ne serait pas parfait, mais le robot ne l’est pas non plus.

    Pour ces dix premiers sites, il faudrait peut-être aussi évaluer la teneur en articles originaux.
    parce que sans cela il est facile de mettre en ligne un agrégateur de contenus externes, qui “publiera” automatiquement trente articles par jour. ce que fait http://blogspolitiques.info/ qui arrive régulièrement en tête des sites les plus actifs, sans produire un seul article original.

  8. Le nouveau dico est en ligne. Si t’as d’autres mots José, je les ajoute. Quand tu poses le curseur sur un mot, l’info-bulle indique les variations recherchées pour ce mot. Par exemple, j’ai pas ajouté social de peur de comptabiliser socialiste (je recherche la variation en début ou fin de mot).

    Ce disco doit être public pour que la méthodologie soit transparente. Si des blogueurs veulent s’amuser à paraître plus politisés qu’ils ne le sont vraiment, ils vont devoir se débrouiller pour parler de politique sinon leurs textes n’auront plus aucun sens.

    Pour Agoravox, c’est vrai que Carlo est un ami, c’est vrai que je publie quelque fois dans Agoravox et même que je m’y fais taper dessus comme aujourd’hui. Mais tu as sans doute raison. Je vais voir comment je peux mettre à part les médias et tous les agrégateurs en fait (de champG à rezo.net). Dans tous les cas, ça va pas changer grand-chose au reste du classement. Mais au moins les choses seront claires. Les agrégateurs doivent aussi être écartés des mesures de politisation.

    Le nombre d’articles postés par jour n’a plus d’importance pour calculer l’influence. Si tu postes un ou dix articles, c’est pareil. C’est pas la course à la quantité qui doit être prioritaire. L’activité mesure l’assiduité d’un blogueur. Si tu publies un long article, tu peux faire monter ta politisation ni plus ni moins qu’avec dix petits articles. Tout dépend des mots employés.

    Pour l’instant le blog de Lemeur est ni plus ni moins politisé que beaucoup d’autres blogs dans le top 100. Je viens d’ajouter une courbe dans les stats pour suivre le niveau de politisation relatif. On va voir si ça change avec le nouveau dico.

    Pour le moment, je n’ai pas mieux que technorati pour avoir une idée de l’influence d’un blog. Ça vaut ce que ça vaut mais c’est la méthode qu’utilisent tous les robots, celui de google rank notamment. Comme les logs des sites sont privés on peut pas se baser sur le trafic. Les résultats NNR ou Alexa pourraient être utilisés en théorie, malheureusement le trafic des blogs est trop faible pour que ce soit pertinent.

    Page2007 ton analyse est juste. J’aimerais que bonVote devienne aussi incontournable que tu l’imagines. En attendant, je ne crois pas que les gens vont truander leur blog pour gagner des positions. Le robot analyse les posts, ce qui est publié. Un truand ne se rendrait pas service car il empoisonnerait ses lecteurs.

    Quand à la méthode à la mano, faut pas y penser. C’est trop de boulot. Et en plus ce serait un boulot de merde que ne voudrait confier à personne.

  9. Pour info, bonVote fait 6000 visiteurs/jour en ce moment et 22 000 pages/jour. C’est pas mal pour un début, surtout pour un mois d’août où habituellement le trafic est calme.

  10. Axel says:

    Bonjour,

    Vous avez modifié les paramètres du robot de Bonvote.com ces trois derniers jours?

    Nos articles (page2007.com) ne sont plus comptabilisés, pourtant ils parviennent bien via le flux RSS : http://www.bonvote.com/rss.php?s=212887

    De notre côté nous n’avons ajouté aucun plugin. (Une fois précédente, il y avait eu un problème avec le plugin WordPress “sticky” épinglant des articles, ce qui bloquait votre moteur, mais nous l’avons désactivé et rien ajouté de nouveau ces derniers jours).

    Cordialement.

  11. @Alex… non pas de modif, mais j’ai modifié un petit truc tout de suite, on va voir si sa repart.

Comments are closed.