Je viens de tomber sur une paire d'articles de messieurs Simkin et Roychowdhury, le second que j'ai lu, grâce aux références du premier, étant d'ailleurs le plus intéressant, et chronologiquement antérieur. C'est pas clair ? M'en cogne.
Bref.
Ces deux chercheurs du Department of Electrical Engineering, UCLA, se sont intéressés dans un premier temps au rapport entre le mérite des as allemands de la première guerre mondiale, mesuré par leur nombre de succès aériens, et leur réputation, mesurée par ... le nombre de hits Google. Ils montrent que la célebrité n'est pas directement proportionnelle au mérite, mais plutôt qu'elle croit exponentiellement avec celui-ci. Plus techniquement, le coefficient de corrélation entre le mérite et le logarithme de la célebrité est de 0.72.
C'est ainsi qu'avec 80 victoire confirmées, Manfred Von Richthofen, le Baron Rouge (non, jeunes tifosi de la Scuderia Ferrari, ce nom n'a pas été inventé pour Michael Schumacher) est le plus célèbre sur le net, avec 4720 hits (en mai 2003 - une requête sur son nom entre guillemets m'en donne 249000 à ce jour) sur 17674 au total pour les as allemands. Vu que ces derniers ont détruit au total 5050 appareils ennemis, Von Richthofen totalise donc 27% des hits pour seulement 1.6% des victoires ... Inversement, les 60 as ayant scoré seulement 5 victoires ont détruit 6% des appareils ennemis, mais n'ont récolté que 2.6% des lauriers Googueuliens.

Dans le second papier, les auteurs ont essayé de déterminer si les succès cumulés par les as ont vraiment été obtenus grâce à leur talent, ou simplement par chance.
A l'époque du projet Manhattan, le physicien Enrico Fermi avait demandé au général Groves, responsable de l'opération, quelle était selon lui la définition d'un "grand général". Celui-ci lui répondit qu'un général ayant emporté cinq victoires d'affilée pouvait raisonnablement être qualifié de la sorte. Fermi demanda alors à Groves quelle était la proportion approximative de grands généraux. Il lui répondit qu'il pensait qu'elle était de l'ordre de 3% ... Fermi montra a posteriori que Groves n'était sans doute pas si loin de la plaque, puisqu'en supposant que la probabilité de victoire est de 1/2, la chance d'en obtenir cinq de rang est de 1/(2^5) = 1/32, soit très près des 3% pifométrés par le général.
Un raisonnement de même nature pourrait laisser croire qu'avec 80 victoires successives avant de trouver la mort, la probabilité que Von Richthofen les ait obtenues par chance était seulement de 1/(2^80) soit environ 10^(-24) ... Mais il n'en est rien :
Le nombre total de victoires certifiées (6745) est très nettement supérieur au nombre de défaites (dans un facteur allant de 5.4 à 8.2 selon la convention adoptée pour le comptage ...). Les auteurs repartent de ce facteur de 8.2 pour faire l'hypothèse que c'est le ratio entre la probabilité d'une victoire créditée et la probabilité d'une défaite, donc la probabilité d'une défaite à chaque engagement est de r=1/9.2. La probabilité d'obtenir 80 victoires d'affilée est alors de (1-r^80), soit environ 10^(-4). La probabilité qu'au moins un des 2890 pilotes allemands obtienne 80 victoires d'affilée est par conséquent de 1-(1-10^-4)^2890, soit environ 0.25. Chiffre qui n'exclut donc nullement que Von Richthofen ait simplement eu de la chance.
En utilisant cette approche, la probabilité de gagner n combats et de perdre le suivant est p(n) = r.(1-r)^n. L'accord entre cette distribution théorique et la distribution réellement observée des scores de victoires n'est cependant pas très bon. Une meilleure approche consiste à étudier la probabilité d'une défaite en fonction du nombre de victoires passées. Intuitivement, on comprend en effet que la probabilité de défaite n'est pas constante en fonction du nombre de victoires : au moment de comptabiliser la première victoire (ou défaite), on prend en compte tous les pilotes, débutants ou expérimentés, bons ou mauvais. Quand il s'agit d'étudier la probabilité d'enregistrer une onzième victoire, seulement les as en ayant déjà 10 au compteur se présentent au portillon. La probabilité de victoire au onzième engagement est donc naturellement plus élevée, puisque les pilotes sont meilleurs ...
Bon, j'ai pas tout compris dans la suite de l'article, ceux qui ont des souvenirs de probas plus frais que les miens (et familiarisés avec l'inférence bayesienne) pourront aller jeter un coup d'oeil. Les auteurs concluent, après avoir introduit la notion de taux de défaite intrinsèque, que celui de Von Richthofen était de l'ordre de 2.5%, comparable à celui de 29% des pilotes allemands.
Il se peut donc que le baron rouge ne fut pas plus doué que le tiers de la population des as, mais simplement plus chanceux ...


Question subsidiaire pour ceux qui ont tout lu : pourquoi le premier article est-il situé dans le répertoire Condensed Matter d'arXiv.org ?