site de Fabien Torre (football)


Simulation du championnat de football

Description et discussion des méthodes utilisées pour simuler le championnat de football et obtenir des probabilités sur le classement final.

Prévisions et probabilités sur le championnat de footbal

Principes de nos simulations

Nous démarrons avec la situation actuelle du championnat puis nous terminons le championnat en choisissant les résultats des matches restants. Nous obtenons donc un classement final, qui peut être le bon mais qui plus probablement est une fin possible, parmi d'autres. En tout cas, nous pouvons sur ce classement observer qui est champion, qui est relégué, quelle équipe est devant l'autre, etc.

Ici il y a deux points à observer :

  1. pour choisir au mieux la fin de chaque match, nous nous basons sur les statistiques des championnats passés,
  2. pour gommer l'effet de choix particuliers, nous simulons non pas un, mais un grand nombre de championnats.

Résultats des matches

Pour décider du résultat d'un match nous choisissons au hasard, en respectant la répartition observée lors des dernières saisons, en fonction du classement actuel des équipes.

Par exemple, lorsqu'une équipe du bas de classement reçoit une équipe du haut, nous observons l'histogramme suivant (les lignes horizontales donnent les valeurs de chaque résultat sur l'ensemble des matches passés) :

probabilités : équipe faible reçoit équipe forte

Naturellement la répartition 1/N/2 n'est pas respectée et nous voyons que l'équipe la plus forte va le plus souvent gagner, même à l'extérieur.
Et si au contraire nous considérons un match dans lequel c'est l'équipe la plus forte qui reçoit la plus faible :

probabilités : équipe forte reçoit équipe faible

Cette fois, la répartition habituelle en 1/N/2 est renforcée par la supériorité de l'équipe qui reçoit.

Beaucoup de simulations de championnats

Naturellement, un classement final unique est biaisé par les résultats des matches tirés au sort comme décrit ci-dessus. L'idée est alors de recommencer un grand nombre de fois pour obtenir un grand nombre de scénarios plausibles, idéalement toutes les fins de championnat possibles.

Finalement, sur toutes ces fins de championnats produites, nous comptons combien de fois chaque équipe a terminé première, combien de fois elle a été reléguée, etc. Ce sont ces pourcentages qui apparaissent sur les différentes pages du site.

Motivation et discussion des tirages aléatoires pour le football

La première motivation de ces pages sur le championnat de football est purement personnelle : elles doivent me donner l'intuition du devenir de mon équipe préférée sachant que je n'ai pas le temps de suivre le championnat et que je ne veux pas attendre la certitude mathématique du titre ou de la relégation, certitude qui le plus souvent ne survient que le dernier jour du championnat. Il est probable que ceux qui suivent de près le championnat ont déjà ce type d'intuition et n'ont donc rien à apprendre sur ce site.

L'intuition recherchée est donnée par les probabilités estimées par la méthode. Il n'y a pas réellement de prédiction et donc pas de raison de dire a posteriori que la méthode a fonctionné ou s'est trompée : nous donnons des probabilités de chaque événement, nous ne disons pas ce qui va se produire.

Un point qui pourrait faire l'objet d'une discussion est le mode d'évaluation des probabilités : étant donnée une rencontre, quel est la probabilité de chaque score ? La méthode décrite ci-dessus ne prend en compte que les statistiques sur les scores observés durant les championnats précédents, selon le classement des équipes. On pourrait imaginer faire intervenir d'autres éléments : forme ou blessure des joueurs, participation et réussite dans les autres épreuves, etc. Comment le faire ? Ce qui est sûr c'est qu'il faudrait y passer un peu plus de temps que je n'en ai...

Pour aller plus loin sur le hasard et le football

Article de John Wesson : La glorieuse incertitude du football,
Pour la Science (numéro 301 de novembre 2002)

Cet article m'a en partie conforté dans l'idée de tirer le score des rencontres au hasard. Il y est expliqué qu'un score courant comme 0-0 ou 1-0 doit souvent un peu au hasard : un 0-0 n'indique pas que les deux équipes sont exactement de même force et le 1-0 ne signifie pas toujours que l'équipe gagnante était la meilleure. Pourtant, ce dernier score amène trois points à l'équipe gagnante, si bien qu'à la fin du championnat le classement peut être considéré comme aléatoire (comme les classements calculés par notre méthode).

Conférence de Fabien Torre : L'intérêt du hasard, dans la vie de tous les jours et en informatique, INRIA Rennes (mars 2012)

J'y présente la méthode mise en œuvre sur ce site, et d'autres choses aussi.

Simulations de championnats avec des équipes exclues

En mai 2009, Michel Boulier m'a suggéré, merci à lui, de calculer un classement basé sur les matches réels mais en excluant certaines équipes. Son idée était de savoir ce que serait le classement final si les plus gros budgets (PLMB) n'était pas présents.

Voici les résultats de telles simulations pour la saison 2008-2009 :

  • L1 sans Le Mans ou L1 sans Lorient : Marseille aurait été champion ;
  • L1 sans Nancy ou L1 sans Lille : Nantes n'aurait pas été relégué ;
  • L2 sans Reims : Lens n'aurait pas été champion mais 4ème ;
  • L2 sans Lens : Boulogne-sur-Mer n'était pas promu en L1, ce sont Strasbourg et Metz qui remontaient (suggéré par Thomas Feuillet le 19 août 2009) ;
  • L2 sans Clermont : Metz serait 2ème et accéderait à la L1 ;
  • L2 sans Nîmes ni Troyes : Metz serait champion de L2 ;
  • L1 sans Auxerre ni Lorient : Grenoble serait 8ème et non 13ème ;
  • L1 sans Le Havre, ni Paris Saint-Germain, ni Saint-Etienne : Grenoble serait la dernière équipe du championnat ;
  • L1 sans le PSG, ni Lyon, ni Marseille, ni Bordeaux : Caen ne serait pas relégué mais 10ème.

Fabien Torre Valid HTML5! Valid CSS!
site de Fabien Torre (football)