Press "Enter" to skip to content

Fiche de lecture de l’ouvrage : DATA ET SPORT, LA REVOLUTION : Comment la data révolutionne le sport – Editions de l’Observatoire. Auteurs Yannick Nyanga et Aurélie Jean

Dernière modification le 4 octobre 2023

Référence : https://www.editions-observatoire.com/content/DATA_ET_SPORT_LA_REVOLUTION

Voir sa découverte dans la revue du mois de juillet et août : https://www.datassence.fr/2023/09/11/revue-data-du-mois-juillet-et-aout-2023/#_ftnref1

L’ouvrage est remarquable par son ancrage dans la réalité, sa prise de recul et sa pédagogie.

Avec une tentative non évidente de proposer un tour d’horizon du sujet data (avec le problème des buzz word, du foisonnement de concepts, de technologies… IoT, IA, métavers… associés. Il fallait oser).

Bon je suis partisan pour aimer le sport et aussi la data !

Mais de fait, le résultat fait échos à des situations et attitudes qui pourrait avoir leur place en entreprise. Comment y aborde-t-on le sens des données pour l’action ?

Et il a le mérite également de remettre la data à sa place. Non la data ne va pas sauver le monde, oui l’humain à toujours sa place (mais il faut qu’il la gagne).

C’est aussi la première fois que je lis un tel témoignage de quelqu’un qui raconte sa vie en relation aux données. Cela change des ouvrages techniques, méthodologiques de conseil sur les données… largement le reflet de ce site ! Et c’est sûrement l’angle le plus important (auto conseil … pour un datassence plus humain !).

Au travers des lignes de l’ouvrage, on perçoit l’importance de la prise de recul par rapport aux données, de l’exercice difficile mais au combien important de penser données et ainsi d’éviter de se laisser dominer, submerger, de se reposer aveuglement sur les données.

Je m’attendais un ouvrage dominé par les technologies de captures et d’analyse de données au service du sport dans sa version mécanique, physique, physiologique, biomécanique. Et ce n’est pas la cas. J’ai découvert un ouvrage, où on s’attaque aux émotions, à l’instinct, à l’intuition … au french flair du rugby et à la relation humaine entraîneur – joueur.

Nouvelle portée des données qui amène à se poser en tant que data informaticien, des questions profondes !

On ne sera jamais tous des internationaux de la data.

Mais a minima, on sera tous confronté aux données … autant les maîtriser !

Si vous cherchez un exercice de data literacy … n’hésitez pas à engager un débat par rapport à votre propre contexte après avoir fait lire cet ouvrage.

Dans ce sens, ci-après les éléments en partage de ma lecture… forcément largement interprétative.

Dans cette lecture, j’indiquerai parfois par NB, des compléments de précision, de réflexion de mon point de vue.

Allez les petits ! (Pour ceux qui ont vibré sur les commentaires de Roger Courderc)


Le livre démarre par « Le rugby, la data et moi », le parcours de Yannick Nyanga (chapitre 1) :

  • D’abord hors de la data : il n’a pas le profil qui correspond aux métriques attendues, il pourrait être exclu par les données et pourtant il devient international de Rugby
  • Puis dans la data : il se reconstruit grâce aux données et surmonte un arrêt dans sa carrière, puis une blessure pour redevenir international.
  • Et enfin avec la data : il se reconverti comme entraîneur adjoint et directeur sportif et à ce titre s’appuie sur les données, se confronte à les expliquer à ses joueurs et en vit les résultats sportifs.

Y. Nyanga nous parle directement de son parcours dans le livre, son discours éclaire à la fois son effort et son ressenti comme individu face aux données, mais aussi sa vision d’ensemble du rôle des données, par rapport à un projet collectif (l’équipe, le staff).

Il manie avec équilibre, la cadre analytique des données et la place du french flair … arme redoutable pour les adversaires (et parfois, hélas aussi contre soi). Quelques extraits p35 à 37 « Je ne comprenais pas ces indicateurs mesurés sur les performances des joueurs, ni même la logique qui faisait d’elles des éléments déterminants pour la qualité de mon jeu.

… Durant l’été 2009, je m’entraînais comme jamais auparavant. J’avais compris ce que signifiaient les données collectées sur mes performances et comment les faire évoluer dans la bonne direction. ».

Et plus loin p42 et 43 « J’apprends ainsi à mes joueurs espoirs du Racing 92 à penser contre eux-mêmes et à s’interroger sur leurs actions afin de s’extraire des indicateurs de performances comme unique référence… Le joueur qui est le sujet de cette data doit assimiler la logique analytique qui agit sur lui pour éventuellement la défier, voire pour la contredire. Ainsi l’analytique sportive ne fera que grandit pour être encore mieux exploitée.»

Une citation qui restera p42 : « La data n’est pas bonne ou mauvaise en soi, mais elles est ce qu’on en fait d’elle – comment on la collecte, comment on l’interprète et comment on la raconte ».

P45, bel exemple du Stade Toulousain et de l’idée de sa vision du rugby (son identité bien connue) appuyée par les données. Et vision partagée à tous les niveaux de toutes les catégories du club et aussi par toutes les équipes dirigeantes et de communication.

La data n’est pas « à côté », elle est avec des profils data intégrés.

Le chapitre 2 « La data dans le sport » propose l’exercice difficile d’un tour d’horizon de ce qu’est la data, comment la data est collectée, interprétée, analysée.

L’ouvrage introduit l’idée de « point de données » qui correspond à l’objet (le joueur, l’équipe, le match) auquel on va attacher les données collectées (hum avec une petite confusion entre métadonnée et donnée. Là où l’auteur parle de métadonnée il faut entendre donnée. Les métadonnées sont réservées aux données sur les données, c-à-d par exemple, où, quand, par quel dispositif de collecte, par qui, dans quelle condition… les données ont été recueillies).

Mais l’auteur a le mérite de mettre en avant l’importance d’une véritable stratégie de collecte des données. Avec tous les moyens et efforts nécessaires (de la bonne définition des données – qu’est-ce qu’un plaquage positif, en passant par la définition des catégories de données à collecter – exemple des données externes au joueur correspondant aux charges, chocs perçus, les choix de discrétisation – ou de transformation de réponses qualitative en quantitatif – exemple l’estimation d’une douleur musculaire ramené sur une échelle, jusqu’à la labélisation à la main des données pour les algorithmes d’apprentissage). NB : cette réflexion sur la stratégie de collecte est paradoxalement une chose pas si fréquente dans certaines entreprises dans lesquelles on a l’impression que la donnée est là et il suffit de la prendre !

L’auteur revient aussi sur l’influence de la collecte (de mesures) sur le joueur avec parfois des comportements influencés (j’ai lu en parallèle de la parution de l’ouvrage, l’interview des auteurs dans l’Equipe, ou Y. Nyanga reconnaissait avoir vu des rugbymans sprinter pour rentrer au vestiaire à la mi-temps, pour rajouter une mesure supplémentaire à leur performance en nombre de sprints sur le terrain). Extrait 😊 :

« Vous évoquez aussi les limites de la collecte des données. Vous parlez de rugbymen qui, à la mi-temps, font un dernier sprint pour rejoindre les vestiaires. Et augmentent ainsi leur pic d’accélération et de vitesse. Yannick, ça vous est arrivé ?

Y. N. : Oui… Même à l’entraînement, tu sprintes pour aller boire. Ça te fait une accélération de plus… »

L’article est réservé aux abonnés (dont je suis !), je vous mets le lien au cas où : https://www.lequipe.fr/Tous-sports/Article/Aurelie-jean-et-yannick-nyanga-auteurs-de-data-et-sport-la-revolution-la-data-doit-reveler-les-emotions/1417498

Ensuite est abordé l’usage des données :

  • Suivant le point de vue où on se place (le joueur, l’entraîneur, le staff médical),
  • L’auteur distingue le data analyst du de data scientist. Le data scientist est d’abord un expert data qui va répondre aux problèmes, besoins de décision du staff, faire tourner des modèles et produire des résultats à l’aide des données. Le data analyst est d’abord un expert d’un problème précis (exemple les coups de pied arrêtés dans le football) et comprend les données et résultats produit par le data scientist, il va alors éclairer les joueurs avec ces éléments.

Pour aller plus loin sur le rôle de data analyst (cité par l’auteur, le rôle de Nicolas Jover à Arsenal) : https://www.skysports.com/football/news/11670/12465120/nicolas-jover-arsenals-set-piece-genius-is-transforming-their-threat-from-dead-ball-situations et https://archive.ph/20210819095122/, https://theathletic.com/2764470/2021/08/12/the-arsenal-signing-you-wont-know-but-who-will-play-a-crucial-role-this-season/ et https://m.allfootballapp.com/news/All/Man-Utd–Arsenal-hired-set-piece-coaches-but-what-do-they-do/2651504

Et data scientist (cité par l’auteur, le rôle de Jérémy Cheradame auprès du staff de l’équipe de France de rugby) : https://actu.fr/normandie/alencon_61001/coupe-du-monde-2023-a-quoi-sert-jeremy-cheradame-expert-en-stats-du-xv-de-france_60044089.html et https://www.techxv.org/IFER-Webconference-Le-metier-de-Data-Scientist-dans-le-rugby et https://theses.hal.science/tel-04064954

Exemple d’usage anticipatoire : un nouveau joueur est recruté. Par ses données il va rentrer dans telle catégorie et pour cette catégorie on sait que plus de 70% des joueurs ont telle blessure spécifique. Ce qui devient une alerte pour le nouveau joueur

On verra plus loin que ce pouvoir via le classement du joueur peut avoir des effets non désirés.

Le chapitre 3 « Les limites de la datafication du sport » peut se résumer en une phrase (p95 et 96) « Nous devons nous assurer que le champ des possibles reste large au profit du joueur et de la pérennité de la magie du sport ».

Cette idée de champ des possibles est à garder en tête dès que l’on va manipuler des données. Par nature travailler avec des données s’est enfermer quelque part un sujet dans une représentation formelle. Tout l’art va alors d’être à la fois conscient que toute manipulation de données peut induire un risque de réduction de ce champ et que l’on peut briser ce risque en s’attachant élargir ce champ.

Quelques illustrations de limites présentées dans l’ouvrage :

  • Le biais de collecte – non représentativité de la réalité qui va éliminer certaines populations. Elargir le champ en prenant en compte des populations sous représentées.
  • Le risque de trop d’homogénéisation et de réduction du jeu en se focalisant sur les caractères dominants (catégories, moyenne, médian), qui va éliminer les événements rares mais au rôle important, qui va rendre trop prévisible son jeu, qui va écarter des talents hors des catégories prévues (les données vont cacher des potentiels au lieu de les révéler). Elargir le champ en éliminant la confusion entre causalité et corrélation. Il existe une mesure qui montre que plus il y a de coup de pied donné, plus il y a des chances de gagner (NB : c’est le moment d’observer l’évolution de l’usage des coups de pied au cours des matchs de la coupe de monde de rugby en cours). Voir cela non comme une causalité (on tape au pied et cela nous fera gagner), mais comme le moyen d’ouvrir des espaces libres de jeu, qui sont un des facteurs de victoire potentielle (p91). L’homogénéisation est importante pour le collectif mais elle doit aussi accompagner la spontanéité, l’intuition, l’instinct – voir le chapitre suivant.
  • L’absence de prise en compte du contexte. Exemple p90 du contexte du ruck. Constat : « plus le nombre de rucks rapides (moins de 2,5 secondes) chez une équipe est élevé, plus elle a de probabilité de remporté la victoire ». Mal appliqué c’est au contraire un danger. Il faut prendre en compte le contexte du ruck. En attaque effectivement la rapidité compte pour profiter de la désorganisation. En défense au contraire, la lenteur compte pour se réorganiser.
  • L’effet bulle (bien connu dans les réseaux sociaux), c-à-d le fait d’être enfermer dans ses catégories qu’utilisent les algorithmes (NB Rappel le pouvoir c’est de classer). Elargir le champ en identifiant des signaux faibles, prémisses (cité p86).
  • Le paradoxe de la mesure (déjà cité), la manière de collecter les données va orienter le comportement de celui qui sait qu’il est mesuré. (NB :rien n’est dit comme élargir le champ dans ce cas ?).
  • Le risque d’incohérence de la mesure – p87 (NB et de reproductibilité), directement liée au mode de naissance des mesures. Lorsque l’on constate que différentes techniques et protocoles utilisés, amènent à des valeurs différentes. Elargir le champ en diversifiant les moyens de mesures.
  • Le risque de prédiction autoréalisatrice.
  • Le risque de se perdre dans les amas de données à la croissance exponentielle.

Quand on parle de limite, il faut penser au couple données et algorithmes (qui peuvent amplifier les limites des données : filtres, tris, choix…).

Reste, le point clé pour l’auteur (Rugbyman dans son cœur) : comment éviter la perte du « french flair » dans un cadre de données ? Avec la crainte de se retrouver dans la situation vécue par les Irlandais à une certaine époque : Trop d’analytique -> Perte du flair -> L’équipe devient prévisible -> Ses adversaires savent l’attaquer -> Elle devient vulnérable … l’analytique va à l’encontre de l’objectif de victoire (p105).

Comment accorder analytique et flair ?

Chapitre 4 « La data au service de l’intelligence situationnelle »

Le jeu mobilise trois intelligences : analytique (apprendre à capter et mobiliser les bonnes informations sur le terrain, caractéristiques des passes, des coups de pied effectués … lois du rugby), sensorielle (de situation – sentir les joueurs adverses et ses partenaires – s’adapter à l’environnement) et créative (incluant l’intelligence émotionnelle – « penser différemment face à un problème jusqu’ici inconnu »).

Les deux dernières correspondent à ce qu’on peut rapprocher du flair, de l’intuition et de l’instinct.

Les questions clés autour des données :

Comment mobiliser l’analytique des données pour sa propre intelligence analytique (donner du sens au données) ?

Comment allier cette dimension analytique avec les deux autres intelligence ?

Eléments de réflexion par rapport à ces questions (extraits p115) :

  • « Les données ne sont pas stricto sensu intelligentes, mais elles sont la source d’une certaine intelligence… »
  • « Les données seules dans leur coin n’ont quasiment aucune valeur… »
  • « C’est pourquoi chercher à collecter un maximum de données sans réfléchir à leur traitement et à leur usage est une erreur »
  • « En réalité, la data ne peut devenir « intelligente » que grâce à l’intelligence humaine… »

Sur le lien analytique et flair (extraits p116 et 117) :

« La data met en équation des actions de la vie a priori non analytiques comme le ressenti, le bon sens, ou encore les interactions entre individus … », « Ces grandeurs sont du ressort du raisonnement analytique, mais elles reflètent quelque chose d’humain que seules les deux autres composantes de l’intelligence peuvent capturer. C’est en cela que la data peut être au service des autres intelligences… ».

Le lien repose sur la mise en mesures du flair (le a priori non analytique). Mesures prise en compte analytiquement. Et qui doivent être retransmises par un humain (l’entraîneur) à un autre humain (le joueur) parce que cela mobilise les deux autres intelligence et que ce n’est pas robotisables ! (on est au cœur du coaching).

Exemple repris p124 du RPE (Rating of perceived exertion) – NB : https://en.wikipedia.org/wiki/Rating_of_perceived_exertion qui permet de transformer le ressenti d’un joueur en analytique qui permettra ensuite à l’entraîneur de déterminer un cadre d’entraînement dans lequel le joueur pourra progressivement s’autodéterminé (intensité, fréquence des exercices). Le tout dans une boucle vertueuse.

Le précepte est connu, encadrer c’est libérer. Ici l’encadrement analytique par les données c’est libérer l’expression du french flair vu comme un enjeu stratégique :

  • Le cadre analytique donne une vision du contexte (jeu, joueurs, équipe, environnement – exemple météo), qui peut s’automatiser et se transmettre une fois un certain apprentissage effectué.
  • Il limite en fixant des repères, les effets des émotions qui brouillent les joueurs.
  • Ce cadre est issu d’une réflexion stratégique. Exemple créer du désordre dans certaines situations pour ouvrir des espaces de liberté
  • Ces espaces de liberté sont alors exploités, déclinés en actions par les joueurs en mobilisant les trois intelligences (dont le fameux flair)
  • Actions et ressenti sont ensuite analysés pour enrichir le cadre (la boucle est bouclée).

NB hors ouvrage : à comparer avec les débats du « pilotage » des cyclistes aux ordres des oreillettes  … ou encore sur le dialogue coach-joueurs en temps réel en match initié dès 1956 en NFL par un système de radio – https://touchdownactu.com/192313/la-faq-du-foot-des-radios-dans-les-casques-des-joueurs/- https://touchdownactu.com/192313/la-faq-du-foot-des-radios-dans-les-casques-des-joueurs/

La data éclaire mais ne décide pas.

Deux exemples :

  • La prise en compte des données par le joueur n’est pas quelque chose d’immédiat, de direct qui le transformerait. Il y a besoin d’un médiateur humain, le coach qui sait les mettre en contexte et connait la singularité/sensibilité du joueur,
  • Les données ne sont pas capable de décider de choix structurel fort. Pour viser la victoire, il faut viser le désordre. L’analytique est seulement là pour éclairer cela. Rappel sur la fin du chapitre 3, comment retourner le risque de trop d’analytique qui va à l’encontre de la victoire. L’idée est la suivante, le cadre analytique, doit « favoriser » des espaces de liberté, pour que l’intuition, l’instinct, s’expriment – le flair. Pour créer ces espaces de liberté, il y a besoin de créer du désordre (apparent) que l’analytique va permettre de rechercher, analyser– à l’exemple de la mesure de l’usage des coups de pied. On est ici face à un paradoxe amusant, l’ordre analytique et au service du désordre pour laisser la place au flair ! et répondre à l’objectif : la victoire.

« S’éclairer par la data : un exercice complexe » – p120

  • Vous n’y échapperait pas, il y a besoin d’un langage commun sur les données, les types d’analyses qui peuvent être faites (statistiques par exemple),
  • Ce langage commun entre les joueurs, les entraîneurs et les experts du jeu et les experts data, se crée au fil du temps, des dialogues, du quotidien, des expérimentations (entraînements) (NB : ce n’est pas un exercice de formation ou de grande messe « à côté », vite appréciée sur le moment, vite oubliée).

Chapitre 5 « Quel avenir pour l’intuition orientée par la data ? »

Les données comme levier pour l’intuition.

Le principe déjà évoquée est de formaliser les sentiments, les émotions, le ressenti. De les rendre analytique.

Une fois cela fait, l’idée est que cela va décomplexer les joueurs (lever la timidité, l’orgueil), permettre leur expression et leur partage.

«P137 La data est comme un moteur des émotions. Cette phrase de Nicolas Jover exprime parfaitement ce que les données peuvent faire pour les sportifs : libérer, déclencher et alimenter des émotions nécessaires pour permettre, l’exploit, le surpassement et la résilience. » .

L’expression analytique des émotions, permet de leur donner du sens, pour l’action et d’en tirer de la confiance.

L’expression d’éléments a priori non analytique en analytique est une première bascule. NB : A rapprocher de la transformation apportée par les émoticônes dans l’expression des émotions. Une capacité d’expression est née, on peut/doit maintenant faire l’effort/de réfléchir à la façon d’exprimer explicitement ses émotions autrement que naturellement et par rapport à un interlocuteur cible visé, avec les conséquences associées…(voir les nombreuses référence sur le sujet. Par exemple : https://www.radiofrance.fr/franceculture/podcasts/la-grande-table-idees/emojis-revolution-du-langage-ou-cheval-de-troie-des-gafam-7131038)

NB : il y a aussi une deuxième bascule pour nous informaticiens, les données permettent le bon fonctionnement de processus, on peut en tirer des statistiques… tout cela est bien formalisé et on maîtrise. En s’appropriant les émotions, les données jouent dans la cour des comportements humains. Qu’est-ce que nous informaticiens pouvons alors maîtriser ? Cela rejoint le sujet connu depuis longtemps et plus large du mariage des sciences sociales et du numérique. Qui fait quoi, que fait-on ?

Attention, l’auteur le dit, mais ne donne pas d’exemple (plus loin il évoque l’amour), tous les sentiments ne sont pas capturables. Il reste une part humaine de mystère !

Il faut également considérer une troisième bascule, générationnelle cette fois. Les jeunes générations sont dans un contexte de données, de mesures (NB : de quantified self). Il y a une rupture entre l’ancienne génération et la nouvelle (NB : voir l’exemple dans le cyclisme, au fil des interviews de J. Alaphilippe, de R. Bardet et de leur relation aux capteurs de puissance par exemple par rapport à la génération la plus récente, critiquée gentiment pour n’avoir les yeux que dessus. J’aimerais bien avoir l’avis de spécialistes, sur cet aspect par rapport aux courses débridées auxquelles on assiste depuis quelques temps. Merci à Remco Evenepoel, Tadej Pogacar, Mathieu Van der Poel !).

A noter que par rapport cette datafication, l’auteur met en avant, le danger de l’individualisation par les données. Toujours de plus en plus attaché à ses données personnelles (jusqu’à la granularité de ses gestes) on risque d’oublier d’avoir une vue plus large de son environnement, de ses coéquipiers, de ses adversaires, du match vu dans son ensemble et non pas au travers des vidéos uniquement centrées sur ses actions. NB : personnellement j’appelle ces données personnelles … les égo-données 😉. Avec le risque de renforcement des œillères par les algorithmes de personnalisation.

L’intuition n’est pas que par rapport à son comportement, mais aussi par rapport à son environnement (P141).

En conclusion – éléments repris de l’ouvrage :

L’expansion des data est loin d’une fin annoncée . La data est doublée d’une force multiplicative (la portée des données est croissante) et elle est son propre catalyseur (plus on a de données, plus on va définir des moyens qui vont permettre de répondre à de nouveaux besoins et nécessiter encore plus de données, ainsi de suite). Cela conduit à caractère exponentiel des données qu’il faut maîtriser. Et c’est un véritable défi qui demande de bien le contrôler… et donc des efforts de compréhension et d’explication.

Face à la masse de données, le danger est de se passer du lien humain de l’entraîneur entre l’analytique des données et le joueur (évoqué dans le § La data éclaire mais ne décide pas et le premier exemple avec le besoin d’un médiateur humain).

La masse de données fait que les résultats analytiques ne sont pas vérifiables humainement et la complexité des algorithmes en jeu fait que les résultats ne sont pas explicables (un des défis de l’IA).

Dans cette logique, je traduis la fin de l’ouvrage à ma façon : attention à ne pas perdre les talents hors de la norme (les signaux faibles) dans la masse des données … et là il reste encore beaucoup à faire, concevoir et expliquer !

Y. Nyanga aurait-il été international de rugby et un des auteurs de cet ouvrage … dans un monde de data ?!

FIN de lecture.


Tous droits réservés – datassence.fr. Cet article a été publié originellement sur www.datassence.fr.

L’attribut alt de cette image est vide, son nom de fichier est Datassence_Logo1_1.png.

Les commentaires sont fermés.