Dernière modification le 21 mars 2025
Pour partage une suite de notes issues de la préparation d’un atelier sur le pouvoir des données, dans le cadre d’un cycle savoir penser data (voir : https://www.datassence.fr/2025/02/25/notes-sur-la-gouvernance-des-donnees-suite/#_ftn18 ).
Le sujet est aussi vieux que les données existent.
Mais il a pris une nouvelle dimension par l’intensification de la datafication, par le nouveau statut des données (Big data par exemple), par leur prise d’autonomie (data product par exemple).
On a atteint un point de bascule, où les données forment un maillage, une toile dans laquelle la multiplication des représentations de notre monde sont capturées. Et qui dit capture dit potentiellement contrôle donc pouvoir (pour le bénéfice de quelqu’un, soi, un tiers, un ennemi…).
L’actualité US – Trump / Musk et l’organisme DOGE exacerbent ce sujet : « En fait, Musk se contrefout du gouvernement comme de l’efficacité. Il n’est là que pour siphonner des données qui lui assureront une puissance sans limite. ». Cette citation est extraite de l’article de ce jour de Hubert Guillaud – https://danslesalgorithmes.net/2025/03/04/doge-lefficacite-vraiment/.
S’il y a un seul article à lire sur le sujet, c’est celui-ci !
Les données y sont présentes à chaque coin de phrase.
Comme ancien informaticien dans une banque, j’y ai aussi découvert la prise en main de SWIFT par les Etats-Unis … édifiant.
Et lorsque vous lisez tout ce qui peut être mis en œuvre lorsque vous maîtrisez les données (voir toutes les tentatives et actions des « soldats » du DOGE), alors on ne peut ignorer que les données sont au cœur du pouvoir et par raccourci ont le pouvoir !
Face à cela, comme informaticien et pour employer un terme d’actualité, c’est la sidération !
Autre extrait : « Musk et son équipe pourraient agir délibérément pour extraire des données sensibles, modifier des aspects fondamentaux du fonctionnement de ces systèmes ou fournir un accès supplémentaire à des acteurs non contrôlés…Pire, les données peuvent également être modifiées tout comme le fonctionnement de logiciels critiques. Pire encore, le Doge peut désormais cacher les preuves des modifications que ses équipes accomplissent. « Ils pourraient modifier ou manipuler les données du Trésor directement dans la base de données sans que plus personne ne puisse vérifier les modifications » ».
On le sait de base, les données ne sont pas des faits, les données ne sont pas neutres, mais là on touche au cœur de la gestion des données : leur intégrité.
On est au-delà du piratage, on est dans la manipulation de données qui vont orienter selon les souhaits de leur manipulateur le fonctionnement de processus.
Je vous laisse lire l’article d’Hubert Guillaud, remarquable et qui vous laisse en état de choc !
Une brève prise de recul suite à cette lecture et la préparation de mon atelier sur le pouvoir des données, ont allumé la question du contre-pouvoir aux données.
En première réflexion à chaud, je distinguerais trois types de contre-pouvoir. Un contre-pouvoir activiste, volontariste, dont je ne suis pas expert, mais que je vois évoqué dans différents articles et entretiens, comme refuser par différents moyens l’emprise des données. Un contre-pouvoir législatif, réglementaire, de gouvernance … mais qui vole en éclat actuellement du côté des US. Et un contre-pouvoir qui est plus de mon domaine, l’hétérogénéité des environnements de données qui de fait introduit des freins, des limites à un usage sans barrière des données.
Je reviendrai sur ce dernier point dans la fin de mes notes.
Ces notes sont organisées de la façon suivante :
- Introduction à l’atelier
- 1) La prise de pouvoir des données
- 2) Inventaire de pouvoirs des données
- 3) Quand les données sont au cœur d’un jeu de transfert de pouvoir
- 4) Commentaire sur l’idée de contre-pouvoir … parce que le monde des données n’est surtout pas une datasphère que l’on peut investir si facilement !
- Conclusion : maîtriser le pouvoir des données, c’est d’abord maîtriser leur définition
- Annexes
Le tout en cours d’illustration par une suite de dessins, aimablement générés par l’IA DALL·E 3 de Microsoft Bing 😎.
Il s’agit d’une première version de notes voire juste un plan à ce stade. Elles viendront s’enrichir au fil du temps. Restez connectés !
Bonne lecture.
Introduction à l’atelier
Comment les données deviennent des leviers de pouvoir ?
C’est une banalité, les données en elles-mêmes n’ont pas de pouvoir.
Par contre la façon de les penser et de les utiliser permet d’exercer des formes de pouvoirs que seules les données permettent.
Cet atelier s’inscrit dans le cycle savoir penser données (voir Annexe).
Le champ d’exercice des données est large.
Ce champ va naturellement de pair avec la digitalisation, l’informatisation des systèmes.
L’idée ici est prendre une casquette data est d’identifier dans ce champ, comment les données vont être un levier de pouvoir.
Traiter toutes les situations de pouvoir des données n’a pas de sens tellement le champ d’exercice est aussi ouvert et dynamique.
Il existe toutefois des patterns que l’on retrouve souvent et qui permettent de s’exercer à la pensée données.
Le but de l’atelier est de s’exercer sur ces patterns à partir de données en contexte.
Dans la suite de ces notes, on parle souvent de personnes, individus pour lesquels un pouvoir est en jeu. Mais cette idée de pouvoir s’applique également à des objets (matériels ou abstraits). Par exemple on peut disposer de données de trace pour un objet matériel (une voiture), un objet abstrait (une candidature), un individu. D’une façon générale il faudrait parle d’objets au sens large concernés par des jeux de pouvoirs.
POINT D’ATTENTION ET DE PRECAUTION : le thème du pouvoir, ce qui relève réellement de pouvoirs, comment cela nous touche est extrêmement sensible et ne relève pas de considération techniques. Le pouvoir n’est jamais garanti, son exercice relève de pratiques humaines objet de nombreux débats (philosophique, politique, sociologique, psychologique). La vision données présentée ici, propose des leviers techniques. Rien ne dit qu’à la fin cela aboutira à une forme de pouvoir.
1) La prise de pouvoir des données
Le sujet n’est pas récent. Déjà en 1979 Le monde diplomatique consacrait un dossier sur la « guerre des données ».

(Le monde diplomatique 1979)
Depuis les données ont mangé le monde.
Leur portée est en expansion continue (datafication*).
- Objets, comportements,
- Activités, secteurs, métiers
- Caractéristiques, particularités
- Granularités
- Quantitatif
- Qualitatif
- Enregistrements (son, images…)
- Langages, écrits
Et les données appellent des données…
* Ou autre terme dataisation

On a atteint un point de bascule.
Les données initialement vues comme un sous-produit de processus, enfouies dans des systèmes prennent la lumière.
Elles prennent leur autonomie, elle deviennent LE produit. On parle de big data. Les entreprises data centric deviennent des géants économiques. Les brokers de données s’enrichissent. La datafication mange le monde. Les données prennent plus en plus de poids et donc de pouvoir. Il y a bascule.

Cela a conduit à une multiplication exponentielle des environnements de données, là où naissent et sont exploitées les données (par exemple caractérisés dans les Systèmes d’Information par des processus, des systèmes de collecte, des chaînes de traitements applicatives, des systèmes de gestion de données, du data management, etc.).
Et tous ces environnements forment une toile de capture des données… et de ce qu’elles représentent.

On verra dans la dernière partie qu’on est plutôt en face d’un patchwork !
2) Inventaire de pouvoirs des données
Quels sont ces pouvoirs ?
Les vieilles recettes :
- Fonctionnement (automatisation) des processus, activités, services et tâches, décisionnel
- Dématérialisation
- Données -> Informations -> Connaissances
- Observations scientifiques
- Statistiques, mesures, métriques
2.1) La digitalisation de processus et d’activités : la qualité d’exécution jusqu’à la manipulation de processus
La digitalisation, l’informatisation comme vous voulez, change l’exercice de pouvoirs.
Il suffit de lire tout ce qu’il peut se dire sur le pouvoir algorithmique (voir Cathy O’Neil…).
L’idée ici est d’adopter un angle vue données.
Les données dans les entreprises c’est d’abord un sous-produit de processus, d’activités et de services automatisés. Avec un zeste de pilotage au travers des systèmes décisionnels.
Lorsqu’on apprend les données dans un cursus d’informaticien (rédiger des exigences, des spécifications, concevoir un modèle de données), un premier exercice est d’identifier les données que l’on va trouver dans un processus et que l’on va devoir gérer (souvent sous forme de transactions).
Le pouvoir des données porte sur la qualité de fonctionnement de ces processus et activités.
Vous pouvez rendre performant, détourner en votre faveur ou faire dérailler un processus en étant capable de manipuler les données dont il dépend.
La recette : un processus et ses activités automatisés, via des données support attachées aux objets de gestion du processus -> pouvoir des données : contrôle du déroulement du processus
Et rappel : penser données dans le contexte d’un processus, c’est cela (identifier les données concernées), mais cela peut aussi s’inverser, c’est-à-dire partir de données et concevoir le processus comme les actions et l’organisation nécessaires pour faire évoluer le statut des données (par exemple un dossier de candidature que l’on doit faire progresser de son dépôt à son traitement).
2.2) La dématérialisation d’objets (matériel, abstrait) : le contrôle algorithmique d’objets
La dématérialisation est une mise en données plus ou moins complète d’un objet existant.
L’objet numérique traduit l’objet en données jusqu’à dans certains cas prendre sa place. Les exemples sont nombreux, factures, transactions financières, relations – rencontres, courriers, contrats, CV, médias, monnaies, étiquettes de prix…
Cette mise en données ou numérisation n’est pas neutre. Elle fait rentrer l’objet dans l’univers de la programmation. Autrement dit, tout un contrôle programmatique peut alors être appliqué (contrôle d’accès – exemple des DRM, filtrage, classification, expiration, définition des usages autorisés…).
L’objet hérite des propriétés du bain numérique, ce qui le transforme.
La recette : un objet d’un univers donné, dématérialisable sous forme de données -> pouvoir programmatique sur l’objet.
Exemple dans le monde du travail – le calcul algorithmique des salaires ou revenus à partir de données choisies pour représenter le travail effectué : https://www.columbialawreview.org/content/on-algorithmic-wage-discrimination/
Exemple à surveiller : la monnaie numérique.
Pouvoir lié : le pouvoir normalisateur
En projetant un univers sous forme de données on va définir ce qu’il faut en retenir et ce qu’il sera exclu. Autrement dit ce qui sera visible ou invisible.
C’est une première normalisation qui en termes de pouvoirs va favoriser une certaine représentation au détriment d’autres (voir les débats par exemple sur la lecture automatique de CVs, le sujet des discriminations – exclusions de minorités, voir aussi dans les processus automatisés d’entreprise les errances de certaines situations « hors process »).
Il existe un deuxième niveau de pouvoir, lorsque la normalisation s’impose de l’extérieur au travers de standards de fait ou établis, de normes de représentation des données. Ceux qui définissent ces standards vont fixer et imposer ce qu’ils considèrent comme important. Ils disposent d’un pouvoir normalisateur étendu et imposent leur vision (façon de voir l’univers en données).
Certaines normes essaie de modérer cela en permettant d’étendre la norme avec des données customs (voir par exemple dans le domaine de la santé HL7).
2.3) Statistiques, mesures, métriques
Le rôle des statistiques et de leur pouvoir est un sujet historique et récurrent depuis leur naissance.
La définition de métriques, leur qualité, leur dépendance (voir les arbres de performance ou KPI-Metric tree – https://www.datassence.fr/2024/01/18/revue-data-du-mois-decembre-2023/?highlight=arbre%20de%20performance#_ftn5 ), leur déviance et donc leur pouvoir ont également largement été commentés.
Quelques références :
Voir le site de l’Insee qui regorge d’illustrations de l’importance des statistiques – https://www.insee.fr/fr/information/1302194 et le courrier des statistiques https://www.insee.fr/fr/information/3622502 .
Voir aussi les ouvrages de référence sur le pouvoir des nombres, des statistiques. Exemple « La politique des grands nombres- Histoire de la raison statistique » – Alain Desrosières – https://www.editionsladecouverte.fr/la_politique_des_grands_nombres-9782707165046
Voir aussi « Trust in Numbers: The Pursuit of Objectivity in Science and Public Life » – avec une première partie dédiée au pouvoir des nombres – https://press.princeton.edu/books/paperback/9780691208411/trust-in-numbers?srsltid=AfmBOooGErPTH_vK1PAVSpwdljQ403Ud2iwfvUgkD8p31FJzYUywOOmZ#preview
Et des ouvrages de débat comme : « Stat Wars – Le côté obscur de la force des statistiques » au presses universitaires de Rennes – https://pur-editions.fr/product/9742/stat-wars ou encore « The Tyranny of Metrics » de Jerry Z. Muller – https://press.princeton.edu/books/hardcover/9780691174952/the-tyranny-of-metrics.
Les nouvelles recettes :
- Transformer un produit en service
- Intermédiation, désintermédiation
- Payer avec des données
- Tracer, surveiller
- Créer des doubles numériques
- Data science : décrire, prédire, prescrire
- Décupler la capacité de classer
- Capturer et asservir
- Occulter
- Régurgitation « intelligente » artificielle
La suite de ces notes s’intéresse aux nouvelles recettes.
2.4) Transformer un produit en service
- Prendre un produit -> le penser en service
- Définir les données : d’utilisation et de contrôle
- Y coller des capteurs et asservisseurs
- Exemple : les moteurs d’avion Rolls Royce (on ne vend plus un moteur mais des heures de vol).

2.5) Intermédiation, désintermédiation
- S’emparer des données liées à la relation entre des prestataires de services et des clients (ou tiers)
- Pour peser sur la relation en mutualisant les données (imposer ses conditions)
- Exemple : Doctolib, UBER, Airbnb, Amazon,
- REX vécu : Tentative dans le domaine de l’énergie, appropriation des données de gestion de distribution de l’énergie dans des collectivités pour renverser la relation de prestation (avant je dicte mes conditions de gestion de distribution, après on me dicte les conditions de gestion de distribution).

2.6) Payer avec des données
- Mettre en place un service digital gratuit (data centric)
- Récolter un maximum de données sur un maximum de « contacts » (personnes),
- Construire un double digital- identité (personnaliser, asservir)
- « Vendre » les données (régie publicitaire, 2nde vie)
- Exemple : les entreprises digitales, Google, Réseaux sociaux, OpenAI…

2.7) Tracer, surveiller
Ce n’est pas une nouvelle forme de pouvoir. Mais les données (au sens numérique) permettent de nouvelles recettes.
- Définir les données d’un ensemble d’objets à tracer sur une certaine portée
- Utiliser des traces numériques, disposer de moyens de captures de données
- …jusqu’à piloter (asservir), traquer (voir l’exemple en date de propriétaires de Tesla (source : https://www.numerama.com/cyberguerre/1929201-chasse-aux-tesla-un-site-seme-la-panique-en-publiant-les-donnees-personnelles-des-proprietaires.html ).


2.8) Capturer … asservir : le coup de filet data
- …(à développer)
…

2.9) Copies numériques
- Profils numériques
- Doubles / jumeaux numériques
- Avatars
- Exemple, projet de jumeau numérique de la terre ”On June10th (2024), the European Union’s Destination Earth system was launched aimed to model and monitor our planet, and simulate natural phenomena with unprecedented accuracy.” – https://destination-earth.eu/
- Jouer avec ces jumeaux numériques (simulations, planification … asservissement)

Copies numériques :
- Dans le temps

Copies numériques :
- S’applique à tout et n’importe quoi … de son frigo à sa personne

2.10) Data science : big data
- Décrire, Prédire, Prescrire
- Reconnaître (identités, patterns – formes –comportements – associations – similarités, corrélations)
- Simuler
- Jusqu’à l’idée folle « La fin de la théorie : le déluge des données rend la méthode scientifique obsolète » – Chris Anderson – Rédacteur en chef de Wired – 2008 – https://www.wired.com/2008/06/pb-theory/

2.11) Classer est un pouvoir, les données le décuple
- Par le choix des nomenclatures (domaines de valeur des données)
- Par la capacité à recueillir des masses de notations
- Par la micro-classification de masses de données (data science) et de façon dynamique
- Comme matière première d’algorithme de scoring…

2.12) Occulter
- Par l’absence de données (dont volontaire – données rendues inaccessibles voire détruites).
- Par le choix des nomenclatures (domaines de valeur des données)
Dans un monde numérique, ne plus exister en termes de données devient un handicap.
(cf. les opérations DOGE Trump / Musk – suppression des jeux de données sur l’inclusion)

2.13) Intelligence artificielle … par les données
- Pas de données pas d’IA
- Pas de maîtrise des données pas de maîtrise de l’IA
- Courses aux données par tous les moyens (data workers)
- (rappel les données n’ont pas de sens sans contexte)

Le super pouvoir des données
La formule : (Dataisation) X (Portée universelle : pas de frontières pour les données) X (Anciens et nouveaux pouvoirs)

3) Quand les données sont au cœur d’un jeu de transfert de pouvoir
Les données ne sont pas innocentes.
Dès lors que des données vont être en jeu, que des acteurs vont chercher à les posséder, en les récupérant, en les collectant, un transfert de pouvoir va s’exercer au bénéfice de ces acteurs.
Si on reprend les exemples précédents :
- Dans le cas de la « servicification » d’un produit, un transfert de pouvoir s’est effectué de l’utilisateur du produit vers celui qui maîtrise le service. On peut parler d’asservissement. Avant : vous êtes maître de l’usage du produit que vous possédez. Après : vos usages sont sous le contrôle de celui qui vous vend le service. Et les données sont au cœur de ce contrôle. Avec des exemples connus, où le véhicule que vous utilisez via un contrat de location longue durée, est immobilisé parce que vous n’avez pas payé la dernière échéance. Voir aussi « La multiplication des capteurs sur les machines agricoles en donne un exemple. Le flot de données qu’ils produisent offre un pouvoir nouveau aux constructeurs, à la fois sur les agriculteurs, et sur les distributeurs qui sont partiellement contournés (Oui 2021 ; Brunier 2022). https://calenda.org/1228258 ».
- Dans le cas de la désintermédiation, le pouvoir est transféré à l’intermédiaire qui est venu s’immiscer entre vous et votre « client ». Et cela par le simple fait de la récupération des données de la relation « client ». Avant : vous êtes maître de votre relation. Après : l’intermédiaire peut vous dicter des actions à mener vis-à-vis de cette relation.
- Quand vous payez avec des données, vous cédez du pouvoir à celui qui est payé (en majorité de vous proposer de la publicité mais cela peut aller plus loin).
- Dans le cas de la traçabilité, surveillance, le transfert de pouvoir est évident. Vous donnez le moyen à celui qui récupère les données d’exercer un contrôle comportemental (les comportements sélectionnés sont représentés par des données). Il y a transfert du pouvoir de l’individu (d’un objet plus largement) observé vers un observateur.
- Dans le cas du classement, de la prédiction voire de la prescription, le transfert de pouvoir est également évident, les données vont vous classer dans le présent et dans le futur sans intervention de votre part au profit d’un acteur qui saura l’exploiter.
- La capacité d’influence des conversations produites par l’IA générative. Voir les exemples d’actualité (tentative d’influence des moteurs d’IA par des activistes Russes, ou l’idée de marketing d’influence des moteurs d’IA pour promouvoir une marque). Dans le cas de ces IA il y a potentiellement une suite de transfert de pouvoir : des auteurs de la maîtrise de leurs productions sous forme de données vers les moteurs d’IA qui dans leur apprentissage en prennent le pouvoir sous la forme de générations, puis des moteurs d’IA vers des influenceurs qui vont chercher à orienter les conversations produites à partir d’une sélection de données.
Ce transfert de pouvoir est explicite dans le cas de vol de données. C’est ce que cherchent les hackers, avoir un pouvoir sur leurs victimes et c’est ce pourquoi les données s’achètent, se volent.
Avec également des effets insidieux de transfert, quand la pratique du quantified self transfert le pouvoir mais aussi le risque aux pratiquants versus la responsabilité d’examen et de traitement des données normalement du ressort des praticiens de santé.
Pour terminer, le plus fort, dès lors que vous (personne, objet) faite partie d’une population cible, si un acteur data s’est accaparé d’un marché concernant cette population, jusqu’à en être incontournable (parce qu’il est capable de collecter des données à grande échelle et par effet réseau), alors l’ensemble de la population lui a « transféré » un pouvoir (d’où l’importance de la gouvernance de populations). Dans cette situation, il a alors le pouvoir de gérer qui appartient à la population (vous y inscrire sans que cela soit à votre connaissance – exemple des profils fantômes de Facebook, contraindre votre présence – voir le cas des jeunes praticiens et la quasi obligation d’être sur Doctolib, vous occulter).
4) Contre-pouvoir : le monde des données n’est pas une datasphère que l’on peut investir si facilement
A la lecture de l’article d’Hubert Guillaud, il m’a semblé que ce qui était décrit relevait dans certains cas d’un vue idéale du monde des données.
C’est-à-dire un tout, uniforme, fait de données (les data), auxquelles on a accès et que l’on peut modifier relativement facilement, récupérer pour les rassembler puis les exploiter sans trop de difficulté (à l’arrache peut-être, mais cela se fait).
On peut voir ce tout, ce milieu comme une nouvelle couche dans laquelle on vit, dans laquelle on consomme et produit des données et que les agents de Musk s’approprient pas à pas au fur et à mesure qu’ils investissent les organismes fédéraux.
Certains utilise le terme datasphère* pour désigner cette couche (analogie à la troposphère …on « respire » et on « rejette » tous des données).
« La datasphère peut se concevoir comme la représentation d’un nouvel ensemble spatial formé par la totalité des données numériques et des technologies qui la sous-tendent, ainsi que de leurs interactions avec le monde physique, humain et politique dans lequel elle est ancrée. » – https://shs.cairn.info/revue-herodote-2020-2-page-3?lang=fr – Du cyberespace à la datasphère. Enjeux stratégiques de la révolution numérique – 2020 (voir références).
Mais ce terme datasphère n’est pas adapté. Il connote une dimension d’homogénéité qui n’est pas représentative de la réalité des données.
Les données sont partout, mais elles sont extrêmement différenciées.
Elles naissent et existent dans une multitudes d’environnements. Environnements par construction différents, imparfaits en termes de technologie, de modélisation, de conception, d’architecture, de fonctionnement, de gouvernance. Le tout forme un milieu hétérogène et disloqué (l’effort numéro 1 des architectes des Systèmes d’Information est justement de faire que tout cela marche ensemble).
Exemples d’environnements de données : un processus ou un service et les données associées, une application, une chaîne applicative, un système décisionnel, un progiciel, un datalab, un espace de stockage dans un data center, une data platform, des instances clouds mises en production, l’idée de dataspaces, des systèmes de collectes de données, un bac à sable d’expérimentation scientifique, la data shadow…
Le contre-pouvoir est ici l’hétérogénéité, la diversité, la non interopérabilité, la non accessibilité, la non standardisation des environnements de données (bref la réalité des données). C’est paradoxal, en tant qu’architecte de données, je vise à tout le contraire, alors que c’est finalement un atout quand il y a un push data.
Parenthèse générale sur les données : ce qui est frappant dans l’histoire des données, c’est ce problème de la multitude de ces environnements (en nombre, en diversité, en emprise). La problématique data est passée du big data au multi data.
Concrètement, soit les agents DOGE sont extrêmement brillants et ils sont capables d’appréhender tous les environnements de données auxquels ils sont confrontés, qu’ils ne connaissent pas et dont ils ont licencié les sachants… pour satisfaire leurs objectifs. Soit ils font n’importe quoi pour arriver à n’importe quoi.
Localement, ils peuvent arriver à certaines fins. Mais globalement, leur prise en main des données issues d’une multitude d’environnements différents est forcément un casse-tête et une débauche d’énergie gigantesque pour en saisir chaque sens.
Sauf à croire à une sorte de dataisme [1] (ce qui semble être le cas), c’est-à-dire à récupérer les données telles quelles et les faire ingurgiter dans un moteur d’IA parce que c’est de là que sortira la (leur) vérité. On le sait cette approche ne marche pas. Redite : les données sont hétérogènes (en définition, en qualité, en format, en histoire…), sans connaissance de leurs environnements (métadonnées a minima) elles n’ont pas de sens, faire croire que tout cela va constituer une vue unifiée de données que l’IA saura décoder est un mythe (NB : une telle vue unifiée des données est déjà un mythe à l’échelle d’un seul S.I. d’une entreprise, c’est encore plus un mythe à l’échelle de N organismes).
Mais bon, après tout la vérité on s’en moque ?!
[1] David Brooks – éditorialiste du New York Time – https://www.nytimes.com/2013/02/05/opinion/brooks-the-philosophy-of-data.html
Conclusion : maîtriser le pouvoir des données, c’est d’abord maîtriser leur définition
Qu’est-ce qu’une donnée ?
Quelle est son environnement de vie, de sa naissance à sa disparition ?
Les réponses à ces deux questions forment les bases de la maîtrise des données.
Si vous maîtrisez la définition des données et leurs environnements de vie, vous avez la maîtrise de leur pouvoir… (développement à venir).
Une première piste ici : « Qu’est-ce qu’une donnée ? » P. Rivière – Courrier des statistiques de l’Insee – 31/12/2020 – https://www.insee.fr/fr/information/5008707 ;
Une autre piste, la description de la face cachée des données vue de l’informaticien (analyste, développeur, architecte) : comment sont conçus les systèmes de données, les environnements de données ?
Et une réflexion (ambitieuse ?!) en cours sur l’idée data hétérotopie à partir du concept développé par M. Foucault.
« L’hétérotopie, concept repris par Michel Foucault dans sa conférence Des espaces autres (1967), désigne des espaces réels qui coexistent avec les espaces ordinaires, mais qui fonctionnent selon des logiques, des règles et des significations différentes ».
* Terme, formé des éléments grecs topo-, de topos « lieu» et hétér(o), hétéro-, « autre» on entend généralement par hétérotopie un « lieu autre » (https://fr.wikipedia.org/wiki/H%C3%A9t%C3%A9rotopie ).
Le concept ne fait pas référence aux environnements de données. Même si dans son introduction lors d’une conférence prononcée le 14 mars 1967 à Paris, M. Foucault évoque le stockage de l’information comme exemple d’emplacement (https://shs.cairn.info/revue-empan-2004-2-page-12?lang=fr).
Mais ce concept est une formidable grille de lecture d’un tout hétérogène formé de N lieux de vie. Pour nous les environnements de données dans lesquels on vit.
A suivre…
Annexe-1 – le cycle penser données
Au cours de mes pérégrinations data, je me suis rendu compte de deux faiblesses : 1- La méconnaissance d’une définition opérationnelle des données et 2- La non pratique d’outils de pensée données au-delà de se référer à des cas d’usage classiques.
Le cycle penser données vise à combler une part de ces faiblesses. Il se veut être un pont entre le business (les métiers) et l’univers des données.
Il comprend un ensemble d’outils de pensée, dont les patterns sur le pouvoir des données proposés dans cet ensemble de notes.
Voir une liste plus large sur ces outils ici : 17) La stratégie data c’est d’abord savoir « penser data » https://www.datassence.fr/2025/02/25/notes-sur-la-gouvernance-des-donnees-suite/#_ftn18
Annexe-2 – références datasphère
« La notion de « sphère des données » a d’abord été théorisée par Stéphane Grumbach dans le cadre conceptuel de l’anthropocène ».
- Revue Hérodote : géopolitique de la datasphère https://shs.cairn.info/revue-herodote-2020-2?lang=fr – Article : Du cyberespace à la datasphère. Enjeux stratégiques de la révolution numérique – https://shs.cairn.info/revue-herodote-2020-2-page-3?lang=fr
- Bergé J. S. et Grumbach S. (2016), « La sphère des données : objet du droit international et européen », Journal du droit international (Clunet).
- Cattaruzza A. (2019), Géopolitique des données numériques. Pouvoir et conflits à l’heure du big data, Paris, Le Cavalier Bleu.
- Du cyberespace à la datasphère. Le nouveau front pionnier de la géographie – Frédérick Douzet et Alix Desforges (2018) – https://journals.openedition.org/netcom/3419
- Politique de la datasphère, enjeux juridiques, éthiques et démocratiques – https://geode.science/geopolitique-de-la-datasphere/
- Les Big Data Et L’Éthique , Le cas de la Datasphère Médicale – Jérôme Béranger
- Kevin Limonier (30 juillet 2022). Terrains numériques : la datasphère, nouveau(x) terrain(s) exploratoire(s) de la géographie ? Poussières d’empire. Consulté le 8 janvier 2025 à l’adresse https://doi.org/10.58079/v7vi – https://journals.openedition.org/bagf/9459
Tous droits réservés – datassence.fr. Cet article a été publié originellement sur www.datassence.fr.

Les commentaires sont fermés.