Ce vendredi 15 novembre j’ai eu le plaisir de vous parler de mes retours d’expérience sur la gouvernance des données au cours d’un Datacamp de DAMA-France.
Merci à Jérôme Capirossi https://www.linkedin.com/in/capirossi/ pour cette invitation.
Une heure pour parler de ce vaste sujet, c’est très très court. Et je m’excuse de ne pas avoir pu laisser du temps à de l’échange.
Mais rassurez-vous DAMA-France a proposé d’organiser une table ronde dans la continuité de mon intervention. Sujet à suivre.
Je vous propose, ci-après un partage du support que j’ai utilisé, et mes notes associées avec des compléments que je n’ai pas eu le temps de développer.
Et la vidéo du Datacamp est déjà disponible sur la chaîne de DAMA-France : https://www.youtube.com/results?search_query=DAMA+france
Lien direct : https://www.youtube.com/watch?v=VqrYuo78R4E
Merci pour votre écoute.
Le support
Mes notes
Slide 2 : Le pitch
Au cours de ce datacamp, mon ambition n’est pas d’exposer ce qu’est la data gouvernance, mais de vous parler de mon expérience et de vous apporter de la matière à réflexion en regard à votre propre contexte. Il faut avoir en tête tout au long de mon intervention que « Trouver à l’extérieur le modèle de gouvernance des données applicable chez soi n’existe pas ».
Mon point de vue est forcément subjectif, contextuel .. à prendre ou à laisser tant il existe une diversité de situations … rappel les données sont partout.
Slide 4 : Immersion dans les données
En 15 ans d’immersion dans les données, j’ai forcément été concerné par ce sujet comme acteur direct et indirect avec des besoins, des douleurs, des appuis bienvenus.
Je me suis dit que ces deux appels à l’aide sur la data gouvernance était l’occasion de me débarrasser du sujet.
Compiler mes expériences, prendre du recul, se faire une boîte à outils… et passer le relai à d’autres.
La gouvernance des données est un sujet d’attention maximale.
On connait tous la problématique de la sécurité et du vols de données souvent à cause d’une gouvernance insuffisante, mais cela peut encore aller plus loin.
J’ai été spectateur d’une crise data évitée à temps au sein d’une entreprise où l’absence de gouvernance a failli ébranler voire détruire une part du business mode de l’entreprise.
Cette entreprise industrielle est amenée à fournir des données à ses clients. Et pour la bonne relation client les gestionnaires se sont mis à fournir de plus en plus de données à leurs clients pour les aider, satisfaire des demandes particulières … le tout de façon dispersée, sans contrôle mais partant d’un bon sentiment.
Le cas est je pense encore confidentiel, mais pour vous donner un aperçu de la crise, un acteur tiers s’est rapproché de plusieurs clients de l’entreprise X, je vais l’appeler comme cela. Cet acteur tiers leur a proposé un service d’intermédiation de leur relation avec l’entreprise X. En mutualisation les données des différents contrats clients et les données recueillies par les clients (publiées à tort), il proposait de prendre la main sur la relation, l’optimiser (effectuer des comparaisons entre clients, mutualiser des demandes), imposer des conditions à l’entreprise X (par exemple inverser les décisions de maintenance – en gros passer d’une maintenance contrôlée par l’entreprise X à une maintenance contrôlée par les clients).
Imaginer l’impact sur la politique industrielle de l’entreprise !
Heureusement pour elle, en quelques semaines, une politique de publication des données a été définie et mise en place pour fermer le robinet des données sensibles et rendre impossible cette prise de contrôle.
A garder en tête, une façon de voir la gouvernance des données est comment définir cette politique (sans attendre une crise) et comment passer de cette politique à la fermeture du robinet !
On le voit sur cet exemple, lorsqu’on traite de data gouvernance, on n’est pas dans le cadre rassurant d’un projet.
Ceux qui s’y implique sont courageux.
Slide 6 : DMBOK du DAMA et définition
Je pense que vous connaissez la roue du DAMA dans sa version DMBOK V1 et DMBOK V2.
La data gouvernance y occupe une place centrale. Et je ne peux que vous conseiller de vous en inspirer.
Je vous ai mis aussi ma définition du jour. Je vous laisse lire. J’aurais pu vous en proposer une autre autour des produits de la gouvernance, c’est-à-dire de principes directeurs, des politiques, des choix d’organisation, des normes, des procédures. Certains résument aussi la data gouvernance à la définition de tout ce qui contribue en la confiance dans les données.
Et bien entendu il existe une dualité indissociable et complémentaire entre la gouvernance des données et le data management.
Slide 7 : Compilation de mes retours d’expérience dans un article sur www.datassence.fr
Un rapide retour sur mon devoir d’été. Après avoir répondu aux appels à l’aide comme j’ai pu. Je me suis dit que la matière que j’avais récolté pourrait intéresser d’autres personnes au lieu de rester dans un placard.
Voir l’index de cette matière qui a fait l’objet d’un article dans lequel j’ai puisé pour ce datacamp.
A la suite de cette publication, j’ai eu des retours de personnes qui se sont mises à me raconter leurs histoires. Avec il y a une dizaine de jours un échange fascinant avec un jeune data analyst / BI bien formé au génie logiciel – c’est important (qui avec ses 5 ans d’expérience au sein de 4 entreprises différentes a tout compris) et qui m’a déversé une brouette de constats tous piquants sur les difficultés de son travail et l’absence de gouvernance des données … avant de démissionner et de partir en Australie.
J’ai prévu de faire de tout cela une restitution complémentaire (« Data gouvernance : La parole aux autres »).
Slide 9 : ça n’imprime pas – 1er constat
D’un côté une dynamique data (et un peu aussi de peur de passer à côté de la data) et de l’autre une réalité data.
Avec à gauche : une campagne data, la mise en place d’une équipe centrale data avec plein d’idées (cataloguer les données, lancer une marketplace data interne…), le lancement d’un datalab, et des acteurs que j’ai appelé data « conscients » c’est-à-dire ayant un vécu de crises data et motivés par cet élan data. Avec l’idée de corriger ce qu’ils ont vécus, de passer d’un traitement a posteriori à un traitement a priori, avec comme sujets des problèmes de qualité de données, des problèmes réglementaires (exemple aucune gestion des délais de conservation des données), des problèmes d’absence de référentiel organisation partagé avec un cout de plusieurs millions d’euros pour réaliser une mise à niveau des données d’organisation dans des centaines d’endroits… à la main. Des acteurs volontaires, qui vont au charbon (parfois souvent sans mandat) pour relever des défis data transverses.
De l’autre côté la réalité data…avec les effets d’une communication qui se veut acculturante mais sans application immédiate autrement dit vite oubliée
Des acteurs data du quotidien oublié par l’élan data.
Une boutique data déserte, un datalab non connecté – isolé dans son laboratoire dans tous les sens du terme, dans l’organisation, dans sa communication mode startup qui ne passe pas – et isolé même au sens physique – je leur ai rendu visite et on leur avait trouvé une place dans le recoin d’un site éloigné du siège, des équipes métiers et IT (tout n’est pas noir, le datalab a fini par produire des vraies innovation avec les données … après avoir déménagé !), des projets data que j’appelle de gouvernance a posteriori … à refaire sans cesse (le mythe de Sysiphe) et les fameux acteurs « conscient data » épuisés .. le plus tenance a quand même tenu pratiquement 2 ans avant de renoncer.
Slide 10 ça n’imprime pas – 2ème constat
Avec cette fois ci d’un côté les métiers et de l’autre côté la DSI … qui ne se parlent pas sur les données.
Du côté métier, une initiative data avec ses principaux clients sans inviter la DSI, de la collecte de données avec ses propres moyens, du shadow data à profusion, jusqu’à intégrer des profils data (ingénieur) dans les équipes support … du volontarisme mais dispersé … et des trous surprenant sur sujets qui mériteraient être étudiés sous l’angle data et qui ne le sont pas (exemple du lancement d’un nouvelle activité métier stratégique …).
Et du côté de la DSI, un projet de construction d’un data lake / stack data sans implication formelle du métier, des tensions internes avec le DW finance-gestion. Avec un vrai problème de gouvernance, la valeur des données vient souvent de leur croisement et le croisement avec des données financières est majeur, malheureusement sans gouvernance la mise en commun des forces entre le data lake et le DW n’a pas pu se faire – j’ai tenté du lobbying, des restaurants, pour arriver à obtenir un pauvre test de passerelle avec un démonstrateur montrant que l’on pouvait attaquer les données du DW à partir de l’outil BI du datalake … sans suite.
Dans le même esprit, le burn out de l’architecte en charge de définir une cible technique en termes d’architecture des systèmes de données – sources-entrepôts-BI… (exercice impossible sans au préalable une clarification de la gouvernance).
Des revue data des projets mis en place par l’équipe data centrale mais à côté de la démarche projet de la DSI ! Les projets se trouvent avec une nouvelle démarche à prendre en compte. Autrement dit ils ne font pas l’effort.
Jusqu’au grands projets IT – exemple changement d’ERP qu’il ne faut surtout pas perturber avec cela.
Slide 11 : ça n’imprime pas – La gouvernance n’atteint pas le dernier km
Pour résumer en termes de data gouvernance.
Une stratégie data très faible.
L’errance équipe data centrale (à la DSI, au secrétariat général, nulle part, sans chef …
Problème de politique non ancrée, rédigée par l’équipe central mais sans capacité d’application (dans les processus, dans le code…). J’ai vécu une équipe data gouvernance positionnée dans l’équipe relation client d’une direction digitale … autant dire que personne ne les écoutait.
L’errance CDO avec turn over des CDO – j’ai vu défiler un CDO métier non légitime COMEX, un CDO IT, un CDO juriste, un CDO venu de l’externe vite parti…)., des CDO et des acteurs data coincés entre des réunions où ils sont invités pour la forme (difficile d’y mettre son grain de sel) et à l’initiative de réunions où on vient pour faire plaisir (pas de levier sur les participants attendus … sans gouvernance)
L’errance des data owners (voire absence – nomination qui traine) – sans prise sur les données, avec pour finir par se débarrasser du problème avec la nomination de data owners délégués …
Les développeurs non intégrés à la gouvernance … où sont les règles de gestion préconisées par les politiques ?
On est typiquement en face du problème du dernier km (entre une belle politique et son implémentation dans des process, du code), avec les questions d’intégration, d’alignement, d’adhésion (ce n’est pas mon problème … j’ai d’autres chat à fouetter) avec la gouvernance d’entreprise, la gouvernance IT.
Attention tout n’est pas noir, mais l’ensemble amène un sentiment de frustration, d’impression de brouillon, de pouvoir faire mieux… avec une bonne gouvernance.
Slide 12 : Co-construction de la gouvernance des données
Le 2ème morceau choisis : Comment travailler ensemble sur les données ?
Le contexte une entreprise de plus petite taille 1 000 personnes, culture digitale.
Avec deux principes pivot pour la définition de la gouvernance des données :
1) Celui ou celle qui applique, qui endosse la responsabilité de gouvernance est à l’origine de sa définition. Cela couvre la définition de règle que l’on va retrouver dans des politiques, des contrôles à intégrer dans des procédures et processus existants, l’expression de besoins en termes de fonctions de gouvernance (exemples de la traçabilité – lineage, de l’observabilité)
2) Et le tout est mis en œuvre au travers de cas d’usage que l’on va collecter et piloter au travers d’un portefeuille.
Slide 13 : Co-construction les groupes de travail
Des groupes de travail (GT) ont été constitués par affinité (rôles, domaine, cas d’usage), dont c’est à noter avec des membres du COMEX (avec des décisions et besoins de gouvernance, comme, assumer d’aller au-delà de la durée réglementaire de conservation de certaines données, un cas d’usage rêvé par un des membres du COMEX avec la nécessité d’une gouvernance conjointe entre la direction financière et la direction technique qui ne pouvant se traiter qu’en COMEX).
Les DEV ont beaucoup participé, avec plein d’idées, comme de rendre visible la gouvernance dans les tableaux de bord. Mais aussi des irritants, comme la difficulté d’accès aux métadonnées (schémas de données utiles à leurs développements) et en retour ne pas savoir où déposer leur métadonnées (éléments de lineage, règles des politiques embarquées, standards appliqués comme FHIR dans la santé..).
Avec un cycle de travail trimestriel : alternance de séances des GT et de séances collectives de coordination entre GT (présentation des travaux, revue des dépendances, cohérence d’ensemble, rôles à instancier).
Nous étions 4 à accompagner la démarche avec un rôle d’animateur, de qualification de l’existant (on ne part pas d’une page blanche) de scribe, de force de proposition, d’instruction de points à approfondir, de construction progressive de la cible.
Slide 14 : Co-construction les produits / livrables supports à la gouvernance des données
Le tout pour produire les éléments de gouvernance (plan de gouvernance et points d’exécution de la gouvernance) : politiques, stratégie data, choix d’outils, règles à appliquer…
Alignés sur les cas d’usage recueillis au sein d’un portefeuille piloté c’est-à-dire qui faisait l’objet d’une revue particulière.
- Par cas d’usage, identification des points de gouvernance – exemples : alimentation du dictionnaire de données et des points de lineage, déclinaison des politiques
- A-t-on les moyens nécessaires pour assumer la gouvernance associée aux cas d’usage (moyens de data gouvernance – outils, rôles …)
- Quelle couverture des domaines métier (pas de domaine orphelin) ?
- Est-ce que des cas d’usage sont bien intégrés aux grands projets de transformation – de digitalisation (nouvel ERP, refonte digitale…) … qui ne manquent pas et pour qui la gouvernance des données n’est pas la priorité (par expérience, il faudra se battre pour y imposer le volet gouvernance)
- A-t-on des cas d’usage qui parlent à tous les niveaux de l’organisation (du local, au COMEX en passant par le middle management) ?
- A-t-on des cas d’usage qui tirent de la coopération de plusieurs domaines, processus ?
- A-t-on des cas d’usage qui touchent notre écosystème de partenaires, de tiers externes, d’initiatives open data ?
Pour illustration, j’ai été le scribe du GT du domaine RH. Avec autour de la table, le responsable des politiques RH, que l’on a décliné sous forme de politique des données RH puis en impacts sur le SIRH, on a appelé cela des points d’exécution de gouvernance (réglementaire, conservation des données, mode de gestion d’un vivier de candidats, protection des données des salariés, liens référentiels dont organisation, mobilité des données dans le cadre de l’expatriation…).
Slide 15 : Les freins à la gouvernance des données
Pour terminer sur la partie morceaux choisis, et pour partage, je vous propose une revue des 7 freins que j’ai systématiquement rencontrés sur le sujet de la data gouvernance.
Slide 16 : La data gouvernance éloignée du business
Le 2ème frein représente le vécu de la data pour la data, on crée une filière data, à côté (le dialogue métier – IT n’est déjà pas facile et on ajoute d’un 3ème interlocuteur).
Avec un coup de gueule … j’entends une recrudescence de communication – grandes pensées sur la data avec des messages comme … « Mapper la gouvernance des données à la valeur métier… Je vais jouer les vieux râleurs, mon premier métier analyste programmeur. Où on vous demande de programmer mais aussi d’analyser un métier !
Slide 18 : Le manque de moyens
La gouvernance des données à la main impossible, la données est partout.
Slide 19 : La fuite devant les responsabilités
Appréhender les données, avoir une prise sur les données dont on est responsable n’est pas toujours facile, elles sont enfouies dans des systèmes, accessible via des experts, dupliquées, insaisissable comme les horcruxes dans Harry Potter, sous le manteau de la shadow data …
L’accessibilité des données est souvent mentionné comme le sujet n°1 à traiter par la gouvernance des données.
Il y a aussi la confusion ownership et propriétaire des données
Les données ne sont la propriété d’aucune direction ou département particulier (politique générale des données).
Le data owner n’est pas le propriétaire (on ne peut pas être propriétaire d’un actif d’entreprise).
Par contre on a besoin de responsables, de garants des règles de gouvernance sur les données (le tête sur laquelle taper !).
Slide 20 : La croix de la transversalité
Je ne vais pas en rajouter mais tous ceux qui ont occupé des postes transverses comprennent ce que je veux dire.
Slide 22 : Ma boîte à outils data gouvernance
En conclusion, je voudrais vous partager ce que j’ai appris de tout cela.
Je l’ai traduit dans une matrice. A vous de me dire si vous en comprenez le sens et l’intérêt.
Il existe déjà des formes de gouvernance dans l’entreprise : la gouvernance d’entreprise en tant que tel et la gouvernance IT (avec COBIT par exemple).
Où situer la data gouvernance et sa déclinaison SI ?
Slide 23 et slide 24 : Ma boîte à outils data gouvernance
La data gouvernance doit être alignée et intégrée avec la gouvernance d’entreprise et la gouvernance IT. Elle n’est pas « à côté ».
Une parenthèse, on entend beaucoup de débat entre une gouvernance centralisée ou décentralisée des données.
C’est pour moi un faux débat.
On peut avoir suivant les cas, les situations du centralisé et du décentralisé en même temps (par exemple une gouvernance centralisée de publication des données et des gouvernances décentralisées sur la qualité de certaines de données). Ce qui compte c’est l’alignement, l’intégration.
Slide 25 et 26 : Ma boîte à outils data gouvernance
Illustrations : sur la publication de données de consommation d’énergie, dans le cadre de la LTECV (loi de transition énergétique pour la croissance verte) et sur l’inclusivité des séniors dans l’offre de service d’une entreprise.
NB : RGAA – Référentiel général d’amélioration de l’accessibilité.
Avec aussi en fond de pensée : On ne peut pas à chaque cas d’usage créer un nouveau système (silo !) … syndrome classique un problème une solution / un système (loi de Conway étendue)
Slide 28 : Ma boîte à outils data gouvernance
L’ambition de l’outil.
Poser des points de gouvernance.
Exemples de points de gouvernance :
- Des règles de contrôle et de mise en qualité des données,
- Une politique de sécurité des données intégrée à la politique globale de sécurité,
- Un volet avis data dans les dossiers d’urbanisation et d’architecture SI,
- Des rôles data à faire porter et décrit dans des fiches de poste,
- Des moyens de traçabilité des mouvements de données intégrés dans les infrastructures IT,
- Un processus de promotion et d’industrialisation des initiatives locales data,
- Un référentiel des métadonnées,
- …
Slide 28 : Pour conclure
On n’en n’a pas parlé … mais à noter LE cas d’usage qui bouscule (dans le bon sens) le sujet de la data gouvernance avec le buzz IA (exploit j’ai tenu un webinaire sans prononcer le terme d’IA !).
Avec l’IA générative, l’urgence de définir et de mettre en œuvre des stratégies de gouvernance des données n’a jamais été aussi grande. Avec des sujets comme :
- Le garbage in garbage out (qualité des données)
- Le besoin de contextualisation -de métadonnées
- La gestion des données en – continuité – « temps réel »
- La problématique du data drift (décalage des jeux de données par rapport à la réalité)
- …
On peut aller plus loin aussi avec la gouvernance des données pour la gouvernance par les données (exemple du sujet « data poor » – les oubliés de programme sociaux à aller chercher par les données …et l’idée de governance by data infrastructure (au sens infrastructure de la connaissance – voir l’ouvrage de Christine L. Borgmann – Qu’est-ce que le travail scientifique des données ? Big data, little data, no data – https://books.openedition.org/oep/14692
Une dernière parenthèse, à l’échelle des Etats, de notre société c’est un sujet très très sérieux, critique. Voir par exemple le data gouvernance acte de l’Europe, les sujets de souveraineté des données.
L’ambition de ce datacamp a été plus modeste et s’arrête à ma compétence au domaine plus confortable des S.I. d’entreprise.
Je l’avais dit en introduction le sujet est difficile.
J’ai essayé de faire de mon mieux … sans me / vous noyer. J’aurais encore beaucoup de choses à dire.
Mais je vais m’arrêter là.
Tous droits réservés – datassence.fr. Cet article a été publié originellement sur www.datassence.fr.
Comments are closed.