Dernière modification le 4 mars 2024
Cette revue est basée sur un ensemble de publications du mois de septembre 2023, issues de sources en lien avec le sujet Data. A piocher suivant vos centres d’intérêts.
Pour ce mois de septembre, un très rapide retour sur le salon Big Data et IA, la course continue dans le développement des data platforms, data et sport et toujours les sujets autour de la gouvernance des données et du data mesh.
Et pour le reste, un rapide tour d’horizon d’une sélection d’articles data.
Sommaire :
- Retour sur le salon big data et IA des 25 et 26 septembre
- La course aux investissements dans les plates-formes de données est continue et à hauteur de centaines de millions de dollars
- Une réflexion toujours à suivre : comment chez O.Reilly sont vues les évolutions structurelles du monde des données
- Data et sport
- Data et automobiles
- Identity – entity resolution : un sujet clé pour et par les données
- Data gouvernance – data management : challenges – actif – portails de données – observabilité – lineage
- Actualité du data mesh
- En Vrac (green data, données et territoires, cas d’usage data, la data sauve le monde, data terrorisme, virtual data room, data et IA)
Retour sur le salon big data et IA des 25 et 26 septembre
J’y ai participé comme visiteur.
Un salon au succès incontournable – plus de 15 000 visiteurs annoncés … et ils étaient bien là au vu de la densité présente.
Un salon très orienté technique, aubaine d’un tour d’horizon up to date (data) ! Avec parfois quelques acteurs métier perdus dans les files d’attente des ateliers.
Une incontestable richesse. L’accès aux éditeurs et intégrateurs dans un même lieu.
Difficile d’en faire une synthèse, mais la course à la maîtrise des données proposée par les éditeurs de plates-formes de données et les intégrateurs est toujours en plein développement et cela n’est pas prêt de s’arrêter.
Pour revoir l’événement c’est ici : https://www.bigdataparis.com/
La course aux investissements dans les plates-formes de données est continue et à hauteur de centaines de millions de dollars
https://www.datanami.com/2023/09/13/data-fabric-firm-denodo-raises-336-million/
https://techcrunch.com/2023/09/21/secoda-secures-16m-to-expand-its-data-cataloging-platform/
Et https://www.datanami.com/2023/09/05/databricks-versus-snowflake-comparing-data-giants/
Une réflexion toujours à suivre : comment chez O.Reilly sont vues les évolutions structurelles du monde des données
Source : https://www.oreilly.com/radar/structural-evolutions-in-data/
Deux réflexions :
1) Sans appel, le phénomène Hadoop tiré par le buzz est remis à sa place : échec parce que non adapté au contexte d’une grande majorité des entreprises par rapport à leurs données (volume, structuration), mangé par l’évolution des performance des technologies traditionnelles et par les nouveaux / modern data stack, coûteux – NB en intégration et TCO, non adapté au besoin de l’IA
2) La perspective des simulations comme environnement pour tester des hypothèses, des idées, un espace de solutions, des systèmes complexes : nouvel axe de l’analyse des données.
Data et sport
Avec en tête de liste : la publication du livre DATA ET SPORT, LA REVOLUTION : Comment la data révolutionne le sport – Editions de l’Observatoire. Auteurs Yannick Nyanga et Aurélie Jean
J’en parle ici au travers d’une longue fiche de lecture : https://www.datassence.fr/2023/09/21/fiche-de-lecture-de-louvrage-data-et-sport-la-revolution-comment-la-data-revolutionne-le-sport-editions-de-lobservatoire-auteurs-yannick-nyanga-et-aurelie-jean/
Et aussi :
La data et l’IA modifient le football : https://management-datascience.org/articles/25041/
Le rôle de l’IoT dans le sport au cœur de la 5e édition de l’IoT Business Hub : https://www.journaldunet.com/ebusiness/internet-mobile/1525169-le-role-de-l-iot-dans-le-sport-au-coeur-de-la-5e-edition-de-l-iot-business-hub/
Data et automobiles
Un automobile il y a 30 ans c’était une dizaine de capteurs. Aujourd’hui cela peut aller à plusieurs centaines de capteurs. Et le tout connecté à distance.
Avec le défi et les enjeux de data privacy.
Sources :
https://gizmodo.com/mozilla-new-cars-data-privacy-report-1850805416
https://www.lebigdata.fr/confidentialite-donnees-voitures-intelligentes
https://www.datanami.com/2023/09/11/cars-the-next-data-privacy-battleground/
Identity – entity resolution : un sujet clé pour et par les données
Savoir rattacher les données aux bons objets est un sujet naturellement clé. Et cela n’est pas toujours aisé. Il est même possible de tricher (à l’exemple d’une gentille personne aux US qui avait attaché sa montre connectée à son chien pour récupérer plus facilement la réduction de prime promise par son assurance en fonction de son activité physique).
Comment identifier une même entité à partir de différentes sources de données (sujet bien connu dans le monde des vues 360° client ou d’autres « objets ») :
Et quand cela tire des enjeux sociétaux :
Data gouvernance – data management : challenges – actif – portails de données – observabilité – lineage
Challenges gouvernance des données : Toujours plus de sources de données et donc de volume, l’essor des données structurées (et avec la capacité immédiate des IA pour en tirer des données structurées), la recherche de données demande de plus en plus d’effort (effet volume), le contexte lié aux données est essentiel (NB : sans contexte une donnée ne peut être transformée en information et est sans valeur – sur ce sujet voir aussi https://towardsdatascience.com/power-of-context-in-data-driven-storytelling-b4dc48a402e ), la gouvernance des données doit être holistique.
Challenges data management : démontrer la rentabilité des investissements en données, la pression réglementaire, la cybercriminalité et les besoins en data de l’IA. Avec comme réponses : gouvernance des données et data management même combat, le rôle de l’architecture d’entreprise, le partenariat avec les métiers, faire le tri dans tout ce que cela tire – avec en particulier sur les rôles data – extrait « The next one is the creation of new roles. In some of my publications, I’ve already shared the results of my investigations about the number of data management roles mentioned in DAMA-DMBOK2. How many roles do you think DAMA-DMBOK2 describes? It is more than 100. So, the question is: “Do we need more roles?” However, new developments in data architecture, like data mesh, require new functions like “data product owner” and so on. ». NB j’ai mis en gras le chiffre impressionnant de rôles possibles … à débattre de la pertinence, mais l’expérience montre que parfois seulement quelques rôles explicites suffisent.
Data management. Source : https://datacrossroads.nl/2023/09/13/challenges-with-data-management-trends-part-1/
En avance du mois d’octobre – la partie 2 de l’article est ici : https://datacrossroads.nl/2023/10/09/challenges-with-data-management-trends-part-2/
Les données comme actif dans le bilan financier des entreprise : défi de leur comptabilisation
Portail de données : la facilité d’accès aux données est essentielle (constat des CDO en 2021 – étude IDC pour Informatica 49% jugent l’accès aux données comme un sujet difficile https://www.informatica.com/about-us/news/news-releases/2021/12/20211209-informatica-unveils-2021-state-of-the-cdo-study.html ).
– Un tour d’horizon des fonctionnalités d’un portail de données : https://www.opendatasoft.com/fr/blog/quelles-sont-les-fonctionnalites-essentielles-de-votre-portail-de-donnees/
– Et une prise de recul par rapport au web sémantique dans sa capacité à rendre accessible les données https://tdan.com/the-data-centric-revolution-rdf-is-too-hard/31103
Data observability : indispensable pour gouverner
Un tour d’horizon, ne pas confondre data monitoring, data profiling, data quality et data observability. Source : https://blog.masterdata.co.za/2023/09/05/data-observability-a-game-changer-for-data-driven-decision-making/ et https://www.precisely.com/blog/data-quality/how-data-observability-helps-to-build-trusted-data
Et pour finir l’intérêt du data lineage dans la gouvernance. Source :https://www.opendatasoft.com/fr/blog/benefices-data-lineage-pour-strategie-gouvernance/
NB : et l’occasion d’un peu de publicité sur une contribution sur ce sujet, à laquelle j’ai participé dans le cadre de l’open method d’architecture d’entreprise Praxeme https://www.praxeme.org/data-lineage-assurer-la-tracabilite-des-donnees/ )
Actualité du data mesh
L’actualité de Zhamak Dehghani à l’origine de l’idée de data mesh.
Au travers de la société qu’elle a créé : Nextdata (https://www.nextdata.com/).
A suivre son développement, dont l’ambition de concilier partage de données et sécurité.
Avec au centre l’idée de conteneur (support à un data product) comprenant à la fois les données et métadonnées, ainsi que les politiques de données instanciées permettant de contrôler tout au long de son cycle de vie le produit de données.
L’autre idée clé est d’inverser le paradigme classique où les données vont aux traitements par les traitements vont au données.
Source : https://techcrunch.com/2023/09/28/nextdata-is-building-data-meshes-for-the-enterprise
En Vrac (green data, données et territoires, cas d’usage data, la data sauve le monde, data terrorisme, virtual data room, data et IA)
1) Green data
https://www.bortzmeyer.org/marseille-datacenter.html
2) Données et territoires dans le cadre de la démarche de l’événement Numérique en Commun[s]
https://opendatafrance.fr/nec-2023-donnees-et-territoires/
3) Cas d’usage
https://diginomica.com/rethinking-retail-picnic-delivers-data-driven-approach
https://www.presse-citron.net/comment-les-start-up-exploitent-les-donnees-de-votre-compteur-linky/
4) La data sauve le monde
https://www.weforum.org/agenda/2023/09/healthcare-data-africa-displaced-people/
5) Data terrorisme
https://www.lebigdata.fr/les-data-terrorists-volent-les-donnees-de-vos-enfants-pour-le-dark-web
6) Virtual Data room
https://dataconomy.com/2023/09/14/how-virtual-data-rooms-are-revolutionizing-due-diligence/
7) Data et IA
https://www.lebigdata.fr/prophecy-data-analyst-enginee
RDV maintenant en novembre pour la revue et les actualités d’octobre
Les commentaires sont fermés.