Press "Enter" to skip to content

Revue data du mois (septembre 2023)

Cette revue est basée sur un ensemble de publications du mois de septembre 2023, issues de sources en lien avec le sujet Data. A piocher suivant vos centres d’intérêts.

Pour ce mois de septembre, un très rapide retour sur le salon Big Data et IA, la course continue dans le développement des data platforms, data et sport et toujours les sujets autour de la gouvernance des données et du data mesh.

Et pour le reste, un rapide tour d’horizon d’une sélection d’articles data.

Sommaire :

Retour sur le salon big data et IA des 25 et 26 septembre

J’y ai participé comme visiteur.

Un salon au succès incontournable – plus de 15 000 visiteurs annoncés … et ils étaient bien là au vu de la densité présente.

Un salon très orienté technique, aubaine d’un tour d’horizon up to date (data) ! Avec parfois quelques acteurs métier perdus dans les files d’attente des ateliers.

Une incontestable richesse. L’accès aux éditeurs et intégrateurs dans un même lieu.

Difficile d’en faire une synthèse, mais la course à la maîtrise des données proposée par les éditeurs de plates-formes de données et les intégrateurs est toujours en plein développement et cela n’est pas prêt de s’arrêter.

Pour revoir l’événement c’est ici : https://www.bigdataparis.com/

La course aux investissements dans les plates-formes de données est continue et à hauteur de centaines de millions de dollars

https://www.journaldunet.com/solutions/dsi/1524813-databricks-leve-500-millions-de-dollars-de-plus-pour-assouvir-son-appetit/

https://www.datanami.com/2023/09/13/data-fabric-firm-denodo-raises-336-million/

https://techcrunch.com/2023/09/20/database-startup-motherduck-lands-52-5m-to-grow-its-duckdb-based-platform/

https://techcrunch.com/2023/09/21/secoda-secures-16m-to-expand-its-data-cataloging-platform/

Et https://www.datanami.com/2023/09/05/databricks-versus-snowflake-comparing-data-giants/

Une réflexion toujours à suivre : comment chez O.Reilly sont vues les évolutions structurelles du monde des données

Source : https://www.oreilly.com/radar/structural-evolutions-in-data/

Deux réflexions :

1) Sans appel, le phénomène Hadoop tiré par le buzz est remis à sa place : échec parce que non adapté au contexte d’une grande majorité des entreprises par rapport à leurs données (volume, structuration), mangé par l’évolution des performance des technologies traditionnelles et par les nouveaux / modern data stack, coûteux – NB en intégration et TCO, non adapté au besoin de l’IA

2) La perspective des simulations comme environnement pour tester des hypothèses, des idées, un espace de solutions, des systèmes complexes  : nouvel axe de l’analyse des données.

Data et sport

Avec en tête de liste : la publication du livre DATA ET SPORT, LA REVOLUTION : Comment la data révolutionne le sport – Editions de l’Observatoire. Auteurs Yannick Nyanga et Aurélie Jean

J’en parle ici au travers d’une longue fiche de lecture : https://www.datassence.fr/2023/09/21/fiche-de-lecture-de-louvrage-data-et-sport-la-revolution-comment-la-data-revolutionne-le-sport-editions-de-lobservatoire-auteurs-yannick-nyanga-et-aurelie-jean/

Et aussi :

La data et l’IA modifient le football : https://management-datascience.org/articles/25041/

Le rôle de l’IoT dans le sport au cœur de la 5e édition de l’IoT Business Hub : https://www.journaldunet.com/ebusiness/internet-mobile/1525169-le-role-de-l-iot-dans-le-sport-au-coeur-de-la-5e-edition-de-l-iot-business-hub/

Data et automobiles

Un automobile il y a 30 ans c’était une dizaine de capteurs. Aujourd’hui cela peut aller à plusieurs centaines de capteurs. Et le tout connecté à distance.

Avec le défi et les enjeux de data privacy.

Sources :

https://gizmodo.com/mozilla-new-cars-data-privacy-report-1850805416

https://www.lebigdata.fr/confidentialite-donnees-voitures-intelligentes

https://www.datanami.com/2023/09/11/cars-the-next-data-privacy-battleground/

Identity – entity resolution : un sujet clé pour et par les données

Savoir rattacher les données aux bons objets est un sujet naturellement clé. Et cela n’est pas toujours aisé. Il est même possible de tricher (à l’exemple d’une gentille personne aux US qui avait attaché sa montre connectée à son chien pour récupérer plus facilement la réduction de prime promise par son assurance en fonction de son activité physique).

Comment identifier une même entité à partir de différentes sources de données (sujet bien connu dans le monde des vues 360° client ou d’autres « objets ») :

https://towardsdatascience.com/entity-resolution-identifying-real-world-entities-in-noisy-data-3e8c59f4f41c?source=rss—-7f60cf5620c9—4

Et quand cela tire des enjeux sociétaux :

https://www.laquadrature.net/2023/09/19/projet-de-loi-sren-et-acces-au-porno-identifier-les-internautes-ne-resoudra-rien/

Data gouvernance – data management : challenges – actif – portails de données – observabilité – lineage

Challenges gouvernance des données : Toujours plus de sources de données et donc de volume, l’essor des données structurées (et avec la capacité immédiate des IA pour en tirer des données structurées), la recherche de données demande de plus en plus d’effort (effet volume), le contexte lié aux données est essentiel (NB : sans contexte une donnée ne peut être transformée en information et est sans valeur – sur ce sujet voir aussi https://towardsdatascience.com/power-of-context-in-data-driven-storytelling-b4dc48a402e ), la gouvernance des données doit être holistique.

Source : https://www.precisely.com/blog/datagovernance/solving-5-big-data-governance-challenges-in-the-enterprise

Challenges data management : démontrer la rentabilité des investissements en données, la pression réglementaire, la cybercriminalité et les besoins en data de l’IA. Avec comme réponses : gouvernance des données et data management même combat, le rôle de l’architecture d’entreprise, le partenariat avec les métiers, faire le tri dans tout ce que cela tire – avec en particulier sur les rôles data – extrait « The next one is the creation of new roles. In some of my publications, I’ve already shared the results of my investigations about the number of data management roles mentioned in DAMA-DMBOK2. How many roles do you think DAMA-DMBOK2 describes? It is more than 100. So, the question is: “Do we need more roles?” However, new developments in data architecture, like data mesh, require new functions like “data product owner” and so on. ». NB j’ai mis en gras le chiffre impressionnant de rôles possibles … à débattre de la pertinence, mais l’expérience montre que parfois seulement quelques rôles explicites suffisent.

Data management. Source : https://datacrossroads.nl/2023/09/13/challenges-with-data-management-trends-part-1/

En avance du mois d’octobre – la partie 2 de l’article est ici : https://datacrossroads.nl/2023/10/09/challenges-with-data-management-trends-part-2/

Les données comme actif dans le bilan financier des entreprise : défi de leur comptabilisation

Source : https://blog.masterdata.co.za/2023/09/08/accounting-for-data-as-an-asset-strategies-for-effective-financial-reporting-and-decision-making-in-the-information-age/

Portail de données : la facilité d’accès aux données est essentielle (constat des CDO en 2021 – étude IDC pour Informatica 49% jugent l’accès aux données comme un sujet difficile https://www.informatica.com/about-us/news/news-releases/2021/12/20211209-informatica-unveils-2021-state-of-the-cdo-study.html ).

– Un tour d’horizon des fonctionnalités d’un portail de données : https://www.opendatasoft.com/fr/blog/quelles-sont-les-fonctionnalites-essentielles-de-votre-portail-de-donnees/

– Et une prise de recul par rapport au web sémantique dans sa capacité à rendre accessible les données https://tdan.com/the-data-centric-revolution-rdf-is-too-hard/31103

Data observability : indispensable pour gouverner

Un tour d’horizon, ne pas confondre data monitoring, data profiling, data quality et data observability. Source : https://blog.masterdata.co.za/2023/09/05/data-observability-a-game-changer-for-data-driven-decision-making/ et https://www.precisely.com/blog/data-quality/how-data-observability-helps-to-build-trusted-data

Et pour finir l’intérêt du data lineage dans la gouvernance. Source :https://www.opendatasoft.com/fr/blog/benefices-data-lineage-pour-strategie-gouvernance/

NB : et l’occasion d’un peu de publicité sur une contribution sur ce sujet, à laquelle j’ai participé dans le cadre de l’open method d’architecture d’entreprise Praxeme https://www.praxeme.org/data-lineage-assurer-la-tracabilite-des-donnees/ )

Actualité du data mesh

L’actualité de Zhamak Dehghani à l’origine de l’idée de data mesh.

Au travers de la société qu’elle a créé : Nextdata (https://www.nextdata.com/).

A suivre son développement, dont l’ambition de concilier partage de données et sécurité.

Avec au centre l’idée de conteneur (support à un data product) comprenant à la fois les données et métadonnées, ainsi que les politiques de données instanciées permettant de contrôler tout au long de son cycle de vie le produit de données.

L’autre idée clé est d’inverser le paradigme classique où les données vont aux traitements par les traitements vont au données.

Source : https://techcrunch.com/2023/09/28/nextdata-is-building-data-meshes-for-the-enterprise

En Vrac (green data, données et territoires, cas d’usage data, la data sauve le monde, data terrorisme, virtual data room, data et IA)

1) Green data

https://www.bortzmeyer.org/marseille-datacenter.html

2) Données et territoires dans le cadre de la démarche de l’événement Numérique en Commun[s]

https://opendatafrance.fr/nec-2023-donnees-et-territoires/

3) Cas d’usage

https://diginomica.com/rethinking-retail-picnic-delivers-data-driven-approach

https://www.cambridge.org/core/journals/data-and-policy/article/data-collaborations-at-a-local-scale-lessons-learnt-in-rennes-20102021/82B20129C0C0DD40E2D07F7F8031A4DB

https://www.presse-citron.net/comment-les-start-up-exploitent-les-donnees-de-votre-compteur-linky/

4) La data sauve le monde

https://www.weforum.org/agenda/2023/09/healthcare-data-africa-displaced-people/

5) Data terrorisme

https://www.lebigdata.fr/les-data-terrorists-volent-les-donnees-de-vos-enfants-pour-le-dark-web

6) Virtual Data room

https://dataconomy.com/2023/09/14/how-virtual-data-rooms-are-revolutionizing-due-diligence/

7) Data et IA

https://www.lebigdata.fr/prophecy-data-analyst-enginee

https://towardsdatascience.com/add-your-own-data-to-an-llm-using-retrieval-augmented-generation-rag-b1958bf56a5a


RDV maintenant en novembre pour la revue et les actualités d’octobre


L’attribut alt de cette image est vide, son nom de fichier est Datassence_Logo1_1.png.

Les commentaires sont fermés.