Dernière modification le 11 avril 2023
Cette revue est basée sur un ensemble de publications du mois de janvier 2023, issues de sources en lien avec le sujet Data. A piocher suivant vos centres d’intérêts.
Sommaire :
- Toujours plus de capteurs, de captures, de collectes de données sur des objets de toute nature, à toutes échelles (de la galaxie via le télescope James Webb à la cellule biologique par un capteur quantique)
- La vague Data mesh continue avec plusieurs articles ce mois de janvier
- Quand finalement le stockage des données devient limité (en attendant les promesses du stockage ADN)
- Janvier c’est le mois d’annonces des tendances de l’année : Data literacy, CES 2023 et données, Enterprise analytics, Data quality, Data gouvernance
- Quand Tim Berners Lee parle de nos données
- Dans l’esprit des thèmes de revue récurrents : La data sauve le monde, La régulation des données personnelles
- Pour finir, liens en vrac : le pouvoir des chiffres, le concept de data gravity, open data et culture data
Toujours plus de capteurs, de captures, de collectes de données sur des objets de toute nature, à toutes échelles (de la galaxie via le télescope James Webb à la cellule biologique par un capteur quantique)
Sujet naturellement récurrent dans le monde de la data. Chaque mois voit apparaître des capteurs pour tout, toujours plus intégrés, embarquant de plus en plus de règles de traitement, de modules de calculs, voire d’IA. Avec le lien clé d’association des données captées aux bons objets et par rebond avec le sujet critique de l’identité digitale et de ses usages. Et pour finir le commerce de ces données.
Pour ce mois :
- 1) Dans la santé : https://www.presse-citron.net/avec-u-scan-withings-peut-maintenant-analyser-votre-urine-ce-nest-pas-une-blague/ : le secteur médical est une source constante d’innovation (voir aussi https://www.medgadget.com/ Exemple ce mois de janvier : https://www.medgadget.com/2023/01/flexible-sensors-detect-heavy-metals-in-sweat.html )
- 2) Avec ses dérives possibles : https://www.laquadrature.net/2023/01/12/surveillance-sonore-orleans-baratine-la-justice/ : quand la capture vidéo ne suffit pas, certains se lance dans son association avec de la surveillance sonore avec l’ambition de détecter les anomalies sonores. Quand on fait du numérique, on doit définir formellement. Je vous laisse réfléchir à la définition de ce qu’est une anomalie sonore. Pour comprendre avec un exemple simple, supposons que le système reconnaisse une série de coups de klaxons. Est-ce en avertissement de piétons d’un danger, est-ce un mariage, est-ce par impatience derrière un automobilisme lent, est-ce pour saluer quelqu’un, est-ce un klaxon coincé suite à un accident… Le sujet est sensible : repérer un comportement ne se limite pas à une seule source (ici couplage capture vidéo et capture sonore), la compréhension d’un contexte est nécessaire, pour y arriver on va devoir normaliser l’idée de comportement anormal (a minima d’alerte) … avec quelles conséquences et quelles perspectives lorsqu’on pense à la facilité d’intégration de traitements (reconnaissance d’objets, faciales, interprétation automatique de la parole…). Avec par exemple l’usage de capteurs dans l’identification biométrique : https://www.datasciencecentral.com/mobile-biometric-solutions-game-changer-in-the-authentication-industry/ .
- 3) Voir aussi sur la chaîne : capteurs -> données -> attachement à un objet -> identité digitale -> finalité de reconnaissance (surveillance, aide…), un article paru ce mois sur l’identité digitale https://journals.sagepub.com/doi/full/10.1177/20539517221135176 . Extraits : « A datafier perspective views digital identity as a tool for the conversion of human beings into data »
- 4) La révolution quantique est aussi dans les capteurs : https://news.mit.edu/2022/quantum-sensor-frequency-0621 : et la technologie quantique s’insère dans les capteurs avec la promesse d’une détection nanométrique de signaux … on y parle d’un saut d’échelle pour lesquels on pourrait capturer des données : exemple au niveau d’une cellule, d’un neurone …. !
- 5) Avec le paradoxe, si vous n’êtes pas « dataifié » vous n’existez pas ! https://www.numerama.com/tech/1223110-si-ce-nest-pas-sur-strava-ca-na-pas-existe-les-apps-de-suivi-gachent-elles-le-sport.html
- 6) Avec aussi la difficulté de la multimodalité (comment rapprocher N sources, formes, périmètres, échelles de captures de données sur le même objet). Problématique connue dans la construction des jumeaux numériques. Voir ce mois, un article dans le cadre des algorithmes d’IA (comment reconnaître un objet à partir de ses composants : roues, carrosserie, vitre … pour une voiture). Source : https://www.lesswrong.com/posts/o6ptPu7arZrqRCxyz/200-cop-in-mi-exploring-polysemanticity-and-superposition
- 7) Et sur les jumeaux numériques, voir les cas d’usage des données de santé capturées : https://www.datasciencecentral.com/digital-twin-technology-top-use-cases-in-smart-healthcare/
- 8) Et le sujet des données manquantes par défauts de capture, stratégies possibles à adopter pour les traiter, voir : https://www.kdnuggets.com/2023/01/approaches-data-imputation.html
- 9) Et pour finir la boucle du sujet, le commerce de ces données capturées :
- A lire l’interview du CEO d’Acxiom un des data brokers les plus controversés (« The company claims to have granular details on more than 2.5 billion people » : https://gizmodo.com/acxiom-ceo-chad-engelgau-data-broker-interview-privacy-1849977330 Et comme tout est lié, retour aussi sur le sujet de l’identité numérique avec par exemple l’ambition d’Acxiom pour les acteurs du Metaverse « The first is identity. We can help Metaverse platforms better describe the individuals who are on their networks, beyond the data they already have. » … vers quel monde va-t-on ???
- Et si vous voulez savoir toutes les données que collecte Apple sur vous : https://www.wired.com/story/apple-privacy-data-collection/
La vague Data mesh continue avec plusieurs articles ce mois de janvier
Le sujet data mesh va continuer à fairet l’objet d’une forte actualité en 2023 (voir ce qu’il se passait en 2022 – https://www.datassence.fr/2023/01/10/revue-data-du-mois-decembre-2022/#_ftn2) .
Pour arrêter le pendule entre une centralisation forcée des données et une décentralisation par silos indépendants : les silos sont inhérents et c’est aussi une force, il faut composer avec, l’approche data mesh propose un cadre de fédération… suivez les équipes de Martin Fowler.
Liens :
- https://martinfowler.com/articles/data-mesh-accelerate-workshop.html et https://martinfowler.com/articles/data-mesh-accelerate-workshop.html#ASampleAgendaForADataMeshAccelerateWorkshop
- https://dataingovernment.blog.gov.uk/2023/01/11/dits-data-workspace-all-our-data-in-one-place/
- https://www.datasciencecentral.com/preconditions-for-decoupled-and-decentralized-data-centric-systems/
Quand finalement le stockage des données devient limité (en attendant les promesses du stockage ADN)
Liens :
- https://www.lebigdata.fr/cloud-sature-crise-stockage
- https://www.lebigdata.fr/xethub-stockage-donnees-startup
- https://interstices.info/stocker-les-donnees-la-piste-prometteuse-de-ladn/
Janvier c’est le mois d’annonces des tendances de l’année : Data literacy, CES 2023 et données, Enterprise analytics, Data quality, Data gouvernance
1) Data literacy 2023 :
Source : https://www.dataversity.net/data-literacy-trends-in-2023-formalizing-programs/
Avec la référence principalement au discours du cabinet Forrester sur le sujet et sa proposition d’un nième concept data : DataComs, mais aussi du Gartner.
Pour résumer, on y trouve tous les axes classiques et rodés d’intervention de ces cabinets :
- Le sujet est incontournable : « Forrester Research predicts “70% of employees are expected to work heavily with data by 2025 – up from just 40% in 2018. »
- Les enjeux se chiffrent en millions de $ : « The Global Data Literacy Project claims that large companies could increase their value by $500 million with a more data-literate culture »
- Il faut combattre l’intuition dans les décisions : « The real substitute for data is intuition … Where data literacy is poor, intuition will prevail over data in decision-making. »
- La data literacy est indispensable pour l’IA, débloquer les Big Data !
- Il faut mesurer votre niveau de maturité de data literacy.
- Il faut commencer par convaincre les COMEX (normal, cible de ces cabinets).
- Et au final, la solution (pour le Forrester), c’est les Datacoms :
- Forrester defines DataComs as:
- « The understanding and optimization of communication channels and mediums that insight professionals can leverage to change user perceptions and behaviors in a psychologically safe environment. It includes a collaborative mix of internal, external, and interpersonal company communications, committees, and communities. »
- Si les efforts en data literacy sont inefficaces, c’est un problème de communication … je vous laisse vous faire votre propre opinion.
2) CES (Consumer Electronics Show) 2023 et données
Lien avec un volet data : https://www.journaldunet.com/ebusiness/internet-mobile/1518089-ces-2023-quelles-tendances-annoncees-pour-l-annee/
3) Enterprise analytics 2023
Source : https://www.dataversity.net/adv-slides-2023-trends-in-enterprise-analytics/
Extraits :
Sur ce sujet data product, voir aussi le focus posé par La Harvard Business Review dans un article à destination des Chief Data Officer : « Focus on data products.
Data products are combinations of data and analytics/AI to achieve a specified result for a customer or employee. ». Source : https://hbr.org/2023/01/8-strategies-for-chief-data-officers-to-create-and-demonstrate-value
Sur ce sujet Data Fabric,
Voir aussi https://www.forrester.com/blogs/bi-vendors-cant-resist-the-sheen-of-data-fabric/
Voir aussi https://www.dataversity.net/data-analytics-and-bi-trends-in-2023/
« The growing popularity of data fabric as a preferred data analytics architecture will continue in 2023 on a bigger scale. Data fabric not only integrates all distributed data points seamlessly, but also enables automated Data Management processes from data acquisition to data analysis. »
Sur l’idée de data observability – voir aussi :
https://techcrunch.com/2023/01/10/data-observability-startup-metaplane-lands-investment-from-yc-others/ et
https://techcrunch.com/2023/01/10/observability-platform-chronosphere-raises-another-115m-at-a-1-6b-valuation/
Sur ce sujet Lowcode/Nocode, voir aussi : https://www.dataversity.net/data-analytics-and-bi-trends-in-2023/
« Self-Service business intelligence: Self-service BI has put power tools in the hands of ordinary business users and trusted them to discover their own trends, insights, and profit opportunities. »
Voir aussi le sujet de synchronisation des données en nocode/lowcode : https://techcrunch.com/2023/01/26/whalesync-wants-to-simplify-the-process-of-syncing-data-between-saas-apps/
4) Data quality 2023
Source : https://www.precisely.com/blog/data-quality/data-quality-trends
Idées classiques :
- La qualité doit être vue comme évolutive au vu de la masse et de la variété des données. Les approches curatives sur un stock figé sont limitées. Il est nécessaire d’être en mesure de gérer évolutivement la qualité (par paramétrage de règles métier, de politiques qualité, de profiling automatique des données…),
- Pas de data démocratisation sans data qualité. La confiance dans les données est clé.
- L’IA n’échappe pas au problème de la qualité des données,
- La conformité réglementaire (qui explose), la compliance sont des métiers de data processing. Sans qualité des données, elles ne peuvent pas travailler,
- La qualité des données est la première étape non négociable de la data gouvernance.
Voir aussi : https://www.dataversity.net/data-analytics-and-bi-trends-in-2023/
« Data Quality management: In 2023, Data Quality management will mean combining a DQM strategy with a strong, enterprise-wide data culture. This approach will keep its focus on cloud technologies for Data Management, advanced AI/ML models for Data Quality management, building trust architectures and other Data Governance frameworks »
5) Data gouvernance 2023
Source : https://www.dataversity.net/rwdg-slides-data-governance-trends-a-look-backwards-and-forwards/
- Ce n’est pas un sujet « sexy », souvent source de procrastination dans les organisations,
- L’explosion des outils de data gouvernance : data catalog, business glossary, dictionnaire de données, métadata management (délivrer les métadonnées avec les données), lineage.
Voir aussi ce qu’en dit le CIGREF – rapport publié ce mois de janvier – axé sur la définition de stratégies data : https://www.cigref.fr/wp/wp-content/uploads/2023/01/Gouvernance-et-achitecture-Data-Analytics_Janvier-2023.pdf . Toujours intéressant de voir les verbatims de témoignages de membres du CIGREF sur le sujet (à noter les citations récurrentes du rôle clé de la data literacy).
Quand Tim Berners Lee parle de nos données
Source : https://edition.cnn.com/2022/12/16/tech/tim-berners-lee-inrupt-spc-intl
Son cri et son offre : possédez et contrôlez vos données personnelles.
A suivre le développement de ses idées et de sa startup : https://solidproject.org/
Et aussi sur ce sujet, une initiative française historique à suivre : https://m-itrust.com/
Et voir aussi le lancement de la plate-forme https://www.respectemesdatas.fr/ par UFC Que Choisir. Ils en parlent : https://www.lebigdata.fr/respectemesdatas . Faites l’exercice sur Linkedin par exemple … bluffant !
Et le 28 janvier c’était la journée de la protection des données. Voir l’article « Mais au fait c’est quoi une donnée personnelle ? » https://www.numerama.com/tech/684917-mais-au-fait-cest-quoi-une-donnee-personnelle.html
Mais la bataille fait rage, les cookies vont disparaître, mais rassurez vous on pourrai faire mieux. Voir : https://gizmodo.com/full-throttle-new-tracker-google-kills-cookies-1850051167 « A New Tracker Promises to Collect a Lot More of Your Data. Its Maker Says That’s Better For Your Privacy. »
Et aussi https://www.wired.com/story/privacy-health-data-women/ « The Battle Over Women’s Data ».
Dans l’esprit des thèmes de revue récurrents : La data sauve le monde, La régulation des données personnelles
Voir aussi les revues précédentes : Décembre 2022, Novembre 2022
1) La data sauve le monde
Pas mal de liens sur www.weforum.org (World Economic Forum) :
- https://www.weforum.org/agenda/2023/01/why-we-need-to-unlock-health-data-to-beat-disease/
- https://www.weforum.org/agenda/2023/01/davos23-data-analytics-protect-amazon-basin/
- https://www.weforum.org/agenda/2023/01/ocean-data-energy-transition-davos23/
- https://www.weforum.org/agenda/2023/01/how-data-can-become-a-force-of-sustainable-development-davos2023/
- https://www.weforum.org/agenda/2023/01/here-s-how-agricultural-sector-data-problem-davos2023/
2) La régulation des données personnelles
L’OCDE défini un cadre d’accès des gouvernements aux données personnelles détenues par les acteurs privés : https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0487#:~:text=The%20Declaration%20on%20Government%20Access,held%20in%20the%20island%20of (date de décembre – est vu ici : https://www.journaldunet.com/media/publishers/1518343-declaration-on-government-access-to-personal-data-held-by-private-sector-entities-l-ocde-publie-un-cadre-international-pour-l-encadrement-de-l-acces-aux-donnees-personnelles-par-les-instances-gouvernementales/
Le RGPD va évoluer ? https://techcrunch.com/2023/01/31/gdpr-enforcement-reform-dpa-oversight/
Pour finir, liens en vrac : le pouvoir des chiffres, le concept de data gravity, open data et culture data
Une synthèse sur le sujet des chiffres et de leur pouvoir : http://www.nonfiction.fr/article-11570-dechiffrer-entretien-avec-olivier-martin.htm
Le concept de gravité des données (data gravity) : voir la synthèse proposée par https://dataconomy.com/2023/01/data-gravity-index/ . Les données ont tendances à s’amasser à un même endroit (les données attirent les données). Cela influence la stratégie de stockage (dépendance Cloud, couts). Cela pose la question de comment gérer les déplacements, transferts de ces masses (réplication, archivage, sauvegarde, résilience…).
NB : le monde de la data est friand d’inventer / réinventer des concepts data x. Trouver votre x et mettez date devant pour voir ce que cela fait !
Open data et culture data : à lire avec intérêt, le CR de l’événement « Le 1er décembre 2022, OpenDataFrance accueillait l’événement Culture D-ay, une journée ouverte et collaborative pour imaginer et dessiner ensemble les contours d’une culture des données à la portée de tous. »
Source : https://www.opendatafrance.net/2023/01/09/culture-d-ay-levenement-en-synthese/
Dont le parcours de data literacy imaginé par les participants à l’événement :
RDV maintenant en mars pour la revue et les actualités de février !
Les commentaires sont fermés.