Lorsque l’on parle de Big Data, nous avons tous l’impression d’un plongeon dans le futur. Le discours autour des Big Data est résolument optimiste sur les possibilités infinies de ces nouvelles technologies. Cela fait, maintenant, plusieurs années que je vais au salon du Big Data. Celui de 2019 ressemble étrangement à celui de 2018 qui était déjà moins enthousiasmant que celui de 2017. Une pensée m’a alors traversée : les Big Data ne seraient-elles pas un secteur en phase de maturité ?

C’était il y a 10 ans

Le guide du salon n’en fait pas mystère. Les Big Data ont dix ans. Le 22 décembre 2008, un white paper signait le début du phénomène Big Data. Cet article n’a finalement été cité que 179 fois sur Google Scholar.
Pour le découvrir c’est ici : https://www.immagic.com/eLibrary/ARCHIVES/GENERAL/CRA_US/C081222B.pdf
Bryant, R., Katz, R. H., & Lazowska, E. D. (2008). Big-data computing: creating revolutionary breakthroughs in commerce, science and society.

Aujourd’hui, comme le font remarquer les organisateurs du salon, les principaux concepts portés par le Big Data  et parfois préexistants sont entrés dans le vocabulaire quotidien des informaticiens. Spark, Hadoop, IA, Machine Learning, Deep Learning, Data Lake, NoSQL…

Définis comme « la combinaison ultime entre technologie, analyse et mythologie » par Boyd et Crawford en 2012, le marché du Big Data se porte bien. Il représenterait :

  • Des applications dans le marketing, la finance, la logistique, la médecine…
  • Des usages permettant l’émergence de nouveaux acteurs comme Uber, Airbnb ou Blablacar
  • Des développements dans tous les secteurs de la santé en passant par la démocratie ou l’agriculture

Le tournant du Big Data est de reparler de la User Experience comme élément central des projets Big Data. La complexité de ce type de projets et des processus à mettre en œuvre font que certaines industries pourtant pourvoyeuses de données pensent que ce n’est pas pour elles.

Deux conceptions se font face. Celle du tout cloud voire du multi-cloud entre les mains des Gafam qui traitent la donnée comme un flux plutôt que comme un asset. Celle du tout juridique qui cherche à protéger la vie privée et à respecter le RGPD.

Enfin, les concepts se mêlent, se brouillent et se font concurrence tout en s’enrichissant mutuellement. Nous prendrons l’exemple de l’IA sorti des années 50 pour retrouver une seconde jeunesse grâce aux Big Data. Les deux marchés peuvent être envisagés ensemble sous la dénomination de « Big Data et IA ».

Des chiffres Big, Big

Voici quelques chiffres qui illustrent la vivacité de la croissance des Big Data.

Le marché représenterait 260 billions de dollars US. Attention ! Ces chiffres intègrent le secteur de la Business Analytics.

Ce marché est porté par la banque, l’industrie mais également le service public. La transformation digitale des administrations du monde entier est en marche (si j’ose dire).

Economies de fonctionnement pour un Etat dont on veut s’alléger et dont on veut supprimer bon nombre de missions. La partie la plus intéressante de cette mutation forcée est certainement celle des data publiques. L’Open Data peut être extrêmement utile pour la démocratie digitale, l’aménagement du territoire, la gestion de la mobilité, la détection des épidémies… Néanmoins, assez peu de données publiques en open data peuvent être considérées comme des big data. Vous pouvez retrouver les data françaises sur le site suivant : https://www.data.gouv.fr/fr/

Car derrière les Big Data, on trouve des zettabytes et des exabytes.

Zettabytes et Exabytes.

Le préfixe zetta indique la multiplication par la septième puissance de 1000 ou 10²¹ dans le Système international d’unités. Un zettaoctet est un sextillion d’octets. Le symbole de l’unité est ZB. Wikipédia (anglais) L’exaoctet est un multiple de l’octet d’unité pour les informations numériques. Dans le Système international d’unités, le préfixe exa indique une multiplication par la sixième puissance de 1000. Par conséquent, un exaoctet est un quintillion d’octets. Le symbole pour l’exabyte est EB. Wikipédia (anglais)

Source : Statista

Ces chiffres montrent que les Big Data deviennent, peu à peu, essentielles dans la gouvernance des entreprises et dans leur processus de mutation technologique à visée ROIste. L’objectif de moins dépenser grâce aux data devient primordial. Les Big Data sont parfois également synonyme d’échec organisationnel. Elles nécessitent de vrais efforts d’alignement et d’agilité. Ceci explique pourquoi seules 48% des entreprises considèrent leur déploiement en interne comme un succès.

Source Statista

Cette exigence de mutation et surtout de monter en expertise des SI peuvent ralentir les investissements Big Data. Le graphique ci-dessous illustre cette relative faible progression du marché d’année en année même si celui-ci reste à un niveau très élevé. On observe un relatif ralentissement de sa croissance.

Ce ralentissement de la croissance des projets Big Data n’implique pas que la production et la captation de données ralentissent. Bien au contraire !

La tendance est de ne plus parler de Big Data mais de Huge Data avec un basculement progressif du monde des data des USA à la Chine.

Huge Data

Une multiplication par 5,3 d’ici 2025 pour atteindre 175 Zo soit 175 milliards de téraoctets. Si l’on stockait 175 Zettaoctects sur des disques Blu-ray la pile de disques serait assez haute pour aller jusqu’à la lune… 23 fois. (Vice-président Senior d'IDC, David Reisel)

Par ailleurs, le marché du Big Data est constitué de multiples segments qui ne croissent pas à la même vitesse. Voici l’analyse du cabinet IDC sur le marché français. 

Les segments qui tirent la croissance du marché des Big Data en France (source IDC, croissance annuelle moyenne)

+35% Plateformes logicielles cognitives /IA +9,6% Outils d'analyse continue +8,9% Systèmes de recherche

Les Big Data en tant que données non structurées sont, pour certains secteurs, dépendantes des réseaux sociaux. La lutte pour le respect de la vie privée, les concepts de Privacy by Design imposent aux projets Big Data une stricte observance d’un juridique de plus en plus sourcilleux sur le sujet.

Focus sur quelques ateliers, énergies renouvelables et automobile : place à l’utilité sociale

En matière d’e-commerce, les applications Big Data permettent d’affiner les offres, de mieux gérer les relations avec les consommateurs et de gagner en efficacité en matière de supply chain, gestion des stocks…Si ce secteur donne une multitude de cas d’usages intéressants, d’autres marchés sont profondément révolutionnés par les Big Data.

Les énergies renouvelables avec EDF Renouvelables

EDF Renouvelables, acteur mondial de la transition énergétique, construit et exploite des centrales électriques (principalement dans l’éolien et le solaire photovoltaïque) dans 22 pays. L’innovation est un axe de développement important comme dans le stockage d’énergie, le solaire, l’essor de filières industrielles et l’optimisation technologique des énergies renouvelables matures.

Avec la société Quantmetry, EDF vise à valoriser les données produites par les assets (turbines, panneaux solaires). Ces données sont stockées via le Cloud Amazon. Un véritable travail d’harmonisation à l’international a été effectué. 15 Giga watts de données sont produites à travers le monde par EDF Renouvelables. Ce travail d’harmonisation a nécessité de casser les silos avec un parti pris logistique full-services.

Ces gains de productivité étant la résultante de la mise en place et le suivi d’indicateurs unifiés et le recours à toutes les nouvelles technologies ayant recours à des briques d’IA comme pour la maintenance préventive par exemple permettent à EDF Renouvelables d’avoir une vision unifiée de ses données produites même si elles sont très diverses.

L’automobile avec Mathworks

Les voitures autonomes, les assistants vocaux, les robots, les appareils intelligents, … les systèmes autonomes entrent dans nos vies et modifient nos habitudes, et le Deep Learning est la technologie au cœur ce changement. Les niveaux avancés de perception, rendus possible grâce au Deep Learning, sont un élément essentiel pour le succès d’applications telles que la conduite automatisée. Cependant, concevoir et déployer des applications de Deep Learning sur des plateformes CPU et GPU embarquées est un défi, les ingénieurs devant faire face aux contraintes de ressources inhérentes à ces systèmes embarqués.

Voici le pitch de cet atelier original présenté par une femme, la seule femme de l’après-midi. Au-delà du Deep Learning, nous avons abordé la notion de Transfer Learning.

L’apprentissage par transfert (transfer learning en anglais) est l’un des champs de recherche de l’apprentissage automatique qui vise à transférer des connaissances d’une ou plusieurs tâches sources vers une ou plusieurs tâches cibles. Il peut être vu comme la capacité d’un système à reconnaître et appliquer des connaissances et des compétences, apprises à partir de tâches antérieures, sur de nouvelles tâches ou domaines partageant des similitudes.

Le deuxième point intéressant de cette présentation est la connexion des données entre elles. Les données fournies par les lidars qui sont essentielles dans la conduite d’une voiture autonome ont besoin de s’intégrer dans une architecture globale très représentative de ce que va devenir la voiture à savoir un objet connecté, mobile et fournisseur de services. La voiture Big Data devient un élément également éthique et écoresponsable.

L’avenir des Big Data n’est pas forcément dans une relance de la croissance économique par une nouvelle révolution technologique. L’avenir est d’abord dans la construction d’une nouvelle société grâce à des big data éthiques.

Quid des jumeaux digitaux, le buzz word 2018 des Big Data

Dans ce cadre, il est impératif de s’interroger sur le concept de jumeaux digitaux. Popularisés par le Gartner comme une tendance majeure des Big Data et , notamment, dans la conception des objets connectés, les jumeaux digitaux peuvent se définir comme une source de croissance importante pour le marché “Nous avions prédit que d’ici 2022, plus de deux tiers des entreprises travaillant sur l’IoT auraient déployé au moins un jumeau numérique en production. Nous pourrions atteindre ce nombre d’ici un an. » (source, Le Monde Informatique)

Les jumeaux digitaux, une représentation du monde physique

Un jumeau numérique (en anglais, digital twin ou device shadow1) est une réplique numérique d'un objet, d'un processus ou d'un système qui peut être utilisé à diverses fins2. La représentation numérique fournit à la fois les éléments et la dynamique de fonctionnement d'un dispositif de l'Internet des objets tout au long de son cycle de vie3. Les jumeaux numériques intègrent l'intelligence artificielle, l'apprentissage automatique et l'analyse des données avec des données pour créer des modèles de simulation numérique qui se mettent à jour et changent à mesure que leurs contreparties physiques changent. Un jumeau numérique apprend en permanence et se met à jour en utilisant de multiples sources pour représenter son statut, sa condition de travail ou sa position en temps quasi réel. (Source Wikipédia)

Chez Beabilis, nous faisons un autre rêve. Si le meilleur du numérique consiste à reproduire le monde réel, où est le progrès ? Pourquoi ne pas faire des simulations sur des situations idéales et l’appliquer au monde physique ? Il est sûr que les contraintes qui pèsent sur les pipelines ou les centrales nucléaires ont tout intérêt à être exactes. En ce sens, le digital est un formidable outil de prédiction des incidents, des usures, des accidents en un mot des risques du monde réel. Le danger est de calculer au plus juste les budgets permettant de “résoudre les problèmes”. Si les modèles se trompent, les conséquences pourront être catastrophiques. Toutes les prédictions s’appliquant à l’homme s’avèrent délicates. Les jumeaux digitaux peuvent concevoir la ville idéale, la gestion de l’éclairage, le besoin en hôpitaux ou en écoles. Sauf que…l’homme est l’homme et pas, uniquement des data. Enfin, si ! Mais nous n’en connaissons pas la majorité.

Intelligendo ignotum

Pour aller plus loin
http://penseeartificielle.fr/jumeau-digital-ia-aide-finance/