Big data, grosses données, méga données, McKinsey, données informatiques, open data, data science, POC Proof of Concept, pay as you live, pay as you drive, Olivier Ezratty, Christophe Brasseur, data scientist
La traduction littérale du terme "Big Data" signifie "grosses données" ou "méga données". La terminologie anglo-saxonne Big Data est néanmoins couramment utilisée par les acteurs travaillant sur ce sujet. Le Big Data au sens large concerne donc l'ensemble des techniques ayant recours à des données extrêmement volumineuses.
Il n'existe pas à ce jour de définition officielle du Big Data. La commission générale de terminologie et de néologie a proposé une définition. Celle-ci est : "données structurées ou non dont le très grand volume requiert des outils d'analyse adaptés".
On peut également citer plusieurs autres définitions :
- Cabinet McKinsey : "datasets whose size is beyond the ability of typical Database software tools to capture, store, manage and analyze", soit en français "les jeux de données dont la taille dépasse les capacités de capture (d'enregistrement), de stockage, de gestion et d'analyse des systèmes de gestion de bases de données traditionnels".
[...] Les facteurs permettant l'émergence des technologies Big Data Plusieurs facteurs expliquent l'émergence du Big Data. On peut par exemple citer : - L'explosion du volume de données générées : cette augmentation exponentielle du volume de données est-elle même le fruit de plusieurs facteurs dont : o L'augmentation des utilisateurs générant des données (hausse des utilisateurs d'internet, d'internet sur mobile, des bases de données d'entreprises, etc.). Exemple : entre 2012 et 2017, le nombre d'utilisateurs d'internet dans le monde est passé de 2,5 milliards d'utilisateurs à 3,8 milliards d'utilisateurs. [...]
[...] Chacun d'entre eux fournira des données pour développer des modèles et algorithmes Big Data. - L'industrialisation des modèles Big Data. L'implémentation des technologies Big Data dans une organisation passe par plusieurs phases : o Généralement une première phase dite de « POC » (« proof of concept » : preuve du concept). Une ou plusieurs expérimentations sont effectuées pour prouver l'apport et l'efficacité des modèles Big Data. o Une deuxième phase dite de pilote, pendant laquelle sont réalisés des tests en condition réelle et une évaluation des risques de dérive notamment. [...]
[...] - Variété : la conséquence du volume des données est que celles-ci sont extrêmement variables. Celles-ci peuvent aller de fichiers ou de bases de données structurées aux images, en passant par des textes ou les vidéos. - Vélocité : de nombreux systèmes de données ou bases de données sont alimentés en continu dès qu'une nouvelle donnée est enregistrée. Sur des systèmes ou applications fortement utilisés, cela peut engendrer de véritables défis techniques. Le marché du Big Data, un marché en fort développement Le marché actuel Les applications liées au Big Data sont en constant développement au fur et à mesure que des données sont récoltées et que des systèmes sont mis en place pour analyser celles-ci. [...]
[...] Quelques chiffres permettent d'estimer le volume immense de données créées à chaque instant : Chaque minute : (source : Data never sleeps www.domo.com) - Google génère 3 877 140 recherches, - Les utilisateurs de You Tube visionnent 4 333 560 vidéos, - 12 986 111 SMS sont échangés Les enjeux liés à la croissance des données L'émergence du Big Data, et son intérêt réside dans le fait d'analyser les données disponibles pour en tirer des analyses. C'est ce qu'on appelle le « Big Analytics ». Dès 2001, un rapport d'étude et de recherche du groupe Gartner identifie les enjeux à relever pour faire face à la croissance continue des données. [...]
[...] o Une troisième phase dite d'industrialisation, pendant laquelle les modèles et algorithmes sont mis en production sur le système d'information de l'entité et insérés dans les processus. o La phase d'industrialisation est la phase la plus longue à mettre en œuvre, mais également celle qui amène le plus de gains. Au fur et à mesure que les entreprises vont industrialiser les modèles Big Data, les gains vont donc augmenter mécaniquement. Les applications concrètes sur le marché du Big Data Par secteur d'activité Les applications concrètes du Big Data dans les différents secteurs d'activité sont nombreuses. Le tableau ci-dessous reprend quelques exemples spécifiques au secteur d'activité. [...]
Référence bibliographique
Source fiable, format APALecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture