Données massives - Big data

Il n’existe pas de définition consensuelle et stabilisée des données massives. On les qualifie néanmoins souvent par les trois V : volume, variété et vélocité, c’est-à-dire :

  • le volume correspond à la quantité de données ;
  • la vélocité signifie que ces données sont créées en temps réel, de façon permanente ou immédiate, contrairement, par exemple, aux données scientifiques qui requièrent beaucoup de temps réparti à travers plusieurs étapes ;
  • la variété des données souligne l’éventail de sources et de type de données.

(Définition tirée de la synthèse de connaissances du TIESS sur les fiducies de protection de données, à paraître en 2021)

Source :

Laney, D. (2001), 3-D Data Management: Controlling Data Volume, Velocity and Variety, META Group Research Note cité dans Da Sylva, L. (2017). Les données et leurs impacts théoriques et pratiques sur les professionnels de l’information. Documentation et bibliothèques, 63(4), 5–34; Zikopoulos, P.C., Eaton, C., deRoos, D., Deutsch, T. et Lapis, G. (2012). Understanding Big Data. McGraw Hill, New York.

Kitchin, R. et McArdle, G. (2016). What makes big data, big data? Exploring the ontological characteristics of 26 datasets. BIG DATA AND SOCIETY, 3(1), 1-10; Ollion et Boelaert, supra note 13; Da Sylva, supra note 20.

Par Émilien Gruet, le 26 mars 2021