Il n’existe pas de définition consensuelle et stabilisée des données massives. On les qualifie néanmoins souvent par les trois V : volume, variété et vélocité, c’est-à-dire :

- le volume correspond à la quantité de données ;
- la vélocité signifie que ces données sont créées en temps réel, de façon permanente ou immédiate, contrairement, par exemple, aux données scientifiques qui requièrent beaucoup de temps réparti à travers plusieurs étapes ;
- la variété des données souligne l’éventail de sources et de type de données.

(Définition tirée de la synthèse de connaissances du TIESS sur les fiducies de protection de données, à paraître en 2021)

Source

Laney, D. (2001), 3-D Data Management: Controlling Data Volume, Velocity and Variety, META Group Research Note cité dans Da Sylva, L. (2017). Les données et leurs impacts théoriques et pratiques sur les professionnels de l’information. Documentation et bibliothèques, 63(4), 5–34; Zikopoulos, P.C., Eaton, C., deRoos, D., Deutsch, T. et Lapis, G. (2012). Understanding Big Data. McGraw Hill, New York.

Kitchin, R. et McArdle, G. (2016). What makes big data, big data? Exploring the ontological characteristics of 26 datasets. BIG DATA AND SOCIETY, 3(1), 1-10; Ollion et Boelaert, supra note 13; Da Sylva, supra note 20.

Auteur·trice(s) de note

Création

14 janvier 2023 09:16

Modification

14 janvier 2023 09:16

Historique des modifications

Licence

Attention : une partie ou l’ensemble de ce contenu pourrait ne pas être la propriété de la, du ou des auteur·trices de la note. Au besoin, informez-vous sur les conditions de réutilisation.