Par définition, le big data, ou littéralement en français « grosses données », désigne une quantité de données devenue tellement volumineuse qu’il est devenu quasi-impossible pour un outil informatique classique, a fortiori pour un cerveau humain, d’en analyser la teneur.
Pour être qualifiées de « données du Big Data », les données doivent répondre à trois, voire quatre, critères :
- Le volume (plus ou moins massif)
- La variété (nature et niveau de structuration souvent flous)
- La vélocité (de la production, de la collecte et d’analyse)
- La véracité (plus difficile à verifier)