Le mot #4 : DATA

par Elisa | le 17 juillet 2013

data2

Le mot data est d’abord associé à l’informatique. Dans ce domaine, il nous vient de l’anglais et se traduit tout simplement par « donnée ». C’est d’ailleurs ce dernier mot que l’on utilise pour désigner une « représentation conventionnelle d’une information permettant d’en faire le traitement automatique » (selon la très définitionnelle définition du Robert Dixel 2013).

Ces derniers temps, le mot data n’a plus été seulement présent dans le discours informatique mais s’est étendu au discours politique, marketing, médiatique… Si bien que, dans ce foisonnement, on utilise aussi bien data que donnéemême si le mot anglais semble l’emporter le plus souvent. En effet, certains concepts peuvent avoir pris une telle importance politique et économique qu’ils ne reçoivent pas de traduction en français, ou bien celle-ci ne parvient pas à s’imposer face à un anglais unifiant. C’est ainsi que l’on parle plus volontiers de « data mining », de « data center » et de « big data » que de « centre de traitement des donnés » et de « grosses données ». « Big data » est d’ailleurs l’une des expressions clef de cette tendance actuelle, permettant peut-être de mieux en saisir les enjeux.

De la data à la big data, en passant par le débat

La big data désigne à la fois un concept et un axe de développement de l’informatique, selon lequel un volume de données devient tellement important que les outils ordinaires de gestion de données (bases de données) et de recherche des données s’avèrent  insuffisants pour le contrôler, le manipuler et l’exploiter.

Matrix

Le big data ou la matrice (un peu)

Pour autant, les progrès technologiques constants rendent de plus en plus d’entreprises capables de trier cette véritable masse d’informations qui, selon Wikipédia, devrait atteindre les 40 zettaoctets en 2020 (40.1021 octets – soit 40 suivi de 21 zéros !).

Outre la référence à ce phénomène d’infobésité, l’intérêt d’utiliser la tournure « big data » serait surtout de faire référence à la métaphore du régime totalitaire du roman de George Orwell, 1984. En effet, l’exploitation de ces « grosses données », les « big analytics », consiste à développer des outils d’analyses pouvant aussi bien traiter de données publiques que privées. Ainsi, si Microsoft s’est rendu populaire en étant capable de prédire quel serait le vainqueur de l’Eurovision par la mise en place d’un algorithme complexe (traitant des données notamment issues des réseaux sociaux : nombre de citations, nombre d’articles, sondages, avis, vidéos, partages, mise en valeur de chacun des candidats, tendances diverses…), les récents scandales d’atteinte à la vie privée des internautes à des fins d’information gouvernementales ou marketing ont surtout fait émerger de violentes critiques à l’égard d’un phénomène potentiellement dangereux.

matrix

Danger vs. opportunité, fantasme marketing vs. réalité, on vous laisse choisir…

Mais pour l’heure, retournons-en à notre étymologie.

Data est un mot utilisé au singulier en anglais : il fait partie des noms indénombrables qui regroupent des choses concrètes (le thé, le lait) ou abstraites (la beauté) que l’on ne peut compter. En anglais, l’indénombrable est singulier, donc on ne dira pas « the data are published annualy » mais « the data is published annualy ».

Cependant, data est étymologiquement un pluriel : celui du latin datum, participe passé de do, das, dare signifiant… donner. Autrement dit data peut se traduire par « donnés ».

Le latin a donc donné (c’est le cas de le dire) directement au français le mot donnée et ses dérivés, mais il l’a parfois aussi fait pour la langue anglaise – qui a d’ailleurs elle-même emprunté au français dans les siècles précédents–  comme on le voit ici pour l’informatique. Le latin, c’est donc comme les données sur un réseau : ça circule – mais crypté dans les mots.