Lexique Data et IA – Français

  • “Big data” (ou encore « grands ensembles de données », “mégadonnées”, “grosses données” ou “données massives”) désigne un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler et rassemblent en grandes familles les trillions d’octets de données que nous produisons tous les jours : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. 

  • Un jeu de données (en anglais dataset ou data set) est une collection d’éléments connexes de données associées entre elles et accessibles individuellement ou de façon combinée, ou gérées comme une entité. Un jeu de données est organisé en structure de données. Dans une base de données, par exemple, un jeu de données peut contenir des données métier (noms, salaires, coordonnées, chiffre des ventes, etc.). La base de données elle-même peut être considérée comme un jeu de données, de même que les corps de données qu’elle contient et qui sont associés à un type spécifique d’information, par exemple les données des ventes d’un service d’entreprise.

  • Données à  “haute valeur” : désigne les ensembles de données susceptibles de générer le plus de valeur économique, ou dont l’importance pour les besoins essentiels ou stratégiques d’une organisation nécessitent un traitement et une réglementation particulière.

  • “Open Data” – en français “données ouvertes” est une pratique qui consiste à “ouvrir” l’accès à ses données à tous, aussi bien dans un but consultatif que pour de la réutilisation. Elle permet à la personne/structure partageante de contribuer à la collectivité et de soumettre ses données à la critique pour les perfectionner ; mais également d’améliorer le service rendu au client/usager avec une meilleure information. Elle permet aussi à des tiers d’incorporer ces données dans leurs projets pour produire des services à plus haute valeur ajoutée. Elles peuvent être d’origine publique ou privée, produites notamment par une collectivité, un service public, un collectif citoyen ou une entreprise. Elles sont diffusées de manière structurée selon une méthode et une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.

  • L’intelligence artificielle (IA, ou AI en anglais pour Artificial Intelligence) consiste à mettre en œuvre un certain nombre de techniques visant à permettre aux machines d’imiter une forme d’intelligence réelle. L’IA se retrouve implémentée dans un nombre grandissant de domaines d’application. La vision artificielle, par exemple, permet à la machine de déterminer précisément le contenu d’une image pour ensuite la classer automatiquement selon l’objet, la couleur ou le visage repéré. Les algorithmes sont en mesure d’optimiser leurs calculs au fur et à mesure qu’ils effectuent des traitements. C’est ainsi que les filtres antispam deviennent de plus en plus efficaces au fur et à mesure que l’utilisateur identifie un message indésirable ou au contraire traite les faux-positifs. La reconnaissance vocale a le vent en poupe avec des assistants virtuels capables de transcrire les propos formulés en langage naturel puis de traiter les requêtes soit en répondant directement via une synthèse vocale, soit avec une traduction instantanée ou encore en effectuant une requête relative à la commande. Alors qu’en 2015 le marché de l’intelligence artificielle pesait 200 millions de dollars, on estime qu’en 2025, il s’élèvera à près de 90 milliards de dollars.