Qu’est-ce que le deep learning ?


Les termes « intelligence artificielle », « réseaux neuronaux », « machine learning » (ML) et « deep learning » (DL) sont souvent utilisés de manière interchangeable. En réalité, ils décrivent différents niveaux de sophistication qui aident les ordinateurs à traiter les données brutes de manière plus « humaine ».

deep_learning_hero

Qu’est-ce que l’intelligence artificielle ?

L’intelligence artificielle (IA) est un terme générique qui décrit les systèmes informatiques conçus pour fonctionner davantage comme des êtres humains.

Qu’est-ce que les réseaux neuronaux ?

Les réseaux neuronaux utilisent des nœuds interconnectés qui s’inspirent du fonctionnement des neurones dans le cerveau. Ils s’appuient sur des algorithmes pour reconnaître des modèles dans les données brutes.

Qu’est-ce que le machine learning ?

Le machine learning décrit comment les réseaux neuronaux peuvent améliorer leurs performances au fil du temps en « apprenant » par l’expérience.

Deep learning vs machine learning

La différence entre le deep learning et le machine learning est que le DL est l’évolution ultérieure du ML. Il utilise plusieurs couches (ou profondeurs) de nœuds de réseaux neuronaux pour traiter les données et créer des résultats plus utiles et intéressants. Ce n’est que récemment que les systèmes de deep learning sont devenus accessibles à un grand nombre de personnes grâce à l’amélioration exponentielle des performances des processeurs GPU. Ces systèmes sont notamment à l’origine d’avancées majeures dans le domaine des véhicules autonomes, de la détection des fraudes, des systèmes de négociation, etc.

Différents types de deep learning

Le deep learning tente d’imiter la pensée humaine en combinant de nombreuses couches d’algorithmes pour traiter les données. À mesure que les données traversent chaque couche, les algorithmes traduisent certains éléments en un format numérique, ce qui facilite leur traitement par les couches suivantes.

Apprentissage supervisé

Lorsqu’une personne est supervisée dans l’apprentissage d’une tâche, son enseignant ou formateur est présent afin de la corriger en cas d’erreur. Pour un ordinateur, les données traitées sont étiquetées correctement, afin que l’appareil soit informé lorsqu’il commet une erreur.

Il existe deux modèles de deep learning supervisé : la classification et la régression.

Classification : un modèle de deep learning peut, par exemple, être entraîné en traitant de nombreuses images d’animaux. Lorsqu’il analyse une nouvelle image, il la compare à ce qu’il a « appris » de ses autres entraînements avant d’essayer de prédire si la nouvelle image contient un animal ou non. L’algorithme est ensuite évalué en fonction de la précision avec laquelle il parvient à reconnaître un animal dans série d’images aléatoires.

Régression : une autre alternative consiste à fournir au modèle de deep learning plusieurs variables avant de lui demander de prédire une valeur. Prenons l’exemple du secteur bancaire, lorsque les clients demandent un prêt. Le modèle est formé en étudiant des milliers de demandes de prêt, chacune contenant des données relatives aux revenus du demandeur, à ses antécédents en matière de crédit, son solde bancaire, sa situation professionnelle et d’autres informations. Il indique ensuite si ces demandeurs se sont vu accorder un prêt ou non. Le modèle peut ainsi recevoir les données d’un nouveau demandeur et estimer s’il remplit les conditions requises pour obtenir un prêt.

L’apprentissage supervisé est principalement utilisé lorsqu’il existe un grand nombre de points de données étiquetés, comme les images d’animaux ou les informations des demandeurs de prêt.

Apprentissage non supervisé

Dans cette situation, le modèle de deep learning ne reçoit pas d’étiquettes sur les données qu’il traite : il est libre de découvrir les modèles par lui-même.

Par exemple, il est possible d’introduire des milliers de chansons dans un modèle de deep learning afin de le laisser décider de comment les regrouper. En tant qu’êtres humains, lorsque nous écoutons un morceau de musique, nous en identifions la structure, les instruments, le tempo, les voix et le BPM, puis nous la classons selon un genre (punk, classique, électro...). Le modèle d’apprentissage non supervisé ne sait pas ce qu’est un genre ou un instrument, il utilise donc son « cerveau » mathématique pour trouver des modèles dans les morceaux et créer de nouvelles catégories.

Apprentissage semi-supervisé

Il s’agit d’une combinaison des apprentissages supervisé et non supervisé. Les modèles de deep learning sont alimentés par un mélange de données étiquetées et non étiquetées. Une certaine structure et des conseils sont fournis, mais les appareils sont libres de créer leurs propres modèles. Reprenons l’exemple de la musique : certaines données sont étiquetées pour chaque piste. Il peut par exemple s’agir de la date de la première sortie, ce qui peut aider à aiguiller la création du modèle de deep learning vers le résultat souhaité.

Cas d’usage du deep learning et de l’IA

Les cas d’usage du deep learning ont connu une croissance exponentielle au cours de la dernière décennie. De plus, cette technologie est appelée à devenir plus influente grâce à l’amélioration constance de la sophistication des algorithmes et de la puissance de traitement.

Les différentes formes d’IA peuvent être appliquées à un large éventail de cas d’usage. En effet, l’IA s’est insinuée dans tous les aspects de la vie actuelle, car cette méthode de traitement des données rend les ordinateurs plus efficaces et plus aptes à interagir avec les humains.

Il n’y a pas si longtemps, les filtres anti-spam étaient plutôt rudimentaires : ils découvraient les potentiels messages potentiels en bloquant toute communication contenant des mots-clés spécifiques. Avec l’introduction de l’IA, les filtres anti-spam sont maintenant capables d’examiner différents aspects des e-mails (lieu d’envoi, destinataire, contexte du message) avant de décider de l’envoyer dans la boîte de réception du destinataire ou dans son dossier de spam.

Prenons un autre exemple. Imaginez un modèle de deep learning examinant les données brutes d’une caméra de sécurité en direct pointée sur une station-service. Cette caméra produit environ 25 images fixes distinctes par seconde, qui sont introduites dans le modèle selon un mélange des différents systèmes d’apprentissage décrits ci-dessus.

Supposons qu’il s’agisse d’une station-service rurale et qu’elle ne soit pas très fréquentée. La plupart du temps, les images montrent un endroit désert, avec les pompes à essence et l’avant de la boutique. Au bout d’un certain temps, le système peut reconnaître que la « norme » est d’avoir une station-service déserte. Lorsqu’une voiture s’arrête, le modèle de deep learning « remarque » le véhicule et sait que quelque chose a changé. Après quelques perfectionnements, le modèle parvient à faire la différence entre une voiture, une moto et un camion. Si le système est ensuite relié à la caisse enregistreuse, il n’est pas difficile de savoir si le véhicule qui vient de quitter l’aire de stationnement a payé ou non. Ainsi, d’autres couches de saisie et de traitement des données sont ajoutées pour rendre le système plus « intelligent » et utile dans un contexte concret.

Des modèles de deep learning similaires sont mis en place dans les aéroports du monde entier pour repérer les bagages sans surveillance. Le modèle examine les données vidéo des caméras de sécurité et reconnaît les personnes qui se déplacent avec leurs valises et leurs sacs. Avec plusieurs couches de perfectionnement, l’algorithme peut apprendre à envoyer une alerte de sécurité lorsqu’il remarque qu’une personne a posé son bagage et s’est éloignée pendant plus d’un certain temps.

Dans le monde de la finance, les systèmes de deep learning surveillent les marchés et tentent de comprendre les fluctuations des différents produits. Ils peuvent établir des liens avec un grand nombre de données en temps réel et comprendre à leur rythme comment certains mouvements de valeurs en affectent d’autres. Les données peuvent être diverses et variées : alertes météorologiques extrêmes, situations politiques, prix réels du marché, etc. Avec le temps, ils parviennent à créer des modèles récurrents afin d’anticiper les situations à venir. Par exemple, le modèle de deep learning peut se rendre compte qu’un cyclone va toucher une zone géographique comportant un nombre important de plantations de bananes, ce qui entraînera probablement une augmentation des prix des bananes lors de la prochaine saison. Ce type d’informations peut s’avérer extrêmement précieux pour les négociants.

Les modèles de deep learning sont également utilisés dans les centrales nucléaires, les usines et les data centers. Les systèmes surveillent les données provenant des capteurs de l’Internet des objets (IoT) et des caméras situées dans tout l’installation. Une fois que le modèle connaît le fonctionnement « normal » des lieux, il peut envoyer des alertes lorsqu’il remarque un comportement inhabituel. Ces comportements peuvent inclure des équipements qui ne fonctionnent pas correctement, une violente tempête à l’extérieur ou le fait que certains membres du personnel ne pointent pas. Ajoutés les uns aux autres, ces petits soucis peuvent créer un problème plus important. Les modèles de deep learning sont bien plus fiables que les humains lorsqu’il s’agit de reconnaître une combinaison de petits facteurs susceptibles de conduire à un problème plus grave. Ils permettent ainsi aux ingénieurs d’éviter les catastrophes avant qu’elles ne se produisent.

Limites et enjeux

Qualité des données :  les systèmes de deep learning se basent sur l’observation des données, ils sont donc limités par la quantité et la qualité qui leur sont fournies. S’il n’y a pas assez de données, ou si elles sont biaisées, l’algorithme risque de ne pas être assez précis et de reproduire ce biais dans ses résultats. Par exemple, le modèle de deep learning analyse des milliers de photos d’oiseaux, puis il examine une sélection de nouvelles photos et doit trouver celles qui contiennent des oiseaux. Admettons que les données d’origine contiennent des photos d’oiseaux dans une jungle, avec des arbres en arrière-plan. À moins que le système de deep learning ne soit spécifiquement programmé pour ignorer l’arrière-plan et l’environnement, il pourrait avoir des difficultés à identifier un oiseau sur une photo prise dans une zone urbaine ou dans un enclos.

Manque d’adaptabilité :  une fois qu’un modèle de deep learning est entraîné, il est généralement capable de fournir des résultats précis uniquement pour le même problème, en utilisant le même type de données. Reprenons l’exemple des oiseaux : si la qualité des images est modifiée, il est possible que le système ne soit pas en mesure de les comparer avec précision. Il faudrait également le réentraîner si, au lieu des oiseaux, l’utilisateur voulait qu’il identifie les photos d’un autre animal. Ainsi, même pour des tâches similaires, les modèles de deep learning nécessitent un entraînement spécifique : ils ne s’adaptent pas seuls.

Ressources informatiques :  les modèles de deep learning nécessitent une grande puissance de calcul. La raison pour laquelle le deep learning est plus répandu aujourd’hui qu’il y a dix ans est en grande partie due à la disponibilité de processeurs à cœurs multiples et de GPU. Ces modèles sont également gourmands en ressources en termes de mémoire vive et de stockage. Les données circulant rapidement, les disques durs traditionnels risquent de ne pas pouvoir suivre le rythme, d’où la nécessité de recourir à des disques SSD.

OVHcloud et le deep learning

Le deep learning est une technique de data science qui peut aider les systèmes informatiques à traiter efficacement de grandes quantités de données pour produire des résultats commerciaux pratiques et efficaces.

Chez OVHcloud, nous comprenons le potentiel du deep learning et la façon dont il peut résoudre des problèmes actuels d’une grande variété de secteurs.

Notre objectif est de fournir les outils de pointe nécessaires à la prise en charge des systèmes de deep learning afin d’aider les entreprises à acquérir un avantage concurrentiel.