Comment fonctionne un chatbot IA ? L’apprentissage et le rôle des supercalculateurs

Alexis Tremblay
Alexis Tremblay

Chatbot AI fait référence à un système basé sur l’intelligence artificielle qui interagit avec les utilisateurs en simulant une conversation humaine. Derrière un Chatbot IA, même s’il fonctionne, il y a beaucoup de choses très complexes, mais fondamentalement il y a deux éléments principaux : le modèle d’intelligence artificielle et les composants physiques, le matériel. Le modèle est un peu comme le cerveau du chatbot, tandis que le matériel est un peu comme les muscles : ils fournissent au cerveau la puissance nécessaire pour effectuer des calculs complexes. Spécifiquement pour un chatbot IA, vous avez besoin d’un matériel très puissant : un supercalculateurs. Nous avons un exemple ici même en Italie, dans la province de Bergame, capable de développer de nouvelles applications, dont des chatbots en italien.

Comment un modèle est-il formé pour un chatbot IA ?

Tout d’abord, il faut comprendre qu’un chatbot doit être formé avant de pouvoir répondre et pour ce faire il existe un processus basé sur l’intelligence artificielle, notamment le fameux apprentissage automatiqueà travers lequel le modèle apprend grâce à une énorme quantité de données, de textes et d’images qui lui sont transmises. Ok, mais concrètement, comment le modèle apprend-il ?

Il y a trois étapes principales d’apprentissage.
La première phase est un peu comme à l’école primaire : on apprend les compétences linguistiques et les notions générales. C’est dans cette phase que le modèle « apprend la langue italienne ». Comment?
En pratique, le modèle reçoit une série de textes de qualité vérifiée, comme un article Geopop, dont certains mots ont été masqués aléatoirement. Or, ce qui est demandé au modèle, c’est de remplir ces espaces vides, un peu à la manière du jeu de réflexion, de combler le vide. Au départ il fera beaucoup d’erreurs mais, petit à petit, à chaque fois que le chatbot fait des erreurs, ses paramètres sont modifiés. Ainsi, en apprenant à prédire le mot, le modèle apprend aussi toute une série d’informations associées : la structure syntaxique de la phrase, la grammaire puis toute une série de notions.
La deuxième phase, cependant, se déroule comme s’il s’agissait d’une université, car ici on acquiert des compétences plus spécialisées : après avoir appris l’italien, le modèle se voit poser une série de questions à réponses multiples et on lui « apprend » à accomplir des tâches. La troisième et dernière phase ressemble un peu à l’examen final : l’efficacité des réponses est vérifiée par une équipe de personnes réelles, qui vérifient les résultats des tâches assignées. Dans cette phase, vous pouvez également définir le type de comportement attendu, donc la manière et le ton avec lesquels vous attendez que le modèle réponde (par exemple de manière formelle, ou de manière ludique, juvénile ou avec un langage technique, dépend du type de question). . Une fois que nous sommes satisfaits du niveau d’apprentissage, le modèle est prêt à être utilisé et n’apprendra plus de nouvelles informations, au moins jusqu’à la prochaine mise à jour.
Alors attention : les chatbots ne cherchent pas la réponse sur internet, mais génèrent une réponse grâce à leur propre modèle, leur propre cerveau entraîné. Idéalement, si je disposais d’un chatbot génératif léger, c’est-à-dire ne pouvant réaliser que quelques fonctions, je pourrais aussi le faire fonctionner sur mon PC non connecté à internet. Techniquement, cela fonctionnerait.
Evidemment les grands chatbots internationaux qui savent tout faire sont connectés au réseau pour être aussi constamment mis à jour et attention, ils utilisent des moteurs et des muscles très puissants : les supercalculateurs.

Comprendre les questions et générer des réponses : derrière l’expérience client

Leur puissance de calcul est notamment utilisée pour pouvoir comprendre ce qu’on leur écrit et formuler des réponses, ce qui se traduit techniquement par la gestion des données et les opérations nécessaires.

Pour comprendre notre langage, le robot divise la phrase en briques, c’est-à-dire en unités uniques appelées jetons, et on dit en fait qu’il symbolise la question reçue. Pour donner un exemple, si la question était « comment prépare-t-on une tarte aux pommes ? », le bot décomposerait la phrase en 8 jetons :

  1. Comme
  2. Oui
  3. préparer
  4. un
  5. gâteau
  6. De
  7. pommes
  8. point d’interrogation

De cette façon, il lui sera plus facile de l’analyser et de reconnaître les parties les plus importantes du discours.
En fait, la prochaine étape consiste justement à reconnaître « les briques les plus pertinentes », à savoir les mots-clés de la phrase.
Dans notre cas, il identifie les mots « gâteau » et « préparer », et à ce stade il comprend que, très probablement, pour répondre à la question, il devra fouiller dans les « tiroirs » de sa mémoire liée au monde de la cuisine.
Une fois la question comprise, pour y répondre le chatbot passe à la phase de Génération du Langage Naturel, c’est à dire la génération de la réponse.
Ainsi, dans ce cas, il sélectionne les données les plus importantes relatives à la recette de tarte aux pommes (parmi celles qu’il a apprises lors de la phase d’entraînement), organise les informations dans une structure logique, compose les phrases, les relie entre elles et génère le texte. Et voici notre réponse.

Le premier chatbot fabriqué en Italie

Depuis juillet, nous disposons en Italie d’un supercalculateur entièrement dédié à l’intelligence artificielle générative. Il a été installé par Fastweb pour créer des chatbots en italien pouvant être utilisés par les entreprises et les administrations publiques.

Mais pourquoi avons-nous besoin d’un chatbot spécifiquement italien ? Les avantages sont nombreux. Tout d’abord, étant formé sur des données italiennes, il parlera très bien italien. Et pas seulement en ce qui concerne la grammaire, mais aussi pour toutes ces facettes de la langue et ces nuances culturelles que, normalement, seuls ceux qui vivent dans la région peuvent comprendre pleinement. De plus, il respectera les droits d’auteur sur les contenus utilisés pour la formation, puisqu’il s’agit de données régulièrement acquises suite à des accords avec des éditeurs. Même les entreprises qui souhaitent développer leur chatbot seront plus protégées, sachant que les serveurs sont ici sur le territoire italien : ce n’est pas anodin.
Deuxièmement, puisqu’il s’agit d’un modèle entièrement développé à partir de zéro, vous aurez un contrôle total sur toutes les phases de développement, ainsi, par exemple, vous pourrez choisir le type de données à utiliser pour la formation. Ce modèle, en particulier, sera formé sur des données faisant autorité et vérifiées, grâce à des accords conclus avec des organisations du calibre de Mondadori, Bignami et ISTAT.