Fastweb travaille sur une intelligence artificielle qui « pense » en italien

Alexis Tremblay
Alexis Tremblay

Web rapide crée le premier LLM (Grand modèle de langage), c'est-à-dire un grand modèle de langage pour l'intelligence artificielle, formé nativement à la langue italienne. L'objectif est de créer des systèmes d'IA capable de comprendre parfaitement l'italien, capturant toutes les nuances et particularités linguistiques. Cela présenterait des avantages tant en termes de précision dans la compréhension des demandes qu'en termes de protection et de contrôle des informations. À cet effet, Fastweb a acquis 31 NVIDIA DGX H100le matériel qui constituera le cœur battant du supercalculateur que la société contrôlée par le groupe suisse Swisscom utilisera pour créer et alimenter son LLM.

Comment l'intelligence artificielle de Fastweb sera formée

Les modèles sur lesquels ils se basent les systèmes d'IA les plus populaires du moment – comme ChatGPT d'OpenAI et Gemini de Google – sont formés nativement en anglais et, en interagissant avec eux, vous percevez leur profonde empreinte anglo-saxonne. Cela peut représenter une limite pour ceux qui les utilisent en émettant des commandes dans d'autres langues (comme l'italien), car il n'y a pas toujours une compréhension complète des demandes faites du côté de l'utilisateur. Ces IA ne sont donc pas toujours capables de restituer des résultats satisfaisants pour une culture autre que celle anglo-saxonne. Avec le nouveau LLM formé nativement en italien, Fastweb veut combler cette « lacune ».

Giovanni Germaniresponsable de l'architecture et du COE IA chez Fastweb, a déclaré :

Notre objectif est de couvrir tous les maillons de la chaîne de valeur de l’intelligence artificielle, à l’exception de la production de puces. Nous partons du supercalculateur NVIDIA pour arriver au conseil, en passant par la fourniture de puissance de calcul aux startups et aux entreprises et la création de modèles sur mesure.

Afin d'obtenir un résultat qualitativement pertinent d'un point de vue linguistique, Fastweb collecte une grande quantité de données pour entraîner le modèle à partir de sources multiples : de la publication aux médias sociaux, en passant par le Web et l'administration publique. À cet égard, le responsable IA de Fastweb a expliqué :

La qualité de l'ensemble des données et l'équilibre des différentes sources sont fondamentaux pour disposer d'un LLM efficace et capable de véritablement parler la langue italienne.

Lorsqu'il s'agit de former un grand modèle de langage et les données utilisées pour le former, des questions sont souvent soulevées sur le respect de la vie privée des utilisateurs et des réglementations en matière de droits d'auteur (tous deux abordés au cœur de l’AI Act, la première loi au monde réglementant l’utilisation de l’intelligence artificielle). Concernant cette problématique, le responsable de Fastweb a rassuré :

Contrairement à d'autres modèles, nous respecterons toutes les réglementations européennes en matière de protection des données personnelles, de sécurité de l'IA et de droit d'auteur.

Image

Quels sont les potentiels d’une IA « italienne »

Soi d'ici 2024 l'objectif de sera atteint faire construire les premiers modèles à partir de zéro, formés nativement en langue italienne, le paysage de l'IA pour nous, Italiens, pourrait changer considérablement. «À ce moment-là», affirme Giovanni Germani, «nous serons en mesure d'offrir aux entreprises et à l'administration publique une alternative aux fournisseurs actuels d'IA».

Cela signifiera pouvoir entraîner des modèles avec des personnalisations ad hoc en gardant physiquement vos données en Italie (pour mémoire, le centre de données qui hébergera le supercalculateur Fastweb utilisé pour la formation est situé en Lombardie), avec tous les avantages liés au protection et contrôle des informations.

Plus intéressant encore, disposer d'une intelligence artificielle « italienne » contribuera à la naissance potentielle de nouveaux chatbots et assistants virtuels capables de communiquer naturellement avec ceux qui parlent italien, disposant de systèmes de traduction automatique plus efficaces, fiables et précis, et générant du contenu créatif qui a du sens dans notre langue.