NVIDIA pousse l'IA pour l'apprentissage des robots humanoïdes : lancement du projet GR00T

Alexis Tremblay
Alexis Tremblay

Il s'appelle Projet GR00T (Généraliste Robot 00 Technologie) la nouvelle plateforme d'intelligence artificielle présentée par Nvidia aux GTC 2024, destinées à faciliter la création de robots humanoïdes capable d'imiter les mouvements et le langage naturel directement en observant les humains. Lors de la présentation, une démonstration a été vue avec des robots capables de répondre de manière crédible aux entrées données par les humains, démontrant que le projet est déjà à un bon niveau de maturité. Avec ce projet, le géant de l'informatique veut concurrencer OpenAIla société ChatGPT, qui faisait la une des journaux il y a quelques jours seulement avec son robot humanoïde Chiffres 01. Pour accompagner la nouvelle plateforme, NVIDIA a également présenté le puissance de calcul du nouveau SoC (Système sur puce) Jetson Thor qui utilise les nouveaux pour les calculs graphiques GPU Blackwelldédié aux applications d'intelligence artificielle, qui promettent des performances de 7 à 30 fois supérieures par rapport à la génération précédente.

Nvidia a développé une plateforme appelée Isaac, qui simplifie et réduit les coûts de développement de robots à des fins industrielles ou commerciales. Entre autres fonctionnalités, NVIDIA Isaac vous permet d'utiliser des modèles prédéfinis pour entraîner des robots, exécuter des tests et des simulations et simplifier le développement de robots autonomes.

La stratégie de NVIDIA est donc de attirer les entreprises intéressés à investir dans le secteur de la robotique et de l'IA en leur fournissant une suite avec laquelle concevoir et développer des robots à partir de zéro. Des entreprises comme Dynamique de Boston, Sanctuaire c'est le même Les chiffres de l'IA ont déjà rejoint le projet.

De plus, pour automatiser la capacité d'apprentissage des robots, en plus de rendre disponible la suite Isaac, NVIDIA a prévu modèles d'apprentissage capable de traiter un multitude de fichiers données en entrée. Le modèle permet un apprentissage à partir de l'ensemble des données fournies : par exemple, il est possible de demander l'analyse de textes, images, vidéos ou même de manifestations comportementales liés à la proxémie, au mimétisme et à la gestuelle. Après le traitement, le robot peut être formé et utiliser ce qu'il a « appris » pour produire caractéristiques unique tels que les mouvements, les propriétés de la parole (même dans les langues) ou la capacité d'interagir avec les utilisateurs en fonction des informations reçues en entrée.

gr00t-foundation-model-workflow