Les robots humanoïdes apprennent à travailler ensemble grâce au contrôle par le langage naturel, le nouveau système d'IA Helix permet à deux robots de collaborer à des tâches communes

Collaboration multi-robots. Helix peut faire fonctionner simultanément deux robots, ce qui leur permet de résoudre une tâche commune de manipulation à long terme d'objets nouveaux.

Contrôle total de la partie supérieure du corps. Helix peut assurer un contrôle continu de toute la partie supérieure du corps du robot, y compris la tête, le torse, les poignets et les doigts individuels.

Un seul réseau neuronal. Helix utilise un seul ensemble de poids de réseau neuronal pour apprendre tous les comportements, y compris la prise et le placement d'objets, l'utilisation de tiroirs et de réfrigérateurs et l'interaction inter-robots, sans aucun réglage fin spécifique à une tâche.

Prêt à être commercialisé. Helix fonctionne entièrement sur des unités de traitement général intégrées à faible consommation d'énergie, ce qui le rend prêt pour un déploiement commercial.



Figure AI est une société américaine de robotique spécialisée dans le développement de robots humanoïdes dotés d'IA. Elle a été fondée en 2022 par Brett Adcock, le fondateur d'Archer Aviation et de Vettery. L'équipe de Figure AI est composée d'experts en robotique, en intelligence artificielle, en détection, en perception et en navigation, combinant les expériences d'entreprises notables telles que Boston Dynamics et Tesla.Récemment, Figure AI a dévoilé Helix, un nouveau modèle d'IA vision-langage-action, le premier à contrôler directement la partie supérieure du corps d'un robot par le langage naturel, selon l'entreprise. Contrairement aux systèmes de contrôle de robots précédents, Helix peut effectuer des manipulations d'objets de longue portée, collaboratives et dextres "à la volée", sans passer par des heures de démonstrations de formation ou par une programmation manuelle approfondie, a déclaré Figure AI.Le système aurait une forte capacité de généralisation des objets et peut prendre des objets ménagers uniques qui n'ont pas été rencontrés lors de la formation en suivant des instructions en langage naturel. Parmi les autres "premières" d'Helix, a indiqué Figure AI, on peut citer les suivantes :Helix peut contrôler avec agilité et dextérité tous les mouvements de la partie supérieure de son corps grâce à un modèle VLA "Système 1, Système 2". Auparavant, les modèles de langage visuel étaient généraux mais pas rapides, tandis que les politiques visuomotrices des robots étaient rapides mais pas générales. Helix peut combiner les deux en utilisant des systèmes complémentaires formés de bout en bout pour communiquer entre eux.Le système 2 est un VLM embarqué et entraîné sur Internet pour la compréhension de la scène et du langage, ce qui permet une généralisation large à travers les objets et les contextes. Le système 1 fournit une politique visuomotrice rapide et réactive qui traduit les représentations sémantiques latentes de S2 en actions robotiques précises et continues.Selon Figure AI, cette architecture découplée permet à chaque système de fonctionner à son propre rythme, S2 pouvant "penser lentement" à des objectifs de haut niveau, tandis que S1 peut "penser rapidement" pour exécuter des actions en temps réel.Peu après avoir dévoilé Helix, Figure a annoncé une série d'améliorations apportées à S1 qui ont ouvert un nouveau cas d'utilisation commerciale pour la manutention et le tri des colis. La refonte de S1 fait passer l'entrée visuelle du système de monoculaire à stéréo, ce qui permet des mouvements plus précis et tenant compte de la profondeur. Le système peut interpréter des détails fins et des indices contextuels plus larges, ce qui permet un contrôle plus fiable.Pensez-vous que cette annonce est crédible ou pertinente ?Quel est votre avis sur le sujet ?