Le robot qui « improvise » sans qu'on lui ait appris à le faire : GEN-1 passe de 64 % à 99 % de réussite sur des tâches physiques complexes en cinq mois

Avancée technique majeure ou nouveau défi d'alignement ?

Le 9 avril 2026 à 23:18, par Stéphane le calme

460PARTAGES

Le robot qui « improvise » sans qu'on lui ait appris à le faire : GEN-1 passe de 64 % à 99 % de réussite sur des tâches physiques complexes en cinq mois,
avancée technique majeure ou nouveau défi d'alignement ?

En cinq mois seulement, Generalist AI est passé d'un taux de réussite de 64 % à 99 % sur des tâches physiques complexes, selon ses déclarations. Son nouveau modèle GEN-1 ne se contente pas d'être plus fiable et plus rapide : il improvise des solutions inédites face à l'imprévu. Un bond en avant qui soulève autant d'espoirs que de questions sur ce que signifie vraiment « maîtriser » le monde physique.

La robotique a longtemps souffert d'un paradoxe embarrassant : les machines qui battent les humains aux échecs ou composent des poèmes en quelques secondes sont incapables de plier un t-shirt sans tomber en panne. Ce hiatus, connu sous le nom de paradoxe de Moravec, rappelle que les tâches les plus « simples » pour un être humain (saisir un objet, ajuster une prise, récupérer après une erreur) sont en réalité d'une complexité redoutable pour un système automatisé. Depuis quelques jours, la startup américaine Generalist AI revendique avoir, sinon résolu ce problème, du moins franchi un seuil décisif avec son modèle GEN-1.

Des lois d'échelle appliquées au monde physique

Pour comprendre l'ampleur du bond accompli, il faut revenir cinq mois en arrière. En novembre 2025, Generalist présentait GEN-0, un modèle dont l'ambition principale était de démontrer que les « scaling laws », ces lois empiriques selon lesquelles plus de données et plus de calcul produisent des modèles plus performants, s'appliquaient aussi à la robotique, exactement comme elles l'ont fait pour les grands modèles de langage (LLM). GEN-0 avait montré pour la première fois que des lois d'échelle existaient en robotique, en établissant que davantage de données d'entraînement et de puissance de calcul conduisaient à des performances généralisées prévisibles. Mais les chiffres restaient insuffisants pour envisager un déploiement commercial sérieux : sans préentraînement, les tâches entraînées de zéro affichaient en moyenne 19 % de réussite, et les modèles GEN-0 affinés atteignaient 64 %, des niveaux insuffisants pour la production industrielle.

GEN-1 change radicalement la donne. À travers une mise à l'échelle supplémentaire des fondations de GEN-0, accélérée par des avancées algorithmiques, le modèle parvient désormais à maîtriser des tâches simples avec des taux de réussite dépassant 99 %, à compléter ces tâches jusqu'à trois fois plus vite que l'état de l'art précédent, et à afficher une gamme de comportements émergents pour se remettre de scénarios inattendus, le tout en n'utilisant qu'environ une heure de données robotiques spécifiques.

La donnée humaine comme matière première

L'un des verrous historiques de la robotique apprenante a toujours été la rareté des données d'entraînement de qualité. Contrairement aux LLM qui ont pu se nourrir de l'intégralité du texte humain disponible sur Internet, les modèles robotiques n'ont pas d'équivalent numérique pour les interactions physiques. La téléopération (contrôler un bras robotique à distance pour lui montrer comment accomplir une tâche) est coûteuse, lente et difficile à passer à l'échelle.

Generalist a contourné ce problème par une approche originale. La société s'est tournée vers des « data hands », des dispositifs de pinces portables qui enregistrent les micro-mouvements et les indices visuels pendant que des humains réalisent des tâches manuelles. L'entreprise affirme avoir collecté plus d'un demi-million d'heures et des pétaoctets de données d'interaction physique pour entraîner son modèle. La subtilité est importante : le modèle de fondation de base est entraîné sans aucune donnée robotique, il utilise uniquement des données issues de dispositifs portables sur des humains effectuant des millions d'activités, ce qui constitue la preuve que ce préentraînement peut mener à des niveaux élevés de maîtrise sans nécessiter de larges ensembles de données de téléopération ou de simulation.

La conséquence est remarquable en termes d'efficacité : lorsque GEN-1 s'adapte à un nouveau robot et à une nouvelle tâche, il le fait simultanément, et en seulement une heure. Le modèle de fondation de base est préentraîné entièrement sur des données humaines ; il ne rencontre le matériel robotique réel que lors de cette dernière heure d'adaptation spécifique à la tâche.

Le triptyque de la maîtrise : fiabilité, vitesse, improvisation

Generalist définit la « maîtrise » robotique selon trois axes complémentaires. Les deux premiers (fiabilité et vitesse) sont les piliers traditionnels de l'automatisation industrielle depuis les années 1960. C'est le troisième qui introduit quelque chose de fondamentalement nouveau.

Sur le plan de la fiabilité, les démonstrations sont éloquentes. GEN-1 peut accomplir plusieurs tâches à des niveaux élevés de fiabilité sur de longues durées sans intervention : préparation de kits de pièces automobiles pendant plus d'une heure, pliage de t-shirts 86 fois de suite, entretien de robots aspirateurs plus de 200 fois de suite, empaquetage de blocs plus de 1 800 fois de suite, pliage de boîtes plus de 200 fois de suite, et emballage de téléphones plus de 100 fois de suite. Ces séquences, réalisées en autonomie complète pendant des heures, illustrent le passage d'un système expérimental à quelque chose d'industriellement exploitable.

La vitesse est le deuxième vecteur de progrès. GEN-1 peut assembler une boîte en 12,1 secondes, soit 2,8 fois plus vite que l'état de l'art précédent, GEN-0 et π0 prenant tous deux environ 34 secondes sur des boîtes identiques. GEN-1 peut aussi emballer un téléphone dans son étui en 15,5 secondes, à 2,8 fois la vitesse de GEN-0. Cette accélération ne relève pas simplement d'une augmentation de la puissance motrice : les modèles apprennent de l'expérience pour atteindre ces vitesses, et GEN-1 introduit une évolution de la façon d'effectuer l'inférence avec ce que Generalist appelle le « Harmonic Reasoning ».

L'improvisation est sans doute la dimension la plus significative et la plus difficile à évaluer. Dans un exemple à longue trajectoire de préparation de kits automobile, si une rondelle est déplacée au point de ne plus être saisie correctement, le robot peut soit la reposer pour la reprendre proprement, soit l'insérer partiellement dans une fente pour forcer un repositionnement et reprendre la pièce correctement, soit même décider d'utiliser son autre bras pour saisir la pièce à deux mains. Ces comportements se situent bien en dehors de la distribution d'entraînement. Comme l'a déclaré l'ingénieur Felix Wang : « Personne n'a programmé le robot pour faire des erreurs, donc personne ne l'a programmé pour se remettre d'erreurs. Et pourtant, ça se produit naturellement. »

Le problème du dernier 1 % : une perspective coréenne

Paradoxalement, c'est précisément ce résultat à 99 % qui cristallise les inquiétudes des experts. Si Generalist a atteint ce seuil symbolique, que signifie le 1 % restant ? Vivek Burhanpurkar, PDG de Cyberworks Robotics, décrit cette situation comme un « problème des 99 % » : il est relativement simple de développer des systèmes performants pour la grande majorité des situations, mais le défi réside dans ce qui reste. En d'autres termes, les cas marginaux, ces scénarios rares mais inévitables dans tout environnement réel, continuent de poser un problème structurel.

La Corée du Sud, qui affiche la densité robotique la plus élevée au monde avec 1 012 robots pour 10 000 employés, se trouve au cœur de cette transition. Le pays est en train de passer d'une phase d'adoption à une phase de validation : il ne s'agit plus d'augmenter le nombre de robots, mais de s'assurer que ces systèmes fonctionnent de manière fiable dans des conditions réelles. Les documents de politique industrielle du ministère coréen du Commerce, de l'Industrie et de l'Énergie reconnaissent d'ailleurs que les cadres institutionnels et les normes de sécurité restent incomplets pour les robots mobiles et de service opérant en environnement ouvert.

Un analyste résumait la situation ainsi : « Generalist est passé de 64 % à 99 % en cinq mois. Ce n'est pas un progrès incrémental, c'est un problème de planification. Si vous conduisez une étude de faisabilité sur deux ans, la technologie que vous évaluez aujourd'hui pourrait être obsolète avant que vous n'ayez terminé la paperasse. »

Un système, pas seulement un modèle

Il serait réducteur de limiter GEN-1 à un simple ensemble de poids de modèle. GEN-1 comprend des innovations à travers les avancées de préentraînement, les techniques de post-entraînement, l'apprentissage par l'expérience (RL), le guidage humain multimodal, ainsi que de nouvelles techniques à l'inférence. L'infrastructure d'entraînement distribuée a été entièrement repensée pour gérer des pétaoctets de données d'interaction physique, avec la conception de nouveaux noyaux de calcul, de nouvelles formes d'attention paginée pour permettre l'inférence en temps réel, et même la conception de nouveaux matériels déployés dans de nouvelles géographies pour diversifier les données.

La comparaison avec GPT-3 est explicitement revendiquée par Generalist. Tout comme GPT-2 avait tracé un chemin scalable pour l'apprentissage multitâche sans être déployable dans des contextes économiquement utiles, puis GPT-3 avait montré que les lois d'échelle tenaient et que de nouvelles capacités émergentes apparaissaient rendant le modèle viable pour certaines tâches comme la rédaction publicitaire, GEN-1 suit une trajectoire analogue.

L'alignement des robots : un nouveau défi

Avec l'improvisation émergente vient une question que l'industrie devra traiter avec sérieux. Bien que le préentraînement sur des données d'interaction à grande échelle débloque une improvisation émergente (comme secouer un sac pour aider un objet à se repositionner, réorganiser des objets mal placés, ou saisir des objets qui tombent) ce sont des actions physiques avec de vraies conséquences. La définition du succès en robotique n'est pas universelle : elle est spécifique à la tâche, au flux de travail, et ultimement définie par l'utilisateur. Un robot qui improvise intelligemment pour récupérer d'une erreur peut aussi prendre une « initiative créative » non souhaitée. Le domaine de l'alignement, jusqu'ici principalement discuté dans le contexte des LLM, devra s'étendre rapidement aux systèmes incarnés.

Generalist reconnaît d'ailleurs que toutes les tâches testées n'atteignent pas le seuil des 99 %, et que certaines applications industrielles exigeraient des taux de succès encore plus élevés ou des vitesses d'exécution supérieures pour être réellement exploitables. Le chemin vers l'AGI physique reste long, mais pour la première fois, il semble emprunter une trajectoire clairement balisée.

Sources : Generalist AI Team, Korea Tech Desk, vidéos dans le texte

Et vous ?

Le taux de 99 % de fiabilité affiché par GEN-1 est-il suffisant pour une adoption industrielle massive, ou ce 1 % d'échec représente-t-il encore un coût prohibitif dans les contextes à haute cadence ou haute criticité ?

L'approche « data hands » (collecter des données humaines via des dispositifs portables plutôt que par téléopération) est-elle suffisamment représentative de la diversité des environnements réels, ou risque-t-elle d'introduire des biais systémiques dans les comportements robotiques ?

La notion « d'improvisation émergente » est-elle vraiment nouvelle, ou s'agit-il d'une reformulation marketing d'une robustesse accrue aux cas limites ? Comment distinguer une véritable intelligence situationnelle d'une meilleure généralisation statistique ?

Si les lois d'échelle s'appliquent à la robotique de la même façon qu'aux LLM, quelles sont les implications en termes de concentration du marché ? Seules les entreprises capables de collecter des centaines de milliers d'heures de données physiques pourront-elles jouer dans la cour des grands ?

La question de l'alignement des robots incarnés vous semble-t-elle plus ou moins urgente que celle des LLM ? Quels mécanismes de contrôle faudrait-il imposer à des systèmes capables d'improviser des comportements non prévus par leurs concepteurs ?

Vous avez lu gratuitement 43 513 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Le robot qui « improvise » sans qu'on lui ait appris à le faire : GEN-1 passe de 64 % à 99 % de réussite sur des tâches physiques complexes en cinq mois

Avancée technique majeure ou nouveau défi d'alignement ?

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Le robot qui « improvise » sans qu'on lui ait appris à le faire : GEN-1 passe de 64 % à 99 % de réussite sur des tâches physiques complexes en cinq mois Avancée technique majeure ou nouveau défi d'alignement ?

Le robot qui « improvise » sans qu'on lui ait appris à le faire : GEN-1 passe de 64 % à 99 % de réussite sur des tâches physiques complexes en cinq mois

Avancée technique majeure ou nouveau défi d'alignement ?