ByteDance a présenté un « cerveau » IA pour les robots

ByteDance a présenté un « cerveau » IA pour les robots

La société ByteDance, propriétaire de TikTok, a présenté un système qui sert de "cerveau" pour les robots. Il permet d'effectuer des tâches ménagères telles que pendre des vêtements ou nettoyer la table.

GR-3 est un grand modèle de langage de type « vision-langage-action », qui permet aux bots de suivre des commandes en langage naturel et d'exécuter des tâches universelles avec des objets inconnus. Ils peuvent fonctionner dans de nouvelles conditions ou avec des concepts abstraits liés aux dimensions et aux relations spatiales.

Dans la vidéo publiée sur le site, il est démontré comment le robot bipède de laboratoire ByteMini peut insérer un cintre dans une chemise et le placer sur un support.

🚀🚀🚀 Vous vous êtes déjà demandé ce qu'il faut pour que les robots s'occupent des tâches ménagères dans le monde réel ? exécution à long terme, dextérité avec des objets déformables et généralisation d'objets invisibles — découvrez GR-3, le nouveau modèle Vision-Langage-Action (VLA) de ByteDance Seed !

GR-3 est un modèle généralisable… pic.twitter.com/zECRjaXC0J

— Xiao Ma (@yusufma555) 22 juillet 2025

Dans un rapport technique distinct, l'équipe a rapporté que le bot gère les vêtements à manches courtes, bien que « tous les articles dans les données d'entraînement étaient à manches longues ».

Grâce au GR-3, le robot peut exécuter des commandes pour choisir un objet spécifique parmi plusieurs et le placer à un endroit désigné.

Le système est capable de reconnaître un objet non seulement par son nom, mais aussi par sa taille ( par exemple, «grande assiette» ) ou par un attribut spatial ( par exemple, «à gauche» ). Il peut exécuter complètement la tâche «débarasser la table» sur la base d'une seule commande.

Pour former le modèle, ByteDance a utilisé une approche multi-composants, incluant :

  • apprentissage collaboratif sur de grands ensembles de données au format « image-texte »;
  • formation supplémentaire sur les trajectoires d'actions humaines, collectées à l'aide d'appareils VR;
  • configuration par imitation sur les données de mouvement d'Android.

«Nous espérons que le GR-3 sera un pas vers la création de robots universels capables d'aider les gens dans la vie quotidienne», a déclaré l'équipe.

Rappelons qu'en janvier, la startup Perplexity AI a annoncé son intention d'acquérir le TikTok américain. La société a envoyé à ByteDance une proposition de fusion de Perplexity, TikTok U.S. et de nouveaux partenaires en capital dans une seule structure juridique.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)