A empresa ByteDance, que controla o TikTok, apresentou um sistema que atua como o "cérebro" para robôs. Ele permite realizar tarefas domésticas como pendurar roupas ou limpar a mesa.
GR-3 é um grande modelo de linguagem do tipo "visão-linguagem-ação", que permite que os robôs sigam comandos em linguagem natural e realizem tarefas universais com objetos desconhecidos. Eles podem operar em novas condições ou com conceitos abstratos relacionados a tamanhos e relações espaciais.
No vídeo publicado no site, é demonstrado como o robô de laboratório de duas mãos ByteMini pode inserir um cabide na camisa e colocá-lo no suporte.
🚀🚀🚀 Já se perguntou o que é necessário para os robôs lidarem com tarefas domésticas do mundo real? execução de longo prazo, destreza com objetos deformáveis e generalização de objetos invisíveis — conheça o GR-3, o novo modelo Vision-Language-Action (VLA) da ByteDance Seed!
GR-3 é um generalizável… pic.twitter.com/zECRjaXC0J
— Xiao Ma (@yusufma555) 22 de julho de 2025
Num relatório técnico separado, a equipe informou que o robô lida com roupas de mangas curtas, embora "todos os itens nos dados de treinamento fossem de mangas longas."
Graças ao GR-3, o robô pode executar comandos para escolher um item específico entre vários e colocá-lo em um local designado.
O sistema é capaz de reconhecer um objeto não apenas pelo nome, mas também pelo tamanho (, por exemplo, "prato grande" ) ou por um atributo espacial (, por exemplo, "à esquerda" ). Ele pode executar completamente a tarefa "limpar a mesa de jantar" com um único comando.
Para treinar o modelo, a ByteDance utilizou uma abordagem multimodal que inclui:
aprendizagem conjunta em grandes conjuntos de dados no formato "imagem-texto";
treinamento adicional com informações sobre as trajetórias das ações humanas, coletadas com dispositivos de VR;
configuração por imitação com dados sobre os movimentos do android.
"Esperamos que o GR-3 seja um passo em direção à criação de robôs universais capazes de ajudar as pessoas no dia a dia", disse a equipe.
Recordamos que, em janeiro, a startup Perplexity AI anunciou a sua intenção de adquirir o TikTok americano. A empresa enviou à ByteDance uma proposta para unir a Perplexity, o TikTok U.S. e novos parceiros de capital numa única estrutura jurídica.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A ByteDance apresentou um "cérebro" de IA para robôs
ByteDance apresentou o «cérebro» de IA para robôs
A empresa ByteDance, que controla o TikTok, apresentou um sistema que atua como o "cérebro" para robôs. Ele permite realizar tarefas domésticas como pendurar roupas ou limpar a mesa.
GR-3 é um grande modelo de linguagem do tipo "visão-linguagem-ação", que permite que os robôs sigam comandos em linguagem natural e realizem tarefas universais com objetos desconhecidos. Eles podem operar em novas condições ou com conceitos abstratos relacionados a tamanhos e relações espaciais.
No vídeo publicado no site, é demonstrado como o robô de laboratório de duas mãos ByteMini pode inserir um cabide na camisa e colocá-lo no suporte.
Num relatório técnico separado, a equipe informou que o robô lida com roupas de mangas curtas, embora "todos os itens nos dados de treinamento fossem de mangas longas."
Graças ao GR-3, o robô pode executar comandos para escolher um item específico entre vários e colocá-lo em um local designado.
O sistema é capaz de reconhecer um objeto não apenas pelo nome, mas também pelo tamanho (, por exemplo, "prato grande" ) ou por um atributo espacial (, por exemplo, "à esquerda" ). Ele pode executar completamente a tarefa "limpar a mesa de jantar" com um único comando.
Para treinar o modelo, a ByteDance utilizou uma abordagem multimodal que inclui:
Recordamos que, em janeiro, a startup Perplexity AI anunciou a sua intenção de adquirir o TikTok americano. A empresa enviou à ByteDance uma proposta para unir a Perplexity, o TikTok U.S. e novos parceiros de capital numa única estrutura jurídica.