IA

¿Pueden los robots hacer origami? Descubre cómo Google lo logró

📱 ¡Liquidación! Xiaomi está liquidando los Redmi Note 14 y 14 Pro… ¡corre que vuelan! [ Saber más ]

Google DeepMind anunció recientemente el lanzamiento de dos avanzados modelos de inteligencia artificial especialmente diseñados para controlar robots: Gemini Robotics y Gemini Robotics-ER.

Estos modelos buscan mejorar la interacción de los robots con el mundo real, dotándolos de mayor precisión y eficacia en sus movimientos, y acercando la visión de asistentes robóticos humanoides a la realidad cotidiana.

TE INTERESA:
Los robots humanoides de Figure ayudarán con las tareas domésticas este año

En el ámbito tecnológico existe un objetivo ambicioso conocido como «Inteligencia Artificial Encarnada» (Embodied AI), que pretende dotar a los robots de la capacidad de operar de manera autónoma en entornos desconocidos y complejos con seguridad y precisión. Empresas como Nvidia también trabajan intensamente en esta meta, considerándola clave para convertir a los robots en trabajadores versátiles en múltiples áreas.

Ambos modelos parten de Gemini 2.0, la avanzada plataforma de lenguaje de Google, pero cada uno tiene enfoques diferentes:

  • Gemini Robotics incluye habilidades de «visión-lenguaje-acción» (VLA), permitiendo al robot interpretar comandos verbales, procesar imágenes del entorno y generar movimientos precisos.
  • Gemini Robotics-ER, por otro lado, se especializa en el razonamiento espacial y la interacción física, siendo compatible con los sistemas actuales de control robótico.

Por ejemplo, Gemini Robotics puede identificar visualmente objetos como frutas y colocarlos en lugares específicos con órdenes simples, o incluso realizar tareas tan delicadas como plegar origami.

 

Anteriormente, Google había presentado modelos como RT-2, enfocado en interpretar órdenes generales mediante datos provenientes de internet. Aunque RT-2 duplicó la eficacia en tareas nuevas respecto a modelos previos, aún no lograba movimientos físicos complejos. Gemini Robotics supone un avance importante, ya que permite manipular objetos con gran destreza, realizar tareas delicadas como doblar papel o empacar alimentos, y generalizar comportamientos a situaciones inéditas.

DeepMind destacó que Gemini Robotics duplica el rendimiento en pruebas de generalización frente a otros modelos avanzados. Esto es vital, ya que la capacidad de adaptarse a entornos desconocidos sin entrenamiento previo permitirá que los robots operen efectivamente en situaciones impredecibles.

A pesar de esto, aún persiste cierto escepticismo respecto a la verdadera autonomía de robots humanoides presentados por otras empresas, como el Optimus Gen 3 de Tesla, que recientemente generó polémica debido a cuestionamientos sobre la autenticidad de sus demostraciones.

Google también anunció su colaboración con la empresa Apptronik, ubicada en Austin, Texas, con el objetivo de integrar Gemini 2.0 en robots humanoides avanzados. Aunque estos modelos fueron inicialmente probados con plataformas como ALOHA 2 (un robot de brazos duales), Gemini Robotics es compatible con diversos tipos de robots, desde brazos robóticos Franka hasta modelos humanoides complejos como el Apollo de Apptronik.

Cabe destacar que, aunque Google adquirió anteriormente empresas robóticas (como Boston Dynamics), esta alianza con Apptronik representa un enfoque renovado hacia la robótica humanoide y no una continuación directa de esfuerzos pasados.

 

Actualmente, Google ha facilitado un acceso limitado a Gemini Robotics-ER mediante un programa piloto con empresas expertas en robótica como Boston Dynamics, Agility Robotics y Enchanted Tools. Esto busca acelerar la creación de un «cerebro» generalista para robots, integrando plenamente capacidades físicas con inteligencia artificial avanzada.

Aunque Google no especificó fechas concretas para su implementación comercial, ni detalló posibles aplicaciones comerciales específicas, los avances presentados demuestran un progreso significativo en entornos controlados. No obstante, aún quedan preguntas abiertas sobre cómo estos sistemas rendirán en escenarios reales, más caóticos e impredecibles.

📱 ¡Liquidación! Xiaomi está liquidando los Redmi Note 14 y 14 Pro… ¡corre que vuelan! [ Saber más ]

¿Cuál es tu reacción?
Sorprendido
0%
Feliz
0%
Indiferente
0%
Triste
0%
Enfadado
0%
Aburrido
0%
Incrédulo
0%
¡Buen trabajo!
0%
Sobre el Autor
Luis A.
Luis es el creador y editor jefe de Teknófilo. Se aficionó a la tecnología con un Commodore 64 e hizo sus pinitos programando gracias a los míticos libros de 🛒 'BASIC para niños' con 11 años. Con el paso de los años, la afición a los ordenadores se ha extendido a cualquier cacharrito que tenga una pantalla y CPU.
Comentarios
Deja un comentario

Deja un comentario