La robótica es un campo que poco a poco va evolucionando —sin prisa pero sin pausa— que tiene el potencial de transformar las vidas de todos. Los robots ya se utilizan para realizar todo tipo de tareas en múltiples sectores, desde la industria hasta incluso en medicina y cirugías.
Sin embargo, no cabe duda de que aún hay mucho trabajo por hacer para crear robots que sean capaces de realizar o incluso sustituir a los humanos a la hora realizar determinados trabajos —no una sustitución completa, sino un apoyo seguro y realmente útil—.
Resulta que, precisamente, el proyecto RT-X parece que va por este camino y se trata de un esfuerzo colaborativo internacional de 32 laboratorios de robótica que tiene como finalidad crear robots de uso general.
El proyecto se basa en la idea de usar grandes modelos de redes neuronales entrenados con un conjunto de datos masivo de demostraciones robóticas, al más puro estilo ChatGPT, pero claro, esto va un paso más allá y las funcionalidades no se quedan dentro de un dispositivo.
El proyecto RT-X ha logrado dos avances importantes en el campo de la robótica
Por un lado, han demostrado que es posible entrenar un único modelo de red neuronal para controlar muchos tipos diferentes de robots. Esto se debe a que el modelo puede aprender a reconocer el tipo de robot que está controlando a partir de las observaciones de la cámara del robot.
Esto, en pocas palabras, permite crear robots que sean capaces de adaptarse a diferentes entornos y condiciones. Por ejemplo, un robot entrenado con el modelo RT-X podría utilizarse en una fábrica para manipular objetos de diferentes formas y tamaños, o en un hospital para realizar tareas de atención al paciente en diferentes habitaciones.
“La escala de este proyecto es muy grande porque tiene que serlo. El conjunto de datos RT-X contiene actualmente casi un millón de pruebas robóticas para 22 tipos de robots, incluidos muchos de los brazos robóticos más utilizados en el mercado”, se explica en un artículo de Spectrum. “En total, hay alrededor de 500 habilidades diferentes e interacciones con miles de objetos diferentes. Es el conjunto de datos de código abierto más grande que existe sobre acciones robóticas reales”, añade.
Por otro, han logrado también demostrar que es posible combinar datos de robots con datos de texto e imágenes a escala de Internet para crear robots con capacidades de razonamiento más profundas. En concreto, y tal y como explican, el modelo es similar a los disponibles como ChatGPT o Bard.
Esto permite a los robots comprender conceptos como “entre” y “encima de”, que son necesarios para realizar tareas como podría ser la limpieza de una casa, teniendo un control absoluto y casi humano de cómo es el entorno.
“Estas conexiones le dan al robot un grado de sentido común, que algún día podría permitirles comprender el significado de comandos de usuario complejos y matizados como “Tráeme mi desayuno” mientras llevan a cabo las acciones para que esto suceda”, explican.
Con todo esto, no cabe duda de que el proyecto RT-X es muy ambicioso, pero tiene el potencial de revolucionar el campo de la robótica. Si los investigadores pueden seguir avanzando en esta línea de trabajo, los robots generalistas podrían convertirse en una realidad más pronto que tarde.
“Dado que la comunidad de robótica no puede depender de Internet para obtener datos de entrenamiento, debemos crear esos datos nosotros mismos. Esperamos que más investigadores contribuyan con sus datos a la base de datos RT-X y se unan a este esfuerzo de colaboración”, finalizan.
Fuente: Computer Hoy