Investigadores crean «3D-GPT» para generar modelos 3D a partir de descripciones de texto
Investigadores de la Universidad Nacional de Australia, la Universidad de Oxford y la Academia de Inteligencia Artificial de Pekín han desarrollado un nuevo sistema de IA llamado «3D-GPT» que puede generar modelos 3D simplemente a partir de descripciones basadas en texto proporcionadas por un usuario.
El sistema ofrece una forma más eficaz e intuitiva de crear activos 3D en comparación con los flujos de trabajo de modelado 3D tradicionales.
3D-GPT es capaz de «diseccionar las tareas de modelado 3D procedimental en segmentos accesibles y designar el agente adecuado para cada tarea», según el artículo. Utiliza varios agentes de IA que se centran cada uno en una parte distinta de la comprensión del texto y la ejecución de las funciones de modelado.
«3D-GPT sitúa a los LLM [modelos lingüísticos de gran tamaño] como competentes solucionadores de problemas, diseccionando las tareas de modelado procedimental en 3D en segmentos accesibles y designando al agente adecuado para cada tarea», afirman los investigadores.
Los agentes clave son un «agente de envío de tareas» que analiza las instrucciones de texto, un «agente de conceptualización» que añade detalles que faltan en la descripción inicial y un «agente de modelado» que establece parámetros y genera código para manejar software 3D como Blender.
Al desglosar el proceso de modelado y asignar agentes de IA especializados, 3D-GPT es capaz de interpretar las instrucciones de texto, mejorar las descripciones con detalles adicionales y, en última instancia, generar activos 3D que coincidan con lo que el usuario imaginó.
El sistema se probó con instrucciones como «una brumosa mañana de primavera, en la que las flores besadas por el rocío salpican un exuberante prado rodeado de árboles en ciernes». 3D-GPT fue capaz de generar escenas tridimensionales completas con gráficos realistas que reflejaban con precisión los elementos descritos en el texto.
Aunque la calidad de los gráficos aún no es fotorrealista, los primeros resultados sugieren que este enfoque basado en agentes es prometedor para simplificar la creación de contenidos 3D. La arquitectura modular también podría permitir mejorar cada componente del agente de forma independiente.