CIENCIA

Nvidia creó un cambiador de caras para mascotas que aprende de unos pocos ejemplos

La mayoría de la IA que manipula o transforma imágenes requiere una gran cantidad de datos de entrenamiento que sirvan de base para sus habilidades. NVIDIA encontró una manera de entrenar un modelo con solo una imagen de entrada de cualquier mascota y algunos ejemplos de otro animal.

en un artículo reciente, Nvidia explica las habilidades y el propósito de crear este nuevo enfoque:

Si bien son muy exitosos, los métodos actuales requieren acceso a muchas imágenes tanto en las clases de origen como en las de destino en el momento del entrenamiento. Argumentamos que esto limita en gran medida su uso. Inspirándonos en la capacidad humana de captar la esencia de un objeto nuevo a partir de una pequeña cantidad de ejemplos y generalizar a partir de ahí, buscamos un algoritmo de traducción de imagen a imagen de pocas tomas y sin supervisión que funcione en clases de destino nunca antes vistas que son especificado, en el momento de la prueba, solo por unas pocas imágenes de ejemplo. Nuestro modelo logra esta capacidad de generación de pocos disparos al acoplar un esquema de entrenamiento contradictorio con un diseño de red novedoso.

Nvidia llama al marco de entrenamiento de su red “Traducción de imágenes sin supervisión de pocas tomas” (FUNIT) porque aprende de solo unos pocos ejemplos de una clase de imágenes (por ejemplo, beagles, osos polares) sin la guía humana directa. El tamaño necesario significativamente reducido para los conjuntos de datos de entrenamiento le dará a este método una gran ventaja sobre los actuales, ya que mejorará en el futuro. Por el momento, requiere una cara de mascota sin obstrucciones para producir los resultados deseados. Si bien técnicamente funciona con rostros humanos, los resultados a menudo caen cómodamente en la categoría “espeluznante”.

Aunque el método de Nvidia solo tiene un propósito muy específico en este momento, y sus limitaciones dan como resultado fallas notables, su trabajo muestra la promesa de resultados mucho más impresionantes en algunas iteraciones más adelante. Con código de fuente abierta disponible para que cualquiera pueda construir (y un demostración pública para todos los demás), La calidad de FUNIT tiene una mayor probabilidad de lograr resultados utilizables mucho antes.

Mirando hacia el panorama general, FUNIT encaja muy bien con la categoría de problemas que Nvidia ha abordado con inteligencia artificial. Además de convertir bocetos objetivamente terribles en paisajes completos y generar entornos urbanos 3D completos para el desarrollo de juegos, parece que Nvidia espera crear un conjunto de herramientas que reduzca en gran medida el tiempo y los gastos necesarios para crear activos de videojuegos. Cuando Los activos de personajes para títulos AAA pueden costar alrededor de $ 80,000, los estudios de juegos pueden reducir los costos en una cantidad significativa con la ayuda de la inteligencia artificial.

Por supuesto, FUNIT necesitará más que una aptitud razonable para el intercambio de perros antes de que pueda ayudar a crear un conjunto de herramientas de inteligencia artificial capaz de generar recursos de juego detallados y dinámicos a la par con el talento humano.

Crédito de la imagen: Adam Dachis (resultados traducidos por Nvidia)

Publicaciones relacionadas

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba
Cerrar
Cerrar