Unidad de Investigación de Inteligencia Artificial de Google LLC Mente profunda Hoy reveló que ha experimentado con un nuevo tipo de agente de IA que puede Realiza múltiples tipos de tareas en videojuegos 3D Ella nunca había jugado antes.
La organización de investigación es conocida desde hace mucho tiempo por sus logros en los juegos, ya que ha creado sistemas inteligentes de inteligencia artificial que pueden enfrentarse a campeones mundiales de Go, Ajedrez y Estrategia. También ha construido modelos que pueden aprender a jugar sin aprender las reglas.
Desde entonces, DeepMind ha centrado su atención específicamente en los videojuegos, y se dice que su agente más poderoso hasta la fecha se siente como en casa en una variedad de mundos de juegos, donde puede realizar una variedad de tareas basadas en instrucciones de humanos.
El equipo de investigación de DeepMind colaboró con varios estudios de juegos en la investigación y capacitó al equipo de investigación. Un agente multimundo escalable y entrenableConocido como «SIMA» en nueve juegos diferentes. Además, utilizaron cuatro entornos de investigación, incluido uno creado con el motor de juegos 3D Unity, para mejorar SIMA. Allí, a SIMA le encomendaron formar esculturas a partir de bloques de construcción, avance que le permitió aprender a adaptarse a diferentes escenarios de videojuegos, con diferentes estilos gráficos y perspectivas, como primera y tercera persona.
«Cada juego del portafolio de SIMA abre un nuevo mundo interactivo, que incluye un conjunto de habilidades para aprender, desde una simple navegación y uso de menús hasta la extracción de recursos, volar una nave espacial o fabricar un casco», escribieron los investigadores en una publicación de blog.
La capacidad de SIMA para seguir instrucciones y completar tareas en mundos de videojuegos podría allanar el camino para agentes de IA más útiles que puedan funcionar en entornos del mundo real, dijeron los investigadores.
Para enseñar SIMA, primero se propusieron grabar a humanos jugando videojuegos, observando qué entradas de teclado y mouse se utilizaban. Esta información se introduce en SIMA, que se basa en un modelo preciso de mapeo del lenguaje de imágenes y un modelo de video que puede ver un juego de computadora en la pantalla y predecir lo que podría suceder a continuación.
SIMA puede comprender una variedad de entornos de juego y luego llevar a cabo casi cualquier tarea que se le solicite, dijeron los investigadores. Lo impresionante es que SIMA no requiere acceso al código fuente del juego. Simplemente ejecuta versiones comerciales de juegos y requiere sólo dos entradas: acción en pantalla e instrucciones del usuario humano. Luego juega usando las mismas entradas que usan los humanos, es decir, teclado y mouse.
El equipo de DeepMind evaluó el desempeño de SIMA en cientos de habilidades básicas de juego en categorías como navegación, tareas basadas en menús e interacción con objetos. Luego probaron sus habilidades entrenándolo para jugar un juego antes de que jugara el mismo título, usándolo como base para su desempeño.
Según los investigadores, un agente de SIMA que fue entrenado por primera vez en los nueve juegos tuvo un desempeño significativamente mejor en un juego determinado que un agente que fue entrenado solo en el mismo juego. Esto indica que puede beneficiarse de la experiencia adquirida jugando otros juegos para mejorar su rendimiento.
También entrenaron al agente SIMA durante ocho juegos, luego lo probaron en el noveno juego, algo que nunca se había hecho antes, y funcionó casi tan bien como el agente probado en solo ese juego. «Esta capacidad de operar en entornos completamente nuevos pone de relieve la capacidad de SIMA para generalizar más allá de su formación», señalaron los investigadores. «Este es un resultado preliminar prometedor, pero se necesita más investigación para que SIMA pueda funcionar a nivel humano en juegos visuales y no visuales».
Los investigadores descubrieron que SIMA necesita poca orientación por parte de los humanos para realizar su trabajo correctamente. Los investigadores dijeron que un agente de SIMA que no recibiera ninguna capacitación o instrucciones lingüísticas no caminaría donde se le dijera que lo hiciera, sino que solo realizaría acciones comunes, como recolectar recursos. «[It] «Se comportan de manera apropiada pero sin rumbo», dijeron los investigadores sobre estos agentes no entrenados ni dirigidos.
DeepMind dijo que la investigación muestra que hay potencial en la idea de desarrollar «una nueva ola de agentes de IA generales basados en el lenguaje». La investigación sugiere que a medida que los modelos de IA se expongan a más entornos de entrenamiento, podrían volverse más versátiles y generalizables.
En última instancia, DeepMind pretende crear agentes que puedan realizar tareas más complejas y de varias etapas basadas en indicaciones de lenguaje natural. Entonces, al final, un humano podría decirle a un agente que juega un juego como Command & Conquer que reúna algunos recursos, construya una base y una fuerza militar, y vaya y destruya al oponente. En la actualidad, esta tarea resulta demasiado compleja para los clientes de SIMA.
«En última instancia, nuestra investigación avanza hacia sistemas y agentes de IA más generales que puedan comprender una amplia gama de tareas y realizarlas de forma segura de una manera que sea útil para las personas en línea y en el mundo real», dijo DeepMind.
Imágenes: Mente profunda
Su voto a favor es importante para nosotros y nos ayuda a mantener el contenido gratuito.
Un clic a continuación respalda nuestra misión de proporcionar contenido gratuito, profundo y relevante.
Únase a nuestra comunidad en YouTube
Únase a una comunidad de más de 15 000 expertos de #CubeAlumni, incluido el director ejecutivo de Amazon.com, Andy Jassy, el fundador y director ejecutivo de Dell Technologies, Michael Dell, el director ejecutivo de Intel, Pat Gelsinger, y muchas más figuras y expertos notables.
gracias
«Food ninja. Freelance pop culture fanatic. Wannabe zombie maven. Twitter aficionado.»
More Stories
La red social Butterflies AI añade una función que te convierte en un personaje de inteligencia artificial
Edición del vigésimo aniversario de Hautlence HLXX: redefiniendo el tiempo con minutos que retroceden y horas saltantes
Un marco para resolver ecuaciones diferenciales parciales equivalentes puede guiar el procesamiento y la ingeniería de gráficos por computadora