Inicio Noticiero Digital La IA de OpenAI ahora sabe jugar a Minecraft: ha aprendido viendo...

La IA de OpenAI ahora sabe jugar a Minecraft: ha aprendido viendo 70.000 horas de vídeos en YouTube

El potencial de la inteligencia artificial (IA) no deja de sorprendernos. En los últimos meses hemos visto desde un ingeniero de Google charlando con un chatbot hasta las delirantes creaciones de DALL-E Mini. Ahora, por si esto fuera poco, un modelo de OpenAI ha aprendido a jugar a Minecraft viendo vídeos en YouTube, y lo hace bastante bien.

La compañía explica que el modelo entrenado para jugar a Minecraft tiene la capacidad de ir más allá de las tareas de supervivencia básicas del juego. Por ejemplo, es capaz de nadar, cazar y cocinar animales. Incluso ha perfeccionado la técnica «salto de pilar», que permite crear un bloque improvisado para llegar a lugares más altos.

Entrenando una IA para que aprenda a jugar

Aunque anteriormente hemos visto a modelos de IA aprendiendo otras tareas, como conducir un coche en solo 20 minutos, los investigadores tuvieron que superar varios desafíos para entrenar un modelo de IA en un juego de mundo abierto. En primer lugar, necesitaban una gran cantidad de datos, los cuales fueron fáciles de conseguir en YouTube debido a que Minecraft es uno de los juegos más populares que existen.

Sin embargo, los vídeos cargados por los entusiastas del juego en YouTube muestran lo que están haciendo, pero no cómo lo están haciendo. Por consecuencia esto es un inconveniente para la IA, que no sabe «qué teclas presionar» para realizar determinadas acciones. En este sentido, los investigadores adoptaron una novedosa técnica.

Por un lado crearon un pequeño conjunto de datos basados en vídeos, pero que detallaba cada una de la acciones llevadas a cabo por los usuarios (para ello contrataron a varias personas para que jueguen por muchas horas). En base a esto, entrenaron un modelo de dinámica inversa (IDM) que predice qué acción vendrá a continuación.

Así, en lugar de exponer a la IA a una enorme cantidad de datos sin etiquetar, primero se tomaron el tiempo de enseñarle cómo jugar con el modelo de dinámica inversa. Después, cuando volcaron el resto de la información, el modelo sabía cuáles eran las acciones necesarias para desarrollar una amplia variedad de tareas.

Según explica OpenAI, esta nueva técnica les permitió entrenar a su modelo con 70.000 horas de vídeos publicados publicados en internet. «Aprender a talar árboles para recolectar madera y convertir esa madera en una mesa de trabajo es casi imposible de lograr con el aprendizaje por refuerzo», aseguran. Lo cierto es que estos avances podrían ir más allá de los mundo de los videojuegos, la compañía cree que podría ser útil en otros escenarios, por ejemplo, en enseñarle a usar ordenadores. Skynet, ¿eres tú?

En Xataka | Europa abraza la Inteligencia Artificial: así es el pionero acuerdo que explotará (y limitará) sus posibilidades