La Inteligencia Artificial debería resolver los problemas de la humanidad, pero falló al jugar Pokémon Red y no poder encontrar un gimnasio después de 50,000 horas

Pokemon Red Ia
Sin comentarios Facebook Twitter Flipboard E-mail

El YouTuber Peter Whidden enseñó a una inteligencia artificial a jugar Pokémon Red utilizando un emulador. La motiva a realizar las acciones correctas a través de recompensas. Sin embargo, surgieron problemas constantes, como un 'miedo' a los Centros Pokémon y dificultades en la navegación.

¿Cómo funciona exactamente? La inteligencia artificial debería abordar el juego de la misma manera que lo haría un ser humano. El YouTuber explica que la IA es capaz de usar el control por sí misma. Después de cada acción, mira la pantalla y piensa en lo que debe hacer a continuación, de la misma manera que un usuario frente al dispositivo.

El miedo a la enfermera Joy, la búsqueda del segundo gimnasio y los 10,000 Magikarps

¿Cuáles fueron los problemas? En la primera visita al Centro Pokémon, la IA interactuó con la computadora y almacenó algunos Pokémon. Esto redujo el nivel general del equipo, lo que llevó a una especie de trauma, aunque el algoritmo, por supuesto, no tiene sentimientos. A partir de ese momento, la IA intentó activamente evitar este edificio.

Esto resultó en que el equipo ya no se curara. Por lo tanto, Peter Whidden tuvo que ajustar el sistema y crear un nuevo nivel de recompensa.

También hubo hallazgos curiosos en las batallas. La IA entraba en cada combate, sin importar si podía ganarlo o no. Por lo tanto, el YouTuber implementó una penalización por derrotas en las batallas. Sin embargo, después de la primera derrota, la IA se negó a presionar el botón A una vez que su último Pokémon había sido derrotado. Simplemente quería permanecer en la pantalla de batalla para evitar una penalización.

Incluso la batalla contra Brock en el primer gimnasio no fue lógica en absoluto. La IA no entendió durante mucho tiempo que los ataques de agua eran la debilidad de los Pokémon de tipo roca. Solo cuando Squirtle ya no tenía más habilidades aparte de Water Gun, se utilizó ese ataque por primera vez. Esto resultó en una victoria fácil, después de alrededor de 7,000 horas de juego.

Sin embargo, las cosas no mejoraron después de eso. La IA logró entrar en la Cueva Celeste, pero se sintió incómoda allí y simplemente abandonó el lugar. Incluso después de 50,000 horas, la IA no encontró Ciudad Celeste y, por lo tanto, el segundo gimnasio.

Eso sí, la IA desarrolló un fuerte afecto por el Pokémon Magikarp. En la tienda sospechosa que vende a Magikarp por 500 monedas, la IA adquirió más de 10,000 de ellos. Dado que la IA estaba programada para atrapar nuevos Pokémon, este fue probablemente el camino más sencillo.

También hubo algunos elementos positivos

La IA aprende fallos que llevarían décadas a otros descunrir. ¿Fue todo malo en el experimento? No, porque el algoritmo utilizó repetidamente una ruta específica en un lugar que no tenía sentido a primera vista. Más tarde, el YouTuber descubrió que se estaba aprovechando de un fallo que garantizaba que el primer Pokémon que se encontrara se capturara de inmediato con un lanzamiento.

¿Cómo se hizo este experimento? Al final de su video, el YouTuber explica muchos detalles técnicos que son especialmente interesantes si deseas realizar experimentos similares. Utilizó el algoritmo de aprendizaje Proximal Policy Optimization, que según él es el estándar y también se utilizó para ChatGPT.

Lo más difícil en este proceso es enseñarle a la máquina lo que debe hacer sin explicarle cada paso por separado, ya que la idea es que la IA aprenda de forma autónoma. Para esto, los conjuntos de datos más grandes son de ayuda, pero en el caso de Pokémon Red, no estaban disponibles, a diferencia de las IA de texto o voz.

Inicio