
Prompt
**Situación** Crea una herramienta educativa interactiva que visualiza cómo dos agentes de inteligencia artificial aprenden a jugar fútbol desde cero mediante aprendizaje por refuerzo. El entorno debe ser un campo de fútbol 3D con estética de bloques cúbicos (inspirado en Minecraft), donde los agentes descubren estrategias futbolísticas a través de prueba y error sin reglas precargadas. **Tarea** Crear una app completa para una aplicación que incluya: (1) un entorno 3D de campo de fútbol con física realista y colisiones, (2) dos agentes de IA que aprenden mediante algoritmos de refuerzo (PPO o DQN), (3) personajes y objetos renderizados con geometría de bloques cúbicos, (4) un sistema de recompensas que incentive comportamientos futbolísticos específicos (aproximación al balón, patadas hacia portería, goles), (5) visualización en tiempo real del progreso de aprendizaje con métricas observables, y (6) recomendaciones tecnológicas claras con justificación. **Objetivo** Crear una demostración educativa que haga comprensible y accesible cómo los algoritmos de aprendizaje por refuerzo descubren estrategias complejas de forma autónoma, utilizando un ejemplo lúdico y visualmente atractivo que permita a estudiantes y no-expertos entender conceptos avanzados de IA. **Conocimiento** - Los agentes comienzan sin conocimiento previo del fútbol; solo tienen acciones primitivas disponibles: movimiento en 4 direcciones, salto, y contacto con objetos - Sistema de recompensas escalonado: +1 punto por reducir distancia al balón, +10 puntos por patear el balón hacia la portería contraria, +100 puntos por marcar gol, -5 puntos por acciones ineficientes (movimiento sin propósito) - Estética visual: bloques cúbicos para jugadores (2x2x2 unidades), balón (1x1x1), porterías, líneas del campo y elementos del terreno - El aprendizaje debe ser observable en modo tiempo real (visualización de episodios) y acelerado (entrenar múltiples episodios sin renderizar) - El campo debe tener dimensiones estándar de fútbol (100x64 unidades), dos porterías, y física que simule gravedad, fricción y colisiones realistas - Considera restricciones: compatibilidad multiplataforma, accesibilidad educativa, rendimiento en hardware estándar **Ejemplos** Para guiar el nivel de detalle esperado, la aplicación debería permitir: visualizar a los agentes mejorando gradualmente de comportamiento caótico (movimiento aleatorio) a coordinado (formación básica, intentos de pase), mostrar gráficos en tiempo real de recompensas acumuladas por agente y por episodio, y permitir pausar/reanudar el entrenamiento para inspeccionar el estado actual de los agentes.
A system prompt was added to support web rendering