SIMA 2: La IA de DeepMind que 'piensa' y actúa como un jugador humano en mundos virtuales
Más que un bot: un agente encarnado que razona, aprende de la experiencia y abre el camino a una nueva generación de inteligencia artificial interactiva.
Google DeepMind ha presentado un avance que acerca la ciencia ficción a la realidad: SIMA 2. Este agente de inteligencia artificial no solo ejecuta órdenes en entornos virtuales; los interpreta, razona sobre ellos y aprende de su propia experiencia, marcando un salto cualitativo hacia sistemas de IA más generales y autónomos.
De obedecer instrucciones a entender intenciones
La primera versión de SIMA, presentada en 2024, demostró que una IA podía seguir comandos simples en diversos videojuegos 3D, entrenada a partir de miles de horas de gameplay humano. Sin embargo, su rendimiento en tareas complejas era limitado. SIMA 2 cambia radicalmente este paradigma. Integrado con el potente modelo de lenguaje Gemini 2.5 Flash-Lite, el agente ahora comprende contextos, deduce objetivos a partir de descripciones ambiguas y toma decisiones con un criterio mucho más afinado.
"Ya no es solo un agente especializado, sino un agente más general, capaz de resolver tareas desafiantes en entornos nuevos sin depender tanto de ejemplos previos", explica Joe Marino, investigador senior de DeepMind. Esta capacidad de razonamiento contextual es la gran novedad: SIMA 2 no ve solo píxeles, sino que construye una comprensión del mundo que lo rodea.
Un cerebro que piensa en tiempo real dentro del juego
El núcleo de SIMA 2 es el concepto de "agente encarnado". Es decir, un sistema que opera a través de un "cuerpo" virtual, similar a cómo un robot lo haría en el mundo físico. Este agente observa, procesa la información lingüística y visual, y planifica sus acciones de forma coherente.
Jane Wang, científica de DeepMind, lo ilustra: "SIMA 2 no solo está jugando; está tratando de entender qué está sucediendo y qué quieres que haga". Esta búsqueda de un entendimiento común entre humano y máquina es clave. En demostraciones prácticas, SIMA 2 ha sido capaz de seguir órdenes expresadas con emojis (como 💥🌲 para talar un árbol) o descripciones subjetivas como "dirígete a la casa del color de un tomate maduro", deduciendo que debe buscar una construcción roja.
Aprendizaje autónomo: el poder de generar su propio entrenamiento
Uno de los avances más significativos es su capacidad para mejorar mediante aprendizaje autónomo. El sistema parte de una base y luego utiliza otro modelo Gemini para generar nuevas misiones y desafíos para sí mismo. Un modelo de recompensa interno evalúa sus propios intentos, permitiéndole aprender por ensayo y error. Este ciclo de autoretroalimentación simula un aprendizaje más orgánico y eficiente, reduciendo la dependencia de grandes conjuntos de datos etiquetados por humanos.
El puente hacia los robots del futuro
Aunque por ahora "vive" en mundos virtuales como No Man's Sky o entornos fotorealistas creados por Genie, la investigación con SIMA 2 tiene un objetivo de largo alcance claro: sentar las bases para robots más inteligentes y versátiles en el mundo real.
Frederic Besse, ingeniero de DeepMind, lo conecta directamente: "Para que un robot útil pueda, por ejemplo, 'ir a revisar cuántas latas hay en la alacena', necesita comprender los objetos, los espacios y las posibles acciones". SIMA 2 se centra en ese nivel cognitivo alto de comprensión y planificación, que luego podría traducirse a comandos para motores y sensores físicos. DeepMind aclara que la transferencia a robots reales es un paso futuro y no ha anunciado fechas concretas, pero la dirección está marcada.
Conclusión
SIMA 2 representa mucho más que un jugador artificial experto. Es un prototipo pionero de una nueva clase de IA: un agente que combina la comprensión del lenguaje, el razonamiento visual y la capacidad de aprender de la interacción continua. Este hito, producto de la investigación interna de Google DeepMind, acerca la perspectiva de asistentes digitales verdaderamente contextuales y, eventualmente, de robots auxiliares que puedan comprender y actuar en nuestro mundo con la soltura con la que SIMA 2 lo hace hoy en los videojuegos. El futuro de la IA no solo piensa, sino que también actúa y aprende.

