Parece que últimamente es imposible abrir LinkedIn, Twitter (sorry, Elon, no pienso llamarlo X), o nuestra red social favorita sin encontrarnos con un post que habla sobre agentes de inteligencia artificial.
Seguramente estás pensando que Claude o ChatGPT son agentes, y que ahora sus equipos de marketing les están cambiando el nombre de “asistentes” a “agentes” para hacerlos sonar más cool. Pues no, esta vez no sólo se trata de hype, sino de un cambio en la tecnología.
Y no es cualquier cambio, se trata de una IA que empieza a tener objetivos y a actuar para conseguirlos de manera autónoma. (Qué miedo :P).
Hoy quiero contarte lo que es un agente y cómo se diferencia de un simple asistente como ChatGPT, la idea es que puedas separar el hype de la realidad y de paso impresionar a todos en tu próxima cena familiar.
Let’s begin.
¿Qué es un agente de IA?
Cuando pienso en un agente, lo primero que me viene a la cabeza es el agente Smith, de The Matrix. Si no has visto The Matrix… pues, shame on you!
Por favor, deja de leer esto inmediatamente y nos vemos en 2 horas y 16 minutos, con tu nueva perspectiva del mundo.
OK, ahora sí. Sigamos.
El agente Smith tenía una sola misión: mantener el orden dentro de la simulación y asegurar que los humanos conectados no cuestionen la realidad ni descubran la verdad sobre la Matrix. Para cumplir ese objetivo, Smith se pasó cuatro películas persiguiendo a Neo.
En el mundo real, donde los agentes no tienen lentes oscuros, los definimos como:
Una entidad que tiene un objetivo y que actúa de forma autónoma para conseguirlo.
OK, entonces eso es lo que es un agente. Una IA que tiene un objetivo y que trabaja por su cuenta, tomando decisiones paso a paso hasta lograrlo. Lo bueno es que su objetivo (todavía) no es perseguirnos… ¿nadie por aquí ha visto Terminator?
Hay una gran diferencia entre un asistente, como ChatGPT, y un agente. Mientras que a tu asistente tienes que dirigirlo paso a paso y decirle exactamente qué hacer, un agente decide por sí mismo la forma de alcanzar su objetivo.
Los agentes no esperan que les demos instrucciones paso a paso, sólo que les digamos cuál es su meta y ellos mismos descubren cómo llegar a ella. Para eso toman decisiones y avanzan por su cuenta hasta cumplirla.
Si nos queremos poner técnicos durante un segundo, podríamos decir que un agente es un sistema que percibe su entorno, actúa de manera autónoma, usa herramientas y persigue objetivos.
Tal vez estés pensando algo como: “Pero, Germán, mi asistente ya puede buscar en Internet, usar herramientas y hasta escribir código… ¿entonces es un agente?”
Buena pregunta!
No. 😅
Estas capacidades son parte de lo que hace un agente, pero los asistentes aún no tienen la autonomía para planificar y ejecutar sin intervención humana hasta llegar a su objetivo. Los asistentes aún necesitan que los guíes paso a paso.
Un agente tiene cuatro características clave (aparte de los lentes oscuros). Ahora te las explico.
Las 4 cosas que hacen a un agente
Ya sabemos que la palabra clave aquí es autonomía. Veamos ahora qué es lo que necesita uno de estos agentes para conseguirla.
Hay cuatro cosas que hacen que un agente sea de verdad un agente (y no sea sólo alguien “hypeando” su IA), veámoslas una por una.
1. Tiene un objetivo y no se detiene hasta lograrlo
Esta es la principal característica de un agente, tiene una misión específica y trabajará hasta completarla.
¿Te suena conocido? Es prácticamente el guión de cada película de ciencia ficción apocalíptica que has visto!
Mientras que tu asistente responde a preguntas sueltas o lleva una conversación contigo, un agente recibe una misión y entiende que tiene un objetivo que alcanzar. No se trata de dar una respuesta, sino de hacer lo que necesite para completar esa misión.
Cuando le das un objetivo a un agente, no necesitas decirle qué pasos debe tomar, él mismo se da cuenta de lo que necesita hacer, los subobjetivos que tiene que cumplir, y cómo cada paso que da lo acerca más a su meta.
Por supuesto que el agente necesita saber cuando cumplió el objetivo que le planteaste. Para eso va evaluando su progreso hacia la meta hasta que reconoce que ha llegado al judgment day “estado final”.
2. Observa, piensa, actúa… repite
OK, un agente no sigue un plan fijo. El mundo real es un escenario complejo y uno necesita poder adaptarse y responder.
Como todos los humanos sabemos, tener un plan fijo y no poder adaptarlo en el camino es una receta para el desastre. Nosotros somos flexibles y las máquinas no, así que tenemos que buscar una forma de darles esa flexibilidad.
Por eso, los agentes funcionan con un ciclo de acciones:
Observa: se da cuenta de cómo está la situación.
Piensa: en base a lo que observó, decide cuál debe ser su siguiente acción
Actúa: realiza esa ación.
Y luego vuelve al paso 1. Esto se repite una y otra vez hasta que se cumple el objetivo. Fíjate cómo este ciclo permite que nuestro agente pueda adaptarse a la situación a cada paso que da.
Sólo para estar claros, esto no es lo mismo que una automatización. En una automatización uno programa los pasos a seguir, así que si algo cambia es probable que la automatización falle. Los agentes pueden evaluar la situación y adaptarse a ella.
Esto último no quiere decir que las automatizaciones sean malas, para nada. De hecho, creo que son una herramienta indispensable; sólo quería que sepas que una automatización no es lo mismo que un agente.
automatización ≠ agente.
En resumen, un agente tiene la capacidad de iterar una y otra vez, adaptarse e ir ajustando su plan sobre la marcha.
3. Recuerda lo que ha hecho
Nada de lo que te he contado funciona si un agente no tiene memoria. Los agentes tienen que recordar lo que han venido haciendo. Tienen que saber qué acciones ya realizaron, cuáles funcionaron (y cuáles no), y cómo va en el avance hacia su meta.
¿Te imaginas a Terminator olvidándose de buscar a Sarah Connor a la mitad de la película? ¿O al agente Smith sin poder recordar que el nombre de Neo en la matrix es Mr. Anderson?
Sin memoria, cada ciclo de “Observa-Piensa-Actúa” empezaría desde cero. Nuestro agente no tendría idea de que lo que está haciendo ya lo probó tres veces antes y nunca funcionó. El hecho de que pueda recordar es lo que hace que esto sea realmente un ciclo.
Esta memoria no es igual a la que tiene, por ejemplo, tu ChatGPT. Un agente es mucho más estructurado y recuerda como va el avance hacia su objetivo. Si nos queremos poner técnicos esto se llama mantener el “estado”.
En fin, si no tiene memoria no es un agente.
4. Usa herramientas
No creas que la IA pueda agarrar su caja de herramientas y terminar ese proyecto que tienes hecho a medias desde hace dos años y medio (¿no tienes uno? yo tengo varios :P).
Aquí estoy hablando de que nuestro querido agente puede interactuar con otros sistemas. Por ejemplo, buscar en internet, ejecutar código, consultar bases de datos, leer y crear archivos, conversar con otros sistemas (en nerd se llama consultar APIs), etc.
No basta con tener un objetivo, un ciclo que te ayude a adaptarte y memoria; estas herramientas son las que le permiten al agente trabajar en el mundo real. Me refiero a que es lo que realmente le da la capacidad de “hacer cosas”.
Ahora mismo, los asistentes como ChatGPT o Claude ya tienen acceso a herramientas. La gran diferencia con un agente es que estos últimos deciden en qué momento usar las herramientas sin intervención humana.
Aquí una nota importante: hay que tener siempre presente a qué herramientas tienen acceso estos agentes; no vaya a ser que, “de casualidad” y “sin saberlo”, les demos la opción de enviarle un correo a nuestro jefe, comprar lo que sea en Internet, decidir dónde invertir los ahorros de nuestra jubilación o manejar nuestro arsenal nuclear. ¿Quién dijo Skynet?
Disculpa el pesimismo, creo que he visto demasiadas películas de ciencia ficción, pero en serio, creo que la parte de las herramientas sí requiere supervisión humana.
La realidad es que, si un agente hace un buen uso de estas herramientas, o nos avisa y nos pide permiso antes de hacerlo, sería extremadamente útil.
Entonces, en resumen:
Agente = Objetivos + Ciclo + Memoria + Herramientas.
Para evitar confusiones
OK, ahora que ya vimos lo que es un agente, me imagino que estás pensando algo como: ¿ahora cómo se llaman el resto de cosas que usan IA?
Gran parte de esta duda viene de que todas la mayoría las compañías que usan IA quieren decir que tienen “agentes”. Obvio, decir eso suena más pro, más cool, más chévere, tú sabes de qué hablo.
Déjame decirte que (si tienes esa duda) te entiendo perfectamente; de hecho, no creo que tenga la respuesta final a esa pregunta, pero puedo tratar.
Aquí te explico rápidamente lo que entiendo por estos términos (no existe una estandarización técnica, que yo sepa, por lo que aquí estás leyendo sólo mi opinión).
Chatbots
La palabra chatbot suena súper anticuada, y de alguna forma, a nivel tecnológico lo es. Se trata de un modelo muy básico de conversación que literalmente sigue un guión y no puede salirse de él.
Hay quienes le dicen chatbots a ChatGPT, Claude, Gemini y compañía, pero yo los veo como algo más avanzado.
Personalmente, le digo chatbot a esos sistemas automatizados, como los de servicio al cliente que siguen un guión y que son muy fáciles de odiar.
Asistentes
Aquí entran los asistentes y los copilotos. Los que usamos todos los días Claude, ChatGPT, Copilot, etc. Son sistemas de IA que trabajan contigo, sugieren cosas, conversas con ellos y te ayudan a crear documentos, código o contenido.
Si bien son muy avanzados, útiles y mejoran nuestra productividad en 124.37% (es cierto, esa data viene de un estudio de Stanford… me lo contó un chatbot :P), a los asistentes hay que decirles qué hacer.
Automatizaciones / RPA
Si te preguntas qué es RPA, son las siglas de Robotic Process Automation. No es más que usar robots de software para automatizar acciones que haría un humano en una pantalla (hacer clic, llenar datos, copiar/pegar, etc). Se usan para acelerar y mejorar la consistencia de tareas repetitivas (y aburridas) que hacemos los humanos.
Una automatización es algo mucho más general. Se trata de usar software o IA para ejecutar procesos sin la intervención de los humanos.
Estas tecnologías son espectaculares para realizar tareas y procesos muy estructurados y que no cambian. En el mundo real, muchos de estos sistemas combinan ambas y usan automatizaciones para tareas repetitivas y agentes para decisiones complejas.
Ojo, que la diferencia fundamental se mantiene. Una automatización va a ejecutar las reglas y condicionales que programaste (que pueden ser super complejas), un agente decide por si mismo qué hacer.
Los agentes no (siempre) trabajan solos
Tal vez te he dado la idea de que un agente es alguien que siempre trabaja sólo, pero no es así, cada vez más estamos viendo cómo los agentes pueden trabajar con otros agentes.
Imagina un grupo de agentes trabajando con una misión común, me hace recordar a Misión imposible.
¿Qué? ¿esperabas ver a Tom Cruise? Este es el cast original de la serie de TV!!! Cada agente tenía habilidades especiales que hacían que todo el grupo pudiera trabajar en misiones que serían imposibles para un solo agente.
Bueno… está James Bond, pero es la excepción.
¿No me digas que esperabas a otro Bond? Eso no está en discusión. Connery es James Bond.
Sorry por la distracción, sigamos.
Antes de irme por las ramas, estaba por contarte que los agentes pueden trabajar con otros agentes.
Colaboración multi-agente
Es lo que te imaginas. Varios agentes, cada uno sus propias capacidades y herramientas, trabajando juntos hacia un objetivo común (a lo Misión imposible).
Esto tiene todo el sentido del mundo. En lugar de tener un sólo agente que lo hace todo, tenemos varios agentes donde cada uno se enfoca en resolver una parte del problema. Así, cada agente puede tener sus objetivos, ciclo, memorias y herramientas pensadas específicamente para su misión y además… los agentes pueden comunicarse entre ellos!!!
Entonces, tenemos un grupo de agentes que tienen una meta en común, cada uno con habilidades especiales, que pueden conversar entre ellos y compartir información.
Y la ventaja de esto no es sólo el tener agentes especializados, también podemos poner a muchos agentes a resolver un problema grande juntos, o podemos poner a algunos agentes a revisar y comprobar el trabajo de otros, las posibilidades son infinitas.
Además, estos agentes se pueden organizar de varias formas. A veces, hasta hay un agente coordinador, una especie de director de orquesta, un líder… un John ‘Hannibal’ Smith del mundo digital.
Me imagino que has visto Los Magníficos, y no, aquí no salen Liam Neeson ni Bradley Cooper.
Me fui por las ramas otra vez; disculpa, trataré de parar con las referencias a series antiguas.
Donde estamos
Coordinar un grupo de agentes es una tarea compleja. Tienen que poder comunicarse, evitar conflictos, separar bien el trabajo que van a hacer, ver cómo resuelven algo cuando tienen información que se contradice y tantas otras cosas que no me puedo imaginar.
Estos sistemas multi-agente ya existen y son un área muy activa de investigación y desarrollo tecnológico. Hay universidades, startups y compañías millonarias trabajando en cómo un grupo de agentes pueden trabajar juntos, planificar tareas complejas y hasta corregirse entre ellos; y todo esto sucede as we speak.
Este tipo de investigación es necesaria porque la mayoría de los problemas que la humanidad busca resolver, son tan grandes que un agente sólo no es suficiente.
No puedo esperar a ver qué hace esta tecnología en los próximos cinco años.
Hasta la vista, baby
Si estás leyendo esto, gracias por llegar hasta aquí, sé que fue un post largo 😬
Ahora no sólo vas a poder presumir sobre tu conocimiento de agentes de IA en tu próxima cena familiar, además podrás saber cuándo algo es real y cuándo es hype del equipo de marketing (o del CEO) de una empresa de IA.
Es un momento raro en la historia de la tecnología, y estoy seguro que lo que voy a decir es un cliché, pero siento que estamos viviendo en una película de ciencia ficción.
En los próximos años vamos a ver cómo algunos de estos agentes van a ser muy útiles y cómo otros van a fallar miserablemente, con consecuencias que hoy no podemos predecir.
Creo que en parte por eso escribo este blog, porque estamos usando todos los días una tecnología que no entendemos por completo, y cada vez le estamos dando más capacidades y poder. Y, fuera de los chistes de ciencia ficción, nunca me ha gustado darle control a algo que no entiendo.
Pero principalmente escribo porque si hay algo que me apasiona, es aprender. Quiero entender a profundidad cómo funciona la IA (y poder explicártela, a mi manera), no sólo para usarla mejor, sino para usarla conscientemente.
Y para cerrar, una nota:
Nota:
Últimamente es imposible abrir LinkedIn sin encontrarnos con un post que hable sobre agentes de IA. Disculpen la incredulidad, pero en un par de meses han aparecido más o menos 135,674 nuevos expertos en esta tecnología.
Esta nota final es algo que tenía que escribir, una especie de catarsis. Gracias por leerla.
Como no me gusta terminar un post de esta forma, te voy a presentar un último agente. 😅 El Super Agente 86. (¿Pensaste que esto se terminaba con Los Magníficos? Ja!).
Sólo para estar claros, este es Don Adams (no Steve Carell).
Esta serie sí tiene sus años, es de 1965. Yo solía ver la repetición de la repetición en los 80s y comienzos de los 90s con mi papá, y nos matábamos de la risa juntos. Pensar en eso me trajo muy bonitos recuerdos.
Aquí te dejo un mini-preview, por si te picó la curiosidad.
Listo, ahora sí.
Nos vemos pronto!
G