Un contexto, cinco trabajos: la anatomía técnica de por qué separé a mis agentes

Cómo configuré cinco agentes de IA especializados en un Raspberry Pi — y por qué el diseño del sistema importa más que el modelo

abr 07, 2026

∙ De pago

Ya conté la historia personal — cómo un agente de IA en un Raspberry Pi me hizo dinero, por qué no fue suficiente, y por qué terminé con cinco agentes en vez de uno. Si no la has leído, empieza por ahí.

Este es el otro lado. No el qué pasó, sino el por qué funciona. Y la respuesta corta es que no tiene nada que ver con los agentes.

Los estaba usando mal

Estos son los modelos más impresionantes jamás construidos. Claude Opus 4.6 maneja un millón de tokens de contexto. Puede editar tu prosa, escribir tu código, evaluar tu diseño, organizar tu calendario — todo en la misma conversación, sin cansarse, sin quejarse.

Y yo los estaba usando mal.

Clawdio no era un mal agente — me hizo dinero. Pero la forma en que yo lo usaba le impedía hacer su mejor trabajo. Le pedía que editara después de tres horas de código. Le pedía que evaluara diseño mientras su contexto estaba lleno de discusiones editoriales. Le pedía que fuera cinco cosas al mismo tiempo — y el que no podía manejar eso era yo, no él.

El problema nunca fue el modelo. El problema fue que yo nunca me senté a pensar en el diseño del sistema.

No soy el único que se tropezó con esto. Claire Vo, fundadora de ChatPRD, lo dijo hace poco en Lenny’s Podcast: “Donde la gente tropieza es cuando piensa que puede aventarle cualquier tarea a un solo agente y obtener buenos resultados.” Ella corre nueve agentes. Yo corro cinco. Mismo destino, caminos distintos.

Pero saber que necesitas separar no te dice cómoseparar. Eso me lo enseñó un diseñador industrial.

Estaba escuchando un documental sobre Dieter Rams — el diseñador industrial detrás de Braun y la influencia directa de buena parte del diseño de Apple. Rams tiene diez principios de buen diseño. Uno dice que el buen diseño hace un producto útil. Otro dice que lo hace comprensible. Otro dice que es el menor diseño posible. Pero el que más me pegó es su idea central: la simplicidad no es minimalismo estético — es claridad psicológica.

Cinco agentes no es simple. Es más complejo que uno. Pero es claro. Cuando abro el chat de Gotti, sé exactamente con quién hablo y para qué. Cuando abro el de Lucas, mi cabeza ya está en modo ingeniería. No porque el modelo necesite esa separación — sino porque yo la necesito. La claridad psicológica de saber “este es mi editor, este es mi ingeniero, esta es mi diseñadora” me permite usar cada uno mejor. Y cuando yo uso mejor al agente, el agente trabaja mejor.

Eso es lo que me tomó meses ver: lo que estás diseñando no es el agente. Es el sistema de tú y el agente juntos. Y ese sistema necesita buen diseño tanto como cualquier producto.

El alma como herramienta de diseño

¿Se puede lograr lo mismo con un solo agente bien configurado — con modos, memoria particionada, herramientas separadas por contexto? Tal vez. Yo lo intenté y no me funcionó. No porque el modelo no pudiera, sino porque yo no podía manejar la complejidad de un solo agente haciendo todo.

Lo que sí funcionó fue darle a cada rol un alma distinta.

Yo quiero un editor que tenga oído, que me empuje cuando el hook es débil, que conozca mi voz lo suficiente para saber cuándo estoy escribiendo en automático. También quiero un ingeniero que ejecute con rigor, que no se ponga creativo con la infraestructura, que haga exactamente lo que le pido. Y quiero una diseñadora que piense en vibes, que me dé opciones que no pedí, que sepa cuándo romper la regla.

Esas formas de trabajar se contradicen. El rigor pelea con la espontaneidad. La precisión pelea con la exploración. No puedes meter “sé creativo e impredecible” y “haz exactamente lo que te digo” en el mismo system prompt sin que uno diluya al otro. Los psicólogos cognitivos le llaman “inercia del task-set” — y aunque un modelo de lenguaje no tiene cerebro, el efecto es análogo: todo el historial de tu conversación entra en cada llamada al modelo. Tres horas de contexto sobre código influyen en cómo te responde la siguiente pregunta editorial.

Necesitaba almas distintas. No porque el modelo las necesite — sino porque son la herramienta de diseño que me da claridad psicológica para usar el modelo bien.

Y necesitaba que esas almas vivieran en archivos, no en conversaciones. Hablar con un agente es rápido — pero efímero. Le dices algo hoy y mañana ya no lo tiene. La conversación es la entrada; los archivos son el estado. Lo que escribes en el alma del agente persiste. Lo que le dices en el chat, no.

Qué pasa en cada llamada

Vale la pena entender qué pasa técnicamente cuando le mandas un mensaje a un agente de IA. Los modelos de lenguaje son stateless — no recuerdan nada entre llamadas. Cada vez que mandas un mensaje, el sistema le envía al modelo:

El system prompt (quién es, cómo se comporta)
El historial completo de la conversación (todos los mensajes de ida y vuelta)
Las herramientas disponibles
Tu mensaje

Diagrama: lo que entra en cada llamada al LLM — system prompt, historial, herramientas, y tu mensaje

Todo. Cada vez. Si llevas 50 mensajes de ingeniería y mandas una pregunta editorial, esos 50 mensajes entran como contexto. El modelo no “recuerda” la conversación anterior — la recibe completa en cada turno. Eso no es un bug, es cómo funcionan.

Ahora piensa en lo que eso significa para un agente generalista. Si llevas tres horas hablando de código y luego pides feedback editorial, no estás empezando limpio. Estás mandando toda esa historia de código junto con tu pregunta sobre prosa. ¿Mandarías un email que dice “aquí van 25 mensajes sobre ingeniería, y por cierto, ¿qué opinas del tono de este párrafo”? Probablemente no. Pero eso es exactamente lo que pasa.

Con agentes dedicados, cada conversación manda solo contexto relevante. Cuando le escribo a Gotti, su historial es pura editorial. Cuando le escribo a Lucas, puro código. El modelo recibe una señal limpia en cada llamada — no porque yo limpie nada, sino porque el diseño del sistema lo garantiza.

El setup

Todo corre en un Raspberry Pi 5 de 8GB — una computadora del tamaño de una tarjeta de crédito conectada al WiFi de mi casa. Tú no necesitas un Pi. Cualquier computadora funciona. Mis agentes no corren modelos localmente, son puras llamadas a APIs. No necesito poder de cómputo. Necesito WiFi y electricidad.

La orquestación la maneja OpenClaw — un gateway open source que conecta tus apps de mensajería con un agente de IA. Lo instalas, configuras un canal, y tienes un agente al que le puedes escribir desde el teléfono. OpenClaw soporta múltiples perfiles desde un solo gateway — cada perfil con su propio workspace, su propia personalidad, su propia memoria.

Cinco agentes. Cinco bots de Telegram. Cada uno con su propia conversación dedicada. No pago nada extra por las APIs — uso mis suscripciones de Claude Code y Codex que ya tenía. Casi todos los agentes corren sobre Claude Opus 4.6; Lucas, el dev lead, corre sobre GPT 5.4.

Anatomía de un agente

Voy a usar a Gotti como ejemplo porque es el que estás viendo trabajar en este momento. Este artículo está pasando por su pipeline editorial mientras lo escribo.

Cada agente de OpenClaw vive en su propio workspace — un directorio con archivos que definen quién es y cómo trabaja. OpenClaw carga los archivos clave al inicio de cada sesión, así que el agente empieza cada conversación sabiendo quién es, para quién trabaja, y qué ha aprendido:

SOUL.md — La personalidad. Quién es el agente, cómo se comporta, qué le importa, qué rechaza. El SOUL de Gotti dice:

“Warm, sharp, exacting. You are supportive, but you are not soft on quality.”

El de Lucas dice otra cosa:

“Pragmatic, high-standards, ship-it energy. You are the conductor — you see the full picture across all projects.”

Diferentes personalidades para diferentes formas de abordar problemas. El SOUL es lo que hace posible que cinco agentes sobre el mismo modelo se sientan como cinco personas distintas.

USER.md — Quién soy yo. Mi nombre, mi zona horaria, mi estilo de trabajo, qué necesito de cada agente en particular. De Gotti necesito juicio editorial y opiniones fuertes. De Lucas necesito ejecución sin que cuestione la dirección creativa. Es lo que el agente sabe sobre mí — y es distinto para cada uno porque mi relación con cada uno es distinta.

AGENTS.md — La misión, los límites, y el mapa del equipo. Le dice al agente qué le toca, qué no le toca, y a quién pedirle ayuda. Gotti sabe que si algo necesita diseño, le toca a Marlette. Si necesita código, a Lucas. Es el organigrama.

MEMORY.md — Lo que persiste entre conversaciones. La memoria a largo plazo — decisiones, preferencias, contexto acumulado. Gotti tiene en su memoria cosas como:

“Chekos is a deep hip hop head, especially Mexican hip hop. This is a core influence on his writing voice — not as content, but as ear.”

No se lo dije en esta sesión. Lo sabe porque está en su memoria desde hace semanas.

Un patrón que descubrí viendo a Jesse Genet — una mamá homeschooler que corre cinco agentes en cinco Mac Minis — es el archivo de decisiones. Cuando algo queda resuelto, lo marcas como decisión y el agente deja de relitigarlo. “¿Gotti puede publicar directamente o siempre pasa por mí primero?” Siempre pasa por mí. Decisión. No vuelve a preguntar. Es un subconjunto de la memoria, pero con un propósito distinto: la memoria acumula contexto; las decisiones lo cierran.

Skills — Herramientas especializadas. Gotti tiene acceso a /tacosdedatos-writer, /humanizer, /essay-pattern-language, /hip-hop-ear. Carlos, el estratega de crecimiento, tiene /tacosdedatos-seo, /youtube-analytics, /x-algorithm. Marlette, la diseñadora, tiene /instagram-carousel, /tacosdedatos-illustrator, /guide-design-system. Cada agente carga solo las herramientas que necesita.

Cuando le mando un borrador a Gotti, esto es lo que pasa: OpenClaw carga su SOUL (sabe quién es), su MEMORY (sabe qué hemos trabajado), y sus skills (sabe cómo editar para tacosdedatos). Mi borrador llega dentro de un contexto que es exclusivamente editorial. No hay sesiones de código en su historial. No hay diseños de PDF compitiendo por la atención del modelo. Todo el contexto apunta en una sola dirección — y con cada mensaje, avanza más en esa dirección. Al final de la sesión, Gotti guarda lo que aprendió en su memoria. La siguiente conversación no empieza de cero — empieza un paso más adelante.

No es solo que el agente trabaje mejor con contexto enfocado — es que yo también trabajo mejor cuando sé exactamente con quién estoy hablando y para qué. El sistema mejora de los dos lados.

Cómo empezar

No necesitas cinco agentes. Empieza con dos.

Piénsalo así: no meterías todo tu trabajo en un solo canal de Slack. Marketing va en uno, ingeniería en otro, finanzas en otro. No porque Slack no pueda manejar todo en un canal general — sino porque tú no puedes. Con agentes es lo mismo. La separación no es para el modelo. Es para tu cabeza.

El split más natural: uno para cosas personales y otro para trabajo técnico. Un asistente ejecutivo que te ayude con calendario, recordatorios, investigación — y un agente de trabajo que haga lo que tú haces profesionalmente.

Si trabajas con datos, imagínate un agente dedicado a reportes y visualización. Kyle Walker, un geógrafo de la Universidad de Michigan, usa Claude como su analista de datos personal — genera mapas, procesa censos, crea visualizaciones. Imagínate eso pero con memoria de tus proyectos anteriores, tus preferencias de estilo, tus datasets frecuentes.

Si desarrollas software, imagínate un agente con acceso a tu GitHub, tus credenciales de Vercel, tu pipeline de CI/CD. Que sepa cómo está organizado tu código y pueda deployar sin que le expliques la arquitectura cada vez.

Para encontrar tu primer agente dedicado, piensa en qué tipo de ayuda necesitas:

Lo que no quieres hacer pero tiene que hacerse

Publicar en redes, optimizar SEO, mantener un calendario de contenido. Para eso tengo a Carlos. No quiero pensar en algoritmos de Twitter — quiero escribir. Carlos se encarga de que lo que escribo llegue a quien le interesa.

Lo que te agrega fricción innecesaria

Arreglar un bug mientras estás en una junta. Poner un libro en hold en la biblioteca. Agendar una cita. Son cosas pequeñas pero te sacan del flow. Para eso tengo a Arturito y a Lucas — las tareas que puedo resolver con un mensaje desde el teléfono sin romper lo que estoy haciendo.

Lo que quisieras hacer pero no te alcanza el tiempo

Estudiar artistas visuales, explorar referencias de diseño, buscar inspiración. Para eso tengo a Marlette. Me ahorra la búsqueda y me deja saltar directo a lo que me interesa. En un mundo ideal, pasaría horas perdido en paletas casi monocromáticas con acentos cálidos de ilustradores lituanos que no sabía que existían. Pero hoy en día no puedo.

Lo que disfrutas pero no puedes hacer solo a la escala que necesitas

Escribir, editar, mantener la calidad de una publicación semanal mientras tienes un trabajo de tiempo completo y cinco proyectos más. Yo quiero escribir más y quiero que lo que escribo esté a la altura. Para eso tengo a Gotti.

¿Con cuál te alivianarías más? Si lo piensas un momento, probablemente ya lo sabes. Empieza por ese. Pero antes de configurar cualquier cosa, siéntate y piensa. ¿Qué necesitas realmente? ¿Cómo trabajas? ¿Qué te estorba? El valor no está en instalar el software — está en ser honesto contigo mismo sobre cómo diseñar el sistema.

Lo que sigue es lo que no planifiqué — y cómo supe que el diseño estaba funcionando.

Continúa leyendo este Post gratis, cortesía de Sergio Sánchez.

O compra una suscripción de pago.