Ensayos y notas
Ideas sobre AI, sistemas y
software que funciona en el mundo real.
Escribo sobre fronteras de decisión, agentes LLM en producción y desarrollo financiero accidental.
Últimas notas
Ver todas-
Cuatro fronteras para un agente con acceso a tu contabilidad
Un agente que concilia facturas y postea al libro mayor sostiene las llaves de tu banco. Las cuatro fronteras que deciden si una inyección puede mover dinero.
-
Tu agente contable no es poco capaz, es poco fiable
El pass@1 cae de 76% a 52% según la tarea se alarga. En un agente que postea al libro mayor, ese hueco son asientos mal puestos. Capacidad no es fiabilidad.
-
Tres piezas, un agente: el stack 2026 según Phil Schmid
Phil Schmid publica en 22 días tres deep-dives — skills, MCP, subagents — que leidos juntos son el manual no escrito de cómo se monta un agente serio en 2026.
-
Tres pruebas de que el harness pesa tanto como el modelo
Firefox encontró 13x más bugs, Zenith ganó 5 de 8 tareas a 43% del coste, Eugene Yan publicó su workflow. La señal: invierte en harness, no en el modelo.