Harness Engineering para IA Enterprise

De la definición de sandbox a la evidencia de auditoría

Cómo funciona la ejecución gobernada de agentes de IA en ContactLab. Cada capa de la arquitectura explicada — desde el plano del tenant hasta la capa de evidencia. Construida para cada equipo, cada función, con trazas de auditoría automáticas.

Capas de la arquitectura

Seis capas forman el stack de ejecución gobernada. Cada capa es independiente — puede ser configurada por equipo, por función, por política de compliance. Juntas, producen ejecución aislada con evidencia automática.

Plano de aplicación del tenant

Cada equipo o función opera en su propio tenant — con identidad aislada, políticas propias y límites de ejecución independientes. Ingeniería, legal, marketing, finanzas y operaciones pueden cada uno tener perfiles de sandbox y conjuntos de skills dedicados. Sin cross-contaminación entre tenants.

Catálogo de gobernanza

600+ skills predefinidos con gobernanza incorporada. 17 perfiles de egress gestionados. Templates de sandbox para cada caso de uso — desde refactorización de código hasta análisis de contratos. Los equipos seleccionan skills del catálogo en vez de configurar desde cero. La gobernanza viene con el skill, no se agrega después.

Capa de definición de sandbox

Perfiles de sandbox definen lo que cada run puede acceder: red (default-deny con egress aprobado), identidad (cloud credentials con alcance), sistema de archivos (solo paths aprobados), y límites de runtime. Los perfiles son versionados y auditables. Cada función puede tener su propio perfil — código, contenido, contratos o modelos financieros.

Plano de ejecución del agente

Los agentes ejecutan en runners efímeros con las definiciones del sandbox impuestas. No hay acceso persistente — cada run comienza limpio y termina limpio. El agente opera dentro de los límites definidos por el perfil, independientemente de lo que el usuario solicitó. La ejecución aislada es garantizada por la plataforma, no por la disciplina del usuario.

Pipeline de eventos y políticas

Cada acción dentro del run produce un evento. Los eventos fluyen por el pipeline de políticas en tiempo real — verificaciones de compliance, chequeos de seguridad, disparadores de aprobación. Si una acción viola la política, es bloqueada. Si requiere aprobación, entra en la cola. El pipeline normaliza eventos de cualquier agente en formato estructurado.

Capa de evidencia

Todos los eventos normalizados, decisiones de política y artefactos producidos son retenidos como evidencia estructurada. Sesiones completas. Manifiestos de artefactos. Decisiones de política con justificación. Resultados de revisión. La traza de evidencia sobrevive al run — disponible para auditoría, compliance y revisión humana en cualquier momento.

Lo que se captura en cada run

Cada sesión gobernada produce un registro estructurado y rastreable. Nada depende de acción humana — la captura es automática.

Tenant y perfil de sandbox cargados
Identidad del agente y contexto del usuario registrados
Skills y egress aprobados para esta sesión
Cada acción del agente capturada con timestamp
Bloqueos de política y aprobaciones capturados
Acceso a red verificado contra perfil de egress
Manifiesto de artefactos producidos
Resultado de la revisión humana (si aplica)
Métricas de uso y traza de auditoría actualizadas
Eventos de sesiónDecisiones de políticaManifiesto de artefactosResultado de revisiónTraza de auditoríaSeñales de uso

Capa de control humano

La gobernanza automática no reemplaza la supervisión humana — la habilita. La plataforma garantiza que los humanos permanezcan en el loop donde importa.

Colas de aprobación

Acciones que violan políticas o acceden a recursos sensibles entran en la cola de aprobación. Revisores autorizados aprueban o rechazan con justificación. La decisión es capturada como evidencia. Funciona para cualquier función — código, contenido, contratos o modelos financieros.

Controles de cancelación

Cualquier run activo puede ser cancelado instantáneamente. La cancelación es registrada. Artefactos parciales son retenidos como evidencia. El poder de parar la ejecución permanece con los humanos — sin importar qué equipo o función disparó el run.

Acceso basado en función

Diferentes equipos ven diferentes things. Los admins gestionan políticas. Los revisores aprueban runs. Los desarrolladores ejecutan agentes dentro de los límites definidos. Cada función — ingeniería, legal, marketing, finanzas, operaciones — obtiene acceso adecuado a su rol en la gobernanza.

Discuta sus requisitos de arquitectura

Agende una call de discovery de 30 minutos. Cuéntenos sobre sus requisitos de arquitectura para cada equipo y función. Propondremos un escopo de piloto que prueba valor en 90 días — comenzando por su función de mayor riesgo.