Harness Engineering para IA Enterprise

Da definição de sandbox à evidência de auditoria

Como funciona a execução governada de agentes de IA na ContactLab. Cada camada da arquitetura explicada — desde o plano do tenant até a camada de evidência. Construída para cada equipe, cada função, com trilhas de auditoria automáticas.

Camadas da arquitetura

Seis camadas formam o stack de execução governada. Cada camada é independente — pode ser configurada por equipe, por função, por política de compliance. Juntas, produzem execução isolada com evidência automática.

Plano de aplicação do tenant

Cada equipe ou função opera em seu próprio tenant — com identidade isolada, políticas próprias e limites de execução independentes. Engenharia, jurídico, marketing, finanças e operações podem cada um ter perfis de sandbox e conjuntos de skills dedicados. Sem cross-contaminação entre tenants.

Catálogo de governança

600+ skills pré-definidos com governança incorporada. 17 perfis de egress gerenciados. Templates de sandbox para cada caso de uso — de refatoração de código a análise de contratos. As equipes selecionam skills do catálogo em vez de configurar do zero. A governança vem com o skill, não é adicionada depois.

Camada de definição de sandbox

Perfis de sandbox definem o que cada run pode acessar: rede (default-deny com egress aprovado), identidade (cloud credentials com escopo), sistema de arquivos (somente paths aprovados), e limites de runtime. Perfis são versionados e auditáveis. Cada função pode ter seu próprio perfil — código, conteúdo, contratos ou modelos financeiros.

Plano de execução do agente

Agents executam em runners efêmeros com as definições do sandbox impostas. Não há acesso persistente — cada run começa limpo e termina limpo. O agente opera dentro dos limites definidos pelo perfil, independentemente do que o usuário solicitou. Execução isolada é garantida pela plataforma, não pela disciplina do usuário.

Pipeline de eventos e políticas

Cada ação dentro do run produz um evento. Eventos fluem pelo pipeline de políticas em tempo real — verificações de compliance, checagens de segurança, gatilhos de aprovação. Se uma ação viola a política, ela é bloqueada. Se requer aprovação, ela entra na fila. O pipeline normaliza eventos de qualquer agente em formato estruturado.

Camada de evidência

Todos os eventos normalizados, decisões de política e artefatos produzidos são retidos como evidência estruturada. Sessões completas. Manifestos de artefatos. Decisões de política com justificativa. Resultados de revisão. A trilha de evidência sobrevive ao run — disponível para auditoria, compliance e revisão humana a qualquer momento.

O que é capturado em cada run

Cada sessão governada produz um registro estruturado e rastreável. Nada depende de ação humana — a captura é automática.

Tenant e perfil de sandbox carregados
Identidade do agente e contexto do usuário registrados
Skills e egress aprovados para esta sessão
Cada ação do agente capturada com timestamp
Bloqueios de política e aprovações capturados
Acesso a rede verificado contra perfil de egress
Manifesto de artefatos produzidos
Resultado da revisão humana (se aplicável)
Métricas de uso e trilha de auditoria atualizadas
Eventos de sessãoDecisões de políticaManifesto de artefatosResultado de revisãoTrilha de auditoriaSinais de uso

Camada de controle humano

Governança automática não substitui supervisão humana — a habilita. A plataforma garante que humanos permaneçam no loop onde importa.

Filas de aprovação

Ações que violam políticas ou acessam recursos sensíveis entram na fila de aprovação. Revisores autorizados aprovam ou rejeitam com justificativa. A decisão é capturada como evidência. Funciona para qualquer função — código, conteúdo, contratos ou modelos financeiros.

Controles de cancelamento

Qualquer run ativo pode ser cancelado instantaneamente. O cancelamento é registrado. Artefatos parciais são retidos como evidência. O poder de parar execução permanece com humanos — não importa qual equipe ou função disparou o run.

Acesso baseado em função

Diferentes equipes veem diferentes things. Admins gerenciam políticas. Revisores aprovam runs. Desenvolvedores executam agents dentro dos limites definidos. Cada função — engenharia, jurídico, marketing, finanças, operações — obtém acesso adequado ao seu papel na governança.

Discuta seus requisitos de arquitetura

Agende uma call de discovery de 30 minutos. Conte sobre seus requisitos de arquitetura para cada equipe e função. Vamos propor um escopo de piloto que prova valor em 90 dias — começando pela sua função de maior risco.