Delegação entre agentes via cli -p

Uma execução do loop não precisa ser feita por uma única IA. Um modelo — o orquestrador — pode distribuir trabalho a uma equipe inteira de outros assistentes de IA, um pequeno serviço de cada vez, conversando com cada um pela sua linha de comando. Esta lição é sobre como esse repasse realmente funciona: quem está na equipe, como o orquestrador verifica que um assistente está sequer disponível antes de confiar nele, os comandos exatos que ele usa para chamar cada um, e a única regra de segurança que torna tudo isso confiável.

loop-engineering · uma unidade delimitada · orquestrador → agente instalado

Entregue uma unidade ao assistente certo, com segurança

AFK · humano na observabilidade 4 camadas roster: claude · codex · kimi · grok · glm · minimax

Uma pessoa declara a equipe — antes de a execução começar.

O orquestrador não pode inventar os próprios ajudantes. Logo no início de uma execução, um humano anota o roster de agentes: o conjunto nomeado de assistentes a que esta execução pode delegar. O padrão é agnóstico — qualquer assistente capaz pode estar nele — mas a lista é explícita, então você sempre sabe quem poderia tocar no seu trabalho.

claudeA CLI da Anthropic. Forte e versátil; muitas vezes o próprio orquestrador.instalado
codexO agente de código da OpenAI, executado em modo headless com exec.instalado
kimi · grokConstrutores adicionais, cada um com suas próprias flags headless.instalado
glm · minimaxAcessados por um proxy local (cliproxyapi) em vez de uma CLI nativa.instalado
pi · agyNo roster pelo nome, mas não instalados nesta máquina — então precisam ser bloqueados, nunca chamados.bloqueado

O orquestrador verifica que um assistente está mesmo lá — antes de confiar nele.

Um roster é uma lista de desejos; estar nele não significa que o programa existe neste computador. Então, antes de delegar, o orquestrador roda um pequeno preflight: ele pergunta ao shell "este comando existe?" com command -v, ou executa um pequeno script detector que preenche uma lista PANELISTS= de quem está de fato disponível. Um assistente que falha na verificação — como pi ou agy aqui — é bloqueado: silenciosamente removido dos candidatos para esta unidade. Nenhum comando é jamais executado para um assistente que não está instalado.

preflight — o agente existe nesta máquina?

# verificação mais barata possível: o binário está no PATH?
command -v claude codex kimi grok # imprime o caminho de cada um que existe

# ou deixe o harness montar o conjunto disponível para você
source detect_panel.sh
echo "$PANELISTS"           # ex.: "claude codex kimi grok glm minimax"
                            # pi / agy ausentes aqui → bloqueados, nunca invocados

Ele executa o comando headless do assistente e lê a resposta.

Cada assistente tem seu jeito exato e comprovado de ser chamado a partir de um script. As flags importam: elas forçam uma única resposta não interativa, fixam o formato de saída para que o orquestrador consiga interpretá-la, e definem o diretório de trabalho. Estas são as invocações que o harness de fato usa — copie-as ao pé da letra.

as invocações comprovadas de cli -p (uma unidade delimitada cada)

# Claude — JSON para o resultado ser interpretável por máquina
claude -p "<uma unidade delimitada>" --output-format json

# Codex — subcomando exec, quiet para um stdout limpo
codex exec --quiet "<uma unidade delimitada>"

# Kimi — texto puro. NUNCA combine -p com --yolo, e NÃO passe --work-dir
kimi -p "<uma unidade delimitada>" --output-format text

# Grok — saída pura, aprova tool calls automaticamente, diretório de trabalho explícito
grok -p "<uma unidade delimitada>" --output-format plain --always-approve --cwd "$PWD"

# GLM / Minimax — sem CLI nativa; roteados pelo proxy local
# (cliproxyapi os expõe em um endpoint compatível com OpenAI)

O que o assistente faz

Executa o único serviço em uma chamada nova e sem estado e imprime o resultado no stdout. Sem memória de outras unidades.

O que o orquestrador faz

Monta o prompt, escolhe o comando para o agente selecionado, captura e interpreta a saída.

Um assistente diferente verifica o trabalho. Nunca o que o construiu.

A regra que torna isso confiável: o Validador nunca é o construtor. Quem produziu a unidade não pode ser quem a aprova — quem faz é cego para os próprios erros e vai alegremente declarar o próprio trabalho correto. Por isso a validação é roteada para um agente diferente do roster, que verifica o resultado contra o limite real (rodar o teste, chamar o endpoint, ler o arquivo).

É por isso que um roster heterogêneo é um recurso, não apenas uma conveniência: com mais de um assistente disponível, o orquestrador sempre consegue encontrar um segundo par de olhos que não escreveu o código. O veredito ainda precisa passar pelo Portão da Prova — evidência real, nunca uma afirmação — e ele aterrissa no LOOP-LOG.md para o humano auditar depois.

Camada 1 de 4 · Roster

# rode de qualquer lugar; imprime uma linha por agente for a in claude codex kimi grok pi agy; do if command -v "$a" >/dev/null 2>&1; then echo "disponível: $a" else echo "bloqueado: $a" # não instalado → nunca invocado fi done

claude -p "<unidade>" --output-format json codex exec --quiet "<unidade>" kimi -p "<unidade>" --output-format text # nunca -p + --yolo; sem --work-dir grok -p "<unidade>" --output-format plain --always-approve --cwd "$PWD" # glm / minimax → via cliproxyapi (endpoint compatível com OpenAI, sem CLI nativa)

Delegação entre agentes via cli -p

A grande ideia: um modelo conduzindo uma equipe

O que "delegar via cli -p" significa, com precisão

Uma unidade de cada vez, de propósito

A delegação em uma imagem

As quatro camadas, passo a passo

O que o assistente faz

O que o orquestrador faz

Por que cada flag é o que é

GLM e Minimax não têm CLI nativa

Bloqueando agentes ausentes

Preflight: nunca chame um comando que não existe

Rode o preflight à mão

As invocações comprovadas, lado a lado

Lendo um resultado de volta

As duas armadilhas do Kimi

Por que o Validador nunca é o construtor

Quem faz o quê: uma pessoa, o orquestrador, os assistentes

Uma pessoa

O orquestrador (uma LLM)

Os assistentes (agentes)

Por que a divisão importa

Verificação rápida