Multi-agente · Passo 7 · Uma pergunta, muitas mentes, um veredicto

fusion: do painel ao juiz

Às vezes a resposta de um único assistente não basta — a aposta é alta, ou duas boas opções discordam. O Fusion faz exatamente a mesma pergunta a vários assistentes ao mesmo tempo, cada um trabalhando às cegas em relação aos outros, e então faz com que um modelo leia todas as respostas e escreva um único veredicto fundamentado: no que eles concordam, onde se chocam e o que apenas um deles enxergou. É a maneira do loop de obter uma resposta de alta confiança quando uma só voz é arriscada demais para se confiar sozinha.

Leia a versão simples ou abra a camada técnica em qualquer seção.

A grande ideia: pergunte a muitos, julgue uma vez

Na maior parte deste curso há um assistente fazendo o trabalho, com um segundo conferindo. O Fusion é para os momentos em que isso não basta — quando você quer uma resposta de alta confiança a uma pergunta difícil, ou duas boas opções puxam em direções opostas e alguém tem de decidir.

A jogada é simples de descrever. Pegue sua pergunta e envie exatamente a mesma pergunta a vários assistentes ao mesmo tempo — um painel. Cada um responde às cegas: nunca vê o que os outros escreveram, então ninguém pode copiar, ceder a uma voz mais alta ou derivar para o grupo. Então um modelo capaz — o juiz — lê cada resposta lado a lado e escreve um único veredicto: onde o painel concorda, onde discorda abertamente, o que apenas um membro notou e uma resposta final que se apoia em tudo isso.

Por que se dar ao trabalho de abrir o leque? Porque respostas independentes falham de maneiras independentes. Se quatro assistentes chegam à mesma conclusão por conta própria, essa concordância é evidência real. Se eles divergem, a própria divergência é o achado — ela diz exatamente onde a pergunta é genuinamente difícil, em vez de um único assistente disfarçar a dúvida com um parágrafo de tom confiante. Você ganha tanto a resposta quanto um mapa de quão confiável ela é.

Uma disciplina sustenta a coisa toda, e é o coração desta lição: independência primeiro, síntese depois. Os panelistas não recebem papéis artificiais ("você é o otimista, você é o cético") — isso só fabrica uma discordância que nunca existiu. Cada um simplesmente responde à pergunta real o melhor que pode, por conta própria. O juiz só entra depois que todas as respostas independentes estão na mesa.

Pense nisso como… um painel de médicos lendo o mesmo exame em salas separadas. Nenhum deles ouve primeiro a opinião dos outros, então ninguém é influenciado pela voz mais sênior ou mais alta. Então um médico-chefe reúne todas as leituras escritas: onde todos os médicos concordam, é sólido; onde dois discordam, isso é sinalizado para um exame mais atento; se um enxergou algo que os demais não viram, isso também é considerado. A decisão final se fundamenta no painel inteiro — não em quem por acaso falou primeiro. Onde a analogia quebra: os médicos são pessoas com agendas, enquanto os panelistas do fusion respondem em paralelo em segundos, então perguntar a cinco em vez de um quase não custa tempo extra.

O painel, concretamente

Uma execução completa de fusion abre um prompt para N panelistas em paralelo — no elenco padrão isso é o Opus 4.8 ao lado de codex (GPT-5.5), kimi, grok e agy (Gemini 3.1 Pro). Cada um roda como seu próprio processo, sem contexto compartilhado, de modo que as respostas são genuinamente independentes. Quando cada panelista retorna, o Opus 4.8 assume a cadeira de juiz e julga o conjunto em um único veredicto estruturado.

Independência-depois-síntese, não lentes artificiais

Os panelistas não recebem personas opostas. Papéis fabricados de "advogado do diabo" produzem uma discordância que é um artefato do prompt, não um sinal sobre a pergunta. O Fusion mantém cada resposta honesta e independente, e então deixa sobreposições reais e conflitos reais emergirem sob o juiz. Concordância que sobrevive à independência significa algo; discordância que sobrevive a ela diz exatamente onde cavar.

Por que isso supera uma única resposta forte

Um único modelo — por melhor que seja — tem um modo de falha por vez: um ponto cego, um viés, um fato desatualizado. Abrir o leque troca esse ponto único de falha por uma distribuição. A final fundamentada do juiz se ancora no que o painel coletivamente enxergou, e sua nota de pontos cegos sinaliza o que nenhum deles cobriu, então você também aprende os limites da resposta.

Fusion em uma imagem

O formato inteiro cabe em uma linha de fluxo. Uma pergunta abre o leque para um painel que responde em paralelo e às cegas; todas as respostas voltam a convergir para um único juiz; o juiz escreve um único veredicto fundamentado. Abre o leque, depois fecha.

Leia da esquerda → direita: um prompt abre o leque para um painel às cegas, as respostas voltam a convergir para um juiz, o juiz emite um único veredicto fundamentado.

mesmo prompt para todos cada panelista às cegas respostas em paralelo um juiz sintetiza final fundamentada

Às cegas primeiro, julgado depois

A ordem é tudo. O Fusion roda em duas fases limpas, e o valor vem de mantê-las separadas.

Fase um — independência. A mesma pergunta vai para cada panelista, e cada um responde sozinho. Nenhum panelista vê o rascunho de outro. Não há personas atribuídas, nenhum "você defenda o lado contrário" — cada membro apenas responde à pergunta real o melhor que pode. É isso que torna o resultado confiável mais tarde: quando as respostas se alinham, é porque chegaram ao mesmo lugar de forma independente, não porque copiaram umas das outras.

Fase dois — síntese. Só depois que todas as respostas às cegas chegam é que o juiz as lê em conjunto e as reconcilia em um veredicto. O juiz não é uma sexta opinião jogada na pilha; seu trabalho é comparar — encontrar as sobreposições, nomear os conflitos e decidir qual é, de fato, a resposta fundamentada.

Por que não deixá-los conversar entre si e convergir por conta própria? Porque isso destrói a independência pela qual você pagou. No momento em que um assistente vê a resposta confiante de outro, ele tende a se ancorar nela, e cinco vozes silenciosamente colapsam em uma. Mantê-los às cegas preserva cinco leituras genuinamente separadas — que é todo o propósito de perguntar a mais de um.

A regra que faz o fusion funcionar

Independência primeiro, síntese depois. A concordância real se conquista respondendo às cegas; a discordância fabricada (papéis artificiais) não vale nada. Deixe as sobreposições e os conflitos emergirem por conta própria, e então julgue-os.

Isolamento de processo, não uma instrução educada

Cada panelista roda em sua própria invocação com sua própria janela de contexto. O sigilo é uma propriedade de como eles são lançados — processos separados, mesmo prompt, sem transcrição compartilhada — não uma frase no prompt pedindo que "por favor, ignore os outros". É por isso que o fusion abre o leque em paralelo em vez de rodar uma mesa-redonda: paralelismo e isolamento são o mesmo mecanismo aqui.

O que o juiz de fato recebe

O juiz recebe a pergunta original mais o conjunto completo de respostas dos panelistas, rotuladas por origem. Ele é instruído a sintetizar — não a responder do zero. Sua saída é estruturada (as categorias na próxima seção), de modo que o leitor pode ver o formato da concordância, não apenas um parágrafo final. Espera-se também que o juiz fundamente a final: onde uma afirmação precisa de um fato externo, ele é confirmado (via o CLI da Bright Data, lição 11), nunca afirmado de memória.

O que o juiz produz

O juiz não apenas escolhe uma resposta favorita. Ele separa as leituras do painel em um conjunto pequeno e fixo de baldes, e então escreve uma resposta final que se assenta sobre eles. Esses baldes são o que tornam um veredicto do fusion mais útil que qualquer resposta isolada — eles mostram a estrutura da resposta.

Consenso — aquilo em que todo panelista concordou, de forma independente. Esta é a base; trate-a como a parte mais confiável da resposta.
Contradições — onde os panelistas discordam abertamente. O juiz não esconde isso; um conflito real é um sinal de que essa parte da pergunta é genuinamente difícil.
Parcial — pontos que alguns membros levantaram e outros simplesmente não abordaram — concordância que é sugestiva, mas não unânime.
Único — algo que apenas um panelista enxergou. Muitas vezes a linha mais valiosa de toda a execução: o insight que você teria perdido ao perguntar a um único assistente.
Pontos cegos — o que nenhum deles cobriu. O juiz nomeia a lacuna para que você conheça os limites da resposta, não apenas seu conteúdo.
Final fundamentada — a única resposta, construída a partir de tudo o que está acima, com quaisquer fatos externos confirmados em vez de presumidos.

O juiz separa as respostas às cegas em cinco baldes, e então escreve uma final fundamentada sobre eles.

Como de fato usar cada balde

Consenso é o seu terreno seguro — aja sobre ele com confiança. Contradições são onde você desacelera: o painel está lhe dizendo que essa subpergunta não está resolvida, então ou reúna mais evidências ou faça o trade-off de forma explícita. Insights únicos merecem um segundo olhar justamente porque sobreviveram a apenas uma mente — são fáceis de descartar e muitas vezes os mais valiosos. Pontos cegos protegem você de uma resposta confiante que silenciosamente pulou algo importante.

Por que um veredicto estruturado supera um único parágrafo

Uma resposta solitária achata certeza e dúvida em um único tom de voz. O veredicto em baldes os mantém separados, de modo que você pode ver quais partes da resposta confiar e quais sondar. Esse é o verdadeiro produto do fusion: não apenas uma resposta, mas uma resposta calibrada.

Para código: rode ambos, faça o merge do resultado verificado

Quando a pergunta é "responda isto", o fusion julga palavras. Quando a pergunta é "escreva este código", o fusion faz algo mais forte: ele não apenas lê as duas soluções candidatas e adivinha qual é melhor — ele roda ambas no boundary real (os testes, o build, a saída de fato) e faz o merge do resultado que realmente funcionou. O veredicto se fundamenta na execução, não em quão confiante cada candidato soava.

Esta é a mesma disciplina do Portão da Prova vista antes no curso, aplicada a um painel: o mérito de um candidato é decidido por passar na checagem real, não pela prosa ao redor dele. Dois rascunhos fortes entram; um resultado verificado e funcional sai.

$ como uma fusion de código é invocada (painel completo)

# Faça a mesma tarefa de código ao painel, julgada pelo Opus 4.8
/fusion-3 "Implement retry-with-backoff for the upload client; keep the public API."

# O Fusion abre o prompt para o elenco vivo e, para candidatos de CÓDIGO,
# RODA ambos e mantém o que o boundary aceitar:
for cand in candidate_a candidate_b; do
  apply "$cand" && run_tests            # o boundary real, não uma alegação
done
# → o juiz faz o merge do resultado VERIFICADO em um único patch fundamentado

O ponto de entrada humano

Você invoca um painel completo com /fusion-3 — Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro em paralelo, julgados pelo Opus 4.8. Há também variantes mais leves de cadeira única (/fusion-opus4.8, /fusion-gpt5.5) quando você quer um modelo específico em vez do quadro inteiro. Para prosa, o juiz retorna o veredicto em baldes; para código, ele retorna um patch mesclado cujas partes foram cada uma executadas.

Por que "rodar ambos" e não "escolher o de aparência melhor"

Dois candidatos podem ambos parecer corretos e só um compilar, passar no teste de caso-limite ou retornar os bytes certos. Lê-los não diz qual — só o boundary diz. Por isso o fusion trata cada candidato como uma hipótese a ser executada, e o merge é montado a partir das partes que de fato passaram. É isso que "fundamentado" significa para código: verificado, nunca afirmado.

Onde isso se encaixa no loop

Uma fusion de código é mais útil em uma bifurcação difícil dentro do EXECUTE, ou como um Validador no Portão da Prova quando o patch de um único agente é arriscado demais para se confiar sozinho. A independência dos candidatos somada à checagem por execução é exatamente o tipo de evidência que uma unidade de aposta alta merece.

Experimente: monte um veredicto

Veja em movimento. Aqui está a mesma execução de fusion, congelada no momento em que todas as quatro respostas às cegas chegaram e o juiz está prestes a escrever o veredicto. Alterne entre os panelistas para ler cada resposta independente, depois abra a visão do juiz para ver essas respostas se separarem em consenso, uma contradição, uma pegada única e uma final fundamentada. O diagrama à esquerda destaca de quem é a resposta que você está lendo.

A pergunta na mesa: "O cliente de upload deveria tentar de novo uploads que falharam e, em caso afirmativo, como?"

Lendo a resposta às cegas do Opus — uma das quatro leituras independentes que alimentam o juiz.

Panelista às cegas

Opus

Sim — tente de novo, mas só em erros de rede transitórios, com backoff exponencial e um teto. Nunca repita um 4xx; isso só repete um erro do cliente.

+Tente de novo em timeouts / 5xx, com backoff e um número máximo de tentativas.
+Torne o upload idempotente para que uma nova tentativa não duplique a criação.
!Não tente de novo em 4xx — a própria requisição está errada.

Panelista às cegas

agy · Gemini 3.1 Pro

Sim — e respeite o header Retry-After do servidor em um 429 em vez de usar seu próprio backoff. O servidor está lhe dizendo exatamente quanto tempo esperar.

+Backoff com um teto em erros transitórios.
★Em um 429, leia o Retry-After e espere esse tempo — só um panelista levantou isso.
+Chave de idempotência para que as novas tentativas sejam seguras.

Juiz · Opus 4.8

Veredicto fundamentado

Os quatro responderam às cegas e convergiram no núcleo, com um conflito aberto e uma pegada que vale manter. Eis como se separam:

ConsensoTente de novo somente erros transitórios (timeouts / 5xx), com backoff exponencial limitado. Nunca repita um 4xx simples. Os quatro, de forma independente.

ContradiçãoComo tratar um 429: backoff próprio vs caso-especial. Genuinamente não resolvido — sinalizado, não escondido.

Pegada únicasó o agy: em um 429, respeite o Retry-After do servidor. Resolve a contradição — adote-a.

Final fundamentadaBackoff limitado com jitter em erros transitórios; em um 429 respeite o Retry-After; upload idempotente; API pública inalterada. Para código, ambos os candidatos foram rodados contra os testes e as partes aprovadas foram mescladas.

Anatomia

Os controles são um role="tablist" de elementos <button> reais — quatro panelistas às cegas mais o juiz. Selecionar um define aria-selected="true", mostra o role="tabpanel" correspondente, acende o nó correspondente no SVG embutido e reescreve a figcaption para que usuários de leitor de tela e videntes fiquem em sincronia. As setas / Home / End movem entre os papéis (o padrão de tabs do WAI-ARIA).

O que ele está ensinando

Note o formato do resultado real: os panelistas se sobrepõem no núcleo seguro (consenso), divergem em exatamente uma subpergunta (a contradição do 429), e um deles sozinho fornece o fato que a resolve (a pegada única). Esse é o ganho cotidiano de perguntar a muitos e julgar uma vez — e você teria perdido o insight do Retry-After ao perguntar a um único assistente.

O elenco vivo e a camada bash

Quem de fato senta no painel não é fixo no código. Antes de uma execução, um pequeno script olha para esta máquina e pergunta: quais dos assistentes candidatos estão instalados e acessíveis agora? Só esses entram no painel. Se o grok não está configurado na sua máquina, o fusion simplesmente roda os panelistas que você tem — o elenco é descoberto, não presumido, a mesma disciplina de olhar-antes-de-pular do restante do curso.

Uma vez escolhido o elenco, cada panelista é lançado da mesma maneira humilde que a equipe foi na lição anterior: um pequeno shell script por assistente que pega o prompt, chama a linha de comando daquele assistente e devolve a resposta dele. Mesmo prompt entra, uma resposta sai, sem contexto compartilhado — é isso que os mantém às cegas.

detect_panel.sh — escolhe o elenco vivo, depois roda cada panelista às cegas

# 1) detect_panel.sh: mantém só os assistentes de fato instalados aqui
panel=$(detect_panel.sh)          # ex.: "opus codex kimi grok agy"

# 2) run_*.sh: um wrapper de camada bash por assistente — mesmo prompt, às cegas
for member in $panel; do
  run_${member}.sh "$PROMPT" > "answers/${member}.txt" &   # paralelo · isolado
done; wait

# 3) o juiz (Opus 4.8) lê answers/*.txt e escreve o veredicto

detect_panel.sh — o seletor de elenco

O detect_panel.sh sonda a máquina para cada assistente candidato (sua CLI está no PATH, ela autentica) e emite a lista de membros vivos. Essa lista é o painel para esta execução. Por ser detectada por máquina, o mesmo comando /fusion-3 se adapta a qualquer equipe que você de fato tenha — nenhum panelista é jamais presumido presente.

run_*.sh — a camada bash da família de adapters

Os scripts run_*.sh são a camada de shell da mesma família de adapters que você reencontrará com o Council (lição 8). Cada um é um wrapper fino: pega o prompt, invoca um assistente headless, retorna o texto. Rodá-los em paralelo com arquivos de saída isolados é exatamente o que torna o painel ao mesmo tempo rápido e às cegas. O juiz então consome esses arquivos e sintetiza — ele recebe as respostas, nunca os panelistas vivos.

Quem recorre ao fusion, e quando

Três tipos de participante tocam o fusion, cada um por uma razão diferente — e eles mapeiam para as três audiências que este curso inteiro mantém em vista.

Uma pessoa roda /fusion-3 quando quer uma resposta de alta confiança a uma pergunta que importa — uma decisão de design, um bug complicado, um "qual destas duas abordagens é a certa" — e a resposta de um único assistente parece fina demais para apostar. O veredicto em baldes diz a ela não apenas a resposta, mas quão sólida ela é.

Um LLM orquestrador recorre ao fusion como ferramenta, não como conversa. Ele usa um painel como Validador no Portão da Prova quando uma unidade é importante demais para ser aprovada com uma só opinião, ou para julgar uma bifurcação difícil — dois caminhos plausíveis, discordância real — obtendo leituras independentes e uma decisão fundamentada em vez de jogar uma moeda. Crucialmente, o modelo que julga não deve ser o autor solitário daquilo que está sendo julgado; a independência do fusion é o que o torna uma checagem justa.

Os agentes — os próprios assistentes — fazem a parte humilde. O detect_panel.sh escolhe quais deles estão vivos nesta máquina, e os wrappers run_*.sh cada um pega o prompt e retorna uma resposta às cegas. Eles não se coordenam e não veem uns aos outros; apenas respondem bem e devolvem o resultado para o juiz pesar.

No Portão da Prova

Quando a correção de uma unidade é de aposta alta, um orquestrador pode encaminhá-la a um painel de fusion em vez de a um único validador. Leituras independentes mais — para código — de fato rodar os candidatos dão ao portão uma evidência muito mais forte que a palavra de um único agente. Quem constrói a unidade nunca é o único juiz dela; essa separação é a mesma regra que protegeu o Portão da Prova ao longo do curso.

Julgando uma bifurcação difícil

Quando o loop atinge uma bifurcação genuína — dois designs defensáveis, uma discordância real entre agentes — o fusion transforma o impasse em dados: quem concorda, onde de fato está o conflito e qual é a decisão fundamentada. Ele substitui "discutir até alguém desistir" por "perguntar de forma independente, depois julgar".

Recapitulação

O Fusion é a máquina de respostas de alta confiança do loop. Abra o leque da mesma pergunta para um painel de assistentes em paralelo, cada um às cegas para que suas respostas permaneçam independentes; então um juiz — Opus 4.8 — lê todas e escreve um único veredicto fundamentado: consenso, contradições, concordância parcial, pegadas únicas, pontos cegos e uma resposta final construída sobre tudo. Para código, ele não adivinha entre os candidatos — ele roda ambos e faz o merge do que de fato passou.

Leve isto adiante

Independência primeiro, síntese depois. A concordância real se conquista respondendo às cegas; a discordância real é um mapa de onde a pergunta é difícil. Humanos rodam /fusion-3 para uma resposta de alta confiança; um orquestrador o usa como Validador no Portão da Prova ou para resolver uma bifurcação difícil; o detect_panel.sh escolhe o elenco vivo e os scripts run_*.sh são a camada bash que lança cada panelista.

Seu agente é seu professor. Quer sentir o ganho? Peça ao seu assistente para rodar /fusion-3 em uma decisão real que você está ruminando e leia o veredicto balde por balde — note onde o painel concorda, onde diverge e se alguém pegou algo que os demais não viram. A seguir, ampliamos o painel para um quadro permanente e configurável, com seus próprios papéis e pesos: Council e a família de adapters.

fusion: do painel ao juiz

A grande ideia: pergunte a muitos, julgue uma vez

O painel, concretamente

Independência-depois-síntese, não lentes artificiais

Por que isso supera uma única resposta forte

Fusion em uma imagem

Às cegas primeiro, julgado depois

Isolamento de processo, não uma instrução educada

O que o juiz de fato recebe

O que o juiz produz

Como de fato usar cada balde

Por que um veredicto estruturado supera um único parágrafo

Para código: rode ambos, faça o merge do resultado verificado

O ponto de entrada humano

Por que "rodar ambos" e não "escolher o de aparência melhor"

Onde isso se encaixa no loop

Experimente: monte um veredicto

Opus

codex · GPT-5.5

grok & kimi

agy · Gemini 3.1 Pro

Veredicto fundamentado

Anatomia

O que ele está ensinando

O elenco vivo e a camada bash

detect_panel.sh — o seletor de elenco

run_*.sh — a camada bash da família de adapters

Quem recorre ao fusion, e quando

No Portão da Prova

Julgando uma bifurcação difícil

Recapitulação