A query atravessa o pipeline um estágio de cada vez: a pergunta entra como texto, vira coordenada de significado, busca os trechos mais próximos da base, monta o prompt com eles, e o modelo responde ancorado nos trechos (citou a fonte, não inventou).