Documento interno de referência para construção e deploy do agente RAG com base documental de 70GB — fotos, PDFs, emails e processos judiciais.
Os 70GB chegam em 4 formatos distintos. Cada um exige extração diferente — usar a ferramenta errada compromete a qualidade do agente.
Cada ferramenta tem uma função específica. Nenhuma é substituível sem impacto no sistema.
Cada etapa com a ferramenta exata, custo real por cenário e o quanto o Claude Code executa. Da extração dos documentos até o agente em produção.
Ordem que minimiza risco e permite uso parcial desde a semana 2.
Ferramenta escolhida, como instalar, como alimentar com os documentos e como configurar o comportamento pericial. Cada etapa com custo, prazo e dificuldade.
Mesma stack, mesma segurança, volumes diferentes. O custo de uso mensal (Claude API) é idêntico nos dois — o que muda é o setup inicial e a infra de storage.
Três passos para começar antes da próxima reunião com o Sergio.
Para cada etapa: nível de dificuldade técnica, quanto o Claude executa sozinho e o que precisa de nós.
Cada lacuna tem uma ferramenta ou processo específico. Nada fica descoberto.
Documentos periciais têm sigilo processual. A arquitetura foi escolhida exatamente para isso.
Dify e Qdrant rodam no Railway — servidor dedicado. Nenhum documento é enviado para OpenAI, Anthropic ou qualquer terceiro. Só os embeddings (números matemáticos, sem texto) são gerados externamente.
R2 (Cloudflare) criptografa todos os arquivos armazenados com AES-256. Todas as conexões são HTTPS/TLS 1.3. Qdrant e Railway têm rede privada interna sem exposição pública.
Autenticação com senha + 2FA no painel do Dify. Nenhuma URL pública expõe os documentos. O agente só é acessível com login — sem links compartilháveis.
R2 replica os originais automaticamente. Qdrant faz snapshot diário dos vetores. Railway persiste o banco de metadados. Recuperação total em caso de falha em menos de 1 hora.
Sim. Nenhum documento precisa ser inserido manualmente. O sistema monitora pastas e ingere automaticamente.