Ajude-nos a construir, entregar e monitorar sistemas de agentes em produção que orquestram modelos de linguagem, ferramentas e memória—de forma confiável e em escala.
Você projetará e implementará componentes principais do runtime para agentes multi-ferramenta e multi-turno, melhorará latência e confiabilidade em nossos caminhos de inferência, e colaborará com produto para transformar pesquisa de ponta em experiências confiáveis.
Visão Geral da Função
- Responsabilizar-se por caminhos críticos no runtime de agentes (ferramentas, orquestração, memória, avaliações).
- Entregar código em toda a stack (TypeScript/Node, Python, Postgres/Redis, filas).
- Instrumentar, monitorar e fortalecer sistemas para confiabilidade, desempenho e custo.
- Criar estruturas de avaliação (offline e online) para medir qualidade e regressões.
- Trabalhar com produto e pesquisa para levar recursos do conceito à produção.
Requisitos
- 5+ anos construindo sistemas backend em escala (filas, workers, serviços, APIs).
- Experiência profunda com TypeScript/Node e/ou Python.
- Prática com ferramentas LLM (chamadas de função/ferramenta, RAG, bancos de dados vetoriais, avaliações).
- Mentalidade operacional: logging, tracing, plantão, SLOs, postmortems.
- Comunicação clara e senso de produto; viés para entregar.
Diferenciais
- Experiência com uso de ferramentas OpenAI/Anthropic, serverless, ou WebRTC/voz.
- MLOps ou infraestrutura como código (Terraform) em ambientes multi-env.
Pronto para se candidatar?
Envie seu LinkedIn/GitHub e uma breve mensagem. Revisamos todas as candidaturas.
Prefere outra vaga? Voltar para todas as vagas