Site Reliability Engineer (SRE) - Sênior
Location
Remote, Remote
Job Type
Full-time
Category
Redes e sistemas
Posted
May 30, 2026
Principais Responsabilidades/funções Da Vaga
- Estratégia de Confiabilidade: Liderar técnicamente a governança global de SRE, definindo frameworks de SLIs/SLOs/SLAs que alinhem os objetivos de negócio à disponibilidade técnica em toda a organização.
- Arquitetura de Entrega (GitOps): Desenvolver e evoluir a arquitetura de entrega contínua, utilizando ArgoCD e EKS, visando escalabilidade para múltiplos clusters e ambientes globais, garantindo conformidade e self-healing.
- Governança de Infraestrutura: Estabelecer padrões de arquitetura para IaC (Terraform), criando módulos reutilizáveis de alta abstração e gerindo a política de automação via Atlantis para garantir consistência entre todas as verticais.
- Evolução da Observabilidade: Projetar a visão de longo prazo para observabilidade (Tracing, Logging, Metrics), integrando OpenTelemetry e Datadog para criar uma cultura de telemetria preditiva e redução drástica do MTTR (Mean Time To Recovery...