DevOps SRE Especialista (Híbrido/SP) - 130679
DevOps SRE Especialista (Híbrido/SP) - 130679
Alphaville - Barueri, BR, 06.454-000
O que buscamos
Buscamos profissional especialista em SRE, com visão sistêmica e forte capacidade analítica, para atuar na garantia de confiabilidade, estabilidade e eficiência operacional de produtos e serviços críticos.
Atuação Híbrida na Região JK – São Paulo/SP
Responsabilidades
• Atuar na definição, manutenção e evolução de SLIs e SLOs para APIs e serviços críticos;
• Gerenciar e comunicar o consumo de error budget, orientando decisões de release;
• Atuar como referência no equilíbrio entre agilidade e estabilidade operacional;
• Implementar e aprimorar práticas de monitoramento, métricas, logs e tracing;
• Garantir alertas acionáveis e dashboards claros para acompanhamento de serviços;
• Liderar ou apoiar respostas a incidentes e war rooms;
• Estruturar processos de incident response com abordagem blameless;
• Conduzir postmortems e garantir execução das ações corretivas;
• Atuar para redução de MTTA, MTTR e reincidência de incidentes;
• Automatizar fluxos operacionais e eliminar tarefas repetitivas (toil);
• Criar runbooks, automações e melhorias em pipelines de CI/CD;
• Padronizar processos de rollout, rollback e testes de resiliência;
• Atuar em ambientes com Kubernetes/EKS, Azure DevOps, Kafka e bancos de dados;
• Apoiar decisões técnicas em conjunto com Engenharia e Arquitetura;
• Otimizar performance, capacidade e custos em ambientes de infraestrutura;
• Disseminar boas práticas e elevar a maturidade SRE das squads;
• Atuar em parceria com times de Arquitetura, DevOps/SRE Enablement e Segurança;
• Influenciar decisões técnicas com base em dados e métricas;
Requisitos e Qualificações
• Vivência com SLI, SLO, error budgets e gestão de incidentes;
• Forte capacidade de troubleshooting e análise de causa raiz (RCA);
• Kubernetes / EKS;
• Observabilidade: Prometheus, Grafana, ELK, CloudWatch, X-Ray;
• Mensageria e dados: Kafka, Oracle, MySQL;
• Segurança operacional e IAM;
• Bash;
• PowerShell;
• Python;
• Ansible;
• Terraform;
• Helm;
• Capacidade de ensinar, influenciar e mentorar;
• Comunicação clara, objetiva e orientada a dados;
• Forte colaboração multidisciplinar;
• Mentalidade de produto e cultura blameless;
Diferenciais
• Conhecimento em .NET Framework / .NET Core;
• Experiência com Chaos Engineering;
• Vivência com Progressive Delivery;
• Experiência em otimização de custos em cloud;
Descrição comportamental:
Procuramos uma pessoa que:
- Goste de trabalhar em equipe e seja colaborativa em suas atribuições;
- Tenha coragem para se desafiar e ir além, abraçando novas oportunidades de crescimento;
- Transforme ideias em soluções criativas e busque qualidade em toda sua rotina;
- Tenha habilidades de resolução de problemas;
- Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo;
- Tenha interesse em lidar com situações adversas e inovadoras no âmbito tecnológico.
Big enough to deliver – small enough to care.
#VempraGFT
#VamosVoarJuntos