SRE (Dynatrace) - 131773
SRE (Dynatrace) - 131773
Alphaville - Barueri, BR, 06.454-000
Escopo a ser definido pelo cliente Itaú Responsabilidades Atuar como Site Reliability Engineer garantindo alta disponibilidade, desempenho e confiabilidade dos sistemas e aplicações. Implementar e manter estratégias de observabilidade utilizando Dynatrace. Monitorar ambientes em AWS, analisando métricas, logs e traces para identificação proativa de incidentes. Automatizar processos operacionais e rotinas de infraestrutura visando maior eficiência e confiabilidade. Participar da gestão de incidentes críticos, análise de causa raiz e implementação de melhorias contínuas. Trabalhar em conjunto com equipes de desenvolvimento, DevOps e infraestrutura para melhorar a resiliência das aplicações. Implementar e evoluir práticas de SRE como SLI, SLO, SLA e gestão de error budgets. Desenvolver e manter dashboards, alertas e relatórios de performance e disponibilidade. Contribuir com a definição de padrões de observabilidade, monitoramento e resposta a incidentes. Requisitos Experiência sólida atuando como SRE, DevOps Engineer ou em funções similares. Experiência avançada com Dynatrace (implementação, configuração, dashboards, alertas e análise de performance). Experiência prática com ambientes AWS. Conhecimento em monitoramento, observabilidade e análise de performance de aplicações distribuídas. Experiência com troubleshooting em ambientes de produção de alta criticidade. Conhecimento em automação e infraestrutura como código. Experiência com ambientes baseados em microsserviços e arquiteturas cloud. Diferenciais Experiência com Kubernetes e containers. Conhecimento em ferramentas de CI/CD. Experiência com outras ferramentas de observabilidade e APM. Conhecimento em práticas avançadas de engenharia de confiabilidade e resiliência de sistemas. Certificações relacionadas a AWS ou observabilidade.