Engenharia de Plataforma de Observabilidade - 130039
Engenharia de Plataforma de Observabilidade - 130039
Alphaville - Barueri, BR, 06.454-000
O que buscamos:
Estamos em busca de um(a) profissional para integrar o projeto de fundação de observabilidade. Esse papel exige atuação prática na construção e manutenção da plataforma de observabilidade, combinando habilidades de DevOps e integração de código backend. A missão será configurar infraestrutura como código na AWS (Terraform, VPC, IAM, Amazon Prometheus/Grafana, OpenSearch, etc.) e instrumentar aplicações e middlewares com telemetria (logs estruturados, métricas de negócio, traces via OpenTelemetry). O objetivo é garantir coleta eficiente de dados e visibilidade completa do comportamento do sistema em produção, contribuindo para confiabilidade e performance conforme diretrizes do time de arquitetura/SRE.
Requisitos e qualificações;
- Provisionar e configurar infraestrutura de observabilidade usando Terraform, incluindo recursos AWS (VPCs, IAM, AMP, AMG, OpenSearch, OSIS).
- Implementar pipelines de coleta e agregação de logs e métricas, integrando Fluent Bit, Prometheus e OpenTelemetry Collector.
- Instrumentar código backend com OpenTelemetry, inserindo rastreamento distribuído e métricas customizadas, além de garantir logs estruturados em JSON.
- Desenvolver dashboards no Grafana e configurar alertas no Prometheus/Alertmanager alinhados aos SLOs.
- Colaborar com times de desenvolvimento para adoção de boas práticas de observabilidade desde as fases iniciais.
- Monitorar a saúde da plataforma, investigar falhas ou gargalos e atuar na resolução de incidentes.
- Manter documentação técnica e apoiar capacitação da equipe no uso das ferramentas implantadas.
- Requisitos Técnicos Obrigatórios:
- Experiência em DevOps/Plataforma ou Desenvolvimento Backend, com pipelines CI/CD e automação de infraestrutura.
- Conhecimento avançado em AWS e serviços de observabilidade (OpenSearch, AMP, AMG, CloudWatch, ECS/EKS) usando Terraform.
- Prática em módulos Terraform e scripts para provisionamento de rede e serviços gerenciados.
- Experiência com Fluent Bit, Prometheus, consultas PromQL e pipelines de logs/métricas.
- Familiaridade com OpenTelemetry e instrumentação de aplicações (Java, Node.js, Python).
- Experiência com containers e orquestração (Kubernetes/OpenShift) e observabilidade de clusters.
- Diferenciais Desejáveis:
- Certificações AWS (Developer Associate, DevOps Professional) e/ou Terraform Associate.
- Experiência com outras ferramentas de observabilidade (EFK, Datadog, New Relic, Splunk).
Descrição comportamental:
Procuramos uma pessoa que:
- Goste de trabalhar em equipe e seja colaborativa em suas atribuições;
- Tenha coragem para se desafiar e ir além, abraçando novas oportunidades de crescimento;
- Transforme ideias em soluções criativas e busque qualidade em toda sua rotina;
- Tenha habilidades de resolução de problemas;
- Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo;
- Tenha interesse em lidar com situações adversas e inovadoras no âmbito tecnológico.
Big enough to deliver – small enough to care.
#VempraGFT
#VamosVoarJuntos
#ProudToBeGFT