O que buscamos
Buscamos profissional especialista em SRE com visão sistêmica e forte capacidade analítica para atuar na garantia de confiabilidade estabilidade e eficiência operacional de produtos e serviços críticos.
Atuação Híbrida na Região JK São Paulo/SP
Responsabilidades
Atuar na definição manutenção e evolução de SLIs e SLOs para APIs e serviços críticos;
Gerenciar e comunicar o consumo de error budget orientando decisões de release;
Atuar como referência no equilíbrio entre agilidade e estabilidade operacional;
Implementar e aprimorar práticas de monitoramento métricas logs e tracing;
Garantir alertas acionáveis e dashboards claros para acompanhamento de serviços;
Liderar ou apoiar respostas a incidentes e war rooms;
Estruturar processos de incident response com abordagem blameless;
Conduzir postmortems e garantir execução das ações corretivas;
Atuar para redução de MTTA MTTR e reincidência de incidentes;
Automatizar fluxos operacionais e eliminar tarefas repetitivas (toil);
Criar runbooks automações e melhorias em pipelines de CI/CD;
Padronizar processos de rollout rollback e testes de resiliência;
Atuar em ambientes com Kubernetes/EKS Azure DevOps Kafka e bancos de dados;
Apoiar decisões técnicas em conjunto com Engenharia e Arquitetura;
Otimizar performance capacidade e custos em ambientes de infraestrutura;
Disseminar boas práticas e elevar a maturidade SRE das squads;
Atuar em parceria com times de Arquitetura DevOps/SRE Enablement e Segurança;
Influenciar decisões técnicas com base em dados e métricas;
Requisitos e Qualificações
Vivência com SLI SLO error budgets e gestão de incidentes;
Forte capacidade de troubleshooting e análise de causa raiz (RCA);
Kubernetes / EKS;
Observabilidade: Prometheus Grafana ELK CloudWatch X-Ray;
Mensageria e dados: Kafka Oracle MySQL;
Segurança operacional e IAM;
Bash;
PowerShell;
Python;
Ansible;
Terraform;
Helm;
Capacidade de ensinar influenciar e mentorar;
Comunicação clara objetiva e orientada a dados;
Forte colaboração multidisciplinar;
Mentalidade de produto e cultura blameless;
Diferenciais
Conhecimento Framework / .NET Core;
Experiência com Chaos Engineering;
Vivência com Progressive Delivery;
Experiência em otimização de custos em cloud;
Descrição comportamental:
Procuramos uma pessoa que:
- Goste de trabalhar em equipe e sejacolaborativaem suas atribuições;
- Tenhacoragempara se desafiar e ir além abraçando novas oportunidades de crescimento;
- Transforme ideias em soluçõescriativase busque qualidade em toda sua rotina;
- Tenha habilidades deresolução de problemas;
- Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo;
- Tenha interesse em lidar com situações adversas einovadorasno âmbito tecnológico.
Big enough to deliver small enough to care.
#VempraGFT
#VamosVoarJuntos
Required Experience:
IC
O que buscamosBuscamos profissional especialista em SRE com visão sistêmica e forte capacidade analítica para atuar na garantia de confiabilidade estabilidade e eficiência operacional de produtos e serviços críticos.Atuação Híbrida na Região JK São Paulo/SPResponsabilidades Atuar na definição manut...
O que buscamos
Buscamos profissional especialista em SRE com visão sistêmica e forte capacidade analítica para atuar na garantia de confiabilidade estabilidade e eficiência operacional de produtos e serviços críticos.
Atuação Híbrida na Região JK São Paulo/SP
Responsabilidades
Atuar na definição manutenção e evolução de SLIs e SLOs para APIs e serviços críticos;
Gerenciar e comunicar o consumo de error budget orientando decisões de release;
Atuar como referência no equilíbrio entre agilidade e estabilidade operacional;
Implementar e aprimorar práticas de monitoramento métricas logs e tracing;
Garantir alertas acionáveis e dashboards claros para acompanhamento de serviços;
Liderar ou apoiar respostas a incidentes e war rooms;
Estruturar processos de incident response com abordagem blameless;
Conduzir postmortems e garantir execução das ações corretivas;
Atuar para redução de MTTA MTTR e reincidência de incidentes;
Automatizar fluxos operacionais e eliminar tarefas repetitivas (toil);
Criar runbooks automações e melhorias em pipelines de CI/CD;
Padronizar processos de rollout rollback e testes de resiliência;
Atuar em ambientes com Kubernetes/EKS Azure DevOps Kafka e bancos de dados;
Apoiar decisões técnicas em conjunto com Engenharia e Arquitetura;
Otimizar performance capacidade e custos em ambientes de infraestrutura;
Disseminar boas práticas e elevar a maturidade SRE das squads;
Atuar em parceria com times de Arquitetura DevOps/SRE Enablement e Segurança;
Influenciar decisões técnicas com base em dados e métricas;
Requisitos e Qualificações
Vivência com SLI SLO error budgets e gestão de incidentes;
Forte capacidade de troubleshooting e análise de causa raiz (RCA);
Kubernetes / EKS;
Observabilidade: Prometheus Grafana ELK CloudWatch X-Ray;
Mensageria e dados: Kafka Oracle MySQL;
Segurança operacional e IAM;
Bash;
PowerShell;
Python;
Ansible;
Terraform;
Helm;
Capacidade de ensinar influenciar e mentorar;
Comunicação clara objetiva e orientada a dados;
Forte colaboração multidisciplinar;
Mentalidade de produto e cultura blameless;
Diferenciais
Conhecimento Framework / .NET Core;
Experiência com Chaos Engineering;
Vivência com Progressive Delivery;
Experiência em otimização de custos em cloud;
Descrição comportamental:
Procuramos uma pessoa que:
- Goste de trabalhar em equipe e sejacolaborativaem suas atribuições;
- Tenhacoragempara se desafiar e ir além abraçando novas oportunidades de crescimento;
- Transforme ideias em soluçõescriativase busque qualidade em toda sua rotina;
- Tenha habilidades deresolução de problemas;
- Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo;
- Tenha interesse em lidar com situações adversas einovadorasno âmbito tecnológico.
Big enough to deliver small enough to care.
#VempraGFT
#VamosVoarJuntos
Required Experience:
IC
View more
View less