SRE (Site Reliability Engineer) Sênior

Raiô Benefícios

Not Interested
Bookmark
Report This Job

profile Job Location:

Porto Alegre - Brazil

profile Monthly Salary: Not Disclosed
Posted on: 7 hours ago
Vacancies: 1 Vacancy

Job Summary

RESPONSABILIDADES E ATRIBUIÇÕES

  • Garantir a confiabilidade estabilidade desempenho e eficiência de custos das plataformas da Raiô atuando de forma próxima aos times de engenharia e produto.

  • Definir acompanhar e evoluir indicadores de confiabilidade e performance (SLIs/SLOs) estabelecendo alertas eficazes e rotinas de melhoria contínua.

  • Atuar na gestão de incidentes em produção conduzindo análise de causa raiz planos de correção e prevenção com foco em aprendizado e evolução do sistema.

  • Projetar implantar e evoluir práticas de observabilidade (logs métricas e rastreamento) promovendo maior previsibilidade e redução de tempo de resposta a falhas.

  • Desenvolver e manter automações e infraestrutura como código garantindo ambientes consistentes seguros e reprodutíveis.

  • Estruturar e evoluir práticas de operação: rotinas playbooks/runbooks gestão de mudanças revisão de indicadores e capacidade.

  • Liderar junto aos times de engenharia decisões técnicas e de arquitetura voltadas à resiliência escalabilidade e custo.

  • Promover melhorias contínuas em processos operacionais segurança disponibilidade e controle de custos em ambientes de nuvem.

  • Disseminar boas práticas de confiabilidade operação e engenharia elevando o nível técnico do time como um todo.

O que buscamos em você

  • Experiência sólida como SRE ou em funções equivalentes atuando diretamente com sistemas críticos em produção.

  • Domínio de ambientes em nuvem especialmente AWS e GCP incluindo redes balanceamento de carga controle de acesso monitoramento e serviços gerenciados.

  • Conhecimento consistente em sistemas distribuídos concorrência tolerância a falhas e estratégias de escalabilidade.

  • Experiência prática com monitoramento observabilidade e definição de indicadores técnicos voltados à confiabilidade e estabilidade.

  • Vivência com regime de plantão e condução de incidentes críticos em produção incluindo análise de causa raiz e acompanhamento de plano de ação.

  • Vivência com infraestrutura como código e automação de ambientes (ex.: Terraform CDK ou ferramentas equivalentes).

  • Experiência com pipelines de entrega contínua e estratégias seguras de implantação e rollback.

  • Capacidade de mentorar pessoas e elevar o padrão técnico e operacional do time.

  • Conhecimento em segurança aplicada à operação incluindo gestão de acessos segredos proteção de ambientes e boas práticas operacionais.

  • Capacidade analítica para tomar decisões baseadas em métricas técnicas e impacto no negócio.

  • Uso responsável de ferramentas de IA generativa para acelerar diagnóstico automações e qualidade sem comprometer segurança e confiabilidade.


O que você encontra na Raio:

Trabalhamos duro para criar um ambiente colaborativo e respeitoso.

Para cuidar de você preparamos:

  • Cartão Raio: R$1.00000/mês - Benefício Flexível;

  • Convênio Médico e Odontológico: Unimed Unipart ou Unimax;

  • Total Pass e WellHub: para cuidar do corpo e da mente;

  • Plataforma StarBem: para cuidado da saúde mental e bem-estar;

  • Clubes de descontos: NewValue e Vai de Visa (via cartão Raio);

  • 20 dias de recesso remunerado.

E aí pronto(a) para construir o futuro com a gente

RESPONSABILIDADES E ATRIBUIÇÕESGarantir a confiabilidade estabilidade desempenho e eficiência de custos das plataformas da Raiô atuando de forma próxima aos times de engenharia e produto.Definir acompanhar e evoluir indicadores de confiabilidade e performance (SLIs/SLOs) estabelecendo alertas eficaz...
View more view more

Key Skills

  • Kubernetes
  • FMEA
  • Continuous Improvement
  • Elasticsearch
  • Go
  • Root cause Analysis
  • Maximo
  • CMMS
  • Maintenance
  • Mechanical Engineering
  • Manufacturing
  • Troubleshooting