DescriptionBuscamos uma liderança técnica e estratégica para orquestrar as frentes de SRE ITSM e Sustentação (Sustaining). Seu desafio será garantir a estabilidade do ambiente tecnológico resiliência da nossa infraestrutura e liderar a criação de um Command Center de alta performance utilizando indicadores de Observabilidade e métricas DORA para elevar a maturidade da nossa operação.
Responsibilities- Liderança de Times: Gerir e desenvolver times multidisciplinares promovendo uma cultura de alta performance e colaboração.
- Gestão de Infraestrutura Cloud: Coordenar e otimizar nosso ambiente AWS garantindo escalabilidade segurança e eficiência de custos (FinOps).
- Implantação de Command Center: Desenvolver e gerenciar uma central de monitoramento em tempo real integrando alertas preditivos e painéis de controle.
- Cultura de Observabilidade: Implementar estratégias de logging tracing e metrics para reduzir o MTTR (tempo médio de recuperação) e antecipar falhas.
- Métricas de Performance: Monitorar e reportar os indicadores DORA (Deployment Frequency Lead Time for Changes Change Failure Rate Time to Restore Service).
- Liderança Técnica: Orientar a equipe técnica promovendo a automação de processos (IaC - Terraform/CloudFormation) e eliminando gargalos operacionais.
- Gestão de Incidentes: Atuar como ponto focal em crises técnicas e conduzir post-mortems para melhoria contínua.
- Sustentação (Ops): Gerenciar a operação de sistemas críticos garantindo a resiliência da infraestrutura e a resolução ágil de débitos técnicos.
- Gestão de Stakeholders: Atuar como facilitador entre as áreas de negócio e técnica comunicando riscos prazos e resultados de forma clara.
Prerequisites- Experiência sólida em liderança de times de tecnologia.
- Experiência sólida em arquitetura e administração de AWS (EC2 RDS Lambda EKS etc.).
- Domínio de ferramentas de Observabilidade (Ex: Datadog).
- Conhecimento profundo em Infraestrutura como Código (IaC).
- Experiência com esteiras de CI/CD e automação.
- Familiaridade com conceitos de SRE (Site Reliability Engineering) e níveis de serviço (SLIs/SLOs).
- Formação em Ciência da Computação Engenharia Sistemas de Informação ou áreas correlatas.
- Visão Analítica: Capacidade de transformar dados técnicos em indicadores de negócio para reportar à gerência.
- Adaptabilidade e colaboração: Habilidade para liderar o time em momentos de instabilidade sistêmica.
- Comunicação assertiva: Habilidade para traduzir termos técnicos complexos em atualizações claras para os stakeholders.
ExperiencesInformações adicionais:
Modelo de Trabalho: Híbrido (2x Presencial e 3x remoto)
Jornada: 7h30/dia
Regime de Contratação: CLT
Local: Pinheiros/SP
DescriptionBuscamos uma liderança técnica e estratégica para orquestrar as frentes de SRE ITSM e Sustentação (Sustaining). Seu desafio será garantir a estabilidade do ambiente tecnológico resiliência da nossa infraestrutura e liderar a criação de um Command Center de alta performance utilizando indi...
DescriptionBuscamos uma liderança técnica e estratégica para orquestrar as frentes de SRE ITSM e Sustentação (Sustaining). Seu desafio será garantir a estabilidade do ambiente tecnológico resiliência da nossa infraestrutura e liderar a criação de um Command Center de alta performance utilizando indicadores de Observabilidade e métricas DORA para elevar a maturidade da nossa operação.
Responsibilities- Liderança de Times: Gerir e desenvolver times multidisciplinares promovendo uma cultura de alta performance e colaboração.
- Gestão de Infraestrutura Cloud: Coordenar e otimizar nosso ambiente AWS garantindo escalabilidade segurança e eficiência de custos (FinOps).
- Implantação de Command Center: Desenvolver e gerenciar uma central de monitoramento em tempo real integrando alertas preditivos e painéis de controle.
- Cultura de Observabilidade: Implementar estratégias de logging tracing e metrics para reduzir o MTTR (tempo médio de recuperação) e antecipar falhas.
- Métricas de Performance: Monitorar e reportar os indicadores DORA (Deployment Frequency Lead Time for Changes Change Failure Rate Time to Restore Service).
- Liderança Técnica: Orientar a equipe técnica promovendo a automação de processos (IaC - Terraform/CloudFormation) e eliminando gargalos operacionais.
- Gestão de Incidentes: Atuar como ponto focal em crises técnicas e conduzir post-mortems para melhoria contínua.
- Sustentação (Ops): Gerenciar a operação de sistemas críticos garantindo a resiliência da infraestrutura e a resolução ágil de débitos técnicos.
- Gestão de Stakeholders: Atuar como facilitador entre as áreas de negócio e técnica comunicando riscos prazos e resultados de forma clara.
Prerequisites- Experiência sólida em liderança de times de tecnologia.
- Experiência sólida em arquitetura e administração de AWS (EC2 RDS Lambda EKS etc.).
- Domínio de ferramentas de Observabilidade (Ex: Datadog).
- Conhecimento profundo em Infraestrutura como Código (IaC).
- Experiência com esteiras de CI/CD e automação.
- Familiaridade com conceitos de SRE (Site Reliability Engineering) e níveis de serviço (SLIs/SLOs).
- Formação em Ciência da Computação Engenharia Sistemas de Informação ou áreas correlatas.
- Visão Analítica: Capacidade de transformar dados técnicos em indicadores de negócio para reportar à gerência.
- Adaptabilidade e colaboração: Habilidade para liderar o time em momentos de instabilidade sistêmica.
- Comunicação assertiva: Habilidade para traduzir termos técnicos complexos em atualizações claras para os stakeholders.
ExperiencesInformações adicionais:
Modelo de Trabalho: Híbrido (2x Presencial e 3x remoto)
Jornada: 7h30/dia
Regime de Contratação: CLT
Local: Pinheiros/SP
View more
View less