This is a remote position.
SOBRE LAYER7
En Layer7 estamos construyendo tecnología en hiperescala donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos retailers y grandes empresas.
Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.
Aquí cultivamos una cultura de alto rendimiento curiosidad técnica y camaradería real con espacio para crecer aprender y mantener un balance sano entre vida
personal y profesional.
Si disfrutas resolver problemas difíciles diseñar sistemas que escalan sin límites y atreverte a innovar con impacto este es tu lugar.
Objetivo del puesto
Diseñar e implementar estrategias de observabilidad resiliencia y confiabilidad que aseguren la continuidad operativa de las plataformas de comunicación y datos de Layer7.
Responsabilidades principales
Diseñar e implementar el sistema de monitoreo y alertas centralizadas (la alerta debe llegar al sistema no al cliente).
Definir métricas de confiabilidad (SLOs SLIs SLAs) y garantizar su cumplimiento.
Analizar y prevenir incidentes de disponibilidad identificando patrones y causas raíz.
Colaborar con DevOps y Data para diseñar arquitecturas que sean resilientes por diseño.
Documentar runbooks dashboards y protocolos de respuesta a incidentes.
Liderar revisiones postmortem con foco en mejora continua y aprendizaje organizacional.
Requirements
Ingeniero en sistemas o afin
5 años de experiencia en entornos de alta disponibilidad
Dominio de herramientas de observabilidad (Datadog Prometheus Grafana Kibana)
Conocimiento sólido de automatización despliegues y cloud.
Pensamiento sistémico y habilidad para construir cultura operativa no solo mantener infraestructura.
Benefits
- Salario competitivo
- Empleo 100% Remoto. Postúlate independientemente del país donde vivas.
- Ambiente de trabajo dinámico y colaborativo
Required Skills:
SRE Datadog Prometheus Grafana Kibana
Required Education:
Ingeniero en sistemas o afín
This is a remote position.SOBRE LAYER7En Layer7 estamos construyendo tecnología en hiperescala donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos retailers y grandes empresas. Somos más de 100 profesionales apasionados enfrentando problemas de...
This is a remote position.
SOBRE LAYER7
En Layer7 estamos construyendo tecnología en hiperescala donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos retailers y grandes empresas.
Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.
Aquí cultivamos una cultura de alto rendimiento curiosidad técnica y camaradería real con espacio para crecer aprender y mantener un balance sano entre vida
personal y profesional.
Si disfrutas resolver problemas difíciles diseñar sistemas que escalan sin límites y atreverte a innovar con impacto este es tu lugar.
Objetivo del puesto
Diseñar e implementar estrategias de observabilidad resiliencia y confiabilidad que aseguren la continuidad operativa de las plataformas de comunicación y datos de Layer7.
Responsabilidades principales
Diseñar e implementar el sistema de monitoreo y alertas centralizadas (la alerta debe llegar al sistema no al cliente).
Definir métricas de confiabilidad (SLOs SLIs SLAs) y garantizar su cumplimiento.
Analizar y prevenir incidentes de disponibilidad identificando patrones y causas raíz.
Colaborar con DevOps y Data para diseñar arquitecturas que sean resilientes por diseño.
Documentar runbooks dashboards y protocolos de respuesta a incidentes.
Liderar revisiones postmortem con foco en mejora continua y aprendizaje organizacional.
Requirements
Ingeniero en sistemas o afin
5 años de experiencia en entornos de alta disponibilidad
Dominio de herramientas de observabilidad (Datadog Prometheus Grafana Kibana)
Conocimiento sólido de automatización despliegues y cloud.
Pensamiento sistémico y habilidad para construir cultura operativa no solo mantener infraestructura.
Benefits
- Salario competitivo
- Empleo 100% Remoto. Postúlate independientemente del país donde vivas.
- Ambiente de trabajo dinámico y colaborativo
Required Skills:
SRE Datadog Prometheus Grafana Kibana
Required Education:
Ingeniero en sistemas o afín
View more
View less