En Keppri los seres humanos son el núcleo de nuestro desarrollo tecnológico.
Somos una compañía enfocada en el ciclo de productos digitales con amplia experiencia en los sectores financiero e inmobiliario. Si buscas un entorno donde el desarrollo personal y profesional es una prioridad esta oportunidad es para ti.
Champion de Observabilidad (Cloud / SRE / Plataforma)
Serás responsable de liderar y evangelizar la estrategia de observabilidad end-to-end para un cliente del sector financiero (banca) asegurando visibilidad completa sobre sus productos y capacidades digitales (APIs microservicios integraciones transacciones autorizaciones etc.).
Tu misión será que los equipos puedan detectar diagnosticar y resolver incidentes más rápido mejorar el performance y operar con métricas claras de confiabilidad (SLO/SLI) impulsando una cultura de mejora continua basada en datos.
Este rol requiere liderazgo transversal (sin necesidad de tener equipo directo): influirás en arquitectura desarrollo DevOps/SRE seguridad y operación.
Definir estándares y buenas prácticas de observabilidad: métricas logs y
trazas
(naming tags/labels cardinalidad convenciones).Diseñar el modelo de madurez de observabilidad y el roadmap de adopción por
equipos y dominios.Diseñar/implementar la plataforma de observabilidad en nube
(preferiblemente
AWS) integrando servicios y herramientas (APM logging tracing alerting).Asegurar observabilidad para EKS/Kubernetes Lambda API Gateway
servicios gestionados y workloads híbridos si aplica.Liderar la instrumentación de aplicaciones y plataformas con OpenTelemetry
(y/o agentes APM) promoviendo tracing distribuido correlación
(traceId/correlationId) y propagación de contexto.Asegurar que la observabilidad esté incorporada desde el diseño (no como
afterthought).Definir y operacionalizar SLIs/SLOs por servicio y journey crítico (ej.
autenticación pagos autorizaciones transferencias).Diseñar alertas accionables reducir alert fatigue y mejorar la señal vs ruido.
Estandarizar runbooks tableros (dashboards) y prácticas de postmortems /
RCA.Impulsar aprendizaje continuo: tendencias capacity/performance
degradaciones silenciosas análisis de causa raíz.Facilitar workshops guías y acompañamiento a squads para acelerar adopción.
Traducir datos técnicos a impacto de negocio: disponibilidad latencia
experiencia del usuario riesgos operativos.5 años de experiencia en roles como SRE DevOps Plataforma Arquitectura
de Software o Ingeniería de Producción (con foco en confiabilidad).Experiencia sólida implementando observabilidad en entornos cloud-native
(microservicios contenedores Kubernetes).Conocimiento práctico de conceptos y frameworks:
Observabilidad: métricas logs trazas APM profiling (ideal).
SRE: SLI/SLO error budgets gestión de incidentes postmortems.
Experiencia con herramientas (no necesitas todas pero sí base sólida en varias):
OpenTelemetry (deseable fuerte)
Prometheus / Grafana
ELK/EFK / OpenSearch o plataformas de logs equivalentes
APMs como Datadog / New Relic / Dynatrace / Splunk (o similares)
En AWS: CloudWatch X-Ray (deseable) y/o servicios administrados
relacionadosAutomatización e Infraestructura como Código: Terraform / CloudFormation
(deseable).Capacidad para comunicar y alinear: explicar decisiones técnicas a
stakeholders
no técnicos influir sin autoridad formal.Experiencia en entornos de desarrollo ágil y colaboración con múltiples equipos.
Experiencia en ecosistemas bancarios/financieros (alta transaccionalidad
auditoría compliance disponibilidad).Conocimiento de prácticas FinOps aplicadas a observabilidad (costo de
métricas/logs retención muestreo).Service mesh (Istio/Linkerd) eBPF/observabilidad avanzada chaos engineering.
Salario competitivo acorde a tu experiencia.
Desarrollo profesional: apoyo para formación/certificaciones.
Bonificaciones por desempeño.
Un ambiente centrado en tu crecimiento humano y profesional.
Proyectos retadores con impacto real en confiabilidad operación y
experiencia de cliente.Si estás listo para impulsar una cultura de observabilidad elevar la confiabilidad de plataformas críticas y liderar la transformación operativa basada en datos únete a Keppri!