Ssr Site Reliability Engineer

Fecha: 7 abr 2026

Ubicación: Mexico, CMX, MX, 11000

Empresa: Scotiabank

 

 

 

ID de la solicitud: 257231

Programa de Referido de Empleados – Probable Pago: $0,00 

Estamos comprometidos en continuar invirtiendo en nuestros empleados y ayudarte a continuar desarrollando tu línea de carrera en Scotiabank.

 

 

Propósito

El Ingeniero de Site Reliability (SRE) tiene como propósito garantizar la disponibilidad, confiabilidad, escalabilidad y eficiencia operativa de los sistemas y servicios críticos de la organización, combinando prácticas de ingeniería de software con operaciones.

 

El SRE trabaja en estrecha colaboración con los equipos de desarrollo, operaciones y producto para implementar y fortalecer prácticas de observabilidad, gestión de incidentes, respuesta ante fallos, automatización y mejora continua, asegurando que los servicios cumplan con los acuerdos de nivel de servicio (SLA/SLO) establecidos y mantengan una experiencia de usuario óptima.

 

Asimismo, se encarga de detectar fallas en tiempo real, liderar la respuesta técnica inicial, automatizar tareas repetitivas, reducir el MTTR y proporcionar análisis basados en datos para prevenir incidentes futuros y mejorar continuamente la confiabilidad del entorno productivo.

 

Responsabilidades:

Disponibilidad y confiabilidad de servicios

 

  • Diseñar, implementar y mantener sistemas resilientes que cumplan con SLO/SLA.
  • Asegurar la operación 7x24 y la continuidad del servicio respetando error budgets.

Observabilidad y análisis (end‑to‑end)

 

  • Implementar y mantener observabilidad (métricas, logs, trazas) y alertas accionables.
  • Administrar dashboards y reglas de alerta en la plataforma de monitoreo utilizada.
  • Definir, medir y monitorear SLI/SLO por servicio.
  • Analizar tendencias y degradaciones con datos (queries de métricas, logs y trazas).

Gestión de incidentes y postmortems

 

  • Actuar como primer nivel técnico especializado: detección y diagnóstico inicial.

Coordinar la escalación y apoyar la resolución durante incidentes P1/P2.

 

  • Documentar y dar seguimiento a postmortems/RCA y planes de acción.
  • Reducir MTTR y prevenir reincidentes.

Confiabilidad, automatización y mejora continua

 

  • Aplicar prácticas SRE (toil reduction, automatización, release readiness, error budgets).

Automatizar tareas operativas (scripts, pipelines CI/CD, remedios).

  • Identificar y ejecutar optimización de arquitectura, rendimiento y costos.

 Gestión de capacidad y escalabilidad

 

  • Analizar tendencias de uso y crecimiento para anticipar necesidades de infraestructura.
  • Planificar y validar escalabilidad y performance de los servicios.

Colaboración transversal

  • Colaborar con Desarrollo, QA, Seguridad, Infraestructura y Producto desde el diseño.
  • Asegurar que los nuevos servicios cumplan estándares de observabilidad, mantenibilidad y confiabilidad antes del go‑live.

Seguridad y cumplimiento

 

  • Asegurar cumplimiento de políticas de seguridad, privacidad y normativas aplicables.
  • Colaborar en controles, evidencias y auditorías conforme a marcos internos.

Documentación técnica y cultura SRE

  • Mantener documentación clara y actualizada (arquitectura, procesos, runbooks, SLI/SLO, RCA).
  • Promover principios SRE y buenas prácticas dentro de los equipos relacionados.

 

Relaciones jerárquicas (solo nombres de puestos)Gerente principal:

(incluir al gerente secundario si es pertinente)

  • Sub Director Service Reliability Engineering (SRE)

Subordinados directos:

n/a

Subordinados compartidos (línea continua o punteada, según sea el caso):

  • n/a

 

 

 

  • Gestión de sistemas de alto volumen transaccional en operación 7x24.
  • Responsabilidad sobre la salud y disponibilidad del ecosistema productivo.
  • Generación de reportes ejecutivos de disponibilidad y desempeño.
  • Colaboración con equipos de TI locales y globales.
  • Mejora del proceso on-call.
  • Comprende la cultura de riesgo del Banco y cómo debe considerarse el apetito de riesgo en las actividades y decisiones diarias.
  • Garantiza el cumplimiento de los controles operativos y regulatorios aplicables.
  • Contribuye a la reducción del riesgo operativo, regulatorio, de lavado de dinero, financiamiento al terrorismo y riesgo de conducta.

 

Educación / Experiencia / Otra información (incluya solo aquellos que son específicos a la función)

  • Título universitario en Ingeniería en Sistemas, Computación, Telecomunicaciones o afín.
  • Nivel de inglés intermedio‑alto (oral y escrito).
  • 5+ años de experiencia en entornos productivos de alta disponibilidad y alto volumen transaccional (operación 7x24).
  • 3+ años en soporte a producción o roles relacionados con confiabilidad, operación o monitoreo.
  • 4+ años de experiencia en ingeniería de nube (AWS, GCP, Azure) o funciones equivalentes.
  • Experiencia en diseño, implementación y mantenimiento de SLI/SLO y prácticas SRE.
  • Experiencia con microservicios, cargas de trabajo basadas en contenedores y funciones.
  • Experiencia en diseño de arquitecturas resilientes, escalables y seguras.
  • Participación en gestión de incidentes complejos, diagnósticos detallados y análisis de causa raíz.
  • Capacidad probada para identificar proactivamente problemas, cuellos de botella y oportunidades de mejora.

 

En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al banco y nos comprometemos a crear y mantener un entorno inclusivo y accesible para todos. Todos/as los/las empleados deben cumplir con las políticas, normas, códigos y directrices del banco relacionadas con la no discriminación y las adaptaciones en el lugar de trabajo.Si necesitas algún tipo de adaptación en temas de accesibilidad durante el proceso, indícalo a nuestro equipo de Atracción de Talento**Scotiabank es una empresa incluyente, que respeta la diversidad y no hace ningún tipo de discriminación****Bajo ninguna circunstancia solicita pruebas de embarazo, ni de VIH**Agradecemos tu interés. Sin embargo, únicamente las personas seleccionadas para entrevista serán contactadas

 

Ubicación(s):  México : Ciudad de México : Cuauhtémoc

Scotiabank es un banco líder en las Américas. Inspirándonos en nuestro propósito corporativo, “por nuestro futuro”, ayudamos a nuestros clientes, sus familias y sus comunidades a lograr el éxito a través de una completa gama de asesoría, productos y servicios en los sectores de banca personal y comercial, gestión patrimonial, banca privada, corporativa y de inversión, y mercados de capital.

En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al Banco y nos hemos comprometido a crear y mantener un entorno inclusivo y accesible para todos. Si necesitas algún tipo de adaptación (como, por ejemplo, un lugar accesible para la entrevista, documentos en formato alternativo, un intérprete en lengua de señas o tecnología de asistencia, entre otras cosas) durante el proceso de reclutamiento y selección, indícalo a nuestro equipo de Reclutamiento. Si necesitas apoyo técnico, haz clic aquí. Los candidatos deben postularse directamente en línea si desean ser tomados en cuenta para este puesto. Agradecemos a todos los candidatos por su interés en esta oportunidad profesional en Scotiabank, pero solo nos comunicaremos con aquellos que hayan sido seleccionados para una entrevista.


Área de trabajo: Telecom, Telecommunications, Credit Analyst, Technical Support, Web Design, Technology, Finance, Creative