Arquitecto de infraestructuras IA
Resumen
Buscamos un/a Platform Monitoring Owner con experiencia en plataformas de monitorización basadas en Prometheus y Grafana, gestión de entornos con GPU, administración de plataformas Linux y contenedores Docker. La persona será responsable de la evolución de las plataformas de monitorización, alineando métricas técnicas con objetivos de negocio y liderando iniciativas de Capacity Planning, Infrastructure Lifecycle Management, Demand Forecasting y definición de la hoja de ruta de las plataformas.
Funciones
Monitorizar y analizar la utilización de GPU en diferentes clústeres mediante dashboards de Prometheus y Grafana.
Diseñar, mantener y evolucionar plataformas de monitorización y observabilidad.
Desarrollar y mantener modelos de capacidad para prever necesidades futuras de infraestructura.
Definir estrategias de escalado, renovación de hardware y optimización de costes.
Gestionar el ciclo de vida de la infraestructura y su alineación con las necesidades del negocio.
Realizar previsiones de demanda de proyectos y capacidad tecnológica.
Garantizar el cumplimiento de estándares de seguridad y fiabilidad en nodos Linux con GPU.
Coordinarse con equipos de ingeniería, compras y finanzas para alinear las decisiones de infraestructura con los objetivos corporativos.
Elaborar informes ejecutivos mensuales y trimestrales para dirección, incluyendo análisis de uso, previsiones de crecimiento e impacto de inversión.
Definir y ejecutar la hoja de ruta de evolución de las plataformas.
Requisitos imprescindibles
Mínimo 5 años de experiencia en posiciones similares.
Experiencia sólida con Prometheus y Grafana.
Conocimiento y experiencia en monitorización y gestión de infraestructuras con GPU.
Conocimientos avanzados de Linux.
Experiencia en Docker y entornos containerizados.
Experiencia en Capacity Planning, gestión de capacidad y previsión de demanda tecnológica.
Capacidad para transformar grandes volúmenes de datos en documentación e informes ejecutivos.
Experiencia presentando información a perfiles directivos y C-Level.
Nivel de inglés C1.
Nivel de francés C2.
- Ubicaciones
- Madrid
- Estado remoto
- Híbrido
Madrid
Lugar de trabajo y cultura
La clave es contar con un equipo humano extraordinariamente preparado y motivado, que renueva constantemente sus conocimientos, y que basa su trabajo en el diálogo continuo, la proximidad a nuestros clientes y l profesionalidad
Acerca de TECDATA ENGINEERING
TECDATA ENGINEERING es un proveedor líder de soluciones y servicios tecnológicos especializado en proyectos globales de tecnología avalado por su portfolio de servicios y productos enfocados a generar valor añadido, aumentar la ventaja competitiva y reducir costes para sus clientes. Estamos presentes en los sectores económicos más importantes: Banca, Telecomunicaciones, Seguros.