Arquitecto de Infraestructuras IA & Capacity Planning (GPU / Observabilidad)
📍 Ubicación
Madrid (modelo híbrido: 4 días/mes oficina)
🌐 Idiomas
Inglés: C1
Francés: C2
🎯 Objetivo del puesto
Se busca un perfil senior con experiencia en arquitectura de infraestructuras de alto rendimiento (IA / GPU) y gestión de plataformas de observabilidad y capacity planning, encargado de la evolución tecnológica de entornos críticos basados en Linux, Docker y clusters GPU.
El rol se centra en la planificación de capacidad, optimización de recursos, análisis de demanda y definición de roadmap de infraestructura alineado con negocio, más que en el desarrollo software tradicional.
🚀 Responsabilidades principales
🔹 Monitorización y Observabilidad
Diseño, mantenimiento y evolución de dashboards en Prometheus y Grafana.
Monitorización de uso de GPU en clusters de alto rendimiento.
Análisis continuo de métricas técnicas de rendimiento e инфраструктura.
🔹 Gestión de Infraestructura GPU
Supervisión de nodos Linux con GPU asegurando rendimiento, seguridad y estabilidad.
Control del ciclo de vida de la infraestructura (actualización, renovación, escalado).
Optimización del uso de recursos en entornos de computación intensiva.
🔹 Capacity Planning & Forecasting
Desarrollo de modelos de capacidad y predicción de demanda.
Análisis de consumo de recursos y proyección de crecimiento.
Recomendación de escalado, inversión y optimización de costes.
🔹 Alineamiento con negocio
Colaboración con equipos de negocio, finanzas, compras e ingeniería.
Traducción de métricas técnicas en impacto económico y estratégico.
Elaboración de reporting ejecutivo para dirección (C-level).
🔹 Reporting & Comunicación ejecutiva
Creación de informes mensuales y trimestrales.
Preparación de presentaciones estratégicas para comité de dirección.
Explicación de evolución de infraestructuras y necesidades futuras.
🛠️ Requisitos técnicos
Experiencia sólida con arquitecturas GPU y rendimiento en entornos de alto cómputo.
Administración de sistemas Linux.
Experiencia con Docker y contenedores.
Conocimiento avanzado de Prometheus y Grafana.
Capacidad para analizar grandes volúmenes de datos de infraestructura.
Experiencia en capacity planning y forecasting de recursos IT.
Habilidad para traducir datos técnicos en informes ejecutivos.
⭐ Competencias valoradas
Mentalidad analítica y orientada a optimización de recursos.
Experiencia en entornos HPC o infraestructuras cloud complejas.
Capacidad de trabajo transversal sin foco en desarrollo puro.
Experiencia en entornos de alta escala y rápido crecimiento.
Excelente comunicación con stakeholders técnicos y no técnicos.
💡 Perfil del candidato
Perfil senior, orientado a infraestructura, datos de rendimiento y estrategia tecnológica, con capacidad para actuar como puente entre tecnología, negocio y finanzas, liderando la evolución de plataformas críticas de IA y computación de alto rendimiento.
- Ubicaciones
- Madrid
- Estado remoto
- Híbrido
Madrid
Lugar de trabajo y cultura
La clave es contar con un equipo humano extraordinariamente preparado y motivado, que renueva constantemente sus conocimientos, y que basa su trabajo en el diálogo continuo, la proximidad a nuestros clientes y l profesionalidad
Acerca de TECDATA ENGINEERING
TECDATA ENGINEERING es un proveedor líder de soluciones y servicios tecnológicos especializado en proyectos globales de tecnología avalado por su portfolio de servicios y productos enfocados a generar valor añadido, aumentar la ventaja competitiva y reducir costes para sus clientes. Estamos presentes en los sectores económicos más importantes: Banca, Telecomunicaciones, Seguros.