Administrador(a) de sistemas, DevOps para HPC, BigData y ML/DL
- Donostia / San Sebastián
Administrador de sistemas, DevOps para HPC, BigData y ML/DL
Buscamos una persona motivada, con experiencia demostrada en la gestión de sistemas TI y Cloud, para formar parte de un equipo dedicado al diseño y puesta en marcha de un sistema de cálculo común para toda la organización dedicada al soporte de los proyectos de investigación. De esta forma se pretende cubrir de forma más eficiente y democrática las necesidades de cómputo de los investigadores de la organización, además de ser más eficiente desde el punto de vista de gestión y mantenimiento de los recursos.
Se pretende que el candidato tenga conocimientos y experiencia para gestionar en base a buenas prácticas, la configuración, mantenimiento, actualización y monitorización del sistema de cálculo en dos niveles: (1) La Infraestructura hardware de HPC, Inteligencia Artificial y Big Data, que incluye clústeres locales de máquinas que usan la última tecnología GPU y otros entornos hardware para el entrenamiento, test e inferencia de modelos de Deep Learning, almacenamiento distribuido y CI/CD. (2) La plataforma software que proporciona aplicaciones y servicios que permitan desarrollar el trabajo de investigación de forma eficiente, además simplificar las operaciones de integración, mantenimiento y monitorización. Otros objetivos estarán ligados a la participación activa en los proyectos de investigación como soporte y apoyo a los investigadores en la implantación de las tecnologías emergentes e innovadoras.
Los candidatos deberán mostrar una actitud proactiva hacia la solución de problemas, capacidades excelentes de tecnologías de la información (TI), trabajo en equipo y compromiso con la compresión de las necesidades de los compañeros. Los candidatos deberán tener también las habilidades necesarias en tecnologías cloud, devops y sistemas, especialmente sistemas distribuidos de cómputo y almacenamiento, escalabilidad y seguridad. Se valorará el conocimiento en procesos de machine learning y el procesamiento general de datos
Las personas aspirantes deben tener:
Educación: Al menos, máster en computer science o telecomunicaciones
Experiencia: Buscamos un Ingeniero/a versátil con experiencia demostrable en las siguientes áreas:
- Experiencia en entornos Linux (gestión de usuario, scripting, gestión de servicios, monitorización y ajuste de procesos)
- Experiencia en configuración de redes (monitorización de tráfico en redes de comunicación y seguridad)
- Sistemas de almacenamiento distribuidos (BeeGFS, Lustre, Ceph, configuración NAS)
- Sistema de programación de trabajos HPC: Slurm
- Tecnologías de contenerización: Docker
- Microservicios y tecnologías de orquestación: Kubernetes
- Herramientas CI/CD: GitLab
Valoramos que las candidaturas cuenten con:
Se valorará positivamente:
- Experiencia en arquitecturas HPC, servidores GPU, data-driven architectures, almacenamiento distribuido
- Soluciones de virtualización bare-metal: Proxmox, MAAS, OpenStack
- Implementación de sistemas Big Data y BBDD: Kafka, PostgreSQL, Spark, MongoDB, Cassandra
- Herramientas de automatización de la configuración: Ansible, Puppet,…
- Conocimiento de diferentes proveedores de servicios cloud y sus ofertas de servicio (p. ej. IaaS, PaaS): Amazon Web Services, Google Cloud Platform, Microsoft Azure
- Infraestructuras definidas por código: p. ej. AWS CloudFormation, Terraform
- MLOPs y herramientas de gestión del workflow de IA: Airflow, Kubeflow, etc.
Ofrecemos:
Se considerarán tareas y responsabilidades:
- Evaluar la infraestructura de HW existente (centrado en servidores GPU, servidores de archivos y redes), identificar las necesidades y participar en el proceso de diseño de modernización del sistema
- Deducir las necesidades HW futuras
- Ayudar en la implementación de plataforma HCP interna (colaborar con consultores externos del centro)
- Mantener, actualizar y dar soporte al HPC interno
- Implementar buenas prácticas en CI/CD y MLOps
- Desarrollo de middleware para MLOps
- Dar soporte/consultoría para la implementación de MLOps para terceros, en clouds/clústeres privados o públicos
Ofrecemos
Incorporación a un centro dinámico, innovador y líder en los sectores de Computer Graphics, Visual Computing y Multimedia, Análisis de Datos a nivel nacional y europeo.