Junior ML Infrastructure Engineer

GPU Solutions • Spain, community of madrid, Spain • Posted June 06, 2026

Location Spain, community of madrid

Job Type Full-time

Category Other-General

Posted June 06, 2026

Sobre nosotros  En GPU Solutions operamos infraestructura de cómputo de última generación, incluyendo NVIDIA B200, para servir modelos de IA en producción. Somos un equipo pequeño donde cada persona tiene impacto directo sobre el producto y las decisiones técnicas. 

El puesto  Buscamos a alguien al inicio de su carrera con ganas de especializarse en inference serving  sobre hardware top de gama. Vas a trabajar mano a mano con modelos de lenguaje y visión grandes, desplegándolos, optimizándolos y midiendo su rendimiento sobre B200. No te vamos a pedir que llegues sabiéndolo todo: te vamos a pedir que aprendas rápido y traigas iniciativa. 

Qué harás  Desplegar y servir modelos (LLMs, VLMs, modelos de difusión) usando frameworks como vLLM, TensorRT-LLM, SGLang o Triton Inference Server. Optimizar latencia y throughput mediante cuantización (FP8, INT4), batching dinámico y paralelismo de tensor...

Interested in this role?

Click the button below to start your application.

Apply Now