Member of Technical Staff, Real-Time Video Generation

Europe Vor Ort Lead vor 7 Tagen
AI Data Science Software Engineer
Auf einen Blick

Baue und optimiere Large-Scale Video-Generierungsmodelle für Echtzeit-Charaktere: Training, Distillation, Inference-Optimierung und Product-Integration – von Research bis Produktion.

💰 €190.000–225.000/Jahr 📊 Senior 🕒 Vollzeit 🌍 Remote 🗺️ EMEA
  • 2+ Jahre ML-Systems-Shipping
  • PyTorch und Python Expertise
  • Video-Generierungsmodelle
  • Distributed Training (DDP/FSDP)
pytorch python diffusion-models video-generation distributed-training ml-optimization

Angegeben: €190.000–225.000/Jahr · Marktschätzung: ~€190.000–225.000/Jahr.

✅ Geeignet für
  • ML Engineers mit Generative-Modelle-Background
  • Video/Diffusion Spezialisten
  • System-Optimierer die Production kennen
🚫 Weniger geeignet
  • Pure Research Scientists ohne Produktions-Shipping-Erfahrung
  • Engineers auf Anfänger-Level
  • Kandidaten unkomfortabel mit Trade-offs und Constraints
💡 Gut zu wissen
  • Remote in Europa innerhalb GMT ±2 Stunden erforderlich
  • 60–75 % Training/Fine-Tuning, 15–25 % Inference Optimization, 10–15 % Prototyping
  • Bonus: Multimodal Conditioning, End-to-End Distillation, Acceleration Toolchains

Über das Unternehmen

Cantina Labs entwickelt fortschrittliche KI-Modelle, die Echtzeit-Video-Generierung für interaktive Charaktere ermöglichen.

Deine Aufgaben

  • Trainiere und skaliere Video-Generierungsmodelle: Führe Large-Scale Training über Multi-GPU Setups durch, owne Training-Loop, Checkpoints und Iterations-Speed
  • Owne Daten für Video-Modellierung: Baue und verbessere Video-Datasets, Sampling, Filtering und Speicherung
  • Distilliere und komprimiere große Modelle in schnelle: Teacher-Student Distillation, Step-Reduktion, Architektur-Vereinfachung
  • Mache Modelle Real-Time-fähig: Profiling, Memory Optimizations, Quantization, Kernel-Verbesserungen
  • Baue die Brücke zu Product: Verpacke Modelle in Inference APIs und Prototypen
  • Evaluiere was zählt: Perceptual Quality, Temporal Consistency, Identity Fidelity, Latenz/Kosten

Deine Voraussetzungen

  • 2+ Jahre Building und Shipping von ML-Systemen mit klarem Ownership und Delivery
  • Starkes PyTorch und Python, komfortabel mit Training und Inference Code
  • Hands-On Erfahrung mit Generative Models Training, ideally Video Generation (Diffusion/Transformers/VAEs)
  • Erfahrung mit Distributed Training (DDP/FSDP/DeepSpeed-Style)
  • Bewiesene Fähigkeit, Performance zu verbessern: Latenz/Memory/Cost Optimierungen
  • Product Mindset: Übergang von Research → Implementation → Iterationen gegen echte Constraints

Benefits

  • Competitive Gehalt und großzügige Equity
  • Medizin-, Zahn- und Sehversicherung
  • 42 Tage bezahlter Urlaub
  • Parental Leave und Fertility Support
  • 401(k) Altersversorgungsplan