Auf einen Blick
Baue und optimiere Large-Scale Video-Generierungsmodelle für Echtzeit-Charaktere: Training, Distillation, Inference-Optimierung und Product-Integration – von Research bis Produktion.
💰 €190.000–225.000/Jahr
📊 Senior
🕒 Vollzeit
🌍 Remote
🗺️ EMEA
- 2+ Jahre ML-Systems-Shipping
- PyTorch und Python Expertise
- Video-Generierungsmodelle
- Distributed Training (DDP/FSDP)
pytorch
python
diffusion-models
video-generation
distributed-training
ml-optimization
Angegeben: €190.000–225.000/Jahr · Marktschätzung: ~€190.000–225.000/Jahr.
✅ Geeignet für
- ML Engineers mit Generative-Modelle-Background
- Video/Diffusion Spezialisten
- System-Optimierer die Production kennen
🚫 Weniger geeignet
- Pure Research Scientists ohne Produktions-Shipping-Erfahrung
- Engineers auf Anfänger-Level
- Kandidaten unkomfortabel mit Trade-offs und Constraints
💡 Gut zu wissen
- Remote in Europa innerhalb GMT ±2 Stunden erforderlich
- 60–75 % Training/Fine-Tuning, 15–25 % Inference Optimization, 10–15 % Prototyping
- Bonus: Multimodal Conditioning, End-to-End Distillation, Acceleration Toolchains
Über das Unternehmen
Cantina Labs entwickelt fortschrittliche KI-Modelle, die Echtzeit-Video-Generierung für interaktive Charaktere ermöglichen.
Deine Aufgaben
- Trainiere und skaliere Video-Generierungsmodelle: Führe Large-Scale Training über Multi-GPU Setups durch, owne Training-Loop, Checkpoints und Iterations-Speed
- Owne Daten für Video-Modellierung: Baue und verbessere Video-Datasets, Sampling, Filtering und Speicherung
- Distilliere und komprimiere große Modelle in schnelle: Teacher-Student Distillation, Step-Reduktion, Architektur-Vereinfachung
- Mache Modelle Real-Time-fähig: Profiling, Memory Optimizations, Quantization, Kernel-Verbesserungen
- Baue die Brücke zu Product: Verpacke Modelle in Inference APIs und Prototypen
- Evaluiere was zählt: Perceptual Quality, Temporal Consistency, Identity Fidelity, Latenz/Kosten
Deine Voraussetzungen
- 2+ Jahre Building und Shipping von ML-Systemen mit klarem Ownership und Delivery
- Starkes PyTorch und Python, komfortabel mit Training und Inference Code
- Hands-On Erfahrung mit Generative Models Training, ideally Video Generation (Diffusion/Transformers/VAEs)
- Erfahrung mit Distributed Training (DDP/FSDP/DeepSpeed-Style)
- Bewiesene Fähigkeit, Performance zu verbessern: Latenz/Memory/Cost Optimierungen
- Product Mindset: Übergang von Research → Implementation → Iterationen gegen echte Constraints
Benefits
- Competitive Gehalt und großzügige Equity
- Medizin-, Zahn- und Sehversicherung
- 42 Tage bezahlter Urlaub
- Parental Leave und Fertility Support
- 401(k) Altersversorgungsplan