Auf einen Blick
Performance Engineer für KI-Trainings-Systeme bei Cohere. Spezialisierung auf GPU-Optimization und Kernel-Entwicklung mit JAX, PyTorch und CUDA.
💰 ~$150.000–220.000/Jahr (geschätzt)
📊 Senior
🕒 Vollzeit
🌍 Remote
🗺️ EMEA
- CUDA und Triton Kernel-Erfahrung
- JAX oder PyTorch Proficiency
- Großflächiges Trainings-Verständnis
- Starke Software-Engineering-Fähigkeiten
CUDA
Triton
Python
JAX
PyTorch
GPU Optimization
Machine Learning
Distributed Systems
Gehalt geschätzt anhand Senior Performance Engineer mit Kernel-Spezialisierung für KI-Training. Kein Gehalt in der Anzeige angegeben.
✅ Geeignet für
- GPU/CUDA-spezialisierte Ingenieure
- ML Systems Engineers
- Performance-Optimierer
🚫 Weniger geeignet
- Frontend-Entwickler
- Business-Analysten ohne Systems-Erfahrung
💡 Gut zu wissen
- Erforderlich: Tiefe Kernel-Programmierung und GPU-Erfahrung
- ML-Framework-Proficiency (JAX oder PyTorch) essentiell
- Team läuft zwischen ET und CET — Zeitzonen-Alignment wichtig
Über das Unternehmen
Cohere entwickelt Sprachmodelle und KI-Systeme mit Fokus auf effiziente und zuverlässige Verarbeitung natürlicher Sprache.
Deine Aufgaben
- Trainings-Performance optimieren und Durchsatzmetriken verbessern
- High-Performance-Software für Sprachmodell-Training entwickeln
- CUDA und Triton Kernels schreiben für GPU-Beschleuniger
- Mit Supercompute- und Daten-Infrastruktur arbeiten und Experimente durchführen
- Mit Top-Forschern zusammenarbeiten und von ihnen lernen
Deine Voraussetzungen
- Extrem starke Software-Engineering-Fähigkeiten
- Python und ML-Frameworks (JAX, PyTorch, XLA/MLIR)
- Erfahrung mit GPU-Kernels (CUDA, Triton)
- Erfahrung mit verteiltem großflächigem Training
Benefits
- Offene und inklusive Arbeitskultur
- Arbeit am Forschungsvorderrand der KI
- Kostenlose Gesundheit und zahnärztliche Vorsorge
- 6 Wochen Urlaub und Familienurlaub-Bonus