Auf einen Blick
GPU Kernel Engineer Position bei Baseten in San Francisco. Du wirst hochperformante Kernels für AI Inference Workloads entwerfen und optimieren.
💰 ~$180.000–250.000/Jahr (geschätzt)
📊 Senior
🕒 Vollzeit
🌍 Vor Ort
🗺️ Americas
- GPU-Architektur-Verständnis
- C++ Proficiency
- CUDA C++ API Wissen
- Memory Patterns und Optimization
CUDA
C++
GPU Architecture
PTX Assembly
Performance Optimization
Kernel Development
Transformer Optimization
Quantization
Gehalt geschätzt anhand Typisches Gehalt für Senior GPU Kernel Engineer mit CUDA-Expertise und AI Focus. Kein Gehalt in der Anzeige angegeben.
✅ Geeignet für
- Erfahrene C++ Engineers mit GPU Focus
- Kandidaten mit CUDA und Kernel Development-Erfahrung
- Personen mit Transformer/Attention Optimization Background
🚫 Weniger geeignet
- Remote-Worker (Vor-Ort-Position)
- Kandidaten ohne tiefes GPU-Architektur-Verständnis
- Personen ohne C++ Expertise
💡 Gut zu wissen
- Cutting-Edge GPU Optimization ist zentral
- Transformer Kernel Optimization ist hochrelevant
- Low-Level Performance Tuning erforderlich
- Open-Source GPU Libraries und Community Involvement erwünscht
Über das Unternehmen
Baseten ist eine Plattform für Mission-Critical AI Inference, die von angesehenen KI-Unternehmen genutzt wird. Das Unternehmen erhielt kürzlich 300 Millionen Dollar in Serie E Finanzierung und konzentriert sich auf GPU Kernel Optimization für AI Workloads.
Deine Aufgaben
- Entwerfe und implementiere hochperformante GPU Kernels für ML Operationen
- Schreibe und optimiere Code mit CUDA, PTX Assembly und architekturspezifischen Techniken
- Wende fortgeschrittene Performance Optimization Methoden an
- Implementiere Cutting-Edge Features wie Quantization und Sparsity
- Identifiziere und behebe Performance Bottlenecks
- Trage zu internen und Open-Source GPU Bibliotheken bei
Deine Voraussetzungen
- Starkes Verständnis der GPU-Architektur und Programmierungs-Paradigmen
- Proficiency in C++ und GPU Performance Profiling Tools
- Wissen von CUDA C++ API und Memory Patterns
- Vertrautheit mit modernen GPU Features (Tensor Cores, Async Operations)
- Bonus: Transformer Model und Attention Optimization Erfahrung
- Bonus: GEMM Tuning und Distributed GPU Compute Erfahrung
Benefits
- Wettbewerbsfähige Vergütung mit sinnvoller Beteiligung
- 100% Kranken-, Zahn- und Sehversicherung
- Flexible PTO mit Company-weiter Winterpause
- Bezahlter Elternurlaub
- Fertility und Family-Building Stipendium