Software Engineer – GPU Kernels

Baseten

San Francisco • Vor Ort • Mid-Level • vor 4 Tagen

Software Engineer backend-developer Data Engineer Software Engineer

Gehalt 270.000 EUR / Jahr

Auf einen Blick

GPU Kernel Engineer Position bei Baseten in San Francisco. Du wirst hochperformante Kernels für AI Inference Workloads entwerfen und optimieren.

💰 ~$180.000–250.000/Jahr (geschätzt) 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas

GPU-Architektur-Verständnis
C++ Proficiency
CUDA C++ API Wissen
Memory Patterns und Optimization

CUDA C++ GPU Architecture PTX Assembly Performance Optimization Kernel Development Transformer Optimization Quantization

Gehalt geschätzt anhand Typisches Gehalt für Senior GPU Kernel Engineer mit CUDA-Expertise und AI Focus. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für

Erfahrene C++ Engineers mit GPU Focus
Kandidaten mit CUDA und Kernel Development-Erfahrung
Personen mit Transformer/Attention Optimization Background

🚫 Weniger geeignet

Remote-Worker (Vor-Ort-Position)
Kandidaten ohne tiefes GPU-Architektur-Verständnis
Personen ohne C++ Expertise

💡 Gut zu wissen

Cutting-Edge GPU Optimization ist zentral
Transformer Kernel Optimization ist hochrelevant
Low-Level Performance Tuning erforderlich
Open-Source GPU Libraries und Community Involvement erwünscht

Über das Unternehmen

Baseten ist eine Plattform für Mission-Critical AI Inference, die von angesehenen KI-Unternehmen genutzt wird. Das Unternehmen erhielt kürzlich 300 Millionen Dollar in Serie E Finanzierung und konzentriert sich auf GPU Kernel Optimization für AI Workloads.

Deine Aufgaben

Entwerfe und implementiere hochperformante GPU Kernels für ML Operationen
Schreibe und optimiere Code mit CUDA, PTX Assembly und architekturspezifischen Techniken
Wende fortgeschrittene Performance Optimization Methoden an
Implementiere Cutting-Edge Features wie Quantization und Sparsity
Identifiziere und behebe Performance Bottlenecks
Trage zu internen und Open-Source GPU Bibliotheken bei

Deine Voraussetzungen

Starkes Verständnis der GPU-Architektur und Programmierungs-Paradigmen
Proficiency in C++ und GPU Performance Profiling Tools
Wissen von CUDA C++ API und Memory Patterns
Vertrautheit mit modernen GPU Features (Tensor Cores, Async Operations)
Bonus: Transformer Model und Attention Optimization Erfahrung
Bonus: GEMM Tuning und Distributed GPU Compute Erfahrung

Benefits

Wettbewerbsfähige Vergütung mit sinnvoller Beteiligung
100% Kranken-, Zahn- und Sehversicherung
Flexible PTO mit Company-weiter Winterpause
Bezahlter Elternurlaub
Fertility und Family-Building Stipendium

Über das Unternehmen

Deine Aufgaben

Deine Voraussetzungen

Benefits

Ähnliche Stellen durchsuchen

Weitere Stellen bei Baseten

Engineering Manager, Runtime Fabric

Integrated Marketing Manager

Engineering Manager – Forward Deployed Engineering (LLM)

Engineering Manager, Cloud Platform