Software Engineer – GPU Kernels

San Francisco Vor Ort Mid-Level vor 4 Tagen
Software Engineer backend-developer Data Engineer Software Engineer
Gehalt 270.000 EUR / Jahr
Auf einen Blick

GPU Kernel Engineer Position bei Baseten in San Francisco. Du wirst hochperformante Kernels für AI Inference Workloads entwerfen und optimieren.

💰 ~$180.000–250.000/Jahr (geschätzt) 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas
  • GPU-Architektur-Verständnis
  • C++ Proficiency
  • CUDA C++ API Wissen
  • Memory Patterns und Optimization
CUDA C++ GPU Architecture PTX Assembly Performance Optimization Kernel Development Transformer Optimization Quantization

Gehalt geschätzt anhand Typisches Gehalt für Senior GPU Kernel Engineer mit CUDA-Expertise und AI Focus. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für
  • Erfahrene C++ Engineers mit GPU Focus
  • Kandidaten mit CUDA und Kernel Development-Erfahrung
  • Personen mit Transformer/Attention Optimization Background
🚫 Weniger geeignet
  • Remote-Worker (Vor-Ort-Position)
  • Kandidaten ohne tiefes GPU-Architektur-Verständnis
  • Personen ohne C++ Expertise
💡 Gut zu wissen
  • Cutting-Edge GPU Optimization ist zentral
  • Transformer Kernel Optimization ist hochrelevant
  • Low-Level Performance Tuning erforderlich
  • Open-Source GPU Libraries und Community Involvement erwünscht

Über das Unternehmen

Baseten ist eine Plattform für Mission-Critical AI Inference, die von angesehenen KI-Unternehmen genutzt wird. Das Unternehmen erhielt kürzlich 300 Millionen Dollar in Serie E Finanzierung und konzentriert sich auf GPU Kernel Optimization für AI Workloads.

Deine Aufgaben

  • Entwerfe und implementiere hochperformante GPU Kernels für ML Operationen
  • Schreibe und optimiere Code mit CUDA, PTX Assembly und architekturspezifischen Techniken
  • Wende fortgeschrittene Performance Optimization Methoden an
  • Implementiere Cutting-Edge Features wie Quantization und Sparsity
  • Identifiziere und behebe Performance Bottlenecks
  • Trage zu internen und Open-Source GPU Bibliotheken bei

Deine Voraussetzungen

  • Starkes Verständnis der GPU-Architektur und Programmierungs-Paradigmen
  • Proficiency in C++ und GPU Performance Profiling Tools
  • Wissen von CUDA C++ API und Memory Patterns
  • Vertrautheit mit modernen GPU Features (Tensor Cores, Async Operations)
  • Bonus: Transformer Model und Attention Optimization Erfahrung
  • Bonus: GEMM Tuning und Distributed GPU Compute Erfahrung

Benefits

  • Wettbewerbsfähige Vergütung mit sinnvoller Beteiligung
  • 100% Kranken-, Zahn- und Sehversicherung
  • Flexible PTO mit Company-weiter Winterpause
  • Bezahlter Elternurlaub
  • Fertility und Family-Building Stipendium