Principal Systems Software Engineer

San Francisco, CA - US On-site Lead 13 days ago
Software Engineer backend-developer DevOps Software Engineer
Auf einen Blick

Principal Systems Engineer für Crusoe's Next-Generation KI-Infrastruktur gesucht. Dies ist eine Experten-Rolle für Hyperscale-Profis mit 12+ Jahren Kern-Infrastruktur-Erfahrung bei hyperscalers oder HPC-Clouds.

💰 ~$300.000–380.000/Jahr (geschätzt) 📊 Lead 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas
  • 12+ Jahre Hyperscale-Infrastruktur
  • Linux-Kernel-Expertise
  • Virtualisierungs-Tiefe
  • High-Performance-Netzwerk
Linux Kernel Virtualisierung RDMA KVM Kubernetes Slurm GPU-Architekturen Systems Design

Gehalt geschätzt anhand Principal-Level Infrastruktur-Ingenieur mit 12+ Jahren Hyperscale-Erfahrung und Publikationen/Patents in den USA. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für
  • Hyperscale-Infrastruktur-Architekten
  • Senior Linux-/Kernel-Ingenieure mit HPC-Erfahrung
  • R&D-Leads aus Major Cloud-Anbietern
🚫 Weniger geeignet
  • Kandidaten unter 12 Jahren Erfahrung
  • Personen ohne Linux-Kernel-Tiefe
  • Remote-Arbeitende – On-site erforderlich
💡 Gut zu wissen
  • Dies ist eine seltene, hochspezialisierte Rolle – Hyperscale-Provenance ist zentral
  • Patent oder Open-Source-Portfolio ist erwartet
  • On-site in SF/Sunnyvale ist nicht verhandelbar

Über das Unternehmen

Crusoe ist ein vertikal integriertes KI-Infrastruktur-Unternehmen, das alle Ebenen des Stacks – von Strom bis zu Token – selbst besitzt und betreibt. Das Unternehmen baut die nächste Generation von KI-Infrastruktur für massive Trainings-Workloads.

Deine Aufgaben

  • Architektur von Bare-Metal-as-a-Service (BMaaS) für GPU-Durchsatz über Hochgeschwindigkeits-RDMA-Fabrics
  • Design hochoptimierter, dünner Virtualisierungsschichten (KVM oder Custom Micro-VMs) für Enterprise-Isolation
  • Aufbau hochperformanter Container-Substrate (Kubernetes oder Slurm) für Burst-Skalierung
  • Führung der Architektur des internen Cloud-Fabrics mit SR-IOV, RDMA und virtualisiertem GPU-Scheduling
  • Advanced R&D Leadership für Prototyping und Produktionalisierung von neuen Speicher-, Netzwerk- und Compute-Management-Methoden
  • Erstellung von White Papers und RFCs für technische Roadmap
  • Zusammenarbeit bei der Lösung komplexer Race Conditions im I/O-Path
  • Repräsentation von Crusoe in Open-Source-Communities

Deine Voraussetzungen

  • 12+ Jahre Erfahrung beim Design und Versand von Kern-Infrastruktur bei Major Hyperscaler (OCI, AWS, Azure, GCP) oder HPC-Cloud
  • Tiefe Linux-Kernel-, Virtualisierungs- und High-Performance-Netzwerk-Kenntnisse
  • Hardware-Software Co-Design-Erfahrung (NVIDIA/AMD GPUs, High-Speed NICs)
  • R&D-Führung bei High-Ambiguity-Projekten
  • Portfolio von signifikanten Open-Source-Beiträgen oder Patents
  • Exzellente Kommunikation komplexer technischer Konzepte