Auf einen Blick
Principal Operations Engineer für Hyperscale AI Data Centers gesucht mit 10+ Jahren Hardware-Operations-Erfahrung.
💰 $150.000–220.000/Jahr
📊 Lead
🕒 Vollzeit
🌍 Hybrid
🗺️ Americas
- 10+ Jahre Hardware Operations
- GPU & Server Expertise
- Hyperscale Experience
- Production Change Management
GPU Operations
Data Center
Hardware
Linux
Firmware
RCA
Change Management
Leadership
✅ Geeignet für
- Infrastructure Engineers mit 10+ Jahren Hyperscale-Erfahrung
- Data Center Operations Leads
- GPU/Hardware Subject Matter Experts
🚫 Weniger geeignet
- Junior Infrastructure Engineers
- Reine Software-Engineers ohne Hardware-Erfahrung
💡 Gut zu wissen
- 50-75% Reisebereitschaft über Fleet
- GPU/Liquid-Cooling Spezialisierung erforderlich
- Vendor-Verwaltung und Enforcement
- Firmware & Boot-Diagnostik Deep Dive
Über das Unternehmen
Fluidstack ist ein Venture-backed Defense-Tech Unternehmen, das sich auf Künstliche Intelligenz und Compute-Infrastruktur konzentriert. Wir bauen Hyperscale AI Data Centers mit 10-100s GWs Compute-Kapazität.
Deine Aufgaben
- Diene als seniorste technische Autorität für Hardware-Flotte über Hyperscale AI Data Centers
- Führe Site-Assessments und operative Audits durch
- Leite technische Readiness von Teams vor Site-Aktivierung
- Überprüfe Hardware-Plattformen und Integration-Designs aus operativer Perspektive
- Gebe operative Erkenntnisse an Hardware Engineering, Deployment und Supply Chain zurück
- Force Multiplier für Site Hardware Leads, Deployment Teams und Reliability Engineers
- Diagnostiziere Boot-Fehler, leite Fleet-wide Root Cause Investigations und halte Anbietern hohe Standards
Deine Voraussetzungen
- 10+ Jahre hands-on Erfahrung in operativer Mission-Critical Hardware Infrastructure
- Mindestens 5 Jahre als seniorste technische Stimme auf Site, Campus oder Fleet
- Data Center Operations Erfahrung oder vergleichbare Hyperscale/HPC/Cloud Infrastructure Erfahrung
- Deep Working Knowledge von GPU Systems, Server Platforms, Storage, Firmware Lifecycle und Hardware Diagnostics
- Nachgewiesene Fähigkeit, High-Risk MOPs und Change Records in Production auszuführen
- Track Record in Root Cause Analysis und Corrective Action Management