Principal Operations Engineer Hardware & Data Center Operations

Vor Ort Lead vor 4 Tagen
DevOps engineering Infrastructure
Gehalt 150.000.250.000 EUR / Jahr
Auf einen Blick

Principal Operations Engineer für Hyperscale AI Data Centers gesucht mit 10+ Jahren Hardware-Operations-Erfahrung.

💰 $150.000–220.000/Jahr 📊 Lead 🕒 Vollzeit 🌍 Hybrid 🗺️ Americas
  • 10+ Jahre Hardware Operations
  • GPU & Server Expertise
  • Hyperscale Experience
  • Production Change Management
GPU Operations Data Center Hardware Linux Firmware RCA Change Management Leadership
✅ Geeignet für
  • Infrastructure Engineers mit 10+ Jahren Hyperscale-Erfahrung
  • Data Center Operations Leads
  • GPU/Hardware Subject Matter Experts
🚫 Weniger geeignet
  • Junior Infrastructure Engineers
  • Reine Software-Engineers ohne Hardware-Erfahrung
💡 Gut zu wissen
  • 50-75% Reisebereitschaft über Fleet
  • GPU/Liquid-Cooling Spezialisierung erforderlich
  • Vendor-Verwaltung und Enforcement
  • Firmware & Boot-Diagnostik Deep Dive

Über das Unternehmen

Fluidstack ist ein Venture-backed Defense-Tech Unternehmen, das sich auf Künstliche Intelligenz und Compute-Infrastruktur konzentriert. Wir bauen Hyperscale AI Data Centers mit 10-100s GWs Compute-Kapazität.

Deine Aufgaben

  • Diene als seniorste technische Autorität für Hardware-Flotte über Hyperscale AI Data Centers
  • Führe Site-Assessments und operative Audits durch
  • Leite technische Readiness von Teams vor Site-Aktivierung
  • Überprüfe Hardware-Plattformen und Integration-Designs aus operativer Perspektive
  • Gebe operative Erkenntnisse an Hardware Engineering, Deployment und Supply Chain zurück
  • Force Multiplier für Site Hardware Leads, Deployment Teams und Reliability Engineers
  • Diagnostiziere Boot-Fehler, leite Fleet-wide Root Cause Investigations und halte Anbietern hohe Standards

Deine Voraussetzungen

  • 10+ Jahre hands-on Erfahrung in operativer Mission-Critical Hardware Infrastructure
  • Mindestens 5 Jahre als seniorste technische Stimme auf Site, Campus oder Fleet
  • Data Center Operations Erfahrung oder vergleichbare Hyperscale/HPC/Cloud Infrastructure Erfahrung
  • Deep Working Knowledge von GPU Systems, Server Platforms, Storage, Firmware Lifecycle und Hardware Diagnostics
  • Nachgewiesene Fähigkeit, High-Risk MOPs und Change Records in Production auszuführen
  • Track Record in Root Cause Analysis und Corrective Action Management