Senior Data Observability Software Engineer

Vollzeit
Remote Lead
📍 Palo Alto
🗓 Veröffentlicht vor 1 Woche
💰

remote-job.net Job-Zusammenfassung:
💶 Gehalt: keine Angabe
⏰ Wöchentliche Arbeitszeit: Vollzeit
🔍 Empfohlene Erfahrung: Senior
🎓 Empfohlene Ausbildung: keine Angabe
📋 Hauptaufgaben:
  • Entwurf skalierbarer Infrastruktur für Cloud- und Enterprise-Bereitstellungen.
  • Führung der technischen Vision für Multi-Cloud-Strategien.
  • Aufbau von Monitoring- und Observability-Systemen.
✅ Hauptvoraussetzungen:
  • Erfahrung als SRE Tech Lead oder vergleichbar (Senior-Level).
  • Kenntnisse in Multi-Cloud, verteilten Systemen und IaC.
  • Erfahrung mit Monitoring/Observability und Deployment-Automatisierung.
🏭 Branche: SaaS

Über das Unternehmen

DataHub ist eine AI- und Daten-Kontextplattform, die von über 3.000 Unternehmen genutzt wird, darunter Apple, CVS Health, Netflix und Visa. Gemeinsam mit einer aktiven Open-Source-Community von über 13.000 Mitgliedern entwickelt, liefert der Metadata-Graph von DataHub tiefgehenden Kontext zu AI- und Datenressourcen mit erstklassiger Skalierbarkeit und Erweiterbarkeit.

Das Enterprise-SaaS-Angebot DataHub Cloud bietet eine vollständig verwaltete Lösung mit KI-gestützter Suche, Observability und Governance-Funktionen. Organisationen nutzen DataHub, um den Wert ihrer Dateninvestitionen schneller zu realisieren, die Zuverlässigkeit von AI-Systemen sicherzustellen und eine einheitliche Governance umzusetzen.


Aufgaben
  • Entwurf und Implementierung robuster, skalierbarer Infrastrukturlösungen für DataHub Cloud und Enterprise-Bereitstellungen.
  • Führung der technischen Vision für Multi-Cloud-Bereitstellungsstrategien und Integration verteilter Systeme.
  • Architektur von Monitoring-, Observability- und Alerting-Systemen über verschiedene Umgebungen hinweg.
  • Einführung und Durchsetzung von Best Practices für Infrastructure as Code, Konfigurationsmanagement und Deployment-Automatisierung.
  • Zusammenarbeit mit Produkt- und Engineering-Teams zur Weiterentwicklung erweiterter Bereitstellungsfunktionen.
  • Leitung technischer Initiativen zur Verbesserung von Zuverlässigkeit, Skalierbarkeit und operativer Exzellenz der Plattform.

Voraussetzungen
  • Mehrjährige Erfahrung in Site Reliability Engineering (SRE) mit nachgewiesener Führungserfahrung als Tech Lead oder in ähnlicher Rolle.
  • Tiefe Kenntnisse in Multi-Cloud-Strategien, verteilten Systemen und Enterprise-Deployments.
  • Erfahrung mit Monitoring-, Observability- und Alerting-Stacks sowie Incident- und Runbook-Design.
  • Praxis mit Infrastructure as Code, Konfigurationsmanagement und CI/CD- bzw. Deployment-Automatisierung.
  • Fähigkeit zur bereichsübergreifenden Zusammenarbeit mit Produkt- und Engineering-Teams und zur Einflussnahme auf technische Roadmaps.

Benefits
  • keine Angabe