Sr. Site Reliability Engineer

United States Remote Senior 7 days ago
Site Reliability Engineer backend-developer DevOps IT
Auf einen Blick

Sr. Site Reliability Engineer bei AuthZed. Designiere und betreibe hochverfügbare, skalierbare Infrastruktur für Mission-Critical Authorization Services. Focus auf Observability, Incident Response und SRE Best Practices.

💰 ~$140.000–210.000/Jahr (geschätzt) 📊 Senior 🕒 Vollzeit 🌍 Remote 🗺️ Worldwide
  • Nachgewiesene SRE Erfahrung
  • Kubernetes und Cloud Infrastructure
  • Infrastructure-as-Code
  • Monitoring und Observability Tools
Kubernetes Docker Terraform Prometheus Grafana AWS GCP Azure

Gehalt geschätzt anhand typical_senior_sre_salary. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für
  • DevOps Engineer mit SRE Ambition
  • Systems Engineer mit Infrastructure Fokus
  • Operations Engineer zum Upgrade zu SRE
🚫 Weniger geeignet
  • Reine Software Development ohne Ops
  • Einstiegs-Level ohne Operations Erfahrung
  • Keine Kubernetes Experience
💡 Gut zu wissen
  • Fully Remote mit globaler Verteilung
  • On-Call Rotation erforderlich: Production Systems
  • Authorization Systems sind Mission-Critical: 99.99%+ Verfügbarkeit

Über das Unternehmen

AuthZed ist eine Reihe-A-Company, die SpiceDB und Autorisierungsinfrastruktur erstellt. Das Unternehmen konzentriert sich auf Permission Management mit Enterprise-Scale Performance. AuthZed ist vollständig remote mit Mitarbeitern in den USA, Kanada und Europa.

Deine Aufgaben

  • Designieren, implementieren und warten hochverfügbare und skalierbare Infrastruktur-Lösungen
  • System-Performance überwachen und analysieren, Bottlenecks identifizieren und auflösen
  • Infrastructure Deployment und Configuration Management Prozesse automatisieren
  • System-Zuverlässigkeit, Sicherheit und Effizienz durch Monitoring und Capacity Planning kontinuierlich verbessern
  • Komplexe Infrastructure und Application Issues troubleshooten
  • Mit Software Engineering Teams zusammenarbeiten, um resiliente, skalierbare, sichere Systeme zu designen
  • On-Call Rotation teilnehmen und Production Incidents schnell auflösen
  • System-Konfigurationen und Troubleshooting-Richtlinien dokumentieren

Deine Voraussetzungen

  • Nachgewiesene SRE- oder ähnliche Rolle Erfahrung
  • Starkes Verständnis von Networking, Operating Systems und Cloud Infrastructure
  • Site Reliability Engineering, System Design und Distributed Computing Erfahrung
  • Verschiedene Programmiersprachen (NodeJS, Java, Python, Ruby, Go)
  • Containerization (Docker) und Kubernetes Erfahrung
  • Infrastructure-as-Code Tools (Terraform, Pulumi)
  • Monitoring und Logging Tools (Prometheus, Grafana, ELK Stack)
  • Relational Database Lower-Level Implementation Details
  • Git und GitHub Erfahrung
  • CI/CD Systems Erfahrung
  • Starke Problem-Solving und Troubleshooting Fähigkeiten

Benefits

  • Möglichkeiten mit Cutting-Edge-Technologie zu arbeiten
  • Unterstützende Umgebung mit echtem Impact
  • Wettbewerbsfähiges Gehalt basierend auf Erfahrung
  • Aktienoptionen in frühem Startup
  • Umfassende Gesundheit, Zahnmedizin, Vision-Versicherung
  • Vollständig ferngesteuert
  • Zweimal jährliche Team Offsites