R
Senior ML Platform Engineer
Auf einen Blick
Suche nach Senior ML Platform Engineer für RBCs AI Farm-Plattform in Toronto. Aufbau von Kubernetes-Infrastruktur, Datenplattformen und Developer Tools für ML-Forscher in einem autonomen kleinen Team.
💰 ~CAD 160.000–210.000/Jahr (geschätzt)
📊 Senior
🕒 Vollzeit
🌍 Vor Ort
🗺️ Americas
- 5+ Jahre Platform Engineering
- Kubernetes Production Experience
- Python Fluency
- Distributed Data Systems
Kubernetes
Python
Trino
Grafana
GitHub Actions
GitOps
Helm
Data Infrastructure
Gehalt geschätzt anhand Senior Platform Engineer in Toronto mit Kubernetes/GPU-Expertise bei großer Bank. Kein Gehalt in der Anzeige angegeben.
✅ Geeignet für
- Erfahrene Plattform-Engineers mit Kubernetes-Tiefe
- ML-Infrastructure-Spezialisten
🚫 Weniger geeignet
- Junior Developer ohne Kubernetes-Erfahrung
- Klassische Backend-Entwickler ohne DevOps-Fokus
💡 Gut zu wissen
- On-Premise GPU-Cluster (OpenShift + Run:AI)
- Kleine, hochautonome Team-Struktur
- Fokus auf Datensicherung und Compliance-Automatisierung
Über das Unternehmen
RBC Borealis betreibt AI Farm, eine Enterprise-GPU-Compute- und Datenplattform für Machine Learning. Das Team betreut über einhundert ML-Forscher und Ingenieure in der Modellentwicklung und Datenbereitstellung.
Deine Aufgaben
- Kubernetes-native Automatisierung für Plattformoperationen: PV-Lebenszyklusmanagement, Namespace-Bereitstellung, Compliance-Scanning
- Dateninfrastruktur-Ebene: Trino/Starburst-Cluster-Betrieb, Spalten-Level-Datenmaskierung, Ressourcengruppen-Management
- Developer-Tools in Python (SDK, CLI) für ML-Teams zur Datenzugriff und Compute
- Datensicherung und Compliance: automatisiertes Scanning, Klassifizierung, Aufbewahrungsdurchsetzung
- Observability-Pipelines: Grafana-Dashboards für GPU-Auslastung und Compliance
Deine Voraussetzungen
- 5+ Jahre in Software/Plattform-Engineering
- Tiefe praktische Kubernetes-Erfahrung in Produktion (Pod-Security, RBAC, Storage, CronJobs, Admission Webhooks)
- Python-Kenntnisse für Production Tools und Automatisierung
- Erfahrung mit verteilten Datensystemen (Trino, Spark, Iceberg, Hive)
- CI/CD und Automatisierung (GitHub Actions, Helm, GitOps)
Benefits
- Ownership komplexer Plattform-Capabilities in kleinem Team mit hoher Autonomie
- Arbeite mit führender GPU-Hardware (NVIDIA B300, H100, A100)
- Umfassendes Total Rewards Programm mit Boni und flexiblen Benefits
- Klare Wachstumslaufbahn: Senior Engineer → Staff Engineer