D
Dacodes: Senior GCP DevOps con Especialización en MLOps & GenAI
Über das Unternehmen
Standort der Zentrale: Mexiko.
Wir sind ein technologieorientiertes Unternehmen, das mit globalen Marken und disruptiven Startups zusammenarbeitet und KI-gestützte Lösungen in Produktion bringt. Das Team ist multikulturell und bietet Remote-Arbeit für LATAM.
Das Unternehmen fördert berufliche Weiterentwicklung (Zugang zu Kursen und Zertifizierungen), veranstaltet Meetups und virtuelle Events und ist als Great Place to Work zertifiziert.
Aufgaben
- Entwurf, Automatisierung und Betrieb von Infrastruktur in Google Cloud (IAM, VPCs, Cloud Run, Compute Engine, Pub/Sub, Cloud SQL).
- Implementierung von Infrastructure as Code mit Terraform (Module, Remote State, Multi-Environment Workspaces) und Aufbau/Maintenance von GitLab CI/CD-Pipelines.
- Verwaltung von Kubernetes/GKE-Clustern (inkl. GPU-Nodepools, Autoscaling, Sicherheit, Networking) und Deployment von AI/ML-Inferenze-Services in GKE oder Cloud Run.
- Integration und Betrieb von MLOps-Plattformen (z. B. Vertex AI, MLflow), Deployment von Modellen (online/batch) und Verwaltung von Experiment Tracking & Model Registry.
- Entwicklung und Betrieb von GenAI-/LLM-basierten Workflows (RAG, Embeddings, Multiagenten-Pipelines) und Optimierung von Performance sowie Kosten.
- Einrichtung von Observability, Monitoring und Alerting (Grafana, Datadog, Looker Studio) sowie Überwachung von LLM-Tokenverbrauch, GPU/CPU-Ressourcen und GCP-Kosten.
Voraussetzungen
- Mindestens 4 Jahre Produktionserfahrung mit GCP (IAM, Netzwerke, Compute-Services, Pub/Sub etc.).
- Mindestens 3 Jahre Erfahrung mit Terraform (fortgeschrittene Nutzung) und mit Kubernetes/GKE (gerne mit GPU-Erfahrung).
- Mindestens 3 Jahre Erfahrung beim Aufbau von CI/CD-Pipelines (GitLab), plus fundierte Kenntnisse in Docker, Cloud-Sicherheit, Netzwerken und Observability.
- Erfahrung mit Deployment von ML-Modellen (endpoints online/batch), Zusammenarbeit mit Data/AI-Teams und Grundkenntnisse in GenAI/LLM-APIs (OpenAI, Gemini, etc.).
- Wünschenswert: GCP-Zertifizierungen (Cloud Architect, Data/ML Engineer), Erfahrung mit Dataflow/BigQuery, Kenntnisse in NLP-Frameworks (LangChain, LlamaIndex) sind von Vorteil.
Benefits
- 100% Remote-Arbeit für LATAM (bei Bedarf wird über hybride/Präsenzregelungen informiert).
- Flexible Arbeitszeiten, Arbeit von Montag bis Freitag, Regelung nach Team/Projekt.
- Freier Tag am Geburtstag.
- Krankenversicherung mit höherer Deckung (gilt für Mexiko) und Lebensversicherung (gilt für Mexiko).
- Multikulturelle Teams, Zugang zu Schulungen und Zertifizierungen, Meetups und Gastvorträgen.
- Virtuelle Integrations-Events, Englischunterricht und interne Entwicklungsmöglichkeiten.
- Arbeit mit globalen Marken und innovativen Startups; Great Place to Work-Zertifizierung.