Senior Data Engineer (Data Platforms & ML Pipelines)

Vollzeit
Remote Senior
🗓 Veröffentlicht vor 6 Tagen
đź’°

remote-job.net Job-Zusammenfassung:
đź’¶ Gehalt: keine Angabe
⏰ Wöchentliche Arbeitszeit: Vollzeit
🔍 Empfohlene Erfahrung: Senior
🎓 Empfohlene Ausbildung: keine Angabe
đź“‹ Hauptaufgaben:
  • Entwicklung und Betreuung skalierbarer Datenpipelines und Orchestrierung (z. B. Prefect)
  • Reprocessing, Validierung und Anreicherung groĂźer Datensätze aus vielfältigen Quellen
  • Architekturentscheidungen treffen, Beobachtbarkeit und Performance sicherstellen
âś… Hauptvoraussetzungen:
  • Sehr gute Python‑Kenntnisse und Erfahrung mit Workflow‑Orchestratoren
  • Verständnis von ETL/Transformationen fĂĽr LLM‑Ingestion und Erfahrung mit LLM‑APIs
  • Mindestens 5 Jahre Erfahrung in Backend‑ und/oder nativer App‑Entwicklung
🏭 Branche: AI & Health/Wellness

Ăśber das Unternehmen

garden3d ist ein arbeitnehmergeführtes kreatives Kollektiv, das an Marken, physischen Communities, IoT-Geräten und plattformübergreifenden Apps arbeitet. Wir teilen Gewinne, stellen Open‑Source‑Lösungen bereit, gründen neue Unternehmen und investieren finanziell oder in Form von Sachleistungen in vielversprechende Ideen.

Das Kollektiv hat für bekannte Kunden wie Google, Stripe, Figma, Hinge, ACLU, MIT u. a. gearbeitet. Das hier ausgeschriebene Projekt wird im Auftrag eines frühen AI‑Startups mit Sitz in New York City durchgeführt (Remote‑Option möglich).


Aufgaben
  • Ăśberwachen, Warten und Fehlerbehebung von Datenpipelines sowie Umgang mit Format‑Drift
  • Entwicklung, Optimierung und Reprocessing groĂźer Batch‑Workflows; Extraktion und Anreicherung strukturierter und unstrukturierter Daten (z. B. Web‑Crawls, Scraper)
  • Design und Integration neuer Datenquellen, Abstimmung extrahierter Daten mit dem Core‑Datenmodell; Teilnahme an Code‑Reviews und Sicherstellung von Best Practices

Voraussetzungen
  • Senior‑Erfahrung in Python und 5+ Jahre Backend- und/oder nativer App‑Entwicklung (z. B. Ruby on Rails, Elixir, Django, Node, React Native, Flutter, Android)
  • Fundierte Kenntnisse in Daten-/Workflow‑Orchestrierungstools (z. B. Prefect, Airflow, Dagster) sowie ETL/Transformation fĂĽr LLM‑Ingestion
  • Erfahrung mit APIs (OpenAI, Google Gemini/Vertex), Prompt‑Engineering, Arbeit mit LLMs und strukturierten Outputs; idealerweise Kenntnisse zu GCP, Vector DBs, PySpark und Suchtechnologien

Benefits
  • Wettbewerbsfähige VergĂĽtung (Stundensatz angegeben: $180–$230) + ggf. Equity‑Angebot
  • Remote‑Option mit bevorzugter Zusammenarbeit in NYC (nicht zwingend)
  • Mitarbeit in einem kreativen, kollektiven Umfeld mit namhaften Kunden und vielfältigen Projekten

Source
We Work Remotely: Copywriting Jobs