Researcher, Post Training

*HQ - San Francisco, CA On-site Mid-level 9 days ago
AI Data Science ki
Salary 265,000 EUR / Jahr
Auf einen Blick

Researcher Post Training bei Cartesia für die Entwicklung von Alignment- und Post-Training-Methoden für Multimodal-Modelle. Physische Präsenz in San Francisco erforderlich.

💰 $150.000–200.000/Jahr 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas
  • RLHF & Preference-Optimization Expertise
  • ML-Systems Engineering
  • Model-Evaluation-Design
  • Debugging komplexer Systeme
machine-learning RLHF preference-optimization model-evaluation research python deep-learning multimodal-models
✅ Geeignet für
  • PhD ML Forscher mit RLHF-Publikationen
  • Google Brain/DeepMind Alumni
  • Menschen mit Open-Source-Alignment-Beiträgen
🚫 Weniger geeignet
  • Indy-ML-Engineers ohne Research-Background
  • Remote-only Kandidaten (SF-Büro erforderlich)
  • Menschen ohne RLHF-Erfahrung
💡 Gut zu wissen
  • Cartesia ist eine PhD-gegründete Research Company – sehr technical
  • San Francisco In-Person-Erwartung ist nicht negotiable
  • Research-Tempo bedeutet hohe Autonomie aber auch wenig Guidance
  • Benefits-Listing endete mit 'Personal Yoshi' – vermutlich Joke

Über das Unternehmen

Cartesia ist ein AI-Startup, das von phD-Gründern aus dem Stanford AI Lab gegründet wurde. Sie erfinden State Space Models (SSMs) als neue Primitive für große-scale Foundation Models. Finanziert durch Index Ventures, Lightspeed Venture Partners und andere Top-Investoren.

Deine Aufgaben

  • Leitung von Research-Initiativen zur Verbesserung der Alignment und Capabilities von Multimodal-Modellen
  • Entwicklung neuer Post-Training-Methoden und Evaluierungs-Frameworks für Modell-Verbesserungen
  • Enge Partnerschaft mit Research, Product und Platform Teams zur Definition von Best Practices
  • Implementierung, Debugging und Skalierung experimenteller Systeme für Reliabilität und Reproduzierbarkeit
  • Übersetzung von Research-Erkenntnissen in produktionsreife Systeme

Deine Voraussetzungen

  • Tiefes Wissen über Preference-Optimization und Alignment-Methoden (RLHF und verwandte Ansätze)
  • Erfahrung in der Gestaltung von Evaluationen und Metriken für generative oder multimodale Modelle
  • Starke Engineering- und Debugging-Fähigkeiten mit Skalierungserfahrung komplexer ML-Systeme
  • Fähigkeit, komplexe Modell-Verhaltensweisen über Training und Evaluation Pipelines zu diagnostizieren

Nice-to-Have

  • Erfahrung mit Multimodal-Modell-Training (Text, Audio, Vision-Language)
  • Beiträge zu Alignment-Research oder Open-Source-Projekten
  • Background in Human-in-the-Loop-Evaluationssystemen

Benefits (nur USA-Mitarbeiter)

  • Wettbewerbsfähiges Grundgehalt + attraktive Equity-Pakete
  • Vollständig versicherte Krankenversicherung (Dental & Vision)
  • 401(k) mit Company Match
  • Monatliche Fahrtzuschuss und flexible PTO
  • Tägliche Mahlzeiten und Snacks im Büro
  • Personal Yoshi (?)