Researcher, Post Training

Cartesia

*HQ - San Francisco, CA • On-site • Mid-level • 9 days ago

AI Data Science ki

Salary 265,000 EUR / Jahr

Auf einen Blick

Researcher Post Training bei Cartesia für die Entwicklung von Alignment- und Post-Training-Methoden für Multimodal-Modelle. Physische Präsenz in San Francisco erforderlich.

💰 $150.000–200.000/Jahr 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas

RLHF & Preference-Optimization Expertise
ML-Systems Engineering
Model-Evaluation-Design
Debugging komplexer Systeme

machine-learning RLHF preference-optimization model-evaluation research python deep-learning multimodal-models

✅ Geeignet für

PhD ML Forscher mit RLHF-Publikationen
Google Brain/DeepMind Alumni
Menschen mit Open-Source-Alignment-Beiträgen

🚫 Weniger geeignet

Indy-ML-Engineers ohne Research-Background
Remote-only Kandidaten (SF-Büro erforderlich)
Menschen ohne RLHF-Erfahrung

💡 Gut zu wissen

Cartesia ist eine PhD-gegründete Research Company – sehr technical
San Francisco In-Person-Erwartung ist nicht negotiable
Research-Tempo bedeutet hohe Autonomie aber auch wenig Guidance
Benefits-Listing endete mit 'Personal Yoshi' – vermutlich Joke

Über das Unternehmen

Cartesia ist ein AI-Startup, das von phD-Gründern aus dem Stanford AI Lab gegründet wurde. Sie erfinden State Space Models (SSMs) als neue Primitive für große-scale Foundation Models. Finanziert durch Index Ventures, Lightspeed Venture Partners und andere Top-Investoren.

Deine Aufgaben

Leitung von Research-Initiativen zur Verbesserung der Alignment und Capabilities von Multimodal-Modellen
Entwicklung neuer Post-Training-Methoden und Evaluierungs-Frameworks für Modell-Verbesserungen
Enge Partnerschaft mit Research, Product und Platform Teams zur Definition von Best Practices
Implementierung, Debugging und Skalierung experimenteller Systeme für Reliabilität und Reproduzierbarkeit
Übersetzung von Research-Erkenntnissen in produktionsreife Systeme

Deine Voraussetzungen

Tiefes Wissen über Preference-Optimization und Alignment-Methoden (RLHF und verwandte Ansätze)
Erfahrung in der Gestaltung von Evaluationen und Metriken für generative oder multimodale Modelle
Starke Engineering- und Debugging-Fähigkeiten mit Skalierungserfahrung komplexer ML-Systeme
Fähigkeit, komplexe Modell-Verhaltensweisen über Training und Evaluation Pipelines zu diagnostizieren

Nice-to-Have

Erfahrung mit Multimodal-Modell-Training (Text, Audio, Vision-Language)
Beiträge zu Alignment-Research oder Open-Source-Projekten
Background in Human-in-the-Loop-Evaluationssystemen

Benefits (nur USA-Mitarbeiter)

Wettbewerbsfähiges Grundgehalt + attraktive Equity-Pakete
Vollständig versicherte Krankenversicherung (Dental & Vision)
401(k) mit Company Match
Monatliche Fahrtzuschuss und flexible PTO
Tägliche Mahlzeiten und Snacks im Büro
Personal Yoshi (?)

Über das Unternehmen

Deine Aufgaben

Deine Voraussetzungen

Nice-to-Have

Benefits (nur USA-Mitarbeiter)

Ähnliche Stellen durchsuchen

Weitere Stellen bei Cartesia

Business Recruiter

Founding Forward Deployed Engineer (India)

Product Manager, Infrastructure

GTM Strategist