C
Researcher, Post Training
Gehalt
265.000 EUR / Jahr
Auf einen Blick
Researcher Post Training bei Cartesia für die Entwicklung von Alignment- und Post-Training-Methoden für Multimodal-Modelle. Physische Präsenz in San Francisco erforderlich.
💰 $150.000–200.000/Jahr
📊 Senior
🕒 Vollzeit
🌍 Vor Ort
🗺️ Americas
- RLHF & Preference-Optimization Expertise
- ML-Systems Engineering
- Model-Evaluation-Design
- Debugging komplexer Systeme
machine-learning
RLHF
preference-optimization
model-evaluation
research
python
deep-learning
multimodal-models
✅ Geeignet für
- PhD ML Forscher mit RLHF-Publikationen
- Google Brain/DeepMind Alumni
- Menschen mit Open-Source-Alignment-Beiträgen
🚫 Weniger geeignet
- Indy-ML-Engineers ohne Research-Background
- Remote-only Kandidaten (SF-Büro erforderlich)
- Menschen ohne RLHF-Erfahrung
💡 Gut zu wissen
- Cartesia ist eine PhD-gegründete Research Company – sehr technical
- San Francisco In-Person-Erwartung ist nicht negotiable
- Research-Tempo bedeutet hohe Autonomie aber auch wenig Guidance
- Benefits-Listing endete mit 'Personal Yoshi' – vermutlich Joke
Über das Unternehmen
Cartesia ist ein AI-Startup, das von phD-Gründern aus dem Stanford AI Lab gegründet wurde. Sie erfinden State Space Models (SSMs) als neue Primitive für große-scale Foundation Models. Finanziert durch Index Ventures, Lightspeed Venture Partners und andere Top-Investoren.
Deine Aufgaben
- Leitung von Research-Initiativen zur Verbesserung der Alignment und Capabilities von Multimodal-Modellen
- Entwicklung neuer Post-Training-Methoden und Evaluierungs-Frameworks für Modell-Verbesserungen
- Enge Partnerschaft mit Research, Product und Platform Teams zur Definition von Best Practices
- Implementierung, Debugging und Skalierung experimenteller Systeme für Reliabilität und Reproduzierbarkeit
- Übersetzung von Research-Erkenntnissen in produktionsreife Systeme
Deine Voraussetzungen
- Tiefes Wissen über Preference-Optimization und Alignment-Methoden (RLHF und verwandte Ansätze)
- Erfahrung in der Gestaltung von Evaluationen und Metriken für generative oder multimodale Modelle
- Starke Engineering- und Debugging-Fähigkeiten mit Skalierungserfahrung komplexer ML-Systeme
- Fähigkeit, komplexe Modell-Verhaltensweisen über Training und Evaluation Pipelines zu diagnostizieren
Nice-to-Have
- Erfahrung mit Multimodal-Modell-Training (Text, Audio, Vision-Language)
- Beiträge zu Alignment-Research oder Open-Source-Projekten
- Background in Human-in-the-Loop-Evaluationssystemen
Benefits (nur USA-Mitarbeiter)
- Wettbewerbsfähiges Grundgehalt + attraktive Equity-Pakete
- Vollständig versicherte Krankenversicherung (Dental & Vision)
- 401(k) mit Company Match
- Monatliche Fahrtzuschuss und flexible PTO
- Tägliche Mahlzeiten und Snacks im Büro
- Personal Yoshi (?)