C
Research Scientist – Reinforcement Learning (Cursor)
Auf einen Blick
Research Scientist bei Cursor: Arbeite an Reinforcement Learning für Coding-Agenten, Datenqualität und Reward-Modellierung mit hoher Autonomie.
💰 ~$160.000–280.000/Jahr (geschätzt)
📊 Senior
🕒 Vollzeit
🌍 Vor Ort
🗺️ Americas
- Tiefgreifender RL-Hintergrund
- Starke ML-Grundlagen
- Excellent Programming
- Datenqualitäts-Fokus
Machine Learning
Reinforcement Learning
Python
Research
Deep Learning
Gehalt geschätzt anhand Senior Research Scientist bei KI-fokussiertem Startup. Kein Gehalt in der Anzeige angegeben.
✅ Geeignet für
- Machine Learning Researchers mit RL-Fokus
- Senior Data Scientists mit Research-Interesse
🚫 Weniger geeignet
- Junior-Forscher
- Production-fokussierte Engineers
💡 Gut zu wissen
- Hohe Autonomie und Ownership
- Vor-Ort San Francisco
- Frontier ML-Forschung
Über das Unternehmen
Cursor baut Frontier-Coding-Agenten und skaliert Reinforcement Learning auf echten Nutzerdaten.
Über die Rolle
Research Scientist mit Fokus auf Reinforcement Learning und Mid-Training Research. Du wirst ambitionierte, schwierige Forschungsprobleme End-to-End bearbeiten: Hypothesen bilden, Experimente entwerfen, Training/Eval/Data bauen und Ergebnisse in das nächste Modell pushen.
Aufgaben
- Verbessere RL-Verständnis und Training für längere Horizon-Tasks
- Trainiere Grader zur Verbesserung der Coding-Task-Performance
- Verbessere Qualität und Schwierigkeit von Trainingsdaten
- Realtime-RL für Coding-Agenten
Anforderungen
- Tiefgreifender Hintergrund in RL und starke ML-Grundlagen
- Ausgezeichneter Programmierer und Software Engineer
- Fähigkeit, ambitionierte Forschungsaufgaben mit minimaler Anleitung zu handhaben
- Sorge um Datenqualität und Deep-Dive-Fähigkeit
- Wahrheitsuchende Mentality