Research Scientist – Reinforcement Learning (Cursor)

Cursor

San Francisco • Vor Ort • Mid-Level • vor 13 Tagen

Data Science ki Python

Auf einen Blick

Research Scientist bei Cursor: Arbeite an Reinforcement Learning für Coding-Agenten, Datenqualität und Reward-Modellierung mit hoher Autonomie.

💰 ~$160.000–280.000/Jahr (geschätzt) 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ Americas

Tiefgreifender RL-Hintergrund
Starke ML-Grundlagen
Excellent Programming
Datenqualitäts-Fokus

Machine Learning Reinforcement Learning Python Research Deep Learning

Gehalt geschätzt anhand Senior Research Scientist bei KI-fokussiertem Startup. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für

Machine Learning Researchers mit RL-Fokus
Senior Data Scientists mit Research-Interesse

🚫 Weniger geeignet

Junior-Forscher
Production-fokussierte Engineers

💡 Gut zu wissen

Hohe Autonomie und Ownership
Vor-Ort San Francisco
Frontier ML-Forschung

Über das Unternehmen

Cursor baut Frontier-Coding-Agenten und skaliert Reinforcement Learning auf echten Nutzerdaten.

Über die Rolle

Research Scientist mit Fokus auf Reinforcement Learning und Mid-Training Research. Du wirst ambitionierte, schwierige Forschungsprobleme End-to-End bearbeiten: Hypothesen bilden, Experimente entwerfen, Training/Eval/Data bauen und Ergebnisse in das nächste Modell pushen.

Aufgaben

Verbessere RL-Verständnis und Training für längere Horizon-Tasks
Trainiere Grader zur Verbesserung der Coding-Task-Performance
Verbessere Qualität und Schwierigkeit von Trainingsdaten
Realtime-RL für Coding-Agenten

Anforderungen

Tiefgreifender Hintergrund in RL und starke ML-Grundlagen
Ausgezeichneter Programmierer und Software Engineer
Fähigkeit, ambitionierte Forschungsaufgaben mit minimaler Anleitung zu handhaben
Sorge um Datenqualität und Deep-Dive-Fähigkeit
Wahrheitsuchende Mentality

Über das Unternehmen

Über die Rolle

Aufgaben

Anforderungen

Ähnliche Stellen durchsuchen

Weitere Stellen bei Cursor

Engineering Manager, Desktop

Software Engineer, Services Platform

JRVP, Solutions Architecture – APJ

Product Manager, Cloud Agents