Research Scientist (Singapore)

Cantina

Singapore • Vor Ort • Mid-Level • vor 7 Tagen

AI Data Science

Auf einen Blick

Fahre Fundamentalforschung an Large-Scale Video-Generierungsmodellen: Designiere Data Pipelines, entwickle Distillation- und Preference-Fine-Tuning-Methoden und arbeite mit Pretraining/Post-Training-Integration.

💰 ~SGD 200.000–260.000/Jahr (geschätzt) 📊 Senior 🕒 Vollzeit 🌍 Vor Ort 🗺️ APAC

Large-Scale Data Systems Experience
PySpark/Ray Expertise
Distributed Training Know-How
Reward Modeling oder Preference Fine-Tuning

pytorch python diffusion-models data-pipelines kubernetes distributed-systems

Gehalt geschätzt anhand Geschätzt für Research Scientist in Singapore mit Large-Scale ML und Video Generation Background. Kein Gehalt in der Anzeige angegeben.

✅ Geeignet für

Research Scientists mit Publication Track Record
Large-Scale ML Systems Builders
Post-Training Spezialisten

🚫 Weniger geeignet

Pure Practitioners ohne Research Background
Engineers unkomfortabel mit Ambiguität in Forschung
Kandidaten ohne Top-Tier Publications

💡 Gut zu wissen

Singapore Onsite erforderlich
Top-Tier Publications (NeurIPS etc.) werden bevorzugt
Starker Fokus auf Data-Infrastruktur neben reiner Research

Über das Unternehmen

Cantina Labs expandiert in Singapur und sucht Research Scientists für Fundamentalforschung an Video-Generierungsmodellen.

Deine Aufgaben

Baue und skaliere Systeme für Large-Scale Video-Data-Ingestion, Preprocessing und Delivery für Model Training
Designiere und skaliere Distributed Data Pipelines für Preprocessing, Dataset Generation und Repeated Dataset Refreshes
Owne Workflow Orchestration, Job Scheduling, Monitoring und Failure Recovery für Large-Scale Data Processing
Implementiere Containerized Pipeline Infrastructure über Kubernetes
Optimiere Cloud-basierte Data Storage und Movement über Providers (AWS, GCS, Azure)
Definiere und implementiere Best Practices für Dataset Storage, Versioning, Caching und Access Patterns
Baue Deduplication Tooling über Large-Scale Video Corpora
Forsche an Distillation Methods für Large-Scale Diffusion und Flow-Based Video Generation
Entwickle Reward Models und Preference-Based Fine-Tuning Pipelines

Deine Voraussetzungen

Starke Hands-On Erfahrung mit Large-Scale Data Systems oder Pipelines für ML Workflows
Erfahrung mit PySpark, Ray und Orchestration Tools (Airflow)
Vertrautheit mit Containerization und Kubernetes
Erfahrung mit Cloud-basiertem Storage und Compute (AWS, GCS, Azure)
Vertrautheit mit Video/Media Processing Tools: FFmpeg, PyAV, DALI, OpenCV
Vertrautheit mit Multimodal oder Media Data
Starker Research Background in Post-Training Methods für Large-Scale Generative Models
Erfahrung mit Reward Modeling oder Preference-Based Fine-Tuning
Solides Verständnis von Pretraining und Post-Training Interplay
Proficiency in Python und Modern ML Frameworks (PyTorch oder JAX)
Track Record von Independent Research
Top-Tier Publications (NeurIPS, ICML, ICLR, CVPR, ICCV, ECCV) bevorzugt

Benefits

Competitive Gehalt und großzügige Equity
Persönliche Zeit off und bezahlte Feiertage
Krankenversicherung
Global Travel Insurance
Monthly Spending Stipend: 500 $ (~S$635)
Equipment für Home Office

Über das Unternehmen

Deine Aufgaben

Deine Voraussetzungen

Benefits

Ähnliche Stellen durchsuchen

Weitere Stellen bei Cantina

Product Manager, Video Products

Creator Partner Manager

Events Manager

Kotlin Multiplatform Engineer (Senior-Staff Levels)