TwelveLabs logo

Software Engineer, ML Data

TwelveLabs
Full-time
Remote
South Korea
Remote AI

Who We Are

영상 이해 AI의 글로벌 기준을 함께 만들어갈 인재를 찾습니다!
트웰브랩스는 방대한 영상 데이터를 효과적으로 처리하여, 영상에 특화된 검색, 분석, 요약, 인사이트 생성 기능을 제공하는 세계 최고 수준의 영상 특화 AI 모델을 만들고 있습니다.

세계 최대 스포츠 리그에서는 트웰브랩스 모델을 활용해 방대한 경기 영상 속에서 빠르고 정확하게 하이라이트를 선별하여 초개인화된 시청 경험을 제공하고 있습니다. 국내 통합관제센터에서는 위기 상황에 신속히 대응하기 위해 트웰브랩스와 함께 CCTV 영상을 효율적으로 탐색하고 있으며, 전 세계 주요 방송사와 스튜디오들은 수십억 명의 시청자를 위한 콘텐츠 제작에 트웰브랩스 모델을 활용하고 있습니다.

트웰브랩스는 샌프란시스코와 서울에 오피스를 둔 Deep Tech 스타트업으로, 4년 연속 CB Insights 선정 세계 100대 AI 스타트업에 이름을 올렸습니다. NVIDIA, NEA, Index Ventures, Databricks, Snowflake 등 세계적인 VC와 기업들로부터 총 1억 1천만 달러 이상의 투자를 유치했으며, 한국에서 개발된 AI 모델 중 유일하게 Amazon Bedrock을 통해 서비스됩니다. 우리는 탁월한 동료들과 혁신적인 제품을 만들고 전 세계 고객들과 함께 성장하고 있습니다. 

트웰브랩스는 다음과 같은 핵심 가치를 중심으로 일합니다.

  • 나와 팀에 대해 정직하고 성찰할 수 있는 태도

  • 실패와 피드백을 두려워하지 않는 끈기와 겸손

  • 끊임없는 학습을 통해 팀의 역량을 함께 높여가는 자세

도전적인 문제를 함께 해결하며 성장하는 과정을 즐기는 분이라면, 그 기회가 여기 트웰브랩스에 있습니다.

About the Team

트웰브랩스 ML 데이터 팀은 ‘데이터가 AI 모델의 성능을 결정한다’는 믿음을 바탕으로, 멀티모달 AI 모델의 학습과 평가에 필요한 고품질 데이터를 End-to-End로 구축합니다. 영상, 이미지, 오디오 등 다양한 멀티모달 데이터를 수집하고, 필터링·가공·라벨링하는 것은 물론, 다양한 팀과 협업하여 새로운 모델 능력을 끌어낼 수 있는 학습 데이터를 설계합니다. 더불어, 실제 사용자 경험을 반영한 평가 데이터셋도 함께 만들어 나갑니다. 또한, 이 모든 과정을 효율적으로 수행하기 위해 내부 툴을 직접 개발하고 지속적으로 개선합니다.

ML 데이터 팀은 이렇게 정교하게 설계된 데이터 파이프라인을 통해 트웰브랩스의 세계 최고 수준 영상 이해 모델 개발에 핵심적인 역할을 하고 있습니다.

About the Role

Software Engineer, Data는 멀티모달(영상, 이미지, 오디오) 데이터를 위한 파이프라인을 설계하고 개발하며, 학습 데이터의 품질을 통해 모델 성능을 근본적으로 향상시키는 데 핵심적인 역할을 합니다.

비정형 멀티모달 대규모 데이터셋을 다루는 분산 시스템을 설계하고 운영한 경험이 있다면, 이 포지션에서 큰 임팩트를 낼 수 있습니다. 정교하게 정제되고 정확히 라벨링된 데이터는 TwelveLabs의 모든 모델 개발의 기반이 되며, Software Engineer, Data는 회사 내 그 어떤 엔지니어링 역할보다도 모델 품질에 큰 임팩트를 줄 수 있습니다.

TwelveLabs의 영상 이해 기술을 한 단계 끌어올릴 데이터 인프라를 함께 만들어갈 분을 기다립니다.

In this Role, You Will

  • LLM/VLM 학습을 위한 대규모 멀티모달 (영상, 이미지, 오디오) 데이터셋의 수집, 전처리, 정제, 필터링, 라벨링할 수 있는 데이터 엔진을 구축합니다.

  • 페타바이트(PB) 규모의 영상, 이미지, 오디오 데이터를 효율적으로 관리하고 시각화할 수 있는 데이터 시스템을 설계하고 개발합니다.

  • 단순히 눈에 띄는 기능이 아닌, 실질적인 임팩트를 만들어내는 라이브러리와 서비스를 설계하고 구축합니다.

  • 다양한 팀과 긴밀히 협업하여 프로젝트의 우선순위와 목표를 정의하고, 기획부터 개발, 운영 단계까지 기술 이니셔티브를 주도합니다.

You may be a good fit if you have

  • Python 언어에 능숙하며, 백엔드 또는 데이터 엔지니어로서 3년 이상의 실무 경험이 있으신 분

  • ML/AI 시스템과의 협업 또는 관련 데이터 처리에 높은 관심과 이해도를 갖추신 분

  • 빠르게 변화하는 스타트업 환경에 잘 적응하며, 회복탄력성과 문제 해결 역량이 뛰어나신 분

  • 데이터 엔지니어링 과제에 대해 주도적으로 해결책을 탐색하고 실행할 수 있는 분

Preferred Qualifications

  • 기술 리더(Technical Lead)로서 팀을 이끌며 프로젝트를 주도한 경험이 있으신 분

  • 대규모 데이터 수집·가공·저장 파이프라인 구축 및 운영 경험 (Spark 등)이 있으신 분

  • 모델 기반 언어 또는 비전-언어 데이터셋 구축 경험이 있으신 분

  • FFmpeg 또는 기타 고성능 이미지/비디오 처리 라이브러리를 활용한 개발 경험이 있으신 분

  • 머신러닝 또는 유관 분야의 박사 또는 석사 학위 소지자

Hiring Process

서류 검토 → 리크루터 인터뷰 (비대면, 한국어) → 코딩 테스트 및 Hiring Manager 인터뷰 (비대면, 영어/한국어) → 기술 인터뷰 (대면/비대면, 영어) → 컬처 핏 인터뷰 (대면/비대면, 한국어/영어) → 레퍼런스 체크 (비대면) → 처우 협의 및 최종 합격

Benefits and Perks

  • 글로벌 B2B 고객과 함께 성장하는 Global Team

  • 자율성과 협업을 모두 갖춘 하이브리드 근무

  • 전 직원에게 맥북 및 70만원 상당 재택근무 장비 지원, 3년 주기로 최신 장비 교체

  • 식사·교통비 등 자유롭게 사용할 수 있는 월 60만 원 한도 법인카드 제공

  • 사무실 내 스낵바(간식, 커피, 신선식품 제공)

  • 연말 2주간 겨울 방학 운영

  • 연 1회 건강검진 지원

  • 영어 교육 프로그램 지원