
[직무내용]
에듀테크 글로벌 강자! 캐치잇플레이에서 인공지능 교육의 미래를 바꾸어 나가기 위해 9.7억 건의 학습 행동 데이터를 기반으로,
신규 제품·엔진 개발의 데이터·ML 플랫폼 리드를 맡아 주실 '데이터 엔지니어' 한 분을 모시려고 합니다.
1️⃣ 우리는 이런 분을 찾습니다
대규모 학습 로그를 안정적으로 다루고, ML 모델 인프라까지 함께 책임질 데이터 엔지니어를 찾습니다.
데이터 플랫폼에서 시작해 MLOps 영역으로 자기 역할을 확장해 나갈 분을 모시고 싶습니다.
- 데이터 파이프라인의 안정성과 비용을 동시에 고려할 줄 아는 분
- 피처의 필요성과 활용 맥락을 ML 엔지니어와 함께 논의할 수 있는 분
- 처음부터 완벽한 설계보다, MVP로 먼저 돌리고 점진적으로 개선하는 접근을 선호하는 분
- 장애 발생 시 원인을 끝까지 추적하고 재발 방지까지 가져가는 책임감을 가진 분
- 데이터 플랫폼에서 ML 플랫폼·MLOps 영역으로 자기 역할을 확장해 나가는 데 관심이 있는 분
2️⃣ 주요 책임
A. 데이터 플랫폼 (~60%)
- 라이브 서비스에서 발생하는 대규모 이벤트·로그·학습 데이터 수집·가공 파이프라인 설계·구현·운영
- Airflow 등 워크플로우 도구로 **ETL/ELT 파이프라인** 안정 운영, 장애 대응·성능 최적화·비용 효율 책임
- 분석가·ML 엔지니어·기획팀이 활용하기 좋은 형태로 데이터 웨어하우스(DW)·데이터 마트(DM) 설계·구축 및 자산화
- 데이터 품질 관리 및 거버넌스(메타데이터·카탈로그·접근 제어) 구축으로 데이터 신뢰성 확보
- 클라우드(AWS, GCP 등) 기반 데이터 인프라 운영, 확장성·비용 효율 고려한 아키텍처 개선 주도
B. ML 플랫폼·MLOps 인접 영역 (~40%)
- ML팀과 협업하여 추천·매칭·이탈 예측 등 모델 학습·서빙용 데이터 파이프라인과 **Feature Store** 운영
- 모델 서빙·모니터링 인프라 함께 운영, 저지연 추론 환경과 운영 안정성 확보
- 데이터·성능 드리프트 감지·알람 체계 운영
3️⃣ 필수 자격
- 데이터 엔지니어링 관련 실무 경력 3년 이상
- Python, SQL 능숙
- 대규모 사용자 로그 처리 경험 (high-volume event processing)
- Spark, Flink 등 분산 처리 프레임워크 실무 경험
- ETL 파이프라인 구축 경험 (Airflow, Prefect 등)
- 배치 + 스트리밍 데이터 처리의 차이를 이해하고 양쪽을 설계할 수 있는 분
- 클라우드(AWS, GCP 등) 환경에서 데이터 인프라 구축 경험
- Docker / Kubernetes 기반 컨테이너 환경 운영 경험
- 인프라 코드(IaC, Terraform 등) 관리 경험
4️⃣우대 사항
- 실시간 스트리밍 플랫폼(Kafka, Kinesis 등) 구축 경험
- 분석용 대규모 데이터 웨어하우스 운영 경험 (BigQuery, Redshift, Snowflake 등)
- Feature Store 구축 또는 운영 경험 (Feast 등)
- ML 모델 학습·서빙 파이프라인 구축 경험 (MLflow, Kubeflow 등)
- LLM/대형 모델 추론 인프라(vLLM, TGI 등) 경험
- ML 모델의 데이터/성능 드리프트 감지 경험 (Evidently, WhyLabs 등)
- 추론 지연·가용성 SLA 관리 경험 (Prometheus + Grafana 등)
- 에듀테크, 게임, 추천 서비스 등 대규모 유저 행동 로그 처리 경험
- 오픈소스 기여 또는 기술 콘퍼런스·논문 발표 경험
[세부내용은 아래 노션페이지 참조]
https://catchitplay.notion.site/AI-Mid-Senior-36098f74ee5a8003a68ac81fc502eca9
[근무시간 및 형태]
주 5일 근무
(근무시간) (오전) 9시 30분 ~ (오후) 6시 30분
주소정근로시간 : 40시간
[급여조건]
- 연봉
45000000원 이상
- 상여금 : 0%
(미 포함)
[장애인채용희망여부]
비희망
[병역특례]
- 비희망