← 프리뷰 목록으로

데이터 사이언스는 이제 달라졌다

게시일: 2025년 11월 22일 | 원문 작성일: 2019년 2월 13일 | 저자: Vicki Boykis | 원문 보기

핵심 요약

  • 포화된 시장—데이터 사이언스는 인재 부족에서 과잉으로 바뀌었고, 한 포지션에 100-500명이 지원합니다
  • 직무 타이틀이 뒤죽박죽—“데이터 사이언티스트” 타이틀은 이제 일관성 없이 사용되며, 실제로는 분석가나 엔지니어 역할인 경우가 많습니다
  • 미디어 vs 현실—화려한 AI 개발? 실제로는 80% 이상이 데이터 정제와 파이프라인 구축입니다
  • 엔지니어링 쪽으로 확 바뀜—현대 데이터 사이언스는 통계보다 소프트웨어 엔지니어링에 가까워졌습니다
  • “뒷문” 진입 전략—SQL, 프로그래밍, 클라우드 기술로 인접 직무에 먼저 들어간 후 내부 전환하세요

참고: 이 글은 2019년 2월에 작성된 아카이브 버전의 요약입니다. 전체 글은 원문 링크에서 확인하실 수 있습니다.

핵심 주장

데이터 사이언스 분야는 2010년대 초반의 하이프 시대 이후로 근본적으로 변했어요. 희귀하고 화려한 커리어 경로였던 것이 이제는 경쟁이 치열해지고, 정의가 애매해지고, 엔지니어링 중심으로 확 바뀌었죠. 데이터 사이언티스트를 희망하는 사람들은 5년 전과는 완전히 다른 시장 상황에 직면하고 있고, 진입을 위한 업데이트된 전략이 필요해요.

포화된 시장

분야가 인재 부족에서 과잉으로 바뀌었어요. 글쓴이가 처음 시작했을 때는 데이터 사이언스 포지션당 지원자가 20명 정도였어요. 이제 채용 담당자들은 한 포지션에 100-500명의 지원자가 있다고 보고해요.

증거:

  • 업계 자료를 보면 AI/ML 일자리 공석이 약 10,000개
  • 매년 딥러닝 강의를 이수하는 사람이 100,000명 이상
  • 수요-공급 불균형으로 경쟁률이 10:1 또는 그 이상
  • 주니어 포지션은 회사들이 경력자를 선호하면서 특히 희소해졌어요

데이터 사이언티스트 타이틀이 애매해지고 의미가 퇴색됨

”데이터 사이언티스트”는 예전 같은 의미가 아니에요. 회사들이 타이틀을 제각각 사용하죠—“데이터 사이언스”로 표시된 일부 역할은 실제로는 데이터 분석가 스킬(SQL 쿼리, 대시보드)을 요구하고, 다른 역할은 프로덕션 ML 엔지니어링(배포, 확장, 인프라)을 요구해요. 새로운 알고리즘을 개발하는 화려한 “리서치 사이언티스트”는 여전히 드물고요.

미디어 하이프 vs 현실

미디어 서사

  • 최첨단 AI 개발
  • 흥미로운 문제 작업
  • 낮은 진입장벽에 높은 급여

현실

  • 시간의 80% 이상을 데이터 정제, 파이프라인 구축, 인프라에 쓰죠
  • 대부분의 작업은 ETL 작업 디버깅, SQL 작성, 데이터 품질 검증
  • 경쟁이 치열한 시장에서 상당한 소프트웨어 엔지니어링 스킬이 필요해요

엔지니어링 쪽으로 확 바뀜

현대 데이터 사이언스는 통계나 연구보다 소프트웨어 엔지니어링에 더 가까워요. 5년 전에는 중요하지 않았던 필수 스킬들:

  • 버전 관리 (Git) - 코드 협업과 이력 추적
  • CI/CD 파이프라인 - 자동화된 테스트와 배포
  • 클라우드 플랫폼 전문성 - AWS, GCP, Azure
  • 컨테이너 기술 - Docker, Kubernetes
  • 프로덕션 모니터링과 디버깅 - 실제 환경 문제 해결
  • API 설계와 마이크로서비스 - 시스템 통합

현실적인 진입 전략: “뒷문” 접근법

처음부터 “데이터 사이언스” 직무를 바로 노리지 마세요

1단계: SQL을 철저히 마스터하기

SQL은 데이터 작업의 기본 중의 기본이에요. 모든 데이터 역할은 데이터베이스 쿼리를 요구합니다.

2단계: 하나의 프로그래밍 언어를 깊이 배우기 (Python 권장)

문법만 배우는 게 아니라 컴퓨터 과학 기초를 이해하세요. 자료구조, 알고리즘, 테스팅, 디버깅을 배우세요. 실제 프로젝트를 처음부터 끝까지 만드세요.

3단계: 클라우드 플랫폼 경험 쌓기

AWS, GCP, Azure 중 하나를 선택해서 제대로 배우세요. 클라우드 스킬은 어디서나 유용하고, 여러분이 단순히 프로토타입만이 아니라 실제로 운영 가능한 작업을 할 수 있다는 것을 보여줘요.

왜 이게 효과적일까요?

이런 스킬들은 인접한 역할(데이터 분석가, 백엔드 개발자, DevOps)에 지원할 수 있게 해줘요. “옆으로 진입”해서 내부적으로 전환할 수 있어요.

핵심 교훈

  • 진입이 5년 전보다 훨씬 더 어려워졌어요
  • 꿈의 직장이 아니라 인접한 역할에서 시작할 가능성이 높아요
  • 작업은 예상보다 엔지니어링 쪽에 더 가까워요
  • 유행어 지식의 폭보다 기초의 깊이가 중요해요
  • 분야는 죽어가는 게 아니라 성숙하고 있어요

2025년 관점에서: 이 글이 작성된 2019년 이후로 이런 흐름은 더 심해졌어요. GenAI와 LLM의 등장으로 엔지니어링 스킬의 중요성은 더욱 커졌고, 시장은 더욱 경쟁적이 되었죠. Vicki의 조언—SQL, 프로그래밍, 클라우드 기술로 기초를 다지고 인접 역할을 통해 진입하는 것—은 여전히 유효하고, 어쩌면 더욱 중요해졌어요.

저자 소개: Vicki Boykis는 Machine Learning Engineer로, 데이터 분야에서 6년 이상의 경험을 가지고 있으며 실무자 관점에서 업계의 현실을 직설적으로 얘기하는 분이에요.

원문: Data Science is Different Now - Vicki Boykis (2019년 2월 13일)

아카이브: 2025년 11월 19일

생성: Claude (Anthropic)

총괄: (디노이저denoiser)