AI가 Anthropic의 업무 방식을 어떻게 바꾸고 있는가

게시일: 2026년 2월 25일 | 원문 작성일: 2025년 12월 2일 | 저자: Saffron Huang 외 | 원문 보기

16비트 픽셀아트: 엔지니어가 빛나는 픽셀 블록 탑 꼭대기에서 노트북을 들고 앉아 있고, 로봇이 블록을 쌓으며, 바닥의 엔지니어들이 올려다보는 야경

핵심 요약

Anthropic이 자사 엔지니어와 연구원을 대상으로 AI가 업무를 어떻게 바꾸고 있는지 직접 조사한 결과예요. 설문조사, 심층 인터뷰, 그리고 실제 사용 데이터를 종합 분석했어요.

생산성 2배↑ — 업무의 60%에 Claude 활용, 생산성 +50%. 1년 전 대비 2-3배 증가.
새로운 종류의 일 — Claude 업무의 27%는 AI 없이는 안 했을 일. 탐색적 작업, 소규모 개선, 전문 영역 밖 도전.
풀스택化 vs 기술 퇴화 — 영역이 넓어지는 만큼, 깊은 실력이 퇴화할 수 있다는 우려도 커지는 중.
동료 → Claude — 질문의 첫 창구가 동료에서 Claude로 이동. 멘토링과 협업 기회가 줄고 있어요.
단기 낙관, 장기 불안 — “매일 출근해서 스스로를 실직시키고 있는 느낌.” 미래가 불확실해요.

• • •

도입

AI는 우리가 일하는 방식을 어떻게 바꾸고 있을까요? Anthropic의 경제적 영향 연구에서는 다양한 직업에 걸친 노동시장 전반의 변화를 살펴봤어요. 그런데 AI를 가장 일찍 받아들인 사람들을 좀 더 자세히 들여다보면 어떨까요 — 다시 말해, 바로 저희 자신을요?

시선을 안으로 돌려, 2025년 8월에 Anthropic 엔지니어와 연구원 132명을 설문조사하고, 53명을 심층 인터뷰했으며, 내부 Claude Code 사용 데이터까지 분석했어요. AI가 Anthropic 안에서 무엇을 바꾸고 있는지 알아보기 위해서요. 결론은 이래요: AI는 소프트웨어 개발자가 일하는 방식 자체를 근본적으로 바꾸고 있고, 거기엔 희망과 우려가 공존해요.

연구 결과가 보여주는 건, 큰 변화의 한가운데에 놓인 직장의 모습이에요. 엔지니어들은 훨씬 더 많은 일을 해내고, “풀스택”에 가까워지고 있어요 — 자기 전문 영역이 아닌 일도 성공적으로 해내고, 학습과 반복 속도가 빨라졌으며, 전에는 손도 안 대던 일까지 처리하고 있거든요. 하지만 이렇게 할 수 있는 범위가 넓어지면서, 동시에 걱정도 생겨요. 깊은 기술 역량을 잃는 건 아닌지, Claude의 결과물을 제대로 감독할 수 있을지 불안해하는 사람이 있는 반면, 더 넓고 높은 차원에서 사고할 수 있게 됐다고 환영하는 사람도 있어요. AI와 협업이 늘면서 동료와의 협업은 줄었다는 목소리도 있었고, 결국 스스로를 자동화해서 일자리를 잃게 되는 건 아닌지 자문하는 사람도 있었어요.

AI를 만드는 회사가 AI의 영향을 연구한다는 건, 분명 특수한 위치에서 바라보는 거예요 — 저희 엔지니어들은 최첨단 도구를 남보다 일찍 쓸 수 있고, 비교적 안정적인 분야에서 일하며, 다른 산업을 바꾸는 AI 변혁에 직접 기여하고 있으니까요. 그래도 이 연구를 공개하는 게 전체적으로 볼 때 유익하다고 판단했어요. Anthropic 내부 엔지니어들에게 지금 일어나고 있는 일이, 앞으로 사회 전반에 일어날 변화의 선행 지표가 될 수 있기 때문이에요. 연구 결과는 여러 분야에서 일찍 대응할 필요가 있는 과제를 시사해요 (단, 부록의 한계점 섹션을 참고해 주세요). 이 데이터를 수집할 당시에는 Claude Sonnet 4와 Claude Opus 4가 가장 뛰어난 모델이었고, 그 이후로도 역량은 계속 발전하고 있어요.

AI가 더 뛰어나질수록 생산성은 올라가지만, 동시에 이런 질문도 떠올라요: 기술 전문성을 어떻게 유지할 것인가? 의미 있는 협업은 어떻게 지킬 것인가? 학습, 멘토링, 커리어 개발에 새로운 접근이 필요한 불확실한 미래를 어떻게 준비할 것인가? 아래 “전망” 섹션에서는 이런 질문에 대해 내부적으로 시도하고 있는 초기 대응을 다뤄요. 최근의 AI 관련 경제 정책 아이디어 블로그 포스트에서는 정책 차원의 대응도 살펴봤어요.

• • •

주요 발견 사항

이 섹션에서는 설문조사, 인터뷰, Claude Code 데이터에서 나온 발견 사항을 간략히 정리해요. 자세한 결과, 방법론, 주의사항은 이어지는 섹션에서 다뤄요.

설문조사 데이터 요약

Anthropic 엔지니어와 연구원들은 코드 오류 수정과 코드베이스 학습에 Claude를 가장 많이 사용해요. 디버깅과 코드 이해가 가장 일반적인 용도예요 (Figure 1).
Claude 사용량과 생산성 향상이 함께 증가하고 있어요. 직원들은 업무의 60%에 Claude를 사용하고 50%의 생산성 향상을 보고했는데, 이는 작년 대비 2-3배 증가한 수치예요. 이 생산성은 작업 카테고리별 소요 시간이 약간 줄고, 산출물 규모가 상당히 늘어나는 형태로 나타나요 (Figure 2).
Claude 지원 업무의 27%는 AI 없이는 하지 않았을 일이에요. 프로젝트 확장, 있으면 좋은 도구 제작 (예: 인터랙티브 데이터 대시보드), 수작업으로는 비용 대비 효과가 낮은 탐색적 작업 등이 여기에 해당해요.
대부분의 직원은 Claude를 자주 사용하면서도, 완전히 위임할 수 있는 업무는 0-20%라고 보고해요. Claude는 일상적인 협업자이지만, 특히 중요한(high-stakes) 업무에서는 적극적인 감독과 검증이 수반돼요 — 검증 없이 완전히 넘기는 것과는 달라요.

심층 인터뷰 요약

직원들이 AI에 뭘 맡길지에 대한 감각을 키우고 있어요. 엔지니어들은 검증이 쉬운 것 (“정확한지 대충 봐도 알 수 있는” 것), 위험이 낮은 것 (“일회성 디버그나 연구 코드”), 하기 싫은 것 (“하고 싶은 작업일수록 Claude를 안 쓰게 돼요”)을 위임하는 경향이 있어요. 많은 이가 신뢰를 쌓아가는 과정을 묘사했는데, 간단한 일부터 시작해 점차 복잡한 일까지 맡기게 된다고요. 현재는 설계나 “감각(taste)“이 필요한 작업은 주로 직접 하고 있지만, 모델이 좋아지면서 이 경계는 계속 재조정되고 있어요.
역량이 더 넓은 영역으로 확장되고 있지만, 실전 연습은 줄고 있어요. Claude 덕분에 소프트웨어 엔지니어링의 더 넓은 영역까지 할 수 있게 됐지만 (“프론트엔드도, 트랜잭션 데이터베이스도 능숙하게 다룰 수 있게 됐어요… 예전에는 전문가가 아닌 영역은 건드리기 무서웠는데”), 역설적으로 코드 작성과 검토에 필요한 깊은 기술력이 퇴화할까 걱정하는 직원들도 있어요 — “결과물을 내기가 너무 쉽고 빨라지니까, 실제로 시간을 들여 무언가를 배우기가 점점 더 어려워져요.”
코딩이라는 장인정신과의 관계 변화. 어떤 엔지니어들은 AI 지원을 자연스럽게 받아들이고 결과에 집중해요 (“코드 쓰는 걸 좋아한다고 생각했는데, 사실은 코드로 얻는 결과를 좋아하는 거였어요”). 다른 이들은 “분명 그리운 부분이 있다”고 해요.
직장 내 사회적 관계가 변하고 있어요. 예전에 동료에게 가던 질문이 이제 Claude로 먼저 가요 — 그 결과 멘토링과 협업 기회가 줄었다는 목소리가 나와요. (“사람들과 함께 일하는 게 좋은데, 이제 그들이 덜 ‘필요’해진 게 슬퍼요… 후배들이 저한테 질문을 잘 안 하게 됐어요.”)
커리어의 변화와 불확실성. 엔지니어들은 AI 시스템을 관리하는 상위 수준의 업무로 이동하고 있고, 상당한 생산성 향상을 보고해요. 하지만 이런 변화는 소프트웨어 엔지니어링이라는 직업이 장기적으로 어디로 향하는지에 대한 질문도 던져요. 미래에 대해 상충되는 감정을 표현하는 사람도 있어요: “단기적으로는 낙관적인데, 장기적으로는 AI가 결국 다 하게 되어서 저를 포함해 많은 사람이 필요 없어질 것 같아요.” 또 어떤 사람들은 순수한 불확실성을 강조하면서, 자기 역할이 몇 년 뒤에 어떻게 될지 “뭐라 말하기 어렵다”고만 해요.

Claude Code 사용 추세 요약

Claude가 점점 더 복잡한 일을 더 자율적으로 해내고 있어요. 6개월 전에는 Claude Code가 사람의 개입 없이 약 10개의 행동(action)을 수행했는데, 지금은 약 20개를 처리하면서 더 적은 조향으로 더 복잡한 워크플로를 완수해요 (Figure 3). 코드 설계/기획(1% → 10%)이나 새 기능 구현(14% → 37%) 같은 복잡한 작업에 Claude를 쓰는 비율도 크게 늘었어요 (Figure 4).
Claude가 수많은 “페이퍼컷”1을 고쳐요. Claude Code 작업의 8.6%가, 유지보수를 위한 코드 리팩토링처럼 삶의 질을 개선하는 작은 이슈 수정이에요. 이런 수정은 보통 후순위로 밀리지만, 쌓이면 생산성과 효율성이 크게 올라갈 수 있어요.
모두가 더 “풀스택”이 되고 있어요. 팀마다 Claude를 다른 방식으로 쓰면서 핵심 전문성을 보완하고 있어요 — 보안팀은 낯선 코드 분석에, 정렬 및 안전팀은 데이터의 프론트엔드 시각화에 사용하는 식이에요 (Figure 5).

• • •

설문조사 데이터

조직 전반의 엔지니어와 연구원 132명에게 Claude를 어떻게 쓰고 있는지 설문조사를 했어요. 일상에서 정확히 어떻게 활용하는지 파악하기 위해서요. 설문은 내부 커뮤니케이션 채널과 다양한 팀에 대한 직접 연락을 통해 배포했고, 연구와 제품 기능 양쪽을 대표하는 팀들이 포함됐어요. 부록에 방법론 관련 한계점을 수록했고, 다른 조직이 접근 방식을 평가하고 자체 연구에 적용할 수 있도록 설문 문항도 공유해요.

사람들이 어떤 코딩 작업에 Claude를 쓸까?

설문 대상 엔지니어와 연구원에게, 다양한 코딩 작업에 Claude를 얼마나 자주 쓰는지 평가해달라고 요청했어요. 예를 들어 “디버깅” (코드 오류 수정), “코드 이해” (기존 코드를 Claude가 설명해서 코드베이스 파악을 돕는 것), “리팩토링” (기존 코드 재구조화), “데이터 사이언스” (데이터셋 분석이나 차트 만들기) 같은 항목이에요.

아래는 가장 많이 쓰이는 일일 작업이에요. 직원의 55%가 디버깅에 매일 Claude를 썼고, 42%는 코드 이해에, 37%는 새 기능 구현에 매일 사용했어요. 상대적으로 빈도가 낮은 작업은 상위 수준 설계/기획 (사람들이 직접 하고 싶어하는 영역이라서), 그리고 데이터 사이언스와 프론트엔드 개발 (전체적으로 덜 흔한 작업이라서)이었어요. 이는 아래 “Claude Code 사용 추세” 섹션의 데이터 분포와 대체로 일치해요.

그림 1: 다양한 코딩 작업(y축)별 일일 사용자 비율(x축).

사용량과 생산성

직원들의 자가보고에 따르면, 12개월 전에는 일상 업무의 28%에 Claude를 쓰면서 생산성이 +20% 향상됐다고 했는데, 지금은 업무의 59%에 Claude를 쓰면서 평균 +50%의 생산성 향상을 달성하고 있어요 (사용률 28% → 59%, 생산성 +20% → +50%). (엔지니어링 조직 전체에 Claude Code를 도입한 뒤 관측한 엔지니어 1인당 일일 머지 풀 리퀘스트 67% 증가와 대체로 부합하는 수치예요.) 전년 대비 변화가 상당히 극적이에요 — 1년 만에 사용량과 생산성이 모두 2배 이상 증가한 셈이거든요. 두 지표 사이에는 강한 상관관계가 있고, 분포의 극단에서는 응답자의 14%가 Claude를 써서 생산성이 100% 이상 올랐다고 보고해요 — 이들이 내부 “파워 유저”예요.

이 결과 (그리고 아래의 다른 자가보고 생산성 수치)에 대해 한 가지 유의할 점이 있어요. 생산성은 정확히 측정하기 어렵거든요 (자세한 한계점은 부록 참고). AI 연구 비영리단체 METR2의 최근 연구에서는 매우 익숙한 코드베이스에서 작업하는 숙련 개발자들이 AI로 인한 생산성 향상을 과대평가한다는 걸 보여줬어요. 하지만 흥미롭게도, METR이 “생산성이 기대보다 낮아지는 원인”으로 지목한 요인들 (예: 대규모·복잡한 환경에서 AI 성능이 떨어지는 경우, 암묵지가 많이 필요한 경우)은, 저희 직원들이 Claude에 위임하지 않는다고 말한 작업 유형과 거의 일치해요 (아래 AI 위임 접근법 참고). 즉, 저희가 보고하는 생산성 향상은 직원들이 “어떤 일을 Claude에 맡기고 어떤 일을 직접 할지” 전략적으로 선별한 결과일 수 있어요 — METR 연구에서는 고려하지 않은 부분이에요.

직원들에게 “Claude를 쓰는 작업 카테고리에서, 전체 소요 시간과 산출량이 어떻게 달라졌나요?”라고 물었더니, 흥미로운 패턴이 나타났어요. 거의 모든 카테고리에서 소요 시간은 순감소하고, 산출량은 더 크게 순증가했거든요:

그림 2: 작업(y축)별 소요 시간(왼쪽 패널)과 산출물 규모(오른쪽 패널)에 대한 영향. x축은 Claude 미사용 대비 자가보고된 감소/증가. 오차 막대는 95% 신뢰구간.

그런데 원시 데이터를 더 파보면, 시간 절약 응답이 양 극단에 몰려 있어요 — 어떤 사람들은 Claude를 쓰는 작업에 오히려 시간을 더 많이 쓰고 있었거든요.

왜 그럴까요? 주된 이유는 두 가지예요. 첫째, Claude가 만든 코드를 디버깅하고 정리하는 데 추가 시간이 든다는 것 (예: “바이브 코딩3하다 막다른 골목에 빠졌을 때”). 둘째, 자기가 직접 쓰지 않은 코드를 이해하는 데 인지적 부담이 크다는 것. 반면, 오히려 긍정적인 이유로 시간을 더 쓰는 사람도 있었어요 — 한 사람은 Claude 덕분에 “전에는 바로 포기했을 작업을 끝까지 하게 됐다”고 했고, 다른 사람은 테스트를 더 꼼꼼히 하고 새 코드베이스를 더 많이 탐색하게 됐다고 했어요. 전반적으로 보면, 시간을 절약하는 엔지니어는 빠르게 검증할 수 있는 작업을 Claude에 맡기는 사람들이고, 시간이 더 드는 쪽은 AI 생성 코드를 디버깅하거나 Claude에 안내가 많이 필요한 영역에서 작업하는 사람들인 것 같아요.

절약된 시간이 어디에 재투자되는지도 이 데이터만으로는 알 수 없어요 — 추가 엔지니어링 작업에 쓰이는 건지, 비기술 업무인지, Claude와의 상호작용이나 결과물 검토인지, 아니면 업무 외 활동인지요. 저희 작업 분류 체계가 엔지니어들의 시간 배분을 전부 포착하지는 못하고, 시간 절약 자체가 자가보고의 인식 편향을 반영할 수도 있어요. 이런 효과들을 분리하려면 추가 연구가 필요해요.

반면 산출량 증가는 훨씬 뚜렷하고 실질적이에요. 모든 작업 카테고리에서 큰 폭의 순증가가 나타나거든요. 이 패턴은 사람들이 개별 작업이 아니라 작업 카테고리 전체 (예: “디버깅” 전반)에 대해 답하고 있다는 점을 고려하면 납득이 돼요 — 디버깅이라는 카테고리에 시간을 약간 덜 쓰면서도, 전체 디버깅 산출량은 훨씬 늘어날 수 있는 거예요. 생산성은 직접 측정하기 매우 어렵지만, 이 자가보고 데이터는 Anthropic에서 AI가 생산성을 높이는 주된 경로가 “더 빨리 끝내기”보다는 “더 많이 해내기”임을 시사해요.

Claude가 새로운 업무를 가능하게 하다

한 가지 궁금한 점이 있었어요: Claude가 질적으로 새로운 종류의 일을 가능하게 하는 건지, 아니면 Claude가 도운 일은 결국 (더 느리더라도) 직원들이 어차피 했을 일인지?

직원들은 Claude로 하는 일의 27%가 AI 없었으면 아예 안 했을 일이라고 추정했어요. 구체적으로는 프로젝트 확장, 있으면 좋지만 우선순위가 아닌 것들 (예: 인터랙티브 데이터 대시보드), 문서화나 테스트 같은 유용하지만 지루한 작업, 수작업으로는 비용 대비 효과가 안 나오는 탐색적 작업 등이에요. 한 사람의 표현을 빌리면, 이전에는 삶의 질을 갉아먹던 “페이퍼컷”을 이제는 더 많이 고칠 수 있게 됐다고 해요 — 엉망인 코드를 리팩토링하거나 “다른 작업을 더 빨리 처리하는 데 도움이 되는 작은 도구”를 만드는 것처럼요. 사용 데이터 분석에서도 같은 패턴이 확인됐는데, Claude Code 작업의 8.6%가 ‘페이퍼컷 수정’에 해당했어요.

또 다른 연구원은 여러 버전의 Claude를 동시에 실행하며, 각각 다른 접근법으로 문제를 탐색했다고 설명했어요:

“사람들은 초고성능 모델 하나를 쓰는 걸 상상해요, 더 빠른 차 한 대를 가진 것처럼. 하지만 백만 마리의 말이 있다면… 온갖 다른 아이디어를 동시에 시험해볼 수 있어요… 그런 탐색의 폭이 있으면 훨씬 더 흥미롭고 창의적이에요.”

다음 섹션에서 보게 되겠지만, 이런 새로운 업무는 종종 엔지니어들이 핵심 전문 영역 밖의 작업에 도전하는 것을 포함해요.

Claude에 완전히 위임할 수 있는 업무는 얼마나 될까?

엔지니어들은 Claude를 자주 쓰지만, 절반 이상이 “완전히 맡길 수 있는 업무”는 전체의 0-20%에 불과하다고 답했어요. (“완전 위임”의 의미는 사람마다 달랐어요 — 검증이 전혀 필요 없는 수준부터, 가벼운 감독만으로 충분할 정도로 신뢰할 수 있는 수준까지.) 이유를 설명하면서, 엔지니어들은 Claude와 적극적으로 주고받으며 작업하고, 특히 코드 품질이 중요한 복잡한 작업이나 고위험 영역에서는 결과물을 반드시 검증한다고 말했어요. 요컨대 엔지니어들은 “완전 위임”의 기준을 꽤 높게 잡고 있고, 검증 없이 통째로 넘기기보다는 Claude와 긴밀히 협업하면서 결과를 확인하는 편이에요.

• • •

심층 인터뷰

설문 결과가 상당한 생산성 향상과 변화하는 업무 패턴을 보여주긴 하지만, 숫자만으로는 알 수 없는 게 있어요 — 엔지니어들이 이런 변화를 매일 어떻게 체감하고 있는지요. 이 지표 뒤에 있는 사람의 이야기를 이해하기 위해, 설문에 응답한 Anthropic 엔지니어와 연구원 53명을 심층 인터뷰했어요. 직장에서 일어나는 이런 변화에 대해 어떻게 생각하고 느끼는지 더 깊이 들여다보기 위해서요.

AI 위임 접근법

엔지니어와 연구원들은 자기 업무 흐름에 Claude를 효과적으로 녹이기 위한 다양한 전략을 발전시키고 있어요. 사람들이 보통 Claude에 맡기는 작업에는 공통된 특성이 있어요:

위임 기준	핵심	인터뷰 발언
맥락 밖 + 낮은 복잡도	내가 모르지만 어렵지도 않은 일	”내가 맥락이 부족하지만, 전반적인 복잡도도 낮다고 생각되는 일에 Claude를 써요." "Git이나 Linux를 잘 모르는데… Claude가 내 경험 부족을 잘 메워줘요.”
검증이 쉬운 것	만드는 것보다 확인이 빠른 일	”검증 노력이 생성 노력에 비해 크지 않은 모든 일에 정말 놀라울 정도로 좋아요.”
잘 정의되었거나 독립적인 것	다른 코드와 분리된 모듈	”프로젝트의 하위 컴포넌트가 나머지와 충분히 분리돼 있으면, Claude에게 시도해보라고 해요.”
코드 품질이 중요하지 않은 것	일회성 코드, 연구용 스크립트	”일회성 디버깅이나 연구 코드는 바로 Claude에게 보내요. 설계 문제라면 직접 해요.”
반복적이거나 지루한 것	하기 싫은 일 → Claude에 먼저	”하고 싶은 작업일수록 Claude를 안 쓰게 돼요. 반면에 저항감이 많이 느껴지면… Claude와 대화를 시작하는 게 더 쉬워요.” Claude 지원 업무의 44%가 직접 하면 즐기지 않았을 작업.
프롬프트가 직접 실행보다 빠른 것	콜드 스타트 비용 vs 직접 하기	”10분 미만이 걸릴 것 같은 작업은… Claude를 쓰지 않을 거예요." "콜드 스타트 문제4가 지금 가장 큰 걸림돌이에요… 완벽한 프롬프트를 반복 작성하는 데 시간을 쓸 수도 있지만, 그냥 가서 직접 하는 게 나아요.”

직원들이 위임 판단에서 고려하는 이런 요인들은, METR의 외부 연구에서 AI 관련 생산성이 기대보다 낮게 나온 원인 (개발자가 코드베이스에 너무 익숙한 경우, 대규모·복잡한 저장소 등)과 유사했어요. 여러 인터뷰에서 이런 위임 기준이 반복적으로 나타난다는 건, “어떤 작업을 AI에 맡기느냐”가 생산성 향상의 핵심 변수라는 뜻이에요 (향후 생산성 연구에서 반드시 통제해야 할 부분이에요).

신뢰하되 검증하라 (Trust but verify)

많은 사용자가 시간이 지나면서 점점 더 복잡한 작업을 맡기게 되는 과정을 묘사했어요: “처음에는 Rust 프로그래밍 언어에 대한 기본적인 질문에 AI 도구를 썼는데… 요즘은 모든 코딩에 Claude Code를 쓰고 있어요.”

한 엔지니어는 이 신뢰 과정을 Google Maps 같은 다른 기술의 채택에 비유했어요:

“처음에는 모르는 경로에만 [Google Maps를] 썼어요… 이건 내가 모르는 SQL을 Claude에게 쓰라고 하면서, 내가 아는 Python은 쓰라고 안 한 것과 같아요. 그러다가 대부분 아는 경로에도 Google Maps를 쓰기 시작했어요, 마지막 1마일만 모를 수 있으니까… 오늘은 매일 출퇴근에도 Google Maps를 써요. 다른 길로 가라고 하면 그냥 따라가요, 모든 옵션을 고려했다고 믿으면서… Claude Code도 지금 비슷하게 쓰고 있어요.”

Claude를 자기 전문 분야 안에서 쓸지 밖에서 쓸지에 대해서는 의견이 갈려요. 어떤 사람은 “주변부” 영역에서 구현 시간을 아끼려고 쓰고, 어떤 사람은 결과물을 제대로 검증할 수 있는 익숙한 영역에서 쓰는 걸 선호해요 (“Claude가 뭘 하는지 완전히 이해하는 방식으로 사용해요”). 한 보안 엔지니어는 경험의 중요성을 강조하면서 이런 사례를 들었어요 — Claude가 제안한 솔루션이 “위험할 정도로 영리한, 아주 재능 있는 주니어 엔지니어가 제안할 법한 종류”였다고요. 경험과 판단력이 있는 사람만 문제를 알아챌 수 있는 솔루션이었던 거예요.

또 다른 엔지니어들은 전문 분야 안팎 모두에서 Claude를 쓰는데, 일단 무조건 시켜보는 식으로 (“기본적으로 항상 코딩 문제를 먼저 Claude에 던져봐요”) 또는 해당 작업에 대한 자기 전문성 수준에 따라 접근법을 달리하며 사용해요:

“두 가지 경우 모두에 도구를 써요 — 핵심 전문 분야에서는 가속기로 활용하고 (뭘 기대해야 하는지 알고, 에이전트를 효과적으로 안내할 수 있으니까요), 전문 분야에서 약간 벗어난 영역에서는 대략 뭘 기대하는지는 알지만 Claude가 세부 정의나 익숙하지 않은 부분을 채워주는 식으로 써요.”

“내가 특히 잘 아는 분야에서는 Claude에게 단호하게 뭘 봐야 하는지 지시해요. 잘 모르는 분야에서는 반대로, Claude에게 전문가 역할을 맡겨서 내가 고려하고 조사해야 할 선택지와 통찰을 제시해달라고 해요.”

어떤 작업을 직접 할까?

사람들이 한결같이 Claude를 쓰지 않는다고 한 영역이 있어요 — 상위 수준의 전략적 사고가 필요한 작업, 그리고 조직 맥락이나 “감각(taste)“이 필요한 설계 결정이에요. 한 엔지니어의 설명: “상위 수준의 사고와 설계는 보통 제가 해요. 새 기능 개발부터 디버깅까지, 위임할 수 있는 건 다 맡겨요.” 이는 설문에서 설계 및 기획 작업의 생산성 향상 폭이 가장 작았던 것과 일치해요 (Figure 2). 많은 사람들이 이 위임의 경계를 “움직이는 과녁”이라고 표현했는데, 모델이 좋아질 때마다 경계를 다시 그리게 된다는 거예요 (실제로 아래 Claude Code 사용 데이터를 보면, 코딩 설계/기획 용도가 6개월 전보다 상대적으로 더 늘었어요).

기술의 변환 (Skill transformations)

새로운 역량…

”Claude로 하는 일의 27%는 AI 없었으면 안 했을 일”이라는 설문 결과는 더 큰 흐름을 반영해요: 엔지니어들이 AI의 도움으로 자기 전문 영역 밖의 일까지 해내고 있다는 거예요. 많은 직원이 전에는 엄두도 못 냈을 작업을 완수했다고 해요 — 백엔드 엔지니어가 UI를 만들고, 연구자가 시각화를 만드는 식으로요. 한 백엔드 엔지니어는 Claude와 주고받으며 복잡한 UI를 만든 경험을 이렇게 묘사했어요:

“Claude가 내가 할 수 있었을 것보다 훨씬 잘해냈어요. 나는 그걸 못 했을 거예요, 확실히 제시간에는요… [디자이너들이] ‘잠깐, 이거 네가 한 거야?’ 하길래 ‘아니요, Claude가 한 거예요 — 저는 그냥 프롬프트만 했어요’라고 했죠.”

엔지니어들은 “점점 풀스택에 가까워지고 있다”고 말해요. “프론트엔드도, 트랜잭션 데이터베이스도, API 코드도 능숙하게 할 수 있게 됐어요. 예전에는 전문가가 아닌 영역은 건드리기 무서웠는데요.” 이런 역량 확장 덕분에 피드백 루프가 더 촘촘해지고 학습도 빨라져요 — 한 엔지니어는 만들고, 미팅 잡고, 반복하는 “몇 주짜리 과정”이, 동료들이 실시간으로 피드백을 주는 “몇 시간짜리 집중 세션”으로 바뀔 수 있다고 했어요.

전반적으로 사람들은 빠른 프로토타이핑, 작업 병렬 처리, 단순 반복 줄이기, 그리고 목표 수준 자체를 높이는 새로운 능력에 열정적이었어요. 한 시니어 엔지니어는 “도구들이 확실히 주니어 엔지니어들을 더 생산적이고 대담하게 만들어서, 도전하는 프로젝트의 종류 자체가 달라졌어요”라고 말했어요. Claude를 쓰면 일을 시작하는 데 필요한 “활성 에너지”가 낮아져서 미루기를 더 쉽게 극복할 수 있다는 이야기도 나왔어요 — “문제를 시작하는 데 필요한 에너지가 극적으로 줄었고, 덕분에 훨씬 더 많은 일에 기꺼이 뛰어들게 됐어요.”

…그리고 줄어드는 실습

동시에, 어떤 사람들은 “위임이 늘수록 기술이 퇴화하는” 것을 걱정했어요. 직접 문제를 풀면서 자연스럽게 일어나는 부수적 학습 — 원래 목적이 아닌데 그 과정에서 시스템을 이해하게 되는 것 — 이 사라지고 있다는 거예요:

“직접 어려운 이슈를 디버그하러 나가면, 문제 해결에 직접적으로 유용하지 않은 문서와 코드를 읽는 데 시간을 써요 — 하지만 그 전체 시간 동안 시스템이 어떻게 작동하는지에 대한 모델을 구축하는 거예요. Claude가 바로 문제까지 데려다줄 수 있으니까, 그런 과정이 훨씬 줄었어요.”

“예전에는 도구가 뭘 할 수 있는지 이해하려고 모든 설정을 일일이 탐색했는데, 이제는 새 도구 사용법을 AI에게 물어봐요. 그러다 보니 전문성이 얕아졌어요. 동료들과 대화할 때 예전에는 바로 떠올릴 수 있던 것들도, 이제는 AI한테 물어봐야 해요.”

“Claude를 쓰면 쉬운 문제를 직접 풀면서 요령을 배우는 단계를 건너뛸 수 있어요. 그러면 나중에 더 복잡한 문제를 만났을 때 어려움을 겪게 돼요.”

한 시니어 엔지니어는 자신이 더 주니어였다면 기술에 대해 더 걱정했을 거라고 말했어요:

“저는 주로 답이 어때야 하는지, 어떤 모습이어야 하는지 아는 경우에 AI를 사용해요. 그 능력은 소프트웨어 엔지니어링을 ‘힘든 방식으로’ 하면서 개발한 거예요… 하지만 [커리어 초기였다면], 모델의 결과를 맹목적으로 수용하기보다 자신의 능력을 계속 키우려면 상당한 의도적 노력이 필요할 거라고 생각해요.”

코딩 기술의 퇴화가 특히 우려되는 이유가 있어요 — “감독의 역설(paradox of supervision)“이에요. Claude를 효과적으로 쓰려면 결과물을 감독해야 하는데, 감독하려면 바로 그 코딩 기술이 필요하고, 그 기술은 AI를 너무 많이 쓰면 퇴화할 수 있는 거예요. 한 사람은 이렇게 말했어요:

“솔직히, 제 기술 자체보다 감독 문제가 훨씬 더 걱정돼요… 기술이 퇴화하거나 성장하지 못하는 게 진짜 문제가 되는 건, 내가 중요하게 여기는 작업에 AI를 안전하게 쓸 수 있느냐에 달려 있어요. 그 작업을 AI 없이 혼자 할 수 있느냐의 문제가 아니라요.”

이에 대응해서 일부 엔지니어들은 의도적으로 AI 없이 연습해요: “가끔은 Claude가 문제를 완벽하게 풀 수 있다는 걸 알면서도, 일부러 안 시켜요. 감각을 유지하는 데 도움이 돼요.”

그 실무 코딩 기술이 여전히 필요할까?

어쩌면 소프트웨어 엔지니어링은 과거에도 그랬듯이, 더 높은 추상화 수준으로 이동하고 있는 건지도 몰라요. 초기 프로그래머들은 기계와 훨씬 가까이서 일했어요 — 메모리를 직접 관리하고, 어셈블리 언어로 코드를 쓰고, 심지어 물리적 스위치를 토글해서 명령을 입력하기도 했죠. 시간이 지나면서 복잡한 저수준 연산을 자동으로 처리하는, 더 읽기 쉬운 고수준 언어가 등장했어요. 특히 “바이브 코딩”의 부상과 함께, 어쩌면 이제는 영어 자체가 프로그래밍 언어가 되고 있는 건지도요. 한 스태프 엔지니어는 성장하고 싶은 엔지니어들에게 “AI에게 코드를 쓰게 하는 데 능숙해지고, 더 높은 수준의 개념과 패턴을 배우는 데 집중하라”고 조언했어요.

몇몇 직원은 이 전환 덕분에 더 높은 수준에서 사고할 수 있게 됐다고 느꼈어요 — 코드 자체가 아니라 “최종 제품과 최종 사용자”에 대해 생각할 수 있게 된 거예요. 한 사람은 예전에 컴퓨터 과학에서 링크드 리스트를 배워야 했던 것과 비교했어요 — 이제는 고수준 언어가 자동으로 처리하는 기본 구조인데요. “그걸 할 줄 알아서 다행이에요… 하지만 저수준 연산을 직접 하는 것 자체가 감정적으로 중요하진 않아요. 코드로 뭘 할 수 있느냐에 더 관심이 가요.” 다른 엔지니어도 비슷한 비유를 했지만, 추상화에는 대가가 따른다고 짚었어요 — 고수준 언어로 넘어가면서 대부분의 엔지니어가 메모리 관리에 대한 깊은 이해를 잃었다는 거예요.

특정 영역에서 기술을 계속 갈고닦으면 Claude를 더 잘 감독하고 더 효율적으로 일할 수 있는 건 맞아요 (“익숙한 분야면, 제가 직접 하는 게 더 빠른 경우가 종종 있어요”). 하지만 그게 정말 중요한지에 대해서는 의견이 나뉘어요. 어떤 사람들은 낙관적이에요:

“기술 퇴화에 대해 너무 걱정하진 않아요. AI가 여전히 문제를 신중하게 생각하게 하고 새로운 접근법을 배우게 해줘요. 오히려 아이디어를 더 빨리 탐색하고 테스트할 수 있게 되면서 일부 영역에서는 학습이 가속화됐어요.”

더 실용적인 시각도 있었어요: “소프트웨어 엔지니어로서 기술이 확실히 퇴화하고 있어요… 하지만 필요하면 다시 돌아올 수 있는 기술이고, 그냥 이제 필요 없는 거예요!” 또 한 사람은 차트 만들기 같은 덜 중요한 기술만 잃었을 뿐, “정작 중요한 코드는 여전히 아주 잘 쓸 수 있다”고 했어요.

아마 가장 흥미로운 관점은, 한 엔지니어가 질문의 전제 자체를 뒤집은 거예요: “‘녹슨다’라는 프레이밍은 코딩이 언젠가 Claude 3.5 이전 시대로 돌아갈 거라는 가정에서 출발해요. 저는 그런 일은 안 일어난다고 봐요.”

소프트웨어 엔지니어링의 장인정신과 의미

직접 코딩하는 것에 대한 감정은 엔지니어마다 크게 갈려요. 진짜 상실감을 느끼는 사람이 있어요:

“저에게는 하나의 시대가 끝나는 거예요 — 25년 동안 프로그래밍을 해왔고, 그 기술에 능숙하다는 느낌이 직업적 만족의 핵심 부분이에요.”

새로운 업무 방식 자체가 즐겁지 않을까 봐 걱정하는 사람도 있어요: “하루 종일 Claude한테 프롬프트만 치는 건 별로 재미있지도, 보람 있지도 않아요. 음악 틀어놓고 몰입 상태에 들어가서 직접 구현하는 게 훨씬 재미있고 보람 있어요.”

트레이드오프를 정면으로 인정하고 받아들인 사람도 있어요: “코드 리팩토링하면서 선(zen) 같은 몰입 상태에 빠지는 것… 분명 그리운 부분이 있어요. 하지만 지금 훨씬 더 생산적이니까, 기꺼이 그걸 포기할 거예요.”

한 사람은 Claude와 주고받으며 작업하는 게 오히려 더 재미있다고 했어요 — 사람한테는 미안해서 못 하는 까다로운 피드백도 거리낌 없이 줄 수 있으니까요. 또 어떤 사람들은 과정보다 결과에 더 관심이 있어요. 한 엔지니어는 이렇게 말했어요:

“이쯤이면 두렵거나 지루할 줄 알았는데… 사실 둘 다 느끼지 않아요. 오히려 훨씬 더 많은 걸 할 수 있어서 꽤 흥분돼요. 코드 작성 자체를 정말 좋아한다고 생각했는데, 사실은 코드 작성으로 얻는 것을 좋아하는 거였어요.”

결국 AI 지원을 반기는지, 직접 코딩의 상실을 아쉬워하는지는 그 사람이 소프트웨어 엔지니어링에서 무엇에 가장 의미를 느끼느냐에 달려 있는 것 같아요.

직장 내 사회적 역학의 변화

가장 두드러진 주제 중 하나는, 예전에 동료에게 가던 질문이 이제 Claude에게 먼저 간다는 거예요. “이제 질문을 전반적으로 훨씬 많이 하는데, 80-90%는 Claude한테 해요”라고 한 직원이 말했어요. 이렇게 되면 일종의 필터가 생겨요 — Claude가 일상적인 질문을 처리하고, 동료에게는 AI 능력을 넘어서는 복잡하고 전략적이고 맥락이 필요한 문제만 남는 거예요 (“팀에 대한 의존도가 80% 줄었어요. 하지만 나머지 20%가 중요해서 그건 직접 가서 대화해요”). Claude에게 “아이디어를 던져보는” 용도로 쓴다는 사람도 있었는데, 인간 동료와의 상호작용과 비슷한 방식이에요.

약 절반은 팀 협업 패턴이 크게 변하지 않았다고 말했어요. 한 엔지니어는 여전히 사람들과 만나고, 맥락을 공유하고, 방향을 정하고 있다고 했어요. 가까운 미래에도 협업은 여전히 많을 텐데, 다만 “표준적인 집중 코딩 시간 대신, 여러 Claude와 대화하게 될 것”이라고 예상했어요.

반면, 동료와의 상호작용이 줄었다고 말하는 사람도 있었어요 (“동료 누구보다 Claude와 훨씬 더 많이 작업해요”). 줄어든 사회적 부담을 고마워하는 사람도 있고 (“동료의 시간을 빼앗는 게 미안하지 않아요”), 변화에 저항하는 사람도 있어요 (“‘Claude에게 물어봤어?‘가 기본 반응이 된 게 정말 싫어요. 사람들과 대면으로 일하는 걸 소중히 여기거든요”). 예전 방식을 그리워하는 목소리도 있었어요: “사람들과 함께 일하는 게 좋은데, 이제 그들이 덜 ‘필요’해진 게 슬퍼요.” 여러 사람이 전통적 멘토링 관계에 미치는 영향도 지적했어요 — 시니어 엔지니어 대신 “Claude가 주니어 직원에게 코칭의 많은 부분을 해줄 수 있으니까”요. 한 시니어 엔지니어의 말:

“후배들이 저에게 질문을 덜 하게 된 게 슬프긴 한데, 확실히 질문에 더 효과적으로 답을 얻고 더 빨리 배우긴 하죠.”

커리어 불확실성과 적응

많은 엔지니어가 자신의 역할이 “코드를 쓰는 것”에서 “AI를 관리하는 것”으로 바뀌고 있다고 말해요. 점점 더 스스로를 “AI 에이전트의 매니저”로 보고 있는 거예요 — 어떤 사람은 이미 “항상 최소 몇 개의 Claude 인스턴스를 돌리고” 있다고 해요. 한 사람은 업무의 “70% 이상이 새 코드를 쓰는 게 아니라 코드를 리뷰하고 수정하는 것”으로 바뀌었다고 추정했고, 또 한 명은 “Claude 1개, 5개, 100개의 결과물에 책임지는 것”이 미래 역할의 일부라고 봤어요.

더 먼 미래를 보면, 커리어 불확실성이 널리 퍼져 있어요. 엔지니어들은 이런 변화를 더 넓은 산업 변혁의 전조로 보고 있었고, 많은 이가 몇 년 뒤 자기 커리어가 어떤 모습일지 “뭐라 말하기 어렵다”고 했어요. 단기적 낙관과 장기적 불안 사이에서 갈등하는 사람도 있었어요. “단기적으로는 낙관적인데, 장기적으로는 결국 AI가 다 하게 되어서 저를 포함한 많은 사람이 필요 없어질 것 같아요”라고 한 사람이 말했어요. 더 직설적인 표현도 있었어요: “매일 출근해서 스스로를 실직시키고 있는 느낌이에요.”

더 낙관적인 사람들도 있었어요. 한 명은 이렇게 말했어요: “주니어 개발자들이 걱정되기는 하지만, 동시에 주니어 개발자들이 새로운 기술에 가장 목마른 사람들이기도 해요. 이 직업의 미래에 대해 전반적으로 매우 낙관적이에요.” 이들은 경험 부족한 엔지니어가 문제 있는 코드를 배포할 위험이 있다는 걸 인정하면서도, 더 나은 AI 안전장치, 더 많은 내장 교육 자원, 그리고 실수를 통한 자연스러운 학습이 시간이 지나면서 분야가 적응하는 데 도움이 될 거라고 했어요.

미래 역할을 어떻게 그리고 있는지, 적응 전략이 있는지 물었어요. 어떤 사람은 더 깊이 전문화할 계획을 말했어요 (“AI의 결과물을 제대로 검토하는 기술을 키우려면 시간이 더 걸리고 더 깊은 전문성이 필요해요”). 어떤 사람은 대인 관계와 전략적 사고에 더 집중하게 될 거라고 예상했어요 (“합의를 찾는 데 더 많은 시간을 쓰고, 구현은 AI에 맡기게 될 거예요”). 한 사람은 커리어 개발 자체에 Claude를 활용해서, 업무와 리더십 기술에 대한 피드백을 받고 있다고 했어요 (“배움의 속도, 아니 완전히 배우지 않고도 효과를 낼 수 있는 속도가 완전히 달라졌어요. 천장이 산산조각 난 느낌이에요”).

전반적으로 많은 이들이 깊은 불확실성을 인정해요: “미래에 어떤 특정 기술이 유용할지에 대해 확신이 매우 낮아요.” 한 팀 리드의 말: “무슨 일이 일어날지 아무도 몰라요… 중요한 건 정말 적응력 있게 사는 거예요.”

• • •

Claude Code 사용 추세

설문조사와 인터뷰 데이터는 Claude 사용 증가가 사람들이 더 빠르게 일하고 새로운 유형의 업무에 도전하는 데 도움을 주고 있음을 보여주지만, AI 위임과 기술 퇴화를 둘러싼 긴장도 함께 드러났어요. 하지만 자가보고 데이터는 이야기의 일부일 뿐이에요. 이를 보완하기 위해 Anthropic 팀 전체의 실제 Claude 사용 데이터도 분석했어요. 설문 응답자들이 Claude Code가 사용량의 대부분이라고 했기 때문에, 프라이버시 보존 분석 도구 5를 사용해서 2025년 2월과 8월의 Claude Code 내부 대화기록 20만 건을 분석했어요.

더 어려운 문제를, 더 적은 감독으로

Claude Code 사용은 지난 6개월간 더 어렵고 자율적인 코딩 작업 방향으로 전환됐어요 (Figure 3):

직원들이 Claude Code로 점점 더 복잡한 작업에 도전하고 있어요. 각 대화기록의 작업 복잡도를 1-5 척도로 추정했는데 (1은 “기본 편집”, 5는 “인간 전문가의 수 주/수 개월의 작업이 필요한 전문가 수준 작업”), 평균 작업 복잡도가 3.2 → 3.8로 증가했어요. 차이를 설명하자면: 3.2 수준의 작업에는 “Python 모듈 임포트 오류 해결” 같은 것이, 3.8 수준의 작업에는 “캐싱 시스템 구현 및 최적화” 같은 것이 포함됐어요.
Claude Code가 대화기록당 연속으로 수행하는 도구 호출(tool call) 최대 횟수가 116% 증가했어요. 도구 호출은 파일 편집이나 명령어 실행 같은 외부 도구 사용 행위에 해당해요. Claude는 이제 인간의 개입 없이 9.8 → 21.2회의 독립적 도구 호출을 연속 수행해요.
인간의 턴(turn) 수가 33% 감소했어요. 대화기록당 평균 인간 턴 수가 6.2 → 4.1로 줄었는데, 이는 6개월 전보다 주어진 작업을 완수하는 데 인간의 입력이 덜 필요함을 시사해요.

그림 3: Claude Code 사용 변화 — 복잡도, 도구 호출, 인간 턴

그림 3: 2025년 2월과 8월 사이 Claude Code 사용 변화. 작업 복잡도 증가(왼쪽), 연속 도구 호출 수 증가(가운데), 인간 턴 수 감소(오른쪽). 오차 막대는 95% 신뢰구간.

이 사용 데이터는 설문 결과를 뒷받침해요: 엔지니어들은 점점 더 복잡한 업무를 Claude에 맡기고 있고, Claude는 더 적은 개입으로도 일을 해내고 있어요. 이것이 관찰된 생산성 향상의 주요 원인일 가능성이 높아요.

작업 분포

Claude Code 대화기록을 하나 이상의 코딩 작업 유형으로 분류하여, 지난 6개월간 다양한 작업에 대한 사용이 어떻게 변화했는지 조사했어요:

그림 4: 전체 레코드 비율(x축)로 나타낸 코딩 작업(y축) 분포. 6개월 전(분홍)과 현재(보라) 비교.

사용 데이터에서 추정한 전체 작업 분포는 자가보고 분포와 대체로 일치해요. 2025년 2월에서 8월 사이 가장 눈에 띄는 변화는, 새 기능 구현(14.3% → 36.9%)과 코드 설계/기획(1.0% → 9.9%)에 Claude를 사용하는 비율이 크게 늘었다라는 점이에요. 이런 비율 변화는 Claude가 이런 복잡한 작업을 더 잘하게 됐다는 뜻일 수 있지만, 절대적 작업량 증가가 아니라 팀들이 Claude Code를 다른 워크플로에 도입하는 방식이 바뀐 것을 반영할 수도 있어요 (자세한 한계점은 부록 참고).

페이퍼컷 수정 (Fixing papercuts)

설문에서 엔지니어들이 작은 삶의 질 개선에 더 많은 시간을 쓰게 됐다는 걸 확인했는데, 실제로 현재 Claude Code 작업의 8.6%가 “페이퍼컷 수정”으로 분류돼요. 성능 시각화 도구를 만들거나 유지보수를 위해 코드를 리팩토링하는 것 같은 비교적 큰 작업부터, 터미널 단축키를 만드는 것 같은 작은 작업까지 포함돼요. 이런 수정들은 엔지니어들이 보고한 생산성 향상에 기여할 수 있어요 — 전에는 뒤로 밀려나던 개선들을 처리하면, 시간이 지나면서 전체 효율성이 올라가고 일상 업무의 마찰과 짜증이 줄어드니까요.

팀별 작업 차이

현재 팀 간 작업 차이를 조사하기 위해, 분류 방식을 정교화하여 각 8월 대화기록에 단일 주요 코딩 작업을 할당하고, 내부 팀별(y축)로 데이터를 나눴어요. 누적 막대 차트는 각 팀의 코딩 작업 구성을 보여줘요:

그림 5: 각 수평 막대는 팀(y축)을 나타내며, 해당 팀의 Claude Code 사용 비율(x축)을 코딩 작업별로 색상 코딩. 맨 위(“전체 팀”)는 전체 분포.

”전체 팀” 막대는 전체 분포를 보여주며, 가장 일반적인 작업은 새 기능 구축, 디버깅, 코드 이해예요. 이는 팀별 비교를 위한 기준선을 제공해요.

주목할 만한 팀별 패턴:

사전 훈련(Pre-training) 팀 (Claude 훈련을 돕는 팀)은 Claude Code를 새 기능 구축에 자주 사용하며 (54.6%), 이 중 많은 부분이 추가 실험 실행이에요.
정렬 및 안전(Alignment & Safety)과 사후 훈련(Post-training) 팀은 Claude Code로 프론트엔드 개발을 가장 많이 하며 (7.5%와 7.4%), 주로 데이터 시각화 생성에 사용해요.
보안(Security) 팀은 Claude Code를 코드 이해에 자주 사용하며 (48.9%), 특히 코드베이스 각 부분의 보안 함의를 분석하고 이해하는 데 써요.
비기술(Non-technical) 직원은 Claude Code를 디버깅에 자주 사용하며 (51.5%), 네트워크 이슈나 Git 작업 해결 등에 쓰고, 데이터 사이언스에도 사용해요 (12.7%). Claude가 기술 지식의 격차를 메우는 데 가치가 있는 것으로 보여요.

이런 팀별 패턴의 상당수가, 설문과 인터뷰에서 확인한 것과 같은 역량 확장을 보여줘요: 시간이나 기술이 부족해서 이전에는 못 했던 새로운 종류의 일을 가능하게 하는 거예요. 예를 들어 사전 훈련 팀은 훨씬 더 많은 실험을 돌렸고, 비기술 직원들은 코드의 오류를 직접 고칠 수 있게 됐어요. 데이터를 보면 팀들이 Claude를 핵심 업무에 사용하기도 하지만 (예: 인프라 팀이 인프라 및 DevOps에 가장 많이 사용), 핵심 업무를 보완하는 용도로도 써요 (예: 연구자들이 데이터 시각화를 위해 프론트엔드 개발에 사용). Claude가 모든 사람을 자기 영역에서 더 풀스택으로 만들어주고 있다는 뜻이에요.

• • •

전망 (Looking Forward)

Anthropic 직원들은 지난 1년간 Claude 사용을 크게 늘렸어요. 기존 업무를 빠르게 하는 것뿐 아니라, 새 코드베이스를 배우고, 단순 반복을 줄이고, 새 영역으로 확장하고, 전에는 방치했던 개선 사항을 처리하는 데도 쓰고 있어요. Claude가 더 자율적이고 뛰어나질수록, 엔지니어들은 AI에 맡기는 새로운 방법을 찾는 동시에 앞으로 어떤 기술이 필요할지도 고민하고 있어요. 이런 전환은 분명한 생산성과 학습의 이점을 가져오지만, 소프트웨어 엔지니어링 업무의 장기적 방향에 대한 진짜 불확실성도 함께 가져와요. 여러 엔지니어가 시사한 것처럼, 이 변화가 과거의 전환 — 저수준에서 고수준 프로그래밍 언어로, 개인 기여자에서 매니저로 — 과 비슷할까요? 아니면 훨씬 더 먼 곳까지 갈까요?

아직 초기 단계예요 — Anthropic 내부에 얼리 어답터가 많고, 환경이 빠르게 바뀌고 있어서, 이 결과가 지금 당장 다른 조직이나 맥락에 그대로 적용되지는 않을 거예요 (자세한 한계점은 부록 참고). 이 연구 자체가 그런 불확실성을 반영하고 있어요 — 결과에는 뉘앙스가 많고, 하나의 합의나 명확한 방향이 나오지는 않거든요. 하지만 이런 변화를 어떻게 사려 깊고 효과적으로 헤쳐나갈 것인지에 대한 질문은 분명히 던지고 있어요.

이 초기 연구에 이어 몇 가지 후속 조치를 진행하고 있어요. Anthropic 엔지니어, 연구원, 리더십과 대화하면서 드러난 기회와 과제를 다루고 있어요. 팀을 어떻게 모으고 서로 협업할지, 전문성 개발을 어떻게 지원할지, AI 보강 업무의 모범 사례를 어떻게 수립할지 (예: AI 유창성 프레임워크 기반) 같은 문제예요. 또한 이 연구를 엔지니어 너머로 확대해서 AI 변혁이 조직 전반의 역할에 어떤 영향을 미치는지 파악하고 있고, CodePath6 같은 외부 조직이 AI 보조 미래에 맞춰 컴퓨터 과학 교육과정을 조정하는 것도 지원하고 있어요. 앞으로는 AI 역량이 발전함에 따라 점점 더 중요해질 구조적 접근도 검토하고 있어요 — 역할 진화나 조직 내 재교육을 위한 새로운 경로 같은 것이요.

2026년에 생각이 더 무르익으면 더 구체적인 계획을 공유할 예정이에요. Anthropic은 책임 있는 직장 전환을 위한 실험실이에요. AI가 업무를 어떻게 바꾸는지 연구하는 데 그치지 않고, 그 변화를 사려 깊게 헤쳐나가는 방법까지 직접 실험하고 싶어요 — 저희 자신부터 시작해서요.

• • •

부록: 한계점

방법론적 한계: 이 연구에는 여러 한계가 있어요. 편의 표집과 목적 표집을 모두 사용했고, 설문 응답률은 31%였어요. Claude에 특별히 관심이 있거나 강한 의견(긍정적이든 부정적이든)을 가진 사람들이 응답할 가능성이 더 높은 선택 편향이 있을 수 있어요.

편향 가능성: 응답이 익명이 아니고 모든 참여자가 Anthropic 직원이므로, 사회적으로 바람직한 방향으로 답변이 치우쳤을 수 있어요. 또한 12개월 전의 생산성과 사용 패턴을 회상하도록 요청하는 것은 기억 왜곡의 영향을 받을 수 있어요. 자가보고 생산성은 본질적으로 추정이 어려우므로, 이런 수치는 어느 정도 여유를 두고 해석해야 해요.

데이터 분석 한계: Claude Code 분석은 시기별 비례 표집을 사용하기 때문에, 작업 분포의 상대적 변화만 측정할 수 있어요. 예를 들어 기능 구현이 Claude Code 사용의 14%에서 37%로 늘었다고 해서, 전체 기능 구현 작업량 자체가 늘었다는 뜻은 아니에요.

시점의 한계: 이 연구는 2025년 8월에 진행되었으며 Claude Sonnet 4와 Claude Opus 4가 최신 모델이었어요. AI 발전 속도를 감안하면, 관찰된 패턴은 더 새로운 모델이 나오면서 이미 변했을 수 있어요.

역자 주

페이퍼컷(papercuts): 종이에 베이는 작은 상처에서 유래한 표현으로, 소프트웨어에서 치명적이지는 않지만 사용자 경험을 갉아먹는 사소한 불편이나 버그를 뜻해요. 하나하나는 별것 아니지만 쌓이면 전체 생산성에 큰 영향을 미쳐요. ↩
METR(Model Evaluation & Threat Research): AI 시스템의 능력과 위험성을 독립적으로 평가하는 비영리 연구 단체예요. AI가 자율적으로 행동할 수 있는 수준을 측정하는 벤치마크를 개발하며, 여기서 인용된 연구에서는 숙련 개발자들이 AI로 인한 생산성 향상을 실제보다 높게 인식하는 경향을 발견했어요. ↩
바이브 코딩(vibe coding): 2025년 2월 Andrej Karpathy(전 Tesla AI 총괄, OpenAI 공동 창립 멤버)가 만든 용어예요. 코드의 세부 구현을 직접 작성하지 않고, AI에게 자연어로 원하는 결과를 설명한 뒤 생성된 코드를 “분위기(vibe)“로 검토하며 진행하는 개발 방식을 뜻해요. ↩
콜드 스타트 문제(cold start problem): 원래는 추천 시스템이나 데이터베이스에서 쓰이는 용어로, 새 사용자나 새 아이템에 대한 정보가 없어서 적절한 추천이나 처리를 못 하는 상태를 말해요. 여기서는 Claude가 팀의 코드베이스에 대한 맥락 없이 처음 시작할 때 효과적으로 작업하기 어려운 상황을 비유적으로 표현한 거예요. ↩
Clio: Anthropic이 개발한 프라이버시 보존 분석 도구예요. 개별 사용자의 대화 내용을 직접 열람하지 않으면서도, AI 사용 패턴과 트렌드를 분석할 수 있도록 설계됐어요. 대화를 자동으로 추상화·분류해서 통계적 인사이트를 추출하는 방식으로 작동해요. ↩
CodePath: 미국의 비영리 컴퓨터 과학 교육 단체로, 주로 소외 계층 대학생들에게 실무 중심의 소프트웨어 개발 교육을 제공해요. 여기서는 AI 시대에 맞춰 교육과정을 재설계하는 파트너 사례로 언급됐어요. ↩

저자: Saffron Huang (프로젝트 리드), Bryan Seethor, Esin Durmus, Kunal Handa, Miles McCain, Michael Stern, Deep Ganguli

참고: 이 글은 Anthropic이 자사 리서치 블로그에 게시한 아티클을 번역한 것입니다.

원문: How AI is transforming work at Anthropic — Saffron Huang 외, Anthropic (2025년 12월 2일)

생성: Claude (Anthropic)

총괄: 존 (디노이저denoiser)