LLM 시장의 구조와 역학: 가격, 공급, 수요의 분석
게시일: 2025년 12월 19일 | 원문 작성일: 2025년 12월 12일 | 저자: Mert Demirer, Andrey Fradkin, Nadav Tadelis, Sida Peng | 원문 보기
핵심 요약
OpenRouter와 Microsoft Azure의 대규모 데이터를 분석해 LLM API 시장의 구조와 역학을 실증적으로 파악한 연구예요. 6가지 핵심 발견을 통해 시장의 현재 상태를 보여줘요.
- 오픈소스가 주도하는 폭발적 성장 — 2025년 모델 수 253개→651개, 제공자 27개→90개. 성장의 대부분은 오픈소스 생태계에서 나왔어요.
- 극심한 가격 차이 — 오픈소스 모델은 동일 지능 수준의 클로즈드소스 모델 대비 약 90% 저렴하지만, 시장 점유율은 30% 미만이에요.
- GPT-4급 모델 가격 1,000배 하락 — 2년 만에 품질 대비 가격이 급락. 품질 조정 기준으로 엄청난 디플레이션이 일어나고 있어요.
- 어떤 모델도 모든 용도에서 최고가 아니다 — 프로그래밍, 번역, SEO 등 각 카테고리마다 선호 모델이 다르고, 지불 의향도 천차만별이에요.
- 제본스 역설은 아직 없다 — 가격 탄력성* -1.11로, 단기적으로 가격 하락이 총 사용량 폭증으로 이어지지는 않고 있어요.
• • •
들어가며: LLM 시장을 들여다보다
AI가 뜨겁다는 건 다들 알지만, LLM API 시장이 어떻게 돌아가는지 실제 데이터로 본 적은 없을 거예요. 이 연구는 LLM 애그리게이터 OpenRouter와 Microsoft Azure의 대규모 데이터를 결합해서, 시장의 공급, 수요, 가격 역학을 처음으로 체계적으로 분석했어요.
연구진은 6가지 핵심 발견(Core Facts)을 도출했는데, 이 발견들은 AI 시장이 어디로 향하고 있는지에 대한 중요한 시사점을 던져줘요.
• • •
LLM 시장의 구조: 누가 뭘 하나?
LLM 시장을 이해하려면 먼저 수직적 공급망을 알아야 해요. 모델이 만들어져서 API로 제공되기까지 여러 플레이어가 관여하거든요.
| 역할 | 설명 | 예시 |
|---|---|---|
| LLM 크리에이터 | 모델을 설계, 훈련, 배포하는 주체 | OpenAI, Anthropic, Meta, Google |
| 추론 제공자 | 모델 실행을 위한 컴퓨팅 인프라 운영 | AWS, Azure, GCP, Together AI, Groq |
| 애그리게이터 | 다양한 모델에 통합 API 접근 제공 | OpenRouter |
클로즈드소스 크리에이터(OpenAI, Anthropic 등)는 모델 가중치를 비공개로 유지하고 가격을 마음대로 정할 수 있어요. 반면 오픈소스 크리에이터(Meta의 Llama 등)는 모델을 공개해서 누구나 호스팅하고 서비스할 수 있게 하죠.
이 차이가 가격 경쟁에서 결정적인 역할을 해요.
• • •
발견 1: 공급 측면의 폭발적 성장
핵심 수치
- API로 제공되는 모델 수: 253개 → 651개 (2025년 1월→12월)
- 크리에이터 수: 43개 → 85개
- 추론 제공자 수: 27개 → 90개
- 오픈소스 모델 434개 vs 클로즈드소스 217개
LLM 시장의 성장은 거의 전적으로 오픈소스 생태계가 주도하고 있어요. 오픈소스 크리에이터는 75개로 늘어난 반면, 클로즈드소스 크리에이터는 10개 수준에서 정체 상태예요.
특히 눈에 띄는 건 추론 제공자들의 경쟁이에요. 같은 오픈소스 모델을 10개 이상의 업체가 호스팅하는 경우가 14개나 돼요. 이들은 가격뿐 아니라 지연 시간(latency)과 처리량(throughput)에서도 경쟁해요. 최고 성능 업체와 최저 성능 업체 간 속도 차이가 5배 이상이거든요.
모델의 품질도 꾸준히 향상되고 있어요. 시간이 갈수록 새로 나오는 모델들의 평균 지능 지수가 계속 올라가고 있죠.
• • •
발견 2: 가격 역학과 지능의 비용
충격적인 수치
- GPT-4급 모델의 가격: 2년 만에 1,000배 하락
- 오픈소스 vs 클로즈드소스: 동일 지능 수준에서 오픈소스가 약 87% 저렴
- 가격 변동 확률: 오픈소스 5.5%/주 vs 클로즈드소스 1.8%/주
시장에서는 엄청난 가격 차이가 존재해요. 같은 시점에 가장 비싼 모델(상위 10%)과 가장 저렴한 모델(하위 10%) 사이에 50~150배나 가격이 벌어져요.
더 흥미로운 건 지능과 가격의 관계예요. 벤치마크 점수가 10% 올라가면 가격은 20~30% 올라가는 식이에요. 똑똑해질수록 가격 프리미엄이 기하급수적으로 붙죠.
그런데 여기서 경제학적 퍼즐이 등장해요: 오픈소스 모델이 87%나 저렴한데, 왜 시장 점유율은 30% 미만일까요? 이건 비가격 요인(브랜드 신뢰, 지원, 프라이버시 등)이 중요하다는 뜻이거나, 현재 벤치마크가 사용자들이 실제로 중요하게 여기는 품질 차원을 제대로 측정하지 못한다는 뜻이에요.
• • •
발견 3: 치열한 시장 경쟁과 빠른 교체
LLM 시장은 극도로 역동적이에요. 선두 자리가 자주 바뀌고, 신생 업체가 기존 강자를 빠르게 밀어내요.
크리에이터 수준에서는 2025년 내내 Google과 Anthropic이 치열하게 경쟁해왔는데, 최근 xAI가 Grok Code Fast 1을 출시하면서 상당한 점유율을 빼앗았어요.
더 극적인 건 개별 모델 수준이에요:
- 현재 사용량 상위 10개 모델은 4개월 전에는 시장 점유율 20%에 불과했어요
- 10개월 전에는 이 모델들이 아예 존재하지도 않았어요
이건 시장에서 창조적 파괴(creative destruction)1가 극단적인 속도로 일어나고 있다는 뜻이에요.
그런데 흥미롭게도, 대다수 토큰은 최신 프론티어 모델에서 나오지 않아요. 2025년 12월 기준으로 전체 토큰의 90%가 벤치마크 점수 약 60점대 모델에서 처리되는데, 최고 성능 모델은 70점 이상이거든요. 많은 사용자가 굳이 최신 모델에 프리미엄을 지불할 필요가 없다고 보는 거예요.
• • •
발견 4: 수직적 · 수평적 차별화
수백 개의 모델이 다양한 가격과 성능으로 공존할 수 있는 이유는 차별화 때문이에요. 수직적 차별화는 “더 좋은 품질”(성능 차이)이고, 수평적 차별화는 “다른 용도에 특화”(코딩용, 번역용 등)예요.
| 사용 카테고리 | 요구 지능 수준 | 지불 의향 (백만 토큰당) |
|---|---|---|
| 프로그래밍 | 0.51 (높음) | 중간 |
| 과학 | 0.47 | 중간 |
| 번역 | 0.32 (낮음) | 낮음 |
| SEO | 중간 | $1.40 (최고) |
| 법률 | 중간 | $0.16 (최저 수준) |
핵심 발견: 어떤 단일 모델도 모든 사용 사례에서 지배적이지 않아요. 각 카테고리마다 리더가 다르고, 그 리더십도 계속 바뀌어요.
예를 들어 프로그래밍 분야에서는 Anthropic의 Claude 시리즈가 리더였다가, xAI의 특화 모델 Grok Code Fast 1 출시 이후 리더십이 바뀌었어요.
허핀달-허쉬만 지수(HHI)2로 시장 집중도를 분석해보면, 개별 카테고리 내에서는 집중도가 매우 높아요(예: 번역은 사실상 두 회사가 거의 독점). 하지만 전체 시장을 보면 집중도가 훨씬 낮아요. 특정 분야를 장악해도 시장 전체를 지배하기는 어렵다는 뜻이에요.
• • •
발견 5: 기업의 멀티호밍 패턴
Microsoft Azure 데이터를 통해 기업들이 어떻게 LLM을 채택하는지 살펴봤어요. 멀티호밍(multi-homing)이란 여러 LLM을 동시에 사용하는 것을 말해요.
기업 채택 패턴
- 단일 모델 사용 기업 비율: 75% (2023년 중반) → 50% (2025년 중반)
- 하지만 멀티호밍 기업도 지출의 90% 이상을 단일 주력 모델에 집중
이 패턴이 시사하는 건 뭘까요? 대부분의 기업에서 멀티호밍은 실험(experimentation)의 성격이 강해요. 이것저것 테스트해보지만, 핵심 업무에 여러 모델을 본격적으로 쓰지는 않는다는 뜻이에요.
• • •
발견 6: 수요 탄력성과 제본스 역설
AI 업계의 큰 질문 중 하나: 가격이 내려가면 사용량이 폭발적으로 늘어날까? 이건 제본스 역설(Jevons Paradox)과 관련된 질문이에요. 19세기 영국의 경제학자 윌리엄 제본스가 발견한 현상인데, 석탄 효율이 좋아지면 오히려 석탄 총 소비량이 늘어났다는 거예요. 기술이 저렴해지면 더 많이 쓰게 된다는 이론이죠.
연구진은 똑같은 오픈소스 모델을 여러 제공자가 서로 다른 가격에 파는 상황을 분석했어요. 모델은 같으니 품질 차이는 없고, 순수하게 가격이 수요에 미치는 영향만 볼 수 있죠.
핵심 결과
가격 탄력성: -1.11
가격이 10% 내려가면 해당 제공자의 토큰 수요가 11.1% 증가한다는 뜻이에요.
이 결과는 단기적으로 제본스 역설이 작동하지 않는다는 증거예요. 탄력성이 1보다 약간 높긴 하지만, 이건 대부분 “A업체가 비싸지면 같은 모델을 파는 B업체로 옮기는” 대체 효과예요. 시장 전체 가격이 내려간다고 해서 토큰 소비가 폭증하지는 않는다는 거죠.
물론 이건 단기적 분석이에요. 장기적으로 기업들이 새로운 애플리케이션을 개발하고 워크플로우를 조정하면서, 가격 하락이 엄청난 사용량 증가로 이어질 가능성은 여전히 열려 있어요.
• • •
시사점: 이 시장은 어디로?
이 연구는 LLM API 시장이 빠른 전환기에 있다는 걸 보여줘요.
- 공급 측면: 오픈소스 모델과 추론 제공자의 폭발적 증가가 경쟁을 심화시키고 있어요
- 가격: 품질 조정 기준으로 급격한 하락세. 오픈소스와 클로즈드소스 간 가격 격차가 큼
- 경쟁 구조: 어떤 모델도 시장 전체를 지배하지 못하고, 카테고리별 특화 경쟁이 이뤄짐
- 수요: 기업들은 아직 실험 단계. 멀티호밍은 늘지만 실제 통합은 단일 모델에 집중
오픈소스 생태계의 성장은 사용자에게 더 낮은 가격, 더 많은 선택지, 빠른 혁신이라는 혜택을 주고 있어요. 앞으로 기업들이 이 기술을 핵심 업무에 어떻게 통합해 나갈지가 시장의 다음 단계를 결정할 거예요.
역자 주
- 창조적 파괴(Creative Destruction): 경제학자 조지프 슘페터(Joseph Schumpeter)가 제시한 개념. 혁신적인 신기술이나 새로운 기업이 기존 기술과 기업을 밀어내면서 경제가 발전한다는 이론이에요. 마치 스마트폰이 피처폰을 대체하고, 스트리밍이 DVD를 대체한 것처럼요. ↩
- 허핀달-허쉬만 지수(HHI): 시장 집중도를 측정하는 경제학 지표. 각 기업의 시장 점유율을 제곱해서 더한 값이에요. 0에 가까우면 완전 경쟁, 10,000이면 완전 독점. 예를 들어 점유율 50%, 50%인 시장은 HHI가 5,000(=50²+50²)이고, 점유율 90%, 10%인 시장은 HHI가 8,200(=90²+10²)이에요. 미국 법무부는 1,500 이상이면 집중된 시장으로 봐요. ↩
- 가격 탄력성(Price Elasticity): 가격이 변할 때 수요가 얼마나 변하는지 나타내는 지표. -1.11이라는 건 가격이 10% 내려가면 수요가 11.1% 늘어난다는 뜻이에요. 탄력성이 -1보다 크면(예: -1.5) 가격 인하가 매출 증가로 이어지고, -1보다 작으면(예: -0.5) 가격 인하해도 매출은 오히려 줄어요. ↩
저자 소개: Mert Demirer(MIT), Andrey Fradkin(Boston University), Nadav Tadelis(Microsoft Research), Sida Peng(Microsoft Research). 이 연구는 OpenRouter와 Microsoft Azure의 대규모 데이터셋을 활용한 실증 연구입니다.
참고: 이 글은 “The Emerging Market for Intelligence” 연구 논문의 핵심 발견을 요약한 것입니다. 원문은 데이터 분석 방법론과 추가 그래프를 포함하고 있습니다.
원문: The Emerging Market for Intelligence: Pricing, Supply, and Demand for LLMs - Demirer, Fradkin, Tadelis, Peng (2025년 12월 12일)
생성: Claude (Anthropic)