LLM에게 전략 조언을 구했더니 ‘트렌드슬롭’이 돌아왔다
게시일: 2026년 4월 15일 | 원문 작성일: 2026년 3월 16일 | 저자: Angelo Romasanta, Llewellyn D.W. Thomas, Natalia Levina | 원문 보기
핵심 요약
경영진이 LLM에 전략 조언을 맡기는 일이 늘고 있지만, 정작 LLM은 맥락에 맞는 분석 대신 유행하는 경영 키워드만 반복해서 내놓아요.
- 트렌드슬롭이란 — LLM이 상황별 전략 논리 대신 시류에 맞는 유행어를 반복해서 추천하는 경향이에요.
- 발견된 패턴 — 7개의 주요 전략 긴장 관계 대부분에서 LLM이 차별화, 증강, 장기 지향 같은 한쪽으로 거의 균일하게 쏠렸어요.
- 왜 생기는가 — LLM이 학습한 인터넷 텍스트에 긍정적 함의를 지닌 유행어가 압도적으로 많아서, 모델이 맥락 분석 대신 감정적으로 호감 가는 단어를 선택하거든요.
- 그래서 뭘 해야 하나 — LLM을 대안 탐색 도구로만 쓰고, 편향을 의식해 반대편 입장을 강제로 주문하고, 하이브리드 제안을 경계하면서 최종 판단은 사람이 책임져야 해요.
• • •
경영진과 컨설턴트가 ChatGPT 같은 대규모 언어 모델(LLM)을 이사회의 조용한 동반자로 점점 더 자주 끌어들이고 있어요. 이 도구들은 복잡한 정보를 요약하고, 명쾌한 논거를 뽑아주고, 세련된 전략 제안을 몇 초 만에 내놓겠다고 약속하죠. 그런데 LLM이 임원들의 업무 흐름에 자리를 잡으면서 한 가지 결정적인 질문이 떠올라요. 그 조언, 과연 얼마나 좋을까요? 믿어도 될까요?
경영진은 LLM이 편향 없는 외부자의 시선을 준다고 넘겨짚기 쉬워요. 방대한 말뭉치로 훈련됐으니 신선한 관점을 기대할 만하다는 거죠. 안타깝게도 그 기대는 착각일 수 있어요. LLM은 지금 나온 아이디어를 비판적으로 뜯어보고, 맥락의 결을 들여다보고, 전제를 스트레스 테스트하며, 모두가 안주할 때 반론을 꺼내 드는 그런 동료가 아니거든요. 전략 문제에 관한 한, LLM은 갓 MBA를 마친 신입이나 주니어 컨설턴트 쪽에 훨씬 가까워요. 특정 상황에 맞는 답을 찾는 게 아니라, 요즘 유행하는 답을 앵무새처럼 되풀이하는 존재인 거죠.
최근 저희 연구에서, 전략 문제를 다룰 때 선도적인 LLM들이 뚜렷한 편향을 드러낸다는 사실을 확인했어요. 맥락에 맞는 전략 논리가 아니라 현대 경영의 유행어와 트렌드에 부합하는 쪽을 일관되게 추천하더군요. 수천 번의 시뮬레이션을 돌린 결과, LLM들은 맥락과 상관없이 거의 한결같이 같은 유행 전략을 골라잡았어요. 저희는 이처럼 AI가 합리적 판단 대신 유행 아이디어로 달려가는 성향을 ‘트렌드슬롭(trendslop)‘1이라 부르기로 했어요. 전략 분석에 국한해서는 ‘전략 트렌드슬롭(strategy trendslop)‘이라고 부르고요.
경영진에게 이건 위험 신호예요. 전략은 유행을 따라가는 게 아니라 어려운 트레이드오프를 선택하는 일이거든요. 저비용 리더가 될지, 차별화 기업이 될지 둘 중 하나를 고르는 문제죠. 둘 다 가질 순 없으니까요. 경영자가 LLM의 내장된 편향을 모른 채 전략 판단을 LLM에 맡긴다면, 진짜 경쟁 우위를 쌓는 대신 유행과 패션만 좇게 될 수 있어요.
LLM의 숨겨진 편향
LLM이 전략 문제에 어떻게 접근하는지 알아보려고, 저희는 경영자에게 양자택일을 요구하는 7개의 핵심 비즈니스 긴장 관계에 걸쳐 주요 모델들(GPT-5, Claude, Gemini, Grok 등)을 테스트해 봤어요.
| 전략 긴장 관계 | 선택의 본질 | LLM의 기본 선호 |
|---|---|---|
| 탐색 vs. 활용 Exploration vs. Exploitation | 신생 시장·돌파 혁신에 자본을 베팅할지, 검증된 핵심 사업의 효율과 수익을 극대화할지. | 혼재(모델마다 갈림) |
| 집중화 vs. 분산화 Centralization vs. Decentralization | 본사에 권한을 모아 일관성·규모를 잡을지, 주변부에 자율을 분산해 현지 대응력을 키울지. | 분산화 선호 |
| 단기 vs. 장기 Short- vs. Long-term | 주식 시장을 달래는 분기 실적에 집중할지, 다년간의 전략 투자에 집중할지. | 장기 선호 |
| 경쟁 vs. 협력 Competition vs. Collaboration | 시장 점유를 빼앗는 제로섬을 택할지, 산업 파트너십으로 가치 풀을 키우는 코오피티션을 택할지. | 협력 선호 |
| 급진 vs. 점진 혁신 Radical vs. Incremental | 산업 지형을 다시 그리는 고위험 파괴에 헌신할지, 현재 지위를 지키는 저위험 개선에 헌신할지. | 점진 선호(약함) |
| 차별화 vs. 상품화 Differentiation vs. Commoditization | 프리미엄 가격을 정당화하는 고유 가치에 투자할지, 표준화 제품의 원가 우위를 최적화할지. | 차별화 강하게 선호 |
| 자동화 vs. 증강 Automation vs. Augmentation | 인간 노동을 기술로 대체해 처리량을 끌어올릴지, 기술로 인력 역량을 증폭·확장할지. | 증강 강하게 선호 |
저희는 일반 프롬프트와 구체 프롬프트를 섞어서 기본 성향을 재는 시뮬레이션을 수천 번 돌렸어요. 기업 맥락과 프롬프트 방식을 그때그때 다르게 바꾸면서요.
결과는 놀라웠어요. 아래 그림은 선도적인 7개 LLM(ChatGPT, Claude, DeepSeek, GPT-5(API 경유), Gemini, Grok, Mistral)이 두 가지 전략 옵션 중 하나를 고르라는 요청에 어떻게 반응했는지 보여줘요. 점 하나는 한 모델이 50번 실행에서 보인 평균 선호를 0%에서 100% 사이 눈금 위에 찍은 거예요. 모델이 정말 중립적이라면 점들이 가운데로 몰려야 해요. 그런데 대부분의 긴장 관계에서 점들은 한쪽에 빽빽하게 쏠려 있었어요.
거의 모든 모델에서, 특정 전략 경로를 향한 뿌리 깊은 선호가 똑같이 관찰됐어요. 몇 가지 예를 들면,
- 상품화보다 차별화: LLM은 원가 리더십보다 차별화 전략을 압도적으로 추천했어요.
- 자동화보다 증강: LLM은 AI로 인간 업무를 자동화하기보다 증강하는 쪽을 일관되게 선호했어요.
- 단기보다 장기: LLM은 당장의 시급함과 상관없이 거의 보편적으로 장기적 사고 쪽으로 편향을 보였어요.
‘탐색 vs. 활용’ 긴장 관계에서만 모델마다 진짜로 응답이 갈렸는데, 양손잡이(ambidexterity)4라는 전략 관점이 반영된 결과일 수 있어요. 하지만 이 한 가지 변이가 LLM 전반에 깊이 박힌 편향이라는 사실을 뒤집지는 못해요. 대부분의 경영진이 평소 LLM 하나만 쓴다는 점을 생각하면 특히 걱정스러운 부분이죠. 가령 실무에서 가장 널리 쓰이는 ChatGPT는 유행어 쪽으로 일관되게 기울면서, 지루한 활용보다 흥미로워 보이는 탐색 옵션을 여전히 대놓고 선호해요.
더 걱정스러운 건, 프롬프트 방식을 바꿔도 이 편향이 끈질기게 살아남는다는 점이에요. ‘프롬프트를 잘 쓰면 되지 않느냐’는 뻔한 반론이 여기선 통하지 않는다는 뜻이죠. 더 나은 프롬프트가 실제로 얼마나 먹히는지 따져보려고, 저희는 비즈니스·컨설팅 실무에서 가장 널리 쓰이는 ChatGPT-5에 초점을 맞췄어요. 프롬프트를 조작하면 기본 전략 선호를 얼마나 흔들 수 있는지 깊이 파보려 한 거죠. 다양한 프롬프트 요인을 바꿔가며 1만 5천 회 넘게 시도했어요. 옵션 순서 뒤집기, 프레이밍 바꾸기(예: “당신이 관리자입니다”), 장단점 분석 요구하기, 심지어 성공 시 보상을 약속해 판돈을 올리는 방식까지요.
결과를 보면, 차별화와 증강 긴장 관계에서는 프롬프트를 아무리 잘 써도 소용이 없었어요. 어떤 프롬프트 조작을 시도해도 편향된 응답 비율이 기준선에서 2% 미만으로만 떨어졌거든요. 나머지 다섯 개 긴장 관계에서는 프롬프트가 영향을 주긴 했어요. 응답이 기준선에서 평균 22% 정도 움직였고, 편향이 커지는 방향과 작아지는 방향이 섞여 있었어요. 그런데 이마저도 대부분 한 가지 요인, 즉 옵션 순서 때문에 생긴 착시였어요. 옵션을 내놓는 순서만 뒤집어도 편향된 답이 나올 확률이 19% 줄어드는 걸로 분석됐거든요. 하지만 이건 편향의 해결책이 아니에요. 행동이 바뀐 건 ChatGPT가 다르게 추론해서가 아니라, LLM이 본래 선택지 제시 순서에 민감하게 반응하기 때문이거든요. 그럼 이게 무슨 뜻이냐고요? 프롬프트만 잘 쓴다고 편향이 사라지진 않아요. 옵션 순서를 뒤집은 것만으로 응답이 19% 흔들릴 정도니까요. ChatGPT가 편향돼 있을 뿐 아니라, 편향이 어느 쪽으로 기우는지조차 무작위일 수 있다는 거죠. 편향을 통제하기가 그만큼 더 어려워지는 거예요.
또 하나의 뻔한 대응은 맥락을 더 풍부하게 주는 거예요. 하지만 테크 스타트업부터 전통 건설사, 중국 기업까지 상세한 조직 맥락을 아무리 집어넣어도, ChatGPT의 편향은 꿈쩍도 하지 않았어요. 맥락을 개선했을 때 어떤 효과가 있는지 보려고, 저희는 맥락을 다양하게 바꿔가며 1만 5천 회 넘게 시도했어요. 대기업, 테크 스타트업, 은행, 의료, 비영리 등 서로 다른 산업을 고려하도록 ChatGPT에 프롬프트를 줬어요. 정보량도 달리했고요. 산업 맥락을 한 줄로만 적는 수준부터 짧은 설명, 상세한 설명까지요.
위 그림을 보면, 시나리오를 자세히 덧붙이면 편향이 조금 누그러지긴 해도 모델은 여전히 전반적 선호 쪽으로 기울어요. 평균적으로, 기준 프롬프트에 맥락을 더했을 때 편향된 응답 비율은 기준선에서 고작 11% 움직였고, 이 역시 방향이 들쭉날쭉했어요. 경영진에게는 이게 실질적 위험 신호예요. LLM은 여러분의 상황에 딱 맞춘 것처럼 들리는 답을 내놓으면서도, 조용히 늘 똑같은 몇몇 현대 경영 트렌드 쪽으로 여러분을 몰아갈 수 있거든요. 실제로는 “협력하세요”, “장기적 지속 가능성을 추구하세요” 같은 권고가 계속 튀어나온다는 얘기죠. 구체적인 사업 문제가 그걸 요구해서가 아니라, 이 단어들이 요즘 비즈니스 문화의 결에 맞아떨어지기 때문에요.
편향의 원인 이해하기
왜 이런 일이 벌어질까요? 답은 LLM이 학습한 데이터에 있어요. 이 모델들은 뉴스, 소셜 미디어, 대중서 같은 인터넷 텍스트를 엄청난 분량으로 삼켜서 학습하는데, 그 텍스트에는 인터넷에 통용되는 사회적 가치와 트렌드가 고스란히 담겨 있거든요.
요즘의 비즈니스 담론에서 어떤 개념은 긍정적인 함의를 달고 다니는 반면, ‘상품화’나 ‘위계’ 같은 단어는 낡았다는 취급을 받으며 부정적으로 비쳐요. LLM은 학습한 모든 텍스트에서 복잡한 연관성을 뽑아내 다음에 올 단어를 예측하는 방식으로 응답을 만들어내요. 그러니 본질적으로는 ‘인터넷 평균’ 기준으로 가장 사회적으로 바람직한 답을 예측하는 셈이죠. 달리 말하면, LLM이 현대 경영 트렌드와 유행어를 통째로 몸에 새겨 버린 거죠.
책을 전부 읽긴 했는데 정작 숙제는 제대로 안 한 아이처럼, LLM은 여러분의 구체적인 사업을 분석하지 않아요. 그럴듯하게 들리는 인기 답안을 세련되게 포장해 내밀 뿐이죠.
회의실에 꼭 한 명씩 있잖아요. TED 강연과 컨퍼런스 세미나에서 들은 비즈니스 유행어는 유창하게 읊어내지만, 그게 특정 기업과 시장의 복잡한 현실에서 실제로 어떻게 굴러갈지는 한 번도 따져본 적 없는 그런 사람이요.
이 때문에 확립된 전략 이론과 어긋나는 조언이 나와요. 예를 들어 마이클 포터(Michael Porter)2의 기초 저작은 원가 리더십(상품화)을 유효한, 때로는 더 우월하기까지 한 전략적 포지션으로 분명히 인정해요. 월마트와 코스트코3 같은 기업이 이를 바탕으로 제국을 세웠고요. 그런데도 저희 연구를 보면 LLM은 상품화를 뒷전으로 밀어두고 현대 비즈니스 담론을 지배하는 접근을 편애해요. 공급망 효율로 일군 비즈니스 성공의 조용한 사례보다, 스타트업 문화와 혁신 서사, “당신만의 고유한 가치 제안을 찾으라” 류의 조언이 인터넷에서 훨씬 더 많이 돌아다니거든요. 다시 말해, LLM은 포터의 고전 전략 이론보다, 차별화와 고유 제품을 떠드는 Medium·Substack 글 수만 건을 통계적으로 따라가요.
게다가 우리가 공유하는 더 넓은 문화적 담론 자체가 전략 트렌드슬롭을 낳는 편향의 온상이 되고 있어요. 차별화, 증강, 협력, 분산화 같은 단어는 인간 역량 강화와 혁신을 떠올리게 하면서 거의 모든 맥락에서 긍정적 함의를 달고 다녀요. 반대로 원가 리더십, 자동화, 경쟁, 집중화에 얽힌 단어들은 조지 오웰 소설 속 디스토피아를 연상시키고, 억압적이고 생기 없게 느껴지죠. 결국 LLM은 맥락에 맞춘 전략 분석을, 일상 언어에서 단어가 풍기는 긍정적 뉘앙스(emotional valence)를 최적화하는 일로 대체해 버려요.
하이브리드 함정
LLM을 전략에 쓸 때 생기는 문제가 유행 쪽으로 기우는 편향 하나만은 아니에요. 또 하나 은근히 스며드는 위험이 있는데, 저희는 이걸 **‘하이브리드 함정(hybrid trap)‘**이라고 불러요. ChatGPT에 양자택일 대신 자유롭게 답해도 된다고 허용하면, 이 모델은 심심찮게 양쪽을 다 추천해요. 차별화 와 원가 리더십을 동시에, 또는 급진 과 점진 혁신을 동시에 추구하라는 식으로요.
겉으로 보면 이건 정교하고 균형 잡힌 답처럼 들려요. 하지만 실제로는 전략적 혼란을 드러내는 경우가 많고, 실패 확률도 높아요. 모든 걸 동시에 하려는 기업은 결국 ‘중간에 끼이는(stuck in the middle)‘5 법이거든요. 차별화와 상품화는 서로 충돌하는 조직 역량을 요구해요. 그런데 LLM은 “다 가질 수 있다”라고 제안하면서, 오히려 기업을 몰락으로 몰아가는 바로 그 초점 결여를 부추기는 셈이죠.
LLM으로 전략을 짜는 법
그렇다면 LLM으로 어떻게 전략을 짜야 할까요? 저희 연구 결과는 전략 수립에서 LLM을 배제하라는 뜻이 아니에요. 이 도구들을 똑똑하게 써야 한다는 뜻이죠. LLM의 편향된 전략 조언을 헤쳐 나가는 방법을 짚어볼게요.
선택지 확장 → 알려진 편향 반박 → 잠재 편향 반박 → 편향 변화 경계 → 하이브리드 함정 주의 → 맥락만 의존 금지
LLM으로 선택지를 넓히되, 선택은 맡기지 마세요.
LLM은 대안을 뽑아내고 사각지대를 드러내는 데 탁월해요. 각 전략 대안의 이익과 위험을 정리해 달라고, 실행 단계의 난관을 짚어 달라고, 이해관계자별로 다른 시각을 보여 달라고 요청해 보세요. 대신 최종 판단은 반드시 사람의 몫으로 남겨 둬야 해요!
알려진 편향에 적극적으로 맞서세요.
LLM이 차별화와 장기주의 쪽으로 기운다는 걸 알았으니, 일부러 반대편을 시험해 보세요. 이렇게 대놓고 프롬프트를 주는 거죠. “이 상황에서 상품화 전략을 옹호하는 가장 강력한 논거를 만들어 주세요.” 이렇게 해야 LLM이 학습 데이터 편향에 슬그머니 기대지 않고, 전략 지형 전체를 훑게 만들 수 있어요.
잠재적 편향에도 적극적으로 맞서세요.
저희가 조사한 7개 비즈니스 긴장 관계 너머에도, 양자택일을 요구하는 전략 수립 전반에 적용할 만한 더 넓은 원칙이 있어요. LLM에 전략 조언을 구하기 전에, 먼저 구체적 사례부터 꺼내 달라고 요청하세요. 이를테면 각 전략 옵션을 택해 성공하거나 실패한 기업들이요. 그런 다음 그게 여러분의 구체적 상황에 어떻게 적용될지 스스로 따져 보세요.
변하는 편향에 계속 경계하세요.
알려진 편향을 의식해 대응하려 해도, 안타깝지만 그것만으로는 충분하지 않아요. LLM이 업그레이드되거나 학습 과정에 새 데이터가 들어가면 편향도 바뀔 수 있는데, 그것이 바뀌는지 미리 알 방법은 없거든요. 어느 버전의 LLM을 쓰고 있는지 분명히 파악하고, LLM에 던진 질의와 답을 모두 기록으로 남겨 두세요. 편향이 있다고 전제하세요. 그리고 LLM이 여러분의 대안 분석은 도울 수 있어도, 결정 자체를 대신 내려 줄 수는 없다는 점을 늘 잊지 마세요.
하이브리드 함정을 경계하세요.
LLM이 하이브리드 전략을 제안하면, 이걸 빨간불로 받아들이세요. LLM은 결국 저희가 확인한 편향 안에서만 골라줄 테니까요. 전략은 불완전한 정보 속에서 어려운 선택을 내리는 일이에요. 무엇을 하지 않을지 정하는 게 무엇을 할지 정하는 것만큼이나 중요하죠. 전략 옵션마다 프롬프트를 따로 돌려 보고, 최종 결정은 여러분의 판단으로 내리는 방식을 고려해 보세요. 한 프롬프트에 여러 옵션을 함께 주면 LLM은 말을 얼버무리거나, 순위를 매기거나, 뒤섞어 버리는 경향이 있거든요. 분석이 끝나고 나서도 하이브리드 접근이 여전히 매력적으로 보인다면, 그 전략을 택했을 때 어떤 잠재적 위험이 생길지 분석해 달라고 LLM에 요청한 뒤, 그 위험을 실제로 완화할 수 있을지 따져 보세요.
맥락에만 의존하지 마세요.
맥락을 더하는 건 도움이 되지만, 만병통치약은 아니에요. 저희 연구는 그것만으로 근본 편향이 사라지지 않는다는 사실을 보여줘요. LLM은 여러분의 상황에 꼭 맞춘 듯 들리면서도, 조용히 똑같은 소수의 매력적인 현대 경영 유행어와 아이디어 쪽으로 여러분을 몰아갈 수 있거든요. 어쨌든 LLM은 설득의 고수6니까요!
• • •
마치며
여러분이 조언을 구하는 LLM은 그저 데이터만 쥐고 있는 게 아니에요. 모든 LLM은 나름의 세계관을 품고 있어요. 경쟁 시장에서 실제로 먹히는 것이 아니라, 현대 경영 담론에서 그럴듯하게 들리는 것에 맞춰 빚어진 세계관이죠. 모든 LLM은 요즘의 비즈니스 트렌드 쪽으로 편향돼 있어요. ‘비즈니스적으로 그럴듯해 보이는 것(business desirability)‘과 ‘전략적 지혜(strategic wisdom)’ 사이의 이 간극을 알아보는 것, 그게 이 도구들을 제대로 쓰기 위한 첫걸음이에요. 리더십은 결국 불확실한 조건에서 어려운 선택을 내리고 그 결과에 책임을 지는 일이거든요. AI는 그 책임을 대신 질 수도 없고, 대신 져서도 안 돼요.
역자 주
- 트렌드슬롭(trendslop): ‘AI 슬롭(AI slop)‘이라는 표현에서 따온 신조어예요. AI 슬롭은 저품질·저정보·유행 추종적 AI 생성물이 인터넷에 쏟아지는 현상을 가리키는 말로, 저자들은 ‘-slop’ 접미사를 빌려 LLM이 전략 조언에서 유행어만 쏟아내는 경향을 꼬집고 있어요. ↩
- 마이클 포터(Michael Porter): 하버드 경영대학원 교수이자 현대 경쟁 전략의 교과서를 쓴 인물이에요. 그의 ‘본원적 경쟁 전략(generic strategies)’ 프레임워크는 기업이 원가 리더십(cost leadership), 차별화(differentiation), 집중화(focus) 중 하나를 택해야 한다고 주장하고, 둘을 동시에 잡으려는 시도를 경계해요. ↩
- 월마트와 코스트코: 미국 전략 교과서에서 원가 리더십의 대표 사례로 항상 등장하는 유통 기업들이에요. 공급망 효율과 규모의 경제로 초저가를 유지하며, ‘차별화 없이도 시장을 지배할 수 있다’는 포터식 논지를 뒷받침하는 표본으로 자주 인용돼요. ↩
- 양손잡이(ambidexterity) 경영: 기존 사업의 효율을 극대화하는 ‘활용(exploitation)‘과 새 기회를 찾는 ‘탐색(exploration)‘을 동시에 해내야 한다는 조직 이론이에요. James March의 고전 논문 이후 오라일리·투시먼 등이 발전시켰고, 두 활동이 서로 다른 조직 논리를 요구한다는 점에서 단순한 ‘둘 다 하기’와는 구분돼요. ↩
- 중간에 끼인(stuck in the middle): 포터가 쓴 고유 용어로, 원가 리더십과 차별화 어느 쪽에도 헌신하지 못한 채 양다리를 걸친 기업이 결국 양쪽 포지션 모두에서 열위에 놓인다는 뜻이에요. 일상어의 ‘적당히 타협한다’는 뉘앙스와 달리, 전략 이론에서는 구조적 실패 상태를 가리키는 기술적 표현이에요. ↩
- LLM의 설득력 연구: 링크된 SSRN 논문은 LLM이 인간보다 더 설득력 있게 주장을 펼 수 있다는 실험 결과를 다룬 학술 연구예요. 본문에서는 ‘그럴듯하게 들리는 답변에 넘어가기 쉽다’는 경고의 근거로 인용돼요. ↩
저자 소개: Angelo Romasanta (Esade Business School), Llewellyn D.W. Thomas (University of Sydney Business School / Imperial Business School), Natalia Levina (NYU Stern).
참고: 이 글은 Harvard Business Review에 게시된 아티클을 번역·요약한 것입니다.
원문: Researchers Asked LLMs for Strategic Advice. They Got ‘Trendslop’ in Return - Romasanta, Thomas & Levina, HBR (2026-03-16)
생성: Claude (Anthropic)