← 메인으로

생성형 비디오 가속주의를 옹호하며

게시일: 2025년 10월 27일 | 원문 작성일: 2025년 10월 13일 | 저자: Byrne Hobart (The Diff) | 원문 보기

생성형 비디오 가속주의

핵심 요약

저자는 다소 도발적인 주장을 펼쳐요. 생성형 AI로 만든 가짜 비디오가 너무 흔해져서 모든 비디오를 의심하게 되는 세상이 오히려 좋다는 거죠. 왜냐하면 지금도 우리는 비디오를 너무 쉽게 믿고 있거든요. 역사적으로 봤을 때, 인쇄술 같은 새로운 기술이 등장할 때마다 비슷한 걱정이 있었지만, 결국 사회 규범이 적응하면서 오히려 긍정적인 결과를 가져왔다는 게 저자의 논지예요.

주요 내용:

  • 비디오를 너무 쉽게 믿는 현재가 문제예요 - 영상은 텍스트보다 더 실감나서 드물게 일어나는 일을 흔한 일처럼 느끼게 만들죠
  • 기술이 바뀌면 규범도 바뀌어요 - 휴대폰이 나왔을 때도 “언제든 전화받아야 하나?” 걱정했지만, 지금은 음성메일로 보내는 게 당연하잖아요
  • 인쇄술의 역사가 반복돼요 - 책이 대량생산되면서 거짓 정보가 퍼진다고 걱정했지만, 결국 정보 접근성이 높아진 게 더 중요했죠
  • 의견 불일치가 건강해요 - 시장, 법률, 학계 모두 사람들이 의견이 다르기 때문에 제대로 작동하거든요

왜 이게 도발적인 주장인가요?

저자는 사람들에게 이 얘기를 하면 스캔들처럼 받아들여진다고 해요. “언젠가 모든 비디오가 가짜라고 가정해야 하는 날을 기대한다”고 말하면요. 대부분의 사람들은 이런 미래를 디스토피아로 생각하죠. 하지만 저자는 이렇게 반문해요.

지금 당장 기술적으로는 완전히 가짜인 상황의 비디오를 만들 수 있어요. 실제 사람을 이용해서요. 그리고 이걸 진짜라고 공유하면, 보는 사람들은 실제로 일어나지 않은 일을 믿게 되죠. 하지만 이건 사회적 규범이 정적으로 유지된다고 가정할 때만 문제예요.

휴대폰 사례: 기술이 바뀌면 규범도 바뀌어요

휴대폰이 처음 나왔을 때 사람들이 걱정했던 게 뭔지 아세요? “이제 어디서든 전화벨이 울리면 받아야 하는 거 아냐?”였어요. 왜냐하면 당시 규범이 그랬거든요. 자동응답기도 없고 발신자 표시도 없던 시절에는 전화벨이 울리면 무조건 받았어요. 중요하고 긴급한 일일 수도 있고, 다시 연락할 방법도 없으니까요.

하지만 그 규범은 기술 발전을 따라가지 못했어요. 지금은 전화를 음성메일로 보내도 큰일 아니에요. 문자나 이메일 같은 비동기 소통 수단도 있고요. 이런 규범 변화는 위에서 강제로 내려온 게 아니었어요. AT&T CEO나 대통령이 기자회견해서 “이제부터 저녁 식사 중에 전화해도 되고, 안 받아도 됩니다”라고 선언한 게 아니라는 거죠. 그냥 천천히 다른 규범이 만들어졌고, 전화벨 소리에 대한 반응이 달라진 거예요.

인쇄술: 500년 전에도 똑같은 걱정을 했어요

생성형 비디오에 대한 걱정을 역사적으로 재생해보면 재밌어요. 구텐베르크의 인쇄술 얘기죠. 경제적 차이는 있지만 일반적인 효과는 비슷했어요. 책과 팸플릿이 갑자기 훨씬 싸졌거든요.

그리고 알치안-앨런 효과(Alchian-Allen effect)가 작동했어요. 책 제작 비용이 엄청나게 비쌀 때는 품질과 관계없이 비용이 비싸니까, 가장 고품질의 책만 제작할 가치가 있었죠. 하지만 대량생산이 가능해지면서:

인쇄술 이전인쇄술 이후
생산 비용: 엄청나게 비쌈생산 비용: 대폭 하락
누가 만드나: 왕과 대주교만누가 만드나: 누구든지
내용: 권위자가 승인한 것내용: 저질 콘텐츠와 허위 정보 포함
신뢰성: 높음 (소수만 제작)신뢰성: 혼재 (누구나 제작)
접근성: 매우 낮음 (14세기 유럽 최대 도서관이 2천 권 미만)접근성: 대폭 증가

당시 문자 세계에 익숙한 권위자들 입장에서 보면 이건 인식론적 재앙이었어요. “왜 사람들에게 거짓말을 하거나 쓰레기를 무한정 생산하는 도구를 원하겠어요?”

하지만 뒤돌아보면, 그 시대의 정보 빈곤이 진짜 재앙이었다는 걸 알 수 있어요. 맨더빌의 여행기(Mandeville’s Travels) 같은 건 양을 키우는 나무나 프레스터 존의 왕국 같은 황당한 얘기로 가득했지만, 마르코 폴로의 “종이를 돈으로 쓴다”거나 “특별한 흙에 불을 붙여서 발사체를 날린다”는 이상한 주장보다 훨씬 인기가 많았죠. (근데 마르코 폴로가 맞았잖아요.)

비디오의 문제: 너무 실감나서 과신하게 돼요

진실을 찾는다는 관점에서, 비디오는 텍스트보다 나빠요. 반드시 거짓 정보를 전달해서가 아니라, 과신을 유발하기 때문이에요.

텍스트를 읽을 때는 눈으로 기호들을 훑고, 그걸 단어로 바꾸고, 다시 개념으로 바꿔요. 하지만 비디오는 소리와 움직이는 영상을 경험하는 건데, 이게 정확히 실제 삶을 경험하는 방식이에요. 그래서 비디오는 항상 더 실감나게 느껴지죠.

그리고 ‘정상’이라고 생각하는 게 경험한 것의 함수이기 때문에, 비디오는 어떤 것들을 실제보다 훨씬 더 흔하게 느끼게 만들어요. 채널이 많아지고, 스트리밍이 생기고, 비디오 녹화 장비가 늘어나면서, 거의 모든 것에 대한 비디오 증거를 찾기가 꽤 쉬워졌어요.

Fox를 하루 종일 보면, 도널드 트럼프가 용감하고 사려 깊은 리더로, 항상 문법적으로 올바른 문장으로 말하는 걸로 보여요. MSNBC를 보면 지금 일어나는 일에 대한 당신의 견해는 완전히 다르지만, 똑같이 비디오 증거로 뒷받침되죠.

소셜 미디어는 이걸 왜곡된 방식으로 악화시켜요. 가장 바이럴한 비디오 콘텐츠는 새롭고 충격적인 거예요. 하지만 사람들이 공유하면서, 이런 종류의 일이 항상 일어난다는 게 모두의 공통 지식이 되죠.

가짜 비디오가 흔해지면 어떻게 되나요?

생성형 비디오로 인해 비디오 제작 비용이 낮아지면, 실제로 이 문제가 해결돼요. 큰 미디어 기업들이 어떤 비디오를 홍보할지 선택하는 문제는 여전히 있지만, 소셜 미디어에서는 생성형 비디오가 청중이 믿고 싶은 것의 터무니없이 과장된 버전을 항상 보여주면서 현실을 이길 수 있어요. 텍스트의 경우에도 처음에는 가장 선정적이고 날조된 콘텐츠가 주를 이뤘지만, 결국에는 큰 출판사들이 사실에 대해 기본적으로 거짓말을 하지 않는 미디어 생태계로 필터링됐던 것처럼 말이죠. (물론 내러티브를 구성하는 방식에는 자연스러운 편향이 스며들지만요.)

결국 “X에 대한 비디오를 봤어요”라고 말하는 건 “X에 대한 트윗을 봤어요”라고 말하는 것만큼 설득력이 있을 거예요. 사실일 수도 있고 아닐 수도 있고, 텍스트 증거만으로 뭔가를 믿는 건 꽤 부끄러운 일이죠. 특히 그게 믿기 어려운 거라면요.

기술 변화와 규범 적응 과정

graph TD A["새로운 기술 등장"] --> B["초기: 기존 규범과 충돌"] B --> C{{"사람들의 반응"}} C -->|걱정| D["인식론적 위기 우려"] C -->|적응| E["새로운 사용 패턴 실험"] D --> F["권위자들의 제한 시도"] E --> F F --> G["제한의 비효율성 드러남"] G --> H["새로운 규범 형성"] H --> I["기술의 긍정적 측면 부각"] I --> J["사회 전체의 적응 완료"] J --> K["다음 기술 혁신..."]

왜 의견 불일치가 오히려 좋은가요?

생성형 비디오가 만드는 상황이 여전히 위험하게 느껴질 수 있어요. 이념적 버전의 바벨탑 붕괴 같은 거죠. 우리 모두 조금씩 덜 확신하게 되고, 완전히 메울 수 없는 의견 불일치가 더 많아질 거예요. 이게 불건강해 보여요.

하지만 이건 실제로 꽤 잘 작동하는 제도들에 대한 설명이기도 해요. 인류의 가장 정교하고 비싼 진실 추구 노력 중 하나가 바로 시장이에요. 시장은 뉴스가 좋은지 나쁜지, 누구에게, 어느 정도인지 대략적으로 알려줄 수 있어요.

시장이 작동하는 데 필요한 연료가 뭔지 아세요? 바로 시장 참여자들의 진실에 대한 의견 불일치예요! 사실 사람들이 무엇이 중요한지에 대해 근본적으로 동의하지 않을 때 시장은 더 잘 작동해요. 그게 시장 움직임을 더 무작위로 보이게 만들고, 유동성 공급자들이 매수호가와 매도호가를 제시할 때 더 적은 위험에 직면하게 되거든요.

같은 거래가 일어나는 이유도 천차만별이에요:

  • 애널리스트가 회사의 비즈니스 전망을 신중히 평가해서 주식이 싸다고 판단해서
  • 누군가가 로보어드바이저를 통해 월간 ETF 매수를 자동 실행해서
  • 통계적 차익거래 모델이 주식이 동종 업체 대비 성과에서 벗어나서 다시 돌아올 것 같다고 판단해서
  • 매크로 투자자가 인플레이션에 대한 자신의 견해에 유용한 프록시로 주식을 찾아서
  • 옵션 마켓메이커나 전환사채 차익거래자가 델타를 헤지해야 해서
  • 해커가 이사회 멤버의 이메일에 접근해서 회사가 큰 프리미엄으로 인수 제안을 받아들일 것을 알아서

이 거래 상대방들은 사실적인 포인트에 대해 동의하지 않을 뿐만 아니라, 시장이 뭘 위한 건지에 대한 양립 불가능한 견해를 가지고 있어요. 저축 수단? 존경하는 경영진과 파트너십을 맺는 방법? 도박 도구? 범죄 장소? 아니면 다른 뭔가?

전체 시스템이 잘 작동하는 이유는 거래할 때 정보 일부를 드러내도록 인센티브를 받기 때문이에요. (즉, 주식이 어느 방향으로 가야 한다고 생각하는지.) 마찬가지로, 널리 합의된 신뢰성의 외부 출처가 적다면, 더 많은 사람들이 자신의 견해를 더 신뢰할 만하게 만드는 데 노력을 투자해야 해요. 그걸 하는 가장 게으르고 효과적인 방법은 실제로 옳을 때만 강한 신념을 갖는 것이죠.

법률과 학계도 마찬가지예요

명시적으로 진실 추구를 목표로 하는 법률과 학계도 이런 특징을 가지고 있어요. 적대적 법률 시스템은 명시적으로 양측이 공통 정보에 접근하면서도 그 신뢰성과 해당 사건과의 관련성에 대해 다른 견해를 가진다는 아이디어를 받아들여요.

학계에서는 독창적인 것을 출판하는 건 부분적으로 이전 작업을 기반으로 하는 방법이지만, 두 가지 주장 중 하나로 해석될 수도 있어요. 해당 분야의 다른 모든 사람이 중요한 걸 놓쳤거나, 누군가가 뭔가를 매우 잘못 이해해서 수정이 필요하다는 거죠.

보편적으로 신뢰받는 공통 진실의 출처가 있다면, 시장, 법률 시스템, 학계가 존재를 정당화하기 어려워요. 그냥 근본적인 진실의 조회 테이블 인터페이스 말고는요. 하지만 현실은 그렇게 작동하지 않아요.

결론: 건강한 회의주의를 향해

생성형 비디오는 움직이는 이미지의 팬들에게 이게 예술적 표현을 위한 재밌는 매체이긴 하지만 세상을 이해하는 방법은 아니라는 걸 인정하도록 강제할 거예요.

저자가 보기에 이런 변화는 중세 시대의 정보 빈곤에서 벗어난 것처럼, 현재의 “비디오면 다 믿는” 상태에서 벗어나는 진전이에요. 물론 과도기는 혼란스러울 거예요. 역사를 보면 항상 그랬죠. 하지만 사람들은 적응해요. 새로운 규범이 형성되고, 더 건강한 회의주의가 자리잡을 거예요.

결국 “비디오로 봤어요”가 “트윗으로 봤어요”만큼의 증거 가치를 갖게 되는 날이 올 거예요. 그리고 그게 디스토피아가 아니라, 우리가 마침내 영상 매체를 제대로 이해하게 되는 순간이 될 거예요.

참고: 이 글은 Byrne Hobart가 The Diff 뉴스레터에 게시한 아티클을 번역하고 요약한 것입니다.

원문: https://www.thediff.co/archive/in-defense-of-generative-video-accelerationism/

생성: Claude (Anthropic)

총괄: (디노이저denoiser)