AI가 채울 수 없는 저널리즘 공백에 대한 공포가 NYT 소송을 부르다(Fear of a journalistic void that AI can't fill sparks lawsuits)

Generative AI, which creates images, videos, and text on command, is shaking up the creative ecosystem. This is because generative AI is evolving day by day through mass language learning (LLM) and machine learning, threatening human jobs and increasing the threat of copyright infringement in the process of learning.

The New York Times, the world's No. 1 subscription news media, sued OpenAI, Microsoft and other AI tool developers in late December 2023 for copyright infringement, accusing them of using article content for AI training without their permission;

This is the first time a major U.S. news organization has sued an AI platform company for unauthorized use of copyrighted material. However, copyright infringement due to AI learning is likely to occur in all media organizations, and similar legal disputes are likely to occur. But the New York Times' lawsuit goes beyond copyright infringement and can be seen as a check on "AI journalism. The New York Times, the world's No. 1 news subscription media, may not be safe if the era of checking everything with AI instead of journalists becomes widespread.

For journalism to be sustainable, the potential benefits of AI models based on news content must be balanced with safeguards for the providers of that content, such as monetary compensation for the use of AI or broader regulation of AI-generated news stories.

주어진 명령에 따라 이미지, 비디오, 텍스트를 만들어내는 생성AI가 창작 생태계를 흔들고 있다. 생성AI는 대량언어학습(LLM)과 머신러닝을 통해 나날이 진화하면서 인간의 일자리를 위협하고 학습을 하는 과정에서 저작권 침해 위협도 증가하고 있기 때문이다.

글로벌 1위 구독 뉴스 미디어 뉴욕타임스(The New York Times)가 2023년 12월 말 오픈AI와 마이크로소프트 등 AI 툴 개발 기업을 저작권 침해(copyright infringement)로 고소했다. 자신들의 허락 없이 AI학습을 위해 기사 콘텐츠를 사용했다는 것이다.

미국 메이저 언론사가 기사 저작권 무단 사용을 이유로 AI 플랫폼 기업을 고소한 것은 이번이 처음이다. 하지만, AI학습으로 인한 저작권 침해는 모든 언론사에 해당해 유사한 법적 분쟁이 일어날 가능성이 크다.

그러나 뉴욕타임스의 소송은 저작권 침해를 넘어 'AI저널리즘'에 대한 견제로도 볼 수 있다. 언론이 아닌 AI에게 모든 것을 확인하고 물어보는 시대가 확산된다면 글로벌 1위 뉴스 구독 미디어 뉴욕타임스도 안전할 수 없다.

[NYT “수백만 건 기사가 AI챗봇 훈련에 무단 사용”]

뉴욕 맨하탄 법원에 제기된 이번 소송은 뉴욕타임스가 발행한 수백만 건의 기사가 자동화된 챗봇을 훈련시키는 데 사용되었으며, 심지어 이 챗봇은 뉴스 매체와 경쟁하고 있다고 주장하고 있다. 다만 뉴욕타임스는 이번 소송에서 금전적 요구 수준을 명기 하지 않았다.

그러나 피고들(마이크로소프트 오픈AI)은 뉴욕타임스의 저작물의 불법 복제 및 기사를 무단으로 사용한 것에 대해 수십억 달러의 법적 및 실적적 손해에 책임을 져야 한다고 명시했다. (unlawful copying and use of The Times’s uniquely valuable works) 배상 규모가 수억 달러에 해당할 수 있다는 것을 예상케 하는 대목이다.

[NYT의 요구, 보상과 데이터 파기]

NYT는 소송에서 모든 상황을 원상 복구하길 원했다. 보상과 함께 타임즈의 저작권이 있는 자료를 사용하는 모든 챗봇 모델과 트레이닝 데이터를 파기할 것을 요구했다. 뉴욕타임스는 지난 4월 마이크로소프트와 오픈AI에 저작권 침해 우려를 전달하고 협상을 진행해 왔다. 당시 뉴욕타임스는 기사 콘텐츠 사용에 대한 금전적 보상과 기술적 가이드레일 등 원만한 해결 방안(amicable resolution)을 찾기 위해 접촉을 이어갔다고 공개했다. 그러나 양 측은 최종 결론을 내지 못했고 결국 소송으로 이어졌다.

오픈AI 대변인 린제이(Lindsey)는 자료에서 “회사는 뉴욕타임스와 건설적인 협상을 이어갔지만 소송을 제기한 것에 대해 놀랐고 실망했다”고 설명했다. 오픈AI는 또 “우리는 콘텐츠 크리에이터와 저작권 보유자의 권리를 존중한다”며 “또 AI기술 사용에 대한 이점과 새로운 매출 모델의 혜택을 누릴 수 있도록 노력했다”고 강조했다. 하지만, 마이크로소프트는 공개 답변을 거부했다.

[뉴욕타임스가 시작한 ‘뉴스 VS AI’ 전쟁]

뉴욕타임스가 시작한 ‘뉴스 VS AI전쟁’은 이제 시작이다. 이번 소송에서 우리는 ‘AI이용에 따른 뉴스 저작권 보호 방향’, ‘보상 수준’, ‘보상 방법’ 등을 모두 엿볼 수 있다. AI가 지배하는 세상에서 뉴스미디어가 저작권을 지키며 보상 받는 방법의 바이블로 작용할 수 있다. 생성AI가 뉴스 미디어에 영향을 미치는 이유는 대규모 데이터 세트를 학습한 후 텍스트와 이미지나 비디오 등의 콘텐츠를 만들어낼 수 있기 때문이다. 지면에서 온라인 구독 저널리즘으로의 변신에 성공한 뉴욕타임스도 AI의 기사 무단 사용을 막지 못할 경우 수익이 급감할 수 있다.

이와 함께 뉴스 미디어들의 불만은 ‘자신들의 콘텐츠를 이용해 오픈AI 등 AI플랫폼이 자사의 회사 가치를 높이는 데 활용했다는 것이다. 실제, AI테크 기업들은 뉴스와 방송 등 언론사들의 기사 콘텐츠를 무단으로 사용해 복제하는 능력을 통해 수십억 달러를 투자 받았다.

챗GPT의 오픈AI는 800억 달러가 넘는 시장 가치를 인정 받고 있다. 마이크로소프트는 오픈AI에 1,300억 달러 투자를 약속했으며 검색 엔진 빙 등 자사 오피스 제품이 오픈AI의 기술을 탑재하고 있다. 블룸버그는 2023년 12월 23일 오픈AI가 1,000억 달러 규모의 새로운 펀딩을 논의 중이라고 보도했다. 이 경우 역대 최대 가치의 스타트업에 등극할 수 있다.

언론사들은 AI기업들을 향해 콘텐츠를 무단 이용해 이익을 높이는 이른바 ‘무임승차(Free-ride)’를 하고 있다고 비난의 수위를 높였다. 뉴욕타임스는 소장에서 “엄청난 투자를 통해 만들어 놓은 (NYT) 저널리즘에 AI기업들이 무임승차했다” 며 “이들은 뉴욕타임스 콘텐츠 사용에 대한 어떠한 금전적 보상없이 타임스를 대체하는 콘텐츠를 만들고 오디언스를 뺏아 갔다”고 비난했다.

마이크로소프트나 오픈AI 등도 뉴스 미디어들의 잠재적 저작권 소송에 대비하고 있었다. 마이크로소프트는 2023년 9월 AI툴을 사용한 고객들이 저작권 소송에 휘말릴 경우 이를 배상하고 소송 비용을 지원하겠다고 밝힌 바 있다.

기술 진영에선 빅테크를 엄호하는 흐름도 있다. 과거 빌 클린턴 정부 시절, 인터넷 플랫폼이 이용자들이 올린 콘텐츠의 선정성과 저작권 위반 사례로 공격 받자, 통신품위유지법(DCA)에 면책조항(섹션230)을 만들어 낸 것과 유사한 흐름이다. 섹션 230에 따라 인터넷 플랫폼들을 블라인드, 삭제 등 일정 수준의 조치를 취할 경우 콘텐츠의 문제로 인한 처벌에서 면제된다.

2023년 10월 벤처캐피탈이자 오픈AI의 초기 투자자인 안데르센 호로위츠(Andreessen Horowitz)는 미국 저작권청에 보낸 서한에서 “AI기업들이 저작권 책임에 노출될 경우 개발이 느려지거나 고사될 것”이라고 경고했다. 그는 “저작권 콘텐츠들을 AI훈련에 사용하는 것은 공정 이용에 해당한다”며 “만약 AI 개발에 지나치게 저작권을 주장한다면 미국의 AI 기술 경쟁력은 크게 퇴보할 것”이라고 강조했다.

[ AI는 뉴스 미디어의 잠재적 경쟁자]

뉴욕타임스가 오픈AI와 마이크로소프트에 소송을 제기한 이유는 저작권 보호에만 그치지 않는다. ‘모든 이들이 AI에 묻는 상황’에서 오픈AI가 NYT의 잠재적인 경쟁자가 될 수도 있다는 우려도 작동했다.

NYT는 소송을 뉴스 산업의 잠재적인 경쟁자를 견제하겠다는 포석으로 삼았다. 이슈나 특정 개념에 대한 사람들의 질문에 답을 만들어내는 생성AI의 기능은 언론의 사회적 역할과 유사할 수 있다. 독자들이 검색이나 언론사이트를 방문하지 않아도 궁금증을 해소할 수 있게 된 것이다. AI의 이용은 결국 뉴스 웹 트래픽 감소와 광고와 구독 매출의 저하를 불러 올 수 있다.

NYT는 소장에서 AI 챗봇이 뉴욕타임스 유료 기사를 무단으로 사용해 제공한 사용자에게 유료 구독기사를 무단 사용한 사례를 여럿 공개했다. 이에 대해 오픈AI와 마이크로소프트는 자료의 신뢰성과 정확성 때문에 AI 프로그램 훈련에 뉴욕타임스 기사를 사용하고 있다고 주장했다.

뉴욕타임스 소장 중

또 소장에서 NYT는 챗GPT 기반 마이크로소프트 검색 엔진 '브라우즈 위드 빙(Browse With Bing)'이 뉴욕타임스 유료 제품 리뷰 사이트 와이어커터( Wirecutter)의 결과를 거의 그대로 노출한 사례도 지적했다. 빙에 노출된 텍스트는 와이어커터 기사로 연동되지 않았고 와이어커터(Wirecutter)가 추천을 기반으로 판매 수수료를 생성하는 데 사용하는 텍스트의 추천 링크도 제거됐다고 NYT는 밝혔다.

뉴욕타임스는 또한 AI사용으로 인한 잠재적인 브랜드 이미지 훼손도 지적했다. 이른바 ‘AI 환각(A.I. hallucinations)으로 인한 회사의 신뢰도 하락이다. AI환각은 챗봇이 허위 정보를 제공한 뒤 출처를 잘못 표현하는 것을 말한다. 이와 관련 NYT는 소장에서 마이크로소프트의 빙챗(Bing Chat)이 뉴욕타임스로부터 발췌했다고 하는 정보의 부정확성도 지적했다. 뉴욕타임스에 보도되었다고 언급한 내용 상당수가 실제 기사화된 것이 없었던 것이다. 뉴욕타임스는 “타임스 등 뉴스 미디어가 AI로부터 보호받지 못한다면, AI가 생산할 수 없는 저널리즘의 공백이 생길 것”이라며 “이는 저널리즘의 위축과 이로 인한 엄청난 사회적 비용 증대로 이어질 것”이라고 설명했다.

뉴욕타임스는 8월 AI툴이 학습용으로 뉴욕타임스 콘텐츠에 접근하는 것을 막은 바 있다. 이 움직임인 CNN과 BBC에도 확산됐다. 뉴욕타임스, 월스트리트저널, 복스미디어 등은 지난 2023년 6월 AI와의 협상을 위한 연대 결성을 추진하기도 했다.

뉴욕타임스는 이번 소송의 법률 대리인으로 서스만 고드프리(Susman Godfrey)와 로스웰(Rothwell), 피그*Figg), 에른스트 앤 맨벡 로펌(Ernst & Manbeck)을 선임했다. 특히, 서스만의 경우 폭스뉴스를 상대로 한 선거 개표 시스템 도미니언 보팅 시스템(Dominion Voting Systems)의 명예 훼손 소송을 대리해 7억 8,750만 달러의 합의금을 받아내 유명해졌다. 서스만은 또한 논픽션 작가들을 대행해 마이크로소프트와 오픈AI를 상대로 집단 소송도 진행했다. 이들의 AI시스템이 작가들의 책과 다른 작품의 저작권을 침해했다는 논리다.

[크리에이티브 산업과 AI전쟁]

물론 뉴스 미디어들도 생성AI의 확산에 대응하고 있다. 일부 언론사들은 이미 AI플랫폼과 뉴스 사용에 대한 보상과 합의를 마쳤다. AP는 2023년 7월 비즈니스 인사이더와 폴리티코를 보유한 독일 미디어 악셀 스프링거(Axel Springer)는 12월 오픈AI와 잠재적인 뉴스 데이터 사용에 대한 합의를 끝냈다.

합의로 오픈AI는 지난 1985년 이후 AP의 기사를 모두 AI훈련에 사용할 수 있게 됐다. 구체적인 금전 보상 수준은 공개되지 않았다.

AI를 저널리즘과 뉴스 보도에 활용하는 방법도 연구 중이다. 뉴욕타임스는 AI를 기술을 활용하는 방법을 자체적으로 모색하고 있는 것으로 알려졌다.

뉴욕타임스는 뉴스룸의 AI사용에 대한 기본 원칙을 담은 ‘AI이니셔티브(artificial intelligence initiatives)’를 담당할 편집 디렉터(Zach Seward)를 최근선발했다. 잭 스워드는 AI기술을 뉴욕타임스 취재와 보도에 적용하는 방법을 연구하는 역할도 맡았다. 잭은 디지털 세대를 위한 비즈니스 뉴스 쿼츠(Quartz)의 개국 에디터였다.

[우려로 가득찬 크리에이터 산업]

금전 보상없는 AI의 지적재산권 무단 사용은 크리에이티브 산업 전반에 우려로 작동하고 있다. 여배우 사라 실버맨(Sarah Silverman)은 지난 2023년 7월 AI프로그램이 텍스트를 훈련시키는 용도로 자신의 회고록을 무단 사용했다는 이유로 메타와 오픈AI를 고소했다.

특히, 소설가 등 텍스트 기반 창작자들의 우려가 가장 크다. AI가 데이터 학습을 위해 엄청난 양의 책과 데이터를 흡수하고 있기 때문이다. 조나단 프랜즌과 존 그리샴 등 많은 유명 작가들이 9월 오픈AI를 상대로 소송을 제기한 것이 이를 반증하다.

AI시대, 저널리즘이 지속 가능한 비즈니스로 유지되려면 뉴스 콘텐츠에 기반한 AI 모델의 이익이 생산자와 유통자 모두에게 돌아가야 한다. 콘텐츠 사용에 대한 금전적 보상이나 AI가 생성한 뉴스 기사에 대한 보다 광범위한 규제가 필요하다면 우리는 나서야 한다. NYT의 소송이 모든 것을 제공하지는 않겠지만, 적어도 시작은 될 수 있다.