DJ가 아닌 생성형 AI가 추천하는 '나의 음악'

사람처럼 답하고 인간처럼 사고하는 생성형 AI(Generative AI)가 사회 곳곳에 확산되고 있다. 교육이나 의료 현장은 물론 엔터테인먼트 영역도 이제 AI가 발전을 주도하고 있다. 이에 음악 스트리밍에 챗GPT가 개입하는 것도 더이상 어색한 일은 아니다.

인간의 목소리로 사용자의 취향에 맞는 음악을 소개하고 추천해주는 AI DI가 드디어 등장했다.  글로벌 1위 오디오 스트리밍 플랫폼 스포티파이(Spotify)가 생성형 AI DJ를 앱에 데뷔시켰다. 스포피타이의 AI DJ는 사용자가 이전에 들었던 음악 리스트를 바탕으로 뮤직을 추천해준다. 놀라울 정도로 구독자의 음악적 취향을 잘 맞추며 ‘사실적인 목소리’가 강점이다.

영어를 지원하는 DJ베타버전은 2023년 3월 1일 첫 런칭됐으며 미국과 캐나다에서 사용할 수 있다.  월 정액제 고객인 프리미엄 이용자는 무료로 사용할 수 있다.

[개인 타깃 서비스로 가치 높이기 나선 스포티파이]

AI DJ를 도입하기 전에도 스포티파이는 데일리 믹스, 디스커버리 위클리 오토 플레이리스트 등 개인 전용 청취 기능을  도입해왔다. 과거 개인 전용 청취 기능과 AI DJ의 가장 큰 차이점은  오픈AI의 기술을 활용해 스포티파이의 개인화 기술(personalization technology)이 생성형AI를 결합했다는 점이다.  스포티파이는 당신이 듣는 음악이나 가수, 장르와 관련한 보다 심층적인 사실을 제공하기 위해 AI기술을 음악 에디터들의 손에 맡겼다고  밝혔다. 결국  알고리즘이 아닌 AI기술을 통해 음악을 고르고 취향에 맞는 작품을 선정하는 작업이 개인을 더 잘 이해하고 훨씬  정교할 수 있다는 이야기다.

인간 DI와 마찬가지로 스포티파이 AI DJ는 자신이 플레이하고 있는 음악에 대한 트랙과 아티스트에 대한 실시간 코멘트를 해줄 수 있다. 이 가능에는 2022년 6월 스포티파이가 인수한 ‘소난틱(Sonnatic)’의 AI 문자 음성 변환 엔진(AI text-to-speech engine)이 적용됐다.

초기 출시에서 DJ 목소리 모델을 만들기 위해, 스포티파이는 기존 스포티파이의 첫 번째 (개인화된) 아침 쇼 ‘The Get Up’의 진행자 중 한 명으로 활동했던 문화 파트너십 대표(head of cultural partnerships) 자비에르 X 저니건(Xavier X Jernigan)을 책임자로 임명했다. AI DJ의 첫 번째 모델에는 자비에르의 목소리가 탑재됐다. 스포피타이는 “우리는 모든 제품에서 그렇듯이 계속해 반복하고 혁신할 것”이라고 말했다.

개인의 음악적 취향에 기반해, 스포티파이 DJ는 당신이 좋아할 것이라고 예측하는 새로운 음반을 찾거나 혹은 당신이 과거에 반복 청취했던 곡을 다시 추천한다. 또 청취자들의 피드백을 반영한 음악 라인업을 끊임없이 만들어낸다. 만약, DJ가 재생하고 있는 음악 리스트가 마음에 들지 않는다면 ‘DJ’ 버튼을 클릭해 다음 장르나 무드 음악으로 점프할 수 있다.

[사람의 목소리를 가진 AI DJ]

특히, 새로운 스포티파이 DJ는 생성형 AI의 장점을 최대한 활용한다. 스포피타이의 최고 R&D 대표 구스타프 쇠데르스트룀( Gustav Söderström)는 보도자료에서 “AI DJ는 사람처럼 생각하고 답을 전달하는 생성형 AI 특성을 반영, 각각 개인을 위한 음악 추천과 개인 취향 뮤직 리스트를 제공한다”며 “당신이 뭘 들을 지 모르는 상황에서도 늘 AI는 도와준다”고 강조했다.

AI DJ의 선곡 능력은 과거 알고리즘 추천과 비슷할 수 있다. 그러나 가장 큰 차별화 포인트는 현실적인 목소리(vocal manifestation)다. 사람의 목소리(human-sounding voice)를 가진 알고리즘은 ‘기술을 사람으로 만드는 강력함’이 있다. 이는 시리나 빅스비의 딱딱한 기계음과는 다르다.

사람처럼 ‘진정성 있는 목소리’를 가진 AI DJ가 가능했던 이유는 앞서 언급한 소난틱’의 힘이다. ‘탑 건: 매버릭(Top Gun: Maverick)’에서 발 킬머(Val Kilmer)의 목소리를 복원했던 회사로도 유명하다. 발 킬머는 탑 건 후속작 ‘아이스맨(Iceman)을 다시 맡았지만, 2014년 인후암(throat cancer) 치료를 받고 난 뒤 목소리를 잃은 것은 문제였다.  

그러나 2021년 8월 AI 음성 복원 기업 소난틱은 40개가 넘는 발 킬머의 과거 목소리 샘플을 통해 ‘발 킬머가 직접 말하는 음성’을 만들어내는데 성공했다. 소난틱이 만든 AI음성은 DJ에도 잘 어울렸다.

저니건의 부드러운 목소리는 미국 지역 방송사 라디오 DJ와 비슷한 편안함을 줬다는 평가다. 특히, 매년 구독자의 이름을 부르며 (그 혹은 그녀가) 좋아하는 장르나 그룹, 노래를 추천하는 저니건의 목소리는 머리보다 가슴으로  더 다가온다.

오디오 서비스 구독자 규모(버라이어티)

글로벌 오디오 스트리밍 서비스 시장 경쟁이 보다 치열해 짐에 따라 스포티파이는 구독자 확보를 위한 모든 전략을 펼쳐야 하는 상황이다. 애플 뮤직 등이 점유율을 크게 확대하고 있고 스포피타이가 공을 들이고 있는 팟캐스트 시장은 유튜브의 기세가 만만치 않다. 때문에 구독자를 원하는 서비스를 보다 많이 제공하고 청취자를 보다 오래 동안 잡아둘 정책은 필요하다.

팟캐스트 소스 플랫폼(버라이어티)

[AI DJ가 만드는 콘텐츠 편식. 빈익빈 부익부]

하지만, AI 추천 알고리즘은 위험한 측면도 있다. 사람들이 원하는 음악이나 평소에 들었던 장르만을 추천해 ‘화면의 다양성’이나 ‘음악 콘텐츠의 소비 종류’를 크게 줄일 가능성이 있기 때문이다.

오디오 시장은 생성형 AI DI뿐만 아니라 보이스 명령 기술의 발전으로 크게 변화하고 있다. 음악 구독 모델의 장점이 자신도 모르는 추천 음악을 듣고 의외의 즐거움을 찾는 것이지만, AI DJ의 추천은 이런 상황을 기대하기 어렵다.

AI DJ는 당신의 이름을 부르고 정확한 취향과 음악 소비 습관을 파악해 심지어 시간대에 맞는 음악을 골라준다. 때문에 스트리밍 플랫폼의 특징 중 하나인 새로운 콘텐츠를 검색하는데 시간을 쓰는 상황은 사라질 수 있다.

2022년 하반기 스트리밍 시청 시간

AI 알고리즘에 의한 콘텐츠 소비자 늘어난다면 ‘플랫폼의 빈익빈 부익부’ 현상이 가속화될 수도 있다. 버라이어티의 조사 결과 스트리밍 서비스의 경우에도 넷플릭스를 제외한 다른 플랫폼들은 한 달에 한번 정도 보거나 특정 프로그램을 시청하기 위해서만 접속했다.

파라마운트+는 응답자의 18%가 한 달에 한번 쓴다고 답했지만 넷플릭스는 ‘한 달에 한번만 본다는 응답’은 1%에 그쳤다. 또 한 달에 한 개의 프로그램만 본다는 응답도 넷플릭스가 가장 낮았다.

다른 말로 하면 넷플릭스는 다른 스트리밍과는 달리 많은 시간을 머무르고 많은 콘텐츠를 시청한다는 이야기다.

연령별 스트리밍 시청 선택 소요 시간(버라이어티)

Newsletter
디지털 시대, 새로운 정보를 받아보세요!
작가와 대화를 시작하세요
1 이달에 읽은
무료 콘텐츠의 수

유료 구독 프리미엄 독자들에게는 글로벌 미디어 관련 뉴스레터, 월간 트렌드 보고서, 독점 비디오 콘텐츠, 타깃 컨설팅요청시)이 제공됩니다.

스트리밍 비즈니스, 뉴스 콘텐츠 포맷, 크리에이터 이코노미, 할리우드와 테크놀로지의 만남 등의 트렌드를 가장 빠르고 깊게 전합니다. 학자보다는 빠르게 기자보다는 깊게'는 미디어의 사명입니다.

Powered by Bluedot, Partner of Mediasphere
닫기
인사이트 Store