메타, AI 음악 시장 진출…포자랩스 등 한국 AI음악 기업에도 기회?

메타가 생성AI(Generative AI) 음악 시장에 진출했다.

주어진 명령이나 분위기에 따라 음악을 만들어 내는 AI다. 특히, 메타는 다른 사람들이 무료로 쓸 수 있도록 오픈 소스로 AI툴을 공급한다는 방침으로 생성AI 음악 시장에 큰 파장이 예상된다.

생성AI 음악은 일반인들이 텍스트 명령으로 손쉽게 음악을 만들어낼 수 있다는 장점으로 저작권 비용이 부담스러운 드라마, 영화나 배경 음악이 필요한 크리에이터, 기업까지 활용폭이 매우 넓다.  

메타의 진출도 AI음악 시장은 더 대중화될 것으로 보인다. 특히, AI음악 시장은 K팝의 인기로 포자랩스 등 한국 스타트업들도 두각을 나타내고 있다.

메타의 AI시장 진출은 차별화된 기술력을 갖춘 한국 기업들에게는 위기만은 아니다.

[메타, 주어진 명령에 따라 음악 만드는 오디오크래프트 출시]

메타(Meta)는 2023년 8월 2일(미국 시간) AI오디오툴  ‘오디오크래프트(AudioCraft)’를 출시한다고 밝혔다.

일반 음악AI처럼 텍스트 기반 명령으로 오디오를 만들어주는 툴(Tool)로 특정 DJ나 가수 스타일의 음악을 원한다고 입력하면 음악 시퀀스를 만들어준다.

오디오 크래프트에 대해 메타는 회사 블로그에서  “악기 연주 없이 새로운 작곡을 할 수 있는 프로 뮤지션이 된다고 상상해 보라”며 “또 매장을 위한 배경 음악이 필요한 소상공인들이나 인스타그램 콘텐츠를 위한 음악이 필요할 때도 손쉽게 이 툴을 쓸 수 있다”고 말했다.

오디오크래프는 3개 모델로 구성됐다. 뮤직젠(음악 뮤직젠), 오디오젠(사운드 이펙트, AudioGen), 엔코덱(생성AI디코더) 등이다.

생성AI 음악을 만들어내는 뮤직젠은 텍스트 묘사나 메타데이터와 함께 40만 곡을 훈련했다. 메타가 소유하거나 훈련(트레이닝)을 위해 도입한 음악은 2만 시간에 달했다.

메타는 제품을 내놓으면서 뮤직젠(MusicGen)으로 만들어 낸 샘플도 공개했다.

28초 분량 샘플에는 레게 음악, 타악기로 연주된 사막의 영화 장면, 드럼 비트가 담긴 80년대 일렉트로닉, 재즈 인스트루멘탈, 미디움 템포, 멜로 힙합  등 AI가 만든 다양한 음원이 담겼다.

메타는 오디오젠(AudioGen)은 공공 사운드 효과(public sound effect)을 훈련했다고 밝혔다.

메타는 “개가 짓거나 자동차가 경적을 울리거나 나무 바닥에서 발소리를 내는 것과 같은 일상 소리와 다양한 음향 효과를 AI를 통해 만들어 낼 수 있다”고 말했다.

메타는 또 “엔코덱 디코더(EnCodec decoder)의 개선된 버전도 공개했다. 엔코덱은 더 적은 음악 소스로 고품질 음악을 만들어낼 수 있는 솔루션이다.

메타는 오디오크래프트를  연구자들과 기업들이 무료로 쓸 수 있는 오픈 소스 코드로 공개한다고 밝혔다.

기업들은 이 툴과 자신의 데이터로 새로운 비즈니스 모델을 개발할 수 있다. 메타는 “AI가 생성하는 오디오와 음악 분야를 발전시키는 데 도움을 주는 것이 목표”라고 설명했다.

오픈 소스 공개는 다양성 부족 때문이기도 하다. 메타는 오디오크래프트 훈련에 쓰는 데이터의 경우 영어나, 텍스트 오디오 명령어에 더 익숙하다고 강조했다.  메타는 “오디오크래프트 코드를 공유함으로써, 우리는 다른 연구자들이  편향성과 편견을 없애는 새로운 방법을 테스트하고 생성AI 모델의 오남용을 줄일 수 있길 희망한다”고 설명했다.

AI 오디오, 아바타 솔루션 특징 및 주요 솔루션(버라이어티)

[메타 이후 음악 AI시장 활성화 기대]

음악 생성AI는 글이나 이미지 AI에 비해 주목을 덜 받아왔던 것이 사실이다. 그러나 성장 가능성은 크다.

 메타의 등장은 생성AI 시장을 더 키워줄 것으로 보인다. 보다 많은 사람들이 생성AI 음악을 사용하고 크리에이터나 기업들도 오디오크래프트의 오픈툴로 연관 파생 서비스를 만들어낼 수 있다.

AI툴로 음악을 만드는 방식은 두 가지다. 원하는 장르나, 음악, 아티스트 등을 사전 옵션(preset option)으로 골라 선택하거나 시간 멜로디, 코드 진행(chord progression)과 같은 짧은 음악 오디오 파일을 업로드해 AI를 통해 계속 수정하는 방식이다.

앞으로 방식은 B2C며 후자는 B2B에 가깝다. 현재 주어진 명령에 따라 AI로 원하는 음악을 만들어내는 B2C시장이 더 커지고 있다.

생성 AI 음악 솔루션은 한국 기업들도 강세를 띄고 있는 시장이다.

메타의 등장으로 경쟁과 동시에 새로운 기회도 열릴 것으로 보고 있다.

네이버와 CJ E&M이 투자한 포자랩스(Pozalabs)가 대표적이다.  포자랩는  작사, 작곡에서부터 ‘간단한 명령어’로 완성된 음악까지 AI로 만들어낼 수 있는 기술을 보유한 AI오디오 기업이다

. AI가 학습하기 위한 음원 데이터를 직접 만들고 있기 때문에 저작권 침해나 표절에 자유롭다. 2023년 1월 현재 AI 학습 음원 데이터 수는 67만여개다. 소비자들은 몇 번의 클릭으로 원하는 장르나 분위기 음악을 자유자재로 만들어낼 수 있다.

포자랩스 솔루션의 강점은 AI로 5분만에 한 곡의 노래를 만들어낼 수 있다는 것이다.

저작권 걱정 없이 다양한 음악을 쓸 수 있는 AI배경 음악 구독 서비스(비오디오)도 내놨고 5월에는 모바일 버전으로 출시했다. 현재 기업용 AI 음악(드라마, 광고, 제작 배경 음악)에 주력하고 있다.

포자랩스 임직원(사진 가장 왼쪽 허원길 대표)

올해 연말(2023년)에는 음악 제작의 전 과정을 AI로 자동화한 ‘AI프로듀서(가칭)’ 서비스를 내놓고 B2C시장에도 더 힘쓸 계획이다. 현재 미국 진출도 추진하고 있다. 할리우드 스튜디오에 AI음악을 공급하는 것이 목표다.  

허원길 포자랩스 대표는 “AI를 활용해 만든 음악은 빠르고 저작권이 해결됐다는 장점이 있다”며 “AI학습 음원데이터를 직접 만들기 때문에 표절 문제에 자유롭고 ‘빠르고 저렴하게, 정확하고 품질 높은 음원’을 만들어낼 수 있다”고 강조했다.

한편, 생성AI가 만든 음악에 일반 소비자들의 인식도 개선되고 있다.

글로벌X가 2023년 2월 미국 성인 302명을 대상으로 조사한(온라인)바에 따르면 ‘생성형AI가 음악이나 뉴스 기사를 만들었을 때 어느 정도 신뢰를 하느냐’라는 응답에 미국인의 67%는 ‘일정 수준 신뢰한다’고 밝혔다.

Newsletter
디지털 시대, 새로운 정보를 받아보세요!
작가와 대화를 시작하세요
1 이달에 읽은
무료 콘텐츠의 수

유료 구독 프리미엄 독자들에게는 글로벌 미디어 관련 뉴스레터, 월간 트렌드 보고서, 독점 비디오 콘텐츠, 타깃 컨설팅요청시)이 제공됩니다.

스트리밍 비즈니스, 뉴스 콘텐츠 포맷, 크리에이터 이코노미, 할리우드와 테크놀로지의 만남 등의 트렌드를 가장 빠르고 깊게 전합니다. 학자보다는 빠르게 기자보다는 깊게'는 미디어의 사명입니다.

Powered by Bluedot, Partner of Mediasphere
닫기
인사이트 Store