강정수, AI는 2024 보다 더 뛰어난 몸을 가지게 된다(Jeong-Soo Kang “AI Gets a Better Body” in 2024 Media and Entertainment)


“멀티모달 서비스가 만드는 미래" "디바이스의 파워를 증강시켜주는 AI"

생성AI가 모든 산업을 지배하고 있다. 이미 AI음성, 디에이지(De-age) 등 AI소프트웨어 틀을 ‘노동 집약적’이었던 많은 작업을 한 번 클릭으로  해결하고 있다. 비용과 시간 효율적임은 물론이다.

더 나아가 2024년은 하드웨어와 AI가 만드는 본격적인 해가 될 것이라는 전망이 나왔다. 애플의 디자이너와 프로덕트 담담자들이 다른 AI회사에 합류하고 있다. 2024년은 디바이스에서 구현되는 다양한 AI를 볼 수 있을 것으로 예측된다. 아울러 보이스(Voice)가 2024년 AI 기기 진화의 중심에 설것이라는 진단이다.

[몸이 되고 있는 AI, 사람들과 더 가까워진 인공지능]

강정수 더코어 이사는  다이렉트미디어랩과 더코어, 디지털산업정책연구원이 CES에서 함께 주최한  "2024 새로운 시작 - 미디어 및 엔터테인먼트 생태계의 변화" 세미나에서 '소셜 미디어와 AI'의 진화에 대해 이야기했다.

이 자리에서 강 이사는 AI가 새로운 챕터로 가고 있다고 진단했다. 디바이스를 만나서 용도와 활용처가 세분화되고 확장되고 있다는 이야기다. 또  자연어 기반 사용자 경험과 새로운 인터페이스가 등장해 일반인들의 AI 사용도 더 늘어날 것이라고 전망했다.

주요 키워드

-AI와 디바이스의 결합과 혁신적인 흐름

-AI의 새로운 넥스트 챕터와 경쟁 구도 형성

-자연어 기반 사용자 경험과 새로운 인터페이스의 등장

-AI 디바이스의 파워 증강과 애플의 GPT 공개 가능성

-AI와 인간의 협업과 복잡한 것들을 AI가 학습하는 능력

-보이스 중심의 새로운 인터페이스와 프로세스의 시작

-멀티 모델의 진화와 질적으로 완전히 다른 보이스 인터페이스의 보편화

이번 세미나는 AI가 미디어 및 엔터테인먼트 분야에 미치는 혁명적인 영향에 대한 논의와 토론 자리였다. 강 이사는 AI와 미디어 콘텐츠의 관계, 소셜 미디어의 변화 등을 집중 논의했다.

강 이사의 "2024: AI가 더 나은 몸을 갖는다"라는 제목의 발표는 주제만큼이나 신선했다. 강 이사는 " AI가 2024년 멀티 모달 기능이나 음성 제어 인터페이스 등 다양한 형태로 등장할 것"이라며 "윈도우 키보드 및 폭스바겐 차량과 같은 여러 디바이스에 통합될 것"이라고 전했다. 발표에서는 앱 기반 운영 체제 및 번역과 같은 혁신적인 기술이 소개됐다.

오른쪽 아래 발표하는 강정수 이사(Bottom of right, Dr Kang)

강 이사는 생성 AI가 다양한 형태의 디바이스들과 결합하는 양상이 2024년에 가장 다양하게 나타날 것이고 이 부분이 가장 큰 혁신의 흐름들로 작용하지 않을까라고 생각한다고 전했다.

특히, 생성 AI가 멀티 모델이라는 특성을 갖고 있기 때문에 디바이스에 있는 수많은 앱들 간에 서로 다른 커뮤니케이션 체계를 통합시켜주는 방향으로 움직일 것이라고 지적했다.  강 이사는 "우리는 AI의 능력을 해제하는 기기가 필요하지 않다. 우리는 AI가 우리의 능력을 해제하는 것이 필요하다"고 말했다. 우리의 능력을 확장시켜주는 AI가 필요하다는 지적이다.

휴메니(Humane)의 실시간 번역 기능을 제공하는 AI핀,  리와인드 펜던트(Rewind), 애플(Apple), 메타(Meta)와 같은 기업들이 자사의 고급 언어 모델을 기기에 구현하는 개발하는 방향으로 AI가 나아가고 있다고 언급했다.

특히, 휴메인의 AI핀이 애플 출신들이 만들었고 특이점은 알뜰폰 사업권을 가졌다는 것이라고 지적했다.  통신 기능을 탑재했다는 것은 기기가 새로운 커뮤니케이션 툴로 진화할 것이른 예측이도 하다. 갤럭시 AI가 실시간 자동 통역 기능을 제공하듯, 인간의 능력을 확장시키는 역할을 AI가 하게 될 것이라고 강 이사는 진단했다.

[애플을 주목하라. AI 디바이스 출시 가능성]

강 이사는 2024년 애플(Apple)을 주목하라고 말했다. 애플 비전 프로 등 애플은 늘 혁신적이지만 AI에서의 역할이 더 확대될 수 있다고 강 이사는 말했다. 그는 "올해 안에 아이폰 16이라든지 iOS 업데이트를 통해  애플의 AI GPT가 충분히 나올 가능성이 있다"고 설명했다.  공간 컴퓨팅 비전 프로를 넘어 올해 안에 속도를 내서 다른 AI 디바이스를 선보일 거라고 보고 있다고 덧붙였다.

[2024년은 AI의 새로운 챕터]

강 이사는 올해(2024년) AI의 새로운 넥스트 챕터가 기록되고 만들어지는 한 해가 될 것이라도 진단했다. AI핀이라든지 레빗 등 새로운 형태의 AI기기들이 등장할것이고 대중적인 것들은 살아남겠지만 일부는 아웃될 가능성도 있다.  그는 2024년 "의미 있는 경쟁 구도가 형성될 것이다. AI에 의해서 힘을 받는 디바이스의 출연들이 가장 2024년 주목해야 될 흐름이라고 보고 있다"고 전했다.

이와 관련 강 이사는 AI를 만난 앱들이 서로 커뮤니케이션하고 연결되면서 단순한 보조 기능이 아닌 사안들을 중개하고 해결하는  에이전트(Agent) 기능으로 진화하는 것들을 보게 될 것이라고 강조했다. 이런 앱들을 장착한 'AI에이전트' 하드웨어 기기들도 등장한다.

그는 "자연어에 기초한 새로운 사용자 경험들, 새로운 인터페이스의 출연들이 가장 중요한 CES에서 보여진 이번 혁신의 시금석이라고 본다"고 전했다.

[AI는 어떤 방향으로 발전하는가? 보이스는 넥스트]


복잡한 것들을 다 인간이 해야 된다는 건 매우 불편하다. AI가 최근 급속히 확산되는 이유도 '복잡한 것을 다 학습해' 처리할 수 있다는 능력이다.  사물들은 이제 AI가 모두 컨트롤 할 수 이다. 하지만,할리우드 작가와 배우들의 파업에서 볼 수 있듯, AI에 의존하는 것은 논쟁적이다.

AI와 디바이스가 만나는 경향에서 새로운 습관과 비즈니스도 등장하고 있다. 이는 확실히 새로운 영역이다. 강 이사는 "AI디바이스가 만드는 새로운 습관의 중심이 보이스(Voice)가 될 것이라고 진단했다.

강 이사는 "멀티모달이 진화한다면 질적으로 완전히 다른 보이스 인터페이스가 보편화될 것"이라며 "AI를 우리의 OS시스템에 통합하는 방식으로 보이스가 진화할 것"이라고 언급했다. 2024년에는 보이스의 중요성이 확대되는 첫 해가 될 것이고 다양한 디바이스로 확대될 것이라고 강조했다.

강 이사는 과거 AI음성 비서 애플의 시리와 아마존의 알렉사가 있지만 엄밀히 말하면 머신러닝이 쓰였을 뿐, 초기적인 AI였다고 말했다.

그러나 챗GPT급의 생성AI가 보이스와 결합되게 되면 ‘공간’을 변화시키는 현상이 벌어질 것이라고 전했다. 챗GPT는 문제 해결과 관련한 대화 수준도 뛰어나고 거의 놓치는 말이 없을 정도이기 때문이다.

인간 업무에 대한 이해도가 높은 AI 음성 비서가 본격적으로 등장할 것이라는 이야기다.

AI와 보이스 인터페이스의 미래

멀티 모델이 진화한다면 훨씬 더 질적으로 완전히 다른 보이스 인터페이스가 보편화될 것임

AI를 우리의 오퍼레이팅 시스템에 통합시키는 방향으로 갈 것임

2024년에 프로세스가 시작될 것이고 2025년부터 다양한 디바이스로 확대되어 가는 것이 전망임


Generative AI is taking over every industry. Many tasks that used to be "labor-intensive" in the AI software framework, such as AI voice and de-age, are now solved with a single click. Cost and time-efficiency is water.


What's more, it's been predicted that 2024 will be the year of hardware and AI. Designers and product managers from Apple are joining other AI companies. We predict that 2024 will see a wide variety of AI implemented in devices. Voice will be at the center of the evolution of AI devices in 2024.

[AI Becoming a Body, Getting Closer to People]


Dr. Jungsoo Kang, Director of Thecore, spoke about the evolution of social media and AI at the "2024 New Beginnings - Changes in the Media and Entertainment Ecosystem" seminar co-hosted by Direct Media Lab, Thecore, and the Digital Industry Policy Institute at CES.


In the seminar, Kang diagnosed that AI is entering a new chapter. It is meeting devices and its uses and applications are being segmented and expanded. He also predicts that natural language-based user experiences and new interfaces will increase the use of AI by the general public.

KEY WORDS


-The convergence and disruption of AI and devices
-The next chapter in AI and the shaping of competition
-Natural language-based user experience and the rise of new interfaces
-Increasing power of AI devices and Apple's potential GPT disclosure
-AI and human collaboration and AI's ability to learn complex things
-The beginning of new voice-centered interfaces and processes.

-The evolution of multi-models and the ubiquity of qualitatively different voice interfaces

The seminar was a discussion and debate on the revolutionary impact of AI on media and entertainment. Mr. Kang focused on the relationship between AI and media content, the transformation of social media, and more.


Mr. Kang's presentation, titled "2024: AI Gets a Better Body," was as refreshing as its subject matter. "AI will come in many forms in 2024, such as multi-modal features and voice-controlled interfaces," Kang said, "and it will be integrated into many devices, such as the Windows keyboard and Volkswagen vehicles." The presentation featured innovative technologies such as app-based operating systems and translation.


Kang said he believes that the most varied ways in which generative AI will be combined with different types of devices will be seen in 2024, and that this will be one of the biggest innovation streams.


In particular, he pointed out that the multi-model nature of generative AI will move toward unifying the different communication schemes between the many apps on a device.  "We don't need a device to unleash the power of AI. We need AI to unlock our abilities," he said. The point is that we need AI that extends our capabilities.

He pointed out that AI is moving in the direction of companies like Humane's AI pin, Rewind pendant, Apple, and Meta, which provide real-time translation, to developers who implement their advanced language models into devices.


In particular, he pointed out that Humain's AI pin was created by ex-Apple employees, and the unique thing about it is that it has a budget phone business license.

The inclusion of a communication function also predicts that the device will evolve into a new communication tool. Just as the Galaxy AI provides real-time automatic interpretation, Kang believes that AI will serve as an extension of human capabilities.

[Watch for Apple to launch an AI device]

Kang said to keep an eye on Apple in 2024.

While Apple is always innovative, such as with the Apple Vision Pro, its role in AI could expand, Kang said. "It's possible that we'll see enough AI GPTs from

Apple in the iPhone 16 or iOS updates this year," he said.  Beyond the spatial computing Vision Pro, he believes the company will accelerate and introduce other AI devices this year.

[2024 is the next chapter in AI]

Mr. Kang predicted that this year (2024) will be the year when the next chapter of AI will be written and created. New forms of AI devices, such as AI pins and levitations, will emerge, and while some popular ones will survive, others will likely die out.  In 2024, "there will be meaningful competition," he says. The emergence of devices powered by AI is the most important trend to watch in 2024."


In this regard, Kang emphasized that we will see apps that meet AI communicate and connect with each other, evolving into agents that mediate and solve problems, rather than simply assisting. There will also be "AI-agent" hardware devices with these apps.
"The emergence of new user experiences and new interfaces based on natural language are the touchstones of the innovation we saw at the all-important CES," he said.

[Where is AI headed? Voice is Next]


It's very uncomfortable to have humans do all the complicated things. The ability to "learn to do complex things" is one of the reasons why AI has been proliferating so rapidly in recent years. Things can now be controlled by AI. However, relying on AI is controversial, as evidenced by the Hollywood writers' and actors' strike.


New habits and businesses are also emerging from the intersection of AI and devices. This is definitely new territory. "Voice will be at the center of the new habits created by AI devices," Kang said.


"If multi Modal evolves, qualitatively different voice interfaces will become commonplace," Kang said, "and voice will evolve in a way that integrates AI into our OS systems." He emphasized that 2024 will be the first year that voice will become more important, and it will expand to a wider range of devices.

KEY KEYWORDS

-If multimodal evolves, a much more qualitatively different voice interface will become commonplace

-We will move towards integrating AI into our operational systems

-The process will begin in 2024, and we can expect to see it expand to a wide range of devices from 2025 onwards.

In the past, there have been AI voice assistants such as Apple's Siri and Amazon's Alexa, but they were technically nascent AI that used machine learning, Kang said.


However, when ChatGPT's level of generative AI is combined with voice, he said, a phenomenon that changes the "space" will occur. This is because ChatGPT has an excellent conversational level when it comes to problem solving and rarely misses a word.This is the beginning of the end for AI voice assistants that understand human tasks.