제품·기술과 관련된
궁금한 점이 있으시면 문의를 남겨주세요.
네이버의 생성형AI ‘하이퍼클로바X’가 공개되고 삼성전자에서 이를 도입했다는 소식이 전해지면서, 생성형AI가 공식적으로 일상에 적용되었음을 체감하는 중입니다. 네이버의 ‘하이퍼클로바X’, 그리고 생성형AI 혁명을 불러온 ‘챗GPT’는 생성형AI 중 대규모 언어 모델(LLM)로, 많은 사람들에게 친숙한 용어일텐데요. 하지만, 생성형AI 중에는 언어 외에도 이미지, 동영상 등과 같은 콘텐츠를 창작하는 AI도 존재하는데요. 그래서 오늘은 이미지와 동영상을 생성하는 AI, ‘GAN(Generative Adversarial Network)’에 대해 이야기하려 합니다.
생성형AI ‘GAN’에게 등장한 알파고
생성형AI ‘GAN’은 2014년 이안 굿팰로우의 논문을 통해 처음 발표되었으며, 이 때는 AI가 대중들에게 널리 알려지기 이전으로 꽤 오래 전에 등장했다고 볼 수 있습니다. ‘GAN’은 학습 방법도 독특할 뿐 아니라 그동안 인간 고유의 영역이라고 생각해왔던 창작의 영역에 AI를 적용할 수 있다는 발상으로 많은 사람들의 관심을 받았다고 합니다. 논문 발표 이후, 약 6만 건 정도 인용되었는데 이는 엄청난 기록이라고 하는데요, 생성형AI가 대중화된 지금은 아마 더 많이 인용되었겠죠?
하지만 ‘GAN’이 대중들에게 알려진 것은 비교적 최근입니다. ‘챗GPT’로 인해 생성형 AI가 주목받기 시작하면서 언어를 대표하는 ‘LLM(대규모 언어 모델)’과 더불어 이미지, 동영상 등 콘텐츠 생성을 대표하는 ‘GAN’을 발견한 것이죠. 현재 대중들에게 급속도로 퍼진 ‘GAN’을 이용한 콘텐츠 생성은 다양하게 사용되고 있습니다.
대표적인 예시로 유명인사의 가짜 이미지 혹은 영상이 있습니다. 수많은 사람들이 SNS를 통해 오바마 전 대통령의 가짜 연설 영상, 그리고 트럼프 전 대통령의 경찰 체포 사진을 접하면서 많은 가짜 이야기가 사실처럼 알려졌는데요. 이 경우, 현재 윤리적인 문제가 대두되면서 할리우드의 파업을 불러일으키기도 했고, 관련 법 제정이 촉구되는 등 많은 부분에서 보완되어야 할 필요가 있습니다. 이 외에, 생성형AI로 그림을 그려 엄청난 상금을 받은 사례도 있는데요. 2018년 AI가 그린 초상화가 경매에서 6억 원에 낙찰되기도 하고, 2022년에는 AI가 그린 그림이 박람회 미술 경연 대회에서 1위를 차지하기도 했습니다.
세상에 없는 창작물, 실력까지 갖추다.
앞서 이야기한 두 번째 예시를 보면, AI가 그린 그림이 상당한 수준이라는 것을 알 수 있습니다. 물론 경매의 경우 ‘AI가 그린 그림’이라는 특성이 값을 올리는 데 역할을 할 수 있겠지만, 박람회 미술 경연 대회에서 1위를 차지하는 것은 어느 정도 수준이 있음을 증명하고 있죠. 실제로 ‘GAN’을 사용했을 때, 이미지, 영상 등의 콘텐츠를 제작을 요청하면 수준 높은 콘텐츠를 만들어줍니다.
‘GAN’은 왜 창작물을 잘 만들 수 있는 걸까요? 그 이유는 훈련 방법에 있습니다. 앞서 ‘GAN’의 훈련 방법이 독특하다고 이야기했는데요. ‘GAN’은 자료를 보며 스스로 정보를 습득하는 방법이 아닌 두 가지 모델을 균형 있게 훈련하는 방법으로 만들어집니다. 우선 첫 번째 모델로 이미지를 생성하는 ‘Generator(생성자)’를, ‘Generator’가 생성한 이미지가 진짜인지 가짜인지 판별하는 ‘Discriminator(판별자)’를 두 번째 모델로 구분합니다. 여기서 ‘Generator(생성자)’는 ‘Discriminator(판별자)’를 속일 수 있는 진짜 같은 이미지를 생성하는 것이 목표이고, ‘Discriminator(판별자)’는 ‘Generator(생성자)’가 만들어 낸 이미지가 가짜임을 파악하는 것을 목표로 설정해 두 가지 모델을 균형 있게 훈련시킵니다. 이렇게 되면 ‘Generator(생성자)’는 더 진짜처럼 보이는 콘텐츠를 만들어 내기 위해 더욱 노력하면서 스스로 실력을 향상시키기 때문에 균형 있는 훈련이 잘 이루어진 ‘GAN’은 수준 높은 콘텐츠를 생성하게 되는 것이죠.
‘GAN’이 사용되는 또 다른 분야, ‘Super Resolution’.
그리고 블루닷이 개발한 동영상 인공지능 모델은 콘텐츠를 진짜처럼, 훌륭한 퀄리티로 만들어주는 ‘GAN’을 적용했습니다. 적용 모델은 블루닷의 ‘Super Resolution’인데요, 이는 인공지능 기반의 화질 개선 및 업스케일링 기술로 낮은 화질과 해상도의 영상을 개선해 선명한 고해상도의 영상으로 만들어줍니다. 여기서 블루닷은 ‘GAN’을 사용함으로써 픽셀 값을 하나 하나 계산하지 않고 영상의 해상도를 높여 자연스러운 결과물을 도출할 수 있습니다.
생성형AI가 불러온 산업의 혁신 덕분에 다양한 기술이 등장하고 있습니다. 앞서 이야기 한 대규모 언어 모델(LLM)은 이미 많은 테크 기업에서 사용하고 있는 모델이며, 오늘 소개한 ‘GAN’을 적용한 기술도 부지런히 등장하고 있는데요. 비록 AI가 아직 우리 사회에 완전히 자리잡기에는 해결해야 할 문제가 많이 남아있지만, 이제는 AI가 없는 세상이 더 상상되지 않은 때가 온 것 같습니다.
GAN에 대해 더 자세한 설명이 듣고 싶다면, 아래 영상을 참고하세요.
제품·기술과 관련된
궁금한 점이 있으시면 문의를 남겨주세요.