Since 1959

2026.06.26 (금)
2026.06.26 (금)
포자랩스, 작곡 AI '지음' 테크 비하인드 공개
2026-06-26 김미혜 기자, elecnews@elec4.co.kr

"국악관현악단과 AI의 협연"…포자랩스만의 '부분 생성' 기술로 10분 대작 국악 완성


6월 26일 개막하는 국립극장 공연의 숨은 주역이자, 최첨단 인공지능(AI) 기술로 전통 국악의 새로운 패러다임을 제시한 AI 음악 스타트업 '포자랩스'의 테크 비하인드 스토리가 공개됐다.


업체 측에 따르면, 이번 공연은 단순한 AI 음악 연주를 넘어, 관객의 실제 감정 데이터를 AI가 해석하고 무대 위에서 실시간으로 대화하며 국악관현악단과 협연하는 최초의 시도다. 포자랩스는 이를 위해 대화 및 작곡 기능을 동시에 갖춘 고도의 AI 모델 ‘지음’을 최초로 선보인다고 밝혔다.



기존에 알려진 공연 개요 외에, 관객의 실제 감정을 음악으로 치환한 포자랩스의 정교한 데이터 처리 과정도 눈길을 끈다. 포자랩스는 사전에 관객들이 주관식으로 남긴 ‘최근 일상에서 느끼는 감정’ 등의 비정형 한글 텍스트 데이터를 분석하기 위해 자연어 처리(NLP) 기술을 활용했다.


단순히 단어를 단편적으로 해석하는 것을 넘어, 텍스트 속에 담긴 맥락과 감정의 깊이를 정량화된 데이터로 추출해 낸 것이다. AI ‘지음’은 이렇게 도출된 현대인의 ‘불안과 두려움’, ‘휴식과 희망’이라는 감정값(Value)을 음악의 주요 요소인 코드 진행(Chord Progression), 템포, 악기 구성 등의 매개변수(Parameter)로 변환해 작곡에 반영했다.


전통 국악은 서양 음악 중심의 기존 AI 작곡 모델이 접근하기 가장 까다로운 영역으로 꼽힌다. 포자랩스는 지난 4개월간 개발자, AI 연구원, 음악감독, 작곡가 등 전문 인력을 총동원해 기술적 한계 극복에 나섰다.


우선 국악의 느낌을 살리기 위해, 포자랩스 음악 전문가들이 국악에서 자주 쓰이는 5음 음계(Pentatonic scale)를 작곡 조건으로 설정했다. AI 엔진은 이 조건을 반영해 서양 음계와도 자연스럽게 어우러지는 대중적이면서도 한국적인 멜로디를 생성해 냈다는 설명이다.


여기에 느리게 시작해 점점 빨라지는 민속 기악 고유의 장단 구조를 구현하고자, AI 엔진을 통해 느림·보통·빠름 등 곡의 구간별 빠르기에 맞추어 음악 소스들을 각각 분할 생성했다.


업체 측에 따르면, 이처럼 서양 음악 문법 기반의 AI 모델로 한 곡당 10분에 달하는 긴 호흡의 국악 곡 초안을 만드는 것은 매우 도전적인 과제였다. 특히 국악관현악단과의 협업 과정에서는 전문가의 판단에 따라 곡의 특정 구간이나 일부 악기의 선율을 수정하는 과정이 필수적이었다.


대다수의 글로벌 AI 음악 서비스는 한 번에 완성형 완곡을 출력하는 데 집중하기 때문에, 중간의 특정 악기, 특정 부분만 골라 수정하는 것이 매우 어렵다. 반면 포자랩스의 AI는 하나의 완성된 음악뿐만 아니라, 음악을 구성하는 세부 세그먼트(Segment ·조각) 단위로 나누어 부분적으로 생성할 수 있는 기능을 갖추고 있다.


이러한 '부분 생성' 기능 덕분에 포자랩스 AI는 최초의 음악 제작(첫 생성) 뿐만 아니라, 피드백에 따른 수정 단계까지 AI를 적극 활용할 수 있었다. 국악 전문가들과의 협업 과정에서 수정이 필요한 구간이 생기면, 곡 전체를 처음부터 다시 만들거나 인간 작곡가가 수작업으로 일일이 고치는 대신, 해당 부분만 요청에 맞춰 AI로 즉각 재생성해 내며 작업 효율성을 극대화했다는 것이다.


이렇게 AI가 정밀하게 조율해 낸 음악 소스들은 최종적으로 이번 공연의 국악 작곡가의 정교한 편곡을 거쳐 하나의 완성도 높은 국악관현악 곡으로 빌드 업 되었다. 국악 특유의 ‘시김새(멋을 내는 음의 굴림)’ 영역 역시 AI가 임의로 처리하기보다 인간 국악 작곡가와 연주자의 예술적 해석 영역으로 남겨두며 AI와 인간의 가장 이상적인 협업 모델을 완성해 냈다.


이번 공연의 백미는 무대 위에서 펼쳐지는 AI와의 실시간 소통이다. 무대 위에 구현된 ‘지음’은 단순한 음성 출력을 넘어 음성 인식(STT), 거대 언어 모델(LLM), 음성 합성(TTS) 기술이 하나의 파이프라인으로 정교하게 연결되어 작동한다. 이를 통해 ‘지음’은 무대 위 사회자 및 관객과 자연스럽게 만담을 나누듯 대화를 주고받으며 공연 전반의 스토리를 이끌어가는 혁신적인 무대 연출을 선보인다.


포자랩스 허원길 대표는 "전통 예술인 국악의 깊은 호흡과 최첨단 AI 기술을 융합하는 과정은 기술적으로 매우 도전적인 프로젝트였다"라며, "단순한 기술적 과시를 넘어, 관객의 마음을 위로하는 따뜻한 AI 기술의 가능성을 국립극장이라는 최고의 무대에서 증명해 보여 기쁘다"라고 포부를 밝혔다.

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>

100자평 쓰기