연구실에서 알데바란 프로세서 기반 AI 반도체 개발해
ETRI(한국전자통신연구원) 인공지능프로세서연구실은 원래 프로세서연구그룹으로 전통적인 CPU 설계를 연구하였다. ‘알데바란’이라는 국내 최초 1GHz 이상의 동작주파수를 가지는 모바일 프로세서 코어를 개발하였으며, 차량에서 요구하는 기능안전 설계 표준인 ISO 26262 ASIL-D 안전기준을 만족하는 설계 기술도 개발하여 그 실력을 인정받았다.
인공지능프로세서연구실로 실명을 변경하면서 알데바란 프로세서 연구 기술을 기반으로 인공지능 알고리즘을 가속할 수 있는 인공지능반도체를 2020년 국내 최초로 개발했다.
한 진 호 책임, 인공지능연구소 인공지능프로세서연구실, ETRI
"앞으로는 하이퍼스케일(Hyperscale) AI가 인공지능 분야에 적용될 예정이기에 반도체에서 더 많은 처리 성능을 요구할 것입니다. 연구실에서는 PIM(Processing-In-Memory) 및 이종집적(Heterogeneous Integration) 기술을 통해 단일 반도체에서 1-PetaFLOPS 성능을 낼 수 있도록 하는 연구를 진행하고 있습니다."
AI 반도체의 도전
인공지능프로세서연구실의 한진호 책임은 “연구실에서는 처음에 모바일AP에 들어가는 고성능 프로세서를 개발했는데 이를 자율주행 차량용 반도체에 적용하는 연구를 하였고, 연구 중에 자율주행용 반도체에 필요한 기술이 오류감내를 위한 기술(Fault Tolerance Feature) 외에도 차량 및 보행자를 인식하는 기술이 필요하다는 것을 알게 되었다”고 말했다. 머신 러닝(Machine Learning) 알고리즘 가속 반도체를 개발하면서 머신 러닝의 하나인 딥 러닝(Deep Learning) 알고리즘을 가속할 수 있는 반도체를 남들보다 먼저 개발(2017년)하게 된 배경이기도 하다.
인공지능 반도체 분야는 기존의 인공지능 알고리즘을 원활히 가속시키는 것은 물론이고, 앞으로 인공지능 알고리즘의 대부분이 될 트랜스포머(Transformer) 계열의 하이퍼스케일(Hyperscale) AI 알고리즘을 빠르게 처리해야 하는 요구를 받고 있다. 이러한 도전적인 요구사항을 만족하는 인공지능 반도체를 개발하여 확산시키고 싶다는 한진호 책임에게 더 자세한 이야기를 들어본다.
Q. 반갑습니다. ETRI는 2년 전에 NPU 기반 AI 반도체 칩(AB9, 알데바란9)을 공개한 데 이어 지난해 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했습니다. 이처럼 칩부터 시스템까지 독자 개발하게 되면 어떠한 효과와 이득을 볼 수 있는지요.
A. 개발된 AI반도체(다른 반도체라고 하여도)는 사용을 위해서는 보드에 장착이 되어야 하고, 이를 시스템에 탑재를 하여 관련 소프트웨어로 동작을 시켜야 합니다. 연구소는 기술을 기업에 이전하여 그 기술을 파급시키고 있는데 단순히 반도체 기술만 이전한다면 기술이전을 받은 해당 기업은 관련 보드, 시스템, 그리고 소프트웨어를 모두 직접 개발을 해야 합니다. 하지만 저희는 관련 반도체 기술을 적용하기 위한 보드, 시스템, 개발용 소프트웨어를 함께 ‘Full-Stack Solution’을 개발하여 제공할 수 있기에 해당 기술을 이용한 시장 진입이 더 빠를 수 있습니다.
Q. 말씀하신대로 AI 반도체와 제반 기술이 반도체 기업 및 AI 하드웨어 기업 등에 이전되었다고 들었습니다. 얼굴인식 및 객체인식 AI 등을 이용한 각종 보안 등에 활용될 예정이라고 했는데, 현재 어떻게 활용되고 있는지요.
A. 현재 인공지능 반도체 및 NPU 보드 기술은 업체에 기술이전을 하여 홈?오피스 보안 시스템 및 차세대 공항 출입 통제 시스템에 적용을 하고 있습니다. 개발 업체에서는 홈?오피스 보안 시스템을 사내에 적용하고 있으며, 차세대 공항 출입 통제 시스템을 올해까지 관련 시스템 개발을 완료할 예정입니다.
Q. 연구실 이야기로 돌아가겠습니다. ETRI의 인공지능프로세서연구실 만이 가진 차별성이 있다면 어떤 것이 있을까요.
A. 프로세서 반도체 기술을 2005년도부터 개발을 해 왔습니다. 이를 통해 임베디드(Embedded) DSP, Configurable Processor, 고성능 저전력 프로세서 코어 기술 등 관련 기술 역량을 보유하고 있습니다. 이들 기술은 인공지능 반도체 및 앞으로 요구될 고성능의 PIM 프로세서를 설계하기 위한 SoC 플랫폼으로 활용하면 개발 기간을 단축시킬 수 있습니다. 설계 후 반도체 칩 제작 및 검증을 위한 협력업체가 오랜 기간 함께하고 있고, 국내에서 항상 선도적인 반도체 개발에 있어 높은 완성도의 결과를 낼 수 있습니다.
Q. 현재 연구실에서 진행하고 있는 핵심 연구과제나 향후 연구 방향을 말씀해 주신다면요. 이를테면 A 반도체는 2세대 NPU, 3세대 뉴로모픽으로 발전할 것으로 전망되고 있는데, 연구실의 활동은 어떤가요.
A. AB9 AI 반도체는 NPU 반도체로 RackScale 수준에 4.8 PetaFLOPS의 성능을 담아 낼 수 있습니다. 앞으로는 하이퍼스케일(Hyperscale) AI가 인공지능 분야에 적용될 예정이기에 반도체에서 더 많은 처리 성능을 요구할 것입니다. 저희 연구실에서는 PIM(Processing-In-Memory) 및 이종집적(Heterogeneous Integration) 기술을 통해 단일 반도체에서 1-PetaFLOPS 성능을 낼 수 있도록 하는 연구를 진행하고 있습니다.
PIM, 이종집적 기술 연구 진행
Q. 과학기술정보통신부는 지난 6월 ‘인공지능 반도체 산업 성장 지원대책’을 발표하였습니다. 인공지능반도체 첨단기술 연구개발에 예타 사업을 포함하여 향후 5년간 1조 200억 원을 투입할 계획인데요. 이는 AI 4차산업혁명 시대에 인공지능 반도체의 중요성을 말해주는 것이기도 합니다. 관련 연구실에 계신 입장에서 남다를 것 같은데요.
A. 기업에서 개발하는 기본 반도체와 비교하여 규모가 큰 반도체이고, SW 개발환경 구축도 필요하기에 국내 팹리스(Fabless) 기업이 NPU 기술개발을 위해 연구비를 투자하기에는 초기투입 비용이 높습니다. 기존 팹리스 기업이 NPU 기술을 바로 개발하지 못하고 있기에 정부출연 연구기관인 ETRI에서 기술 개발을 통한 기술 이전에 노력하고 있는 것입니다.
이에 어느 때보다 관련 인재 육성이 필요합니다. 인공지능 알고리즘, 반도체설계 그리고, 컴파일러 기술을 모두 알고 있는 인력양성이 시급합니다. 그리고 기존 CPU, GPU에서의 SW 개발환경이 다르기에 NPU 기반 SW 및 SW 개발환경 생태계 조성이 필요합니다.
"인공지능 반도체 관련 인재 육성이 필요합니다. 인공지능 알고리즘, 반도체설계 그리고, 컴파일러 기술을 모두 알고 있는 인력양성이 시급합니다. 그리고 기존 CPU, GPU에서의 SW 개발환경이 다르기에 NPU 기반 SW 및 SW 개발환경 생태계 조성이 필요합니다"
Q. 국내 연구 환경과 산업 상황을 볼 때, 세계 인공지능반도체 기술에서 한국은 어느 수준이라고 생각하시는지, 향후 더 강화할 분야가 있다면 무엇이라고 생각하시는지요.
A. 인공지능 반도체 기술은 세계적으로 구글, 그래프코어(Graphcore)에서 개발을 하고 있습니다.
국내는 현재 인공지능반도체 기술을 기반으로 하는 스타트업(Start-up)이 있으며, 이들이 올해부터 칩 개발을 완료하여 제품을 출시하고 있습니다. 인공지능 반도체가 기존 CPU와는 다른 소프트웨어 개발 환경을 가지고 있기에 개발자들의 개발환경을 잘 만드는 것이 중요하다고 생각합니다.
Q. 앞서 말씀하신 것처럼 인공지능 반도체 산업에서의 인력 양성 문제도 중요한데요. 이를 위한 해결책이 있다면요. 또한 연구실이 기여하거나 노력하는 부분이 있다면요.
A. 앞에서도 말했듯이 인공지능 반도체를 위해서는 인공지능 반도체 설계 능력 뿐만이 아니라 인공지능 알고리즘에 대한 이해 그리고, 무엇보다 인공지능 반도체를 위한 컴파일러 환경 개발을 위한 능력이 많이 필요합니다. 이를 위한 인력양성을 위해 저희 부서에서는 개발한 인공지능 반도체의 컴파일러 환경을 Github에 공개하고 있습니다. 이를 통해 많은 이들이 개발 소스 코드(source code)를 살펴보고 공부를 할 수 있도록 지원하고 있습니다.
Q. 인공지능 반도체 분야는 다양한 분야의 협력이 필요한 분야라고 했는데, 이를 위해 다른 전문 인력이나 기관과 평소 어떤 교류를 하고 있는지요.
A. 앞으로 전문가 수준의 지능으로 스스로 학습하고 판단 및 행동하는 AI를 지향하는 초거대 인공신경망인 ‘Hyperscale Neural Network’가 개발되고 있고, 그 중에 하나인 최신 언어 모델인 GPT-3와 같은 초거대 인공신경망은 1750억 개의 신경망 매개 변수가 있고 학습을 위해 하루에 3640 Peta FLOPS의 연산이 필요하기에 높은 성능의 NPU는 계속해서 요구가 될 것입니다. 이를 위해 서울대, 카이스트 등과의 교류를 통해 이러한 문제를 해결하기 위한 선도 기술을 개발하고 있습니다.
인공지능 반도체는 기존에 없었던 반도체이기에 기존 반도체를 대체를 해야 합니다. 그래서, 기관 내 자율주행차 시스템 개발 부서 및 인공지능 서비스 기업과의 협업으로 기존 시스템을 인공지능반도체 기반 시스템으로 대체하고 있습니다.
인공지능반도체 기반 시스템으로 대체
Q. 인공지능 반도체를 연구 개발하는데 어떤 어려움이 있으며, 이를 해결하기 위해 필요한 것이 있다면요.
A. 현재는 인공지능 반도체가 처리해야 하는 연산량이 높아지고 있습니다. 앞에서 말씀드린 Hyperscale AI 알고리즘의 등장 때문이기도 합니다. 이를 위해 많은 기술을 접목하고 있습니다. 저희 기관에서는 ‘칩렛(Chiplet)’을 이용하여 단일 다이(Die)에서의 연산량 증대의 한계를 극복하려고 하고 있고, 폭발적으로 증가하고 있는 인공지능 데이터를 빠르게 처리하기 위한 고대역폭 메모리(HBM) 기술을 적용하고 있습니다.
Q. 끝으로, 인공지능 반도체를 연구하거나 연구하려는 연구자에게 할 말이나 요청할 협력 사항이 있다면 무엇인지요.
A. 앞으로 인공지능 반도체 분야는 다가올 인공지능 세상에서 없어서는 안 될 기술이 될 것입니다. 이를 위해 인공지능 알고리즘 개발자, 인공지능 컴파일러 개발자분들과 많은 협력이 되면 좋겠습니다. 학교에서도 이 분야에 대한 course work이 생겼으면 좋겠고, 이를 통해 관련 인력이 많이 확보되면 좋겠습니다.
AI 반도체에서 NPU 보드 및 관련 SW까지 모두 개발해
ETRI, 연산성능 4배·전력효율 7배 올려… 대규모 AI 서비스에 활용
한국전자통신연구원(ETRI)이 개발한 인공지능 시스템은 고성능 AI 반도체 칩을 활용하여 낮은 전력으로 초당 약 5천조 회 연산이 가능하다.
ETRI는 2020년 NPU 기반 AI 반도체 칩, AB9(알데바란9)을 공개한 데 이어 지난해 12월 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람?사물?음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 적합하다.
연구진이 개발한 NPU 보드 ‘ABrain-S’는 AB9을 기반으로 독자적인 설계를 이뤄 부피가 작으면서도 전력 소모가 낮다. 인공지능 알고리즘 처리를 위해 입출력 데이터를 16GB까지 저장할 수 있는 메모리와 데이터 이동 속도를 빠르게 하기 위한 인터페이스도 적용 했다. AB9이 내장된 NPU 보드는 한 서버 노드에 최대 20개씩 장착 가능하다.
이를 바탕으로 서버 노드 8개를 쌓아 랙 서버(Rack Server) 형태로 구성된 인공지능 시스템, 아트브레인(ArtBrain-K)을 만들었다.
이 밖에도 ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 SW 개발환경도구 ‘AIwareRT’를 깃허브(Github)에 공개했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>