엔비디아, 전세계 슈퍼컴퓨팅 센터들이 엔비디아 암페어 GPU 도입
  • 2020-11-23
  • 박종배 기자, jbpark@elec4.co.kr

엔비디아는 전세계 슈퍼컴퓨팅 센터들이 엔비디아 암페어(Ampere) GPU를 도입해 신약개발에서부터 에너지 연구에 이르는 다양한 분야에 인공지능(AI) 성능을 활용하고 있다고 밝혔다.



후지쯔(Fujitsu)는 최근 일본의 ABCI(AI Bridging Cloud Infrastructure)을 위한 엑사스케일 시스템을 발표했는데, 이는 일본 산업기술총합연구소(AIST)에 구축되어 600페타플롭(PF)의 성능을 제공한다. 해당 시스템은 지난 5년간 AI가 연구에 활용되는 사례가 늘어나면서, 모델 복잡성이 3만배 급증하는 가운데 출시됐다. 과학적 애플리케이션을 사용하면 이러한 거대한 데이터세트를 메모리에 저장할 수 있어 배치처리(batch processing)를 최소화하고 처리량을 높일 수 있다.

엔비디아는 차세대 연구를 지원하고자 HBM2e 기술이 적용된 엔비디아 A100 80GB GPU를 출시했다. 이는 A100 40GB GPU의 고대역 메모리를 두 배인 80GB로 늘리고, 초당 2테라바이트(TB) 이상의 메모리 대역폭을 제공한다.

새로운 엔비디아 A100 80GB GPU를 사용하면 보다 대규모의 모델과 데이터세트를 더 빠른 메모리 대역폭으로 메모리내에서 실행할 수 있어 컴퓨팅 성능을 높이고 워크로드 결과를 더욱 신속하게 얻을 수 있다. 또한, 인터노드 통신을 줄여 GPU의 절반만으로도 AI 훈련 성능을 1.4배나 향상시킬 수 있다.

엔비디아는 또한 새로운 엔비디아 멜라녹스(Mellanox) 400G 인피니밴드(InfiniBand) 아키텍처를 도입해 데이터 처리량을 두 배로 늘리고, 가속화를 위한 새로운 네트워크내(in-network) 컴퓨팅 엔진을 제공한다.

엔비디아는 400페타플롭의 AI 성능을 제공하는 80노드 DGX 슈퍼POD로 케임브리지-1(Cambridge-1)을 구축하고 있다. 이는 영국에서 가장 빠른 슈퍼컴퓨터가 될 전망이다. 영국의 AI와 헬스케어 관련 학계, 산업, 스타트업들의 협력 연구에 사용될 예정이다.
북아메리카도 엑사스케일 AI 슈퍼컴퓨팅 개발에 힘을 쏟고 있다. 미 국립에너지연구소 과학컴퓨팅센터(NERSC)는 펄머터(Perlmutter) 구축 프로그램에 엔비디아 AI를 도입하고 시스템 내에 6,200개의 엔비디아 A100 GPU를 장착할 계획이다. NERSC는 펄뮤터를 통해 3.9엑사플롭의 AI 성능을 제공하게 될 예정이다.

엔비디아 셀린(Selene)은 DGX 슈퍼POD 기반 클러스터 시스템으로 수주일만에 구축이 가능한 대규모 GPU 클러스터용 공개 레퍼런스 아키텍처다. 엔비디아 DGX 수퍼POD 시스템은 와트당 26.2기가플롭의 전력효율이라는 세계 신기록을 달성하며 가장 효율적인 슈퍼컴퓨터를 선정하는 그린500 리스트에서 높은 순위를 차지했다. 또한 MLPerf 추론 테스트에서 8개의 신기록을 세웠다.

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


#반도체   #소프트웨어   #인공지능  

  • 100자평 쓰기
  • 로그인

세미나/교육/전시
TOP