퀀텀코리아, 빅데이터 공유 및 아카이빙 스토리지 ‘스토어넥스트(StorNextⓇ)’ 공급
  • 2013-10-23
  • 편집부



유전체 분석 데이터를 보다 안전하게 관리하고 데이터 활용도를 높이기 위하여 빅데이터 아카이빙(원본 데이터의 저장 및 관리) 시스템 구축 사업 추진
1개 생물의 유전체 분석을 위해 기본 정보 300GB의 100배인 30TB의 분석 데이터를 스토리지에 안정적으로 저장하고 필요 시에 시스템 부하 없이 빠르게 액세스하여 사용
스토어넥스트, 총 144TB 용량을 제공하여 다중 작업이나 복잡한 생물의 유전체 분석 시에 생성되는 빅데이터들도 안정적으로 저장할 수 있도록 지원

데이터 보호 및 빅데이터 관리 분야의 글로벌 선두기업인 퀀텀 (www.quantum.com/kr, 이강욱 지사장)은 오늘, 극지연구소(김예동 소장)가 유전체 분석 연구 데이터의 안정적인 관리 및 공유를 위해 퀀텀의 빅데이터 공유 및 아카이빙 스토리지인 ‘스토어넥스트(StorNextⓇ)’를 도입했다고 밝혔다.

유전체 분석 데이터의 가치를 높이기 위해, 빅데이터 아카이빙 시스템 구축 나서
극지연구소는 극지생물의 기능 유전체 연구를 통한 극지 고유 생명 현상을 규명하고, 극지생물의 오믹스(특정 세포 속에 들어 있는 생리현상과 관련된 대사에 대한 대량의 정보(전사체, 단백질체, 형질체 등)를 통합적으로 분석해 생명현상 규명) 연구에 나서고 있다. 이를 통해, 극지생태계의 형성과 진화는 물론 극지생물의 고유 생명현상(극한환경 적응, 진화) 특성을 이해함으로써 지구생명의 탄생과 진화의 기원을 추정함으로써, 국제적으로도 극지유전체연구 분야를 선도하고 있다.

이러한 유전체 분석 작업은 불과 10년 전만해도 유전자의 염기서열을 분석하는 데에는 9~10년이 소요됐다. 그러나 차세대 유전자 염기서열 분석기술인 NGS(Next Generation Sequencing)가 지난 2004년에 상용화되면서 인간이나 작물과 같이 상대적으로 고등생물의 경우에도 몇 달이면 전체 유전체 해독이 가능할 정도로 이제는 훨씬 쉽고 빠르게 저비용으로 대용량의 시퀀싱(sequencing: 서열 분석)이 가능해졌다

하지만 이러한 시퀀싱을 통해 해독한 DNA의 염기서열 자체는 DNA를 구성하는 염기인 A, T, G, C가 어떤 순서로 배열됐는지 그 서열순서를 하나하나 밝혀낸 데이터로서, 그 자체가 유용한 정보는 아니다. 예를 들어 인간의 유전체는 30억 쌍의 염기서열로 구성되어 있으며, 보통 이를 분석하기 위해 얻은 중간 데이터는 그 수십, 수백 배가 필요해, 데이터량 자체가 매우 크다. 이 데이터들 중에 의미 있는 데이터를 추출하여 인간의 유전적 특성이나 질병 등의 정보를 얻기 위는 컴퓨팅 작업이 필수적이다.

이에 극지연구소는 유전체 분석 데이터를 보다 안전하게 관리하고 데이터 활용도를 높이기 위하여 기존 총 50TB 용량의 NAS(네트워크 스토리지) 3개에 분산되어 저장되어 있던 데이터들을 통합 관리하고 용량을 추가 증설하는 빅데이터 아카이빙(원본 데이터의 저장 및 관리) 시스템 구축 사업을 추진했다. 특히 유전체 분석이 전세계적으로 진행이 되면서 다양한 연구 성과인 R&D 데이터들을 보다 안정적으로 관리하고 활용하는 것이 절실했다.

극지연구소는 유전체 분석 자료 보관을 위한 스토리지 시스템을 144TB규모로 구축하고 유전체 분석 빅데이터들을 안정적으로 보관하고 활용하기 위해, 장기간 데이터 보관과 안정적인 운영이 가능한 테이프 방식의 백업 솔루션을 검토했다. 이에 극지연구소는 향후 스토리지 추가 증설이 용이한 높은 확장성을 제공하고, 사용 편리성은 몰론, 안정적이고 빠르게 데이터를 액세스하여 활용할 수 있도록 빠른 처리 속도, 가격 대비 성능 등 다양한 사항들을 종합적으로 고려하여 최종적으로 퀀텀의 빅데이터 공유 및 아카이빙 스토리지인 ‘스토어넥스트(StorNextⓇ)’를 도입하기로 결정했다. 특히 StorNext Gateway Server(G302)를 통한 Network 기반의 고성능 데이터 엑세스를 보장하고, 전용 메타데이터 컨트롤러 서버(MDC)와 QX-1200 Disk를 사용하여 SAN 기반의 공유 스토리지의 성능과 확장성을 고려하여 제품을 선정하였다.

퀀텀 스토어넥스트, 안정적인 빅데이터 관리 및 파일 공유 기능
극지연구소는 스토어넥스트를 활용하여 일년에 4개 이상의 유전체 분석 업무를 수행하고 있다. 실제로 1개 생물의 유전체 분석을 위해 기본 정보와 중간처리과정의 데이터등의 수십TB의 분석 데이터를 스토리지에 안정적으로 저장하고 필요 시에 시스템 부하 없이 빠르게 액세스하여 사용하고 있다. 특히 스토어넥스트는 총 144TB 용량을 제공하여 다중 작업이나 복잡한 생물의 유전체 분석 시에 생성되는 빅데이터들도 안정적으로 저장할 수 있도록 지원한다.

극지연구소 박현 책임연구원은 “지금까지 전세계적으로 유전체 정보가 분석된 고등생물은 실제로50여종에 불과하다. 유전체 분석 기술의 발전은 극지 생물뿐만 아니라 지구의 수많은 생물들의 유전체 특성을 분석하여 인류에게 의미 있는 정보를 제공하고 있다. 이러한 작업을 위해 도입된 퀀텀의 스토어낵스트를 통하여 안정성, 높은 확장성, 용이한 대용량 데이터 관리로 연구효율성이 크게 향상될 것으로 기대한다”라고 말했다.

빅데이터 아카이빙 스토리지 추가 도입 및 원격지 백업 추진 계획
극지연구소는 향후 유전체 분석 연구 데이터의 증가에 맞춰 추가적으로 빅데이터 아카이빙 스토리지를 추가로 도입할 계획이다. 또한 장기적으로는 데이터의 중요도를 고려하여 원격지에 주요 데이터를 소산(분사 저장)하는 것도 계획하고 있다.

 

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>



  •  홈페이지 보기
  •  트위터 보기
  •  페이스북 보기
  •  유투브 보기
  • 100자평 쓰기
  • 로그인

TOP