News
새소식
고객을 향해 진심을 다한 기술을 개발합니다.
새움은 지속가능한 혁신을 실현합니다.
홈새소식
News
공지사항 및 새소식을 확인하세요.
회사의 중요 내용이나 뉴스를 확인하실 수 있습니다.
엔비디아-메타 대규모 인공지능 연구 슈퍼컴퓨터 개발 협력
엔디비아 "AI 슈퍼컴퓨터, 메타 AI 연구원에 5 엑사플롭스급 성능 제공 전망"
엔비디아는 엔비디아 DGX A100 고객 시스템 '메타(Meta)'의 인공지능(AI) 슈퍼컴퓨터를 통해 메타 AI 연구원에게 5 엑사플롭스(exaflops)급 AI 성능을 제공할 것이라고 25일 밝혔다.
엔디비아는 AI 컴퓨팅 기술 분야 기업이다. 메타의 AI 슈퍼컴퓨터는 최첨단 엔비디아 시스템, 인피니밴드(InfiniBand) 패브릭 및 소프트웨어를 통해 수천 개의 GPU에서 최적화가 가능하다.
AI 리서치 슈퍼클러스터(RSC)는 현재 AI 발전 모델을 훈련시키고 있다. 회사는 메타의 RSC가 구축되면 엔비디아 DGX A100 시스템의 최대 고객 설치가 될 것으로 내다보고 있다.
메타는 "RSC가 서로 다른 언어를 사용하는 대규모 집단에게 실시간 음성 통역을 지원해 연구 프로젝트 협력을 원활히 하거나, AR 게임을 함께 할 수 있도록 하는 인공지능(AI) 시스템을 구축하는 데 도움이 되기 바란다"고 블로그를 통해 언급했다.
메타는 AI 리서치 슈퍼클러스터가 구축되면 올해 말 이를 활용해 매개 변수가 1조 개가 넘는 AI 모델을 훈련하는 것이 목표다. 실시간으로 유해한 내용을 파악하는 것과 같은 작업에 대한 자연어 처리 등 분야가 발전한다는 전망이다.
메타는 RSC의 핵심 기준으로 대규모 성능 외에도 높은 신뢰성, 보안성, 프라이버시, 광범위한 AI 모델을 다룰 수 있는 유연성을 꼽았다.
메타의 AI 리서치 슈퍼클러스터는 수백 개의 엔비디아 DGX 시스템을 엔비디아 퀀텀 인피니밴드) 네트워크에 연결해 AI 연구팀의 작업을 가속화한다.
신형 AI 슈퍼컴퓨터는 현재 760개의 엔비디아 DGX A100 시스템을 컴퓨팅 노드로 사용하고 있다. 엔비디아 퀀텀(Quantum) 200Gb/s 인피니밴드 네트워크에 연결된 총 6080개의 엔비디아 A100 GPU를 패키징해 1895 페타플롭스(petaflops)급 TF32 성능을 제공한다.
RSC는 메타 RSC의 기초에 깔린 엔비디아 DGX A100 기술을 기반으로 18개월 만에 서류상 아이디어를 작동하는 AI 슈퍼컴퓨터로 제작했다.
메타가 연구 인프라 기반으로 엔비디아 기술을 선택한 것은 이번이 두 번째다. 메타는 2017년 하루 3만5000개의 AI 훈련 작업을 처리하는 엔비디아 V100 텐서 코어 GPU 2만2000개로 AI 연구용 1세대 인프라를 구축한 바 있다.
회사는 올해 말 두 번째 단계 과정에서 1만 6000개의 GPU로 확대할 수 있다고 보고있다. RSC는 메타가 5 엑사플롭스(exaflops)급 양의 혼합 정밀 AI 성능을 제공할 것으로 보고있다. 또 메타는 RSC의 스토리지 시스템을 확장해 초당 16 테라바이트의 속도로 최대 1엑사바이트의 데이터를 제공하는 것이 목표다.
한편 엔비디아 AI 기술은 기업의 규모에 관계없이 사용할 수 있다.
전체 엔비디아 AI 소프트웨어 스택이 포함된 엔비디아 DGX는 단일 시스템에서 온프레미스 또는 코로케이션 프로바이더에서 실행되는 DGX SuperPOD로 쉽게 확장할 수 있다. 또 고객은 엔비디아 DGX 파운드리를 통해 DGX 시스템을 대여할 수 있다.
https://www.ebn.co.kr/news/view/1517387/?sc=Naver
새움은 늘 한결같은 마음으로 지속가능한 서비스를 지원합니다.
1644-5745