Connect with us


Global

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표

Published

on

엔비디아 AI 플랫폼 네모 메가트론, A100 GPU 사용한 컨테이너형 프레임워크

엔비디아 네모 메가트론
네모 메가트론(NeMo Megatron) 프레임워크

엔비디아(CEO 젠슨 황)가 대규모 언어 모델(LLM)의 크기와 복잡성이 지속적으로 급증함에 따라 최대 30%의 훈련 속도 향상을 제공하는 네모 메가트론(NeMo Megatron) 프레임워크의 업데이트를 발표했다.

이번 업데이트는 두 가지 선구적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 하이퍼 파라미터(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.

1,760억 개의 파라미터(parameter)를 가진 세계 최대 오픈 사이언스, 오픈 액세스 다국어 언어 모델인 블룸(BLOOM)은 최근 엔비디아 AI 플랫폼에서 훈련돼 46개 언어와 13개 프로그래밍 언어로 텍스트 생성을 가능하게 했다. 또한 엔비디아 AI 플랫폼은 5,300억 개의 파라미터를 포함하는 가장 강력한 변환기 언어 모델인 메가트론-튜링 NLG 모델(MT-NLG)을 지원한다.

LLM의 최신 발전

LLM은 텍스트에서 학습하는 최대 수조 개의 파라미터를 포함하는 오늘날 가장 중요한 첨단 기술 중 하나다. 하지만 이를 개발하려면 심층적인 기술 전문 지식, 분산된 인프라, 전체 스택 접근 방식이 필요해 비용과 시간이 많이 든다.

그러나 실시간 콘텐츠 생성, 텍스트 요약, 고객 서비스 챗봇, 대화형 AI 인터페이스를 위한 질문과 답변을 발전시키는 데 있어 큰 이점을 갖는다.

AI 커뮤니티는 LLM을 발전시키기 위해 메가트론(Megatron)-LM, 에이펙스(Apex), 그리고 기타 GPU 가속 라이브러리를 포함하는 엔비디아 AI 플랫폼을 기반으로 하는 마이크로소프트 딥스피드(Microsoft DeepSpeed), Colossal-AI, 허깅 페이스 빅사이언스(Hugging Face BigScience), 페어스케일(Fairscale) 같은 도구의 혁신을 이어가고 있다.

엔비디아는 오늘날 엔비디아 AI 플랫폼에 대한 새로운 최적화를 통해 스택 전체에서 기존의 많은 문제점을 해결하며, AI 커뮤니티와 협력해 모든 사람이 LLM의 기능에 액세스할 수 있기를 기대하고 있다.

LLM 구축 시간 단축

네모 메가트론의 최신 업데이트는 220억에서 1조 파라미터에 이르는 크기의 GPT-3 모델 훈련 속도를 30% 향상시킨다. 이는 1,024개의 엔비디아 A100 GPU를 사용해 1,750억 개의 파라미터 모델에 대한 훈련을 24일 만에 수행하도록 한다. 즉, 결과 도출 시간을 10일 또는 GPU 컴퓨팅 시간으로 약 250,000 시간 단축할 수 있다.

네모 메가트론은 빠르고 효율적이며 사용하기 쉬운 엔드 투 엔드 컨테이너형 프레임워크이다. 데이터 수집, 대규모 모델 훈련, 업계 표준 벤치마크에 대한 모델 평가, 지연 시간(레이턴시)과 처리량 성능에 대한 최첨단 추론이 가능하다.

이를 통해 LLM 훈련과 추론을 다양한 GPU 클러스터 구성에서 쉽게 재현할 수 있다. 현재 얼리 액세스 고객에게 엔비디아 DGX 슈퍼POD(SuperPOD), 엔비디아 DGX 파운드리(Foundry), 마이크로소프트 애저(Microsoft Azure) 클라우드 플랫폼을 제공한다. 또한 다른 클라우드 플랫폼에 대한 지원도 제공될 예정이다.

더불어 사용자에게 엔비디아 가속 인프라의 실습 랩 카탈로그에 대한 단기 액세스를 제공하는 무료 프로그램인 엔비디아 런치패드(LaunchPad)에서 기능을 체험할 수 있다.

LLM 훈련 속도를 높이는 두 가지 새로운 기술

LLM 훈련을 최적화하고 확장하는 업데이트에 포함된 두 가지 새로운 기술은 시퀀스 병렬화(SP)와 선택적 활성화 재계산(SAR)이다.

시퀀스 병렬화(SP)는 이전에 병렬화 되지 않은 변환기 레이어의 영역이 시퀀스 차원을 따라 독립적이라는 점을 인식해 텐서 수준 모델 병렬화를 확장한다.

시퀀스 차원을 따라 이러한 레이어를 분할함으로써 텐서 병렬 장치 전반에 걸쳐 컴퓨팅 및 가장 중요한 활성화 메모리를 분산할 수 있다. 활성화가 분산되므로 재계산 대신 역방향 패스에 대해 더 많은 활성화를 저장할 수 있다.

엔비디아 네모 메가트론
[그림] 변환기 레이어 내의 병렬화 모드 – ALT-TEXT: 시퀀스 병렬화는 레이어놈(LayerNorm)과 드롭아웃(Dropout) 레이어에서 사용되는 반면 텐서 병렬화는 어텐션 및 FFN 레이어에서 사용된다

선택적 활성화 재계산은 다른 활성화가 재계산하는 데 다른 수의 작업이 필요하다는 점을 인식한다. 이를 통해 메모리 제약으로 인해 활성화의 전부가 아닌 일부를 재계산해야 하는 경우를 개선한다.

전체 변환기 레이어를 검사하고 재계산하는 대신, 상당한 양의 메모리를 차지하지만 재계산하는 데 계산 비용이 많이 들지 않는 각 변환기 레이어의 부분만 검사하고 재계산할 수 있다.

훈련과 추론을 위한 새로운 하이퍼 파라미터 도구

분산된 인프라에서 LLM 모델 구성을 찾는 과정에는 시간이 많이 소요된다. 네모 메가트론은 코드 변경 없이 최적의 훈련과 추론 구성을 자동으로 찾는 하이퍼 파라미터 도구를 도입한다. LLM은 처음부터 추론을 위해 수렴하도록 훈련되어 효율적인 모델 구성을 검색하는데 시간을 낭비하지 않는다.

데이터 병렬화, 텐서 병렬화, 파이프라인 병렬화, 시퀀스 병렬화, 마이크로 배치 크기, 활성화 체크포인트 레이어 수(선택적 활성화 재계산 포함)와 같은 고유한 파라미터에 대한 경험적 그리드 검색을 사용하여 처리량이 가장 우수한 구성을 찾는다.

NGC의 컨테이너에 대한 엔비디아 테스트의 하이퍼 파라미터 도구를 사용하면 24시간 이내에 175B GPT-3 모델에 대한 최적의 훈련 구성에 도달한다. 전체 활성화 재계산을 사용하는 일반적인 구성과 비교할 때 처리 속도가 20-30% 향상됐다. 더불어 최신 기술을 사용해 파라미터가 20B 이상인 모델의 처리 속도를 추가로 10-20% 향상시킨다.

Continue Reading
Advertisement

Click to comment

댓글 남기기

Global

지멘스 모빌리티 브라운슈바이크 공장 150주년 기념식 가져

Published

on

By

세계에서 가장 오래된 최대의 신호 및 철도 자동화 기술 개발 및 생산 사이트

Braunschweig site of Siemens Mobility
사진. 앞줄 좌로부터 1)Siemens AG CEO인 Roland Busch, 2)독일 디지털 사업 및 교통 연방 장관 Volker Wissing, 3)Siemens Mobility Rail Infrastructure CEO인 Andre Rodenbeck

세계 최대이자 가장 오래된 신호 및 철도 자동화 기술 개발 및 생산 사이트인 지멘스 모빌리트(Siemens Mobility)의 브라운슈바이크(Braunschweig) 사이트가 지난 11월 150주년을 맞이해 기념식을 가졌다.

독일 로워색슨 지역에 위치한 브라운슈바이크 사이트는 1873년 브라운슈바이크(Braunschweig) 사업가 Max Jüdel과 기계공학자 Heinrich Büssing에 의해 설립되어 이후 수십 년간 지멘스(Siemens)에 의해 단계적으로 인수되었다.

브라운슈바이크에서의 혁신은 전 세계 철도 인프라의 발전을 일관되게 이끌어왔다. 오늘날 지멘스 모빌리티는 브라운슈바이크 시설에서 철도 인프라를 더욱 효율적이고 지속 가능하며 신뢰성 있게 만드는 기술을 연구 및 개발하고 있다.

이번 행사에는 독일의 디지털 사업 및 교통 연방 장관 Volker Wissing, 경제 사업, 교통, 주택 및 디지털화 장관인 Olaf Lies, Siemens AG CEO인 Roland Busch 등이 참석했다.

지멘스 모빌리티 Rail Infrastructure CEO인 Andre Rodenbeck는 “지난 150년 동안 브라운슈바이크의 저희 사이트는 어제, 오늘 및 내일의 철도 교통을 위한 씽크탱크 역할을 수행해 왔다”고 말하고, “오늘날 우리는 독일과 전 세계 철도 교통을 위해 이곳에서 이루어진 선도적인 작업의 긴 역사를 돌아볼 뿐만 아니라 미래를 바라보고 있다. 우리는 브라운슈바이크에서의 혁신으로 내일의 모빌리티를 형성하는데 중요한 역할을 지속해서 담당할 것이다”라고 밝혔다.

환경 친화적인 교통 수단으로 철도에 대한 투자가 전 세계적으로 증가하고 있다. 독일 연방 정부는 디지털 철도 독일(DSD) 프로그램을 통해 국내 철도망의 포괄적인 혁신 계획을 시작했다. 브라운슈바이크 사이트는 이에 기여할 준비가 되어 있다고 설명했다.

Braunschweig site of Siemens Mobility
Braunschweig site of Siemens Mobility

지난 5년간 약 6,000만 유로가 이 사이트와 생산 시설에 투자되었다. 지멘스 모빌리티는 현재 브라운슈바이크 공장에서 46개국의 약 4,000명의 고도로 자격을 갖춘 직원을 고용하고 있으며, 이 중 약 1,100명은 생산 및 조립, 약 900명은 연구 및 개발, 약 1,500명은 글로벌 프로젝트 관리에 종사하고 있다.

한편, K 50 릴레이 전쟁 이후 가장 큰 획기적 발전 중 하나는 근육의 힘으로 작동되는 기계적 인터락킹 시스템에서 전기 기계식 솔루션으로의 전환이다. 전문가들 중에서는 K 50 신호 릴레이가 전설적인 것으로 여겨진다. 이것은 릴레이 인터락킹의 기초가 되었으며, 철도 교통 자동화를 위한 첫 번째 단계였다.

Continue Reading

Global

ABB E-모빌리티, 보리티(Vourity) 인수로 전기차 충전 결제 간소화

ABB E-모빌리티가 스웨덴 핀테크 스타트업 보리티(Vourity)를 인수했다. 전기차 충전소 결제 간소화 솔루션 확보로 다양한 결제 옵션을 위한 셀프 서비스 활성화에 적극 나선다는 구상이다

Published

on

By

electric vehicle charging
electric vehicle charging image (abb)

ABB E-mobility가 스웨덴 스타트업인 보리티(Vourity)를 인수해 EV 충전의 결제 방식을 간소화하고 개선하겠다고 밝혔다.

보리티(Vourity)는 드라이버의 생활을 충전소에서 간편하게 만들어 주며, 다양한 결제 방식(신용카드, 모바일 페이, RFID 태그 등)을 사용하여 빠르고 안전한 EV 충전 결제를 위한 기술을 제공한다.

보리티의 클라우드 기반 솔루션은 결제 스테이션을 통해 또는 직접 충전기에 통합하여 사용할 수 있다.

ABB E-mobility의 Daniel Alarcon-Rubio CDO는 “보리티(Vourity)의 기술이 얼마나 간단하고 쉬운지에 대해 가장 인상적인 것은 우리 시스템에서 추구하는 것과 완벽하게 일치하기 때문에 ABB E-mobility에 완벽한 전략이라고 본다. 보리티의 인력과 기술을 확보해 우리 자체 시스템의 개발을 강화하고 가장 좋은 서비스를 제공할 수 있게 됐다.”고 말했다.

보리티의 인수는 ABB E-mobility의 기술 스택에 중요한 요소를 추가하여 고객 제공에 매끄러운 결제 시스템을 통합 할 수 있도록 할 것으로 기대된다.

Continue Reading

Trending

© 2024 Copyright by Mobility Times. All rights reserved.


tel. 0505-379-1234 | e-mail. mobi@mobilitytimes.net | Powered by 아이씨엔 미래기술센터
Address: #260, 2F, Shinchonro 25, Seodaemun-gu, Seoul, 03785, Korea
주소: 서울시 서대문구 신촌로 25, 2층 260호 (우 03785) 아이씨엔 미래기술센터 
[전직원 스마트오피스 및 재택근무로 자율근무제 시행중입니다.] 

모빌리티타임즈 (Mobility Times) | 등록번호: 서울 아04965 | 등록일: 2018년 2월 9일 | 사업자등록번호: 206-11-69466 | 발행처: 아이씨엔
발행인/편집인: 오승모 | 개인정보보호책임자: 오승모 | 청소년보호책임자: 오윤경 | 기사제보: mobi@mobilitytimes.net


모빌리티타임즈(mobility times)의 모든 콘텐츠는 저작권법의 보호를 받습니다. 이의 일부 또는 전부를 무단 사용하는 것은 저작권법에 저촉되며, 법적 제재를 받을 수 있습니다.