Connect with us


Global

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표

Published

on

엔비디아 AI 플랫폼 네모 메가트론, A100 GPU 사용한 컨테이너형 프레임워크

엔비디아 네모 메가트론
네모 메가트론(NeMo Megatron) 프레임워크

엔비디아(CEO 젠슨 황)가 대규모 언어 모델(LLM)의 크기와 복잡성이 지속적으로 급증함에 따라 최대 30%의 훈련 속도 향상을 제공하는 네모 메가트론(NeMo Megatron) 프레임워크의 업데이트를 발표했다.

이번 업데이트는 두 가지 선구적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 하이퍼 파라미터(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.

1,760억 개의 파라미터(parameter)를 가진 세계 최대 오픈 사이언스, 오픈 액세스 다국어 언어 모델인 블룸(BLOOM)은 최근 엔비디아 AI 플랫폼에서 훈련돼 46개 언어와 13개 프로그래밍 언어로 텍스트 생성을 가능하게 했다. 또한 엔비디아 AI 플랫폼은 5,300억 개의 파라미터를 포함하는 가장 강력한 변환기 언어 모델인 메가트론-튜링 NLG 모델(MT-NLG)을 지원한다.

LLM의 최신 발전

LLM은 텍스트에서 학습하는 최대 수조 개의 파라미터를 포함하는 오늘날 가장 중요한 첨단 기술 중 하나다. 하지만 이를 개발하려면 심층적인 기술 전문 지식, 분산된 인프라, 전체 스택 접근 방식이 필요해 비용과 시간이 많이 든다.

그러나 실시간 콘텐츠 생성, 텍스트 요약, 고객 서비스 챗봇, 대화형 AI 인터페이스를 위한 질문과 답변을 발전시키는 데 있어 큰 이점을 갖는다.

AI 커뮤니티는 LLM을 발전시키기 위해 메가트론(Megatron)-LM, 에이펙스(Apex), 그리고 기타 GPU 가속 라이브러리를 포함하는 엔비디아 AI 플랫폼을 기반으로 하는 마이크로소프트 딥스피드(Microsoft DeepSpeed), Colossal-AI, 허깅 페이스 빅사이언스(Hugging Face BigScience), 페어스케일(Fairscale) 같은 도구의 혁신을 이어가고 있다.

엔비디아는 오늘날 엔비디아 AI 플랫폼에 대한 새로운 최적화를 통해 스택 전체에서 기존의 많은 문제점을 해결하며, AI 커뮤니티와 협력해 모든 사람이 LLM의 기능에 액세스할 수 있기를 기대하고 있다.

LLM 구축 시간 단축

네모 메가트론의 최신 업데이트는 220억에서 1조 파라미터에 이르는 크기의 GPT-3 모델 훈련 속도를 30% 향상시킨다. 이는 1,024개의 엔비디아 A100 GPU를 사용해 1,750억 개의 파라미터 모델에 대한 훈련을 24일 만에 수행하도록 한다. 즉, 결과 도출 시간을 10일 또는 GPU 컴퓨팅 시간으로 약 250,000 시간 단축할 수 있다.

네모 메가트론은 빠르고 효율적이며 사용하기 쉬운 엔드 투 엔드 컨테이너형 프레임워크이다. 데이터 수집, 대규모 모델 훈련, 업계 표준 벤치마크에 대한 모델 평가, 지연 시간(레이턴시)과 처리량 성능에 대한 최첨단 추론이 가능하다.

이를 통해 LLM 훈련과 추론을 다양한 GPU 클러스터 구성에서 쉽게 재현할 수 있다. 현재 얼리 액세스 고객에게 엔비디아 DGX 슈퍼POD(SuperPOD), 엔비디아 DGX 파운드리(Foundry), 마이크로소프트 애저(Microsoft Azure) 클라우드 플랫폼을 제공한다. 또한 다른 클라우드 플랫폼에 대한 지원도 제공될 예정이다.

더불어 사용자에게 엔비디아 가속 인프라의 실습 랩 카탈로그에 대한 단기 액세스를 제공하는 무료 프로그램인 엔비디아 런치패드(LaunchPad)에서 기능을 체험할 수 있다.

LLM 훈련 속도를 높이는 두 가지 새로운 기술

LLM 훈련을 최적화하고 확장하는 업데이트에 포함된 두 가지 새로운 기술은 시퀀스 병렬화(SP)와 선택적 활성화 재계산(SAR)이다.

시퀀스 병렬화(SP)는 이전에 병렬화 되지 않은 변환기 레이어의 영역이 시퀀스 차원을 따라 독립적이라는 점을 인식해 텐서 수준 모델 병렬화를 확장한다.

시퀀스 차원을 따라 이러한 레이어를 분할함으로써 텐서 병렬 장치 전반에 걸쳐 컴퓨팅 및 가장 중요한 활성화 메모리를 분산할 수 있다. 활성화가 분산되므로 재계산 대신 역방향 패스에 대해 더 많은 활성화를 저장할 수 있다.

엔비디아 네모 메가트론
[그림] 변환기 레이어 내의 병렬화 모드 – ALT-TEXT: 시퀀스 병렬화는 레이어놈(LayerNorm)과 드롭아웃(Dropout) 레이어에서 사용되는 반면 텐서 병렬화는 어텐션 및 FFN 레이어에서 사용된다

선택적 활성화 재계산은 다른 활성화가 재계산하는 데 다른 수의 작업이 필요하다는 점을 인식한다. 이를 통해 메모리 제약으로 인해 활성화의 전부가 아닌 일부를 재계산해야 하는 경우를 개선한다.

전체 변환기 레이어를 검사하고 재계산하는 대신, 상당한 양의 메모리를 차지하지만 재계산하는 데 계산 비용이 많이 들지 않는 각 변환기 레이어의 부분만 검사하고 재계산할 수 있다.

훈련과 추론을 위한 새로운 하이퍼 파라미터 도구

분산된 인프라에서 LLM 모델 구성을 찾는 과정에는 시간이 많이 소요된다. 네모 메가트론은 코드 변경 없이 최적의 훈련과 추론 구성을 자동으로 찾는 하이퍼 파라미터 도구를 도입한다. LLM은 처음부터 추론을 위해 수렴하도록 훈련되어 효율적인 모델 구성을 검색하는데 시간을 낭비하지 않는다.

데이터 병렬화, 텐서 병렬화, 파이프라인 병렬화, 시퀀스 병렬화, 마이크로 배치 크기, 활성화 체크포인트 레이어 수(선택적 활성화 재계산 포함)와 같은 고유한 파라미터에 대한 경험적 그리드 검색을 사용하여 처리량이 가장 우수한 구성을 찾는다.

NGC의 컨테이너에 대한 엔비디아 테스트의 하이퍼 파라미터 도구를 사용하면 24시간 이내에 175B GPT-3 모델에 대한 최적의 훈련 구성에 도달한다. 전체 활성화 재계산을 사용하는 일반적인 구성과 비교할 때 처리 속도가 20-30% 향상됐다. 더불어 최신 기술을 사용해 파라미터가 20B 이상인 모델의 처리 속도를 추가로 10-20% 향상시킨다.

Continue Reading
Advertisement

Click to comment

댓글 남기기

Global

온세미, 폭스바겐 그룹의 차세대 전기차 공급업체로 선정

Published

on

By

온세미, 최신 세대 EliteSiC M3e 플랫폼 기반으로 완전히 최적화된 전력 시스템 솔루션의 주요 공급업체로 선정

지능형 전력 및 센싱 기술의 선도 기업인 온세미(나스닥: ON)는 폭스바겐 그룹(Volkswagen Group)과 실리콘 카바이드(SiC) 기반의 통합 전력 모듈 솔루션에 대한 다년 계약을 체결했다고 발표했다.

이번 계약으로 온세미는 폭스바겐 그룹의 SSP(Scalable Systems Platform)를 위한 차세대 트랙션 인버터의 일부인 완전한 파워 박스 솔루션의 주요 공급업체가 됐다.

EliteSiC 베어 다이
EliteSiC 베어 다이 (image. Onsemi)

해당 솔루션은 모든 차량 유형에 호환되도록 고출력부터 저출력 트랙션 인버터에 이르기까지 모든 전력 단계에서 확장할 수 있는 통합 모듈에 실리콘 카바이드(SiC) 기반 기술을 갖춘 것이 특징이다.

온세미의 파워 박스 솔루션은 엘리트 실리콘 카바이드(EliteSiC) M3e MOSFET을 기반으로, 더 많은 전력을 더 작은 패키지에서 처리할 수 있어 에너지 손실을 크게 줄여준다. 냉각 채널에 장착된 3개의 통합 하프 브리지 모듈을 포함하면 반도체부터 냉각수 케이스에 이르기까지 열을 효과적으로 관리해 시스템 효율을 더욱 향상할 수 있다.

이는 성능 향상, 열 제어 개선, 효율 증대로 이어져, 전기차가 한 번의 충전으로 더 멀리 주행할 수 있다. 이번 통합 솔루션을 통해 폭스바겐 그룹은 향후 EliteSiC 기반 플랫폼으로 쉽게 전환하고 전기차 혁신의 선두를 유지할 수 있을 것으로 기대된다.

하산 엘 코우리(Hassane El-Khoury) 온세미 CEO는 “온세미는 전체 전력 하위 어셈블리를 포괄하는 완전한 전력 시스템 솔루션을 제공함으로써 폭스바겐 그룹의 차량 라인업에 대한 효율성과 성능을 극대화하고 단순화된 단일 모듈 식 확장형 플랫폼을 제공한다. 이러한 새로운 접근 방식으로 성능 저하 없이 다양한 차량에 대한 필요한 전력을 맞춤화하고 기능을 추가하면서 비용을 절감할 수 있다”고 말했다.

또한 폭스바겐 그룹은 SiC 제조 확장을 위한 온세미의 체코 투자 계획에 따라 수혜를 받을 것으로 예상된다. 온세미의 체코 투자는 유럽에 트랙션 인버터 전력 시스템을 위한 엔드 투 엔드 생산 시설을 구축한다. 온세미 시설에 대한 근접성은 폭스바겐 그룹의 공급망을 강화하는 동시에 물류를 개선하고 제조 공정에 더 빠르게 통합할 수 있게 해줄 것이다.

이에 앞서 온세미와 폭스바겐은 지난해(2023년)초 “차세대 전기차를 위한 실리콘 카바이드 (SiC)기술에 대한 전략적 협력” 협약을 채결한 바 있다. 이후 양사는 전기 자동차(EV)를 위한 OEM의 모듈식 자동차 플랫폼을 위한 완전한 트랙션 인버터 솔루션을 개발해 왔다.

한편 EliteSiC M3e MOSFET에 대한 자세한 내용은 여기(링크)에서 확인할 수 있다.

Continue Reading

Global

TI와 델타 일렉트로닉스, 전기차 온보드 충전 발전을 위한 협력 발표

TI가 Delta Electronics와 차세대 전기차 온보드 충전 및 전력 솔루션을 개발하기 위한 장기적인 협력을 발표했다

Published

on

By

공동 혁신 연구소 통해 전력 관리 및 전력 공급에 대한 양사의 연구 개발 역량 접목

좌: 제임스 탕(James Tang) 델타 일렉트로닉스 모빌리티 부문 총괄 부사장 겸 전기차 솔루션 사업 그룹 책임자 / 우: 아미카이 론(Amichai Ron) TI 임베디드 프로세싱 부문 수석 부사장

텍사스 인스트루먼트(TI)델타 일렉트로닉스(Delta Electronics)와 차세대 전기차 온보드 충전 및 전력 솔루션을 개발하기 위한 장기적인 협력을 발표했다.

이러한 개발 협력은 대만 핑전 시에 설립한 TI와 델타 일렉트로닉스의 공동 혁신 연구소에서 전력 관리 및 전력 공급에 대한 양사의 연구 개발 역량을 접목함으로써 이루어질 예정이다. TI와 델타 일렉트로닉스는 함께 전력 밀도, 성능 및 크기를 최적화하여 더 안전하고, 더 빠르게 충전되며, 더 저렴한 전기차의 실현을 가속화하는 것을 목표로 한다.

아미카이 론(Amichai Ron) TI 임베디드 프로세싱 부문 수석 부사장은 “전기차로의 전환은 보다 지속가능한 미래를 실현하는 데 핵심적이며, TI는 델타 일렉트로닉스와 수년간의 협력을 통해 탄탄한 기반을 구축했다”며, “우리는 델타 일렉트로닉스와 함께 TI 반도체를 사용하여 더 작고 효율적이며 안정적인 온보드 충전기 및 DC/DC 컨버터와 같은 전기차 전력 시스템을 개발하여 주행 거리를 늘리고 전기차의 광범위한 도입을 장려할 것”이라고 말했다.

제임스 탕(James Tang) 델타 일렉트로닉스 모빌리티 부문 총괄 부사장 겸 전기차 솔루션 사업 그룹 책임자는 “델타 일렉트로닉스는 TI와의 공동 혁신 연구소를 설립해서 디지털 제어 및 GaN 분야에 대한 TI의 풍부한 경험과 첨단 기술을 활용하며 전기차 전력 시스템의 전력 밀도와 성능을 향상시키고자 한다.”고 밝혔다.

그는 또한 “우리는 더욱 첨단화된 제품 개발 및 설계 역량을 바탕으로 긴밀한 기술 교류와 협력을 통해 제품 개발을 가속화하고 제품 안전과 품질을 개선하는 것을 목표로 하고 있다. 또한 빠르게 발전하는 전기차 시장에서 기술 리더십을 더욱 강화하고 서로 윈윈할 수 있기를 기대한다”고 말했다.

차세대 차량용 전력 솔루션을 위한 3단계 개발

  • 양사 협력의 첫 단계에서는 델타 일렉트로닉스의 최신 C2000™ 실시간 마이크로컨트롤러(MCU)와 TI의 독점적인 액티브 전자기 간섭(EMI) 필터 제품을 사용해서 더 가볍고 비용 효율적인 11kW 온보드 충전기를 개발하는 데 중점을 두고 있다. 양사는 TI의 제품을 사용해서 충전기의 크기를 30% 줄이면서 최대 95%의 전력 변환 효율을 달성하기 위해 협력하고 있다.
  • 두번째 단계에서 TI와 델타 일렉트로닉스는 차량용 애플리케이션을 위한 최신 C2000 실시간 MCU를 활용하여 자동차 제조업체가 가장 엄격한 자동차 안전 요구 사항을 나타내는 ASIL D까지 자동차 안전 무결성 수준(ASIL)을 달성할 수 있도록 지원한다. 고도로 통합된 차량용 절연 게이트 드라이버는 온보드 충전기의 전력 밀도를 더욱 향상시키는 동시에 전체 솔루션 크기를 최소화한다.
  • 3단계에서는 양사가 협력하여 질화 갈륨(GaN) 기술을 사용한 제품 개발 및 제조 분야에서 10년 이상 쌓아온 TI의 경험을 바탕으로 차세대 차량용 전력 솔루션을 개발할 예정이다.

루크 리 (Luke Lee) TI 대만, 일본, 한국 및 남아시아 지역 사장은 “차량용 애플리케이션에서 전자 장치의 급속한 성장으로 더욱 풍부하고 효율적이며 안전한 차량을 구현할 수 있게 됐다. 하지만 여전히 기술적 과제들이 남아 있다”며, ” TI는 대만에서 55년 동안 차량용 전원 관리 분야에서 쌓아온 수십 년의 경험을 바탕으로 현지의 자동차 산업과 긴밀한 관계를 구축해 왔다. 델타 일렉트로닉스와의 협력 및 공동 혁신 연구소 설립은 TI가 차량 전기화를 추진하는 여러가지 방법 중 하나”라고 말했다.

Continue Reading

Trending

© 2024 Copyright by Mobility Times. All rights reserved.


tel. 0505-379-1234 | e-mail. mobi@mobilitytimes.net | Powered by 아이씨엔 미래기술센터
Address: #260, 2F, Shinchonro 25, Seodaemun-gu, Seoul, 03785, Korea
주소: 서울시 서대문구 신촌로 25, 2층 260호 (우 03785) 아이씨엔 미래기술센터 
[전직원 스마트오피스 및 재택근무로 자율근무제 시행중입니다.] 

모빌리티타임즈 (Mobility Times) | 등록번호: 서울 아04965 | 등록일: 2018년 2월 9일 | 사업자등록번호: 206-11-69466 | 발행처: 아이씨엔
발행인/편집인: 오승모 | 개인정보보호책임자: 오승모 | 청소년보호책임자: 오윤경 | 기사제보: mobi@mobilitytimes.net


모빌리티타임즈(mobility times)의 모든 콘텐츠는 저작권법의 보호를 받습니다. 이의 일부 또는 전부를 무단 사용하는 것은 저작권법에 저촉되며, 법적 제재를 받을 수 있습니다.