ML퍼프 테스트서 최고 성능 기록 > 고객상담

ML퍼프 테스트서 최고 성능 기록

페이지 정보

작성자: onion 댓글: 0 조회수: 6 날짜: 2025-04-06

본문

ML퍼프 테스트서 최고 성능 기록…MI300X·망고 LLM부스트 조합으로 H100 성능 추월망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. AI 데이터센터의 성능, 비용 효율성, 개방형 아키텍처를 두루 갖춘 조합으로 가능성을 입증하며 시장의 주목을 받고 있다.망고부스트는 지난 2일 미국 워싱턴주 벨뷰에서 실시된 ML퍼프 인퍼런스(MLPerf Inference) v5.0 테스트에서 자사의 AI 추론 소프트웨어 '망고 LLM부스트'와 AMD 'MI300X' 그래픽처리장치(GPU) 조합으로 라마2-70B(Llama2-70B) 모델 오프라인 추론 부문에서 가장 높은 성능을 기록했다고 5일 밝혔다.이번 테스트는 총 32개의 'MI300X' GPU를 4개 서버 노드에 분산한 다중 노드 구성에서 이뤄졌으며 'MI300X' 기반 시스템의 첫 ML퍼프 멀티노드 제출 사례로도 주목된다.망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. (사진=망고부스트)망고부스트는 '라마2-70B' 오프라인 추론 시나리오에서 초당 10만3천182 토큰(TPS)을 처리해 이전 최고였던 8만2천749 TPS 기록을 넘어섰다. 서버 시나리오에서도 9만3천39 TPS를 기록해 엔비디아 'H100' 기반 시스템 성능을 뛰어넘는 성과를 입증했다.비용 구조 개선 효과도 눈에 띈다. 'MI300X' GPU는 H100 대비 최대 62% 저렴한 가격에 공급되며 '망고 LLM부스트'와의 조합으로 동일 GPU 수 기준 2.8배 더 높은 가격 대비 성능을 기록했다. 일각에서는 이를 고성능 AI 인프라의 비용 구조를 재편할 수 있는 가능성으로 보고 있다.이 같은 성과는 AMD와의 긴밀한 협업을 통해 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택을 최적화한 결과다. 망고부스트는 'MI300X'의 성능을 극대화하는 동시에 단일 노드부터 멀티 노드 클러스터까지 유연하게 확장 가능한 AI 추론 솔루션을 구현했다.클라우드 환경에서도 경쟁 우위가 확인됐다. 망고부스트는 AWS의 'A100' 기반 환경에서 오픈소스 프레임워크 '오라마(Ollama)' 대비 최대 138배 빠른 AI 추론 성능을 보였으며 허깅페이스의 '텍스트 생ML퍼프 테스트서 최고 성능 기록…MI300X·망고 LLM부스트 조합으로 H100 성능 추월망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. AI 데이터센터의 성능, 비용 효율성, 개방형 아키텍처를 두루 갖춘 조합으로 가능성을 입증하며 시장의 주목을 받고 있다.망고부스트는 지난 2일 미국 워싱턴주 벨뷰에서 실시된 ML퍼프 인퍼런스(MLPerf Inference) v5.0 테스트에서 자사의 AI 추론 소프트웨어 '망고 LLM부스트'와 AMD 'MI300X' 그래픽처리장치(GPU) 조합으로 라마2-70B(Llama2-70B) 모델 오프라인 추론 부문에서 가장 높은 성능을 기록했다고 5일 밝혔다.이번 테스트는 총 32개의 'MI300X' GPU를 4개 서버 노드에 분산한 다중 노드 구성에서 이뤄졌으며 'MI300X' 기반 시스템의 첫 ML퍼프 멀티노드 제출 사례로도 주목된다.망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. (사진=망고부스트)망고부스트는 '라마2-70B' 오프라인 추론 시나리오에서 초당 10만3천182 토큰(TPS)을 처리해 이전 최고였던 8만2천749 TPS 기록을 넘어섰다. 서버 시나리오에서도 9만3천39 TPS를 기록해 엔비디아 'H100' 기반 시스템 성능을 뛰어넘는 성과를 입증했다.비용 구조 개선 효과도 눈에 띈다. 'MI300X' GPU는 H100 대비 최대 62% 저렴한 가격에 공급되며 '망고 LLM부스트'와의 조합으로 동일 GPU 수 기준 2.8배 더 높은 가격 대비 성능을 기록했다. 일각에서는 이를 고성능 AI 인프라의 비용 구조를 재편할 수 있는 가능성으로 보고 있다.이 같은 성과는 AMD와의 긴밀한 협업을 통해 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택을 최적화한 결과다. 망고부스트는 'MI300X'의 성능을 극대화하는 동시에 단일 노드부터 멀티 노드 클러스터까지 유연하게 확장 가능한 AI 추론 솔루션을 구현했다.클라우드 환경에서도 경쟁 우위가 확인됐다. 망고부스트는 AWS의 'A100' 기반 환경에서 오픈소스 프레임워크 '오라마(Ollama)' 대비 최대 138배 빠른 AI 추론 성능을 보였으며 허깅페이스의 '텍스트 생성 추론(TGI)'와 vLLM을 포함한 주요 프레임워크와 비교해 성능 및 비용 측면에서 모두 우위를 입증했다.특히 라마3.1-70B, 큐원-

구글상단노출 사이트상위노출 웹상단작업 웹SEO 구글상단작업 네이버상위노출 플레이스상단 seo 하는법 SEO최적화 상위노출 하는법 네이버플레이스상위 구글상위작업 네이버블로그글쓰기 네이버상단작업업체 구글상단노출업체 디시자동댓글 네이버상단노출 네이버지식인자동답변 SEO하는법 웹사이트트래픽 구글찌라시 매크로프로그램 다산신도시부동산 지식인자동답변 네이버지도상단노출 디시인사이드매크로 구글상위노출 네이버지도상위노출 플레이스상위 마케팅프로그램 구글상단노출업체 네이버매크로프로그램 백링크프로그램 플레이스상단 네이버플레이스상위노출 상위노출 플레이스상위노출 키워드찌라시 디시인사이드매크로 네이버마케팅프로그램 네이버지도상위노출 웹사이트 상위노출하는법 디시인사이드댓글자동 쿠팡배송기사 네이버플레이스순위상승 네이버플레이스상단 디시인사이드댓글자동 네이버지식인자동답변 상위노출 네이버블로그매크로 플레이스상위 네이버상위노출 네이버플레이스순위상승 네이버상위작업업체 디시자동댓글 웹상위노출 개포동부동산 네이버상단작업업체 네이버블로그자동글쓰기 구글상단노출 네이버매크로 병점부동산 웹상단작업 웹사이트 상위노출하는법 네이버마케팅 네이버플레이스상단 SEO전문가 구글상위노출하는법 마케팅프로그램판매 홈페이지상위노출 seo 하는법 상위노출 사이트 네이버플레이스트래픽 네이버1페이지노출 구글찌라시 네이버매크로 네이버자동글쓰기 웹사이트트래픽 웹사이트상위노출 네이버마케팅 키워드한줄광고 네이버상단작업 다산신도시부동산 네이버1페이지노출 디시인사이드댓글 네이버블로그AI글작성 디시인사이드자동댓글 마케팅프로그램 SEO하는법 네이버상단노출 부산헌옷방문수거 SEO최적화 백링크구매 상위노출 하는법 지식인자동답변 웹상위노출 구글상위노출하는법

이전글발견의 여정: 새로운 세계 탐험 2025.04.06
다음글후유증 케어 병원, 적기에 제거하지 않는다면 병 2025.04.06

본문 시작

고객상담

페이지 정보

본문