Amazon은 자사 AI 칩에 Nvidia 기술을 통합하고 새로운 Trainium 서버를 출시할 예정입니다.

  • AWS는 고성능 상호 연결을 개선하기 위해 Nvidia의 NVLink Fusion을 출시 예정인 Trainium4 AI 칩에 통합할 예정입니다.
  • 이 회사는 Trainium3를 탑재한 새로운 서버를 출시했는데, 컴퓨팅 성능은 4배 이상, 에너지 소비는 40% 감소했습니다.
  • Amazon은 기업 및 정부 데이터 센터에 구축 가능한 인프라인 AI 팩토리를 통해 AI에 대한 노력을 강화하고 있습니다.
  • 이 전략의 목표는 외부 공급업체에 대한 의존도를 줄이고 칩과 AI 인프라 분야에서 엔비디아, 구글, 마이크로소프트와 직접 경쟁하는 것입니다.

클라우드 내 인공지능 인프라

Amazon Web Services는 인공지능 전략 인텔은 자사의 칩 포트폴리오와 엔비디아와의 기술 제휴를 강화하는 일련의 발표를 통해, 라스베이거스에서 열린 주요 연례 클라우드 컴퓨팅 컨퍼런스에서 엔비디아 기술을 자사의 다가올 AI 프로세서에 어떻게 통합할 것인지 자세히 설명하고 대규모 AI 모델의 훈련 및 배포를 위해 설계된 새로운 서버를 공개했습니다.

이러한 움직임은 AWS가 마이크로소프트, 구글, 메타와 같은 거대 기업들과 직접 경쟁하는 인공지능 컴퓨팅 분야에서 더욱 두드러진 입지를 확보하게 되었습니다. 아마존은 단순히 타사 GPU를 재판매하는 데 그치지 않고, 자체 칩, 특화된 상호 연결, 그리고 엔비디아와의 계약을 결합하여 유럽 ​​및 글로벌 기업에 더 많은 성능 및 비용 옵션을 제공합니다..

Trainium4: Amazon의 다음 칩은 Nvidia의 언어를 사용할 것입니다.

가장 주목할 만한 발표 중 하나는 회사의 미래 AI 교육 칩이 다음과 같이 확인되었다는 것입니다. 트레이닝니움4, 상호 연결 기술을 통합합니다 엔비디아 NVLink 퓨전이 솔루션은 프로세서 간의 초고속 통신을 가능하게 하는데, 이는 수천 대의 머신이 협력하여 대규모 언어 모델을 훈련해야 할 때 매우 중요합니다.

NVLink는 고성능 데이터센터 분야에서 엔비디아의 가장 큰 자산 중 하나로 여겨지며, 지금까지는 주로 엔비디아 자체 GPU 기반 구성과 관련되어 있었습니다. 아마존이 이 기술을 Trainium4에 통합하기로 결정함에 따라 향후 아마존의 AI 클러스터는 AWS 칩과 엔비디아 GPU를 동일한 인프라에 결합하여 더욱 원활하게 운영될 수 있게 되었습니다. 하이브리드 아키텍처.

AWS는 Trainium4가 시장에 출시되는 구체적인 날짜를 밝히지 않았지만, 그 목적은 명확히 밝혔습니다. 고객이 Nvidia 소프트웨어 생태계, 특히 CUDA의 이점을 계속 활용하면서도, 더 나은 가용성과 가격을 추구하는 Amazon에서 설계한 하드웨어로 일부 워크로드를 이전할 수 있는 플랫폼을 제공하는 것입니다.

이 호환성은 이미 Nvidia GPU와 최적화된 라이브러리를 중심으로 표준화를 이루었지만 다음과 같은 문제에 직면한 유럽 및 스페인의 조직과 특히 관련이 있습니다. 용량 제한 또는 비용 증가 생성적 AI 프로젝트를 확장할 때.

서버와 인공지능 칩

Trainium3를 탑재한 새로운 서버: 더 많은 전력과 더 적은 에너지

Trainium4의 개발이 백그라운드에서 계속 진행되고 있는 가운데, AWS는 이미 하나를 프로덕션에 투입했습니다. 차세대 서버 Trainium3 칩을 기반으로 합니다. 라스베이거스 컨퍼런스에서 직접 출시된 이 기기들은 클라우드 AI 서비스에서 대규모 모델과 대용량 추론을 학습하는 데 적합합니다.

각 서버는 통합됩니다 144 Trainium3 칩 AWS에 따르면, 이 제품은 AWS의 이전 세대 AI 하드웨어보다 4배 이상의 컴퓨팅 성능을 제공합니다. 또한, 약 40% 더 낮은 에너지 소비량으로 이러한 성능을 제공합니다. 이는 전기 요금과 네트워크 제약이 데이터 센터 확장에 영향을 미치기 시작하는 상황에서 중요한 요소입니다.

AWS의 컴퓨팅 및 머신 러닝 서비스 부문 부사장인 데이브 브라운은 단순히 강력한 성능을 자랑하는 것이 아니라, 고객에게 그러한 성능이 존재한다는 것을 보여주는 것이 목표라고 강조했습니다. 가격 대비 성능 측면에서 경쟁력 있는 대안 기존 GPU와 비교했을 때입니다. 회사는 정확한 수치를 밝히지 않았지만, 이전 세대와 비교했을 때 놀라운 발전이라고 강조했습니다.

이러한 효율성 향상은 디지털 인프라의 에너지 소비에 대한 규제 및 사회적 압력이 지속적으로 증가하고 있는 유럽 사업자들에게 특히 흥미롭습니다. 동일한 양의 교육에 필요한 전력을 절감한다는 것은 더욱 지속 가능한 데이터 센터를 의미하며, 잠재적으로는 기업 고객을 위한 더욱 간결한 송장.

Amazon의 로드맵 내에서 Trainium3는 Nvidia에 대한 우위를 확보할 뿐만 아니라 외부 공급업체에 대한 의존도를 줄이고 강화하려고 합니다. AI 칩의 독점 라인 회사가 보다 효과적으로 통제할 수 있는 주기에 따라 발전할 수 있습니다.

AI 공장: 자체 데이터 센터에 전용 인프라 구축

많은 관심을 불러일으킨 또 다른 발표는 소위 출시입니다. AI 공장 AWS에서 제공하는 제품은 대기업과 공공 행정부에서 고급 인공 지능 시스템을 실행하고자 하는 사람들을 위해 설계되었습니다. 자체 데이터 센터Amazon 클라우드와의 통합을 포기하지 않고도.

이 모델은 이론적으로는 간단합니다. 클라이언트가 물리적 공간과 에너지를 제공하고, AWS는 AI 시스템의 설치, 관리 및 유지보수를 담당하며, 이를 플랫폼의 다른 서비스와 연결합니다. 이러한 방식으로 엄격한 규제 요건을 준수해야 하는 유럽 기업이나 데이터 주권에 우려하는 정부도 클라우드를 유지할 수 있습니다. 민감한 정보에 대한 완전한 통제 외부 인프라에 노출시키지 않고도.

AI 팩토리라는 용어는 우연이 아닙니다. 엔비디아는 인공지능에 최적화된 자사 하드웨어 시스템을 지칭할 때 동일한 개념을 사용하며, 이 경우 AWS 솔루션은 GPU 제조업체와 협력하여 정확하게 구축되고 있습니다. 아마존의 AI 팩토리는 블랙웰 칩 Nvidia와 새로운 Trainium3를 기반으로 AWS 클라우드 네트워킹, 스토리지 및 보안을 활용합니다.

하드웨어 외에도 이러한 시설은 다음과 같은 관리 서비스와 통합될 수 있습니다. 아마존 기반암 —기본 AI 모델을 조율하고 배포하기 위해— AWS 세이지메이커자체 모델 개발 및 교육에 중점을 두고 있습니다. 기업 입장에서는 고성능 AI 환경을 의미하지만, 현지 데이터 규정에 더 잘 적응하는 하이브리드 클라우드 체계를 기반으로 구축됩니다.

한편, 마이크로소프트와 같은 다른 주요 공급업체들도 데이터 주권을 위해 설계된 로컬 데이터 센터와 솔루션을 통해 같은 방향으로 나아가고 있습니다. 아마존의 AI 팩토리에 대한 헌신은 인공지능이 클라우드 거대 기업을 보다 하이브리드 모델로 밀어붙이기10년 전의 순수 중앙집중형 모델에서 벗어나고 있습니다.

AI용 서버를 갖춘 데이터 센터

Nova 및 Sonic 모델과 AWS의 AI 제공 강화

하드웨어 혁신과 함께 Amazon은 자사 브랜드로 그룹화된 인공 지능 모델의 새로운 버전으로 소프트웨어 측면을 강화하기 위해 자사 컨퍼런스를 활용했습니다. 신성회사가 제시한 노바 엑스 노츠이전 세대에 비해 더욱 빠른 속도와 반응성을 약속하는 진화된 제품입니다.

Nova의 변형 중 하나는 텍스트뿐만 아니라 다음을 통해서도 사용자와 상호 작용할 수 있습니다. 이미지, 음성 및 비디오이를 통해 고객 서비스, 온라인 교육, 콘텐츠 제작 등의 분야에서 잠재적 활용 사례가 확대됩니다. 이러한 멀티모달 기능은 생성 AI 시장의 다른 선도적인 솔루션들과 동등한 수준을 제공합니다.

또한 AWS는 다음과 같은 모델을 선보였습니다. 음속의음성 상호작용에 중점을 두고 있습니다. Amazon Web Services의 CEO인 Matt Garman에 따르면, 이 시스템은 음성 명령에 "사람과 같은" 품질의 음성 출력으로 응답할 수 있어 더욱 자연스러운 대화 도우미 공공 및 민간 서비스용.

회사는 자사 모델이 여전히 경쟁사 등에 비해 시장 점유율을 확대하는 과제에 직면해 있다는 점을 인정하지만, ChatGPT(오픈AI), 클로드(인류) o 쌍둥이 자리 (구글)AWS의 지난 분기 실적은 견실한 성장을 보여줍니다. 해당 사업부의 매출은 AI 컴퓨팅 및 인프라 수요에 힘입어 약 20% 증가했습니다.

유럽 ​​기업의 경우, 이 확장된 카탈로그는 바로 사용 가능한 모델과... 측면에서 AI 플랫폼을 선택할 때 더 많은 옵션을 제공한다는 것을 의미합니다. 독점 솔루션을 교육할 수 있는 인프라 각 부문과 지역 규정에 맞게 조정되었습니다.

AI 칩·인프라 경쟁 치열

이러한 모든 릴리스는 다음 맥락에서 발생합니다. 시장에서의 치열한 경쟁 인공지능 칩엔비디아는 GPU와 강력한 CUDA 생태계 덕분에 지배적인 지위를 유지하고 있지만, 아마존, 구글, 마이크로소프트와 같은 기업은 물론 기존 프로세서 제조업체조차도 뒤처지지 않기 위해 수백만 달러를 투자하고 있습니다.

AWS의 경우, Trainium3와 향후 Trainium4에 대한 투자는 이중 전략의 일환입니다. 한편으로는 외부 공급업체에 대한 의존도 감소 인프라 비용과 가용성을 더욱 효과적으로 관리합니다. 한편, NVIDIA는 성능이나 Nvidia 도구와의 호환성을 희생하지 않고도 고객에게 지출을 최적화할 수 있는 하드웨어 대안을 제공하고자 합니다.

시장 관점에서 볼 때 자체 칩, Nvidia와의 협력 계약, AI 팩토리와 같은 제품의 조합은 Amazon을 클라우드 서비스뿐만 아니라 하드웨어의 기초 인공지능 애플리케이션의 새로운 흐름을 주도하고 있습니다.

스페인과 유럽의 기업과 공공 행정 기관에게 이러한 시나리오는 퍼블릭 클라우드부터 온프레미스 또는 하이브리드 데이터 센터에 이르기까지 더욱 광범위한 인프라를 제공하며, 가격, 성능 및 데이터 주권에 대한 다양한 구성 중에서 선택할 수 있는 옵션을 제공합니다. 기술적 결정이 중요한 분야에서 비용에 직접적인 영향규정 준수 및 혁신 역량, Trainium3의 출시, NVLink Fusion 및 AI 팩토리와의 향후 통합은 예측 가능하게 대규모 인공 지능 솔루션 도입을 더욱 가속화할 새로운 요소를 추가합니다.

RISC-V RVA23이란 무엇입니까?
관련 기사 :
RISC-V RVA23: 프로세서를 변화시키는 프로파일에 대한 모든 것