NVIDIA·Google Cloud, 'Vera Rubin' 기반 A5X 인스턴스 공개 — 추론 비용 1/10로
Google Cloud Next 2026에서 NVIDIA·Google Cloud 가 차세대 'Vera Rubin' 아키텍처 기반의 A5X 인스턴스를 공개했다. 이전 세대 대비 토큰당 추론 비용을 10분의 1로, 메가와트당 처리량을 10배로 줄였다고 밝혔다. Gemini Enterprise Agent Platform 에 NVIDIA Nemotron 과 NeMo 프레임워크도 통합된다.