Google DeepMind, 분산 AI 학습 혁신 기법 'Decoupled DiLoCo' 공개
Google DeepMind가 여러 지역 데이터센터에 걸쳐 대규모 AI 모델을 훈련하는 새 기법 'Decoupled DiLoCo'를 공개했다. 기존 방식 대비 네트워크 대역폭을 199분의 1 수준으로 줄이면서도 동등한 모델 성능을 유지하며, 하드웨어 장애 시에도 학습이 중단되지 않는 구조가 특징이다. 실제로 미국 4개 지역에서 120억 파라미터 모델을 학습하는 데 성공해 연구 단계를 넘어선 실전 검증 사례를 제시했다.
NVIDIA·Google Cloud, 'Vera Rubin' 기반 A5X 인스턴스 공개 — 추론 비용 1/10로
Google Cloud Next 2026에서 NVIDIA·Google Cloud 가 차세대 'Vera Rubin' 아키텍처 기반의 A5X 인스턴스를 공개했다. 이전 세대 대비 토큰당 추론 비용을 10분의 1로, 메가와트당 처리량을 10배로 줄였다고 밝혔다. Gemini Enterprise Agent Platform 에 NVIDIA Nemotron 과 NeMo 프레임워크도 통합된다.
Google, 'Gemini 3.1 Flash TTS' 공개 — 70개 언어·다중 화자·감정 태그 지원
Google이 Gemini 3.1 Flash의 음성 합성(TTS) 전용 모델을 선보였다. Artificial Analysis TTS 리더보드 Elo 1,211로 업계 상위권에 올랐고, 70개 이상 언어와 다중 화자 대화, 자연어 톤·속도 제어를 지원한다. Google AI Studio·Vertex AI·Google Vids에서 이용 가능하다.