AI Post

AI News

LaunchGemini22시간 전

Google DeepMind, 분산 AI 학습 혁신 기법 'Decoupled DiLoCo' 공개

Google DeepMind가 여러 지역 데이터센터에 걸쳐 대규모 AI 모델을 훈련하는 새 기법 'Decoupled DiLoCo'를 공개했다. 기존 방식 대비 네트워크 대역폭을 199분의 1 수준으로 줄이면서도 동등한 모델 성능을 유지하며, 하드웨어 장애 시에도 학습이 중단되지 않는 구조가 특징이다. 실제로 미국 4개 지역에서 120억 파라미터 모델을 학습하는 데 성공해 연구 단계를 넘어선 실전 검증 사례를 제시했다.

출처: Google DeepMind Blog

NVIDIA·Google Cloud, 'Vera Rubin' 기반 A5X 인스턴스 공개 — 추론 비용 1/10로

Google Cloud Next 2026에서 NVIDIA·Google Cloud 가 차세대 'Vera Rubin' 아키텍처 기반의 A5X 인스턴스를 공개했다. 이전 세대 대비 토큰당 추론 비용을 10분의 1로, 메가와트당 처리량을 10배로 줄였다고 밝혔다. Gemini Enterprise Agent Platform 에 NVIDIA Nemotron 과 NeMo 프레임워크도 통합된다.

출처: NVIDIA Blog
LaunchGemma2일 전

Google, 오픈 모델 'Gemma 4' 공개 — 31B가 Arena 3위, Apache 2.0 상업용 허용

Google이 2026년 4월 Gemma 4 모델 패밀리를 공개했다. 추론·에이전트 작업을 겨냥해 E2B·E4B·26B MoE·31B Dense 네 가지 크기로 제공되며, 31B 모델은 Arena AI 벤치마크에서 공개 가중치 모델 중 3위를 기록했다. Apache 2.0 라이선스로 상업 이용이 허용된다.

출처: Google AI Blog
광고
AdSense slot: home-mid
Industry3일 전

Adobe·NVIDIA·WPP 3사 손잡고 '마케팅 AI 에이전트' 출시 — 맞춤 콘텐츠 제작 자동화

Adobe Summit 2026에서 Adobe·NVIDIA·광고그룹 WPP 3사가 공동 개발한 마케팅 전용 AI 에이전트 'CX Enterprise Coworker'를 공개했다. Adobe Firefly Foundry 와 NVIDIA OpenShell 보안 런타임 위에서 동작하며, 글로벌 소매업체가 수백만 개의 고객·상품 조합별 광고 자산을 수분 내에 갱신할 수 있도록 한다.

출처: NVIDIA Blog
UpdateGemini3일 전

Google, 'Gemini 3.1 Flash TTS' 공개 — 70개 언어·다중 화자·감정 태그 지원

Google이 Gemini 3.1 Flash의 음성 합성(TTS) 전용 모델을 선보였다. Artificial Analysis TTS 리더보드 Elo 1,211로 업계 상위권에 올랐고, 70개 이상 언어와 다중 화자 대화, 자연어 톤·속도 제어를 지원한다. Google AI Studio·Vertex AI·Google Vids에서 이용 가능하다.

출처: Google AI Blog