AI Post
UpdateGemini4일 전

Gemini 3.5 Live Translate 공개 — 70개 언어 실시간 음성 번역

출처: Google Blog

Google이 2026년 6월 9일 Gemini 3.5 Live Translate를 공개했다. 이 기능은 70개 이상의 언어를 자동으로 감지하고, 화자의 목소리 특성인 억양·말 속도·음정을 최대한 유지한 채 거의 실시간으로 번역 음성을 생성한다. 단순히 텍스트를 번역한 뒤 TTS로 읽어주는 기존 방식과 달리, 음성을 지속적으로 스트리밍하면서 번역을 수행한다.

기술적으로 가장 큰 차이는 '턴방식(turn-based)'을 벗어난 점이다. 기존 통역 시스템은 화자가 말을 멈추면 그때 번역을 시작하는 구조라 지연이 불가피했다. Live Translate는 화자보다 몇 초 뒤를 따라가며 연속적으로 번역 음성을 출력하므로 대화 흐름이 훨씬 자연스럽다. 소음이 많은 환경에서도 안정적으로 동작한다고 Google은 밝혔다.

출시 범위는 단계적으로 이루어진다. 개발자는 Google AI Studio와 Gemini Live API를 통해 공개 프리뷰로 즉시 활용할 수 있다. 기업 고객은 이달 중 Google Meet 비공개 프리뷰에 참여할 수 있으며, 일반 사용자는 Android와 iOS용 Google Translate 앱에서 바로 사용 가능하다.

실제 적용 사례로는 동남아시아 차량 공유 서비스 Grab이 있다. Grab은 월 1,000만 건 이상의 음성 통화에서 운전자와 승객 간 다국어 소통 테스트를 이미 진행 중이다. 영어를 공통어로 쓰지 않는 지역에서도 서비스를 확장할 수 있다는 실질적 가능성을 보여주는 사례다.

한국 독자 관점에서는 언어 장벽이 높은 한국어 환경에서 특히 주목할 기술이다. 글로벌 비즈니스 회의, 관광 안내, 콜센터 등 다국어 실시간 소통이 필요한 분야에서 활용 가능성이 높다. Google Meet 통합이 완성되면 한국 기업들의 해외 화상 회의 환경도 크게 달라질 수 있다.

광고
AdSense slot: article-bottom
이 AI 에 대해

구글 서비스와 잘 붙는 멀티모달 AI.

이 AI 의 역사

관련 기사

UpdateClaude1일 전

TCS·Anthropic 파트너십 체결 — 50,000명 규모로 Claude 도입

출처: Anthropic News
UpdateClaude2일 전

DXC Technology, 은행·항공사 등 핵심 인프라에 Claude 통합

출처: Anthropic News
UpdateGemini4일 전

Google, Gemini 모델을 Apple 개발자에게 개방 — iOS 27부터 네이티브 연동 지원

출처: Google AI Blog