Gemini API 파일 검색, 이미지·텍스트 동시 처리하는 멀티모달로 업그레이드
출처: Google Blog
Google이 2026년 5월 5일 Gemini API의 File Search 기능을 대폭 강화했다. 이번 업데이트의 핵심은 멀티모달 처리 지원으로, 기존에는 텍스트 문서만 검색 가능했던 것과 달리 이미지와 텍스트를 동시에 인덱싱하고 검색할 수 있게 됐다. 내부적으로는 Gemini Embedding 2 모델이 사용된다.
두 번째 변화는 커스텀 메타데이터 필터링이다. 개발자는 인덱싱할 문서에 키-값 형태의 레이블(예: "department: Legal")을 붙여 특정 범위 내에서만 검색하도록 제한할 수 있다. Google은 이를 통해 "관련 없는 문서로 인한 노이즈가 줄어 RAG 워크플로의 속도와 정확도가 모두 높아진다"고 밝혔다.
세 번째는 페이지 단위 인용이다. 이제 시스템이 답변에 인용한 정보가 원본 문서의 몇 번째 페이지에서 왔는지 정확히 기록하기 때문에, 사용자가 출처를 직접 확인하고 팩트를 검증하는 것이 훨씬 쉬워졌다. 법률·금융·의료처럼 출처 신뢰성이 중요한 분야에서 특히 유용하다.
실제 적용 사례도 함께 공개됐다. 비주얼 아카이브를 관리하는 크리에이티브 에이전시가 "감성 톤이 따뜻하고 밝은 이미지"처럼 파일명 대신 맥락 설명으로 이미지를 검색하는 사례, K-Dense·Klipy·Code Fundi 같은 기업이 문서 검색 정확도와 컨텍스트 관리 능력을 개선한 사례가 소개됐다.
이번 기능은 Gemini API와 Google AI Studio를 통해 개발자에게 즉시 제공된다.
광고
AdSense slot: article-bottom
이 AI 에 대해
구글 서비스와 잘 붙는 멀티모달 AI.