Google DeepMind가 Gemma 4 모델의 양자화 인식 학습(QAT) 최적화 버전을 공개했다. 훈련 단계에서 양자화를 시뮬레이션해 기존 사후 양자화(PTQ)보다 품질 손실을 줄이면서도 메모리 사용량을 크게 낮췄다. 텍스트 전용 Gemma 4 E2B 모델은 커스텀 모바일 양자화 방식으로 1GB 미만에서 구동 가능하다.
구글, 2026년 5월 AI 총정리 — Gemini Omni·Fitbit Air·Googlebook 핵심 발표
구글이 2026년 5월 한 달간의 AI 발표 내용을 공식 정리했다. Google I/O 2026을 통해 선보인 Gemini Omni·Gemini 3.5 모델부터 Fitbit Air 웨어러블, Googlebook 노트북, Android Halo 에이전트 인터페이스까지 소비자·개발자 전 분야를 아우르는 발표가 담겼다. 구글은 이번 정리를 통해 모든 제품군에 에이전트 AI를 동시에 삽입하는 전략을 공식화했다.
Anthropic 레드팀이 2025년 3월부터 2026년 3월까지 악의적 사이버 활동으로 차단된 계정 832개를 분석한 보고서를 공개했다. 공격자들이 AI를 초기 침입보다 침투 후 단계에서 더 많이 활용하고 있으며, 공격 자동화 수준도 높아지고 있다는 점이 핵심 발견이다. 기존 MITRE ATT&CK 프레임워크가 AI 오케스트레이션 공격 패턴을 분류하기 어렵다는 한계도 지적됐다.
Anthropic이 Claude 파트너 네트워크에 '서비스 트랙'과 '파트너 허브'를 새롭게 선보였다. 서비스 트랙은 파트너사의 역량을 3단계로 인증하며, 파트너 허브는 기업 고객이 적합한 파트너를 찾을 수 있는 공개 포털이다. Accenture, Deloitte, KPMG 등 글로벌 컨설팅사들이 이미 수천 명 규모의 Claude 전문 인력을 육성 중이다.