앤트로픽이 Claude Opus 4, Sonnet 4 를 공개했다. 특히 Opus 4 는 7시간 이상 이어지는 자율 코딩 작업에서 실질적 성능을 유지한 첫 모델로 평가됐고, SWE-bench 같은 실무 코드 벤치마크를 크게 끌어올렸다. 'AI 가 하루 종일 일하는 시대' 라는 마케팅 문구가 현실적으로 읽히기 시작한 시점.
Anthropic Claude 4 — 에이전트 코딩의 새 기준
앤트로픽이 Claude 4 시리즈를 공개하고 장시간 자율 코딩 작업에서 업계 최고 벤치마크를 기록했다.
출처 / 더 읽을거리
https://www.anthropic.com/news/claude-4