AI Post
Launch2026.05.20

Cohere, 218B 오픈소스 MoE 모델 Command A+ 공개

출처: Cohere Blog

코히어(Cohere)가 새로운 기업용 오픈소스 AI 모델 Command A+를 2026년 5월 20일 공개했다. 모델 ID는 command-a-plus-05-2026이며, 아파치 2.0 라이선스로 누구나 상업적으로 활용할 수 있다.

Command A+는 혼합전문가(Mixture-of-Experts, MoE) 희소 구조를 채택했다. 총 파라미터는 218B이지만 추론 시 실제 활성화되는 파라미터는 25B에 불과해 계산 비용을 대폭 줄였다. 최소 NVIDIA H100 GPU 2개(W4A4 4비트 양자화 기준) 또는 B200 GPU 1개만으로 실행이 가능하며, Hugging Face에서 BF16·FP8·W4A4 세 가지 양자화 형식으로 내려받을 수 있다.

성능 면에서는 이전 Command A Reasoning 대비 에이전트 작업 정확도가 크게 개선됐다. τ²-벤치(Telecom) 기준 정확도가 37%에서 85%로 뛰었고, 기업 Q&A 에이전트 작업에서 20%, 스프레드시트 분석에서 32% 향상됐다. 출력 속도도 초당 토큰(TOPS) 기준 최대 63% 빨라졌으며 W4A4 양자화 적용 시 추가로 47% 속도 향상이 가능하다.

다국어 지원 면에서도 의미 있는 발전이 있었다. 이전 23개 언어에서 48개 언어로 확대됐으며 새로운 토크나이저 덕분에 아랍어 20%, 일본어 18%, 한국어 16% 등 비라틴 계열 언어의 토큰 효율이 높아졌다. 텍스트·이미지·도구 사용을 지원하는 멀티모달 입력도 갖췄으며 128K 컨텍스트 길이에 최대 64K 토큰을 생성할 수 있다.

코히어는 이번 릴리스를 "주권 AI(Sovereign AI)" 배포 전략의 핵심으로 제시하고 있다. 별도 외부 의존 없이 자체 인프라에서 기업급 AI를 운영할 수 있어, 데이터 규제가 엄격한 금융·의료·공공 분야에 적합하다는 것이다.

한국 독자 관점에서 이번 발표가 주목되는 이유는 언어 토큰 효율 개선이다. 한국어 토크나이저가 16% 개선됐다는 것은 같은 텍스트를 처리할 때 API 비용이 줄어든다는 의미다. 또한 오픈소스 Apache 2.0 라이선스로 공개된 덕분에 국내 기업도 자체 서버에 올려 비용 없이 상업적으로 활용할 수 있다.

광고
AdSense slot: article-bottom

관련 기사