샤오미도 DeepSeek 따라 대형모델 API 영구 인하…최대 99%↓

샤오미가 DeepSeek에 이어 대형 AI 모델 API 가격 영구 인하에 나섰다. 최대 인하 폭은 99%에 달한다.

27일 계면신문(界面新闻)에 따르면 샤오미는 이날 MiMo-V2.5 시리즈 API 가격을 영구 인하한다고 발표했다. DeepSeek 이후 또 다른 대형모델 기업이 영구 가격 인하를 선언한 것이다.

이번 가격 조정은 발표 당일부터 적용된다. 샤오미는 기존처럼 컨텍스트 창(AI가 한 번에 기억하고 처리할 수 있는 텍스트 범위) 길이에 따라 가격을 구분하던 방식을 없앴고, Token Plan 요금 체계도 최적화했다. 같은 비용으로 사용할 수 있는 토큰량은 기존 대비 5~8배 늘어난다.

구체적인 가격 조정 내용을 보면 MiMo-V2.5-Pro의 입력 캐시 적중(cache hit) 가격은 100만 토큰당 0.025위안으로 내려갔다. 기존 256k 이하 규격 가격인 1.4위안 대비 98%, 256k~1M 규격 가격인 2.8위안 대비 99% 인하된 수준이다.

입력 캐시 미적중 가격은 100만 토큰당 3위안으로 조정됐다. 기존 7위안 대비 57%, 장문 컨텍스트 기준 기존 14위안 대비 79% 낮아졌다. 출력 가격은 100만 토큰당 6위안으로, 기존 21위안과 42위안 대비 각각 71%, 86% 인하됐다.

이번 가격 조정은 주로 MiMo-V2.5 핵심 시리즈에 집중됐다. MiMo-V2.5-TTS 시리즈는 기존처럼 한시적 무료 정책을 유지한다.

반면 MiMo-V2-Pro와 MiMo-V2-Omni 두 고급 모델 API 가격은 변동이 없다. 해당 모델들의 Token Plan 패키지도 조정 대상에서 제외됐으며 곧 서비스 종료 예정이다. 샤오미는 개발자들이 가성비 중심인 V2.5 시리즈로 이동하도록 유도하고 있다.

MiMo-V2.5 시리즈 개발은 샤오미 AI 핵심 인물인 뤄푸리(罗福莉)가 주도했다. DeepSeek 출신의 젊은 AI 인재인 뤄푸리는 지난해 11월 샤오미에 합류해 MiMo 대형모델 책임자를 맡았다. 이후 평균 연령 25세, 칭화대·베이징대 출신 비중 60% 이상인 연구개발팀을 꾸렸다.

뤄푸리의 총괄 아래 샤오미 MiMo 대형모델은 여러 차례 빠르게 업그레이드됐다. 올해 3월 MiMo-V2-Pro, MiMo-V2-Omni, MiMo-V2-TTS 등 3개 기반 모델이 정식 공개됐고, 이후 V2.5 버전으로 추가 업그레이드됐다. 이를 통해 고성능 추론과 경량 범용 인터랙션, 음성합성 등 전방위 기능을 보완하며 상용 보급형 시장용 주력 제품으로 자리 잡았다.

레이쥔 샤오미 창업자는 전날 “Xiaomi MiMo-V2.5-Pro가 Artificial Analysis 종합지능지수와 Agent 지수 평가에서 글로벌 오픈소스 모델 공동 1위에 올랐다”며 “향후 3년간 AI 분야에 600억 위안을 투자할 계획”이라고 밝혔다.

샤오미와 DeepSeek 외에도 중국 대형모델 시장은 뚜렷한 양극화 흐름을 보이고 있다.

알리윈 통이첸원과 바이트댄스 더우바오 같은 범용 모델들은 API 가격을 잇따라 낮추고 있지만, 즈푸 GLM과 텐센트 훈위안처럼 기업 맞춤형 서비스를 주력으로 하는 모델들은 가격을 유지하거나 일부 인상하고 있다.

업계에서는 “범용 모델은 가격 인하로 물량 확대, 고급 모델은 프리미엄 유지”라는 새로운 구조가 형성되고 있다고 보고 있다. 단순 가격 경쟁에서 기술 효율 경쟁으로 중심이 이동하고 있으며, 가격 인하는 단순 마케팅이 아니라 알고리즘 최적화와 추론 기술 향상, 연산 비용 하락이 함께 작용한 결과라는 것이다.

AI 플랫폼 AI.cc가 발표한 ‘2026 AI API 인프라 보고서’에 따르면 최근 1년간 기업용 대형모델 토큰 호출 비용은 전년 대비 67% 급락했다.

현재 오픈소스 모델은 기업용 토큰 호출량의 38%를 차지하고 있으며, 업계에서는 가격 대비 성능이 핵심 경쟁 요소로 자리 잡고 있다는 분석이 나오고 있다.

이민정 기자