경제일반

딥시크, R1 업데이트…“오픈AI 최고 모델 성능 근접”

이민희 기자 2025년 05월 30일 1 min read

중국 인공지능(AI) 스타트업 딥시크가 추론형 AI 모델 R1을 출시한 지 5개월 만에 대규모 업데이트 버전을 선보였다.

29일 차이신(财新)에 따르면, 딥시크는 오픈소스 커뮤니티 허깅페이스에 업데이트 버전인 ‘딥시크-R1-0528’을 공개했다.

해당 모델은 지난해 12월 발표된 딥시크 V3 모델을 기반으로 후훈련(Fine-tuning) 단계에서 연산 능력을 투입해 모델의 사고 깊이, 추리 능력을 대폭 개선했다. 특히 수학, 코딩, 일반 논리 등 평가에서 우수한 성능을 나타냈으며 전반적으로 오픈AI의 o3, 구글의 Gemini 2.5 프로 등 최상위 모델에 근접한 성능을 갖췄다고 딥시크는 소개했다.

구버전인 R1과 비교하면, 복잡한 추론 과제에서 특히 두드러진 성능 향상을 나타냈다. 미국 수학 경시대회 예선인 AIME 2025 테스트를 예로 들면, 구버전의 정답률이 70%였다면 업데이트 버전은 87.5%까지 상승했다. 문제당 사용한 평균 토큰 수는 기존 12K에서 23K로 높아졌다. 문제 해결 과정에서 더 정교하고 깊이 있는 사고를 거쳤다는 의미다.

문장 교정, 요약, 독해 등에서 데이터에 없는 정보를 ‘있는 것처럼’ 말하는 환각률도 45~50% 감소했다. 또 논설문, 소설, 산문 등 문체 성능을 최적화해 완전한 구조와 내용을 갖춘 더 긴 분량의 장편 작품을 생성하고 사람들이 선호하는 글쓰기 스타일에 가까운 결과물을 만들어낼 수 있다고 딥시크는 부연했다.

한편, 이날 새로운 R1 모델을 기반으로 훈련된 알리바바 간판 모델 큐원3-8B(Qwen3-8B)도 함께 공개됐다. 이 모델 성능은 2350억 개 매개변수의 큐원3-235B(Qwen3-235B)와 어깨를 견줄 수 있는 수준이라고 딥시크는 강조했다.

유재희 기자