중국 빅테크 텐센트가 자체 개발한 인공지능(AI) 추론모델 ‘훈위안(混元) T1’ 정식 버전을 출시했다.
22일 매일경제신문(每日经济新闻)은 텐센트가 21일 추론모델 훈위안 T1 정식 버전을 출시하고 텐센트 클라우드 공식 웹사이트에 해당 모델을 공개했다고 전했다.
텐센트는 이에 앞서 자체 AI 챗봇 위안바오(元宝)에 T1 프리뷰 버전을 출시한 바 있다. 이번에 출시된 정식 버전은 이달 초 발표한 ‘훈위안 터보 S(混元Turbo S)’를 기반으로 더욱 빨라진 응답 속도, 빠른 텍스트 출력, 더욱 강화된 장문 처리 능력으로 앞서 공개된 프리뷰 버전보다 전반적인 성능이 크게 향상됐다고 텐센트는 설명했다.
실제 훈위안 T1은 대규모 강화 학습을 통한 수리, 논리 추론, 과학, 코딩 등 이과 난제에 특화된 최적화 기술로 추론 능력이 더욱 강화됐다. 성능 지표로 보면, 훈위안 T1은 다중과제 언어이해평가(MMLU-PRO) 벤치마크에서 87.2점으로 딥시크R1(84점)를 제치고 오픈AI의 o1(89.3점) 다음으로 높은 수준을 기록했다.
훈위안 T1은 터보 S의 혁신적인 아키텍처에 따라 하이브리드 맘바 트랜스포머(Hybrid-Mamba-Transformer) 모델을 채택했다. 이는 업계 최초로 혼합 맘바 아키텍처를 초대형 추론모델에 도입한 사례로 꼽힌다.
이 아키텍처는 기존 트랜스포머 구조의 연산 복잡도를 효과적으로 낮추고 대형모델 추론 성능 최적화 기술인 KV-Cache의 메모리 점유율을 감소시켜 훈련, 추론 비용을 크게 절감한다. 이로써 훈위안 T1의 응답 속도를 더욱 빠르게 하고 텍스트 출력 속도를 최대 80tokens/s까지 단축한다.
훈위안 T1의 이용 요금은 입력 토큰 100만 개당 1위안(200원), 출력 토큰 100만 개당 4위안으로 책정됐다. 이는 바이두 X1의 절반 수준으로 딥시크R1보다 약 75% 저렴하다.
현재 훈위안 T1은 텐센트 클라우드에서 이용할 수 있으며 곧 위안바오 앱(app)에도 테스트 버전이 출시될 예정이다. 해당 모델은 오는 3월 말 오픈소스로 공개될 것으로 전해졌다.
유재희 기자
