틱톡 모기업 바이트댄스(字节跳动) 산하의 훠산엔진(火山引擎)이 B2B 기업을 대상으로 인공지능(AI) 추론 중심의 더우바오(豆包)1.5 딥 리즈닝 모델을 출시했다.
17일 차이신(财新)에 따르면, 더우바오1.5 딥 리즈닝 모델은 바이트댄스가 처음 선보인 추론형 모델로 문제 해결 시 생각과 동시에 검색하고 목표에 따라 검색 경로를 계획할 수 있으며 이미지 속 각종 정보를 종합적으로 이해할 수 있는 시각적 추론 능력을 보유하고 있다.
추론형 모델은 AI 모델이 사전 학습을 마친 후 강화 학습, 연쇄적 사고 기술을 단계적으로 활용해 복잡한 추론 임무 처리 능력을 탑재한 모델로 단순한 언어 답변을 넘어 논리적 사고와 판단력이 필요한 고차원 작업을 수행한다.
앞서 오픈AI가 지난해 9월 세계 최초 추론형 모델인 ‘o1’ 모델을 출시한 데 이어 중국 스타트업 딥시크가 올해 1월 20일 ‘R1’ 모델을 출시해 업계 큰 반향을 일으켰다. 그리고 중국 빅테크 기업이 줄줄이 AI 기반 모델 경쟁에 뛰어들면서 텐센트, 알리바바가 각각 ‘T1’, ‘QwQ-32B’ 모델을 출시했고 바이두도 지난달 17일 첫 추론형 모델 ‘X1’을 공개했다.
탄다이(谭待) 훠산엔진 대표는 “더우바오1.5는 정확한 정오 판단과 개별 상황에 따른 다양한 작업 수행 능력을 갖춰 알고리즘의 신뢰성을 크게 개선했다”면서 “창의적 글쓰기, 인문 지식 응답 등 일반적인 작업 수행 능력을 높이기 위해 더우바오는 데이터 처리 전략을 최적화하고 검증 가능한 데이터와 창의적인 데이터를 종합 처리할 수 있도록 설계했다”고 소개했다.
더우바오 모델의 총 파라미터 수는 2000억 개, 활성화 파라미터는 200억 개로 적은 수의 파라미터로도 최상급 모델 수준의 효과를 낼 수 있다. 이 밖에 더우마오 모델의 API 서비스는 뛰어는 동시 처리 능력으로 지연 시간이 20밀리초에 불과하다.
탄다이 대표는 “더우바오 1.5 딥 리즈닝 모델은 전문 분야의 추론 작업에 뛰어나다”면서 “테세트 결과, 수학 추론 분야인 AIME 2024 테스트에서 오픈AI의 ‘o3-mini-high’ 모델과 동점을 기록했고 프로그래밍 대회인 Codeforces pass@8에서 오픈AI의 ‘o1’에 가까운 점수를 기록했으며 과학적 추론 벤치마크 GPQA에서도 ‘o3-mini’ 모델에 근점한 점수를 기록했다”고 강조했다.
한편, IDC가 이달 10일 발표한 ‘중국 공공 클라우드 대형모델 서비스 시장 구도 분석’ 보고서에 따르면, 중국 대형모델 호출량을 기준, 훠산엔진이 시장 점유율 46.4%로 압도적인 1위를 차지했고 바이두 스마트 클라우드, 알리 클라우드가 나란히 2~3위에 올랐다. 이 밖에 텐센트 클라우드, 차이나 모바일, 톈이(天翼) 클라우드 등 공공 클라우드 업체들은 전체 시장의 15%를 점유하고 있는 것으로 나타났다.
유재희 기자
