6월 27일, Tencent는 Hunyuan 모델 제품군의 새로운 구성원인 Hunyuan-A13B 모델을 공개하고 완전한 오픈 소스가 될 것이라고 발표했습니다. 공식 소식통에 따르면 Hunyuan-A13B 모델은 중저가 GPU 카드 하나만으로 극한 조건에서 배포할 수 있습니다.


수학적 추론 실험에서 모델은 십진수 비교를 정확하게 완료하고 단계별 분석 기능을 시연했습니다. 깊이 생각하는 데 3초가 걸렸다.

Hunyuan-A13B 모델도 기술 혁신을 이루었습니다. 사전 훈련에서 모델은 20조 개의 고품질 네트워크 단어 말뭉치를 사용하고 MoE 아키텍처의 스케일링 법칙 이론 시스템을 개선하여 MoE 아키텍처 설계에 대한 정량화 가능한 엔지니어링 지침을 제공했습니다.

Hunyuan은 또한 업계 관련 평가 표준의 격차를 메우기 위해 두 가지 새로운 데이터 세트를 오픈 소스로 제공했습니다. 그중 ArtifactsBench는 주로 코드 평가에 사용되며 1825개 작업을 포함하는 새로운 벤치마크를 구축합니다. C3-Bench는 모델 기능의 결함을 발견하기 위해 에이전트 장면 모델 평가를 위한 1024개의 테스트 데이터를 설계합니다.


현재 모델 API는 Tencent Cloud 공식 웹사이트에서 온라인 상태입니다.