본문 바로가기

IT이야기

텐센트, 차세대 AI 모델 Hunyuan-A13B 공개

ai에 의해 생성된 이미지

 

 

 

중국을 대표하는 대형 IT 기업 텐센트가 AI 모델인 헌위안-A13B를 오픈소스로 공개했다. 
MoE(Mixture-of-Experts) 기반의 하이브리드 추론 모델로 800억 매개변수 중 130억 매개변수가 활성화되어 작동한다. 자원의 효율성과 강력한 성능이라는 두 마리 토끼를 잡았다. 기존 LLM의 높은 자원 소모 문제를 해결하며 효율적인 AI 개발 환경을 제공할 것으로 기대된다. 
256K에 달하는 컨텍스트 이해 능력은 매우 긴 텍스트 입력과 복잡한 정보 처리가 필요한 작업에서 뛰어난 성능을 발휘 할 것이다. 이는 긴 보고서 요약과 문서 분석 등 전문 분야에서 큰 강점이 될 수 있다. 작업 요구 사항에 따라 사고의 깊이를 조절하는 하이브리드 추론 모드를 사용하여 복잡한 문제 해결의 효율성을 극대화한다.

모델 가중치 뿐만 아니라 소스코드도 오픈소스로 공개하였다.  단, 라이선스에 의해서 유럽 연합, 영국, 한국에서는 소프트웨어의 사용, 복제, 수정, 배포, 표시 등이 모두 금지되어 있다.

이번 인공지능 모델 공개를 통해 AI기술의 대중화와 효율성을 촉진하며 향후 다양한 산업 분야에서 AI의 영향력을 넓히는 전략으로 보여진다.

https://github.com/Tencent-Hunyuan/Hunyuan-A13B/tree/main
https://huggingface.co/tencent/Hunyuan-A13B-Instruct
https://github.com/Tencent-Hunyuan/Hunyuan-A13B/blob/main/report/Hunyuan_A13B_Technical_Report.pdf