
2025년 7월 28일 중국의 인공지능 기업 Zhipu AI(현 Z.ai)에서 최신 플래그십 대규모 언어 모델을 공개했다. GLM-4.5은 지능형 에이전트 애플리케이션에 최적화되어 추론, 코딩, 에이전트 기능을 통합 한 것이 특징이다.
가장 눈에 띄는 기능은 하이브리드 추론을 채택했다는 점이다. 이는 복잡한 추론과 도구 사용에 적합한 사고 모드(Thinking Mode)와 즉각적인 응답에 최적화된 비사고 모드를 유연하게 전환하여 사용하는 방식이다. 모델의 상항에 따라서 효율성과 정확성을 극대화할 수 있다.
GLM-4.5는 두가지 주요 버전으로 공개되었다. 기본 GLM-4.5는 355B의 파리미터와 32B개의 활성 파라미터로 구성되었으며, GLM-4.5-Air는 더 효율적인 설계로 되어 있는데 106B의 파라미터와 12B의 활성 파라미터로 이루어졌다. 이 모델들 MoE(Mixture-of-Experts) 아키텍처를 기반으로 하여, 방대한 파라미터 중 일부만 활성화해서 컴퓨팅 효율성을 크게 높였다.
최대 128k 토큰의 컨텍스트 길이를 지원하여 매우 긴 문서나 복잡한 도구 사용 기록도 처리할 수 있다. 이는 복잡한 에이전트 작업 수행에 필수적인 요소이다. 추론과 코딩, 에이전트 작업 등 다양한 벤치마크에서 글로벌 취상위 모델들과 어깨를 나란히 했다. 특히 코딩 및 소프트웨어 버그 해결 능력이 뛰어나다는 평가를 받고 있다.
MIT 라이선스로 오픈소스로 공개되어 상업적 사용 및 2차 개발이 자유롭다. 이는 AI 생태계의 확장에 기여하는 동시에 오픈소스 LLM 경쟁에서 주도적인 역할을 하고 있음을 보여주는 사례이다.
효율적인 운영을 큰 장점으로 하며 저렴한 비용으로 사용할 수 있다.
강화학습 인프라 slime도 오픈소스로 제공하고 있다.
https://huggingface.co/zai-org/GLM-4.5
강화학습 인프라 slime
https://github.com/THUDM/slime
'IT이야기' 카테고리의 다른 글
| NVIDIA, Llama 3.3 Nemotron Super 49B v1.5 추론 모델 공개 (3) | 2025.07.31 |
|---|---|
| 텐센트, 3D 월드를 생성 모델 HunyuanWorld 1.0 공개 (0) | 2025.07.30 |
| 알리바바, Qwen3 Coder 와 Qwen Code 공개 (0) | 2025.07.24 |
| 프론티어 모델을 알려주세요! (0) | 2025.07.22 |
| 허깅페이스, 작지만 강한 모델 SmolLM3 등장 (0) | 2025.07.21 |