본문 바로가기

IT이야기

알리바바, 영상 생성 모델 Wan2.1 오픈소스로 공개

알리바바

 

 

알리바바 클라우드가 새로운 인공지능 영상 생성 모델 Wan2.12025423일 오픈소스로 공개했다.

텍스트와 이미지 입력을 기반으로 고품질의 이미지와 영상을 생성하는데 최적화된 모델이다. Wan2.1 웹사이트에서 720p 해상도의 5초 분량 영상을 무료로 생성 가능하다.

 

허깅페이스의 VBench 리더보드에서 4월에는 종합 1위를 차지했으며 현재는 3위에 등록되어 있다. 영상 생성 AI 모델을 훈련하려면 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 필요하다. 또한 오픈소스로 공개함으로 AI 활용의 장벽을 낮추며 많은 기업들이 필요로 하는 최적화된 영상 콘텐츠를 제작 하는데 이용 될 것이다.

 

알리바바 클라우드는 중국 최대의 전자상거래 기업인 알리바바 그룹이 속해있는 기업이다. AWS, Microsoft Azure, Google Cloud와 함께 글로벌 주요 클라우드 서비스 제공업체 중 하나로 평가받고 있다. 중국 시장에 최적화 되어 있고, 다른 글로벌 클라우드보다 저렴하여 강력한 가격 경쟁력을 가지고 있다.

최근 발표한 Qwen2.5 AI모델은 허깅페이스의 LLM 리더보드에서 최상위귄에서 위치하고 있다. 최근까지 200개 이상의 생성형 AI 모델을 오픈소스로 공개해 왔으며 현재까지 허깅페이스를 기반으로 약 10만 개 이상의 파생 모델이 만들어 졌다. 그만큼 뛰어난 모델이며 많은 개발자와 엔지니어로 부터 기술력을 인정받고 있다고 보여진다.

 

 

참고자료

https://modelscope.cn/models/Wan-AI/Wan2.1-VACE-14B/summary

https://huggingface.co/blog/LLMhacker/wanai-wan21

https://github.com/Wan-Video/Wan2.1

https://huggingface.co/spaces/Vchitect/VBench_Leaderboard

https://modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P

https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P

Wan: Open and Advanced Large-Scale Video Generative Models

https://arxiv.org/pdf/2503.20314

https://huggingface.co/spaces/Vchitect/VBench_Leaderboard

https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard