본문 바로가기

IT이야기

텐센트, 3D 월드를 생성 모델 HunyuanWorld 1.0 공개

ai에 의해 생성된 이미지

 

 

2025년 7월에 텐센트에서 HunyuanWorld 1.0 모델을 공개했다. 텍스트나 단일 이미지 입력으로 360도 몰입형 인터랙티브 3D 월드를 생성하는 오픈소스 AI 모델이다. 기존 3D 콘텐츠 제작에 필요한 시간과 비용을 크게 줄이며 다양한 산업에서 활용 가능성을 높이고 있다. 

 

사용자가 입력한 텍스트 설명이나 한장의 이미지에서 360도 파노라마 이미지를 생성한다. 생성된 파노라마 이미지는 자연스럽고 왜곡 없이 주변을 둘러볼 수 있도록 설계되었다. Diffusion Transformer(Panorama-DiT) 모델을 통해 구현되었다. 

생성된 파노라마 이미지는 전경, 배경 등의 의미적 레이어로 자동 분리된다. 이를 통해 각 부분을 독립적으로 조정하고 수정 할 수 있다. 

레이어별로 깊이를 추정하여 실제 3D 공간을 구성한다. 특히 전경 오브젝트는 개별적인 3D 모델로 변환되어 이동, 회전, 크기 조정이 가능하다. 이를 통해 입체 공간을 빠르게 만들 수 있다. 

기본적으로 한지점에서 360뷰를 제공하는 파노라마 방식이지만 Voyager 비디오 생성 모듈을 이용하면 사용자가 탐험하면서 월드를 자연스럽게 확장하고 움직이는 카메라 시점에서 더욱 현실적으로 탐색할 수 있다. 

 

Unity, Unreal Engine, Blender 등 주요 3D 소프트웨어에서 불러와 게임 개발, VR, AR 컨텐츠 제작, 교육 및 시뮬레이션 분야에 활용할 수 있다. 특히 빠르게 3D 프로토타입을 만들어 테스트하거나 컨텐츠 제작 비용과 시간을 획기적으로 줄일 수 있다는 점이다.

 

텍스트나 이미지 프롬프트만으로 복잡하고 몰입적인 3D 환경을 생성하는데 있어 중요한 진전을 보여주는 기술로 평가받고 있다. 이는 3D 컨텐츠를 제작하는 크리에이터에게 새로운 가능성을 열어 줄 것으로 기대된다.

 

https://huggingface.co/tencent/HunyuanWorld-1

https://3d-models.hunyuan.tencent.com/world

https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0