
8월 11일 캐나다 벤쿠버에서 열린 SIGGRAPH 2025 컨퍼런스에서 Cosmos 플랫폼과 이를 지원하는 각종 인프라, 도구들을 공개했다. 그중에서 단연 눈길을 끄는 Cosmos reasen1 모델에 관련된 내용이다.
Cosmos Reason는 로봇 및 물리적 인공지능 시스템이 사람처럼 사고하고 행동하도록 도와주는 시각 언어 모델이다. 물리적 상식, 공간-시각 관계, 그리고 추론 능력을 활용하여 복잡한 문제를 해결해도록 설계되었다.
물체가 떨어지거나 밀릴 때 어떻게 반응하는지, 주변 환경에 따라 어떤 일이 벌어지는지 예측하는 능력을 갖추고 있다. 이러한 능력은 로봇이 복잡한 작업을 하거나 자율주행차가 예측 불가능한 상황에서 대처하는데 필수적이다.
영상과 텍스트를 동시에 입력 받아서 사고의 연쇄 과정을 거치며 단계별로 논리적인 결론에 도달한다. 지도 학습 기반 미세 조정(SFT)과 강화학습(RL)을 통해 훈련하며 실제 세계의 역학을 인간의 주석 없이도 학습하며 최적의 결정을 내리는 능력을 가지게 된다. 즉 로봇이 시행착오를 겪으며 스스로 학습하고 개선할 수 있게 된다.
일반적인 현상은 물체 간의 관계, 중력, 관성 등 물리적 규칙을 통해서 발생한다. 컵을 떨어뜨리면 깨진다 라는 물리적 규칙을 인공지능에게 학습시켜서 돌발상황이 일어났을때 대처하도록 하는 것이다. 사고의 연쇄 과정을 통해 최적의 결정을 내릴 수 있도록 돕는다. 인공지능은 컵이 떨어지기전에 손으로 잡는다 또는 컵이 떨어져 깨지면 청소를 한다 등 다양한 반응을 할 수 있다.
엔비디아의 강점은 하드웨어와 소프트웨어의 통합에 있다. Cosmos Reason는 엔비디아의 강력한 GPU 성능과 로봇 시뮬레이션 기술을 기반으로 개발되어 로봇이 실제 환경과 가상 환경을 넘나들며 효율적으로 학습할 수 있는 최적의 환경을 제공한다.
로봇이 단순히 정해진 명령을 수행하는 것을 넘어 현실 세계의 복잡한 물리적 환경을 이해하고 예측하는 능력이 미래 로봇의 모습일 것이다. 이번 엔비디아에서 공개한 Cosmos Reason모델은 물리적 추론 능력을 보여주었으며 엔비디아는 로봇 분야에서도 핵심 인프라와 소프트웨어를 제공함으로써 영향력을 강화하겠다는 전략으로 보여진다.
https://github.com/nvidia-cosmos/cosmos-reason1
https://huggingface.co/nvidia/Cosmos-Reason1-7B
'IT이야기' 카테고리의 다른 글
| Windows 10 기술 지원 종료(2025.10.14) 대처 방안 (1) | 2025.08.16 |
|---|---|
| Z.ai, 멀티모달 모델 GLM-4.5V 출시 (2) | 2025.08.14 |
| 알리바바, 이미지 생성 모델 Qwen-Image 공개 (5) | 2025.08.11 |
| 화웨이, 어센드(NPU) 전용 소프트웨어 CANN 전면 오픈소스화 (5) | 2025.08.10 |
| GPT시리즈 (GPT1 ~ GPT5) (3) | 2025.08.09 |