본문 바로가기

IT이야기

알리바바, Qwen3 Coder 와 Qwen Code 공개

ai에 의해 생성된 이미지

 

 

인공지능 기술이 전 세계의 사업 구조와 일자리 지형을 크게 바꾸고 있다. 그중에서도 개발자도 예외는 아니다. 인공지능으로 인해서 일자리 위협을 가장 가깝게 체감하는 직업 중 하나가 바로 소프트웨어 개발자이다. 최근에는 마이크로소프트와 같은 미국의 빅테크 기업들은 소프트웨어 개발자를 대거 감원을 진행하였고 이러한 감원에는 인공지능의 영향이 크다고 생각이 된다. 첫번째로 인공지능으로 기존에 개발자들의 효율이 크게 증가했다는 것이다. 바이브코딩이라는 신조어도 탄생했다. 바이브코딩이란 인공지능에게 회사 홈페이지 만들어줘! 라고 말해 주면 홈페이지를 자동으로 만들어 주는 기술이다.

 

최근 개발자의 핵심 역량으로 바이브코딩을 잘하기 위한 프롬프트를 사용할 수를 보기도 한다. 결국에는 개발자가 바이브코딩으로 2~5명의 일을 할수 있게 되었다. 물론 실력이 좋은 개발자는 더 많은 일을 할 수도 있다. 100명의 개발자가 필요한 업무를 20명의 개발자로 할 수 있게 되면서 불가피하게 감원을 하지 않았을까 생각해본다. 물론 상위 20%의 개발자는 아직까지 인공지능이 대체하기 어렵다. 하지만 인공지능은 계속해서 상위 20%의 개발자들의 코드를 학습하고 시간이 지남에 따라서 인공지능이 개발하고 사람은 기획만 하는 시대가 올 수도 있다. 

 

바이브코딩의 인기와 더불어 같이 성장한 스타트업이 있다. 바로 애니스피어이다. 애니스피어는 AI 기반 코딩 플랫폼인 커서를 개발하고 운영하는 기업이다. 빠른 속도로 1억 달러 매출액을 달성하면서 폭풍 성장을 하였다. 역대 가장 빠르게 5억 달러 ARR (Annual Recurring Revenue)를 달성한 회사가 되었다. 이렇게 인공지능 코딩 시장이 빠르게 성장하면서 이번에 중국 알리바바에서 Qwen3 Coder와 코딩 에이전트인 Qwen code를 공개했다. 회사의 주요 코드를 노출시키지 않으면서 바이브코딩을 통해서 개발 역량을 향상시키기에 좋은 선택지가 될 것으로 보여진다. 

 

Open 되어 있는 Model 중에는 최고로 좋은 성능을 보여 주고 있다. 물론 Apache License 2.0를 지향하고 있어서 사용자가 소프트웨어를 자유롭게 사용, 수정, 배포할 수 있으며, 상업적 목적으로도 사용할 수 있다는 의미이다. 거의 제한 사항이 없다. 기존 알리바바가 100B이상 모델과 고성능 모델에서 채택하고 있는 알리바바 License 아니라는 점에서 플러스 요인이라고 본다.

 

 Qwen3 Coder는 두가지 크기의 모델로 구성되어 있지만 주목할만한 모델은 480B의 파라미터를 가지는 모델인 Qwen3-Coder-480B-A35B-Instruct이다.  Mixture-of-Experts (MoE) 구조를 채택하여 480B 파라미터를 보유하면서도 토큰 예측 시에는 38B의 파라미터만 활성화하도록 하였다. 160개의 전문가로 구성되었고 구중 8개만 추론하는 방식이며 총 62개의 레이어와 96개의 어텐션 헤드를 갖추었다. 컨텍스트 길이는 256k 토큰을 기본 지원하며 RoPE 기반 위치인코딩을 확장하는 YaRN기법으로 최대 1백만 토큰까지 맥락을 늘릴 수 있다. 이처럼 긴 컨텍스트로 인해서 코드베이스 전체를 한번에 이해하거나 장문의 문서까지 처리 할 수 있어서 큰 규모의 프로젝트 분석에 뛰어난 강점을 보일 것이다.사전학습에는 총 7.5조 토큰이 사용되었고 그중 70%가 코드 데이터로 구성되어 있다. 방대한 양의 고품질 코드를 학습하기 위해 이전 세대 모델인 Qwen 2.5-Coder를 활용한 데이터 정제 및 재생성 작업을 거쳤다. 사전학습 후에는 모델 성능 향상을 위해 두단계의 강화학습 기반 미세조정(RL)을 도입했다. 다양한 실제 프로그래밍 문제에 대해 코드 실행 결과를 보상으로 주는 실행 기반 강화학습을 대규모로 실시하여 코드 실행 성공률을 크게 높였다. 이는 테스트 케이스를 자동 생성해 모델이 스스로 코드작성 > 실행 > 수정 사이클을 학습하도록 한것이다.

 

소프트웨어 엔지니어링 과제처럼 여러 단계의 상호작용이 필요한 문제를 풀도록 에인전트형 강화학습을 채택했다. 이를 위해 2만 개의 벙렬 환경을 구성하여 모델이 도구를 연속적으로 사용하면서 목표를 달성하는 훈련을 시켰고 그 결과 복잡한 문제 해결 능력이 크게 향상되었다.Qwen3 Coder는 공개 모델 중 1위를 차지했으며 앤트로픽의 Claude Sonnet 4와 견줄만한 성능을 보여주었다. 코드 자동완성에 큰 영향을 미치는 LiveCodeBench v5에서 최상위권 성능을 입증했다. 공개 직후 연구자와 개발자들 사이에 큰 돌풍을 일으키고 있으며 이미 실무 개발에 적용한 사례들도 등장하고 있다. 중국의 인공지능 기업들이 돌아가면서 세계를 깜짝 놀랠 만한 모델들을 선보이고 있다. 딥시크, 알리바바, 바이트댄스, 문샷AI, 쯔푸AI, 텐센트, 미니맥스......

 

 

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://modelscope.cn/models/Qwen/Qwen3-Coder-480B-A35B-Instruct

https://github.com/QwenLM/Qwen3-Coder

https://arxiv.org/abs/2505.09388