인공지능의 새 시대, '머큐리'가 연다!
최근 AI 업계에서 가장 핫한 키워드는 단연 '확산 방식 대형 언어 모델(dLLM)'이다.
기존의 자기회귀 방식 LLM이 아닌, 새로운 접근법을 적용한 최초의 상업적 모델이 등장했다.
바로 '머큐리(Mercury)'다. 인공지능 연구소 인셉션(Inception)이 최초로 공개한 이 모델은 기존 AI 모델과는 차원이 다른 속도와 성능을 자랑하며, AI 업계에 새로운 패러다임을 제시하고 있다.
과연 머큐리는 기존 모델과 무엇이 다르며, 어떤 변화를 가져올 것인가?
🔥 머큐리, 기존 LLM의 한계를 뛰어넘다
인셉션은 3월 8일(현지시간) 공식 홈페이지를 통해 머큐리의 기술적 세부 사항을 공개했다.
또한, 코드 생성에 특화된 '머큐리 코더(Mercury Coder)'의 데모 사이트도 출시하며 본격적인 AI 혁신의 서막을 알렸다.
기업들은 API 및 온프레미스 배포를 통해 이 모델을 활용할 수 있게 될 예정이다.
머큐리 시리즈의 가장 큰 특징은 기존의 LLM 아키텍처와 비교할 수 없는 속도다.
일반적인 LLM은 순차적으로 데이터를 생성하지만, 머큐리는 확산 모델을 통해 병렬로 토큰을 업데이트하는 방식이다.
이 덕분에 엔비디아 'H100' GPU에서 초당 1000개 이상의 토큰을 처리할 수 있어, 기존 프론티어 모델보다 5~10배나 빠른 성능을 보인다.
이는 과거 고가의 맞춤형 AI 칩에서만 가능했던 수준의 속도다.
💡 머큐리 코더, GPT-4o 미니를 뛰어넘다?
이번에 공개된 머큐리 시리즈의 첫 번째 제품은 코딩에 특화된
▲머큐리 코더 스몰(Mercury Coder Small)
▲머큐리 코더 미니(Mercury Coder Mini)다.
정확한 매개변수는 공개되지 않았지만, 성능 테스트 결과는 놀라웠다.
머큐리 코더 스몰은 코딩 벤치마크에서 'GPT-4o 미니'와 '클로드 3.5 하이쿠'와 동급 혹은 더 나은 성능을 보였으며, 머큐리 코더 미니는 IM아레나 리더보드에서 2위를 차지했다.
무엇보다도, 이 모든 것이 기존 모델보다 몇 배 빠른 속도로 이루어진다는 점이 차별화된 강점이다.
⚡ 새로운 AI 시대, 머큐리의 가능성
인셉션은 머큐리 시리즈가 기존 트랜스포머(Transformer) 기반 LLM의 대안으로 원활하게 작동한다고 강조했다.
이는 기존의 하드웨어 및 데이터셋과 완벽히 호환되며, 감독 미세 조정(SFT), 정렬(RLHF), 검색 증강 생성(RAG) 등의 파이프라인을 그대로 사용할 수 있다는 뜻이다.
또한, 확산 모델은 과거 출력만을 기반으로 예측하는 기존 LLM과 달리, 출력 자체를 지속적으로 개선하며 더 정교한 응답을 생성할 수 있다.
특히, 기존 AI 모델들이 겪던 '환각(잘못된 정보 생성)' 문제를 줄이고, 실수를 수정할 수 있는 능력이 강화됐다.
따라서 엔터프라이즈 환경이나 API 통합, 온프레미스 배포 등에 최적화된 솔루션이 될 것으로 보인다.
🌍 머큐리는 어떻게 탄생했나?
머큐리 프로젝트를 주도한 인셉션은 지난해 6월 관련 논문을 발표한 바 있으며, 최근 테크크런치 인터뷰를 통해 기술의 실체를 공개했다.
이 회사는 스탠포드대학교 컴퓨터과학 교수인 스테파노 에르몬과 UCLA, 코넬대학교 연구진들이 주도해 설립한 AI 스타트업이다.
머큐리 개발에는 확산 방식뿐만 아니라
▲직접 선호 최적화(DPO)
▲플래시 어텐션(Flash Attention)
▲결정 변환기(Decision Transformers) 등의 최신 기술이 활용됐다.
이를 통해 인셉션은 "기존 LLM보다 최대 10배 빠르고 비용도 저렴한 dLLM을 훈련하는 데 성공했다"고 밝혔다.
🔮 앞으로의 전망: LLM 시장의 판도가 바뀐다
머큐리의 등장은 LLM 시장의 판도를 바꿀 핵심 기술로 평가받고 있다.
기존의 OpenAI, Anthropic, Google DeepMind 등의 LLM 모델들은 자기회귀 방식의 한계를 극복하기 위해 연구를 지속해왔지만, 머큐리는 이를 완전히 뛰어넘는 새로운 기술을 제시했다.
인공지능이 점점 더 빠르고 정확해지는 시대, 머큐리는 AI 혁신의 새로운 전환점이 될 수 있을까?
앞으로의 행보가 더욱 기대된다.
당신을 위한 3줄 요약
- 인공지능 연구소 인셉션이 세계 최초 확산 방식 대형 언어 모델 '머큐리'를 공개했다.
- 기존 모델보다 5~10배 빠른 성능을 자랑하며, 코딩 특화 모델도 함께 출시되었다.
- 자기회귀 방식 LLM의 한계를 뛰어넘으며, AI 혁신의 새로운 전환점을 제시하고 있다.
3 line summary for you
- Inception has unveiled 'Mercury,' the world's first diffusion-based large language model (dLLM).
- It is 5–10 times faster than existing models and includes coding-specialized versions.
- Mercury overcomes autoregressive LLM limitations, setting a new milestone in AI innovation.
구독!! 공감과 댓글,
광고 클릭은 저에게 큰 힘이 됩니다.
Starting Google Play App Distribution! "Tester Share" for Recruiting 12 Testers for a Closed Test.
Tester Share [테스터쉐어] - Google Play 앱
Tester Share로 Google Play 앱 등록을 단순화하세요.
play.google.com
'Development News > AI' 카테고리의 다른 글
‘라마 4’, AI 음성 비서 시장에 본격 도전! (0) | 2025.03.10 |
---|---|
“개발자 필독!” 구글 Gemini Code Assist, 개발을 혁신할 AI가 왔다! (2) | 2025.03.10 |
오픈AI, '박사급' AI 에이전트에 월 2900만원 과금 계획...'연봉 3.5억' (0) | 2025.03.09 |
GPT-4.5, 인간 선호도 투표에서 '그록-3' 누르고 정상 등극 (2) | 2025.03.09 |
기존 RAG는 짜깁기? RAG 2.0으로 진화한 최고 사실 검증 AI 등장 (0) | 2025.03.09 |