반응형 DeepSeekMathV21 딥시크의 ‘IMO 금메달 수학 모델’ 오픈소스 공개, AI 추론 경쟁의 새로운 전환점 딥시크가 국제수학올림피아드(IMO) 금메달 수준 성능을 달성한 ‘DeepSeekMath-V2’를 오픈 소스로 공개했다. 이는 오픈AI·구글에 이어 세 번째 IMO 금메달 모델이며, 그 중 유일하게 전체 모델을 공개한 사례다. 단순한 기술 성과를 넘어, AI 수학 추론의 새로운 패러다임을 상업적으로 누구나 활용할 수 있는 수준으로 개방했다는 점에서 산업·학술 생태계 모두에 큰 충격을 주고 있다.이번 모델은 강화학습(RL), 자체 검증(Self-verification), 병렬 탐색(Parallel Thinking)이라는 고난도 기술을 통합한 ‘수학 특화 LLM’의 정점에 가깝다. 특히 검증기(verifier)를 RL 보상 모델로 활용하는 구조는 중대형 모델에서 고난도 문제 해결 능력을 높이는 유력한 방향으로.. 2025. 11. 30. 이전 1 다음 반응형