최근 AI 분야에서 놀라운 소식이 전해졌습니다.
UC 버클리 연구진이 단 30달러, 즉 약 4만3750원의 비용으로 딥시크(DeepSeek)의 핵심 기술을 재현하는 데 성공했다는 소식입니다.
이러한 성과는 첨단 AI 모델을 저비용으로 구현할 수 있는 가능성을 보여주며, AI 연구 및 개발 분야에 새로운 방향성을 제시합니다.
인공지능(AI) 기술은 날로 발전하고 있지만, 그 발전의 이면에는 막대한 비용이 따릅니다.
특히 대규모 AI 모델을 훈련하고 운영하는 데 드는 비용은 많은 연구자와 기업에게 큰 부담으로 작용해 왔습니다.
이러한 상황에서 UC 버클리 연구진이 단 30달러의 비용으로 딥시크의 핵심 기술을 재현했다는 소식은 많은 이들의 이목을 집중시키고 있습니다.
과연 그들은 어떻게 이러한 성과를 이뤄냈을까요?
UC 버클리 연구진은 최근 소셜 미디어를 통해 '딥시크-R1-제로(DeepSeek-R1-Zero)'라는 모델을 개발했으며, 이를 깃허브에 공개했습니다.
이 모델은 30억 개의 매개변수를 가지고 있으며, 훈련 과정에서 지도 미세조정(SFT)을 생략하여 작업을 단순화했습니다.
그럼에도 불구하고 수학 추론 벤치마크(AIME 2024)에서 'o1'과 비슷한 성능을 기록했습니다.
연구진은 이 모델을 훈련하기 위해 '카운트다운(Countdown)' 게임을 활용한 강화학습(RL) 방식을 도입했습니다.
카운트다운 게임은 참가자들이 주어진 6개의 숫자를 덧셈, 뺄셈, 곱셈, 나눗셈으로 조합하여 목표 숫자에 가까운 결과를 만드는 게임으로, 영국의 유명 게임쇼에서 시작되었습니다.
이를 통해 참가자들의 지능을 테스트하는데, 연구진은 이 게임을 통해 작은 AI 모델이 스스로 정답을 확인하고 찾는 능력을 발전시키고자 했습니다.
처음에는 모델이 무작위로 답을 제출했지만, 학습을 거치면서 점점 더 정교한 전략을 익히게 되었습니다.
즉, 모델이 먼저 답을 제시한 뒤 정답 여부를 검증하고, 여러 번의 반복을 거쳐 최적의 해결책을 도출하는 방식으로 학습이 이루어진 것입니다.
이러한 접근 방식은 모델이 자율적으로 추론 능력을 발전시키는 과정을 보여줍니다.
또한, 연구진은 다양한 크기의 매개변수를 가진 모델을 실험했습니다.
처음에는 5억 개의 매개변수를 가진 '큐원-2.5B(Qwen-2.5-Base)'를 사용했는데, 이 모델은 정답을 단순히 추측하고 추론을 멈추는 경향을 보였습니다.
그러나 매개변수를 15억 개로 확장하자, 모델이 더 높은 점수를 얻기 위해 다양한 문제 해결 전략을 스스로 학습하기 시작했습니다.
더욱이 30억 개와 70억 개의 매개변수를 사용하면, 모델이 더 적은 단계로 정답에 근접하는 모습을 보였습니다.
이러한 결과는 매개변수가 커질수록 모델의 추론 능력이 향상된다는 것을 보여주며, 적은 비용으로도 AI의 성능을 극대화할 수 있는 가능성을 시사합니다.
다만, 모델의 크기가 증가할수록 학습 비용이 증가하는 문제를 해결하기 위한 추가적인 연구가 필요합니다.
UC 버클리 연구진의 이번 연구는 저비용으로도 고성능 AI 모델을 개발할 수 있는 가능성을 보여주었습니다.
이는 AI 연구의 접근성을 높이고, 더 많은 연구자들이 AI 개발에 참여할 수 있는 길을 열어줍니다.
앞으로 이러한 연구가 지속되어 AI 기술의 발전과 보급에 큰 기여를 하기를 기대합니다.
당신을 위한 3줄 요약
- UC 버클리 연구진이 단 30달러로 딥시크의 핵심 기술을 재현한 AI 모델을 개발했습니다.
- '카운트다운' 게임을 통한 강화학습 방식을 활용하여 모델의 추론 능력을 향상시켰습니다.
- 이 연구는 저비용으로 고성능 AI 모델을 개발할 수 있는 가능성을 보여주었습니다.
3 line summary for you
- UC Berkeley researchers developed an AI model replicating DeepSeek's core technology for just $30.
- They enhanced the model's reasoning abilities using reinforcement learning through the 'Countdown' game.
- This study demonstrates the potential to develop high-performance AI models at low costs.
구독!! 공감과 댓글,
광고 클릭은 저에게 큰 힘이 됩니다.
Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.
Tester Share [테스터쉐어] - Google Play 앱
Tester Share로 Google Play 앱 등록을 단순화하세요.
play.google.com
'Development News > AI' 카테고리의 다른 글
머스크, 140조에 오픈AI 인수 제안...알트먼 "트위터나 파세요" 충격적인 반응! (0) | 2025.02.11 |
---|---|
보안 우려에 김 빠진 딥시크 인기···PC서 구동하면 괜찮나? (1) | 2025.02.09 |
솔트룩스, '루시아 2.5' 13일 공개... "오픈 소스로 제공" (1) | 2025.02.09 |
맥/iOS FullMoon 앱 완전 정복! 나만의 LLM 비서 활용 가이드 (0) | 2025.02.05 |
카카오는 처음! 오픈AI와 전략적 제휴, '카나나' 서비스에 챗GPT 도입 (0) | 2025.02.04 |