본문 바로가기
반응형

AI모델50

엔비디아, 오픈 소스 코드 추론 모델 OCR 공개 – 성능과 사용법 완벽 정리 최근 엔비디아가 코드 생성과 문제 해결에 최적화된 오픈 소스 코드 추론 모델인 OCR(Open Code Reasoning) 제품군을 공개했습니다. 이번 공개는 코드 AI 분야에서 폐쇄형 모델의 대안을 제시하며 큰 주목을 받고 있습니다. 특히 허깅페이스에 모델 가중치와 구성을 모두 공개하여 개발자와 연구자들이 쉽게 접근할 수 있게 했다는 점이 특징입니다. 이번 글에서는 OCR 모델의 특징, 성능, 활용 방법을 초보자도 이해하기 쉽게 설명하겠습니다.OCR(Open Code Reasoning) 모델이란?OCR 모델은 디버깅, 코드 생성, 논리 완성 등 실제 개발 환경에서 필요한 복잡한 코드 추론 작업을 처리할 수 있도록 설계된 모델입니다. 다음과 같은 세 가지 주요 모델로 구성되어 있습니다.OCR-네모트론-3.. 2025. 5. 12.
딥시크 R1이 벌써 밀렸다? 엔비디아와 딥시크의 '추론 전쟁'…승자는 누구? AI 업계에 큰 지각 변동이 일어나고 있습니다.지난 몇 달간 놀라운 성능을 자랑하며 주목받은 딥시크 R1이 연이어 새로운 모델들에게 추월당하고 있는 것입니다.특히, 엔비디아가 공개한 ‘라마-3.1-네모트론-울트라-253B’와 딥시크의 자체 보상 모델 GRM-27B가 AI 추론 모델의 새로운 기준을 제시하고 있습니다.딥시크, R2를 위한 '고효율 보상 모델' GRM-27B 공개딥시크는 최근 강화학습(RL)의 핵심인 보상 모델(RM, Reward Model)을 새롭게 개선한 DeepSeek-GRM-27B를 공개했습니다. 핵심은 "작은 RM으로도 큰 모델 못지않은 효과를 낼 수 있다"는 것이었죠. 기존에는 R1 같은 초대형 모델(671B 파라미터)을 학습시키기 위해서는 동급의 초대형 RM이 필요하다고 여겨졌습.. 2025. 4. 11.
오픈AI, 가장 비싼 'o1-프로' API 출시… 딥시크 최대 1000배 오픈AI, 더 강력한 성능을 자랑하는 AI 모델 ‘o1-프로(o1-pro)’를 API로 출시했습니다.이번 모델은 기존 'o1' 모델보다 훨씬 많은 컴퓨팅 자원을 활용해 더 안정적이고 향상된 응답을 제공합니다.그러나 그만큼 가격이 매우 비싸 주목을 받고 있습니다.o1-프로, 기존 모델 대비 성능 향상오픈AI는 20일(현지 시간), X(트위터)를 통해 'o1-프로'가 기존 'o1' 모델을 강화한 버전이라며, 이를 API에서 제공한다고 발표했습니다. 이번 모델은 더 많은 컴퓨팅 자원을 활용하고, 더 높은 성능을 보장합니다. 하지만 이 모델은 5달러 이상 소비한 1~5등급 티어의 개발자들에게만 제공됩니다.비전(vision), 함수 호출(function calling), 구조화된 출력(Structured Outp.. 2025. 3. 22.
"추론 AI, LG가 그 답이다!"... 세계 최고 수준 ‘엑사원 딥’ 오픈소스로 공개 LG, AI 혁신의 선두주자로 나서다2025년 3월 18일, LG AI연구원이 자체 개발한 추론 AI 모델 ‘엑사원 딥(EXAONE Deep)’을 공개했다는 소식이 전해졌습니다.이 모델의 공개는 한국 기업이 글로벌 AI 시장에서 경쟁력을 인정받기 위한 중요한 이정표로, 특히 에이전틱(Agentic) AI 시대를 본격적으로 열었다는 점에서 큰 의미를 지닙니다.LG는 이번 모델을 오픈소스로 공개하여 전 세계의 개발자들이 쉽게 접근하고 활용할 수 있도록 했습니다.이를 통해 LG는 AI 기술의 선도적인 입지를 확립하고, 더욱 다양한 산업 분야에서 AI 혁신을 이끌어 갈 것으로 기대됩니다.‘엑사원 딥’의 성능과 특징엑사원 딥-32B는 딥시크 R1과 비교하여 5% 규모의 매개변수만으로도 우수한 성능을 발휘했습니다... 2025. 3. 22.
알리바바, AI 비디오 생성 모델 ‘Wan2.1’ 4종 오픈소스로 공개 VBench 리더보드 1위 기록, 글로벌 AI 커뮤니티에서 기술력 입증알리바바 클라우드가 AI 영상 생성 모델 ‘완2.1(Wan2.1)’ 시리즈를 오픈소스로 공개하며, AI 기술의 개방성과 확장성을 더욱 강화하고 있다.🚀 Wan2.1, 세계 최초로 중국어·영어 텍스트 효과 지원하는 AI 비디오 생성 모델Wan2.1은 복잡한 움직임을 정밀하게 처리하고 픽셀 품질을 향상시키며, 물리적 원칙을 준수하는 사실적인 영상 생성 능력을 자랑한다. 이러한 뛰어난 성능 덕분에 영상 생성 모델 벤치마크 ‘VBench’ 리더보드에서 1위를 기록했다.특히, VBench 리더보드 상위 5개 모델 중 유일한 오픈소스 모델로 글로벌 AI 커뮤니티에서 큰 주목을 받고 있다.🏆 VBench 종합 점수 86.22% 기록Wan2.1 .. 2025. 3. 8.
트랜스포머의 한계를 넘은 새로운 음성 AI! ‘맘바’ 아키텍처로 무장한 제노스 등장 음성 AI 기술은 날로 발전하고 있습니다. 특히 텍스트-음성 변환(TTS) 모델의 발전은 사람들의 관심을 끌고 있습니다.최근, 지프라라는 미국의 AI 스타트업이 ‘맘바(Mamba)’ 아키텍처를 활용한 새로운 음성 복제 모델을 공개했습니다.이 모델의 이름은 ‘제노스(Zenos)’로, 단 5초의 샘플 오디오만으로 음성을 복제할 수 있는 능력을 자랑합니다.이제, 트랜스포머 모델의 한계를 넘어선 이 혁신적인 기술이 어떻게 음성 AI의 미래를 바꿀 수 있는지 알아보겠습니다.① ‘맘바’ 아키텍처, 트랜스포머의 한계를 넘다제노스는 ‘맘바(Mamba)’ 아키텍처와 트랜스포머 모델을 결합한 하이브리드 모델을 채택하여 기존 모델들의 문제점을 극복하려 했습니다.기존의 트랜스포머 모델은 ‘히든 스테이트(hidden state.. 2025. 2. 18.
반응형