앨런AI연구소(AI2)가 새로운 오픈 소스 대형멀티모달모델(LMM) 제품군 ‘몰모(Molmo)’를 출시했습니다.
이 모델은 고품질 데이터를 학습하여 오픈AI의 'GPT-4o'를 포함한 여러 벤치마크에서 우수한 성능을 보여주고 있다고 주장하고 있습니다.
몰모 모델의 구성
AI2는 몰모 제품군에 포함된 4종의 오픈 소스 LLM을 발표했습니다.
이 모델들은 각각 ▲몰모-72B ▲몰모-7B-D ▲몰모-7B-O ▲몰모E-1B입니다.
현재 이 모델들은 허깅페이스에서 연구 및 상업적 용도로 사용 가능하며, 각각 알리바바의 오픈 소스 '큐원2-72B'와 AI2의 '올모' 모델을 기반으로 하고 있습니다.
플래그십 모델인 몰모-72B와 몰모-7B-D는 특히 여러 벤치마크에서 오픈AI의 GPT-4o, 앤트로픽의 '클로드 3.5 소네트', 구글의 '제미나이 1.5' 등 주요 폐쇄형 경쟁 모델보다 뛰어난 성능을 보였다고 AI2는 밝혔습니다.
성능 벤치마크
몰모-72B는 다양한 문서에서 정보를 이해하고 추출하는 능력을 평가하는 DocVQA에서 96.3점을 기록했으며, 이미지 내의 텍스트를 이해하는 TextVQA에서는 85.5점을 기록했습니다.
이 점수는 제미나이 1.5 프로와 클로드 3.5 소네트를 능가하는 수치입니다. AI2가 자체 개발한 AI2D 벤치마크에서도 GPT-4o보다 더 높은 성능을 보였습니다.
특히, 몰모 모델은 이미지에서 객체를 식별하는 시각적 접지(Visual Grounding) 능력에서도 뛰어난 성능을 발휘했습니다.
이는 복잡한 멀티모달 추론이나 로봇공학 분야에서도 매우 유망하다는 평가를 받고 있습니다.
효율적인 데이터 학습 방법
AI2는 몰모 모델의 성과를 "훨씬 더 효율적인 데이터 수집과 학습 방법 덕분"이라고 설명했습니다.
기존 모델들이 인터넷에서 무차별적으로 데이터를 스크래핑하여 학습하는 것과 달리, 몰모는 정교하게 큐레이팅된 고품질 데이터를 학습하여 우수한 성과를 거두었다고 강조했습니다.
이 모델은 인간 주석자가 60만 개의 이미지에 대해 여러 페이지의 텍스트에 걸쳐 자세히 설명한 데이터셋으로 훈련되었으며, 폐쇄형 경쟁 모델에 비해 1000배 적은 훈련 데이터를 사용했음에도 불구하고 여러 벤치마크에서 뛰어난 성능을 보여주었습니다.
결론 및 전망
AI2는 몰모 모델이 이미지의 요소를 분석하여 질문에 답하는 능력을 보여줍니다.
이는 웹 상에서 상호작용을 통해 실제 작업을 수행하는 데 있어 중요한 기능입니다.
앞으로 AI2의 몰모 모델이 다양한 분야에서 활용될 수 있는 가능성이 큽니다. 또한, 이러한 혁신은 AI 기술의 발전을 더욱 가속화할 것으로 기대됩니다.
당신을 위한 3줄 요약
AI2가 오픈 소스 대형멀티모달모델 '몰모'를 출시했습니다.
몰모 모델은 고품질 데이터로 학습하여 GPT-4o를 포함한 여러 벤치마크에서 뛰어난 성능을 보이고 있습니다.
효율적인 데이터 수집과 학습 방법 덕분에 몰모는 1000배 적은 데이터로 훈련되었음에도 불구하고 우수한 결과를 얻었습니다.
3 line summary for you
AI2 has launched the open-source large multimodal model 'Molmo'.
The Molmo model shows superior performance over benchmarks, including GPT-4o, by learning from high-quality data.
Thanks to efficient data collection and training methods, Molmo achieved excellent results using 1,000 times less data.
구독!! 공감과 댓글,
광고 클릭은 저에게 큰 힘이 됩니다.
Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.
'Development News > AI' 카테고리의 다른 글
인공지능(AI), 이제 캡차(CAPTCHA)까지 뚫었다! 캡차 보안의 끝은 어디인가? (1) | 2024.09.30 |
---|---|
구글, AI 챗봇 '바드' 진화시켜 180개국에 동시 출시! (6) | 2024.09.30 |
AI 코딩 도구, 생산성 효과 미미? 번아웃 방지에도 큰 도움 안 돼 - 업레벨 보고서 분석 (0) | 2024.09.30 |
노트북LM, 구글의 AI 히트작으로 부상...유튜브·오디오 파일 업데이트 (7) | 2024.09.30 |
애플, 비전 프로 2세대 내년 하반기 출시...핵심은 AI와 결합 (1) | 2024.09.30 |