본문 바로가기
Development News/AI

미스트랄, 최초의 멀티모달 모델 '픽스트랄 12B' 출시

by Maccrey Coding 2024. 9. 13.
반응형

프랑스의 인공지능 스타트업 미스트랄(Mistral)이 새로운 이정표를 세우며, 최초의 멀티모달 모델인 '픽스트랄 12B(Pixtral 12B)'를 출시했습니다. 이 모델은 텍스트와 이미지를 동시에 처리할 수 있는 기능을 갖추고 있어, 인공지능의 가능성을 한층 넓힐 것으로 기대됩니다. 본 기사에서는 픽스트랄 12B의 주요 특징과 활용 가능성, 그리고 미스트랄의 향후 계획에 대해 자세히 살펴보겠습니다.

픽스트랄 12B의 주요 특징

1. 멀티모달 기능

픽스트랄 12B는 기존의 텍스트 기반 언어 모델 '네모(Nemo) 12B'를 기반으로, 4억 개의 매개변수를 갖춘 비전 어댑터를 추가한 모델입니다. 이 비전 어댑터는 이미지 처리 기능을 제공하여, 모델이 텍스트와 이미지를 모두 이해하고 처리할 수 있게 합니다. 최대 1024×1024 해상도의 이미지를 입력으로 받아들여 분석할 수 있으며, 웹상의 URL에서 이미지를 불러오거나 base64 인코딩 체계를 통해 이미지를 텍스트 형식으로 변환할 수 있습니다.

2. 자동 자막 작성

픽스트랄 12B는 이미지를 인식하고 분석하여 자동으로 자막을 작성하는 기능을 제공합니다. 이 기능은 이미지와 관련된 텍스트 정보를 생성하여, 시각적 콘텐츠의 접근성과 이해도를 높이는 데 유용합니다.

3. 오픈 소스 제공

이 모델은 깃허브와 허깅페이스의 토런트 링크를 통해 오픈 소스로 제공됩니다. 전체 파일 크기는 약 24GB이며, 상업적 용도로도 자유롭게 사용할 수 있습니다. 이는 연구자와 개발자들이 이 모델을 활용해 다양한 애플리케이션을 개발할 수 있는 기회를 제공합니다.

4. 테스트 플랫폼

픽스트랄 12B는 AI 챗봇 '르챗(Le Chat)'과 AI 개발 플랫폼 '르플랫폼(Le Platforme)'에서도 곧 테스트용으로 제공될 예정입니다. 이를 통해 실무에서의 활용 가능성을 더욱 넓힐 수 있을 것입니다.

미스트랄의 성장과 향후 계획

미스트랄은 최근 6억4500만 달러 규모의 펀딩 라운드를 마감하며, 시장에서의 입지를 더욱 확고히 했습니다. 이 라운드에서는 회사의 시장가치가 60억 달러로 평가되었습니다. 미스트랄은 유럽판 오픈AI로 불리며, AI 모델의 혁신과 개발에 있어 가장 활발한 스타트업 중 하나로 주목받고 있습니다.

 

올해 2월에는 고급 다국어 지원, 향상된 추론, 코드 생성, 수학 성능을 제공하는 '미스트랄 라지 2(Mistral Large 2)'를 출시했으며, 이후 22억 매개변수의 코딩 모델 '코드스트랄(Codestral)', 전문가 혼합 모델 '믹스트랄 8x22B(Mixtral 8x22B)', 그리고 수학적 추론과 과학적 발견을 위한 '매스트랄 7B(Mathtral 7B)'를 차례로 발표했습니다.

픽스트랄 12B의 출시는 이러한 혁신의 연장선상에서 이루어진 것이며, 멀티모달 모델 분야에서도 중요한 이정표가 될 것입니다.

 

미스트랄의 '픽스트랄 12B'는 이미지와 텍스트를 동시에 처리할 수 있는 최초의 멀티모달 모델로, 인공지능의 새로운 가능성을 제시합니다.

텍스트 기반 정보와 시각적 정보를 통합하여 보다 풍부한 데이터를 제공하는 이 모델은 연구자와 개발자들에게 다양한 응용 가능성을 열어줄 것입니다.

미스트랄의 향후 발전과 함께, 멀티모달 모델의 활용도가 더욱 높아질 것으로 기대됩니다.

 

 

구독!! 공감과 댓글은 저에게 큰 힘이 됩니다.

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

 

 

반응형