본문 바로가기
Development News/AI

머스크의 xAI, ‘그록’에 이미지 이해 기능 추가! 농담도 알아듣는 AI의 진화

by Maccrey Coding 2024. 11. 3.
728x90
반응형

최근 인공지능(AI) 분야에서 눈에 띄는 소식이 전해졌습니다. 일론 머스크의 AI 스타트업 xAI가 그들의 AI 챗봇 ‘그록(Grok)’에 이미지 이해 기능을 추가했다고 밝혔습니다.

이제 그록은 단순히 텍스트뿐 아니라, 이미지도 분석해 농담까지 이해할 수 있게 됐다고 하니, 기술의 발전 속도가 놀라울 따름입니다.

특히 AI가 인간의 감각과 유머를 이해하게 되면, 어떤 변화를 가져올지 궁금해집니다.

그럼 그록의 새로운 기능과 xAI의 목표에 대해 깊이 알아보겠습니다.

 

xAI는 지난 10월 28일 X(구 트위터)에서 그록-2 모델에 이미지 이해 기능을 추가했다고 공식 발표했습니다.

이 기능은 유료 사용자에게 우선 제공되며, 이미지를 업로드하고 질문을 하면, AI가 이미지 내용을 분석해 답변을 제공할 수 있습니다.

머스크는 “그록이 이제 농담까지 이해할 수 있다”고 언급하며, 이 기능이 초기 단계임에도 불구하고 상당히 유망하다는 뜻을 내비쳤습니다.

AI가 이미지뿐 아니라 이미지 속에 숨겨진 맥락과 유머를 이해할 수 있다는 것은 AI가 인간의 정서에 한 걸음 더 가까이 다가섰다는 의미이기도 합니다.

 

그록의 이미지 이해 기능이 추가된 배경에는 AI의 멀티모달(Multimodal) 기능 개발이 있습니다.

멀티모달 AI는 텍스트와 이미지를 동시에 이해할 수 있는 기술을 의미하며, 최근 AI 기술의 주요 트렌드로 자리 잡고 있습니다.

xAI는 이미 지난 8월 플럭스.1 모델을 통해 이미지 생성 기능을 선보였고, 그보다 이전인 4월에는 그록-1.5V라는 첫 멀티모달 모델을 발표하며 점진적으로 멀티모달 기술력을 강화하고 있습니다.

 

xAI의 또 다른 목표는 문서 이해 기능입니다. 현재 그록은 PDF와 같은 특정 문서 형식은 처리하지 못하지만, 머스크는 빠른 시일 내로 문서 처리 기능도 지원할 것이라고 밝혔습니다.

이는 그록이 텍스트, 이미지, 문서까지 종합적으로 이해하는 AI로 발전해, 다양한 분야에서 실질적인 도움을 제공할 수 있음을 시사합니다.

이와 같은 기술은 비즈니스 현장, 교육, 개인 비서 서비스 등에서 큰 변화를 불러올 가능성이 큽니다.

 

특히 xAI는 최근 한국어 데이터 라벨러를 채용하며 한국어 서비스를 준비 중인 것으로 알려졌습니다.

머스크의 AI가 한국어까지 지원하게 된다면, 국내 사용자들에게도 그록이 더욱 친숙해질 것으로 기대됩니다.

현재 개발 중인 그록-3는 완전한 멀티모달 모델로, 텍스트와 이미지, 음성 등 다양한 데이터 형식을 이해하고 처리할 수 있을 것으로 예상됩니다.

 

일론 머스크의 AI 스타트업 xAI는 그록의 이미지 이해 기능을 통해 AI의 새로운 가능성을 보여주고 있습니다.

단순히 텍스트를 넘어 이미지를 해석하고 유머까지 이해할 수 있는 AI는, 사람과의 소통에서 훨씬 자연스러운 상호작용을 가능하게 할 것입니다.

앞으로 그록이 PDF를 포함한 문서 이해 기능까지 갖추고, 한국어 서비스까지 지원한다면, AI의 활용 범위는 더욱 넓어질 것입니다.

xAI가 추진하는 멀티모달 AI의 발전이 앞으로 우리의 일상에 어떤 영향을 미칠지 기대가 됩니다.

당신을 위한 3줄 요약

  1. xAI가 그록에 이미지 이해 기능을 추가하여 농담도 알아들을 수 있게 되었습니다.
  2. 앞으로 PDF 등 문서 이해 기능도 추가될 예정이며, 한국어 서비스도 준비 중입니다.
  3. AI의 멀티모달 기능 발전이 우리의 일상에 더욱 큰 변화를 가져올 것입니다.

3 line summary for you

  1. xAI has added an image comprehension feature to Grok, enabling it to understand humor.
  2. PDF support is in development, and Korean language services are also in preparation.
  3. The advancement of multimodal AI could bring transformative changes to our daily lives.

구독!! 공감과 댓글,

광고 클릭은 저에게 큰 힘이 됩니다.

 

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

 

728x90
반응형