본문 바로가기
Development News/AI

앤트로픽, 오픈AI를 앞서 'AI 에이전트' 출시! 아직은 테스트 중

by Maccrey Coding 2024. 10. 23.
728x90
반응형

앤트로픽이 자율적으로 컴퓨터 작업을 수행하는 AI 에이전트 기능을 공개했습니다.

이번 발표는 생성 AI 시장에서 오픈AI와의 치열한 경쟁 속에서 이루어졌으며, 앤트로픽은 한발 앞서 신기능을 선보인 것입니다.

이번 블로그에서는 앤트로픽의 새로운 AI 에이전트 기능과 그 의미를 살펴보겠습니다.

 

앤트로픽은 22일(현지시간) 홈페이지를 통해 '컴퓨터 유즈(Computer Use)'라는 AI 에이전트 기능과 함께 클로드 3.5 소네트의 업그레이드 버전 및 클로드 3.5 하이쿠를 출시했습니다.

컴퓨터 유즈는 클로드 3.5 소네트의 API를 통해 제공되며, 사용자가 개입하지 않고도 웹사이트를 개발하고 스프레드시트를 편집하는 등의 작업을 자율적으로 수행할 수 있습니다.

 

이 기능은 사용자가 마치 컴퓨터를 사용하는 것처럼, 화면에서 사용자 인터페이스(UI)를 인식하고 버튼을 클릭하며 텍스트를 입력하는 등의 작업을 수행하는 것이 특징입니다.

앤트로픽은 이러한 기능을 구현하기 위해 컴퓨터 인터페이스를 인식하고 상호작용할 수 있는 API를 구축했습니다.

개발자들은 이 API를 통합하여 모델이 사용자의 명령을 컴퓨터 명령으로 변환할 수 있도록 지원합니다.

 

예를 들어, "온라인 데이터를 사용해 특정 양식을 작성하라"는 명령을 AI가 받으면, AI는 스프레드시트를 확인하고 웹 브라우저를 열어 관련 웹 페이지로 이동한 후, 데이터를 활용해 양식을 작성하는 작업을 수행합니다.

이는 마치 인간이 컴퓨터를 사용하는 방식과 유사한 접근입니다.

 

앤트로픽의 클로드 3.5 소네트는 멀티모달 에이전트 벤치마크인 'OS월드(OSWorld)'에서 스크린샷만으로 작업을 수행하는 카테고리에서 14.9%의 점수를 기록하여 2위인 7.8%를 크게 앞섰습니다.

그러나 이 기능은 아직 테스트 단계에 있으며, 작업 성공률이 예상보다 낮다는 점도 지적되었습니다.

항공편 예약 수정과 같은 복잡한 작업을 수행하는 능력을 평가한 결과, 클로드 3.5 소네트는 성공률이 절반도 안 되는 것으로 나타났습니다.

 

앤트로픽은 현재 개발자들을 대상으로 컴퓨터 유즈 기능을 공개하고 있으며, 아마존, 아사나, 캔바, 노션 등과 함께 베타 테스트를 진행 중입니다.

일반 사용자와 기업 고객들은 몇 개월 내에 이 기능을 이용할 수 있을 것으로 예상됩니다.

 

최근 생성 AI 시장에서 AI 에이전트 개발이 화두로 떠오르고 있으며, 마이크로소프트(MS)와 세일즈포스 같은 기업 소프트웨어 회사들이 이에 발맞추어 자율 AI 에이전트 개발에 박차를 가하고 있습니다.

앤트로픽이 오픈AI의 추론 모델 o1에 눌려 있었던 상황에서 다시 한 번 반격에 나선 셈입니다.

 

이날 발표된 업그레이드된 클로드 3.5 소네트는 오픈AI의 모델 o1보다 더 뛰어난 코딩 작업 능력을 자랑하며, 장애물에 부딪혔을 때 스스로 수정하고 작업을 재시도할 수 있는 능력을 갖추고 있다고 주장했습니다.

클로드 3.5 하이쿠는 가장 경량화된 버전으로, 이전에 앤트로픽의 최첨단 모델이었던 클로드 3 오퍼스와 비슷한 성능을 보였다고 합니다.

 

앤트로픽은 플래그십 모델인 클로드 3.5 오퍼스에 대해 연내 출시할 예정이라고 밝혔습니다.

이는 오픈AI와의 본격적인 성능 대결을 펼칠 것으로 기대되고 있습니다.

 

앤트로픽의 AI 에이전트 기능은 생성 AI 시장의 새로운 이정표가 될 가능성이 큽니다.

아직은 테스트 단계에 있지만, 사용자가 개입하지 않고 자율적으로 작업을 수행할 수 있는 능력은 AI의 발전을 한층 더 가속화할 것으로 기대됩니다.

앞으로의 발전과 성과가 주목되는 가운데, 앤트로픽은 오픈AI와의 경쟁에서 우위를 점할 수 있을지 관심이 모아지고 있습니다.

이와 함께 AI 에이전트의 다양한 활용 가능성도 기대해 볼 만합니다.

당신을 위한 3줄 요약

앤트로픽은 AI 에이전트 기능 '컴퓨터 유즈'를 출시하며, 사용자가 개입하지 않고도 자율적으로 작업을 수행할 수 있도록 하였습니다.

클로드 3.5 소네트는 멀티모달 벤치마크에서 높은 점수를 기록했지만, 아직은 테스트 단계입니다.

앤트로픽은 AI 기술의 발전을 지속하며 오픈AI와의 경쟁에서 우위를 점하고자 합니다.

3 line summary for you

Anthropic has launched the AI agent feature "Computer Use," enabling autonomous task execution without user intervention. The Claude 3.5 Sonnet has scored well in multimodal benchmarks but is still in the testing phase.

 

Anthropic aims to maintain an edge in competition with OpenAI while continuing advancements in AI technology.

구독!! 공감과 댓글,

광고 클릭은 저에게 큰 힘이 됩니다.

 

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

728x90
반응형