최저가 AI 추론 API 등장! 람다, 엔비디아 지원으로 '가장 저렴한' 서비스 출시

AI 기술의 발전 속도가 점점 더 빨라지고 있습니다.

기업들이 고도의 인공지능 시스템을 구축하고 이를 운영하는데 필요한 비용이 점점 더 증가하고 있는 상황에서, AI 서비스를 제공하는 스타트업들이 이 시장에 뛰어들고 있습니다.

그 중에서도 엔비디아의 강력한 지원을 받으며 빠르게 성장한 클라우드 스타트업 '람다'는 최근 AI 추론 API 시장에서 또 다른 혁신을 일으켰습니다.

람다는 12일, 자사의 '람다 인퍼런스 API(Lambda Inference API)'를 출시하며 가격 경쟁력을 내세웠습니다.

특히, 이 API는 시장에서 가장 저렴한 가격으로 제공된다고 주장하며, 많은 개발자들의 관심을 끌고 있습니다.

이번 포스팅에서는 람다의 새로운 API와 그 파격적인 가격 정책에 대해 깊이 알아보겠습니다.

람다 인퍼런스 API는 AI 모델 운영을 위한 최적화된 서비스를 제공하는 강력한 도구입니다.

기존의 AI 모델 학습이나 미세 조정에 집중되었던 GPU 서비스에서 이제는 AI 모델 운영을 위한 추론 API로 확장되었습니다.

람다의 API는 메타의 최신 모델인 '라마 3.3', '3.1', 누스의 '헤르메스-3', 알리바바의 '큐원 2.5' 등 다양한 최신 오픈 소스 모델을 지원합니다.

이 API를 통해 개발자들은 AI 모델을 효율적으로 운영할 수 있으며, 향후에는 비디오 및 이미지 생성 등 멀티모달 모델로도 확장될 예정입니다.

이를 통해 더욱 다양한 응용 분야에서 사용될 가능성이 큽니다.

람다의 가장 큰 장점 중 하나는 가격입니다.

'람다 인퍼런스 API'는 종량제로 운영되며, 사용자는 실제로 사용한 토큰만큼만 비용을 지불합니다.

토큰당 비용은 매우 저렴하여, 작은 모델인 '라마-3.2-3B-인스트럭트'는 100만 토큰당 0.02달러에 제공됩니다.

반면, 대형 모델인 '라마 3.1-405B-인스트럭트'는 100만 토큰당 0.90달러입니다.

이처럼 가격이 저렴하고, 사용자가 필요한 만큼만 비용을 지불할 수 있기 때문에 비용 효율성이 뛰어나며, 특히 스타트업이나 중소기업들에게 매우 매력적인 옵션이 됩니다.

이 API는 별도의 승인 절차 없이 바로 사용할 수 있다는 점도 큰 장점입니다.

개발자는 람다의 추론 API 웹페이지에서 API 키를 생성하고, 바로 서비스를 이용할 수 있습니다.

이를 통해 복잡한 절차 없이 빠르게 API를 적용할 수 있으며, 개발자들이 원하는 결과를 효율적으로 얻을 수 있습니다.

람다의 CEO인 스티븐 발라반은 이 새로운 API에 대해 “돈 낭비를 멈추고 대형 언어 모델(LLM) 추론을 위해 람다를 사용하라”고 강조했습니다.

그는 이 서비스를 통해 AI 커뮤니티가 자유롭게 속도 제한 없이 추론 API를 사용할 수 있는 환경을 제공하고 싶다고 밝혔습니다.

이를 통해 람다는 더욱 빠르고 효율적인 서비스를 제공할 수 있게 되며, AI 기술을 보다 민주화하는 데 큰 기여를 할 것입니다.

또한 람다의 강점은 무엇보다 엔비디아의 지원을 받으며 확보한 풍부한 GPU 자원입니다.

수만 개의 GPU를 보유하고 있는 람다는 AI 추론에 필요한 컴퓨팅 파워를 충분히 제공하며, 이를 통해 빠르고 안정적인 서비스 제공이 가능합니다.

따라서 사용자는 람다 API를 통해 AI 모델 추론을 원활하게 실행할 수 있고, 필요한 만큼 컴퓨팅 자원을 효율적으로 활용할 수 있습니다.

람다가 출시한 '람다 인퍼런스 API'는 가격 경쟁력뿐만 아니라 뛰어난 성능과 확장성을 자랑합니다.

엔비디아의 지원을 받으며, 람다는 풍부한 GPU 자원을 활용해 빠르고 안정적인 AI 추론 서비스를 제공합니다.

특히, 종량제로 운영되며, 사용한 만큼만 비용을 지불할 수 있기 때문에 매우 경제적인 선택이 됩니다.

AI 추론에 필요한 인프라를 구축하는 데 부담을 느끼던 개발자들에게 매우 유용한 서비스가 될 것입니다.

람다의 이번 API 출시로 AI 서비스 운영의 진입 장벽이 크게 낮아졌으며, 앞으로 AI 기술을 활용한 다양한 혁신이 가능해질 것입니다.

이제 AI를 활용하는 데 있어 비용 부담을 덜고, 효율적인 추론 서비스를 제공하는 람다의 인퍼런스 API가 많은 개발자들에게 새로운 선택지가 될 것입니다.

람다가 제시한 파격적인 가격과 빠른 성능은 앞으로 더 많은 기업과 개발자들이 이 API를 통해 AI 기술을 쉽게 활용할 수 있도록 만들어 줄 것입니다.

당신을 위한 3줄 요약

람다가 새로운 '람다 인퍼런스 API'를 출시하며, 저렴한 가격으로 AI 추론 서비스를 제공하고 있습니다. 이 API는 메타, 알리바바 등 최신 오픈 소스 모델을 지원하며, 종량제로 운영되어 경제적입니다. 람다는 엔비디아 지원을 통해 빠르고 안정적인 AI 추론 서비스를 제공하고 있습니다.

3 line summary for you

Lambda launched a new "Lambda Inference API" offering affordable AI inference services. This API supports latest open-source models from Meta and Alibaba, and operates on a pay-per-use basis, making it cost-effective. Supported by NVIDIA, Lambda provides fast and reliable AI inference services.

구독!! 공감과 댓글,

광고 클릭은 저에게 큰 힘이 됩니다.

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

저작자표시 비영리 변경금지

'Development News > AI' 카테고리의 다른 글

구글 아스트라 프로젝트, 이제 누구나 실시간 테스트 가능! 바로 확인해보세요! (4)	2024.12.15
업무 효율을 높여주는 구조화&시각화 냅킨(Napkin) AI: 아이디어에서 실행까지 (2)	2024.12.15
챗GPT, 실시간 영상 이해 기능 추가! 이제 영상도 분석한다 (4)	2024.12.13
구글, AI 에이전트 시대 개막! '제미나이 2.0'으로 인공지능의 혁신을 선도하다 (3)	2024.12.13
오픈AI, 동영상 생성 AI '소라' 출시... 유료 사용자 대상 크레딧 지급 시작 (5)	2024.12.10

Maccrey's Code Lab