반응형 AI모델45 트랜스포머의 한계를 넘은 새로운 음성 AI! ‘맘바’ 아키텍처로 무장한 제노스 등장 음성 AI 기술은 날로 발전하고 있습니다. 특히 텍스트-음성 변환(TTS) 모델의 발전은 사람들의 관심을 끌고 있습니다.최근, 지프라라는 미국의 AI 스타트업이 ‘맘바(Mamba)’ 아키텍처를 활용한 새로운 음성 복제 모델을 공개했습니다.이 모델의 이름은 ‘제노스(Zenos)’로, 단 5초의 샘플 오디오만으로 음성을 복제할 수 있는 능력을 자랑합니다.이제, 트랜스포머 모델의 한계를 넘어선 이 혁신적인 기술이 어떻게 음성 AI의 미래를 바꿀 수 있는지 알아보겠습니다.① ‘맘바’ 아키텍처, 트랜스포머의 한계를 넘다제노스는 ‘맘바(Mamba)’ 아키텍처와 트랜스포머 모델을 결합한 하이브리드 모델을 채택하여 기존 모델들의 문제점을 극복하려 했습니다.기존의 트랜스포머 모델은 ‘히든 스테이트(hidden state.. 2025. 2. 18. 앤트로픽, '추론 강도' 설정할 수 있는 하이브리드 모델 출시 임박 앤트로픽이 새롭게 개발한 하이브리드 모델이 출시를 앞두고 있다는 소식입니다.이번 모델은 추론 모델과 비추론 모델을 결합하여 사용자가 직접 모델의 추론 강도를 설정할 수 있는 기능을 제공합니다.이는 AI 사용자가 모델의 성능을 요구사항에 맞게 조정할 수 있는 혁신적인 접근 방식으로, 주목받고 있습니다.하이브리드 모델의 특징앤트로픽은 이번에 발표할 모델이 슬라이딩 스케일을 적용하여 추론 강도를 조절할 수 있다고 밝혔습니다.사용자는 추론 강도를 0에서 100까지 설정할 수 있으며, 이로 인해 모델의 추론 시간과 컴퓨팅 비용을 조절할 수 있습니다.강도가 0일 경우 모델은 기존의 비추론 모델인 클로드처럼 작동하며, 100으로 설정하면 가장 많은 컴퓨팅 자원을 사용하고 추론 시간이 길어지며, 그에 따라 요금도 더 .. 2025. 2. 16. 딥시크와 딥 리서치, AI의 미래를 바꿀 게임 체인저 등장! 최근 인공지능(AI) 기술에 큰 변화를 예고하는 혁신적인 모델들이 등장했습니다. 바로 '딥시크-R1'과 오픈AI의 '딥 리서치'입니다.이 두 모델은 AI의 정의를 새롭게 하고 있으며, 기존의 고정된 모델을 사용하는 일은 점점 사라질 것이라는 예측이 나오고 있습니다.이러한 기술들이 기업 환경과 개발자들에게 어떤 영향을 미칠지에 대한 논의가 뜨겁습니다.오늘은 이 두 모델이 가져올 AI의 미래와 그 의미를 자세히 살펴보겠습니다.AI 혁신의 새로운 물결AI 기술이 빠르게 발전하면서, 그 가능성도 점점 넓어지고 있습니다.특히 최근 인공지능의 세계에서 가장 뜨거운 화제가 된 것은 바로 '딥시크-R1'과 '딥 리서치'입니다.이 두 모델은 AI의 성능을 극대화하면서도 비용은 낮추는 혁신적인 기술을 제공합니다.그럼에도 .. 2025. 2. 14. 30달러로 딥시크 추론 능력 재현? UC 버클리의 혁신적 AI 연구! 최근 AI 분야에서 놀라운 소식이 전해졌습니다.UC 버클리 연구진이 단 30달러, 즉 약 4만3750원의 비용으로 딥시크(DeepSeek)의 핵심 기술을 재현하는 데 성공했다는 소식입니다.이러한 성과는 첨단 AI 모델을 저비용으로 구현할 수 있는 가능성을 보여주며, AI 연구 및 개발 분야에 새로운 방향성을 제시합니다. 인공지능(AI) 기술은 날로 발전하고 있지만, 그 발전의 이면에는 막대한 비용이 따릅니다.특히 대규모 AI 모델을 훈련하고 운영하는 데 드는 비용은 많은 연구자와 기업에게 큰 부담으로 작용해 왔습니다.이러한 상황에서 UC 버클리 연구진이 단 30달러의 비용으로 딥시크의 핵심 기술을 재현했다는 소식은 많은 이들의 이목을 집중시키고 있습니다.과연 그들은 어떻게 이러한 성과를 이뤄냈을까요? U.. 2025. 2. 9. 미니맥스, 역대 최대 컨텍스트창 갖춘 오픈 소스 모델 공개…"AI 에이전트에 특화" 중국의 대표 AI 스타트업 미니맥스가 역대 최대 크기의 컨텍스트 창을 자랑하는 오픈 소스 모델 ‘미니맥스-01’을 공개했다.이 모델은 기존 AI 에이전트들의 장기 컨텍스트 처리 능력을 확장해 다가오는 AI 시대에 대응할 수 있도록 설계되었다.미니맥스-01은 두 가지 시리즈로, 텍스트 처리에 최적화된 ‘미니맥스-텍스트-01’과 비전-언어 처리에 특화된 ‘미니맥스-VL-01’로 구성되어 있다.특히, 이 모델은 혁신적인 라이트닝 어텐션 메커니즘과 전 세계 최대 전문가 혼합 아키텍처를 통해 긴 시퀀스와 대규모 데이터 처리에서도 우수한 성능을 발휘한다. 미니맥스는 최근 오픈 소스 AI 모델을 통해 주목받고 있는 중국의 대표 스타트업이다. 이번에 공개된 미니맥스-01은 그동안 제한적이었던 AI 모델의 컨텍스트 처리.. 2025. 1. 17. 구글, "지식 증류와 합성 데이터로 LLM 추론 향상 가능" 테스트-타임 컴퓨트와 합성 데이터가 AI 모델의 새로운 길을 열다 AI 모델의 발전이 점차 느려지고 있다는 우려가 제기되는 가운데, 구글과 딥마인드가 새로운 해법으로 주목받고 있습니다.바로 지식 증류(Knowledge Distillation)와 테스트-타임 컴퓨트(Test-Time Compute)를 활용한 합성 데이터 생성입니다.이 접근법은 기존 데이터 고갈 문제를 해결하고, AI 모델의 추론 성능을 향상하는 데 중요한 역할을 할 것으로 기대됩니다. 1. 지식 증류란 무엇인가?지식 증류는 큰 교사 모델(Teacher Model)이 생성한 데이터를 기반으로 작은 학생 모델(Student Model)을 훈련시키는 기법입니다.이 과정에서 합성 데이터가 생성되며, 이는 AI 모델의 학습에 활용됩니다.특히, 합성.. 2025. 1. 12. 이전 1 2 3 4 ··· 8 다음 반응형