본문 바로가기
반응형

오픈소스36

트랜스포머의 한계를 넘은 새로운 음성 AI! ‘맘바’ 아키텍처로 무장한 제노스 등장 음성 AI 기술은 날로 발전하고 있습니다. 특히 텍스트-음성 변환(TTS) 모델의 발전은 사람들의 관심을 끌고 있습니다.최근, 지프라라는 미국의 AI 스타트업이 ‘맘바(Mamba)’ 아키텍처를 활용한 새로운 음성 복제 모델을 공개했습니다.이 모델의 이름은 ‘제노스(Zenos)’로, 단 5초의 샘플 오디오만으로 음성을 복제할 수 있는 능력을 자랑합니다.이제, 트랜스포머 모델의 한계를 넘어선 이 혁신적인 기술이 어떻게 음성 AI의 미래를 바꿀 수 있는지 알아보겠습니다.① ‘맘바’ 아키텍처, 트랜스포머의 한계를 넘다제노스는 ‘맘바(Mamba)’ 아키텍처와 트랜스포머 모델을 결합한 하이브리드 모델을 채택하여 기존 모델들의 문제점을 극복하려 했습니다.기존의 트랜스포머 모델은 ‘히든 스테이트(hidden state.. 2025. 2. 18.
허깅페이스, 로봇에 말로 지시하는 파운데이션 모델 최초로 오픈 소스 출시 최근 혁신적인 소식이 전해졌습니다.허깅페이스와 피지컬 인텔리전스가 협력하여 파이제로(Pi0)라는 범용 로봇 파운데이션 모델을 오픈 소스로 공개했습니다.이 모델은 기존의 대형 언어 모델(LLM)처럼 텍스트를 통해 작업을 지시하는 것에 그치지 않고, 실제로 로봇이 물리적인 동작을 수행할 수 있도록 변환하는 비전-언어-행동(VLA) 모델입니다.이번 출시로 로봇을 음성 명령이나 자연어로 지시하는 새로운 시대의 시작을 알리고 있습니다. 기존의 대형언어모델은 주로 텍스트 지시만을 처리할 수 있었지만, 파이제로는 이미지, 텍스트, 행동을 모두 통합하여 처리할 수 있는 멀티모달 모델로 로봇의 자율적인 행동을 이끌어낼 수 있습니다.예를 들어, 사용자가 로봇에게 "세탁물을 접어라"라고 자연어로 명령하면, 로봇은 그 명령을.. 2025. 2. 14.
맥/iOS FullMoon 앱 완전 정복! 나만의 LLM 비서 활용 가이드 "FullMoon, 단순한 LLM 앱을 넘어선 나만의 맞춤형 AI 비서로 진화하는 방법"앞선 포스팅에서 FullMoon 앱의 매력과 주요 기능을 살펴보았습니다.오늘은 FullMoon을 더욱 강력하고 효율적으로 활용하기 위한 심층 사용법과 꿀팁을 공개합니다.FullMoon은 단순한 LLM 앱을 넘어 사용자 맞춤형 AI 비서로 활용될 수 있도록 다양한 기능을 제공합니다.1. FullMoon, 나에게 맞게 커스터마이징하기FullMoon은 다양한 설정 옵션을 통해 사용자의 취향과 필요에 맞게 앱을 커스터마이징할 수 있습니다.테마 및 폰트: 밝고 경쾌한 테마부터 어두운 분위기의 테마까지, 다양한 테마와 폰트를 선택하여 FullMoon의 외관을 개인 취향에 맞게 변경할 수 있습니다.시스템 프롬프트: FullMoon.. 2025. 2. 5.
중국의 AI 혁명! 딥시크, 오픈소스 AI로 미국 AI 산업에 충격파 - 이제 우리는 무엇을 해야 할까? AI 분야의 새로운 전환점, 중국의 '딥시크'2025년 1월 28일, 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델 R1이 세계의 이목을 집중시키고 있습니다.이 AI 모델은 고비용의 고성능 칩 없이도 챗GPT와 비슷한 수준의 성능을 자랑하며, 특히 오픈소스로 제공되어 누구나 사용하고 수정할 수 있다는 점에서 큰 주목을 받습니다.딥시크의 혁신적인 성과는 미국의 AI 주도권을 위협할 정도로 놀라운 결과를 낳았습니다.미국은 수년간 중국의 AI 기술을 견제해왔지만, 이번 사건은 그간의 수출 규제와 기술 장벽을 뚫고 중국이 AI 분야에서 뛰어난 경쟁력을 입증했다는 점에서 큰 충격을 안겨주었습니다. 이 글에서는 딥시크가 개발한 AI 모델 R1의 특징과 이로 인한 미국의 대응, 그리고 향후 AI 경쟁에서 .. 2025. 1. 29.
미니맥스, 역대 최대 컨텍스트창 갖춘 오픈 소스 모델 공개…"AI 에이전트에 특화" 중국의 대표 AI 스타트업 미니맥스가 역대 최대 크기의 컨텍스트 창을 자랑하는 오픈 소스 모델 ‘미니맥스-01’을 공개했다.이 모델은 기존 AI 에이전트들의 장기 컨텍스트 처리 능력을 확장해 다가오는 AI 시대에 대응할 수 있도록 설계되었다.미니맥스-01은 두 가지 시리즈로, 텍스트 처리에 최적화된 ‘미니맥스-텍스트-01’과 비전-언어 처리에 특화된 ‘미니맥스-VL-01’로 구성되어 있다.특히, 이 모델은 혁신적인 라이트닝 어텐션 메커니즘과 전 세계 최대 전문가 혼합 아키텍처를 통해 긴 시퀀스와 대규모 데이터 처리에서도 우수한 성능을 발휘한다. 미니맥스는 최근 오픈 소스 AI 모델을 통해 주목받고 있는 중국의 대표 스타트업이다. 이번에 공개된 미니맥스-01은 그동안 제한적이었던 AI 모델의 컨텍스트 처리.. 2025. 1. 17.
IBM, 그라나이트 3.1 출시! 강력한 성능과 확장성, 다국어 지원까지... 기업용 AI의 새로운 패러다임 최근 IBM이 기업용 인공지능(AI) 솔루션 시장에서 새로운 언어 모델인 그라나이트 3.1(Granite 3.1)을 오픈소스로 공개했습니다.이번 모델은 이전 버전인 그라나이트 3.0에서 성능과 기능이 대폭 향상된 모델로, 기업 환경에 적합한 다양한 기능을 탑재하고 있습니다.특히, 128K의 컨텍스트 길이 확장과 다국어 지원 등의 주요 기능들이 더해져, IBM 왓슨x.ai(Watsonx.ai) 플랫폼을 통해 기업들이 더욱 효율적으로 AI 기술을 활용할 수 있게 되었습니다.이번 블로그에서는 그라나이트 3.1의 주요 특징과 기업 환경에서의 활용 가능성, 그리고 그로 인한 산업 변화를 분석해보겠습니다.1. 128K 컨텍스트 길이 확장그라나이트 3.1의 가장 큰 특징 중 하나는 128K의 확장된 컨텍스트 길이입니.. 2024. 12. 28.
반응형