본문 바로가기
반응형

전체 글2006

OpenBMB VoxCPM 리뷰: 30개 언어·48kHz·보이스 클로닝까지 되는 오픈소스 TTS ( 인공지능 TTS) 토크나이저 없는 TTS가 여는 새로운 음성 생성의 시대요즘 생성형 AI의 중심은 텍스트를 넘어 음성으로 빠르게 이동하고 있습니다. 단순히 문장을 읽어주는 수준이 아니라, 사람처럼 말투를 조절하고, 감정을 담고, 특정 화자의 목소리까지 자연스럽게 재현하는 것이 경쟁력이 된 시대입니다. 그런 흐름 속에서 GitHub의 OpenBMB/VoxCPM은 상당히 흥미로운 프로젝트입니다. 이 저장소는 기존 TTS(Text-to-Speech) 시스템이 흔히 의존하던 speech tokenizer를 거치지 않고, 연속적인 음성 표현 공간(continuous latent space) 에서 직접 음성을 생성하는 방향을 제시합니다. 저장소 README와 공식 문서에 따르면 VoxCPM2는 최신 메이저 릴리스로, 2B 파라미터,.. 2026. 4. 14.
“무료로 영상 만들고 음악까지?” 구글 비즈 전면 개편…이제 1인 기업도 광고 영상 공장 된다 예전에는 영상 하나 제대로 만들려면 촬영 장비가 필요했고, 편집 프로그램을 배워야 했고, 배경음악 저작권도 신경 써야 했습니다. 아바타를 넣고 싶으면 또 다른 툴을 찾아야 했고, 유튜브 업로드 전에는 파일 변환과 검수까지 해야 했습니다. 그런데 이제 그 복잡한 과정이 한 플랫폼 안으로 들어오기 시작했습니다. 구글은 2026년 4월 2일 Google Vids 업데이트를 발표하면서, Veo 3.1 기반 영상 생성, Lyria 3·Lyria 3 Pro 기반 맞춤형 음악 생성, AI 아바타, 크롬 화면 녹화 확장 프로그램, 유튜브 직접 내보내기까지 한 번에 강화했다고 밝혔습니다. 특히 개인 구글 계정 사용자도 매월 10개의 영상 생성을 무료로 사용할 수 있다고 공식 발표해, 생성형 영상 AI의 진입장벽을 크게 .. 2026. 4. 11.
구글 코랩이 바꿔버렸다…이제 코딩은 ‘정답 복붙’이 아니라 AI 튜터와 진짜 배우는 시대다 코딩을 처음 배울 때 가장 답답한 순간은 따로 있습니다. 분명 코드를 받아 적었는데 왜 돌아가는지 모르겠고, 에러를 고쳐도 내가 이해한 건 하나도 없는 그 순간입니다. 많은 초보자들이 AI 코딩 도구를 쓰면서도 비슷한 벽에 부딪힙니다. 답은 빨리 나오는데, 실력은 이상하게 늘지 않는다는 느낌 말입니다. 바로 그 지점을 구글이 정면으로 건드렸습니다. 구글은 2026년 4월 8일, 코랩의 제미나이 통합 기능을 강화하면서 ‘커스텀 인스트럭션’과 ‘학습 모드’를 새로 공개했습니다. 공식 설명에 따르면 커스텀 인스트럭션은 사용자가 원하는 코딩 스타일, 프로젝트 맥락, 선호 라이브러리 등을 노트북 단위로 저장해 제미나이의 응답 방식을 맞춤화할 수 있게 해주고, 학습 모드는 제미나이를 단순 코드 생성기가 아니라 단계.. 2026. 4. 11.
오픈AI도 결국 움직였다…앤트로픽 ‘미소스’ 맞불, 이제 AI 전쟁은 ‘사이버 보안’이 본게임이다 인공지능 경쟁의 무대가 또 한 번 바뀌고 있습니다. 예전에는 누가 더 글을 잘 쓰고, 누가 더 똑똑하게 대답하느냐가 핵심이었다면, 이제는 누가 더 빠르게 취약점을 찾고, 더 안전하게 사회 기반시설을 지켜낼 수 있느냐가 새로운 승부처가 되고 있습니다. 이번에 알려진 오픈AI의 움직임은 바로 그 변화의 한복판에 있습니다. 악시오스 보도에 따르면 오픈AI는 일부 파트너에게만 제공하는 사이버 보안 특화 서비스 출시를 준비 중이며, 이는 최근 앤트로픽이 초강력 보안 모델 ‘클로드 미소스 프리뷰’를 일반 공개하지 않고 제한적으로 배포한 흐름과 맞물려 있습니다. 이 소식이 중요한 이유는 단순한 신제품 경쟁이 아니기 때문입니다. 오픈AI는 이미 2026년 2월 ‘Trusted Access for Cyber’라는 파일럿.. 2026. 4. 11.
앤트로픽이 일냈다…‘클로드 코워크’ 정식 출시, 직장인 일자리가 진짜 바뀌기 시작했다 AI는 이제 더 이상 개발자만의 장난감이 아닙니다. 코드 몇 줄을 대신 써주는 도구를 넘어, 회의 내용을 정리하고, 문서를 읽고, 자료를 취합하고, 후속 업무까지 연결하는 ‘같이 일하는 동료’처럼 바뀌고 있습니다. 이번에 앤트로픽이 정식 출시한 ‘클로드 코워크’는 바로 그 변화를 상징하는 서비스입니다. 앤트로픽은 2026년 4월 9일, 클로드 코워크를 맥과 윈도우용 클로드 데스크톱 앱에서 정식 서비스로 전환하고 모든 유료 요금제로 확대한다고 밝혔습니다. 기존 연구 프리뷰 단계에서 벗어나, 이제는 본격적인 기업 업무 도구로 밀어붙이겠다는 뜻입니다.이 소식이 중요한 이유는 단순히 기능 하나가 늘어났기 때문이 아닙니다. AI 업계의 흐름이 “질문에 답하는 챗봇”에서 “업무를 끝까지 처리하는 에이전트”로 이동하.. 2026. 4. 11.
AI 하네스(Harness)란 무엇인가? 요즘 인공지능에서 왜 ‘모델’보다 ‘하네스 설계’가 더 중요해졌을까AI를 이야기할 때 예전에는 “어떤 모델을 쓰느냐”가 거의 전부처럼 여겨졌습니다. GPT냐, Claude냐, Gemini냐, 오픈소스 LLM이냐가 핵심 경쟁력이었습니다. 하지만 2025년 이후 에이전트형 AI가 빠르게 확산되면서 흐름이 달라졌습니다. 이제는 단순히 똑똑한 모델 하나를 붙인다고 해서 좋은 결과가 나오지 않습니다.왜냐하면 실제 업무에서는 모델이 혼자 답만 잘한다고 끝나지 않기 때문입니다. 검색도 해야 하고, 문서도 읽어야 하고, 툴도 호출해야 하고, 중간 결과를 저장해야 하며, 실수했을 때 다시 시도하거나 사람에게 넘기는 절차도 필요합니다. 이처럼 모델이 현실 세계에서 ‘일을 하도록’ 감싸는 실행 구조를 요즘 AI 업계에서는 .. 2026. 4. 9.
반응형