본문 바로가기
반응형

전체 글1912

“30초 만에 노래 완성”…구글 제미나이 ‘리리아 3’ 탑재, 음악 산업 판 바뀐다 이제 AI에게 “코믹한 R&B 슬로우잼 만들어줘”라고 말하면, 몇 초 뒤 보컬과 악기가 모두 들어간 30초짜리 노래가 완성됩니다.구글이 제미나이(Gemini)에 차세대 음악 생성 모델 ‘리리아 3(Lyria 3)’를 탑재했습니다. 단순한 배경음이 아니라, 멜로디·보컬·편곡이 모두 포함된 완성형 트랙을 생성합니다. 사진 한 장, 짧은 문장 하나로 음악이 만들어지는 시대가 본격화된 것입니다.이 변화는 단순한 기능 추가가 아닙니다. 창작의 구조 자체를 뒤흔드는 사건입니다. 1. 텍스트·사진·영상 → 30초 완성곡리리아 3는 다음을 지원합니다.텍스트 설명 기반 음악 생성사진·영상 분위기 분석 후 음악 변환보컬 자동 생성스타일·템포·보컬 톤 세부 조절커버 아트 자동 제작예를 들어 “노을 사진 기반의 감성적인 어쿠.. 2026. 2. 23.
안드레이 카르파시의 ‘마이크로GPT’ — 200줄 코드가 드러낸 GPT의 본질 대형언어모델 LLM, GPT, 트랜스포머, 자동미분, 어텐션.이 다섯 단어는 지금 AI 산업을 움직이는 핵심 키워드다. 그런데 이 모든 개념을 단 200줄의 순수 파이썬 코드로 구현했다면 어떨까.안드레이 카르파시가 공개한 ‘마이크로GPT(MicroGPT)’는 단순한 튜토리얼을 넘어선 선언이다.“거대한 인프라가 없어도, GPT의 알고리즘적 본질은 설명 가능하다.”이 프로젝트는 AI 업계에 두 가지 메시지를 던진다.첫째, LLM의 복잡성은 본질이 아니라 엔지니어링의 결과물이라는 점.둘째, 트랜스포머 기반 생성형 AI의 핵심은 생각보다 단순한 수학 구조 위에 서 있다는 점이다.GPT의 본질: 다음 토큰 예측이라는 단 하나의 문제마이크로GPT는 3만2000개의 영어 이름을 학습한다.BPE도 없다. 거대한 코퍼스.. 2026. 2. 23.
구글 제미나이 3.1 프로, AI 추론 전쟁의 신호탄인가 구글 제미나이 3.1 프로, ARC-AGI-2, 에이전틱 워크플로, 버텍스 AI, NotebookLM.이번 발표는 단순 모델 업그레이드가 아니다. 대형언어모델(LLM) 경쟁의 기준이 ‘지식량’에서 ‘추론 깊이’로 이동했음을 공식 선언한 사건이다. 구글이 공개한 제미나이 3.1 프로는 기존 제미나이 3 프로 대비 추론 성능을 대폭 강화한 모델이다. 특히 ARC-AGI-2에서 77.1%라는 점수는 단순한 벤치마크 수치를 넘어선다. 이는 ‘보지 못한 논리 패턴을 일반화하는 능력’에 대한 검증이기 때문이다.기술 핵심 분석: 추론 중심 아키텍처로의 진화ARC-AGI-2는 모델이 사전 학습 데이터에 없는 문제를 해결할 수 있는지를 측정한다. 즉, 기억된 지식이 아니라 구조적 사고 능력을 평가한다.77.1%는 기존 .. 2026. 2. 23.
“엔지니어가 코드를 안 짠다?” 앤트로픽 충격 선언…클로드가 코드 100% 쓰는 시대의 진짜 의미 요즘 IT 업계에서 가장 검색량이 폭발적으로 늘고 있는 키워드는 AI 코딩, 클로드, 엔지니어 역할 변화, AI 개발자 대체다. 단순한 기술 트렌드가 아니라, “개발자라는 직업은 앞으로 무엇을 하게 될까?”라는 근본적인 질문이 시장 전체를 흔들고 있다.이 논쟁에 불을 붙인 곳은 다름 아닌 Anthropic이다. 이 회사는 생성형 AI ‘클로드(Claude)’의 개발사로, 이제는 자사 내부 코드의 사실상 100%를 클로드가 작성한다고 공식적으로 밝혔다.이 발언이 단순한 마케팅이 아닌 이유는, 이를 말한 인물이 마이크 크리거 최고제품책임자(CPO)이기 때문이다. 그는 “엔지니어는 더 이상 코드를 타이핑하는 사람이 아니다”라고 단언했다. 이 말은 곧, 소프트웨어 산업의 룰 자체가 바뀌고 있다는 선언과 같다.1.. 2026. 2. 10.
100만 토큰으로 기억하고 스스로 협업한다…앤트로픽 ‘클로드 오퍼스 4.6’, 지식노동 판을 갈아엎다 AI는 더 이상 “도와주는 도구”에 머물지 않는다. 이제는 일을 맡기고, 과정을 지켜보며, 결과를 함께 책임지는 동료로 이동하고 있다. 이 변화를 가장 노골적으로 보여준 사례가 바로 앤트로픽의 최신 모델, 클로드 오퍼스 4.6다. 2026년 2월 공개된 이번 모델은 단순한 성능 개선을 넘어, ‘기억력·자율성·협업’이라는 세 가지 축에서 AI의 역할을 재정의했다. 특히 100만 토큰 롱 컨텍스트와 다중 에이전트 협업은 소프트웨어 개발자뿐 아니라 금융, 법률, 연구, 사무직 전반의 일하는 방식을 근본적으로 바꿀 가능성을 품고 있다.클로드 오퍼스 4.6의 가장 큰 변화는 컨텍스트의 크기다. 100만 토큰은 단순히 “긴 글을 읽는다”는 수준이 아니다. 수백 페이지 분량의 문서, 대규모 코드베이스, 장기간 축적된.. 2026. 2. 7.
구글이 AI의 ‘눈’을 바꿨다…제미나이 3 플래시에 에이전트 비전 도입, 인간처럼 보고 확인한다 AI가 이미지를 본다고 할 때, 우리는 그동안 ‘대충 훑어보고 맞히는 존재’를 떠올려 왔다. 사진 속 숫자를 틀리고, 표의 작은 글씨를 놓치며, 그 빈틈을 추측으로 메우는 방식 말이다. 그런데 구글이 이 공식을 정면으로 뒤집었다. 2026년 2월, 구글은 멀티모달 모델 제미나이 3 플래시에 ‘에이전틱 비전(Agentic Vision)’이라는 새로운 시각 이해 기능을 도입했다. 핵심은 단순하다. 이제 AI는 ‘보는 것’에서 멈추지 않고, ‘조사하고 확인하는 존재’로 진화했다는 점이다.기존 멀티모달 AI의 한계는 명확했다. 이미지를 한 번에 입력으로 받아 처리하다 보니, 작은 일련번호나 미세한 표식, 복잡한 도면의 일부를 놓치기 쉬웠다. 이때 AI는 모르는 부분을 추론으로 메우는 선택을 했다. 그 결과가 바.. 2026. 2. 7.
[##_revenu_]()