반응형 분류 전체보기1824 메타 ‘드림짐(DreamGym)’ 공개. RL 학습 비용을 통째로 날려버린 에이전트 훈련 프레임워크의 등장 메타가 이번에 내놓은 드림짐(DreamGym)은 단순히 “새로운 강화학습 환경입니다” 이런 차원이 아니다. AI 에이전트 시대가 본격적으로 열리면서 필수적으로 드러나던 두 가지 고질적인 문제—학습 비용 폭탄, 그리고 환경 구축 지옥—이걸 정면으로 때려부수는 프레임워크다.요즘 실리콘밸리 대형 AI 회사들이 전부 RL Gym 만들고 있다. LLM을 그냥 대답 기계로 만드는 시대 끝났고, 실제 웹·업무·툴·API·로봇 환경에서 목표를 단계적으로 달성하는 ‘에이전트’가 핵심 기술이 됐다. 에이전트를 키우려면 다양한 시행착오, 변화하는 상태, 중간 보상 피드백이 필수라 RL이 들어갈 수밖에 없다.문제는 여기서부터 시작된다. RL은 비싸다. 말도 안 되게 비싸다.예를 들어, 웹에서 버튼 몇 번 잘못 누르면 시스템 .. 2025. 11. 21. 오픈AI ‘GPT-5.1-코덱스-맥스’, 진짜 코딩판을 뒤집을 물건 등장했다. 제미나이 3 넘었다? 넘었다. 이번에 오픈AI가 꺼낸 GPT-5.1-코덱스-맥스는 그냥 “새 모델 나왔습니다” 이런 수준이 아니다. 소프트웨어 개발 프로세스 자체를 재정의하는 물건이다. 이름만 보면 5.1 계열의 단순 강화판처럼 들리지만 실제 구조와 작동 방식은 거의 새로운 종(種)이다. 먼저 핵심부터 말한다. 이 모델이 가진 가장 중요한 능력은 ‘장기 문맥 관리’다. 요즘 AI 모델 다들 토큰 길게 본다고 설치지만, 여기서 말하는 건 단순히 길게 만들었다는 얘기가 아니다. 이 모델은 컴팩션(compaction)이라는 메커니즘을 통해 필요한 정보만 유지하고, 불필요한 문맥은 스스로 정리하면서 작업을 이어간다.그 결과? 사실상 수백만 토큰짜리 대형 프로젝트를 끊김 없이 관리할 수 있다. 중요한 건 ‘끊김 없이’라는 점이다.이게 왜 대단.. 2025. 11. 21. 구글 ‘나노 바나나 프로’, 이건 그냥 이미지 모델이 아니라 완전 다른 게임이다 요즘 AI 이미지 모델들 많이 보잖아. 근데 이번에 구글이 던진 나노 바나나 프로는 그 레벨이 아예 다르다. 이건 그냥 ‘그림 잘 그리는 애’가 아니라, 시각적 추론 능력까지 탑재한 ‘멀티모달 엔진’에 가까운 놈이다. 개발자 입장에서 보면, 이건 기업 서비스 설계 방식 자체를 바꿔버릴 수 있는 무기다. 그리고 솔직히 말해서, 쓸 줄 아는 개발자와 모르는 개발자의 생산성 격차가 이제 진짜 벌어지기 시작한다. 나노 바나나 프로가 왜 난리냐기존 모델들 다 괜찮았지. 해상도도 꽤 올라왔고, 편집도 잘 했고. 근데 텍스트 들어간 이미지는 완전 포기했잖아. 로고? 메뉴판? 다이어그램? 대부분 구리게 나왔고.근데 이번 모델은 텍스트·레이아웃 밀도, 정확도가 압도적으로 올라갔다. 프롬프트 하나로 정확한 메뉴판, 의학 .. 2025. 11. 21. 구글 ‘안티그래비티’: 커서·바이브 코딩을 뛰어넘는 진짜 에이전트 IDE의 시대가 열렸다 구글이 이번에 들고 나온 안티그래비티는 그냥 “코드 자동 생성 도구 업그레이드 버전”이 아니다. 이건 개발의 룰 자체를 갈아버리는 플랫폼이다. 커서(Cursor)나 바이브 코딩(Vibe Coding)처럼 개발자를 돕는 AI 도구는 많았지만, 안티그래비티는 이미 ‘도우미’ 단계를 지나 ‘대신 개발하는 존재’로 넘어갔다.핵심은 딱 하나다.AI가 직접 개발자의 도구를 만지고, 스스로 생각하고, 스스로 로그를 남기고, 스스로 검증하고, 여러 명(여러 에이전트)이 동시에 뛰어다닌다는 것.이건 기존 IDE가 절대 건드려본 적 없는 차원이다.에이전트 중심 아키텍처? 이게 왜 중요하냐 안티그래비티는 구글이 노골적으로 선언하는 셈이다.“프롬프트 기반 코딩 시대 끝났다. 이제 에이전트 기반 개발이다.”즉, 명령하고 결과만.. 2025. 11. 20. 구글 제미나이 3 등장: 진짜 ‘지능’의 시대. 개발 자동화·초추론·에이전트 혁명으로 AGI 경쟁이 다시 불붙었다 구글이 제미나이 3를 공개하면서 선언한 메시지는 간단하다.“이제 AI는 텍스트 읽는 기계 아니다. 상황을 읽고, 의도 파악하고, 스스로 계획하고, 작업을 끝까지 처리한다.”말 그대로 게임 체인저다.특히 Deep Think 모드가 보여준 성적은 그냥 “성능 향상”의 레벨이 아니다. GPQA Diamond 93.8%, ARC-AGI-2 45%라는 수치는 모델 자체가 ‘추상적 사고’를 어느 정도 수행하고 있다는 의미다. 이전까지 AGI 논의는 좀 뜬 구름 잡는 느낌이었는데, 이번 수치는 “이제 막 진짜 티저 영상 나왔다” 정도의 임팩트다.추론 능력 강화가 왜 중요하냐면, 개발자 입장에서 앞으로 AI한테 줄 프롬프트 길이가 점점 줄어든다는 얘기다.예전엔 “이렇게 해줘 → 그거 수정해줘 → 이런 상황 고려해줘” .. 2025. 11. 20. 초등학생도 이해하는 양자컴퓨터 이야기 1. 양자컴퓨터, 한 줄로 뭐냐?양자컴퓨터 = ‘한 번에 여러 경우를 같이 생각할 수 있는 컴퓨터’다.지금 우리가 쓰는 컴퓨터는정보 단위를 비트(bit)라고 부르고비트는 0 아니면 1, 둘 중 하나만 가질 수 있다.반면 양자컴퓨터는정보 단위를 큐비트(qubit)라고 부르고큐비트는 0이면서 동시에 1인 상태(중첩 상태)가 될 수 있다.여기서부터 게임의 룰이 완전히 달라진다.2. “0과 1을 동시에 가진다” = 답을 모른다는 뜻이 아니다많이 하는 오해가 이거다.“0인지 1인지 모른다 = 답을 못 냈다그럼 그게 뭐가 대단한데?”일반 컴퓨터에서0인지 1인지 모르면 → 그냥 정보가 없는 상태, 즉 몰라서 답을 못 낸 상태다.근데 양자컴퓨터의 ‘0과 1이 동시에 있다’는 말은 이거랑 다르다.일반 컴퓨터:0인지 1인.. 2025. 11. 18. 이전 1 2 3 4 ··· 304 다음 반응형