반응형 Development News/AI671 딥시크의 ‘IMO 금메달 수학 모델’ 오픈소스 공개, AI 추론 경쟁의 새로운 전환점 딥시크가 국제수학올림피아드(IMO) 금메달 수준 성능을 달성한 ‘DeepSeekMath-V2’를 오픈 소스로 공개했다. 이는 오픈AI·구글에 이어 세 번째 IMO 금메달 모델이며, 그 중 유일하게 전체 모델을 공개한 사례다. 단순한 기술 성과를 넘어, AI 수학 추론의 새로운 패러다임을 상업적으로 누구나 활용할 수 있는 수준으로 개방했다는 점에서 산업·학술 생태계 모두에 큰 충격을 주고 있다.이번 모델은 강화학습(RL), 자체 검증(Self-verification), 병렬 탐색(Parallel Thinking)이라는 고난도 기술을 통합한 ‘수학 특화 LLM’의 정점에 가깝다. 특히 검증기(verifier)를 RL 보상 모델로 활용하는 구조는 중대형 모델에서 고난도 문제 해결 능력을 높이는 유력한 방향으로.. 2025. 11. 30. 챗GPT가 시간을 잘 못 맞추는 이유, LLM 아키텍처 관점에서 본 구조적 한계 챗GPT가 현재 시각을 틀리게 말하는 문제가 단순한 버그가 아니라, 대형언어모델(LLM) 아키텍처의 구조적 특성과 맞물린 현상이라는 점이 다시 주목받고 있다. 사용자 관점에서는 “시간도 못 맞추는 비서”로 보이지만, 기술적·산업적 차원에서는 훨씬 복잡한 맥락이 존재한다. 특히 실시간 정보와 언어 기반 추론이 결합된 시점에서, LLM이 어떤 데이터를 언제 참조해야 하는지 판단하는 문제는 엔터프라이즈 AI 도입의 핵심 이슈로 떠오르고 있다. LLM이 시간을 잘못 말하는 기술적 이유LLM이 시간을 정확히 모르는 것은 모델이 실시간 환경과 단절된 언어 시스템이기 때문이다. 이 구조는 세 가지 이유로 요약된다. 첫째, LLM은 시스템 클록에 접근하지 않는다. 일반 컴퓨터나 스마트폰은 하드웨어 시계칩을 통해 시간을.. 2025. 11. 29. 카르파시의 ‘LLM 위원회’, AI가 AI를 평가하는 시대…모델 경쟁과 개발 방식의 패러다임이 바뀐다 AI 모델이 서로를 평가하고, 그 결과를 기반으로 최종 답변까지 조율하는 시스템이 본격적으로 등장했다. 안드레이 카르파시(Andrej Karpathy)가 공개한 ‘LLM Council(대형언어모델 위원회)’는 단순한 데모 수준을 넘어, 향후 AI 모델 개발·평가·도입 전략을 재편할 가능성이 큰 기술적 의미를 지닌다. 특히 GPT-5.1, 제미나이 3 프로, 클로드 소네트 4.5, 그록-4 등 프런티어 모델이 동시에 참여해 서로의 응답을 평가하는 방식은 기존의 벤치마크와 전혀 다른 차원의 평가 생태계를 열었다. 더 나아가 카르파시가 이 시스템을 ‘주말 바이브 코딩’으로 완성했다는 사실은 기업의 SW 개발 방식에도 전략적 질문을 던진다.LLM 위원회 시스템의 핵심 기술LLM Council은 크게 세 단계의 .. 2025. 11. 28. 챗GPT 쇼핑 리서치, AI 기반 전자상거래의 새로운 경쟁 축이 열렸다 AI 쇼핑 기능의 상용화가 본격화되고 있다. 오픈AI가 공개한 ‘쇼핑 리서치(Shopping Research)’는 단순한 상품 추천 기능을 넘어 소비자의 구매 결정 전체를 AI가 수행하는 단계로의 진입을 의미한다. 이번 기능은 생성형 AI, 웹 에이전트, 실시간 정보 검색 기술이 결합해 전자상거래의 핵심인 정보 탐색·비교·의사결정 과정을 통째로 자동화한다는 점에서 전략적 의미가 매우 크다. 특히 전자제품, 홈&가전, 뷰티처럼 정보 비대칭이 큰 카테고리에서 강력한 전환율 개선이 기대되며, 이는 곧 AI 기반 커머스 시장 재편을 촉발할 가능성이 있다.쇼핑 리서치 핵심 기술 분석오픈AI 쇼핑 리서치는 세 가지 기술 축이 결합된 형태로 이해해야 한다.첫째, LLM 기반 대화형 의도 파악 기술의 고도화다. 사용자.. 2025. 11. 28. 오픈AI GPT-5.1-코덱스 맥스, 코딩 AI의 경쟁 구도를 다시 짜는 게임체인저인가 AI 코딩 에이전트 시장은 지난해부터 가파르게 성장하며 개발 생산성 전쟁의 중심에 서 있다. 구글 제미나이 3, 앤트로픽 클로드 소넷 4.5 등 주요 기업들이 고성능 모델을 잇따라 공개하는 가운데, 오픈AI가 ‘GPT-5.1-코덱스 맥스(GPT-5.1-Codex-Max)’라는 새로운 카테고리의 모델을 출시하며 경쟁 구도를 새롭게 정의하고 있다. 핵심은 단순 코드 생성이 아니라, 하루 이상 지속되는 장기 코드 작업을 견딜 수 있는 ‘지구력 기반 코딩 AI’라는 점이다.기술 핵심 분석GPT-5.1-코덱스 맥스는 기존 코딩 LLM들이 본질적으로 가진 한계를 정면으로 해결한다. 첫째, 장시간 연속 코딩 성능코딩 업무는 단발성 지침을 수행하는 챗봇과 달리, 8~24시간 이상 맥락을 유지하며 작업해야 하는 경우가 .. 2025. 11. 27. 챗GPT 음성 모드 기본 통합, 기업 AI 도입 전략의 분기점이 되는 이유 오픈AI가 챗GPT 음성 모드를 기본 기능으로 통합했다. 음성과 텍스트, 이미지·지도·문서 등 멀티모달 출력이 하나의 인터페이스에서 자연스럽게 이어지는 방식은 단순한 UI 업데이트를 넘어 대화형 AI의 사용 패러다임 자체를 바꾸는 전환점이다. 특히 한국 기업의 AI 도입 환경에서 이번 변화는 고객 접점 자동화, 사내 지식관리, 업무용 에이전트의 실사용률을 크게 끌어올릴 가능성이 높다.기술 핵심 분석이번 통합의 본질은 음성 모델이 전체 챗GPT 스택의 부가 기능이 아니라 완전한 기본 인터페이스로 승격되었다는 점이다. 이는 두 가지 기술적 변화와 맞닿아 있다.첫째, 대규모 멀티모달 모델(LLM+오디오)의 단일 아키텍처 전환이다. 오픈AI는 GPT-5 계열의 아키텍처에서 텍스트·음성·이미지를 하나의 embed.. 2025. 11. 26. 이전 1 2 3 4 5 ··· 112 다음 반응형