본문 바로가기
반응형

전체 글1895

딥시크의 ‘IMO 금메달 수학 모델’ 오픈소스 공개, AI 추론 경쟁의 새로운 전환점 딥시크가 국제수학올림피아드(IMO) 금메달 수준 성능을 달성한 ‘DeepSeekMath-V2’를 오픈 소스로 공개했다. 이는 오픈AI·구글에 이어 세 번째 IMO 금메달 모델이며, 그 중 유일하게 전체 모델을 공개한 사례다. 단순한 기술 성과를 넘어, AI 수학 추론의 새로운 패러다임을 상업적으로 누구나 활용할 수 있는 수준으로 개방했다는 점에서 산업·학술 생태계 모두에 큰 충격을 주고 있다.이번 모델은 강화학습(RL), 자체 검증(Self-verification), 병렬 탐색(Parallel Thinking)이라는 고난도 기술을 통합한 ‘수학 특화 LLM’의 정점에 가깝다. 특히 검증기(verifier)를 RL 보상 모델로 활용하는 구조는 중대형 모델에서 고난도 문제 해결 능력을 높이는 유력한 방향으로.. 2025. 11. 30.
챗GPT가 시간을 잘 못 맞추는 이유, LLM 아키텍처 관점에서 본 구조적 한계 챗GPT가 현재 시각을 틀리게 말하는 문제가 단순한 버그가 아니라, 대형언어모델(LLM) 아키텍처의 구조적 특성과 맞물린 현상이라는 점이 다시 주목받고 있다. 사용자 관점에서는 “시간도 못 맞추는 비서”로 보이지만, 기술적·산업적 차원에서는 훨씬 복잡한 맥락이 존재한다. 특히 실시간 정보와 언어 기반 추론이 결합된 시점에서, LLM이 어떤 데이터를 언제 참조해야 하는지 판단하는 문제는 엔터프라이즈 AI 도입의 핵심 이슈로 떠오르고 있다. LLM이 시간을 잘못 말하는 기술적 이유LLM이 시간을 정확히 모르는 것은 모델이 실시간 환경과 단절된 언어 시스템이기 때문이다. 이 구조는 세 가지 이유로 요약된다. 첫째, LLM은 시스템 클록에 접근하지 않는다. 일반 컴퓨터나 스마트폰은 하드웨어 시계칩을 통해 시간을.. 2025. 11. 29.
카르파시의 ‘LLM 위원회’, AI가 AI를 평가하는 시대…모델 경쟁과 개발 방식의 패러다임이 바뀐다 AI 모델이 서로를 평가하고, 그 결과를 기반으로 최종 답변까지 조율하는 시스템이 본격적으로 등장했다. 안드레이 카르파시(Andrej Karpathy)가 공개한 ‘LLM Council(대형언어모델 위원회)’는 단순한 데모 수준을 넘어, 향후 AI 모델 개발·평가·도입 전략을 재편할 가능성이 큰 기술적 의미를 지닌다. 특히 GPT-5.1, 제미나이 3 프로, 클로드 소네트 4.5, 그록-4 등 프런티어 모델이 동시에 참여해 서로의 응답을 평가하는 방식은 기존의 벤치마크와 전혀 다른 차원의 평가 생태계를 열었다. 더 나아가 카르파시가 이 시스템을 ‘주말 바이브 코딩’으로 완성했다는 사실은 기업의 SW 개발 방식에도 전략적 질문을 던진다.LLM 위원회 시스템의 핵심 기술LLM Council은 크게 세 단계의 .. 2025. 11. 28.
챗GPT 쇼핑 리서치, AI 기반 전자상거래의 새로운 경쟁 축이 열렸다 AI 쇼핑 기능의 상용화가 본격화되고 있다. 오픈AI가 공개한 ‘쇼핑 리서치(Shopping Research)’는 단순한 상품 추천 기능을 넘어 소비자의 구매 결정 전체를 AI가 수행하는 단계로의 진입을 의미한다. 이번 기능은 생성형 AI, 웹 에이전트, 실시간 정보 검색 기술이 결합해 전자상거래의 핵심인 정보 탐색·비교·의사결정 과정을 통째로 자동화한다는 점에서 전략적 의미가 매우 크다. 특히 전자제품, 홈&가전, 뷰티처럼 정보 비대칭이 큰 카테고리에서 강력한 전환율 개선이 기대되며, 이는 곧 AI 기반 커머스 시장 재편을 촉발할 가능성이 있다.쇼핑 리서치 핵심 기술 분석오픈AI 쇼핑 리서치는 세 가지 기술 축이 결합된 형태로 이해해야 한다.첫째, LLM 기반 대화형 의도 파악 기술의 고도화다. 사용자.. 2025. 11. 28.
MIT 아이스버그 지수, 지금의 AI만으로도 노동력 11.7% 대체 가능…기업은 얼마나 대비되어 있는가 MIT와 오크리지국립연구소(ORNL)가 발표한 ‘아이스버그 지수(Iceberg Index)’는 생성형 AI가 노동시장에 미치는 영향을 정량적으로 제시한 첫 시뮬레이션 기반 분석이다. 특히 이번 분석은 특정 산업의 해고 사례처럼 표면적으로 드러나는 영향만을 측정한 것이 아니라, 미국 전체 노동자 1억5100만명을 디지털 트윈으로 모델링해 AI로 대체 가능한 ‘실제 기술·업무 단위’를 평가했다는 점에서 중요성이 매우 크다. AI 자동화가 기술 기업에서만 일어나는 것이 아니라, 기존에는 저위험군으로 분류되던 인사·사무·재무·물류까지 전방위적으로 확산되고 있다는 점이 드러났다.기술 핵심 분석아이스버그 지수의 핵심은 직무(Job)가 아니라 업무(Task)와 기술(Skill)을 AI 수행 가능성으로 세분화한 점이다.. 2025. 11. 28.
Git 3.0, 기본 브랜치를 ‘main’으로 전환한다 Git 3.0에서 드디어 새로운 기본 브랜치 이름이 적용된다. 앞으로는 새 저장소를 생성할 때 별도의 설정 없이도 기본 브랜치가 자동으로 main으로 설정된다. 이는 Git 커뮤니티에서 오랫동안 논의돼 온 변화로, 2020년 이후 주요 플랫폼과 도구 생태계가 이미 같은 방향으로 움직여 왔다.Git 2.52에 포함된 변화이번 주에 공개된 Git 2.52 릴리스 노트에는 다음과 같은 문구가 포함되었다.“Git 3.0부터 별도 설정이 없는 git init 명령은 기본 브랜치로 ‘master’가 아닌 ‘main’을 사용한다.”단 한 줄의 문장이지만, Git 초기화 동작의 기본값이 바뀌는 것은 사용성과 문화적 맥락 모두에서 중요한 전환점이다.배경: 왜 ‘main’인가?2020년 6월, Git 프로젝트를 관리하는 .. 2025. 11. 27.
[##_revenu_]()