본문 바로가기
반응형

Development News/AI644

문샷 ‘키미-K2 싱킹’, 딥시크를 위협하는 차세대 오픈소스—훈련비 460만 달러로 만든 괴물 모델의 정체 요즘 글로벌 AI 판에서 가장 뜨거운 이름을 하나 꼽으라면, 단연 문샷(Moonshot)이다.지난주 공개된 오픈소스 모델 ‘키미-K2-싱킹(Kimi-K2-Thinking)’은 딥시크-V3를 넘어서는 성능을 보이면서도, 훈련 비용은 오히려 더 낮다는 사실이 알려지며 전 세계 개발자 커뮤니티를 제대로 흔들었다.CNBC 보도에 따르면 키미-K2의 학습 비용은 460만 달러. 딥시크-V3의 557만 달러보다 저렴하다.여기에 문샷이 사용한 GPU는 미국 규제로 더 이상 수입조차 못하는 구형 엔비디아 H800이었다. 하이엔드 H100, B200 같은 장비 없이 이 정도 성능을 뽑았다는 건 업계 판도를 흔들 만한 사건이다.문샷은 극단적인 효율을 위한 자사 기술 스택을 공개했다.• 최대 5배 효율을 끌어올린 문케이크(.. 2025. 11. 13.
오픈AI, GPT-5.1로 돌아온 ‘대화의 즐거움’ — 지능·속도·성격까지 진화한 챗GPT의 재정의 오픈AI가 한 발 물러서면서도 한 단계 더 진화한 ‘GPT-5.1’을 내놨다. 8월 출시된 GPT-5가 “너무 안전하고 차갑다”는 사용자 비판을 받은 지 석 달 만이다. 이번엔 ‘성능’보다 ‘대화 경험’이 핵심이다. GPT-5.1은 두 가지 모델로 나뉜다.‘GPT-5.1 인스턴트(Instant)’는 이름 그대로 즉각적인 응답에 집중했다. 반응 속도를 줄이면서도 문맥 이해력과 대화의 따뜻함을 강화했다.반면 ‘GPT-5.1 싱킹(Thinking)’은 고난도 추론에 최적화됐다. 쉬운 질문은 더 빠르게, 복잡한 문제는 더 오래 ‘생각’하게 설계됐다. 즉, 단순한 연산형 AI가 아니라 상황에 따라 사고 시간을 조절하는 적응형 추론 엔진으로 진화한 셈이다.흥미로운 변화는 ‘성격 시스템(personality syst.. 2025. 11. 13.
웨이브 ‘AV2.0 임바디드 AI’, 단 2% 데이터로 일본 도로를 정복하다 — 맵 기반 자율주행을 넘어선 데이터 효율의 혁명 자율주행의 본질은 ‘얼마나 많은 데이터를 갖고 있느냐’보다 ‘얼마나 잘 학습하느냐’로 옮겨가고 있다.영국의 자율주행 AI 기업 웨이브(Wayve)는 이 변화를 상징적으로 보여줬다. 최근 일본 실증 테스트에서 **‘AV2.0 임바디드 AI(Embodied AI)’**가 단 몇 달 만에 일본의 복잡한 도로 환경에 완벽히 적응하며, 기존의 지도(Map)-기반 자율주행 시스템을 넘어선 성능을 입증했다. 웨이브의 ‘AI 드라이버(Wayve AI Driver)’는 지도 없이, 단 1%의 현지 데이터로 한 달 만에 ‘제로샷(Zero-Shot)’ 초기 성능 대비 2배 향상을 달성했다. 이후 3개월 동안 2%의 데이터 추가 학습만으로 일본에 최적화된 글로벌 베이스라인 모델을 완성했다.이는 기존 자율주행 모델들이 방대한 .. 2025. 11. 12.
트랜스포머의 ‘확률’ 한계를 넘다 — AUI의 아폴로-1이 여는 행동 중심 AI 시대 대부분의 대화형 AI는 여전히 “다음에 올 단어”를 예측하는 데 머물러 있다. 그러나 실제 비즈니스 업무에서 중요한 건 문장이 아니라 행동이다. 미국 스타트업 AUI(Augmented Intelligence)가 공개한 ‘아폴로-1(Apollo-1)’은 바로 그 지점을 정면으로 파고든 모델이다. AUI는 트랜스포머(Transformers)의 확률적 구조 대신, 신경망(neural network)과 기호 논리(symbolic logic)를 결합한 ‘상태 기반 신경-기호 추론(stateful neuro-symbolic reasoning)’ 모델을 설계했다. 기존 LLM이 문맥에 따라 다음 단어를 예측한다면, 아폴로-1은 기호 상태(symbolic state)에 따라 “다음에 취할 행동(next action)”.. 2025. 11. 12.
“앤트로픽이 발표한 혁신! ‘코드 실행 기반 MCP’로 AI 에이전트 비용·지연 대폭 줄인다” 서론최근 AI 생태계에서 주목받는 키워드 중 하나는 바로 Model Context Protocol(이하 MCP)이었습니다. 이 MCP는 Anthropic이 2024년 11월 공개한 오픈 표준으로, AI 에이전트들이 외부 도구·데이터소스와 연결되는 방식을 혁신하려는 시도입니다. 그런데 최근 앤트로픽이 MCP를 도구 호출(tool-call) 방식 대신 코드 실행(code-execution) 방식으로 전환하는 패턴을 제시했어요. 기사에 따르면 이 덕분에 토큰 비용이 수십배 줄고 워크플로우의 효율이 대폭 향상되었다고 합니다.학생님(당신)이 AI, 자동화, 또는 소프트웨어 엔지니어링 과제를 한다면 — 이 변화는 꽤 중요하고 직결될 수 있어요. 왜냐하면 ‘에이전트 + 외부 도구’ 형태의 자동화 시스템에서 비용·지연.. 2025. 11. 11.
구글 Gemini File Search – “RAG 구축이 한 줄로 끝나는 시대” RAG(Retrieval-Augmented Generation) 시스템을 직접 구축해본 개발자라면, 그 복잡함을 잘 알 거야.문서 청킹, 임베딩 생성, 벡터DB 세팅, 쿼리 튜닝까지 — 전부 손이 많이 가지.그런데 구글이 이번에 진짜 미쳤다.Gemini API에 ‘File Search Tool’이 추가되면서 RAG 파이프라인 전체가 코드 한 줄로 끝나버렸다.1. File Search: “RAG를 그냥 API로 불러오기”기존 방식에서는 RAG를 구성하려면 다음 단계를 직접 구현해야 했지.문서를 청킹임베딩 모델로 벡터화벡터 데이터베이스에 저장검색 쿼리 시 관련 문서를 찾아 모델 입력에 주입File Search는 이 전 과정을 자동으로 처리한다.파일을 업로드하면→ 자동 청킹→ Gemini Embedding 모.. 2025. 11. 10.
반응형