반응형 Development News/AI642 웨이브 ‘AV2.0 임바디드 AI’, 단 2% 데이터로 일본 도로를 정복하다 — 맵 기반 자율주행을 넘어선 데이터 효율의 혁명 자율주행의 본질은 ‘얼마나 많은 데이터를 갖고 있느냐’보다 ‘얼마나 잘 학습하느냐’로 옮겨가고 있다.영국의 자율주행 AI 기업 웨이브(Wayve)는 이 변화를 상징적으로 보여줬다. 최근 일본 실증 테스트에서 **‘AV2.0 임바디드 AI(Embodied AI)’**가 단 몇 달 만에 일본의 복잡한 도로 환경에 완벽히 적응하며, 기존의 지도(Map)-기반 자율주행 시스템을 넘어선 성능을 입증했다. 웨이브의 ‘AI 드라이버(Wayve AI Driver)’는 지도 없이, 단 1%의 현지 데이터로 한 달 만에 ‘제로샷(Zero-Shot)’ 초기 성능 대비 2배 향상을 달성했다. 이후 3개월 동안 2%의 데이터 추가 학습만으로 일본에 최적화된 글로벌 베이스라인 모델을 완성했다.이는 기존 자율주행 모델들이 방대한 .. 2025. 11. 12. 트랜스포머의 ‘확률’ 한계를 넘다 — AUI의 아폴로-1이 여는 행동 중심 AI 시대 대부분의 대화형 AI는 여전히 “다음에 올 단어”를 예측하는 데 머물러 있다. 그러나 실제 비즈니스 업무에서 중요한 건 문장이 아니라 행동이다. 미국 스타트업 AUI(Augmented Intelligence)가 공개한 ‘아폴로-1(Apollo-1)’은 바로 그 지점을 정면으로 파고든 모델이다. AUI는 트랜스포머(Transformers)의 확률적 구조 대신, 신경망(neural network)과 기호 논리(symbolic logic)를 결합한 ‘상태 기반 신경-기호 추론(stateful neuro-symbolic reasoning)’ 모델을 설계했다. 기존 LLM이 문맥에 따라 다음 단어를 예측한다면, 아폴로-1은 기호 상태(symbolic state)에 따라 “다음에 취할 행동(next action)”.. 2025. 11. 12. “앤트로픽이 발표한 혁신! ‘코드 실행 기반 MCP’로 AI 에이전트 비용·지연 대폭 줄인다” 서론최근 AI 생태계에서 주목받는 키워드 중 하나는 바로 Model Context Protocol(이하 MCP)이었습니다. 이 MCP는 Anthropic이 2024년 11월 공개한 오픈 표준으로, AI 에이전트들이 외부 도구·데이터소스와 연결되는 방식을 혁신하려는 시도입니다. 그런데 최근 앤트로픽이 MCP를 도구 호출(tool-call) 방식 대신 코드 실행(code-execution) 방식으로 전환하는 패턴을 제시했어요. 기사에 따르면 이 덕분에 토큰 비용이 수십배 줄고 워크플로우의 효율이 대폭 향상되었다고 합니다.학생님(당신)이 AI, 자동화, 또는 소프트웨어 엔지니어링 과제를 한다면 — 이 변화는 꽤 중요하고 직결될 수 있어요. 왜냐하면 ‘에이전트 + 외부 도구’ 형태의 자동화 시스템에서 비용·지연.. 2025. 11. 11. 구글 Gemini File Search – “RAG 구축이 한 줄로 끝나는 시대” RAG(Retrieval-Augmented Generation) 시스템을 직접 구축해본 개발자라면, 그 복잡함을 잘 알 거야.문서 청킹, 임베딩 생성, 벡터DB 세팅, 쿼리 튜닝까지 — 전부 손이 많이 가지.그런데 구글이 이번에 진짜 미쳤다.Gemini API에 ‘File Search Tool’이 추가되면서 RAG 파이프라인 전체가 코드 한 줄로 끝나버렸다.1. File Search: “RAG를 그냥 API로 불러오기”기존 방식에서는 RAG를 구성하려면 다음 단계를 직접 구현해야 했지.문서를 청킹임베딩 모델로 벡터화벡터 데이터베이스에 저장검색 쿼리 시 관련 문서를 찾아 모델 입력에 주입File Search는 이 전 과정을 자동으로 처리한다.파일을 업로드하면→ 자동 청킹→ Gemini Embedding 모.. 2025. 11. 10. ETRI가 만든 ‘신뢰형 AI 코드 생성기술’ — 이제 AI가 코드 품질까지 챙긴다C/C++부터 시작된 코드 혁명, 개발자가 진짜 안심할 수 있는 AI 코딩의 시대 AI가 코드를 써주는 시대, 이제는 너무 익숙하죠.“로그인 기능 만들어줘”, “CSV 파일 읽고 처리해줘” 이런 프롬프트 한 줄이면진짜 돌아가는 코드를 몇 초 만에 만들어주니까요.근데 실제로 써본 개발자라면 알 거예요.AI가 만든 코드가 작동은 되는데, 믿음은 안 간다는 거.보안이 구멍 나있거나, 예외처리 없이 바로 죽고, 유지보수도 난리 나는 경우가 많았죠.그런데 이번에 한국전자통신연구원(ETRI)이 내놓은 기술이 이 판을 통째로 흔들어버렸습니다.바로 **‘LLM 기반 신뢰형 코드 생성기술’**이에요.이건 단순히 “코드를 잘 만든다”가 아니라,“개발자의 의도 + 보안성 + 성능 + 유지보수성”까지 고려하는 AI 코더를 만든 거예요.AI가 개발자의 마음까지 읽는다?ETRI가 만든 모델은 단순한 코드 자동.. 2025. 11. 10. TPU vs NPU, 진짜 뭐가 다를까?AI 칩 전쟁의 핵심을 한 번에 정리해본다 요즘 스마트폰이나 전기차 스펙 보면 “NPU 탑재” “온디바이스 AI 연산” 이런 말 진짜 자주 보이지?한편 구글 쪽에서는 “TPU로 모델 훈련 가속화!” 이런 얘기를 한다.근데 둘 다 “AI용 칩”이라는데, 도대체 뭐가 다른 건지 감이 안 잡히는 사람들 많을 걸.오늘은 이 둘의 차이를 진짜 ‘개발자 시점’에서 딱 정리해줄게.TPU란?구글이 직접 만든 Tensor Processing Unit의 줄임말로,말 그대로 “텐서 연산”에 특화된 AI 전용 칩이야.이건 대규모 데이터센터에서 딥러닝 모델을 학습시키기 위한 괴물급 하드웨어라고 보면 된다.특징 몇 가지 찍어보면,TensorFlow 프레임워크에 최적화수천 개의 연산을 동시에 처리하는 ‘시스톨릭 어레이(Systolic Array)’ 구조초당 수백조 번의 곱.. 2025. 11. 10. 이전 1 2 3 4 ··· 107 다음 반응형