본문 바로가기
반응형

전체 글2007

구글 Gemini File Search – “RAG 구축이 한 줄로 끝나는 시대” RAG(Retrieval-Augmented Generation) 시스템을 직접 구축해본 개발자라면, 그 복잡함을 잘 알 거야.문서 청킹, 임베딩 생성, 벡터DB 세팅, 쿼리 튜닝까지 — 전부 손이 많이 가지.그런데 구글이 이번에 진짜 미쳤다.Gemini API에 ‘File Search Tool’이 추가되면서 RAG 파이프라인 전체가 코드 한 줄로 끝나버렸다.1. File Search: “RAG를 그냥 API로 불러오기”기존 방식에서는 RAG를 구성하려면 다음 단계를 직접 구현해야 했지.문서를 청킹임베딩 모델로 벡터화벡터 데이터베이스에 저장검색 쿼리 시 관련 문서를 찾아 모델 입력에 주입File Search는 이 전 과정을 자동으로 처리한다.파일을 업로드하면→ 자동 청킹→ Gemini Embedding 모.. 2025. 11. 10.
AI에게 ‘시니어 엔지니어의 사고방식’을 심어주는 실전 세팅 가이드 ⚙️ 기본 세팅 구조AI를 3계층으로 나누는 게 핵심이야.Research Layer (조사·분석)Planning Layer (설계·결정)Review Layer (검증·개선)각 계층을 에이전트 단위로 분리해서, AI가 서로 다른 역할을 수행하면서 협력하도록 만든다.결국 네 코드 흐름은 이렇게 변해:👉 “나 → AI → AI끼리 상호검증 → 최종 코드”🧩 1단계: Research Layer 세팅 (정보 수집 자동화)A. @bug-research-agent역할: 버그 재현 + 로그 분석사용 툴: ChatGPT / Claude Code추천 프롬프트: Reproduce this bug using the logs below.Don’t fix it. Just gather:- steps to reproduce- s.. 2025. 11. 10.
“AI를 시니어 엔지니어처럼 가르치는 8가지 전략” 요약 및 핵심 인사이트 AI 코딩 어시스턴트를 진짜 잘 쓰는 개발자들은 공통점이 하나 있다.“코드부터 안 친다.”그들은 먼저 AI에게 사고 과정을 훈련시킨다.즉, 문제를 정의하고, 원인을 분석하고, 설계 방향을 제시하도록 AI를 리드한다.이 과정을 통해 AI는 단순한 자동화 도구에서 “생각하는 엔지니어”로 성장한다.이 글에서 소개된 8가지 전략은 그 사고를 시스템화한 방식이다.AI가 네 코드베이스, 네 패턴, 네 습관까지 배워서 “너처럼 일하는 AI”로 진화하게 만드는 과정.1. Reproduce and document (재현하고 문서화하라)무조건 AI에게 먼저 버그를 재현하게 시켜라.“Reproduce this bug. Don’t fix it.”이 한 줄로 AI는 네가 놓칠 수 있는 로그, 재현 경로, 실패 원인을 잡는다.예.. 2025. 11. 10.
ETRI가 만든 ‘신뢰형 AI 코드 생성기술’ — 이제 AI가 코드 품질까지 챙긴다C/C++부터 시작된 코드 혁명, 개발자가 진짜 안심할 수 있는 AI 코딩의 시대 AI가 코드를 써주는 시대, 이제는 너무 익숙하죠.“로그인 기능 만들어줘”, “CSV 파일 읽고 처리해줘” 이런 프롬프트 한 줄이면진짜 돌아가는 코드를 몇 초 만에 만들어주니까요.근데 실제로 써본 개발자라면 알 거예요.AI가 만든 코드가 작동은 되는데, 믿음은 안 간다는 거.보안이 구멍 나있거나, 예외처리 없이 바로 죽고, 유지보수도 난리 나는 경우가 많았죠.그런데 이번에 한국전자통신연구원(ETRI)이 내놓은 기술이 이 판을 통째로 흔들어버렸습니다.바로 **‘LLM 기반 신뢰형 코드 생성기술’**이에요.이건 단순히 “코드를 잘 만든다”가 아니라,“개발자의 의도 + 보안성 + 성능 + 유지보수성”까지 고려하는 AI 코더를 만든 거예요.AI가 개발자의 마음까지 읽는다?ETRI가 만든 모델은 단순한 코드 자동.. 2025. 11. 10.
TPU vs NPU, 진짜 뭐가 다를까?AI 칩 전쟁의 핵심을 한 번에 정리해본다 요즘 스마트폰이나 전기차 스펙 보면 “NPU 탑재” “온디바이스 AI 연산” 이런 말 진짜 자주 보이지?한편 구글 쪽에서는 “TPU로 모델 훈련 가속화!” 이런 얘기를 한다.근데 둘 다 “AI용 칩”이라는데, 도대체 뭐가 다른 건지 감이 안 잡히는 사람들 많을 걸.오늘은 이 둘의 차이를 진짜 ‘개발자 시점’에서 딱 정리해줄게.TPU란?구글이 직접 만든 Tensor Processing Unit의 줄임말로,말 그대로 “텐서 연산”에 특화된 AI 전용 칩이야.이건 대규모 데이터센터에서 딥러닝 모델을 학습시키기 위한 괴물급 하드웨어라고 보면 된다.특징 몇 가지 찍어보면,TensorFlow 프레임워크에 최적화수천 개의 연산을 동시에 처리하는 ‘시스톨릭 어레이(Systolic Array)’ 구조초당 수백조 번의 곱.. 2025. 11. 10.
샤오펑 ‘인간설’ 로봇, 진짜 충격적인 기술력의 정체휴머노이드가 인간처럼 걸을 수 있었던 이유를 개발자 시점에서 뜯어본다 요즘 AI 업계에서 샤오펑(XPENG) 이름이 심상치 않다. 중국 전기차 회사로 알려져 있지만, 이번 ‘AI 데이’에서 공개한 휴머노이드 로봇 ‘아이언(Iron)’은 그냥 로봇이 아니라, 진짜 “사람인 줄” 알았다는 말이 나올 정도였다. 그 결과 ‘사람이 들어가 있는 거 아니냐’는 루머까지 돌았고, CEO가 직접 지퍼를 열어 내부 기계 구조를 공개하는 상황까지 갔다. 그런데 진짜 포인트는 여기 있다. “왜 사람처럼 움직일 수 있었는가?” 아이언의 핵심: 82자유도와 VLA 모델아이언은 82개의 자유도(Degree of Freedom)를 갖고 있다. 이건 인간 근육의 세밀한 움직임을 모사하기 위한 수준의 정밀 제어를 의미한다. 단순히 모터를 많이 달았다는 얘기가 아니라, 각 관절의 회전, 저항, 가속도까지.. 2025. 11. 10.
반응형