반응형 icml20251 MIT의 '테스트-타임 학습'으로 LLM 추론 능력 6배 향상! 복잡한 문제 해결의 새로운 지평 LLM의 한계를 뛰어넘는 혁신적 학습 기술"대형언어모델(LLM)이 의료 진단, 공급망 관리 같은 복잡한 추론 문제에도 강해진다?"MIT 연구진이 개발한 '테스트-타임 학습(Test-time training)' 기술이 LLM의 복잡한 추론 능력을 6배 향상시켰습니다. 이 기술은 모델이 배포 후에도 실시간으로 학습해 낯선 문제에 적응할 수 있도록 합니다.테스트-타임 학습이란?기존 LLM은 맥락 내 학습(in-context learning)에 의존해 새 작업을 처리했지만, 논리적 추론이 필요한 문제에서는 한계가 있었습니다. MIT의 접근법은 다음과 같습니다.소량의 새 데이터로 모델 매개변수 일부를 실시간 업데이트.저랭크 적응(Low-Rank Adaptation) 기술 적용: 전체 모델 재학습.. 2025. 7. 15. 이전 1 다음 반응형