728x90 반응형 AI기술116 구글, "지식 증류와 합성 데이터로 LLM 추론 향상 가능" 테스트-타임 컴퓨트와 합성 데이터가 AI 모델의 새로운 길을 열다 AI 모델의 발전이 점차 느려지고 있다는 우려가 제기되는 가운데, 구글과 딥마인드가 새로운 해법으로 주목받고 있습니다.바로 지식 증류(Knowledge Distillation)와 테스트-타임 컴퓨트(Test-Time Compute)를 활용한 합성 데이터 생성입니다.이 접근법은 기존 데이터 고갈 문제를 해결하고, AI 모델의 추론 성능을 향상하는 데 중요한 역할을 할 것으로 기대됩니다. 1. 지식 증류란 무엇인가?지식 증류는 큰 교사 모델(Teacher Model)이 생성한 데이터를 기반으로 작은 학생 모델(Student Model)을 훈련시키는 기법입니다.이 과정에서 합성 데이터가 생성되며, 이는 AI 모델의 학습에 활용됩니다.특히, 합성.. 2025. 1. 12. AI의 다음 전장, 휴머노이드 로봇: 테슬라와 엔비디아가 주도하는 미래 기술 경쟁 인공지능(AI)의 혁신이 챗GPT로 시작되었다면, 이제 그 다음 격전지는 '휴머노이드 로봇'입니다. 올해 CES 2025에서 엔비디아의 젠슨 황 CEO가 14대의 휴머노이드 로봇과 함께 등장하며 이 흐름을 상징적으로 보여주었습니다. 전통적인 로봇 기술의 한계를 뛰어넘어, 자율주행 기술과 AI를 융합한 인간형 로봇들이 산업의 미래를 이끌어갈 것입니다. 이번 포스트에서는 주요 기업들의 전략과 기술, 그리고 이로 인한 글로벌 경쟁의 흐름을 심층적으로 살펴보겠습니다.휴머노이드 기술의 현재와 미래1. 빅테크의 격돌: 테슬라와 엔비디아테슬라는 이미 2021년 휴머노이드 로봇 ‘옵티머스’ 개발 계획을 발표하며 이 시장에 뛰어들었습니다. 옵티머스는 인간처럼 학습과 추론을 통해 복잡한 작업을 수행할 수 있는 능력을 갖추.. 2025. 1. 12. MS, 세계 최강 AI 슈퍼컴 'NV링크 72' 첫 공개! 오픈AI, GPT-5 업그레이드 기대감 상승 마이크로소프트(MS)가 세계 최고의 AI 슈퍼컴퓨터로 불리는 엔비디아의 'NV링크 72' 클러스터를 애저(Azure) 서비스에 적용하며, 인공지능(AI) 업계에 또 한 번의 큰 반향을 일으켰습니다.이번 발표는 CES에서 엔비디아 젠슨 황 CEO가 공개한 지 몇 시간 만에 MS 사티아 나델라 CEO가 직접 확인하며 더욱 주목받고 있습니다.이 슈퍼컴퓨터의 등장은 오픈AI의 GPT-5 성능 개선에도 큰 영향을 미칠 것으로 예상되는데요.과연 이번 기술의 핵심은 무엇이고, 앞으로 어떤 변화를 가져올지 살펴보겠습니다.1. NV링크 72 클러스터: 블랙웰 서버의 기술적 진화NV링크 72는 엔비디아가 선보인 블랙웰 기반 'GB200' 서버의 최신 네트워킹 기술입니다.압도적 성능:72개의 블랙웰 GPU와 36개의 그레이.. 2025. 1. 10. 26년 된 펜티엄 2 PC로 ‘라마’ 구동 성공! 고급 GPU 없이 대형언어모델을 구동하는 비결 26년 된 고전적인 펜티엄 2 PC에서 대형언어모델(LLM)을 구동하는 일이 가능하다고 믿어지시나요?2024년 12월, 스타트업 EXO는 1998년 출시된 펜티엄 2 컴퓨터에서 '라마(Llama)'라는 대형언어모델을 실행하는 데 성공했다고 발표했습니다. 이 놀라운 성과는 단순히 오래된 컴퓨터에서 새로운 기술을 구동했다는 사실에 그치지 않습니다.고가의 GPU 없이도 누구나 대형언어모델을 사용할 수 있다는 가능성을 보여주고 있습니다.많은 사람들이 현재 고성능 컴퓨터를 통해 LLM을 사용할 수 있다고 생각하지만, 이번 프로젝트는 그 한계를 뛰어넘은 획기적인 실험으로 주목을 받고 있습니다.과연, 이 26년 된 컴퓨터에서 어떻게 최신 기술을 구현할 수 있었을까요?EXO는 이베이에서 118.88파운드, 약 22만원.. 2024. 12. 31. IBM, 그라나이트 3.1 출시! 강력한 성능과 확장성, 다국어 지원까지... 기업용 AI의 새로운 패러다임 최근 IBM이 기업용 인공지능(AI) 솔루션 시장에서 새로운 언어 모델인 그라나이트 3.1(Granite 3.1)을 오픈소스로 공개했습니다.이번 모델은 이전 버전인 그라나이트 3.0에서 성능과 기능이 대폭 향상된 모델로, 기업 환경에 적합한 다양한 기능을 탑재하고 있습니다.특히, 128K의 컨텍스트 길이 확장과 다국어 지원 등의 주요 기능들이 더해져, IBM 왓슨x.ai(Watsonx.ai) 플랫폼을 통해 기업들이 더욱 효율적으로 AI 기술을 활용할 수 있게 되었습니다.이번 블로그에서는 그라나이트 3.1의 주요 특징과 기업 환경에서의 활용 가능성, 그리고 그로 인한 산업 변화를 분석해보겠습니다.1. 128K 컨텍스트 길이 확장그라나이트 3.1의 가장 큰 특징 중 하나는 128K의 확장된 컨텍스트 길이입니.. 2024. 12. 28. 딥시크, 오픈 소스 사상 최대 규모 LLM 출시…GPT-4o를 따라 잡았다? 2024년 12월 27일, 전 세계 AI 업계에 큰 변화를 일으킬 만한 소식이 전해졌습니다.중국의 AI 스타트업인 딥시크(DeepSeek)가 딥시크-V3(DeepSeek-V3)라는 대형 언어 모델을 발표하며 그 성능을 극대화한 오픈 소스 AI 모델을 공개했습니다.이번에 공개된 딥시크-V3는 기존의 오픈 소스 모델들을 훨씬 능가하는 성능을 자랑하며, 심지어 OpenAI의 GPT-4o보다도 뛰어나다는 주장을 펼쳤습니다.이 모델은 6710억 개의 매개변수를 가지고 있으며, 현재까지 발표된 오픈 소스 대형언어모델 중 가장 큰 규모를 자랑합니다.이번 블로그에서는 딥시크-V3가 어떤 혁신적인 기술을 사용하여 AI 모델의 새로운 이정표를 세운 것인지, 그리고 그 기술적 혁신이 어떤 영향을 미칠지에 대해 자세히 살펴보.. 2024. 12. 28. 이전 1 2 3 4 ··· 20 다음 728x90 반응형