반응형 전체 글1692 MS와 칭화대학교, 트랜스포머 성능 개선하는 새로운 LLM 아키텍처 ‘차등 트랜스포머’ 공개! 마이크로소프트(MS)와 칭화대학교의 연구진이 트랜스포머 아키텍처의 성능을 개선하는 새로운 대형 언어 모델(LLM) 아키텍처인 차등 트랜스포머(Diff Transformer)를 발표했습니다. ( github 소스 오픈 )이 새로운 모델은 긴 컨텍스트 정보를 더 잘 활용할 수 있도록 설계되어, 기존 트랜스포머의 한계를 극복하고자 합니다.이번 발표는 LLM의 발전에 중요한 이정표가 될 것으로 기대됩니다.트랜스포머 아키텍처의 한계트랜스포머 아키텍처는 대부분의 LLM의 기반이 되지만, 긴 입력 컨텍스트에서 중요한 정보를 효과적으로 찾아내기 어려운 문제를 가지고 있습니다. 연구에 따르면, 트랜스포머는 특히 긴 컨텍스트의 중간에 있는 정보를 제대로 활용하지 못해 성능이 저하되는 경향이 있습니다.어텐션 메커니즘의 문제.. 2024. 10. 19. 엔비디아, 오픈AI와 앤트로픽을 뛰어넘는 LLM 공개! AI 모델 생태계의 판도를 바꿀까? AI 기술의 발전 속도는 상상 이상입니다.이번에는 엔비디아가 오픈AI와 앤트로픽을 제치고 최신 대형 언어 모델(LLM)을 공개하며 AI 모델 경쟁에 뛰어들었습니다.라마 3.1-네모트론-70B-인스트럭트(Llama-3.1-Nemotron-70B-Instruct)라는 모델은 이미 여러 벤치마크에서 최고의 성능을 기록하며, 엔비디아의 야심을 드러내고 있습니다.과연 이 모델이 AI 생태계에 미칠 영향은 무엇인지, 그 배경과 특징을 살펴보겠습니다. 엔비디아는 이번 달 초 대형 멀티모달 모델(LMM)을 발표한 이후, 추가로 LLM을 출시하며 모델 경쟁을 본격적으로 선언했습니다.이 모델은 허깅페이스를 통해 무료로 제공되며, 누구나 엔비디아의 전용 플랫폼에서 사용해 볼 수 있습니다.특히, 인간 피드백을 통한 강화 학습.. 2024. 10. 19. 100억 매개변수 최초의 분산형 모델 훈련! 오픈 소스 AGI의 새로운 시작! AI 기술이 날로 발전하면서, 우리는 더 크고 강력한 모델의 등장을 기대하고 있습니다.그중에서도 프라임 인텔렉트가 발표한 인텔렉트-1(INTELLECT-1)은 획기적인 변화를 가져올 전망입니다.이번 모델은 100억 개의 매개변수를 갖춘 최초의 분산형 대형 언어 모델(LLM)로, 누구나 컴퓨팅 자원을 제공하고 참여할 수 있는 오픈 소스 AI 개발의 시작을 알리고 있습니다.과연 이 새로운 모델이 AI 분야에 어떤 영향을 미칠지, 그리고 어떻게 혁신적인 협력을 통해 분산형 훈련이 가능해졌는지 알아보겠습니다. 전통적인 AI 모델은 대개 중앙 집중화된 단일 컴퓨팅 클러스터에서 훈련됩니다.하지만 프라임 인텔렉트는 분산형 학습 방식을 통해 100억 매개변수 모델의 학습을 가능하게 했습니다.이 방식은 전 세계의 개별 .. 2024. 10. 19. GPT-4보다 12배 빠른 AI 모델 등장! 게임 체인저 AI 에이전트, 이제 당신의 업무를 혁신한다! 오늘날 AI 기술은 빠르게 발전하고 있습니다. GPT-4와 같은 대형 언어 모델이 주목받는 가운데, 새로운 도전자가 등장했습니다.AI 스타트업 카타네모(Cataneo)는 기존 AI 모델보다 12배 더 빠른 AI 에이전트 모델을 공개하며, 새로운 혁신을 예고했습니다.이번에 발표된 아치-함수(Arch-Function) 모델은 특히 함수 호출 속도가 놀랍도록 빨라 기존 GPT-4보다 더 경제적이고 효율적입니다.그렇다면 이 모델이 왜 주목받고 있는지, 그리고 이 AI 기술이 어떤 변화를 가져올지 알아보겠습니다.카타네모는 AI 에이전트 구축에 최적화된 아치-함수 모델을 오픈 소스로 공개했습니다.이 모델은 함수 호출에 특화되어 있어 기존의 GPT-4보다 12배 빠른 처리 속도를 자랑합니다.예를 들어, 아치-함수-3.. 2024. 10. 19. 오픈AI, 윈도우용 '챗GPT' 앱 출시…사용 편리성 대폭 향상 1. 앱 출시 배경 및 주요 기능오픈AI는 2024년 10월 18일, 챗GPT를 윈도우용 앱 버전으로 출시했습니다.기존 웹 브라우저를 통한 접속 방식에서 벗어나, 이제 윈도우 10 이상 사용자들은 마이크로소프트 스토어에서 앱을 다운받아 간편하게 챗GPT를 사용할 수 있게 되었습니다.이 앱은 우선 유료 사용자(플러스, 팀, 엔터프라이즈, 에듀)를 대상으로 제공되며, 무료 사용자용 정식 버전은 올해 말 출시될 예정입니다.주요 기능키보드 단축키(Alt + 스페이스)를 통해 빠르게 접속다른 앱과 함께 사용 가능: 챗GPT 창의 크기를 줄여 작업 중에도 한쪽 구석에 띄워두고 사용할 수 있음파일 및 이미지 업로드 기능 지원: PC에 저장된 자료를 챗GPT와 쉽게 공유 가능이미지 생성 기능: 챗GPT에 포함된 '달리.. 2024. 10. 19. 뜨거워지는 엔비디아 블랙웰 칩, 액체 냉각으로 해결! 서버 업계의 새로운 경쟁 구도 최근 AI 산업의 급속한 성장과 함께 엔비디아의 차세대 AI 가속기인 '블랙웰'의 출하가 다가오고 있습니다.블랙웰은 이전 세대보다 성능이 크게 향상된 만큼 발열 문제도 심화되고 있는데, 이를 해결하기 위한 새로운 솔루션으로 ‘액체 냉각 시스템’이 각광받고 있습니다.델, 레노버, 슈퍼마이크로 같은 주요 서버 기업들은 이러한 수랭식 기술을 적용한 신제품을 연달아 공개하며 치열한 경쟁을 예고하고 있습니다.이번 글에서는 액체 냉각 기술의 도입 배경과 그 효과, 그리고 앞으로의 시장 변화에 대해 알아보겠습니다. 엔비디아의 차세대 AI 가속기 블랙웰이 출하를 앞둔 가운데, 서버 업계에서는 발열 문제를 효율적으로 제어할 수 있는 새로운 냉각 방식 도입이 필수로 대두되고 있습니다.기존의 공랭식 냉각 방식은 서버 내부의.. 2024. 10. 19. 이전 1 ··· 81 82 83 84 85 86 87 ··· 282 다음 반응형