본문 바로가기
반응형

AI모델50

샘 알트먼, 실수로 차기 AI 모델 ‘o2’ 힌트 공개… “벤치마크서 역대급 성능” 오픈AI의 CEO인 샘 알트먼이 차기 AI 모델에 대한 중요한 힌트를 실수로 공개해 화제가 되고 있습니다.알트먼은 최근 X(트위터)에 ‘o2’라는 모델명을 언급하며, 이 모델이 AI 성능 벤치마크인 GPQA에서 역대급 성능을 기록했다고 밝혔습니다.하지만 곧 이 글을 삭제하며 "실수였다"고 해명했으나, 이미 많은 이들이 이 정보를 주목하고 있습니다.이번 실수는 AI 기술의 발전과 차기 모델에 대한 기대감을 더욱 증대시키고 있습니다. 샘 알트먼 CEO는 3일, 자신의 X(트위터) 계정에 "o2가 GPQA에서 105%의 점수를 달성했다"는 글을 게시했으나, 이를 몇 분 후 삭제하고는 "계정을 잘못 썼다"며 사과의 글을 남겼습니다.이 게시물로 인해 공개된 ‘o2’라는 모델명은 오픈AI의 차기 모델로 예상되며, .. 2024. 11. 9.
MS, 구글·앤트로픽 모델 깃허브 코파일럿에 통합! 새로운 코딩 혁신의 시작 오늘은 마이크로소프트(MS)가 깃허브 코파일럿에 구글과 앤트로픽의 AI 모델을 통합하겠다는 놀라운 소식을 전해드리려고 합니다.이번 발표는 많은 개발자와 AI 팬들에게 큰 관심을 받고 있으며, 코딩의 미래를 한층 더 발전시킬 기회로 평가받고 있습니다.새로운 변화, 깃허브 코파일럿의 다양한 모델 선택마이크로소프트는 29일 샌프란시스코에서 열린 ‘깃허브 유니버스’ 컨퍼런스에서 이 중요한 발표를 했습니다.이제 깃허브 코파일럿은 오픈AI의 경쟁 모델인 앤트로픽의 '클로드 3.5 소네트'와 구글의 '제미나이 1.5 프로'를 기본 대형 언어 모델(LLM)로 추가할 계획입니다.이는 개발자들이 다양한 AI 모델을 활용하여 더 효율적이고 창의적인 코딩을 할 수 있는 환경을 제공합니다. 깃허브 코파일럿은 2021년 출시 이.. 2024. 10. 31.
오픈AI의 차세대 모델 ‘오리온’ 공개 예정! GPT-4보다 100배 강력해진다? 오픈AI가 공개할 예정인 차세대 인공지능 모델 ‘오리온(Orion)’에 대한 소식을 전해드리려고 해요.오픈AI가 이 모델을 연내에 공개할 계획이라고 하니, 기대되는 분들이 많을 것 같아요!차세대 AI의 출현오픈AI는 최신 인공지능 모델인 오리온을 2024년 말까지 출시할 계획이라고 밝혔습니다.이 모델은 기존의 GPT-4보다 최대 100배 더 강력하다고 알려져 있어 많은 관심을 받고 있습니다.특히 이번 모델은 챗GPT를 통해 일반 사용자에게 곧바로 제공되지 않고, 먼저 오픈AI와 긴밀히 협력하는 기업들에게 액세스 권한이 부여될 예정입니다.이러한 접근 방식은 오리온의 특성과 기능을 효과적으로 테스트하고 발전시키기 위한 전략으로 보입니다. 그동안 AI 기술이 얼마나 발전해왔는지, 그리고 앞으로 어떤 변화를 가.. 2024. 10. 26.
메타, '라마 3.2' 1B 및 3B 모델 업그레이드 메타가 모바일과 엣지 장치에 최적화된 초소형 인공지능(AI) 모델 '라마 3.2 1B' 및 '3B'의 업그레이드 버전을 출시했습니다.이번 업데이트는 온디바이스 AI 분야에서의 경쟁을 더욱 치열하게 만들 것으로 보입니다.업그레이드된 모델의 특징메타는 2024년 9월에 열린 연례 개발자 컨퍼런스 '커넥트 2024'에서 텍스트 전용 모델인 라마 3.2 1B 및 3B의 압축 버전을 공개했습니다.이 새로운 모델들은 메모리 사용량이 기존 모델의 절반도 안 되면서도 성능은 최대 4배 향상된 것이 특징입니다. 이 업그레이드는 '양자화(quantization)'라는 기술을 사용하여 AI 모델의 크기를 줄이고 계산을 단순화했습니다.양자화는 모델의 가중치 정밀도를 낮춰 모델 크기를 줄이는 과정입니다. 특히 메타는 'Q로라(.. 2024. 10. 26.
엔비디아, 프론티어 모델 경쟁에 합류 엔비디아가 발표한 새로운 인공지능 모델, NVLM-D-72B모델은 오픈AI의 GPT-4o와의 경쟁을 선언하며 주목받고 있습니다.이번 포스트에서는 엔비디아의 모델이 어떤 특징을 갖고 있는지, 그리고 AI 분야에 미칠 영향에 대해 살펴보겠습니다.NVLM-D-72B란?NVLM-D-72B는 매개변수 720억 개를 가진 대형 멀티모달 모델(LMM)로, 오픈소스로 허깅페이스에 공개되었습니다.이 모델은 특히 시각 언어 작업에서 뛰어난 성능을 보이며, 여러 벤치마크에서 GPT-4o 및 다른 경쟁 모델과 대등한 결과를 보여주고 있습니다.주요 특징시각적 질문 답변(VQA v2) 및 광학 문자 인식(OCR)에서 높은 점수 획득텍스트 전용 작업에서도 성능 향상, 주요 텍스트 벤치마크에서 평균 4.3포인트 높은 정확도 달성전문.. 2024. 10. 5.
AI2, 오픈 소스 LMM ‘몰모’ 공개..."100배 적은 데이터 학습으로 GPT-4o 능가" 앨런AI연구소(AI2)가 새로운 오픈 소스 대형멀티모달모델(LMM) 제품군 ‘몰모(Molmo)’를 출시했습니다.이 모델은 고품질 데이터를 학습하여 오픈AI의 'GPT-4o'를 포함한 여러 벤치마크에서 우수한 성능을 보여주고 있다고 주장하고 있습니다.  몰모 모델의 구성AI2는 몰모 제품군에 포함된 4종의 오픈 소스 LLM을 발표했습니다.이 모델들은 각각 ▲몰모-72B ▲몰모-7B-D ▲몰모-7B-O ▲몰모E-1B입니다.현재 이 모델들은 허깅페이스에서 연구 및 상업적 용도로 사용 가능하며, 각각 알리바바의 오픈 소스 '큐원2-72B'와 AI2의 '올모' 모델을 기반으로 하고 있습니다. 플래그십 모델인 몰모-72B와 몰모-7B-D는 특히 여러 벤치마크에서 오픈AI의 GPT-4o, 앤트로픽의 '클로드 3.5 .. 2024. 9. 30.
반응형