본문 바로가기
Development News/AI

혁신적인 동영상 생성 AI 도구 '코그비디오X' 오픈 소스로 공개: AI 비디오 기술의 새 지평

by Maccrey Coding 2024. 8. 28.
728x90
반응형

최근 지푸 AI와 칭화대학교 연구진이 공동으로 개발한 동영상 생성 AI 모델 '코그비디오X(CogVideoX)'가 오픈 소스로 공개되었습니다.

이로 인해 이전에는 일부 기술 기업들만이 독점적으로 활용하던 고급 동영상 생성 기술이 전 세계 개발자들에게 개방되었습니다.

특히 이 기술은 AI 비디오 생성 분야에서 큰 변화를 가져올 것으로 기대됩니다.

코그비디오X: 강력한 동영상 생성 AI

코그비디오X는 텍스트 프롬프트를 입력하면 최대 6초 길이의 고품질 동영상을 초당 8프레임, 720×480 해상도로 생성할 수 있습니다.

이 모델은 50억 개의 매개변수를 가지고 있으며, 벤치마크 테스트에서 '피카(Pika)', '비디오크래프터-2.0(VideoCrafter-2.0)', '오픈소라(OpenSora)' 등 경쟁 모델을 여러 지표에서 앞선 성능을 보였습니다.

혁신적인 기술: 3D 변분 오토인코더와 전문가 변환기

코그비디오X는 비디오를 효율적으로 압축하기 위해 3D 변분 오토인코더(VAE)를 구현했습니다.

또한 텍스트 프롬프트를 더욱 정확하게 해석하고, 이에 따라 비디오를 세밀하게 생성할 수 있도록 전문가 변환기(expert transformer)를 개발했습니다.

오픈 소스 공개: 기술 민주화의 시작

 

가장 큰 특징은 이 강력한 AI 모델의 코드와 가중치가 허깅페이스(Hugging Face)를 통해 공개되었다는 점입니다.

이는 자금이 부족한 개발자들도 최첨단 AI 동영상 생성 기술에 접근할 수 있는 기회를 제공하며, 기술 민주화의 새로운 장을 여는 중요한 전환점이 될 것입니다.

코그비디오X의 미래

 

X의 Gradio님(@Gradio)

📢🔥Hot New Release: CogVideoX-5B, a new text-to-video model from @thukeg group (the group behind GLM LLM series) - More examples from the 5B model in this thread👇 - GPU vram requirement on Diffusers: 20.7GB for BF16 and 11.4GB for INT8 - Inference

x.com

 

지푸 AI의 이번 오픈 소스 공개는 AI 비디오 생성 기술의 발전을 가속화할 것으로 보입니다.

개발자 커뮤니티의 적극적인 참여를 통해 AI 동영상 생성 기술이 빠르게 발전하고, 다양한 창의적인 응용이 이루어질 것입니다.

 

코그비디오X의 오픈 소스 공개는 AI 동영상 생성 기술의 새로운 시대를 열고 있습니다.

이제 누구나 접근 가능한 이 기술은 향후 비디오 콘텐츠 제작의 방식을 근본적으로 변화시킬 잠재력을 가지고 있습니다.

 

공감과 댓글은 저에게 큰 힘이 됩니다.

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

 

 

 

728x90
반응형