반응형 diffusiontransformer1 알리바바 ‘Z-이미지’, 60억 파라미터로 나노바나나급 품질 구현…이미지 생성 시장의 판도를 다시 짠다 알리바바가 60억 파라미터(6B) 기반 이미지 생성 모델 ‘Z-이미지(Z-Image)’를 공개하면서 글로벌 생성형 이미지 시장에 새로운 균형점을 제시했다. 모델 규모는 중형에 불과하지만, 품질은 200억 파라미터급 상용 모델을 능가하고 나노바나나(Nano-Banana)와 직접 비교될 정도다. 더 나아가 오픈소스로 공개되면서 기업·개발자 생태계에 막대한 파급력을 예고한다. GPU 자원 제약이 큰 국내 기업에게 특히 의미가 크다.기술 핵심 분석Z-이미지는 기존 이미지 생성 모델과 아키텍처적 출발점부터 다르다.단일 스트림 Diffusion Transformer(DiT)일반 모델이 텍스트 스트림과 이미지 스트림을 분리해 두 개의 모듈로 처리하는 것과 달리, Z-이미지는 텍스트 토큰·시맨틱 비주얼 토큰·VAE 이.. 2025. 12. 2. 이전 1 다음 반응형