본문 바로가기
Development News/AI

구글, AI 음성비서 '제미나이 라이브' 출시: GPT-4o '고급 음성 모드'에 대응

by Maccrey Coding 2024. 8. 14.
728x90
반응형

새로운 AI 음성비서의 등장

구글이 인공지능(AI) 음성비서 '제미나이 라이브(Gemini Live)'를 새롭게 출시했습니다.

이 서비스는 오픈AI의 GPT-4o '고급 음성 모드'에 대응하기 위해 개발되었으며, 유료 서비스로 제공됩니다.

제미나이 라이브는 구글의 최신 AI 음성 비서 기술을 적용하여, 보다 향상된 음성 상호작용을 제공합니다.

제미나이 라이브의 주요 기능

1. 음성 기능의 향상

제미나이 라이브는 기존의 제미나이 서비스에 고급 음성 기능을 추가한 제품입니다.

구글은 이번 모델이 더 일관되며 감정적으로 표현력이 풍부하고 현실적인 대화를 가능하게 한다고 설명했습니다.

사용자는 대화 중 챗봇의 말을 자르고 질문할 수 있으며, 실시간으로 사용자의 음성 패턴에 적응합니다.

제미나이 라이브는 10가지 음성 옵션을 제공하며, 대화 도중에도 언제든지 일시 중지하고 재개할 수 있습니다.

 

2. 모델 및 성능

제미나이 라이브는 제미나이 1.5 플래시와 같은 새로운 모델을 통합하여 더 빠르고 고품질의 응답을 제공합니다.

제미나이 1.5 플래시는 100만 토큰의 컨텍스트 창을 갖추고 있어, 이론상으로는 수시간에 달하는 대화도 처리할 수 있습니다.

반면 GPT-4o의 고급 음성 모드는 12만8000 토큰의 컨텍스트 창을 가지고 있습니다.

 

3. 기능과 호환성

제미나이 라이브는 현재 영어로만 제공되며, 추후 몇 주 내에 다른 언어로 확장될 예정입니다.

또한, iOS에서도 제미나이 앱의 업그레이드 형태로 올해 말쯤 제공될 계획입니다.

이 서비스는 월 20달러의 유료 서비스로 제공되며, 안드로이드 사용자는 제미나이를 모든 앱 사용 중에 호출하여 화면에서 진행되는 작업에 대해 질문할 수 있습니다.

 

4. 무료 오버레이 기능

제미나이 라이브는 애플의 '시리' 업그레이드에 맞서, 휴대폰 사용 중 제미나이를 불러오는 무료 오버레이 기능도 추가합니다.

사용자는 전원 버튼을 누르거나 '헤이 구글'이라고 말하여 제미나이를 호출할 수 있으며, 제미나이는 오버레이 상태에서 이미지 생성도 가능합니다.

이 기능은 유튜브 시청 중 관련 질문을 던지는 등 다양한 용도로 활용될 수 있습니다.

 

5. 제미나이의 향후 계획

구글은 제미나이 라이브의 멀티모달 기능을 올해 말에 출시할 계획이라고 밝혔습니다.

현재는 멀티모달 기능이 지원되지 않지만, 추후 추가될 예정입니다. 제미나이는 구글의 최신 픽셀 9 휴대폰 및 픽셀 워치 3 등 신제품에 대폭 도입될 예정입니다.

AI 음성비서의 발전과 향후 전망

 

제미나이 라이브는 구글의 최신 AI 음성비서 기술을 적용하여, 음성 상호작용의 새로운 기준을 제시하고 있습니다.

GPT-4o '고급 음성 모드'에 대응하는 제미나이 라이브는 더욱 향상된 대화 능력과 사용자 경험을 제공하며, 향후 멀티모달 기능과 추가 언어 지원을 통해 더욱 강력한 기능을 선보일 것으로 기대됩니다.

 

 

공감과 댓글은 저에게 힘이 됩니다.

 

당신을 위한 3 요약

  1. 구글이 '제미나이 라이브'를 출시하며 GPT-4o '고급 음성 모드'에 대응하는 새로운 AI 음성비서를 선보였습니다.
  2. 제미나이 라이브는 더 일관되고 감정적으로 풍부한 대화를 제공하며, 10가지 음성 옵션과 100만 토큰의 컨텍스트 창을 갖추고 있습니다.
  3. 현재 영어로만 제공되며, 추후 몇 주 내에 추가 언어와 멀티모달 기능이 지원될 예정입니다.

3 line summary for you

  1. Google has launched 'Gemini Live', a new AI voice assistant that competes with OpenAI's GPT-4o 'advanced voice mode'.
  2. Gemini Live offers more consistent, emotionally rich conversations with 10 voice options and a context window of 1 million tokens.
  3. Currently available only in English, it will expand to other languages and introduce multimodal features later this year.

Starting Google Play App Distribution! "Tester Share" for Recruiting 20 Testers for a Closed Test.

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

728x90
반응형