Google lanza un chat de inteligencia artificial basado en voz para los usuarios de Android


El logotipo de Google Gemini.
Agrandar / El logotipo de Google Gemini.

Google

El jueves, Google puso a disposición de todos los usuarios de Android de forma gratuita Gemini Live, su función de chatbot con inteligencia artificial basada en voz. La función permite a los usuarios interactuar con Gemini a través de comandos de voz en sus dispositivos Android. Esto es notable porque la función de modo de voz avanzado de ChatGPT de OpenAI, que es similar a Gemini Live, aún no se ha distribuido por completo.

Google presentó Gemini Live durante el evento de lanzamiento de Pixel 9 el mes pasado. Inicialmente, la función era exclusiva para los suscriptores de Gemini Advanced, pero ahora está disponible para cualquier persona que use la aplicación Gemini o su interfaz en Android.

Gemini Live permite a los usuarios hacer preguntas en voz alta e incluso interrumpir las respuestas de la IA a mitad de frase. Los usuarios pueden elegir entre varias opciones de voz para las respuestas de Gemini, lo que añade un nivel de personalización a la interacción.

Gemini sugiere los siguientes usos del modo de voz en sus documentos de ayuda oficiales:

Hablar de ida y vuelta: Habla con Géminis sin escribir y Géminis te responderá verbalmente.
Intercambie ideas en voz alta: Solicita una idea para un regalo, para planificar un evento o para hacer un plan de negocios.
Explorar: Descubra más detalles sobre los temas que le interesan.
Practica en voz alta: Ensaye los momentos importantes de una manera más natural y conversacional.

Curiosamente, aunque OpenAI hizo una demostración inicial de su modo de voz avanzado en mayo con el lanzamiento de GPT-4o, solo ha enviado la función a un número limitado de usuarios a partir de finales de julio. Algunos expertos en IA especulan que una implementación más amplia se ha visto obstaculizada por la falta de potencia informática disponible, ya que se supone que la función de voz requiere un uso intensivo de recursos informáticos.

Para acceder a Gemini Live, los usuarios pueden tocar un nuevo icono en forma de onda en la esquina inferior derecha de la aplicación o en la superposición. Esta acción activa el micrófono, lo que permite a los usuarios hacer preguntas verbalmente. La interfaz incluye opciones para “mantener” la respuesta de Gemini o “finalizar” la conversación, lo que les da a los usuarios control sobre el flujo de la interacción.

Actualmente, Gemini Live solo está disponible en inglés, pero Google ha anunciado planes para ampliar la compatibilidad con otros idiomas en el futuro. La empresa también tiene la intención de llevar la función a los dispositivos iOS, aunque no se ha proporcionado un cronograma específico para esta expansión.



Source link