Microsoft anuncia cuatro nuevas voces de texto a voz con IA para usar con Azure OpenAI

Microsoft anuncia cuatro nuevas voces de texto a voz con IA para usar con Azure OpenAI

Microsoft ha anunciado la introducción de cuatro nuevas voces neuronales impulsadas por IA para aplicaciones de texto a voz (TTS), que se pueden utilizar en Azure OpenAI GPT a partir de hoy para ayudar a crear chatbots, asistentes de voz o agentes conversacionales basados ​​en voz.

Las cuatro voces, denominadas en-US-AndrewNeural, en-US-BrianNeural, en-US-EmmaNeural (todas en inglés estadounidense) y zh-CH-YunjieNeural (chino), están «optimizadas para escenarios conversacionales» y ahora están disponibles. para una vista previa pública en tres regiones: el este de EE. UU., el sudeste asiático y el oeste de Europa.

Microsoft ha mostrado algunas muestras de las nuevas voces en comparación con otras voces neuronales que están disponibles actualmente para mostrar las mejoras que se han realizado para hacer que el habla sea más natural y fluida.

Las voces mismas se pueden integrar en aplicaciones existentes haciendo uso de Azure OpenAI , utilizando Azure Speech SDK o REST API, además de emplear Azure Bot Framework para desarrollar bots inteligentes capaces de usar las nuevas voces neuronales TTS.

Microsoft continúa diciendo lo siguiente:

“Comenzamos por crear la personalidad de cada voz como si fuera una persona real, amigable y optimista acerca de la vida, siempre dispuesta a ayudar a los demás y compartir conocimientos interesantes o prácticos. El estilo de hablar de la voz se asemeja a una conversación con un conocido mientras tomamos una taza de té, manteniendo un tono natural y sin exagerar”.

Además, mejoramos continuamente nuestras técnicas de modelado de texto a voz (TTS) para mejorar la calidad de nuestras voces de IA. Nuestros proyectos más recientes, como DelightfulTTS 2 y MuLanTTS, han reducido significativamente la brecha de calidad entre las voces de IA y las grabaciones humanas profesionales, produciendo voces más naturales y realistas que nunca. Estos avances tecnológicos sirven como base sobre la que se construyen estas nuevas voces de IA.

Las cuatro nuevas voces se unirán a la oferta existente de más de 400 voces neuronales, que cubren más de 140 idiomas y configuraciones regionales.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *