Microsoft quiere mejorar Teams con un detector de mala pronunciación de nombres, según patente
¿Cuántas veces has pronunciado mal el nombre de un participante en una reunión de Microsoft Teams? A veces, cuando estamos en una reunión en línea, intentamos pronunciar correctamente el nombre de un compañero de trabajo y nos damos cuenta de que tal vez lo hayamos hecho mal. Es una situación bastante embarazosa, por decir lo menos.
¿Pero qué pasaría si le dijéramos que Microsoft está tomando la iniciativa de abordar este desafío con una función innovadora: detección de mala pronunciación de nombres en tiempo real en Microsoft Teams?
La tecnología, descrita en una patente reciente , detecta automáticamente cuando no estás pronunciando correctamente el nombre de uno de tus colegas y te lo notifica. Inteligente, ¿verdad?
La función está diseñada para funcionar sin problemas en reuniones en línea. Escucha atentamente, busca los nombres de las personas que participan en lo que se está diciendo y verifica si coinciden con una referencia. Si se nota una diferencia, le informa al orador sobre la mala pronunciación del nombre durante la reunión de Microsoft Teams. Pero, ¿cómo lo hace?
El sistema comienza a funcionar antes de que comience la reunión. Recopila los nombres y los identificadores de usuario de cada persona que participa en la reunión. Luego, crea un modelo de lenguaje especial para la reunión a fin de garantizar que pueda reconocer y escribir correctamente los nombres cuando se los dice en voz alta.
Cuando se dice un nombre en voz alta, el sistema inicia su acción: elimina una parte de audio relacionada con ese nombre y compara este sonido con la pronunciación de referencia, que coincide con el identificador de usuario asociado al nombre del participante. La comparación se realiza mediante algoritmos complejos que evalúan la similitud entre el nombre dicho en voz alta y la referencia, generando una puntuación de pronunciación.
El hablante recibe una notificación si la puntuación se sitúa por debajo de una determinada línea, lo que indica una pronunciación incorrecta. Pero no es el final, el sistema proporciona una experiencia de práctica que permite a los hablantes repetir el nombre y recibir retroalimentación hasta que lo dicen correctamente. Este elemento es muy útil en el momento de la comunicación y también para su uso posterior en el aprendizaje de cómo decir las cosas correctamente.
Este método de proporcionar comentarios en tiempo real sobre la pronunciación incorrecta de nombres en Microsoft Teams es un logro técnico y un cambio radical. Requiere pasos complejos, como crear modelos de lenguaje personalizados, obtener y contrastar pronunciaciones de referencia y presentar notificaciones instantáneas, manteniendo al mismo tiempo las consideraciones de privacidad y seguridad.
La capacidad de la función para adaptarse a las sutilezas del habla humana y a las variaciones en los nombres de diferentes culturas demuestra el progreso logrado en las tecnologías de reconocimiento de voz y aprendizaje automático.
Según la patente, las imágenes del artículo utilizan Microsoft Teams como ejemplo de una plataforma que puede beneficiarse de esta capacidad. Lo más probable es que Teams la obtenga en los próximos meses o años.
La función de detección de errores de pronunciación de nombres en tiempo real de Microsoft es un método moderno y único para promover la comprensión y la conexión en nuestras relaciones digitales. Es bueno ver que la tecnología, cuando se utiliza correctamente, puede unirnos más estrechamente y hacer que nuestras acciones parezcan más humanas en lugar de menos.
No sólo eso, sino que este asistente invisible que garantiza que el nombre de todos se pronuncie correctamente nos ahorrará a todos una gran cantidad de vergüenza.
Esta no es la primera vez que el gigante tecnológico con sede en Redmond publica patentes para Microsoft Teams: en 2023, la compañía también reveló una patente que describía una tecnología destinada a personalizar la experiencia de Teams para cada usuario.
Deja una respuesta