Así eliminará Microsoft el ruido de fondo y los ladridos de las videollamadas con IA

COMPARTIR 0 TWITTEAR

microsoft teams

Una de las cosas más molestas durante las videollamadas –y generalmente en cualquier tipo de llamada– son los ruidos de fondos como otras voces, el teclado del ratón o incluso ruidos de animales, como ladridos. Microsoft lo sabe y por ello quiere eliminar estos ruidos mediante una Inteligencia Artificial que intervendrá en tiempo real neutralizando estos molestos ruidos.

Esta función fue anunciada hace unos días por la compañía norteamericana, pero es ahora cuando conocemos algo más de detalles sobre como funcionará.

Lo que quiere evitar Microsoft precisamente esos momentos incómodos que usualmente ocurren durante muchas en las videoconferencias en las que se pide a alguien que silencio su micrófono porque está, a lo mejor, abriento un paquete de comida o porque su perro está ladrando. No obstante, hay que diferenciar muy bien los ruidos no estacionarios de los estacioarios, puesto que estos últimos ya son eliminados en el sistema de supresión de ruido actual de la compañía.

Actualmente, lo que se hace es aprovechar las pausas de los interlocutores pesara identificar qué sonido es la voz del locutor y qué es ruido de fondo, como el ruido del ventilador del ordenador o ruidos similares. Por lo tanto, esta nueva implementación de Microsoft en sus servicios de videollamadas estaría centrado en los ruidos más difíciles de identificar y aislar: los ruidos no estacionarios, que podrían incluso ocurrir durante una sola vez durante esa llamada.

Te interesa | Adiós Office 365, hola Microsoft 365

Un ladrido, alguien abriendo un paquete de comida, un vaso de cristal que se cae y se rompe o un portazo podrían ser ruidos no estacionarios que son muy difíciles de identificar como ruido. No obstante, y de acuerdo a un portavoz de Microsoft, no se podría eliminar el ruido generado por instrumentos, una persona riéndose, gritando o cantando; los ruidos de otras personas hablando se producen en la misma frecuencia, por lo que estos ruidos no se puede aislar.

Cómo está entrenando Microsoft a su IA para aislar los ruidos de fondo no estacionarios

«Entrenamos un modelo para comprender la diferencia entre el ruido y el habla, y luego el modelo está tratando de mantener el discurso», explica Robert Aichner, gerente de programas grupales de Microsoft Teams al medio VentureBeat. Esto se ha hecho mediante una enorme cantidad de vídeos de personas hablando con ruidos de fondo, en los que, gracias a una transcripción, la Inteligencia Artificial es capaz de seguir la conversación y, de este modo, discernir entre lo que es voz y lo que es ruido.

videollamada en Microsoft Teams

«Tomamos miles de altavoces diversos y más de 100 tipos de ruido. Y luego lo que hacemos es mezclar el discurso limpio sin ruido con el ruido. Entonces simulamos una señal de micrófono. Y luego también le das al modelo un discurso limpio como la verdad fundamental». Aunuqe parezca algo sencillo, Microsoft en realidad se ha enfrentado con múltiples problemas. El principal ha sido encontrar un conjunto de datos lo suficientemente representativo ¿Cómo generar esos ruidos de fondo de manera artificial?

Inicialmente se usó tanto audiolibros como conjuntos de datos de YouTube con datos etiquetados, pero estos modelos drásticamente distintos a las videollamadas reales, sobre todo los audiolibros. Por ello también se decidió crear vídeos específicamente para introducirlos en el sistema, de forma que también se entrenase a la Inteligencia Artificial con situaciones reales.

Te interesa | Microsoft lanza “Teams”, su propio Slack para la comunicación dentro de las empresas

El problema es que tampoco se pueden grabar las videollamadas de los usuarios con este fin, por temas evidentes de privacidad del usuario. Pero incluso aún haciéndolo, por ejemplo, con las videollamadas de sus empleados, alguien tendría que estar etiquetando los ruidos de fondo.

Únete a nuestro canal de Telegram para estar al tanto de todas las últimas horas de Android. Si lo prefieres, también puedes segurinos en Instagram.

Sigue a Andro4all

Archivado en Tecnología
COMPARTIR 0 TWITTEAR

Comentarios

Otras webs de Difoosion