Consiguen separar los sonidos en un ambiente ruidoso
Post 130 - 7 de Mayo de 2008 - Categoría: Innovación.
Nuestro cerebro es capaz de realizar funciones imposibles de realizar con los medios técnicos actuales. El conocido Cocktail Party Effect es uno de los varios ejemplos acústicos donde nuestro cerebro tiene ventaja. Nuestro cerebro puede seguir una conversación independientemente de otras conversaciones que se realicen más cerca de nosotros, ya que es capaz de realizar un seguimiento temporal y frecuencial del sonido que nos interesa, prescindiendo de los que no nos interesan.
Unos matemáticos resuelven el problema de cómo separar los sonidos que interesan (quizás una voz) de aquellos que constituyen el ruido de fondo. Es conocido como el problema de la fiesta ruidosa (Cocktail Party Problem). El resultado se podría aplicar a la criminalística y a favor de la lucha contra el terrorismo.
Este es un problema que tanto los agentes de la CIA como los científicos han estado persiguiendo durante décadas. ¿Se puede separar el sonido correspondiente a una voz de la grabación del conjunto de voces producidas en una reunión festiva?
Un grupo de investigadores de University of Missouri-Columbia dirigidos por Peter Casazza parece haber encontrado una solución matemática al problema.
Teóricamente la solución encontrada puede tomar una grabación determinada de un conjunto de voces registradas con un micrófono convencional y separar cada una de ellas, sabiendo qué dice cada persona. Además las voces separadas retienen sus características vocales originales. En una solución anterior encontrada por el mismo equipo lograron separar las voces, pero no retenían dichas características.
Denominan a la solución reconstrucción de señal sin ruido de fase. La solución puede separar todas las voces de una grabación en la que hay personas hablando a la misma vez en un mismo recinto, demostrando que el problema de la fiesta ruidosa es resoluble matemáticamente.
De momento no tienen un programa duplicable que realice el cálculo automáticamente pero esperan encontrar un modo de realizarlo. Ahora la solución corre en un ordenador pero no se puede reproducir fácilmente en otro o distribuir ya que depende de algoritmo basado en una red neuronal. El sistema aprende por sí mismo de la experiencia basándose en la prueba y el error. No es fácil duplicar un sistema de este tipo pero van a intentar diseñar un algoritmo que se pueda implementar fácilmente y pueda realizar la tarea rápidamente.
Aunque ya existen programas que pueden separar y reconstruir voces no son completamente fiables, pues tienen dificultades para separar voces con características similares. Según los investigadores el nuevo método es mucho más exacto.