Grabación

Reducción de ruido con Audacity: técnicas básicas

Revisamos las técnicas básicas de reducción de ruido, que en la segunda parte aplicaremos a través del editor audio gratuito Audacity destacando algunos consejos prácticos. En esta entrega la teoría y en la próxima resultados eficaces a coste cero.

Introducción

[Índice]

Siempre que grabamos hay ruido. Que sea imperceptible o no es otra cosa. Incluso siendo perceptible puede ser tolerable en según qué aplicaciones. Pero cuando una grabación ya realizada muestra un exceso de ruido molesto, no queda más remedio que pasarla por el quirófano de un editor de audio o DAW para aplicar reducción de ruido.

Diversos tipos de ruido contaminan las señales acústicas grabadas. Algunos de ellos tienen carácter de ruido de banda ancha (ruido blanco, hiss de cinta analógica, ruido de micrófono, rumble, ...), los hay tonales (hum -ruido de masa-), y otros son impulsivos (clicks, crackle, pops). Existen diversos equipos que tratan de eliminar el ruido (cuando se puede plantear un modelo de ruido que permita distinguirlo de la señal) o al menos de disminuir su efecto aparente aprovechando las características de percepción del oído.

Me centro en este tutorial en el clásico ruido de fondo estable y permanente que tiene causa ya sea en el equipo de grabación (cada vez menos) o la mayor parte de las ocasiones por presencia de alguna fuente de ruido en el lugar de grabación. Por ejemplo al grabar una locución en la misma sala en la que está el ordenador en el que estamos registrando, con sus ventiladores y discos duros girando, o sencillamente el ruido ambiente normal en una habitación o sala no acondicionada.

Nos interesaremos por los equipos 'single-ended' (o ‘ciegos’) que limpian de ruido una señal ya contaminada por él, asumen un cierto modelo del ruido y tratan directamente de aminorar su efecto, produciendo una señal más limpia. Un ejemplo evidente son los 'hum canceller', que se ocupan de eliminar el zumbido de red. Se trata de filtros notch sumamente estrechos sintonizados a 50 o 60 Hz. y alguno de sus armónicos. Los filtros digitales permiten una realización mucho más selectiva de estos filtros, mejorando los resultados, incluso con técnicas adaptativas capaces de seguir y compensar las variaciones que sufra ese hum.

Pero yendo a ruidos no tan localizados en frecuencias concretas, sino de banda más ancha, hay que seguir otras estrategias. A día de hoy suelen ser procesos en el dominio del espectro que usan alguna referencia del ruido y comparan con ella la señal grabada para decidir en cada momento y en cada frecuencia qué hacer: mantener la señal o rebajarla, en función de que esté más o menos contaminada. Pero para que todos lo entendamos mejor voy a hacer un recorrido previo por algunos antecedentes.

Una señal con ruido de fondo, y su detalle
hispasonic

Puertas de ruido y expansores ‘downward’

[Índice]

Las puertas de ruido (noise gate) son muy empleadas pero también muy invasivas. En ellas la energía local de la señal de entrada a lo largo del tiempo se compara con un cierto umbral, y cuando no lo alcanza se le aplica una ganancia cero, silenciando la salida. Cuando la energía de la señal sobrepasa el umbral, la ganancia que se aplica es 1, para dejarla pasar sin alteraciones. Esto permite que, cuando la señal tiene nivel suficiente como para que el ruido no se note en exceso, la señal no se modifique; pero si la señal baja de nivel y por tanto el ruido comienza a ser evidente se fuerza salida nula.

Los downward expander son menos bruscos en su acción sobre la dinámica y reducen el nivel tanto más cuánto más por debajo quede la señal de su umbral de actuación. Pero en el fondo tanto las puertas como estos expansores actúan como controles automáticos de ganancia que silencian los pasajes de poca energía, en los que el ruido es más notable.

No dejan de ser una variante de la acción sobre la dinámica que encontramos en los habituales compresores y limitadores, estos dedicados rebajar picos, mientras las puertas y los expansores downward hacen lo contrario: silenciar más si cabe los silencios.

Respuesta básica comparada de compresores, limitadores, expansores y puertas
pablofcid

Sobre esta idea inicial de las puertas y expansores hay varios refinamientos, como los clásicos ‘soft knee’ en la curva de respuesta a la dinámica para una acción más gradual, o la regulación de tiempos de ataque y de liberación en la actuación para adaptarse lo mejor posible a la propia ‘respiración’ de la señal.

En lugar de controlar la ganancia, otras variantes lo que hacen es controlar un filtro paso bajo, de forma que en vez de variar el nivel para toda la señal, a medida que el la señal baja de intensidad se ‘cierra’ ese filtro progresivamente para retirar las frecuencias agudas, que suelen ser las que más evidencian el ruido cuando la señal es baja (las señales de poco nivel suelen tener menor contenido en agudos y enmascaran peor el ruido en alta frecuencia).

Por citar dos ejemplos que fueron muy usados en su día, los modelos Drawmer DF320 y Symetrix 511A combinaban filtrado dinámico para limpiar el ruido de alta frecuencia con un downward expander que hace lo propio con las pausas y silencios (además cuentan con un filtro paso alto a 50 Hz, que elimina el zumbido de red). En ambos modelos, los efectos laterales a que este tratamiento compuesto (pérdida de agudos y brillo) da lugar son compensados mediante excitación psicoacústica y compresión sobre la señal limpia de ruido.

La cancelación de ruido con técnicas espectrales

[Índice]

Un refinamiento son las puertas y/o expansores que operan independientemente sobre distintas bandas. Con una puerta de un solo canal, si hay energía en baja frecuencia y ruido en alta, no se activará el cierre, con lo que el ruido se seguirá oyendo. Más todavía por estar ocupando una banda en la que no hay energía de la señal que lo enmascare. Combinando un banco de filtros con varias puertas simples, se puede crear una puerta de ruido o un expansor multibanda, capaz de tratar mejor el caso expuesto, por la atención individualizada a cada banda, tomando decisiones 'hay / no hay' señal en cada una.

Por volver a otro modelo antiguo pero en su día muy aplicado, podemos pensar en el Roland SN550, un eliminador de ruido mediante downward expander de 5 bandas para el ruido de banda ancha combinado con filtrado notch para el ruido de masa. La actuación diferenciada en cada banda suponía en el SN550 una evidente mejora y permitía tiempos de ataque y de release dependientes de cada banda.

De hecho la idea multibanda llevada al extremo desemboca en tratamientos espectrales, como los que encontramos en las actuales aplicaciones de reducción de ruido sencillas como la que incorpora Audacity, y también en otras más refinadas.

No se trata ya de montar un pequeño juego de bandas. La más potente actuación contra el ruido la proporcionan las estaciones de trabajo de audio digital y los plugin, en los que el banco de filtros (siempre limitado en número de canales) se convierte en una descomposición espectral / FFT capaz de ofrecer centenares de ‘bandas’. Es lo habitual desde los sistemas de referencia especializados en eliminación de ruido como los de Cedar, a otros mucho más asequibles pero capaces de realizar un buen tratamiento en muchos casos como el efecto de reducción de ruido incluido en el editor gratuito Audacity.

Por continuar con referencias antiguas que fueron ampliamente usadas en su momento, Digidesign contaba con el plug-in DINR (Digidesign Intelligent Noise Reduction), que contenía dos módulos software, uno especializado en eliminar ruido de banda ancha, y el otro específico para eliminación de ruido tipo 'hum' (como el ruido de red, el de las pantallas y monitores de visualización, el de algunos equipos de iluminación, o el que captan las pastillas de las guitarras).

El reductor de ruido de banda ancha de DINR, en el fondo implementa un expansor multicanal de 512 bandas. Ciertamente por análisis espectral / FFT y no por un banco de filtros más tradicional, pero en el fondo son ideas equivalentes. Marcando con el ratón un segmento corto que contenga únicamente ruido en el fichero audio que se desea tratar, el sistema lo analiza, y con su espectro construye una máscara, una referencia de cómo es el ruido. En DINR el contorno del ruido es editable (p.ej. si se prefiere no tratar ciertas regiones del espectro para mantener su integridad libre de los posibles efectos laterales del procesamiento). Cuando ya se han definido el perfil deseado, el sistema analiza el fichero completo por segmentos y va comparando el espectro de la señal con la máscara del ruido.

Espectro de una señal con poco ruido, y el contorno espectral de este (en rojo)
pablofcid

En aquellas frecuencias en las que la señal no está claramente por encima de ese contorno umbral, se aplica una ganancia negativa (en un número de dB definible por el usuario). Otros parámetros ajustables son el tiempo de ataque y el de relajamiento (que impide parpadeo en el ruido de cada frecuencia), y el grado de suavizado general de la acción del reductor de ruido entre bandas consecutivas (para que al reducirse el ruido en unas bandas y en otras adyacentes no, no resulte un ruido de carácter tonal, concentrado en bandas estrechas, altamente molesto y fácil de percibir). Adicionalmente en DINR para compensar la posible pérdida de nivel en la señal final, la señal pasa por un filtro shelving ajustable por el usuario. Este filtro permite dar algo de ganancia a las frecuencias altas, y dado que actúa tras la reducción del ruido no incrementa simultáneamente el ruido que pudiera acompañarlas originalmente.

Esa descripción, con los retoques y mejoras que el tiempo y cada fabricante ha querido/sabido ofrecer, es aplicable a la mayoría de los sistemas de reducción de ruido que tenemos hoy en forma de plugin. De hecho si miramos el juego de parámetros del reductor de ruido de Audacity, no por casualidad recuerdan los que acabamos de comentar en DINR.

El reductor de ruido de Audacity y sus parámetros
hispasonic

El precio a pagar: ruidos tonales, flanging, ecos cortos...

[Índice]

Aunque mucho más precisos y eficaces que las actuaciones globales o sólo multibanda, los sistemas espectrales tienen sus propios 'peros' y habituarse a reconocerlos es importante. Los escucharéis en el vídeo de la próxima entrega. Hay que estar atentos especialmente al posible burbujeo espectral: tonos o silencios que entran/salen de forma intermitente por estar demasiado próximos al umbral. Son como mini silbidos, que quizá serían interesantes en una obra electroacústica de corte granular, pero que no lo son en nuestro contexto. Una componente débil que podía ser ligeramente molesta cuando estaba presente de forma permanente es un auténtico incordio insufrible cuando no para de activarse y desactivarse, haciéndose con ello más llamativa de lo que era en origen.

Otros problemas típicos son propios de cualquier tratamiento espectral: trabajan analizando el audio fragmento a fragmento y no de forma instantánea, y eso puede generar sensaciones de cierta especie de eco corto o breve reverberación.

Y otro síntoma típico de habernos excedido con el tratamiento será la presencia en el resultado de ocasionales sonoridades tipo ‘flanger/phasing/metalización’ que indican también que ha habido incisiones demasiado profundas con agujeros que se escuchan en el espectro y que van y vienen.

La parte más sensible para oír estos defectos son siempre las señales más impulsivas y la región de los medios hacia agudos. En el caso del habla, por ejemplo, las eses y las explosivas. Escuchándolas de forma más atenta que el resto podremos percibir mejor en qué grado del tratamiento comienzan a aparecer problemas ya serios. Tendremos ocasión de oír estas cuestiones en la próxima entrega. Afortunadamente son fáciles de reconocer una vez que desarrollamos la facultad de saberlas buscar con el oído atento. Y una vez que las detectamos podremos decidir qué es mejor: mantener una amplia reducción de ruido pese a esos artefactos sonoros o no ser tan exigentes y admitir una limpieza un poco más ligera pero a cambio con menos presencia de esos defectos sobre la señal resultante.

Qué es lo recomendable lo dicta cada caso, sus prioridades y el escenario en que nos movamos. No tiene nada que ver recuperar una locución ininteligible de un cassette almacenado durante 20 años, con sencillamente limpiar un poco una pista de un instrumento que va a formar finalmente parte de una mezcla multipista, o con intentar mejorar una sección de un tema en la que un instrumento está expuesto en solitario.

Continuará

[Índice]

En el vídeo que os ofreceré la semana que viene ilustramos estas técnicas con Audacity, y encontraréis precisamente esos mismos parámetros que acabamos de describir para DINR. En esa segunda entrega, ya con una visión práctica os ofreceré un catálogo de consejos útiles al usar este tipo de sistemas, referidos tanto al momento de grabar, como al momento de realizar los tratamientos. Espero veros de nuevo entonces.

Pablo Fernández-Cid
EL AUTOR

Pablo no puede callar cuando se habla de tecnologías audio/música. Doctor en teleco. Ha creado diversos dispositivos hard y soft y realizado programaciones para músicos y audiovisuales. Toca ocasionalmente en grupo por Madrid (teclados, claro).

¿Te gustó este artículo?
22
Ofertas Ver todas
  • NI Komplete 15 Collector's Edition
    -50%
    NI Komplete 15 Collector's Edition
    885 €
    Ver oferta
  • Modal Argon8 (B-Stock)
    -7%
    Modal Argon8 (B-Stock)
    559 €
    Ver oferta
  • Elektron Digitakt II (B-Stock)
    -6%
    Elektron Digitakt II (B-Stock)
    939 €
    Ver oferta
Comentarios

Regístrate o para poder comentar