Jugando con la psicoacústica (II): Fletcher-Munson
Fue en 1933 que dos trabajadores de Bell Labs, Harvey Fletcher y Wilden A. Munson, introdujeron por primera vez el concepto de loudness, asentando que, definitivamente, nuestro oído no tenía una respuesta lineal —era incapaz de escuchar todas las frecuencias por igual—. Nuestro oído está diseñado específica y maravillosamente para la inteligibilidad de la comunicación oral, es decir, para tener una respuesta perfecta entre 2 y 6 kHz. Pero tal y como reflejan las famosas curvas isofónicas o de Fletcher-Munson, nos cuesta escuchar los sonidos cuya frecuencia esté fuera de ese alcance, sobre todo las del espectro inferior (y, curiosamente, el pico de 8-9 kHz). No sólo eso, sino que la respuesta es distinta en función del nivel de presión sonora.
Hasta hace pocos años era fácil ver una opción en los equipos de sonido de alta fidelidad domésticos: loudness. Un pequeño conmutador que aumentaba graves y agudos cuando nos decidíamos a reproducir pasajes sonoros a bajos niveles de volumen; si lo manteníamos encendido a niveles de volumen alto la descompensación era evidente (otra cosa es que nos gustase más).
Lo importante de las curvas isofónicas no es sólo ver que no tenemos una respuesta lineal, sino que, además, esta respuesta varía en función del nivel de presión sonora: a menos volumen, menos percepción tenemos de las bandas graves y agudas manteniéndose las medias, una relación que no es para nada lineal cuando modificamos el volumen al alza. ¿Qué quiere decir esto a nivel práctico? Que cuando tenemos una mezcla que nos gusta a un nivel de presión dado, si nos decidimos a subir o bajar el nivel del máster todo se nos descompensará: tenemos que estar preparados.
En realidad, nuestra respuesta es más plana (aunque nunca del todo) cuando el nivel de presión sonora es muy alto. Nuestro oído responde similar a un compresor-limitador en este sentido. Esto indica que si haces una prueba de sonido a un nivel de presión alto (digamos algo muy alto), obtendrás una mezcla compensada a lo que podríamos llamar un estándar lineal. Esa misma mezcla reducida en volumen pecará de falta de agudos y, sobretodo, graves. Hacerlo al revés implica que una mezcla compensada a un nivel determinado de volumen, una vez aumentas la salida del máster, hará que graves y agudos sean más perceptibles. ¿Qué preferimos? ¿Aumentar o disminuir la respuesta subjectiva de las frecuencias?
Para responder lo anterior debemos reconocer cómo responde psicológicamente el ser humano a un exceso de graves y a un exceso de agudos. Curiosamente, un exceso de graves no nos produce el “dolor” que sí notamos en un exceso de agudos. Casi al contrario: las mezclas más efectistas las conseguimos cuando los graves están algo por encima. Pero todos sabemos reconocer que unos agudos demasiado evidentes nos producen entre desagrado y dolor (de hecho suele disparar una “alarma” de peligro). Conociendo esto y teniendo en mente el ejemplo anterior, nuestro objetivo principal sería controlar con absoluta precisión cualquier aumento no deseado de la banda alta de frecuencias (agudos). Justamente por ello, cuando hago mis pruebas de sonido reparo la misma trabajando a un alto nivel de presión sonora, lo que me indicará no sólo la respuesta del equipo (que también es tremendamente importante), sino que en caso de necesidad, al subir de nivel toda la mezcla evitaré esos sonidos estridentes tan poco deseados. A la vez consigo poner en alerta a los productores del evento que, normalmente, corren a control a decirme que me estoy pasando… Háblales ahora de las curvas Fletcher-Munson, de la respuesta psicoacústica y de lo limitado que está el equipo. Pero este es otro tema...
¿Existe alguna manera de compensar las diferencias de percepción en función del nivel de presión sonora? Lo ideal sería un sistema que en función de ese nivel aplicase una corrección, llamémosla, ‘Fletcher-Munson invertida’. El problema de esta solución es que depende del ser humano y, por tanto, de la posición absoluta de cada persona respecto del recinto acústico principal: el público más cerca del escenario (y por ende de la PA) recibirá más graves y agudos —chillones— que el público que esté detrás de la mesa de control. Si compensamos los agudos para los fans, olvidaremos matices importantes en esa banda para la gente que esté a 10 o 20 m de distancia. Supone un problema muy complejo.
Pero sí podemos insertar en la mezcla un compresor multibanda que compense las diferencias de percepción auditiva humana en función del nivel de salida, un compresor de recorrido algorítmico y multibanda que aumente graves y agudos de manera diferenciada según la salida, a la vez que reduce ese aumento (e incluso comprima la banda media) cuando el nivel de salida se acerca al límite. La idea es tremendamente atractiva, pero es complicadísimo de ajustar. Aún así, probadlo, porque la solución es tremendamente más atractiva que la inclusión de un compresor de banda total (algo mucho más habitual hoy en día), aunque pueden complementarse perfectamente.
No todas las consolas disponen de serie de plug-ins de compresión multibanda o no todos tenemos la posibilidad de poder insertar un compresor tipo C4 o C6 de Waves o un MC2000 de McDSP. Pero sí es mucho más fácil, a malas, realizar este ajuste de manera “manual”: insertando en la salida máster un ecualizador paramétrico. Cada vez que modifiquemos el volumen de PA restituiremos las frecuencias que nuestro oído percibe mejor o peor. ¿Con qué ajustes? Echad un vistazo a las curvas isofónicas.
Fijaos bien en las curvas Fletcher-Munson y daos cuenta de las diferencias que existen a niveles de presión dados: pueden ser de hasta 30 dB o más de intensidad. La mejor de las mezclas es aquella que, además de un sonido agradable, ofrece de manera audible detalles armónicos que enriquecen la misma, y eso a veces se consigue con un aumento de 20-30 dB en el espectro superior de la respuesta en frecuencia; aunque, como hemos visto, un exceso en ese punto puede suponer todo lo contrario: un dolor molesto que puede reducir a cenizas nuestro trabajo.
El oído humano y el cerebro tienen sus herramientas ante los desastres de los técnicos. Todos conocemos a alguien a quien los agudos les molestan tremendamente y podríamos concluir que esta persona no sólo tiene el sistema de “alarma” con un umbral muy bajo sino que, además, su cerebro no permite aplicar ese especie de filtro anti-agudos que otros sí tienen. ¿Recordáis cómo empezaba el artículo anterior sobre psicoacústica? Me quejaba de que el sonido de mi compañero técnico era estridente, pero me sorprendía de la capacidad del público en soportarlo. De hecho, si la distorsión (entendiéndola como lo que significa: la reproducción no fiel ni controlada) de los agudos se realiza de manera progresiva, el cerebro compensa la adición con una especie de substracción subjetiva que permite, poco a poco, mantener a raya el nivel de “alarma”. En cambio, para unos oídos frescos la “alarma” salta a la primera.
Volvemos al final del primer artículo: la necesidad del técnico de poder “resetear” de vez en cuando su cerebro para recuperar los umbrales de referencia ‘normales’. Un sistema, cutre pero eficaz, es tan sencillo como taponarse los oídos con los dedos unos 5-10 segundos, pensando, si puedes, en cualquier otra cosa que no sea música. Ya comenté que nuestro cerebro es potente, pero curiosamente no tiene una memoria acústica de corto tiempo. Al volver a escuchar nos será fácil, durante unos pocos segundos, analizar lo que realmente está ocurriendo y, evidentemente, tener la información precisa para corregirlo.