Sintetizadores

Síntesis (27): modulación AM, teoría básica

25/11/2014 por Pablo Fernández-Cid

Hoy veremos los conceptos teóricos imprescindibles para entender la modulación en amplitud y continuaremos en una segunda entrega con una revisión de sus usos en síntesis que alcanzará a la popular modulación en anillo. Para esa segunda entrega incluso crearemos un cello, un sonido brass, y algún lead que otro basados en AM/Ring sin necesidad de usar ningún filtro. Pero no sin antes comprender bien qué es esto de la AM, que es el objetivo de hoy. Me permitiréis que me dilate en él. Lo veo fundamental para poder profundizar no sólo en AM, sino en otros tipos de modulación o incluso en la síntesis granular y otras cuestiones varias de audio.

Aunque es una entrega teórica os he preparado un vídeo que condensa ejemplos (igualmente teóricos, no muy musicales) de todo lo que vamos contando. Los ejemplos en la siguiente entrega sí serán muy musicales y espero que os sorprendan. La sorpresa será ver cómo estas teorías frías que hoy contamos se pueden convertir en sonidos interesantes, orgánicos y hasta realistas.

El significado del verbo ‘modular’

[Índice]

Los locutores y cantantes hablan de modular la voz cuando varían la cualidad del sonido que producen. En el ámbito de la teoría musical modular se refiere, dentro del lenguaje tonal, al paso de una tonalidad a otra. Pero a nosotros nos interesa hoy otra acepción del término, que cito del diccionario RAE:

Electr. Variar el valor de la amplitud, frecuencia o fase de una onda portadora en función de una señal.

Modular es por tanto ‘variar’. Al menos cuando actúa como verbo, claro, pues como adjetivo significa ‘hecho de módulos’ tal como sucede cuando hablamos de un sintetizador modular.

Cuando en esta definición se habla de una onda portadora, se suele tener en mente una sinusoide y aunque a veces en los sintetizadores vamos a usar otros tipos de portadora (no necesariamente senos) nos puede valer de ayuda pensar primero en términos de senos, que luego extendamos a otras formas.

Llamativamente, esa definición del RAE ya nos anticipa tres formas básicas de modulación: en amplitud, en frecuencia y en fase, que corresponden a otras tantas utilidades presentes en sintetizadores y que iremos tratando en sucesivas entregas: AM, FM y PM.

La modulación sobre un seno

[Índice]

Si pensamos en un seno perfecto se trata de una señal muy aburrida, repitiendo sin cesar eternamente su ciclo igual a sí mismo desde tiempo inmemorial y hasta el fin de la eternidad. Un seno pueden animarse, y lo podemos hacer jugando con alguno de los tres parámetros que lo definen: su amplitud (su nivel), su frecuencia (la velocidad a la que oscilan) o su fase (su ‘posición’ temporal).

Sinusoides más grandes o más pequeñas, más veloces o menos, o desplazadas en el tiempo, pero sinusoides todavía. Sólo cuando la variación que realizamos no es fija la cosa empieza a animarse. Vamos con el primer caso.

El trémolo como un caso de AM

[Índice]

Pensad en un sonido, de momento una senoide, en el que vamos subiendo y bajando su amplitud de forma repetida y con suavidad. No es más que un trémolo, en términos musicales. Podríamos considerar esa senoide como una señal ‘portadora’, sobre la que se monta, regulando su amplitud, otra senoide mucho más lenta que llamaremos ‘moduladora’ y que es la que define esas subidas y bajadas de nivel. Desde el punto de vista de la síntesis algo bien sencillo: usamos un LFO a modo de oscilador modulador para impartir una lenta variación de amplitud sobre un oscilador (este sí en banda audio) que actúa como portador.

El trémolo se presenta así como un nombre desde el terreno musical para eso que en la vertiente técnica llamamos AM o modulación de amplitud.

Vemos un seno ‘rápido’ que es la portadora (llamemos fp a su frecuencia) , cuya amplitud va variando con una ley senoidal ‘lenta’ (de frecuencia fm) que da lugar a una pequeña excursión de la amplitud entorno al valor ‘por defecto’ que arbitrariamente hemos situado como ‘1’. Si llamamos I al valor de pico de esa excursión, tenemos que esa señal con trémolo sería algo así como el producto:

[ 1 + I seno_fm ] seno_fp

No es más que una forma de escribir que la señal que define la amplitud de la portadora (y que os coloreo en la figura inferior) no es un seno sin más, sino que ese seno aparece montado sobre una componente importante de continua, de DC.

Por tanto, realmente la amplitud final que afecta a la portadora en el trémolo es [ 1 + I seno_fm ]

Vamos a ocuparnos ahora de presentar qué es lo que sucede espectralmente cuando realizamos esa modulación AM, esos cambios de amplitud sobre una señal. ¿Cuál es el significado o resultado espectral de ese trémolo?

El espectro de la señal AM

[Índice]

Queremos saber cómo será el espectro de la señal combinada AM (nuestro maravilloso trémolo). Esa señal AM era el producto

[ 1 + I seno_fm ] seno_fp

O lo que es lo mismo

seno_fp + I seno_fm seno_fp

En el fondo, en la señal AM interviene la portadora original y el producto de los dos senos. El valor ‘I’ es lo que llamamos el índice de modulación y establece cómo de intensa es la contribución de ese producto que se suma a la portadora original. Cuanto mayor sea I, más intensamente modulada está la señal (más intenso será el trémolo). Si I llegara a ser mayor que 1, la señal ‘roja’ de la figura anterior cruzaría por debajo del nivel de amplitud cero, y eso daría lugar a que la portadora se invirtiera (pasaría a tener en algunos momentos amplitud ‘negativa’). Un detalle sobre el que volveremos al hablar de modulación en anillo, pero que hoy obviaremos. De momento nos quedaremos con I < 1, suficiente para que no suceda esa inversión.

Decía que en la señal AM identificamos la presencia de la señal portadora original (seno_fp) acompañada por el producto de dos senos. No pretendo entrar en demostraciones matemáticas para no aburriros. Se puede resolver con trigonometría y conocimientos del colegio: aquello de que el producto de dos sinusoides de frecuencias fa y fb equivale a la suma de dos nuevas sinusoides de frecuencias fa+fb y fa-fb. En nuestro caso el producto de los senos de frecuencias fp y fm equivale a dos senos de frecuencias fp-fm y fp+fm.

En definitiva tenemos que el espectro de la señal AM tiene una componente que es un seno de frecuencia fp, y otras dos con frecuencias fp-fm y fp+fm. Sería algo así:

Vemos cómo, en la señal AM, la portadora se vé acompañada de esas rayas laterales a una distancia que depende de la frecuencia de la moduladora.

Sencillo… pero muy poco práctico cuando, como nos sucederá en síntesis, queremos acabar usando señales que no son senos. ¿Cómo estudiar por esta vía la modulación de una onda rectangular con una triangular? Sólo de pensarlo entran escalofríos por la cantidad de armónicos/senos que intervienen desde cada señal y lo que pueda resultar del producto de ambas. Una explosión de combinaciones difícil de manejar.

Hay otra alternativa para pensar en estas cosas que resulta mucho más útil, ágil y sencilla, para poder pensar en la modulación AM y su resultado espectral. Para poder llegar a ella primero tengo que complicaros la vida (sólo un poco). No decaigáis, por favor. Trataré de hacerlo asimilable y os garantizo que lo que aprendáis hoy será esencial en muchísimas cosas que veremos en el futuro.

La simetría del espectro

[Índice]

Lo primero que tenemos que admitir (no voy a entrar en las matemáticas subyacentes) es que el espectro hay que considerarlo siempre sometido a simetría [para ser más precisos el espectro es hermítico, pero a efectos del espectro de amplitud o potencia eso implica que es simétrico]. Aunque os choque a algunos pensar en frecuencias negativas, es la mejor forma de entender qué pasa cuando realizamos modulaciones. Si no fuera importante no os metería en este embrollo, creedme. Si queréis entender las modulaciones (y muchas otras cosas) es a la postre cómodo pensarlo de esta forma. Pensad por tanto que, a partir de ahora, cada vez que habléis de un seno y su espectro, junto a la raya espectral que solemos pintar habríamos de considerar que hay una imagen simétrica en la correspondiente frecuencia negativa:

La portadora, ese seno cuya amplitud vamos a variar, tendría un espectro de ese tipo, porque era un seno puro: una raya a cada lado de ese espectro simétrico. Cuando pintamos sólo la parte positiva (que es lo que estamos acostumbrados a hacer) estamos obviando la parte negativa, porque sabemos a priori que va a ser la imagen especular. Pero en las modulaciones nos interesará tener en cuenta ambas.

El espectro de la moduladora

[Índice]

Decíamos antes que la amplitud final que afecta a la portadora era 1+I seno_fm. Y su espectro será por ello el de una senoide de baja frecuencia (rayas en –fm y +fm cercanas a la frecuencia cero) pero combinada con una componente continua o DC (en frecuencia cero) que sería ese ‘1’ constante. De hecho la amplitud de la componente DC es bastante superior a la de la propia oscilación, para que la amplitud sea siempre positiva. Su espectro sería por tanto de este tipo:

El resultado espectral de la AM: la convolución espectral

[Índice]

En lugar de crear el espectro de la señal AM pensando en sumas y restas, rayas laterales, etc. vamos a presentar esa otra interpretación de la que os hablaba. Es mucho más de ‘ingeniería’ pero es a la vez mucho más musical y de sintesista:

El producto dos señales equivale a la convolución de sus espectros. Por suerte la convolución en estos casos es muy fácil de calcular gráficamente y nos permite indagar a fondo en el funcionamiento de la síntesis AM.

Es la ‘regla de oro’ clave para entender el funcionamiento de la AM y un elemento básico para luego entender otras modulaciones y también técnicas como la síntesis granular. En AM tenemos el producto de seno_fp por el conjunto (1 + I seno_fm). Y lo que tendremos en el espectro es la convolución del espectro de seno_fp (las dos rayas, una a cada lado) y el espectro de ese conjunto (1 + I seno_fm) que eran tres rayas centradas en cero.

Aunque la convolución tiene un cálculo matemático enrevesado, su representación y ‘cálculo’ gráfico es sencillo, especialmente, y ese es nuestro caso, cuando lo que intervienen son espectros ‘a rayas’.

Desde el punto de vista práctico la convolución sitúa una réplica del espectro de la moduladora (las tres rayas) sobre cada una de las dos rayas del espectro de la portadora. Una ‘imagen’ del espectro de la moduladora va a ocupar el lugar de cada una de las rayas de la portadora. Cada raya de la portadora es sustituida por el espectro de la moduladora.

Interesante resultado: el único tono original enriquecido ahora con otros dos muy próximos, casi una especie de ¿unison? Lamento deciros que realizar un unison no es tan simple. Veremos ahora mismo cómo esa supuesta acción de ‘unison’ no sigue sucediendo cuando la portadora es una señal algo más rica que un simple tono (y la verdad, pocas veces usaréis sonidos que sean puros senos). Avancemos pues.

Si la portadora no es senoidal

[Índice]

Cuando la portadora no es una onda senoidal sino diente, rectangular, etc. tiene varias rayas espectrales. Pero la regla de oro es la misma: al verse multiplicada por 1 + I seno_fm cada raya de la portadora será sustituida por una réplica del espectro de nuestra señal moduladora. Cada una de las réplicas vendrá afectada en amplitud por la amplitud de cada raya de la portadora. No es más que esa convolución del espectro de la portadora con el de la moduladora (evito ahora pintar en detalle completo la zona de frecuencias ‘negativas’).

Lo siento, no es un chorus/unison

[Índice]

Chorus y unison están basados en sumar una señal y versiones de ella misma ligeramente desplazadas en frecuencia… ¿Es eso lo que tenemos aquí?

Pensad qué velocidad acostumbra a tener un trémolo: desde inferior al Hz. a como mucho unos pocos Hz. Realmente lo que tenemos es por tanto que la frecuencia portadora es mucho más grande (pensad en La 440Hz.) que la moduladora y por tanto ese espectro modulado lo que tiene es reemplazada cada raya de la señal original por un pequeño racimo, muy cerrado, muy próximo. Es tentador interpretar ese juego de racimos como una suma de tres señales, que os coloreo en la siguiente figura.
Pero … sólo la señal principal sería armónica, las otras lamentablemente no.
Si fueran tres señales armónicas, cada uno de los peines sería armónico y por tanto la distancia entre la raya principal y las laterales provocadas por la modulación tendría que ir creciendo con el orden del armónico (como os muestro también en la figura). Eso no nos pasa en la modulación AM. Si fueran armónicas sí tendríamos superpuestas varias señales de afinación muy próxima pero ligeramente diferente y sí habría un efecto chorus/unison. Sin embargo un trémolo no suena a eso. Suena… a trémolo, claro. Lo siento, AM, con señales dotadas de armónicos, no equivale a un chorus/unison.

Pero que no nos sirva para hacer chorus no significa que no sea útil. La modulación AM con una velocidad ‘lenta’ no es más que un trémolo, algo que realizamos sin plantearnos jamás que haya una modulación. Lo pensamos en términos de un LFO que somete la amplitud de la señal portadora a una lenta variación. Pero vayamos subiendo la frecuencia del LFO y veamos cómo cambia el resultado y nuestra forma de percibirlo.

Subiendo en frecuencia

[Índice]

¿Qué pasa cuando esa velocidad de variación sube y ya no es de un Hz o pocos a lo sumo, sino que entra ya en frecuencias semejantes a la propia portadora, entra en frecuencias de audio? En ese caso la idea del ‘racimo’ ya no se mantiene.

Cuando la moduladora oscila con velocidades ya cercanas a la decena de Hz y hasta unas pocas decenas, somos incapaces de seguir las subidas y bajadas de nivel, sólo percibimos ya un efecto ‘global’ de inestabilidad. Escuchamos el sonido con un carácter superpuesto ‘zumbante’, algo crispado. Lo que antes era una amplitud que batía con suavidad, es ahora percibido con una sensación muy diferente.

¿Ha cambiado algo realmente? No, sólo es nuestra audición, incapaz ahora de percibir la cohesión de cada racimo (o si lo preferís, incapaz de seguir unas variaciones tan rápidas de amplitud). Ya están tan alejadas las rayas de cada racimo que nuestro oído no las integra como un único estímulo que varía, sino como estímulos diferentes que compiten entre sí por ser oídos. Al igual que un intervalo de segunda menor es muy disonante, estos racimos lo son también. Rayas demasiado próximas para ser percibidas nítidamente individuales y a la vez demasiado alejadas para concebirlas como versiones múltiples de un mismo objeto… Lo dicho, disonancia tímbrica.

Si subimos aún más allá en frecuencia (más allá de unas pocas decenas de Hz.) hay un nuevo cambio. Sigue siendo válida la regla general, por supuesto: hay que realizar la convolución espectral. Es decir: llevamos una réplica del espectro de la moduladora a cada raya que se presente en la portadora. Pero ahora el resultado no tiene nada que ver con la idea del racimo. Llegamos al momento en que directamente escuchamos cada raya por sí misma, sin relación con las demás. ¿Qué es lo que nos suele permitir escuchar varias rayas separadas como un mismo y único objeto o sonido? El que formen una serie armónica. ¿Se produce esto ahora? No. Llegamos a un conjunto claramente inarmónico de rayas. Para facilitaros interpretar el origen de cada raya, os las coloreo:

Rayas demasiado separadas para ser percibidas como un racimo, rayas además en posiciones que no guardan entre sí ningún tipo de relación armónica evidente… Bienvenidos pues al jugoso mundo de las campanas y las relaciones inarmónicas en los parciales de un sonido.

Los puntos golosos: relaciones enteras entre fp y fm

[Índice]

Entre todo ese océano de campanas y disonancias tímbricas, asoman tímidamente algunos puntos dulces que recuperan una sensación armónica. Cuando entre fp y fm existe una relación entera sencilla (por ejemplo una es doble de la otra, o tres cuartas partes, etc.), el conjunto de rayas vuelve a adoptar una configuración que es asimilable en términos de una serie armónica. Os lo ilustro con un ejemplo (tendremos que profundizar más en ello en la próxima entrega).

Si fm es 1/2 de fp, algunas de las rayas debidas a las réplicas del espectro de la moduladora ‘colisionan’ sobre la misma frecuencia (se superponen y suman). Intento hacerlo evidente con la coloración del dibujo. Pero lo que me interesa sobre todo es que veáis que para ese caso particular la nueva formación de las rayas es propia de un peine armónico. Es decir, el sonido que obtenemos no es de ‘campanas’ sino el que asociamos a una nota limpia con su distribución de armónicos, etc.

Podéis apreciar también cómo hemos conseguido que pase a ser el segundo armónico el más fuerte. Pensad lo que significa: sin necesidad de filtrado hemos alcanzado un carácter paso alto… La cosa promete, y no ha hecho más que empezar. Estamos pudiendo generar unas distribuciones espectrales muy diferentes a las de las dos señales (portadora y moduladora) que hemos usado como punto de partida.

Estamos pudiendo generar unas sonoridades muy variadas. Infinidad de campanas de todo tipo, pero también, con un poco de cuidado en la relación entre las frecuencias portadora y moduladora, sonidos armónicos. ¿Se os abre el apetito hacia la segunda entrega?

Antes de cerrar hoy os comento algo que veréis en el final del vídeo. Me interesa que lo entendáis tanto por la cuestión de AM como por lo que vendrá más adelante cuando estudiemos FM.

El ‘aliasing analógico’ por la modulación

[Índice]

Volvamos con las ratios de frecuencia simples y pensemos por un momento en invertir las tornas. Nada nos impide usar una moduladora de frecuencia superior a la propia portadora.

Por ejemplo si fm es 4/3 de fp también resulta una serie armónica. Lo ilustramos primero con senoides en la portadora. Vuelvo a pintar los dos lados del espectro completos, porque sucede algo en lo que tenemos que reparar: alguna de las rayas ‘cruza la frontera’ de la frecuencia cero, y va a caer ‘del otro lado’. Fijaos en la figura. De las tres rayas que como réplica del espectro modulador centramos en la componente ‘azul’ de la portadora hay una (la inferior) que ha ido a caer en fp-fm que en este caso es fp-(4/3)fp y por tanto se sitúa en –fp/3 que es una frecuencia negativa. Pero hemos de pensar que sucede otro tanto con la componente ‘morada’, que acaba generando una componente idéntica pero sobre fp/3 (positiva). Esto nos permite una forma de pensar el efecto de la convolución espectral basada en ‘reflejar’ las componentes que irían a parar en frecuencias negativas hacia las frecuencias positivas.

Más precisamente: podemos concebir la convolución espectral usando sólo la parte positiva del espectro de la portadora y ubicando en cada una de sus rayas una réplica del espectro (bilateral) de la moduladora, siempre y cuando recordemos reflejar hacia frecuencias positivas aquellas componentes que acaben recayendo en frecuencias negativas. Aquí veis cómo hubiéramos concebido el resultado de esta modulación sin necesidad de andar pintando al completo la parte de frecuencias negativas.

¿Os recuerda a algo eso de la ‘reflexión’ de las frecuencias al llegar a una frontera? Sin duda al ‘aliasing’ que estamos acostumbrados a asociar a los sistemas digitales. Pues bien, aquí tenéis un ejemplo de ‘alias’ analógico, de parciales que cuando deberían ‘bajar’ acaban llegando a frecuencia cero, y se dan la vuelta y comienzan a ‘subir’. Os convoco a que lo veáis en vivo y en directo en alguno de los ejemplos que ilustra el vídeo (especialmente el fragmento de cierre del vídeo es bien bonito a este respecto).

Por cierto: aunque en este caso recién visto la serie pueda estar muy incompleta, es suficientemente clara en sus armónicos para generar la sensación de una única nota. La presencia de unos pocos armónicos de orden primo entre sí (en el ejemplo aparecen los parciales 1, 3 y 7) es más que suficiente para generar la sensación de nota única y agregar la percepción de todos ellos como un único objeto sonoro. De hecho no es desconocida esa distribución tan ‘despoblada’ en instrumentos acústicos. Recordad por ejemplo el glockenspiel del que ya os he hecho mención otras veces.

Último ejemplo de hoy

[Índice]

Vamos a repetir lo que acabamos de hacer ( fm = 4/3 fp ) pero ahora con una portadora con varios armónicos, podría ser un diente de sierra por ejemplo. Así podéis usarlo como último ejemplo/ejercicio de hoy. Fijaos cómo cada parcial de la portadora se sustituye por una réplica del espectro (bilateral) de la moduladora y cómo podemos concebir lo de la ‘reflexión’ de la parte negativa, etc.

Fijaos de paso qué configuración final de rayas hemos conseguido, absolutamente inasequible mediante los típicos recursos de filtrado que encontramos en los sintes. Un espectro cargado de picos y valles, de zonas de realce y de anulación, que hubiera exigido un complejísimo sistema de filtrado múltiple.

Continuará

[Índice]

Nos queda por ver lo más jugoso, claro. Ya os dije que hoy era una sesión de teoría, pero importantísima para lo que habrá de venir después (AM, FM, PM, granular y otras cosas como análisis espectral, etc.). Me interesa sobre todo que os acostumbréis a ver eso del espectro simétrico y que entendáis la regla de oro: multiplicar dos señales equivale a realizar la convolución de sus espectros. Intentemos todos dejar esa base asentada (preguntad lo que necesitéis) y así en la siguiente parte la aplicamos, la terminamos de interiorizar de forma definitiva, y nos queda como un recurso al que volveremos varias veces al hablar de otros tipos de síntesis.
Ya os anticipo que es esa nueva entrega os compensaré del esfuerzo realizado en esta con material muy jugoso para la práctica de la síntesis.

Vídeo demo

[Índice]

Te puede interesar