¿Cómo componen las máquinas? La inteligencia artificial en la música
¿Es una máquina capaz de componer? Si bien la pregunta parece el eslogan de una película de ciencia ficción, tiene una respuesta muy real a día de hoy. El cerebro humano ha desarrollado la capacidad de razonar a partir de las experiencias vividas. Somos en realidad “sistemas con memoria” y por ello, nuestras decisiones (incluso aquellas más elementales) se basan en nuestras vivencias, errores y aciertos. Es por eso que comprender la forma en que nuestro cerebro trabaja, cómo da las órdenes para andar o mover un brazo, ha sido clave para desarrollar prótesis de alta tecnología para aquellos que han perdido alguna extremidad o bien nacieron sin ella, y pese a que el cerebro aún sigue siendo un gran desconocido, cada vez se hacen mayores avances en ese terreno.
Reconocer las propiedades de los objetos que nos rodean nos ayuda a distinguirlos y consecuentemente nos ayuda a tomar una u otra decisión. En realidad, cada día tomamos una gran cantidad de decisiones; algunas son más complejas, pero la mayoría son tan básicas que ni siquiera somos conscientes de ellas. Para tomar estas decisiones debemos disponer de ciertos “datos” de antemano: por ejemplo, distinguir los colores nos permite saber cuándo podemos cruzar la calle y cuando debemos aguardar. Si bien la elección del rojo y el verde para indicar prohibición y permiso respectivamente es arbitraria y responde meramente a un convenio o un criterio cultural, todos tenemos muy asumido lo que significan estos colores en ese contexto, porque lo hemos aprendido.
De un modo menos binario (verde/rojo, 1/0), distinguimos palabras y les asociamos un significado. Más aún, somos capaces de otorgar un significado distinto a una misma palabra en función de la sentencia en la que se encuentra... y por añadir una capa adicional al proceso cognitivo, también somos capaces de dar significados distintos a sentencias idénticas dependiendo del contexto. Todas estas decisiones, es decir, todos los significados que otorgamos a las palabras están muy condicionados por el aprendizaje previo.
La música no queda fuera de esta ecuación: nos parecen agradables al oído determinados patrones rítmicos, determinados intervalos musicales, determinados acordes y determinadas escalas, porque las hemos escuchado desde pequeños, nuestro cerebro ha aprendido a asociarles significado y a distinguir aquello que le gusta de aquello que no. Las 12 notas cromáticas de la escala temperada, por ejemplo… ¿por qué 12 y no 10? Por tradición y costumbre –igual que el rojo y el verde–, por aprendizaje.
¿Somos los únicos seres capaces de aprender? no. ¿Es una máquina capaz de aprender? sí, pero debemos enseñarle apropiadamente. En esto consiste el Machine Learning (aprendizaje automático). Se entrena la máquina con “datos” (léase el término de la forma más general posible) y se le indica a qué clase pertenecen dichos datos en el proceso de aprendizaje. Siguiendo el ejemplo del rojo y el verde, para entrenar la máquina deberíamos proporcionar muestras de diferentes tonos de verde y diferentes tonos de rojo, indicando a qué clase pertenece cada tono. Podemos poner a prueba nuestra máquina tras haberle enseñado, y ésta debería ser capaz de decidir si un nuevo tono (diferente pero semejante al de los datos de entrenamiento) es rojo o verde, por aproximación de máxima similitud.
Los resultados del Machine Learning en el campo del reconocimiento y transcripción del habla están hoy presentes en nuestros teléfonos móviles: podemos dictarle al teléfono una dirección y éste nos muestra la ruta que debemos tomar para llegar ahí. Por supuesto que se equivoca, pero os habréis dado cuenta que, comparado con unos años atrás, estos mecanismos se equivocan cada vez menos, pues aprenden progresivamente conforme adquieren nuevos datos.
¿Es la música distinta al habla? a efectos de Machine Learning no tanto, pues en el fondo se basa en patrones y aprendizaje. Ya existen antecedentes en este campo que buscan precisamente crear un algoritmo capaz de crear música por sí solo basado en la descrita técnica de Machine Learning. Es el caso de Melomics109, el cluster de ordenadores que incrementa la potencia del antiguo Iamus del que ya hablamos en 2012. Ha sido capaz de componer una pieza minimalista como esta a partir de midi scores como datos de entrenamiento:
Recientemente Google Brain Team también ha desarrollado el proyecto Magenta. He aquí la creación que nos presenta:
En este caso la composición de Magenta es un tanto simple, parecida a la primera composición que realizaría un niño –exceptuando a Mozart ;) –. Pero en esto consiste precisamente: es un niño capaz de aprender, no un algoritmo cerrado; nuevos datos de entrenamiento pueden permitir al sistema componer cada vez mejor, con la sustanciosa ventaja de que una máquina puede absorber estos datos de entrenamiento de forma mucho más rápida.
De ser así, ¿llegará el día en que la composición de una máquina sea indistinguible de la composición humana? y en tal caso, ¿la música creada por una inteligencia artificial (IA) reemplazará al humano? ¿o bien los humanos rechazarán la música de una IA, por el mero hecho de saber que no es humana? Nos aguarda algo que aún no podemos imaginar: máquinas haciendo arte y que aprenden solas y más deprisa. ¿Estamos ante la revolución de las máquinas?