La inteligencia artificial se está utilizando para crear nuevas canciones : Charla general página 22

Khellus escribió:
Las máquinas todavía están lejos de abstraerse del fallo para encontrar una solución a través de la mera casualidad.

En realidad lo que hace la IA es utilizar modelos de probabilidad, con lo que si quieres que de mera casualidad haga algo no hecho antes, sólo tienes que decirle que busque entre las soluciones menos probables o directamente entre las imposibles. Y probablemente aunque necesite probar más veces que un humano, como lo hace sumamente rápido nos acabará superando en algún momento. Aunque aún falta para eso.

Teo Tormo escribió:
con lo que si quieres que de mera casualidad haga algo no hecho antes, sólo tienes que decirle que busque entre las soluciones menos probables o directamente entre las imposibles.

En realidad es algo más complejo que eso, ya que la máquina debería ser consciente de haber descubierto algo o creado algo buscando la solución de algo completamente distinto.

Explicándolo de manera "gruesa", esta excepcionalidad seria parte de un sistema dinámico no lineal muy sensible a variar desde las premisas iniciales. Vamos una locura desde el punto de vista de la probabilidad lineal y mucho más cerca de la todo poderosa teoria del caos.

Pero vamos, toda la razón en que solo es cuestión de tiempo.

Khellus escribió:
Las máquinas todavía están lejos de abstraerse del fallo para encontrar una solución a través de la mera casualidad. Nos sorprenderíamos de saber cuantos avances en todos los campos se han debido a la "potra".

Lo hacen por fuerza bruta. Te pongo un ejemplo: desde finales de los 60 no habíamos conseguido avances en los algoritmos para multiplicar matrices (básico para casi todo y una de las cosas que más potencia de cálculo consume). Deepmind puso a AlphaTensor a encontrar un nuevo algoritmo mejor que los anteriores... y encontró mucho más que eso.

Alguien escribió:
Basándose en AlphaZero, los investigadores entrenaron una nueva versión de esta inteligencia artificial llamada AlphaTensor que, en lugar de jugar al ajedrez, aprendió los mejores pasos para multiplicar matrices, estos pasos representan lo que llamamos algoritmo.

Entonces, el nuevo algoritmo consiguió multiplicar dos matrices de cuatro por cuatro de manera más rápida que el de Strassen. Recordemos que el método que generalmente se enseña en las aulas consta de 64 pasos y de Strassen de 49 pasos.

Ahora tenemos un nuevo método que puede hacer esta operación en 47 pasos. Pero solo estamos mencionando una matriz a modo de ejemplo. AlphaTensor consiguió mejoras en 70 tamaños diferentes de matriz. En otras palabras, un avance estupendo.

https://www.xataka.com/robotica-e-ia/multiplicar-matrices-vital-para-informatica-cotidiana-deepmind-ha-encontrado-forma-mejor-hacerlo

Puede parecer poca cosa, pero no lo es. Es una prueba más de que las IAs pueden resolver problemas complejos con soluciones innovadoras.

VI Lex escribió:
Me voy a ChatGTP y le digo

ChatGPT no es todas las IAs, es un modelo lingüistico. Hace muy bien algunas cosas y no tan bien otras, dentro de las limitaciones del modelo. ChatGPT no es el final, es el principio de lo que va a venir.

Hace algunas semanas comentamos el artículo que había publicado Chomsky refutando que los modelos de lenguage extremadamente grandes que se están utilizando fuesen señal alguna de inteligencia. Para Chomsky nacemos con las reglas básicas que nos permiten aprender y utilizar el lenguage, probablemente las heredamos y es algo biológico... afirmación que ha sido ampliamente discutida. La caja negra.

Noam Chomsky escribió:
La mente humana no es, como ChatGPT y otros similares, un motor estadístico torpe para el análisis de patrones, que se nutre de cientos de terabytes de datos y extrapola la respuesta conversacional más probable o la respuesta más probable a una pregunta científica. Por el contrario, la mente humana es un sistema sorprendentemente eficiente e incluso elegante que opera con pequeñas cantidades de información; no busca inferir correlaciones brutales entre puntos de datos, sino crear explicaciones.

Por ejemplo, un niño pequeño que adquiere un lenguaje está desarrollando, inconscientemente, automáticamente y rápidamente a partir de datos minúsculos, una gramática, un sistema increíblemente sofisticado de principios y parámetros lógicos. Esta gramática puede entenderse como una expresión del "sistema operativo" innato e instalado genéticamente que dota a los humanos de la capacidad de generar frases complejas y largos trenes de pensamiento. Cuando los lingüistas buscan desarrollar una teoría sobre por qué funciona un determinado lenguaje como lo hace ("¿Por qué se consideran gramaticales estas frases, pero no aquellas?"), están construyendo consciente y laboriosamente una versión explícita de la gramática que el niño construye instintivamente y con una exposición mínima a la información. El sistema operativo del niño es completamente diferente al de un programa de aprendizaje automático.

En resumen, ChatGPT y sus congéneres son incapaces constitucionalmente de equilibrar la creatividad con la restricción.

Pero el equipo de IA de Microsoft publica un paper porque ve en ChatGPT "destellos de inteligencia generalista"... básicamente plantearle problemas espaciales o que requieran un modelo del mundo y ver que los resuelve. Tengo un vaso con una pelota de ping pong dentro, estoy en el dormitorio, me voy al salón, vuelco el vaso, me voy a la cocina ¿dónde está la pelota?. Quiero apilar un libro, un ordenador portátil, dos vasos de papel y media docena de huevos ¿cuál es la mejor forma de hacerlo?.

Los "negacionistas de la IA" te dirán que te da respuestas por analogía a problemas que están en su entrenamiento, lo que es razonable. Los "creyentes" te dirán que se trata de habilidades emergentes que la IA adquiere sin haber sido entrenada para eso.

El debate está ahí. Si los "negacionistas" tienen razón estos sistemas seguirán mejorando la calidad de sus respuestas pero no serán nunca inteligentes en el sentido humano de la palabra. Si los "creyentes" tienen razón habrá un momento en que los modelos serán lo bastante potentes como para mostrar comportamientos y razonamientos humanos de forma más o menos espontánea.

El otro día le daba vueltas a una idea: ¿y si el set de reglas de Chomsky no reside en la biología si no en el lenguaje mismo? ¿Y si está embebido en el lenguaje? Al darle la capacidad de aprendizaje a la IA la hemos dotado de la caja negra, del set de reglas del que deriva el pensamiento.

No se la respuesta, pero joder, ¡qué tiempos estos para estar vivo!

Teo Tormo escribió:
Y probablemente aunque necesite probar más veces que un humano, como lo hace sumamente rápido nos acabará superando en algún momento. Aunque aún falta para eso.

Ya está ocurriendo. Tienes AlphaTensor del que he hablado antes. Pero también AlphaFold que ha derivado la estructura tridimensional de 200 millones de proteínas, uno de los problemas básicos de la química orgánica e increíblemente útil para el desarrollo de fármacos.

https://alphafold.ebi.ac.uk/

Alguien escribió:
Pese a las grandes implicaciones y el punto de inflexión que puede marcar en la investigación en biología, y en general, en la investigación biomédica parece que no ha tenido apenas relevancia entre el gran público.

La relación entre las proteínas y la enfermedad se da en un gran porcentaje de las mismas. Fallos en el plegamiento de las proteínas suponen enfermedades raras y no tan raras. Conocer la estructura de proteínas clave de agentes patógenos también es importante para desarrollar tratamientos.

Por ejemplo, en el caso más reciente: la covid-19. La proteína S (o spike) de la cápsula del coronavirus es la que se une a los receptores (ACE) de nuestras células. Conocer cómo es la proteína S y su estructura permite desarrollar (o estimar la utilización de fármacos ya existentes) que limiten la unión de los virus a nuestras células y por tanto, su entrada.
Imagen tridimensional de la proteína S del SARS-Cov-2. Autor: National Institute of Allergy and Infectious Diseases (NIAID)

Otra enfermedad igualmente actual pero eclipsada por la pandemia que se debe a errores en el plegamiento de las proteínas es el Alzheimer donde el plegamiento incorrecto del péptido-β-amiloide (Aβ42) provoca las placas amiloides (el péptido correctamente plegado protege del estrés oxidativo, activa quinasas…). La enfermedad de Parkinson, la ELA, y el cáncer son otras enfermedades para las que conocer el plegamiento incorrecto de las proteínas es muy importante.

https://cienciaybiologia.com/alphafold-proteinas/

Khellus escribió:
En realidad es algo más complejo que eso, ya que la máquina debería ser consciente de haber descubierto algo o creado algo buscando la solución de algo completamente distinto.

Tanto AlphaFold como AlphaTensor son IAs derivadas de un modelo entrenado para "jugar" (ajedrez, go) y se las entrenó para solucionar problemas de química y matemáticas como si fuese un juego.

La gente se resiste a aceptarlo, pero yo diría que nos encontramos delante de un avance equiparable al fuego, la ruega, la imprenta o la máquina de vapor... pero muchos órdenes de magnitud mayor. Kurzweil was right.

Klaus Mari Kong escribió:
Lo hacen por fuerza bruta. Te pongo un ejemplo: desde finales de los 60 no habíamos conseguido avances en los algoritmos para multiplicar matrices (básico para casi todo y una de las cosas que más potencia de cálculo consume). Deepmind puso a AlphaTensor a encontrar un nuevo algoritmo mejor que los anteriores... y encontró mucho más que eso.

Khellus escribió:
Explicándolo de manera "gruesa", esta excepcionalidad seria parte de un sistema dinámico no lineal muy sensible a variar desde las premisas iniciales. Vamos una locura desde el punto de vista de la probabilidad lineal y mucho más cerca de la todo poderosa teoria del caos.

Calcular una variable no lineal a través de la fuerza bruta es extremadamente ineficiente e ineficaz hoy en día, y no te digo nada si tiende a un sistema dinámico donde las premisas iniciales cambian continuamente.

Khellus escribió:
Calcular una variable no lineal a través de la fuerza bruta es extremadamente ineficiente e ineficaz hoy en día, y no te digo nada si tiende a un sistema dinámico donde las premisas iniciales cambian continuamente.

No digo que sean la solución para todo. Pero cosas como los algoritmos de multiplicación de matrices pueden llevarnos 20 o 50 años para encontrarlos, AlphaTensor los encontró en poco menos de una semana.

Bueno, amanecemos con nuevo correito de Audiojungle. Lo voy a pegar entero para el que lo quiera leer y quiera extraer sus propias conclusiones. Pero para mí es un "donde dije digo, digo Diego" en toda regla. ¿Acaso significa que tanta gente ha empezado a retirar sus tracks, que han dado un pasito atrás? No lo sé, es una conjetura mía. Aquí el email en cuestión:

-----------------------------

Hi there,

We are reaching out to you today to address the upcoming changes on 1 June 2023 to our current Elements Author Agreement and Envato Market Author Terms and how they impact our audio Authors, like yourself.

As you well know, Envato is home to a broad range of item categories, with terms and conditions common to all item types. While these terms apply to all of our creative contributors, we want to be transparent about our current plans in the audio space.

We would like to assure you that beyond internal-use to improve the quality of our product offering (for example, search and discovery enhancements using AI-powered music tagging), we have no immediate plans to use your audio items in third party licensing/distribution arrangements including/or as part of Generative AI services.

You will have the opportunity to opt out of use of your audio items in third party licensing arrangements such as a reseller and/or building AI solutions to generate music or other audio.

If we plan to start using audio items for these types of arrangements (including reseller arrangements or generative AI), we will provide you with reasonable notice that we intend to commence such use, and also provide you with the opportunity to opt-out of being included as part of these types of arrangements going forward. This will be a one-off notice and opt-out that will be provided before initial use of audio items in third party licensing arrangements commences. To avoid doubt, should you elect to opt-out, this will not affect your ability to continue to sell your items on Envato’s sites as normal.

As the audio landscape continues to evolve and the intersection of AI and music licensing matures, we are closely observing the advancements in this space to evaluate viable opportunities. We do not want to rule out the possibility of Envato including audio items in third party licensing arrangements in the future. That being said, we want to again emphasize that there are no immediate or upcoming plans to use your audio items in any third party licensing/distribution arrangements, including/or as part of Generative AI services.

We genuinely appreciate your contributions to our Audio community and importantly, the feedback and insights you have shared with us. Your voices have been heard and have helped us understand your pain points. We hope this update helps alleviate the major themes of concerns you have shared with us.

Once again, thank you for the open dialogue, and we look forward to navigating the road ahead together.

Many thanks,

Team Envato

--------------------------------------

Yo personalmente no voy a retirar mis tracks de ningún sitio. Por mucho que me escueza, el entrenamiento de AI's con nuestro material va a ocurrir antes o después, nos guste o no, nos lo notifiquen o no. Pero vamos, es para darles una bofetá a estos de Envato.

Un saludo.

Hay iniciativas muy interesantes como Iamus, desconozco si de ha citado a lo largo del hilo.
» Vico en la Universidad de Málaga ha desarrollado un ordenador llamado “Iamus” capaz de componer música clásica. Iamus ha escrito obras que han sido interpretadas por la Orquesta Sinfónica de Londres y ha sido capaz de engañar a críticos musicales (que fueron incapaces de saber que habían sido compuestas por una máquina). Iamus ha sido desarrollado en la startup Melomics y ha sacado al mercado varios discos (donde su música es interpretada por humanos). Toda una demostración práctica de que las inteligencias artificiales también pueden ser creativas y de que no hay tanta diferencia entre la creatividad humana y la de las máquinas. »

Pero, desde mi punto de vista, y sin restarle mérito, eso es darle las reglas de la Armonía clásica y demás añadido, Composición, Orquestación, etc, a una máquina y ponerla a funcionar.
Eso también puedo hacerlo yo, escribir un motivo a 4 partes siguiendo dichas las reglas, (las que conozco) y sin escuchar lo escrito saber que "sonará" bien.
Ojo, no me estoy poniendo a la altura de la máquina, es para ilustrar que con el Conocimiento adecuado se puede escribir música sin escucharla previamente, sólo "conociendo las reglas".

Klaus Mari Kong escribió:
ChatGPT no es todas las IAs, es un modelo lingüistico. Hace muy bien algunas cosas y no tan bien otras, dentro de las limitaciones del modelo. ChatGPT no es el final, es el principio de lo que va a venir.

Hombre, eso es más que evidente, lo usé simplemente para ilustrar.
En todo caso es muy interesante porque es un modelo muy accesible al gran público, de hecho lo han puesto tan accesible para que los desarrolladores "aprendan a hacer que la máquina aprenda".

Otra evidencia de que (todavía) no es inteligente;
-Le pido una progresión de 8 acordes que no siga las reglas de la armonía clásica ni moderna en la que no debe repetir ningún acorde, estos pueden ser con la 7ª, incluir la 9ª como tensión, y excluyendo acordes aumentados y disminuidos.
Después de varios intentos lo hace bien. Ok.

-A continuación le pido que me describa la posible función tonal de cada acorde.
Dada la singularidad de la progresión (no seguir las reglas de la armonía) lo hace razonablemente correcto.

-También le pido que me diga que escalas corresponden a cada acorde.
Comete errores (lógico, hay criterio subjetivo por la peculiaridad de la progresión) pero lo vuelve a hacer razonablemente correcto.

Y a continuación viene la "gran cagada"...
-Le pido que me dé las notas comunes de esas escalas entre el acorde anterior y el posterior del acorde en curso.
Esto no tiene nada que ver con el Conocimiento, es un simple ejercicio matemático. 8 conjuntos con 7 elementos y buscar los elementos comunes entre cada conjunto.
A pesar de muchos intentos no hay forma de que lo haga correctamente.

Saludos!

VI Lex escribió:
-Le pido una progresión de 8 acordes que no siga las reglas de la armonía clásica ni moderna en la que no debe repetir ningún acorde, estos pueden ser con la 7ª, incluir la 9ª como tensión, y excluyendo acordes aumentados y disminuidos.
Después de varios intentos lo hace bien. Ok.

Es que es un motor semántico, para texto, no ha sido entrenado para temas musicales. Lo asombroso es que te de siquiera un resultado aceptable dado que se basa en su entrenamiento sobre los textos que hablan del tema. De hecho a eso me refería con lo que llaman "habilidades emergentes", cosas que hace más o menos bien sin haber sido entrenado para eso.

Pero no va a tardar (un par de meses supongo) en aparecer un modelo entrenado sobre lenguaje musical... y entonces apaga y vámonos. A no mucho tardar tendremos modelos que orquestan a partir de imágenes de vídeo, ya lo verás.

Klaus Mari Kong escribió:
De hecho a eso me refería con lo que llaman "habilidades emergentes", cosas que hace más o menos bien sin haber sido entrenado para eso.

Alguien escribió:
Estos modelos supuestamente tienen una directiva: aceptar una cadena de texto como entrada y predecir lo que viene a continuación, una y otra vez, basándose únicamente en estadísticas. Los informáticos habían anticipado que la ampliación mejoraría el rendimiento de las tareas conocidas, pero no esperaban que los modelos manejaran repentinamente tantas tareas nuevas e impredecibles.

Investigaciones recientes, como en la que trabajó Dyer, han revelado que los LLM pueden producir cientos de habilidades «emergentes», tareas que los modelos grandes pueden completar y los modelos más pequeños no, muchas de las cuales parecen tener poco que ver con el análisis de texto. Van desde multiplicar hasta la generación de código informático ejecutable y, aparentemente, la decodificación de películas basándose en emojis. Nuevos análisis sugieren que, para algunas tareas y algunos modelos, existe un umbral de complejidad más allá del cual la funcionalidad del modelo se dispara. (También sugieren un lado oscuro: a medida que aumentan en complejidad, algunos modelos revelan nuevos sesgos e inexactitudes en sus respuestas).

https://culturacientifica.com/2023/04/12/emergencia-en-los-grandes-modelos-de-ia/

https://www.jasonwei.net/blog/emergence

Cuando el modelo es lo suficientemente grande aparecen habilidades no previstas.

Klaus Mari Kong escribió:
Cuando el modelo es lo suficientemente grande aparecen habilidades no previstas.

Klaus Mari Kong escribió:
a medida que aumentan en complejidad, algunos modelos revelan nuevos sesgos e inexactitudes en sus respuestas

La teoría del caos en todo su esplendor...

1

VI Lex escribió:
Pero, desde mi punto de vista, y sin restarle mérito, eso es darle las reglas de la Armonía clásica y demás añadido, Composición, Orquestación, etc, a una máquina y ponerla a funcionar.
Eso también puedo hacerlo yo, escribir un motivo a 4 partes siguiendo dichas las reglas, (las que conozco) y sin escuchar lo escrito saber que "sonará" bien.

Bueno, has roto mis retinas, y has captado mi atención, tanto es así que me he puesto a escuchar tus videos.. estos textos como gancho que escribes son geniales para entrar en tu perfil, también me he puesto a escuchar lamus:

sobran las palabras :manso:

Desde mi punto de vista es infinitamente mas difícil componer una pieza de clásica, que hacer de Quicy Jones y COMPONER billie jean..

Ojo que he comparado a la recien creada Lamus con el top de la composicion pop Quincy Jones, sin embargo.. a nivel de complejidad no hay color..

Algunos dirán, "simplicity is the key", creo que la ia se acabara hartando de hacer de los Beatles.

VI Lex escribió:
Eso también puedo hacerlo yo, escribir un motivo a 4 partes siguiendo dichas las reglas, (las que conozco) y sin escuchar lo escrito saber que "sonará" bien.

4 escribió:
Bueno, has roto mis retinas...

Mira que lo siento, si la causa es lo que he destacado, escribir un simple motivo a 4 partes, ya es de flipar. Y mira que tuve cuidado de elegir "motivo"...
Si la causa son mis vídeos, pues que le vamos a hacer, me gusta lo que hago y admito de buen grado la buena y la mala crítica.

4 escribió:
estos textos como gancho que escribes son geniales para entrar en tu perfil,

Desconocía completamente esa faceta mía, "escribir textos como gancho", y sobretodo, la "genialidad" de dicha acción.
También cabe la posibilidad de tal faceta no exista y que tengas una forma algo "ensortijada" de ver las cosas.

4 escribió:
Desde mi punto de vista es infinitamente mas difícil componer una pieza de clásica, que hacer de Quicy Jones y COMPONER billie jean..

A mi nivel, que es el que es, sin pretensiones, me resulta igual de difícil. El objetivo en Billie Jean, soy bajista, era conseguir un arreglo "aceptable, creíble" con una línea de bajo diferente.
Escribir a 4 partes para una sinfónica es cuestión de 2 cosas.
-Conocimiento, muy amplio y diverso.
-Creatividad.
También lo hago, pero "a mi nivel"... Te dejo un adjunto de un esbozo en el que estoy trabajando, es un pequeño fragmento de la parte que empieza a sonar a algo.

4 escribió:
Ojo que he comparado a la recien creada Lamus con el top de la composicion pop Quincy Jones, sin embargo.. a nivel de complejidad no hay color..

Es Iamus, lo he puesto para aportar al hilo algo relacionado con el hilo. Personalmente no lo veo interesante a nivel musical, he escuchado varias piezas y ninguna me ha emocionado, como tampoco otras tantas humanas.
Según algunas de las opiniones vertidas en el hilo es una cuestión de tiempo que una IA por pura estadística cree algo que emocione.

Saludos!

Archivos adjuntos ( para descargar)

Cima Sol_004.mp3

Os dejo link a lo último de Facebook, MusicGen. En base a una descripción de texto, generan 30 segundos de audio.

https://ai.honu.io/papers/musicgen/

Lo más curioso es como inyecta melodías con el "Melody conditioning".

1

También lo de hacer vídeos surrealistas con IA tiene su salida.

Vin Diesel chupando diesel, etc.