Hombre me refiero a que una vez que se conoce la teoria ( hipotesis ) se puede comprobar empiricamente y verificar que el planteamiento teorico se confirma ( tesis ). Yo creo que es fundamental conocer un pelin de teoria, el mp3 es un sistema estadarizado y tabulado en documentos de varias decenas de paginas, como veras yo he resumido en plan redaccion de 500 palabras la idea fundamental. Y digo que es necesario, porque del planteamiento practico saldran ciertos resultados, que si conocemos previamente la teoria podremos tener el suficiente juicio como para conocer la veracidad de nuestros resultados obtenidos, si no iriamos dando palos de ciego a ver que conclusiones sacariamos, y dependeriamos explicitamente de que todos los experimentos hayan llegado a buen puerto.
Conociendo la teoria incluso podemos hacer experimentos mas interesantes. Os dejo uno a continuacion. Crearos una par de tracks, en el primero poner un bombo ( con un nivel generoso ) y unos platillos ( tipo charles o sucedaneos con menos nivel ) y comprimirlo a 64 kbits segundo. En el segundo track poner solo los platillos y comprimirlo a 64 Kbits/segundo, y contarme que es lo que sucede.
Para todos los amantes de los numeros sigamos haciendo calculos ( leer solo en caso de que quieras aprender nociones teoricas )
Bueno pues eso unos numeritos con calculadora, supongamos que cojemos la salida de bits a la salida de las etapas de muestreo ( PAM ) y cuantificacion ( PCM ) pero que aun no lo hacemos pasar por el codificador de canal. La codificacion de canal en un sistema consiste en la modulacion de los datos obtenidos a la salida del PCM, con una señal previamente conocida y con unas determinadas caracteristicas ( favorables a nuestro sistema de transmision ) de tal manera que la salida obtenida de esta modulacion es una señal mucho mas robusta y resistente a errores en los sistemas, una señal PCM no se puede escribir tal cual en un sistema fisico ya que las posibles errores que se podria suceder serian realmente alarmantes. La codificacion de canal a menudo aumenta el flujo de bits mediante una redundancia y una serie de metadatos para que los siguientes sistemas de deteccion y correccion de errores sepan como han de trabajar. La codificacion de canal y los metodos de correccion de errores es un tema como los campos de castilla, que ves el principio, pero a saber hasta donde llegan
es mas son numerosisimos los metodos para hacer mas robustas determinadas señales y en muchas ocasiones se utilizan varios de estos metodos para añadirle mas robustez si cabe, por eso para no meter mas tedio al tema, obviaremos la codificacion de canal, si alguien le interesa le puedo citar bibliografia para conocer acerca del tema.
Bueno pues teniendo claro que hemos decidido medir nuestra señal antes del codificador de canal ( que añade redundancia y produce un mayor numero de bits ) cojamos calculadora en mano para conocer el regimen binario de una señal por ejemplo de un cd en cuanto a PAM y PCM.
Tenemos 44.100 muestras de 16 bits por 2 canales esto produce un regimen binario de 1410 Kbits/s, si los comparamos con la mejor tasa binaria del mp3 tendremos una relacion de reduccion media de 4,4 lo cual ya es significativo, y con la peor tasa binaria tendremos de 22
joer esto es ya metiendo el hacha a lo Atila.
Si mal no me falla la memoria el regimen de 64 Kbits/s es un regimen estatico, lo cual hace que nuestro sistema utilice unos valores de compresion o mejor dicho de recuantificacion totalmente dinamicos, es decir puede suceder que durante una determinada transmision de datos, solo haya frecuencias agudas y por tanto no se produzca un enmascaramiento por lo tanto el algoritmo de mp3 debera dejar pasar esta trama sin poder hacer nada, la trama llega a un buffer intermedio y el buffer le dice al algoritmo " macho que aqui no has reducido nada, aplicate un poco en las siguientes tramas " con lo cual el algoritmo va a tener que recuantificar con el doble de esfuerzo las siguientes tramas puesto que hay tramas que no las ha podido recuantificar, la salida del buffer es siempre en este caso de 64 Kbits/s por lo tanto si ha habido una trama que no se ha recuantificado la siguiente trama se recuantificara mas duramente para acercar el valor de salida del buffer a la tasa prefijada, realmente es el buffer el que nos dice cuales han de ser los siguientes valores de recuantificacion para obtener la deseada tasa binaria. Con lo cual vemos que la compresion no es estatica, si no que es dinamica y que el grado de recuantificacion es variable con respecto a las tramas anteriores, pudiendo incluso superar los 22 antes citados. Para reducir un 22 necesitaremos despreciar al menos 5 bits, por lo tanto la recuantificacion a veces puede ser incluso inferior a los 12 bits. Con esto nos podemos imaginar como sonaran las frecuencias agudas.
Para comprobarlo empiricamente ya que la teoria en si es un rollete podeis generaros dos tonos puros uno de baja frecuencia con un buen nivel y otro de alta frecuencia de bajo nivel, le aplicais una compresion de 64 Kbits/s y luego volveis a descomprimirlo, para obtener otra vez el archivo en wav. Al archivo en wav lo filtrais paso banda en la zona del tono agudo y escuchar tan solo el tono y lo comparais con el original a ver que os parece.
Creo que os he citado algunos ejemplos bastantes interesantes acerca del mp3, intentar hacerlos en casa, y tras conocer la breve teoria que os he puesto sacar vuestras propias conclusiones.
Suerte