Si se trata de géneros musicales muy "aplastados" (en términos de dinámica), te basta con normalizar por el valor de pico los traks y más o menos se oirán todos al mismo volumen. Cualquier editor de audio te provee de la opción "normalize".
Si la dinámica de los tracks es muy variante, o hay picos muy pronunciados puede que la normalización de pico no sea la mejor estrategia, entonces ya deberías normalizar por RMS (i.e. "energía sonora" en un intervalo de tiempo). La cosa es que para normalizar respecto a RMS debes establecer una ventana de tiempo que puede ser muy corta, corta, larga o muy larga, a elección... aquí Euridia te explica cosillas sobre las normativas ITU-BS.1770 y EBU R128, que regulan precisamente la nivelación a nivel estándar:
https://www.hispasonic.com/reportajes/normativa-broadcast-ebu-r128-produccion-musical/6792
Aún y con esto, la norma no te va a quitar de que psicoacústicamente oigas más alto un track que otro... siempre hay el factor humano.
Desconozco si hay algún programa para hacer todo esto, estoy seguro que lo hay. Youtube hace algo parecido con los volumenes, pero no exactamente lo mism..., yo me llegué a programar en MATLAB un algoritmo que hacia un "nivelado casero" en batch processing de un conjunto de tracks alojados en una carpeta, de modo que si debes nivelar 1000 tracks es el mismo trabajo que nivelar 10: darle al botón.
Cuando dices los tracks de una sesión.... dices que tienes una sola pista de audio (archivo wav/mp3) y en él hay distintas canciones una detrás de la otra, que quieres nivelar? entonces el problema se complica un poco, porque el programa no tiene modo de saber a priori dónde acaba un track y empieza el otro
La otra es usar el FL Limiter con tiempos de integración muy largos
En fin, espero haberte ayudado