En 2021, la gran mayoría de los oyentes consumen música a través de servicios de transmisión
Y Aunque siempre tendrán sus fans, los días de LP, cintas, CD e incluso descargas de MP3 que son los estándares para el consumo de música están menguando. Como ingenieros de audio, es fundamental comprender lo que sucede cuando cargamos una versión final de nuestras canciones a los servicios de transmisión, ya que esto es lo que probablemente escucharán la mayoría de los oyentes.
Uno de los mayores actores de la transmisión, Spotify, acaba de actualizar su información sobre la normalización de la sonoridad y los formatos de archivo, por lo que pensamos que sería un buen momento para analizar las partes más importantes y desglosar lo que significa para nosotros como productores de música y audio. ingenieros.
Sin embargo, tenga en cuenta que las plataformas como Spotify no son estáticas; evolucionan y los estándares se actualizan con el tiempo. Depende de nosotros mantenernos a la vanguardia y estar informados.
Cuando Spotify introdujo por primera vez la reproducción normalizada por sonoridad en su plataforma, el propósito era crear una mejor experiencia auditiva para los usuarios (siguiendo los pasos de la radio terrestre y iTunes de Apple). En lugar de tener que ajustar el volumen al alternar entre canciones, Spotify mediría el volumen de percepción y ajustaría el volumen por usted. ¡Bonito y fácil! Pero ya sea que lo supieran en ese momento o no, esta conciencia acelerada sobre la normalización del volumen entre productores e ingenieros, influyendo cada vez más en el sonido de la producción musical en general.
En el mundo del audio digital, existe un nivel de pico de muestra máximo para un archivo al que nos referimos como 0 dBFS (decibelios a escala completa). Si sus niveles superan los 0 dBFS cuando rebota un archivo, se recortará digitalmente a un máximo de 0 dB (y probablemente suene bastante desagradable). Puede resolver esto con un limitador como el
Ozono
Maximizer , que se asegura de que ninguna muestra supere el “techo”. Al mismo tiempo podemos bajar el umbral, limitando más la señal. Si bien el nivel máximo de la muestra no aumentará, la sonoridad percibida aumentará considerablemente. La tendencia en este aumento en la sonoridad percibida es lo que comúnmente llamamos la ” Guerra de la sonoridad “.
Históricamente, los métodos utilizados para determinar la sonoridad del audio se basaban completamente en mediciones de amplitud y no consideraban la sonoridad percibida. En 2006, la Unión Internacional de Telecomunicaciones (UIT) presentó la primera versión de sus “Algoritmos para medir el volumen del programa de audio y el nivel de audio de pico real”. Esto incluyó LUFS (unidades de sonoridad a gran escala). Una de las primeras aplicaciones fue crear más coherencia entre el volumen de un programa de televisión y la pausa comercial, rechazando esos anuncios súper ruidosos que llamarían su atención a mediados de la década de 2000. Ahora, Spotify y otros servicios de transmisión están utilizando versiones actualizadas de los mismos algoritmos para establecer los niveles de reproducción de cada canción y álbum.
Con el fin de crear la misma consistencia para los oyentes de música, Spotify y algunos otros servicios de transmisión “normalizan el volumen” de las canciones, o las configuran al mismo nivel estándar utilizando varios sistemas, incluido el LUFS integrado. En 2021, Spotify adoptó un nivel estándar de -14 LUFS integrados. ¿Qué significa eso en la práctica para los ingenieros de audio? Usando una aplicación como RX, podemos ver lo que sucede durante este proceso de normalización, que haremos ahora. Usaré mi última canción llamada “Please, Go” como ejemplo:
En la ventana Estadísticas de forma de onda RX, puede ver el volumen integrado de un archivo de audio. Mi canción tiene una medida de sonoridad integrada de -11,2 LUFS. Lo conveniente de las unidades de sonoridad es que escalan igualmente con dB. Para normalizar mi canción a -14 LUFS, todo lo que necesito hacer es reducir la ganancia en 2.8 dB:
Podemos ver que la canción ha sido rechazada, pero eso es todo lo que está sucediendo. No es que Spotify esté usando compresión de rango dinámico en mi canción, simplemente aplicando ganancia negativa. Esta puede ser una técnica realmente útil al masterizar, porque ahora que mi canción está en los niveles de volumen de Spotify, puedo hacer una comparación A / B con cualquier otra canción de referencia en la plataforma.
A modo de demostración, mostraré lo que sucedería si hiciera un master mucho más fuerte bajando el umbral de Maximizer en 3 dB:
Sin cambiar el nivel máximo, he aumentado el volumen de mi maestro. Los coros ahora se parecen más a rectángulos sin bordes que sobresalgan. Ejecutando las mismas matemáticas simples:
14 – 8,6 = 5,4
Entonces, Spotify reducirá este nuevo maestro en 5,4 dB para normalizarlo a -14 LUFS.
Lo realmente interesante es hacer zoom en la forma de onda y comparar el maestro fuerte y fuerte con el original después de que ambos se hayan normalizado:
Podemos ver que todo lo que hemos hecho es cortar los picos de la batería, agregando distorsión. En el mundo de los CD con normalización de pico de muestra, cuando las pistas no se normalizaban de acuerdo con su volumen percibido, tenía sentido presionar el limitador con fuerza. Ahora que estamos en la era de la transmisión normalizada por sonoridad, la medida en que presionamos el limitador es más un factor de nuestra expresión creativa que un requisito técnico. ¡Solo presionarlo por presionarlo no le está haciendo ningún favor a nuestra canción en las plataformas de volumen normalizado!
Puede escuchar las dos versiones después de la normalización aquí:
Spotify recomienda que apunte a -14 LUFS para su canción. Si hace esto, Spotify no aplicará ningún aumento o disminución en la ganancia, y su canción se reproducirá en Spotify exactamente al mismo nivel de amplitud en el que la rebotó.
Le recomendamos que experimente con diferentes niveles de sonoridad, normalice las pistas usted mismo con el procedimiento anterior y luego las compare con canciones de referencia en Spotify.
Puede ser fácil confundirse acerca de la “compresión” y la normalización del volumen. Por lo general, estamos más familiarizados con la compresión de rango dinámico (piense en compresores y limitadores), pero la compresión de datos que ocurre al convertir audio a diferentes códecs es un poco diferente.
El códec más famoso es MP3, pero Spotify opta por utilizar un códec gratuito de código abierto llamado OGG Vorbis. (Esto lo hace una organización llamada Xiph, que también fabrica el códec FLAC). Debido a que OGG es una forma de compresión de datos con pérdida, necesariamente implica cierta compresión de rango dinámico para realizar esta conversión. La compresión de datos en un códec sin pérdidas, como FLAC, no implicaría la misma compresión de rango dinámico.
Dependiendo de la configuración de Calidad de transmisión de un usuario en sus preferencias de Spotify, obtendrán una tasa de bits diferente. La calidad muy alta le da 320 kbps, alta es 160 kbps y normal es 96 kbps. Cuanto mayor sea la tasa de bits, menos información se pierde en el filtrado. Los ingenieros de audio no tenemos control sobre qué configuración de calidad usará un oyente, pero al menos podemos tener una idea de cómo sonará nuestra canción. Utilizando RX, podemos exportar un archivo OGG y probar diferentes configuraciones de compresión. Para esta demostración, tomé una pequeña parte de mi canción y la exporté a diferentes velocidades de bits OGG (luego exporté de nuevo a un archivo WAV para que se puedan cargar):
Una cosa divertida que podemos hacer es realizar una prueba nula. Si tomamos uno de los archivos comprimidos e invertimos la forma de onda, luego lo reproducimos junto con el original, el resultado será lo que la compresión de datos ha eliminado del audio:
Aunque suenan extraños, realmente disfruto escuchando estas pruebas nulas. Es fascinante escuchar qué información se está eliminando para reducir el tamaño del archivo. Si bien se pierde muy poco en la configuración de calidad más alta, se pierde bastante música en calidad normal. Aún así, cuando escucho la versión en calidad Normal, no me suena terrible.
Cuando una canción se codifica en OGG Vorbis (o cualquier otro códec con pérdida), su nivel máximo de muestra cambiará (y casi siempre aumentará). Puede ver esto si exporta un archivo WAV a OGG usando RX, importa el archivo OGG y verifica los niveles máximos en la vista Estadísticas de forma de onda. Por ejemplo, aquí están los picos de muestra y los picos reales de mi canción a las distintas velocidades de bits que escuchamos anteriormente:
Podemos ver que después de la compresión de datos, los niveles máximos de mi canción han aumentado. Los niveles aumentan con la pérdida de calidad. Esto significa que mi canción se recortará digitalmente con cualquier ajuste de calidad que no sea de muy alta calidad. Por esta razón, Spotify recomienda usar un verdadero limitador de picos con un límite máximo de -2 dB (consulte la parte inferior de la página vinculada).
No hay nada peor que finalmente escuchar tu canción el día del lanzamiento y pensar que no suena bien o que no suena tan fuerte como cualquier canción de referencia que toques a continuación. Dado que todas las canciones están normalizadas al mismo volumen, no debería haber diferencias de volumen. Sin embargo, Spotify señala ciertos problemas que podrían hacer que su canción tenga un valor LUFS más alto de lo que debería:
Como se describe en la primera sección, un empujón adicional en el limitador puede hacer que su pista sea demasiado ruidosa. Si la forma de onda de su canción parece un rectángulo, puede sonar tranquila en comparación con las secciones ruidosas de una canción masterizada de forma más dinámica.
Debería ser bastante obvio, pero Spotify no lo sabe y no puede compensar su sistema de monitoreo personal. Si su sistema de reproducción no es lineal de alguna manera, aumenta o carece de ciertas frecuencias, es posible que su percepción de la sonoridad en su entorno de escucha no se alinee consistentemente con el valor LUFS integrado para su pista.
Spotify usa este valor de LUFS para informar la normalización de sonoridad resultante. Entonces, si su experiencia de escuchar música en su sistema no se alinea con el valor que utiliza Spotify, su pista puede normalizarse de una manera que no esperaba.
Imagina que has mezclado y masterizado toda tu canción con auriculares baratos sin extensión de alta frecuencia. No puedes saber lo que está pasando allí, así que tal vez hayas subido demasiado alto. El algoritmo de sonoridad seguirá registrando esos máximos y puede bajar demasiado la pista. Lo mismo podría suceder si a su sistema le faltaran graves mientras mezclaba.
O imagina que tus altavoces tienen un gran bache en los medios bajos. Cualquier canción que reproduzca con un aumento de frecuencia similar parecerá más fuerte porque sus altavoces la están impulsando. Obviamente, el algoritmo de sonoridad no conoce la respuesta de frecuencia de sus altavoces o auriculares, por lo que no puede compensar eso.
Una buena comprobación de cordura para este problema es utilizar una herramienta como
, que le permitirá saber si su pista tiene una acumulación o falta de ciertas frecuencias en su balance tonal general.
Todo lo que he descrito anteriormente será cierto la mayor parte del tiempo. Sin embargo, en aras de la exhaustividad, hay un par de casos extremos para explicar:
Si subes un álbum , Spotify medirá el volumen integrado de cada canción de forma individual, además de realizar una medición para todo el álbum. Cuando aparece una canción en una lista de reproducción, Spotify la normaliza según el volumen de la canción individual. Cuando reproduces un álbum con la reproducción aleatoria desactivada, Spotify utilizará la medición de volumen integrada de todo el álbum y aplicará la misma normalización a cada canción. Esto significa que las canciones hechas intencionalmente para que sean silenciosas o fuertes en relación con el resto del álbum no perderán el nivel deseado.
Nota: En el momento de escribir este artículo, se está desarrollando un nuevo paradigma de normalización de álbumes que daría a los artistas más control sobre el volumen relativo dentro de un álbum. Este artículo se actualizará a medida que se publiquen estos paradigmas.
Spotify usa OGG vorbis para sus aplicaciones móviles y de escritorio, excepto para la configuración de Baja calidad que usa HE-AACv2 (24kbps). La aplicación web utiliza un códec diferente: AAC.
El usuario puede optar por desactivar la normalización, aunque está activada de forma predeterminada para todos los usuarios. También hay una configuración para ajustar el nivel de volumen para su entorno, que cambiará el nivel de normalización de LUFS:
Hasta ahora, solo hemos hablado sobre cómo Spotify bajará la pista si es más fuerte que -14 LUFS. Pero si su pista es más silenciosa que -14 LUFS, Spotify realmente aumentará la ganancia. Sin embargo, hay un límite para esto. Spotify no aumentará su pista más allá de un nivel máximo real de -1 dB. Por ejemplo, si el nivel de sonoridad de una pista es de -20 dB LUFS y su máximo de True Peak es de -5 dB, Spotify solo eleva la pista hasta -16 dB LUFS.
Si el usuario ha seleccionado la opción de reproducción “Loud”, Spotify utilizará un limitador para subir la canción a -11 LUFS, independientemente del nivel máximo. Este es el único caso en el que Spotify aplicará compresión de rango dinámico. (Consulte la parte inferior de la sección “Cómo ajustamos el volumen” aquí ).
Para eliminar el misterio de lo que sucederá con una pista, puede ser increíblemente útil crear su propia “vista previa de transmisión” usando RX.
Si comienza con un archivo WAV, lo convierte a OGG, lo vuelve a importar y luego lo normaliza con una ganancia de -14 LUFS, esto es exactamente lo que reproducirá Spotify. Ahora no volverás a sorprenderte el día del lanzamiento. Puede escuchar lo que se perderá en la compresión de datos y ver cuánta normalización de sonoridad se aplica. Puede usar esta “vista previa de transmisión” para A / B contra otras pistas en Spotify y tomar decisiones informadas mientras ajusta su mezcla / master.
A continuación, puede considerar no presionar su limitador con tanta fuerza. Si la transmisión es su plataforma principal, ahora sabe cómo afectará la normalización del volumen a su pista. También puede considerar seguir las pautas de Spotify sobre el nivel de pico y dejar al menos 2 dB de margen de pico real para el proceso de codificación. Si le preocupa que la respuesta de frecuencia desigual de su sistema de reproducción pueda estar dañando sus mediciones de sonoridad, es posible que desee utilizar una herramienta como Control de equilibrio tonal para identificar cualquier problema.
Esperamos que esto haya sido útil e informativo, y que les ayude a los productores e ingenieros a obtener los resultados que esperan en Spotify.
Agradecemos a Bill Podolak , ingeniero senior de control de calidad de iZotope.
Síguenos en Telegram y súmate a MDS.