Durante décadas, el MP3 marcó un antes y un después en la distribución de sonido al inundar dispositivos con álbumes completos ocupando una fracción del espacio de los archivos WAV. Hoy, aquella limitación de almacenamiento carece de sentido, ya que incluso los teléfonos móviles mas básicos sobrepasan habitualmente los 64 GB, y el ancho de banda crece sin pausa. Además, las técnicas de codificación han avanzado hasta captar matices que el MP3 sacrifica y que sí son perceptibles. Por el contrario, los nuevos formatos de audio aprovechan arquitecturas de procesamiento más robustas y permiten ajustes de compresión más granulares, adaptándose a cada perfil de usuario -streaming, archivo o transmisión en tiempo real- sin perder precisión. Con estos elementos en juego, mantener la tradición MP3 se convierte en una decisión puramente nostálgica. Así que, detallemos cada uno de los actuales códecs de sonido.
FLAC: fidelidad bit a bit y control exhaustivo
El Free Lossless Audio Codec sobresale por preservar íntegramente los datos originales, ofreciendo copias idénticas byte a byte del archivo maestro. Bajo el capó, FLAC divide la señal en bloques de hasta 16 384 muestras, cada uno procesado mediante predicción lineal adaptativa y codificación Rice para eliminar redundancias.
Los niveles de compresión -del 0 al 8- ajustan el tamaño de cada bloque, por lo que cuanto más alto el nivel, mayor la inteligencia al escoger parámetros, pero más carga de cálculo en la codificación. La descompresión, basada en operaciones de enteros, resulta muy eficiente en CPU, y la latencia se mantiene por debajo de los milisegundos incluso en hardware modesto. Cada bloque incluye un sumatorio CRC16 y una firma MD5 de 128 bits del audio original, lo que garantiza la detección de errores y la integridad completa.
En cuanto al sistema de metadatos, FLAC emplea comentarios Vorbis, pero también permite tablas de búsqueda de muestras y carátulas incrustadas en formato PNG o JPG, lo cual facilita la gestión en bibliotecas. La modularidad del contenedor hace que, ante fallos en la lectura de un bloque, el resto permanezca intacto, vital para archivos de gran tamaño y transmisiones en vivo.
Al ofrecer música sin pérdida, lo convierte en la opción predilecta para archivar colecciones musicales y para los audiófilos.
AAC (M4A/M4B): refinamiento perceptual y compatibilidad
El Advanced Audio Coding es una evolución del modelo MP3, refinando el análisis de la psicoacústica con filtros de ventana más flexibles que reducen el pre-eco y mejoran la resolución en altas frecuencias.
En la práctica, AAC implementa ventanas de 1024 y 960 muestras con solapamiento dinámico, optimizando la codificación según la complejidad espectral del pasaje. Su arquitectura de canal gemelo (joint stereo) aprovecha el modelado masivo de canales: combina la señal común y diferencia para reducir redundancias al máximo.
Soporta muestras de 8 kHz hasta 96 kHz y profundidades de hasta 24 bits, con tasas de bits variables o constantes desde 16 kbps hasta 512 kbps. Al alojarse en contenedores MPEG‑4, adopta extensiones M4A para música sin protección y M4B para audiolibros, que incluyen marcadores de capítulo y reanudación automática.
El manejo de perfiles Low Complexity (LC), Main y Scalable Sample Rate (SSR) proporciona flexibilidad según la plataforma: LC es el más extendido por su equilibrio entre calidad y carga de procesamiento. La decodificación soporta tablas de Huffman especializadas y transformadas MDCT (Modified Discrete Cosine Transform), lo que afina la reconstrucción espectral sin incurrir en latencias apreciables.
Y, además, AAC ofrece una compatibilidad casi universal, casi todos los dispositivos, navegadores y sistemas operativos actuales lo admiten de fábrica. Es el formato más habitual en servicios de streaming.
Opus y Vorbis
Opus combina dos motores: SILK, basado en predicción lineal para voz, y CELT, optimizado para música. Cada fotograma -de hasta 120 ms- se decide de forma autónoma qué tecnología aplicar, o si fusionar ambas, garantizando una continua calidad en rangos de 6 a 510 kbps.
El códec ajusta automáticamente la tasa de bits fotograma a fotograma y emplea transformadas MDCT de longitud variable (desde 2.5 ms hasta 120 ms), manteniendo latencias algorítmicas por debajo de los 26 ms.
Gracias al control de retardo en búfer y la corrección de errores FEC (Forward Error Correction), resulta idóneo para videollamadas y streaming interactivo, donde cada milisegundo cuenta. Usualmente va insertado en el contenedor Ogg, aunque admitido también en Matroska y WebM.
Por su parte, Vorbis utiliza compresión con pérdida en contenedor Ogg y basa su esquema en ventanas de tamaño fijo (1 024 o 2 048 muestras) y codificación vectorial de coeficientes MDCT. Emplea VBR con una escala de calidad de -1 a 10 para que el codificador ajuste la tasa según la complejidad.
A niveles medios (índice 5), ofrece calidad superior al MP3 a 192 kbps, y puede escalar hasta 500 kbps para audio hi‑res a 44.1 kHz. Su independencia de patentes anima a proyectos de software libre y plataformas de streaming comunitarias. Aunque cede protagonismo ante Opus y AAC en entornos comerciales, sigue vivo en aplicaciones de código abierto, videojuegos y servicios web que buscan evitar royalties.