Nuestro Instagram

Sistemas de Digitalización de Audio

audio daw.jpg

 

Introducción

 

            Antes de meternos de lleno en cada uno de los temas, haremos una breve introducción al campo digital.

            Es absolutamente evidente que la tecnología de audio digital ha cambiado la manera en que se producen, reúnen y distribuyen todas las formas de medios de comunicación. En las últimas décadas, se desarrolló drásticamente la forma en que los productores de música e ingenieros de grabación manipulan y distribuyen el audio digital. Ello ha sido posible gracias al avance vertiginoso de la microelectrónica y su aplicación a la producción de dispositivos poderosos y complejos capaces de manejar y transformar cada vez más con mayor precisión y rapidez la enorme cantidad de información contenida en el sonido.

            Aunque audio digital es un variado y complejo campo de estudio, la teoría básica detrás de las cortinas de la magia no es tan difícil de entender. En su nivel más elemental, es simplemente un proceso por el cual las representaciones numéricas de señales analógicas (en forma de niveles de voltaje) se codifican , procesan , almacenan y reproducen con el tiempo a través del uso de un sistema de números binarios.

            Al igual que los seres humanos de habla Español que se comunican mediante la combinación de cualquiera de las 27 letras juntas dentro de grupos conocidos como " palabras" y manipulan números utilizando el sistema decimal (base 10), el sistema de elección para los dispositivos digitales es el binario (base 2). Este sistema numérico proporciona un medio rápido y eficaz para manipular y almacenar datos digitales . De esta manera un ordenador o microprocesador puede realizar cálculos y tareas que de otro modo sería engorroso y menos rentables y / o directamente imposible llevar a cabo en el dominio analógico .

            Para dar un ejemplo, vamos a echar un vistazo a cómo una construcción humana puede traducirse en un lenguaje digital (y viceversa) . Si escribimos las letras C , A y T en un procesador de textos, el equipo va a ir rápidamente a la tarea de traducir esas pulsaciones de teclado en una serie de palabras digitales de 8 bits representadas como [0100 0011], [01000001] y [0101 0100].

De una manera similar , un sistema de audio digital funciona por muestreo (medición, mensurado) del nivel de tensión instantánea de una señal analógica a intervalos específicos a través del tiempo, y luego convierte estas muestras en una serie de “palabras codificadas” que digitalmente representan los niveles de voltaje analógicos. Mediante la medición de los cambios sucesivamente en el nivel de voltaje de una señal analógica ( en el tiempo), esta corriente de palabras representativas pueden ser almacenadas en una forma que constituye la señal analógica original. Una vez almacenados, los datos pueden ser procesados ​​y se reproducen de manera que han cambiado la producción de audio para siempre.

Numeración binaria

 

            Dado que todos los sistemas digitales se basan en la numeración binaria, antes de comenzar a describir los procesos básicos de muestreo y digitalización del sonido nos referiremos brevemente a esa numeración. En la numeración decimal (el sistema que empleamos habitualmente), se utilizan diez símbolos (los dígitos 0, 1, 2, ..., 9) en un sistema posicional para representar las sucesivas cantidades. Esto significa que cada nueva cifra que se agrega tiene un peso 10 veces mayor que la que se encuentra a su derecha.

Por ejemplo,

27 = 2 x 10 + 7 ,

306 = 3 x 102 + 0 x 10 + 6 .

En la numeración binaria, se utilizan sólo dos símbolos (los dígitos 0 y 1), también en un sistema posicional, sólo que ahora cada nueva cifra tiene un peso sólo 2 veces mayor que la anterior. Por ejemplo,

101 = 1 x 22 + 0 x 2 + 1 º 5 ,

11011 = 1 x 24 + 1 x 23 + 0 x 22 + 1 x 2 + 1 º 27 .

En esta numeración, el 1 tiene características similares al 9 del sistema decimal, es decir, una vez que llegamos al 1 debemos agregar una nueva cifra 1 y cambiar la primera por 0. En la Tabla 15.1 se muestra la conversión de decimal a binario para los números del 0 al 15. La razón por la que se utilizan los números binarios es porque eléctricamente es muy fácil codificar los 0’s y los 1’s. Basta utilizar un nivel de tensión alto (5 V) para un 1 y un nivel de tensión bajo (0 V) para un 0. Esto hace que la representación sea extremadamente insensible al ruido. En efecto, la señal seguiría siendo recuperable aún en presencia de un ruido de 2 V, que corresponde a una relación señal/ruido tan baja como 20 log 5/2 = 8 dB (inadmisible si el sistema fuera analógico).

 

Muestreo

 

            En el mundo de audio analógico, las señales son registradas, almacenadas y reproducidas como cambios de niveles de voltaje que varían continuamente en el tiempo.

Por otra parte, el proceso de grabación digital no funciona de la misma manera, sino más bien, trabaja tomando muestras periódicas de una forma de onda de audio analógico con el tiempo, y después calcula cada una de estas muestras instantáneas dentro de grupos binarios que representan digitalmente estos niveles de voltaje a medida que cambian con el tiempo, con la mayor precisión posible.

                                                                                    Señal Analogica Señal digitalizada.jpg

 

 

 proceso de muestreo.jpg

 

 

            Dentro de un sistema de audio digital, la frecuencia de muestreo o tasa de muestreo (FM) se define como el número de medidas (muestras) que se toman periódicamente en el transcurso de un segundo.

            Recíprocamente,  periodo de muestreo (TM) es el tiempo transcurrido entre cada periodo de muestreo. Por ejemplo, una velocidad de muestreo de 44.1 kHz corresponde a una tasa de muestreo de 1/44.100 por segundo.

            Por ello:fdem.jpg

            Este proceso puede compararse a un fotógrafo que lleva una serie tomas consecutivas, para luego verlas plasmadas en una animación. Cuando el número de fotografías tomadas en un segundo aumenta, la exactitud del evento capturado, por su parte, aumentará hasta que la resolución podrá volverse continua y convincente (si se quiere).

muestreo en tiempo discreto.jpg

 

            Es intuitivamente evidente que la frecuencia de muestreo debe ser bastante alta, ya que entonces se logra un grado de detalle mayor. Existe un criterio que debe cumplirse obligatoriamente en todo proceso de muestreo, “la frecuencia de muestreo debe ser mayor que el doble de la máxima frecuencia presente en la señal”, ese es el teorema de Nyquist, también llamado teorema del muestreo.

fm2fmax.jpg


            Este teorema no se refiere sólo a la máxima frecuencia de interés sino a la máxima frecuencia que efectivamente aparece en la señal al muestrear, y de no respetarlo, acarrea con sigo la aparición de componentes de frecuencia espurias en la banda útil (dentro del rango audible). Se utiliza para ello un filtro pasabajos de pendiente muy abrupta en la banda de corte (96 dB/octava o más), denominado filtro antialias (antialiasing filter) para explicarlo ilustraremos.

efecto del muestreo.jpg

 

 

Las frecuencias que entran al proceso de digitalización por encima del límite que establece el teorema de muestreo, podrán introducir distorsión armónica. (a) existen frecuencias por encima que el doble (2x) de la tasa de muestreo elegida. (b) ello produce frecuencias espurias (alias) que se introducen dentro del rango audible como distorsión.

 

nyquist frequency.jpg

 

            Otro aspecto al que debemos tomar con cautela, es que los filtros antialias no son del todo inofensivos para la señal dentro de la banda de paso, y ello puede ser un inconveniente. Aunque el filtro afecte sólo imperceptiblemente la amplitud de la señal en dicha banda, afecta de un modo apreciable la fase, lo cual puede alterar la imagen estéreo.

            A modo de conclusión, Federico Miyara sostiene que muestrear una señal significa “reemplazar la señal original por una serie de muestras tomadas a intervalos regulares”

 

Cuantización

 

            La cuantización propiamente dicha, representa dentro del proceso de conversión analógica/digital la componente ligada a la amplitud de la señal de audio.

            Es usada para traducir los niveles de voltaje de una señal analógica continua (en puntos de muestreo discretos en el tiempo) a dígitos binarios (bits), con el fin de almacenar o manipular datos en el dominio digital.

            Mediante el muestreo de la amplitud de una señal analógica a intervalos precisos en el tiempo, el convertidor determina el nivel de tensión exacta de la señal (durante un intervalo de muestra, cuando se mantiene momentáneamente el nivel de tensión), y a continuación emite el nivel de la señal como un conjunto equivalente de números binarios (agrupados en profundidad de n-bits), representando el nivel de tensión muestreada originalmente.

escalones.jpg

 

            El código resultante es usado para codificar el nivel de voltaje original con el mayor grado de precisión posible, determinado por la profundidad de bits elegida y el diseño global del sistema.

            Hoy en día, las computadoras y los dispositivos de procesamiento de señales son capaces de realizar cálculos internos a  32 y 64 bits de resolución. Este espacio libre interno añadido a nivel de bits ayuda a reducir los errores y aumentar el rendimiento en bajas resoluciones cuando múltiples corrientes de datos de audio se mezclan y procesan en un sistema de procesamiento digital de señales (DSP digital signal processing). Esta mayor resolución interna de bits se utiliza para reducir los errores que pueden al acumularse dentro del bit menos significativo ( LSB , el valor numérico final y más pequeño dentro de un código digital ) . Como múltiples señales se mezclan y se multiplican (algo habitual en el cambio de ganancia y las funciones de procesamiento ) , los números de bits de resolución inferior juegan un papel más importante en la determinación de la precisión y la distorsión global de la señal. Entonces si la profundidad de bits internos es mayor, estas resoluciones pueden dar como resultado final una corriente de datos que está relativamente libre de errores . Esto nos lleva a la conclusión de que una mayor longitud de código a menudo se traduce directamente en una mayor resolución (y , dentro de lo razonable , sin duda de mayor calidad ), debido al número agregado de pasos finitos en el que una señal puede ser codificada digitalmente. A continuación se detallan los pasos o “escalones” que son introducidos en el proceso ADC con las tasas de cuantización más frecuentes:

bit pasos o escalones.jpg

 

 

            Si vamos al detalle, explicar el proceso de reproducción/grabación de audio puede llegar a volverse muy complejo con cálculos bastante engorrosos hasta para interpretarlos. Pero los fundamentos básicos son:

  • Toma de muestras (en el verdadero sentido de la palabra) a una señal de tensión analógica a intervalos precisos en el tiempo.
  • Conversión de estas muestras a código digital
  • Almacenamiento en un dispositivo de memoria digital

Tras la reproducción, estos códigos digitales se convierten de nuevo en tensiones discretas (una vez más, a intervalos precisos en el tiempo). De esta forma, permitiendo que los voltajes de las señales grabadas originalmente puedan ser re-creadas, procesadas y reproducidas.

 proceso de digitalización.jpg

 

Análisis Espectral

            El teorema de Fourier establece que, toda onda compleja periódica se puede representar como la suma de ondas simples. Digamos que podemos construir una onda compleja periódica mediante la suma sucesiva de ondas simples. La serie de Fourier es una serie infinita que converge puntualmente a una función continua y periódica.

Las series de Fourier responden a la siguiente fórmula:

series fourier.jpg

Donde an y bn se denominan coeficientes de Fourier de la serie de Fourier de la función f(x)

Si es una función (o señal) periódica y su periodo es 2T, la serie de Fourier puede expresarse como:

Donde los coeficientes de Fourier toman los valores:

coeficientes de Fourier toman los valores.jpg

Para las señales no periódicas, como por ejemplo la música, tenemos otras poderosas herramientas, como las integrales de Fourier. De ellas deriva la Transformada de Fourier, la cual responde a la fórmula:

Transformada de Fourier.jpg

Mediante la transformada de Fourier podemos descomponer a las señales en cada una de las frecuencias que la componen.

Sin profundizar mucho más, diremos que partiendo de la Transformada de Fourier llegamos a la Transformada Discreta (también conocida como DTF, Discrete Fourier Transform) descrita a continuación:

Discrete Fourier Transform.jpg

 

Finalmente estamos en condiciones de hablar del análisis espectral propiamente dicho. La herramienta fundamental del análisis espectral es la Transformada Rápida de Fourier, más conocida como FFT (Fast Fourier Transform). La FFT es un algoritmo que nos permite calcular en forma muy eficiente la DTF y su inversa. Es el arma principal del manejo de señales digitales y filtros de este tipo. Hay muchos algoritmos que permiten calcularla, todos coinciden en que permiten realizar un número N de muestras donde N es potencia de 2 (512, 1024, 2048, 4096 u 8192 muestras generalmente).

Es el algoritmo más famoso para el cálculo de una FFT, diseñado por J.W. Cooley y John Tukey en 1965. Tomando como entrada una señal discreta x[n] con N muestras, se basa en dividir la señal de entrada en otras dos señales de N/2 muestras (por un lado los coeficientes pares y por otro los impares), y se envían cada una de estas subseñales a una FFT de tamaño N/2 puntos.

 

 

Transformación bilineal

            La transformada bilineal (también conocida con el nombre de Método de Tustin) es usada habitualmente en el campo del procesamiento digital de señales y en la Teoría de control de señales discretas. Esta herramienta matemática suele usarse para transformar la representación en tiempo continuo de las señal en tiempo discreto y viceversa.

            Suele usarse para convertir una función de transferencia F(s) de un filtro lineal e invariante en el tiempo, que se encuentra definido en el dominio continuo del tiempo, en una función de transferencia F(z) perteneciente a un filtro lineal e invariante en el tiempo que se encuentre definido en el dominio discreto del tiempo, comúnmente llamado filtros digitales. Cabe resaltar que los filtros, aunque trabajen en dominio discreto del tiempo, no se tienen porque considerar digitales dado que existen una variante de filtros analógicos construido a partir de condensadores conmutados que por su naturaleza trabajan con muestras discretas).

            La transformación bilineal es una aproximación de primer orden de la función logarítmica natural que consiste en realizar una asignación exacta del plano Z al plano S. Cuando la transformada de Laplace se realiza sobre una señal de tiempo discreto el resultado es precisamente la transformada Z de la secuencia de tiempo discreto.

 secuencia de tiempo discreto.jpg

 

Donde T es el periodo de muestreo (inverso a la Frecuencia de muestreo) del filtro discreto. La aproximación bilineal se realiza sustituyendo s por o una aproximación de  La inversa de esta asignación (y su aproximación de primer orden bilineal) es:

 aproximación de primer orden bilineal.jpg

 

En definitiva, la transformación bilineal consiste en sustituir esta aproximación de s en la función de transferencia del filtro en tiempo continuo, F(s).

Es decir:

transferencia del filtro en tiempo continuo.jpg

 

Representaciones más usuales:

Usos comunes Transformación bilineal

  • Obtención de expresiones entrada-salida.
  • Simplificación de estructuras.
  • Implementación de estructuras.
  • Resolución de ecuaciones en diferencias
  • Puente entre el diseño analógico y digital.

Como se puede observar de la lista de aplicaciones nuestro interés es ver como de un diseño análogo de un filtro se llega a uno digital.

 

VST Plugins

 

vst.jpg

            Virtual Studio Technology (Tecnología de Estudio Virtual) o VST es una interfaz estándar desarrollada por Steinberg para conectar sintetizadores de audio y plugins de efectos a editores de audio y sistemas de grabación. Permite reemplazar el hardware tradicional de grabación por un estudio virtual con herramientas software.

            Un VST es un programa de software que debe ser ejecutado mediante una aplicación que soporte esta tecnología, ejemplos de esto son Cubase, FL Studio, Reaper, Ableton Live, etc. Estos subprogramas se instalan al igual que cualquier otro software, pero no funcionan por su cuenta. Siempre necesitan trabajar dentro de un programa. Supongamos que me consigo un plugin de reverberación. Lo instalo y al abrir el editor el programa “carga” todos los complementos. Lo bueno es que esta reverb me servirá en cualquier editor, siempre y cuando éste sea compatible con la tecnología de ese plugin.

            Los VSTs tienen la capacidad de procesar y generar audio, como también interactuar con interfaces MIDI.

            En el caso de Windows los VSTs son archivos DLLs. Como estos son un archivo binario son dependientes de la plataforma donde se ejecutan, por lo que un VST compilado para Mac OS no funcionará en Windows y recíprocamente. En sistemas Linux se pueden utilizar como plugins del software de edición Audacity o bien instalarse las versiones de Windows con Wine.

Los plugins de audio aportan a un editor efectos (revers, delay, phaser…) procesadores (compresores, limitadores, expansores…) limpiadores (eliminadores de ruidos o noise reduction, anti scratch….) analizadores de señal y otras muchas aplicaciones.

            Las ventajas de estas tecnologías es innegable; han hecho posible un sin número de producciones con limitaciones de acceso a determinadas herramientas y equipos debido a restricciones de presupuesto o a los altos costes de los estudios profesionales o porque no siempre es fácil encontrar algunos instrumentos y equipos que son maravillosos pero no siempre de fácil acceso.

            Un gran número de plug-ins VST comerciales y de código abierto se escriben utilizando el marco “Juce C++ framework” en lugar de “Steinberg's VST SDK” (el lenguaje propio de Steinberg) ya que esto permite que los archivos sean multi formato.

            Los VST son una tecnología de plugins, pero existen otras, entre las que se encuentran:

  • LADSPA (Linux Audio Developer’s Simple Plugin)

Plugins de audio para Linux. Funcionan con programas que trabajan sobre esta plataforma como el Ardour.

  • RTAS (Real Time Audio Suites)

Formato de plugins especial para el software ProTools y los sistemas Digidesign. Pocos editores, además de éste, lo reconocen. Otro formato de plugins para Digi es TDM.

  • DX - Direct X

Sólo son compatibles con los editores de audio que trabajan bajo Windows: Cakewalk, Sound Forge, Cubase, Cool Edit/Audtion... Por esta limitación, no está tan extendido como el VST.

 

            VST Plugin Analyser es un software de Steinberg Media Technologies que facilita el análisis de los plugins vst mediante una interface gráfica donde se pueden realizar pruebas de rendimiento, respuesta en frecuencia, distorsión armónica, y más.