Digital Audio/pt BR
From Audacity Manual
Contents |
Amostra Digital
Todos os sons que nós escutamos com nossos ouvidos são ondas de pressão no ar. Começando com a demonstração do primeiro fonógrafo de Thomas Edison em 1877, tem sido possível capturar estas ondas de pressão em um meio físico e depois reproduzir estas ao recriar as mesmas ondas de pressão. Ondas de pressão de áudio, ou formas de onda, parecem com algo assim:
Mídia analógica de gravação tal como gravações de fonógrafo e fitas cassete representam a forma de forma de onda diretamente, usando a profundidade do sulco para uma gravação ou a quantidade de magnetização para uma fita. Gravação análoga pode reproduzir uma quantidade impressionante de sons, mas também sofre com problemas com ruído. Notavelmente, cada vez que uma gravação análoga é copiada, mais ruído é introduzido, diminuindo a fidelidade. Este ruído pode ser minimizado mas não completamente eliminado.
Gravações digitais funcionam de forma diferente: elas criam amostras de forma de onda em pontos do tempo de mesmo espaço de distância, representando cada amostra como um número preciso. Gravações digitais, quando armazenadas em um disco compacto (CD), fita de áudio digital (DAT), ou em um computador pessoal, não se degradam com o tempo e podem ser copiadas perfeitamente sem introduzir qualquer ruído adicional. A seguinte imagem ilustra uma amostra de áudio em forma de onda:
Áudio digital pode ser editado e mixado sem inserir nenhum barulho adicional. Além disso, vários efeitos digitais podem ser aplicados a gravações de áudio digitalizadas para simular reverberação, melhorar certas freqüências ou mudar o tom, por exemplo. Audacity é um programa de edição de áudio, mixagem, e de aplicar efeitos a gravações digitais de áudio.
A habilidade do Audacity de tocar ou gravar áudio diretamente de seu computador depende especificamente do hardware de seu computador. A maioria dos computadores desktop vem com uma placa de som com 1/8" entradas para você plugar seu microfone ou outra fonte para gravação, e alto-falantes ou fones de ouvido para ouvir. Muitos computadores portáteis possuem alto-falantes e um microfone embutidos. A placa de som que vem com com a maioria dos computadores não é particularmente de alta qualidade; se você está interessado em gravação de alta qualidade, veja Qualidade da Gravação para mais detalhes. Para informações em como configurar o Audacity para reproduzir e gravar, veja Configurações do Audacity e Preferências.
Qualidade do Áudio Digital
A qualidade de uma gravação de áudio digital depende intensamente de dois fatores: a taxa de amostra e o formato da amostra ou profundidade do bit. Aumentando a taxa de amostra ou o número de bits em cada amostra aumenta a qualidade da gravação, mas também aumenta a quantidade de espaço usada por arquivos de áudio em um computador ou disco.
Amostra de taxas
Amostragem de taxas são medidas em hertz (Hz), ou ciclos por segundo. Este valor simplesmente representa o número de amostras capturadas por segundo, quanto maior a resolução, mais precisa a medição da forma de onda. O ouvido humano é sensível a padrões de som com freqüências entre aproximadamente 20 Hz e 20,000 Hz. Sons fora desta faixa são essencialmente inaudíveis, entretanto Rupert Neve provou subjetivamente a existência de fidalidade psicoacústica que pode ser ouvida acima do suposto limite de 20,000kHz.
Capturando um som em uma freqüência particular requer uma taxa de amostra de ao menos o dobro da freqüência (conhecido como a freqüência Nyquist). Portanto uma taxa de amostra de 40,000 Hz é o mínimo necessário para reproduzir sons com faixa de audição humana, mesmo que taxas maiores (chamadas over sampling) podem aumentar a qualidade ainda mais ao evitar artefatos de aliasing em torno da freqüência de Nyquist. A taxa de amostra usada por CDs de áudio é de 44,100 Hz. A fala humana é inteligível mesmo quando freqüências acima de 4,000 Hz são eliminadas; na verdade telefones apenas transmitem freqüências entre 200 Hz e 4,000 Hz. Portanto uma taxa de amostra comum para gravações de áudio é 8,000 Hz, que é algumas vezes chamada de qualidade de discurso. Note que uma filtragrem profunda (chamada de filtro de anti-aliasing) é necessária acima da freqüência de Nyquist para que proíba o sinal acima deste ponto de corte de ser retornada em uma faixa audível pelo conversor digital, e criar artefatos de distorção ou ruído aliasing.
As mais comuns faixas de amostra, medidas em kilohertz (KHz, ou 1,000 Hz), são 8 KHz, 16 KHz, 22.05 KHz, 22.25 KHz, 44.1 KHz, 48 KHz, 96 KHz, e 192 KHz. Audacity é compatível com qualquer uma destas faixas de amostra, entretanto a maioria das placas de som dos computadores são limitadas a 48 KHz ou ainda 96 KHz. Novamente, a taxa de amostra mais comum é de longe 44.1 KHz (44100 Hz).
Na imagem abaixo, a metade esquerda possui uma baixa taxa de amostra, e a metade direita possui uma alta taxa de amostra (ie. alta resolução):
Amostra de formatos
A outra medida da qualidade de um áudio é o formato da amostra (ou profundidade do bit), que geralmente é medida pelo números de bits de computador usados para representar cada amostra. Quanto mais bits são usados, mais precisa a representação de cada amostra. Aumentando o número de bits também aumenta a faixa dinâmica máxima da gravação do áudio, em outras palavras a diferença de volume entre os mais barulhentos e mais suaves sons possíveis que podem ser representados.
Faixa dinâmica é medida em decibéis (dB). O ouvido humano pode perceber sons com uma faixa dinâmica de pelo menos 90 dB. Entretanto, sempre que possível é uma boa idéia gravar áudio digital com uma faixa dinâmica de bem mais que 90 dB, em parte para que os sons que são muito suaves poderem ser ampliados para máxima fidelidade. Note que apesar de sinais serem gravados em níveis baixos podem ser elevados (ie normalizados) para tirar proveito da faixa dinâmica disponível, a gravação de sinais de baixo nível não irá usar toda a profundidade de bits e a perda de resolução não pode ser recapturada simplesmente normalizando todos os níveis de forma de onda de tudo.
Formatos de amostra comuns, e suas respectivas faixas dinâmicas incluem:
- inteiro de 8-bits: 45 dB
- inteiro de 16-bits: 90 dB
- inteiro de 24-bits: 135 dB
- ponto flutuante de 32-bits: quase infinito dB
Outros formatos de amostra tais como ADPCM aproximam áudio de 16-bits comprimido com amostras de 4-bits. Audacity pode importar muitos destes formatos, mas eles são raramente usados por causa dos muitos melhores novos métodos de compressão.
CDs de áudio e a maioria dos formatos de arquivos de áudio de computador usam inteiros de 16-bits. Por padrão, Audacity usa internamente amostras de pontos flutuantes de 32-bits enquanto você está trabalhando em um projeto e exporta sua mixagem final usando inteiros de 16-bits. Isto te oferece melhor qualidade que programas de áudio que usam puramente amostras de áudio de 16-bits ou 24-bits. O formato de amostra padrão do Audacity pode ser configurado em Preferências de Qualidade ou definir individualmente para cada faixa em Menu Drop-Down da Faixa.
Na imagem abaixo, a metade à esquerda possui um formato de amostra de poucos bits, e a metade à direita possui um formato de amostra com mais bits. Se você acha na taxa de amostra como os espaços entre as linhas da grade vertical, o formato da amostra é o espaçamento entre as linhas da grade horizontal.
Tamanho de arquivos de áudio
Arquivos de áudio são muito grandes, muito maior do que os arquivos com que você provavalmente trabalha (a menos que você trabalhe com arquivos de vídeo). Para determinar o tamanho de um arquivo de áudio não comprimido, multiplique a taxa de amostra (e.g., 44100 Hz) pela taxa de bit do formato da amostra (e.g. 16-bit) pelo número de canais (2 para estéreo) pelo número de segundos. Um CD estéreo de áudio completo de 74 minutos ocupa mais de 6 bilhões de bits. Divida isto por 8 para obter o número de bytes; um CD de áudio possui um pouco menos de 800 megabytes (MB). Veja áudio comprimido, abaixo.
Clipping
Uma limitação do áudio digital é que ele não consegue lidar com ondas de pressão de som que excedem o nível máximo para o qual é desenhado para lidar. Quando um sinal gravado excede o nível máximo, amostras fora do limite são cortadas para o valor máximo, desta forma:
Um som gravado com clipping soará distorcido e áspero. Existem algumas técnicas que podem elimar uma pequena quantidade de ruído devido aos cortes, é sempre preferível evitar os cortes durante uma gravação. Mude o volume em seu dispositivo de entrada (microfone, tocador de cassete, gravador) e defina o volume de dispositivos de entrada do Audacity (na Barra de Ferramentas do Mixer) de tal forma que a forma de onda seja a mais larga possível (para maior fidelidade) sem cortes/clipping.
Áudio Comprimido
Como os arquivos de áudio são muito grandes, taxas de amostras reduzidas eram tipicamente usadas sempre que possível. Em 1991, o padrão MP3 (MPEG I, layer 3) mudou tudo. MP3 é uma técnica de compressão com perdas que pode diminuir dramaticamente o tamanho de um arquivo de áudio digital surpreendentemente com pouco efeito na qualidade. Um segundo de um áudio de qualidade de CD ocupa 1.4 megabits, enquanto a taxa de bit comum para arquivos MP3 é 128 kilobits, que é um fator de compressão de mais de 10x! MP3 funciona inteligentemente "jogando fora" detalhes da forma de onda do áudio que humanos não possuem tanta sensibilidade, baseado em um modelo psicoacústico de como nossos ouvidos e cérebros processam sons. Todos os arquivos MP3 não são criados da mesma forma; diferentes modelos psicoacústicos irão gerar diferentes quantidades de distorção percebida no arquivo de áudio.
Com boas caixas de som, qualquer um pode ouvir a diferença entre um arquivo de MP3 de 128k e um arquivo de áudio não comprimido de CD. Arquivos MP3 de 192k e 256k são os mais populares entre audiófilos que preferem maior qualidade.
Existem muitos outros formatos de arquivos de áudio comprimidos com perdas. Audacity é compatível com o formato Ogg Vorbis, que é similiar ao MP3 mas é completamente aberto, padrão sem patentes. Ao longo do tempo a qualidade de arquivos Ogg Vorbis ultrapassou a qualidade do MP3, e seu formato é mais extensível logo mais melhorias são possíveis. Ogg Vorbis é uma ótima escolha para o seu próprio áudio, entretanto a realidade é que muitos outros periféricos como iPods e tocadores de áudio portáteis são compatíveis com MP3 mas ainda não o são com Ogg Vorbis.
Outros métodos de compressão bem conhecidos incluem ATRAC, usados por gravadores de Minidiscos da Sony, Windows Media Audio (WMA), e AAC.