Digital Audio/nl

From Audacity Manual

Jump to: navigation, search
Digitale audio
This is translation to Dutch of Digital Audio.

Contents

Digitaal samplen

Alle geluiden die we waarnemen met onze oren zijn drukgolven in lucht. Beginnend met de demonstratie van Thomas Edisons eerste fonograaf in 1877 werd het mogelijk om deze drukgolven op te slaan op een fysiek medium en deze later te reproduceren door diezelfde drukgolven opnieuw te genereren. Audio-drukgolven, of golfvormen zien eruit zoals dit:

Analoge golfvorm

Analoge opnamemedia zoals een fonograaf-opname en cassettebandjes geven de vorm van de golf direct weer, door gebruik te maken van de diepte van de groef voor de fonograaf of de hoeveelheid magnetisme voor een tape. Analoge opname kan een indrukwekkende verzameling geluiden reproduceren, maar het lijdt onder ruisproblemen. Het valt op dat elke keer dat een analoge opname gekopieerd wordt er meer ruis ontstaat, waardoor de getrouwheid van de weergave verminderd wordt. Deze ruis kan verminderd worden, maar niet volledig geëlimineerd.

Digitaal opnemen werkt op een andere manier: het samplet de golfvorm op tijdspunten met gelijke grootte, elke sample als een precies nummer weergevend. Digitale opnames, of ze nu opgeslagen zijn op een compact disk (cd), digitale audio tape (DAT) of op een pc, degraderen niet in de tijd en kunnen perfect gekopieerd worden zonder bijkomende ruis te introduceren. De volgende afbeelding toont een gesamplede audio-golfvorm:

Een digitale golfvorm

Digitale audio kan gewijzigd en gemixt worden zonder bijkomende ruis te introduceren. Daar komt nog bij dat vele digitale effecten toegepast kunnen worden op gedigitaliseerde opnames om bijvoorbeeld galm te simuleren, bepaalde frequenties te verbeteren of de toonhoogte te wijzigen. Audacity is een programma om digitale audio-opnames te wijzigen en mixen en er effecten op toe te passen.

De mogelijkheid van Audacity om audio direct vanaf uw computer af te spelen of op te nemen hangt af van de specifieke hardware van uw computer. De meeste desktopcomputers hebben een geluidskaart met 1/8" jacks om een microfoon of andere geluidsbron in te pluggen voor opname, en speakers of een koptelefoon voor het beluisteren. Vele laptops hebben ingebouwde speakers en microfoon. De geluidskaart die meegeleverd wordt met de meeste computers is meestal niet van hoge kwaliteit; als u geïnteresseerd bent in hogekwaliteits-opnemen, zie Opnamekwaliteit voor meer details. Voor informatie over hoe Audacity in te stellen voor af te spelen en op te nemen, zie Audacity-instelling en configuratie.

Digitale audiokwaliteit

De kwaliteit van een digitale geluidsopname hangt het meeste af van twee factoren: de samplerate en het sampleformat of bitdiepte. Door het vergroten van de samplerate of het aantal bits in elke sample verhoogt de kwaliteit van de opname, maar vergroot ook de hoeveelheid ruimte die gebruikt wordt door audiobestanden op een computer of schijf.

Samplerates

Samplerates worden gemeten in hertz (Hz) of cyclussen per seconde. Deze waarde stelt het aantal samples voor die per seconde opgenomen worden om de golfvorm weer te geven; hoe meer samples per seconde, hoe hoger de resolutie, en dus hoe preciezer de meting van de golfvorm is. Het menselijke oor is gevoelig voor geluidspatronen tussen ongeveer 20 Hz en 20 000 Hz (20 kHz). Geluiden buiten dat gebied zijn in principe onhoorbaar, hoewel Rupert Neve op een subjectieve manier het bestaan heeft bewezen van psychoakoestische fidelity die gehoord kan worden boven zijn veronderstelde limiet van 20 000 Hz.

Om een geluid op te nemen met een bepaalde frequentie is een samplerate nodig van ten minste twee keer diezelfde frequentie (bekend als de Nyquist-frequentie). Daarom is een samplerate van 40 000 Hz het absolute nodige minimum om geluiden te reproduceren binnen het bereik van het menselijke gehoor, hoewel hogere rates (oversampling genoemd) de kwaliteit nog meer laten toenemen doordat aliasing-artefacten rond de Nyquist-frequentie vermeden worden. De samplerate die gebruikt wordt door audio-cd's is 44 100 Hz. Menselijke spraak is zelfs verstaanbaar als frequenties boven 4000 Hz verwijderd worden; in feite verzenden telefoons alleen frequenties tussen 200 Hz en 4000 Hz. Daarom is een veelvoorkomende samplerate voor audio-opnames 8000 Hz, soms spraakkwaliteit genoemd.

Merk op dat heel steil filteren (anti-aliasing filteren genoemd) nodig is boven de Nyquist-frequentie om te voorkomen dat signalen boven deze drempelwaarde door de digitale omzetter terug in het hoorbare gebied gevouwen worden en de vervormende artefacten creëren van aliasing-ruis.

De meest voorkomende samplerates, gemeten in kilohertz (kHz of 1000 Hz), zijn 8 kHz, 16 kHz, 22,05 kHz, 22,25 kHz, 44,1 kHz, 48 kHz, 96 kHz en 192 kHz. Audacity ondersteunt al deze samplerates, hoewel de meeste computergeluidskaarten gelimiteerd zijn tot 48 kHz of soms 96 kHz. Nogmaals, de meest voorkomende samplerate is verreweg 44,1 kHz (44100 Hz).

In onderstaande afbeelding heeft de linkerkant een lage samplerate en de rechterkant een hoge samplerate (een hoge resolutie):

Golfvorm met hoge en lage samplerate

Sampleformaten

De andere maat voor audiokwaliteit is het sampleformaat (of bitdiepte), dat over het algemeen gemeten wordt met het aantal bits die gebruikt worden om elke sample voor te stellen. Hoe meer bits er gebruikt worden, hoe preciezer de voorstelling van elke sample. Door het vermeerderen van het aantal bits zal ook het maximum dynamisch bereik van de audio-opname toenemen. Met andere woorden: het verschil in volume tussen de luidst en stilst mogelijke geluiden die kunnen voorgesteld worden.

Het dynamisch bereik wordt voorgesteld in decibels (dB). Het menselijk oor kan geluiden waarnemen met een dynamisch bereik van ten minste 90 dB. Wanneer het echter mogelijk is, is het een goed idee om digitale audio op te nemen met een dynamisch bereik van veel meer dan 90 dB, gedeeltelijk omdat geluiden die te zacht zijn dan kunnen versterkt worden voor maximale weergavegetrouwheid. Opmerking: hoewel signalen die opgenomen zijn bij over het algemeen lage niveaus, kunnen verhoogd worden (genormaliseerd) om beter gebruik te maken van het beschikbaar dynamisch bereik, zal het opnemen van signalen met lage niveaus niet alle beschikbare bitdiepte gebruiken. Dit verlies van resolutie kan niet opnieuw opgenomen worden door gewoon het algemene volume van de digitale golfvorm te normaliseren.

Veelvoorkomende sampleformaten en hun respectieve dynamisch bereik zijn:

  • 8-bit integer: 45 dB
  • 16-bit integer: 90 dB
  • 24-bit integer: 135 dB
  • 32-bit floating point: bijna oneindig aantal dB

Andere sampleformaten zoals ADPCM benaderen 16-bit audio met gecomprimeerde 4-bit samples. Audacity kan veel van deze formaten importeren, maar ze worden weinig gebruikt omwille van veel betere nieuwere compressiemethodes.

Audio-cd's en de meeste audiobestandsformaten op computer gebruiken 16-bit gehele getallen (integers). Audacity gebruikt intern 32-bit floating point samples en converteert indien nodig de sample-bitdiepte wanneer de eindmix geëxporteerd wordt. Audacity's standaard sampleformaat kan geconfigureerd worden in de kwaliteitsvoorkeuren of individueel voor elke track ingesteld worden in het sporen-menu. Tijdens het afspelen zal de audio die een verschillend sampleformaat heeft dan het project on-the-fly geresampled worden door gebruik te maken van realtime conversie-instellingen in de kwaliteitsvoorkeuren. De hogekwaliteits-conversie-instellingen worden gebruikt bij het verwerken, mixen of exporteren.

Geïmporteerde audio zal zijn originele bitdiepte behouden tenzij deze lager is dan de kwaliteitsvoorkeuren, en in dat geval zal het geconverteerd worden om overeen te komen met de voorkeursinstellingen.

Bij onderstaande afbeelding heeft de linkerhelft een sampleformaat met weinig bits en de rechterhelft een sampleformaat met meer bits. Hoe meer bits, hoe beter de echte golf benaderd wordt. Als u zich de samplerate voorstelt als de ruimte tussen verticale rasterlijnen, dan is het sampleformaat de ruimte tussen horizontale rasterlijnen.

Verschillende sampleformaten

Grootte van audiobestanden

Audiobestanden zijn zeer groot, waarschijnlijk veel groter dan de meeste bestanden waarmee u werkt (behalve als u werkt met videobestanden). Om de grootte van een niet-gecomprimeerd audiobestand te bepalen, maakt u het product van de samplerate (bijvoorbeeld 44100 Hz), de bitrate van het sampleformaat (bijvoorbeeld 16-bit), het aantal kanalen (2 voor stereo) en het aantal seconden. Een compleet volle 74-minuten stereo audio-cd heeft meer dan 6 miljard bits nodig. Deel dit door 8 om het aantal bytes te weten; een audio-cd is een beetje minder dan 800 megabyte (MB). Zie gecomprimeerde audio hieronder.

Clipping

Eén limiet van digitale audio is dat het niet kan omgaan met geluidsdrukgolven die groter zijn dan de maximumwaarden waarvoor het ontworpen is. Wanneer een opgenomen signaal deze maximumwaarde overschrijdt, zullen samples buiten het gebied afgeknipt (in het Engels: clipping) worden tot aan de maximumwaarde, zoals dit:

Golfvorm met clipping

Een geluid opgenomen met clipping zal vervormd en hard klinken. Ondanks het feit dat er technieken zijn om kleine hoeveelheden ruis ten gevolge van clipping te elimineren, is het best om clipping te vermijden tijdens het opnemen. Pas het volume op uw invoerbron aan (microfoon, cassettespeler, platenspeler) en stel de invoervolumeregeling van Audacity (in de mixerwerkbalk) op een zodanige manier in dat de golfvorm zo groot mogelijk is (voor maximale fidelity of weergavegetrouwheid) zonder clipping.

Gecomprimeerde audio

Omdat digitale audiobestanden zo groot zijn, wordt vooral het verminderen van de samplerate toegepast wanneer dat mogelijk is. In 1991 veranderde de mp3-standaard (MPEG I, layer 3) alles. Mp3 is een lossy compressietechniek (compressie waarbij verliezen optreden) die de bestandsgrootte van een digitaal audiobestand drastisch kan verkleinen met verrassend weinig effect op de kwaliteit. Eén seconde cd-kwaliteit audio heeft tot 1,4 megabits nodig, terwijl een algemene bitrate voor mp3-bestanden 128 kilobits is, wat neerkomt op een compressiefactor van meer dan 10! Mp3 werkt door het slim "wegwerpen" van details in de audio-golfvorm waar mensen niet erg gevoelig voor zijn, gebaseerd op een psycho-akoestisch model van hoe onze oren en hersenen geluiden verwerken. Niet alle mp3-bestanden worden op dezelfde manier gemaakt; verschillende psycho-akoestische modellen zullen leiden tot verschillende hoeveelheden waarneembare vervorming in het audiobestand.

Met goede luidsprekers kan iedereen het verschil horen tussen een 128k mp3 en een ongecomprimeerd audiobestand van een cd. 192k en 256k mp3-bestanden zijn populairder onder audiofielen die hogere kwaliteit verkiezen.

Er zijn veel andere lossy gecomprimeerde audio-bestandsformaten. Audacity ondersteunt het Ogg Vorbis-formaat, dat gelijkaardig is aan mp3 maar een compleet open, patentvrije standaard is. Met de tijd heeft de kwaliteit van Ogg Vorbisbestanden de kwaliteit van mp3 overtroefd, terwijl het formaat meer uitbreidbaar is waardoor meer verbeteringen mogelijk zijn. Ogg Vorbis is een zeer goede keuze voor uw eigen audio, hoewel de realiteit is dat veel meer apparaten zoals iPods en andere draagbare audiospelers wel mp3 maar nog geen Ogg Vorbis ondersteunen.

Andere gekende compressiemethodes zijn ATRAC, gebruikt door Sony Minidisc-recorders, Windows Media Audio (WMA) en AAC.

Views
Help Location