Digital Audio/fr
From Audacity Manual
Échantillonnage Digital
Tous les sons que nous percevons avec nos oreilles sont des ondes de pression dans l'air. A partir de la démonstration par Thomas Edison du premier phonographe en 1877, Il a été possible de capturer ces ondes de pression sur un support physique et de les reproduire ultérieurement en les générant à nouveau. Les ondes de pression Audio, ou forme d'ondes, ressemblent environ à cela:
Les supports d'enregistrement en mode analogue tels que les disques de phonographe ou les bandes d'enregistrement de cassette représentent directement la forme de l'onde, utilisant la profondeur du sillon pour un disque ou le degré de magnétisation pour une bande. Les enregistrements analogues peuvent reproduire une variété impressionnante de sons mais ils souffrent aussi de problèmes dûs au bruit. A noter que chaque fois qu'un enregistrement analogue est copié, plus de bruit y est introduit, ce qui diminue la fidélité à l'original. Ce bruit peut être minimisé mais pas complètement éliminé.
L'enregistrement "Digital" fonctionne différemment: il "échantillonne" la forme d'onde à des points espacés de manière égale dans le temps, représentant chaque échantillon en tant que nombre précis. Les enregistrements digitaux, qu'il soient stockés sur des disques compacts (CD) ou sur des bandes audio (DAT), ou sur un ordinateur personnel, ne se dégradent pas au cours du temps et peuvent être copiés parfaitement sans qu'aucun bruit additionnel n'y soit ajouté. L'image suivante illustre une forme audio échantillonnée.
L'audio digital peut être édité et mixé sans ajouter aucun bruit additionnel. De plus de nombreux effets digitaux peuvent être ajoutés à un enregistrement audio digitalisé pour simuler la réverbération, augmenter certaines fréquences, ou changer le niveau par exemple.
La capacité d'Audacity de reproduire ou d'enregistrer le son directement depuis votre ordinateur dépend de votre matériel informatique. La plupart des ordinateurs "desktop" sont munis d'une "carte son" ayant des prises jacks 1/8" qui vous permettent de brancher un microphone ou une autre source pour l'enregistrement ainsi que des haut-parleurs ou des oreillettes pour l'écoute. Un grand nombre d'ordinateur laptop sont munis de haut-parleurs et de microphone intégrés. La carte son qui est intégrée à la plupart des ordinateurs n'est pas de qualité particulièrement bonne; Si vous êtes intéressés à un enregistrement de haute qualité, voir Qualité d'enregistrement pour plus de détails si vous êtes intéressés par l'enregistrement de haute qualité. Pour les informations sur la manière de régler Audacity pour effectuer un playback ou pour enregistrer, voir Réglage et configuration d'Audacity.
Qualité de son Audio
La qualité d'un enregistrement audio digital dépend énormément de deux facteurs: la vitesse et le format type ou l'intensité du bit. L'augmentation de la vitesse ou du nombre de bits de chaque échantillon augmente la qualité de l'enregistrement mais cela a pour conséquence l'augmentation de l'espace utilisé par les fichiers audio sur le disque de l'ordinateur.
Fréquence d'échantillonnage
Les "fréquence d'échantillonnage" sont mesurés en hertz (Hz), ou cycles par seconde. Cette valeur représente simplement le nombre de types de fréquence saisi par seconde de manière à représenter la forme de l'onde. Plus il-y-a de types par secondes, plus précise est la mesure de la forme d'onde. L'oreille humaine est sensible à des types de sons ayant des fréquences approximativement entre 20 Hz et 20'000 Hz. Des sons en dehors de cette limite sont essentiellement inaudibles bien que Rupert Neve a prouvé subjectivement l'existence de fidélité psycho-acoustique qui peut être perçue au-delà cette limite supposée de 20'000kHz.
La saisie de sons à une fréquence particulière requière une gamme de fréquences au moins double de cette fréquence (connue sous le nom de fréquence de Nyquist). C'est pourquoi une fréquence de 40000 Hz est le minimum absolu indispensable pour reproduire des sons dans le spectre auditif humain, bien que des fréquences (appelées over sampling) puissent augmenter encore plus la qualité en évitant des sons parasites autour de la fréquence de Nyquist. Le type de fréquence utilisé pour les CD audios est de 44100 Hz. La voix humaine est intelligible même si les fréquences au-dessus de 4000 Hz sont éliminées. En fait les téléphones ne transmettent guère que des fréquences entre 200 Hz et 4000 Hz. C'est pourquoi une fréquence courante pour les enregistrements audios, appelée parfois "qualité discours", est de 8000 Hz. A noter qu'un filtrage très fort (appelé filtre anti-crénelage) est nécessaire au-dessus de la fréquence de Nyquist afin d'éviter qu'un signal au-dessus de ce point limite ne soit reproduit par le convertisseur digital dans le spectre audible et crée de ce fait des sons ou des bruits parasites.
Les fréquences les plus habituelles, mesurées en kilohertz (kHz, ou 1000 Hz), sont 8 kHz, 16 kHz, 22.05 kHz, 22.25 kHz, 44.1 kHz, 48 kHz, 96 kHz, et 192 kHz. Audacity supporte n'importe laquelle de ces fréquences. Cependant la plupart des cartes sons des ordinateurs sont limitées à 48 kHz et parfois à 96 kHz. Encore une fois, la fréquence la plus courante est de loin 44,1kHz (44100 Hz).
Dans l'image ci-dessous, la partie gauche représente un exemple de basse fréquence. La partie droite représente un exemple de haute fréquence (c.à.d haute résolution).
Formats Types
L'autre manière de mesurer la qualité du son audio est le format type (ou "intensité de bit"), qui est habituellement mesuré en nombre de "bits" informatique utilisé pour représenter chaque échantillon. Plus le nombre de bits est important, plus précise est la représentation de chaque échantillon. En augmentant le nombre de bits on augmente aussi l'échelle dynamique de l'enregistrement audio. En d'autres termes, la différence de volume entre les sons les plus forts et les plus faibles possibles qui peuvent être représentés.
La portée dynamique est mesurée en décibels (dB). L'oreille humaine peut percevoir des sons avec une ampleur dynamique d'au moins 90 dB. Toutefois, chaque fois que cela est possible, il est indiqué d'enregistrer un audio digital à une échelle dynamique de bien plus de 90 dB, de manière que les sons trop faibles puissent être amplifiés avec un degré de fidélité maximal. A noter que bien que les signaux enregistrés à des niveaux inférieurs puissent être augmentés (c.a.d. normalisés) pour améliorer le niveau dynamique disponible, l'enregistrement des signaux faibles ne va pas utiliser toute l'"intensité de bit" à disposition. Cette perte de résolution ne peut pas être récupérée simplement en normalisant le degré général de la forme d'onde digitale.
Les formats types courants et leur ampleur dynamique respective incluent:
- 8-bit entier: 45 dB
- 16-bit entier: 90 dB
- 24-bit entier: 135 dB
- 32-bit virgule flottante: dB quasi infini
D'autres exemples de formats comme ADPCM se rapprochent de 16-bit audio avec des exemples à 4-bit compressés. Audacity peut importer plusieurs de ces formats mais ils sont rarement utilisés du fait qu'il existe de bien meilleures nouvelles méthodes de compression.
Les CD et la plupart des formats de fichiers audio sur ordinateur utilisent 16-bit entiers. Par défaut, Audacity utilise le 32-bit à virgule flottante de manière interne pendant que vous travaillez sur un projet, puis exporte votre mixage final en utilisant 16-bit entiers. Ceci vous donne une meilleure qualité que les programmes audio utilisant purement 16-bit ou 24-bit. Le format par défaut des formats types d'Audacity peut être configuré dans Préférences Qualité ou réglé individuellement pour chaque piste dans Menu déroulant piste.
Sur l'image ci-dessous, la partie gauche montre un exemple de format avec quelques bits, la partie droite montre un exemple de format avec plus de bits. Si vous vous imaginez le degré de l'échantillon comme l'espacement entre les lignes verticales d'un quadrillage, le format de l'échantillon est représenté par l'espacement entre les lignes horizontales du quadrillage.
Volume des fichiers audio
Les fichiers audio sont très volumineux, bien plus volumineux que la plupart des fichiers avec lesquels vous travaillez (sauf si vous travaillez avec des fichiers vidéo). Pour déterminer le volume d'un fichier audio non compressé, multipliez le taux type (p.ex. 44100 Hz) par le taux de bit du format type (p.ex. 16-bit), par le nombre de bandes (2 pour la stéréo), par le nombre de secondes. Un CD audio entier de 74 minutes stéréo nécessite plus de 6 millions de bits. Divisez par 8 pour obtenir le nombre de bytes; un CD audio consiste en un peu moins que 800 megabytes (MB). Voyez audio compressé ci-dessous.
Coupure
Une limitation de l'audio digital consiste dans le fait qu'il ne peut pas accepter des sons qui excèdent le niveau maximum pour lequel il a été réglé. Lorsqu'un signal est enregistré à un niveau supérieur au maximum autorisé, les sons en-dehors de la limite sont coupés au niveau de la valeur maximum, selon l'exemple qui suit:
Un son enregistré avec coupure sera déformé et cru. Bien qu'il existe quelques techniques qui permettent d'éliminer une petite partie du bruit occasionné par la coupure, il est toujours préférable d'éviter la coupure lors de l'enregistrement. Changez le volume de votre source d'entrée (microphone, magnétophone, table de lecture) et réglez le volume d'entrée d'Audacity (dans la Barre d'outils Mixer) de telle sorte que la forme d'onde soit la plus large possible (pour un maximum de fidélité) sans coupure.
Audio Compressé
Du fait que les fichiers audio sont si volumineux, des niveaux d'échantillonnage réduits étaient utilisés chaque fois que cela était possible. En 1991, le standard MP3 (MPEG I, niveau 3) a changé tout cela. MP3 est une compression lossy(à perte) qui peut réduire de manière impressionnante le volume d'un fichier audio avec relativement peu de réduction de qualité. Une seconde audio en qualité CD nécessite environ 1,4 megabits, alors qu'en MP3 la base est de 128 kilobits, ce qui consiste en un facteur de compression de plus de 10 fois ! MP3 travaille de manière intelligente en "jetant" des détails du son audio auxquels les humains ne sont pas sensibles, en se basant sur un modèle "psycho-acoustique" de la manière dont nos oreilles et notre cerveau enregistrent les sons. Tous les fichiers MP3 ne sont pas créés de manière similaires. Des modèles psycho-acoustique différents vont produire des distorsions perçues de manières différentes.
Avec de bons haut-parleurs, n'importe qui peut entendre la différence entre un MP3 à 128k et un fichier audio non compressé d'un CD. Les fichiers MP3 à 192k et 256k sont plus populaires auprès des audiophiles qui préfèrent une qualité plus élevée.
Il existe plusieurs autres format de compressions "lossy" de fichiers audio. Audacity supporte le format Ogg Vorbis, qui est similaire au MP3 mais qui est un standard sans patente, totalement ouvert. Au cours du temps la qualité des fichiers Ogg Vorbis a surpassé celle de MP3 et son format est plus extensible de sorte que plus d'améliorations sont possibles. Ogg Vorbis est un choix privilégié pour votre propre audio. Toutefois la réalité est qu'un grand nombre de nouveau matériel, comme iPods et autres audio players portables supportent MP3 et non encore Ogg Vorbis.
D'autres méthodes de compression bien connues incluent ATRAC, utilisé pour les enregistreurs de mini-disques Sony, Windows Media Audio (WMA) et AAC.