G.722La norme de codage mondiale G.722 normalisée par l'UIT-T en 1987 permet d'obtenir en voix sur IP une qualité de voix "haute définition" (dite téléphonie large-bande). Cette qualité est obtenue par doublement de la bande de fréquence codée (50-7 000 Hz) par rapport à la qualité téléphonique usuelle dite bande étroite (300-3 400 Hz) produite par le format de codage G.711 (MIC) utilisé en téléphonie "classique" sur les réseaux RTC. L'utilisateur bénéficie donc d'une sensation de présence de son interlocuteur, d'un confort d'écoute et d'une intelligibilité fortement améliorés.
Sub-band codingIn signal processing, sub-band coding (SBC) is any form of transform coding that breaks a signal into a number of different frequency bands, typically by using a fast Fourier transform, and encodes each one independently. This decomposition is often the first step in data compression for audio and video signals. SBC is the core technique used in many popular lossy audio compression algorithms including MP3. The simplest way to digitally encode audio signals is pulse-code modulation (PCM), which is used on audio CDs, DAT recordings, and so on.
Opus Interactive Audio CodecOpus est un format ouvert de compression audio avec pertes, sans redevances et normalisé par l'Internet Engineering Task Force (IETF), conçu pour encoder efficacement la voix et plus largement l'audio dans un format unique, tout en ayant une latence suffisamment faible pour la communication en temps réel et une complexité suffisamment faible pour les processeurs embarqués peu puissants. Opus remplace Vorbis et Speex pour les nouvelles applications et différents tests d'écoute en aveugle l'ont jugé supérieur à tous les autres formats audio à tous les débits, y compris MP3, AAC et HE-AAC.
Waveform Audio File FormatLe Waveform Audio File Format (WAVE, ou WAV en rapport avec son extension de fichier), est un format conteneur destiné au stockage de l'audio numérique mis au point par Microsoft et IBM. Le format WAVE est construit conformément au , c'est pourquoi on parle parfois de « RIFF/WAVE ». Le format WAV est un format conteneur capable de recevoir des flux audio aussi variés que le MP3, l'AC-3, l'ATRAC, l'ADPCM, le PCM. Ce dernier étant de très loin le plus courant, les fichiers .
Apple LosslessApple Lossless Audio Codec (abrégé ALAC, en Codec audio sans perte Apple), aussi connu sous le nom Apple Lossless, est un format de compression sans perte (lossless) créé en 2004. Le format a été développé par Apple pour combler une lacune de la norme MPEG-4, dont la partie consacrée à la compression sans perte tarde encore à être finalisée. ALAC, qui s'adressait majoritairement aux utilisateurs d'iTunes et de l'iPod, a été un format propriétaire jusqu’à la fin , date à laquelle les sources du codec ont été rendues disponibles sous une licence Apache.
MPEG-4 Part 14MPEG-4 Part 14, ou MP4, également appelé , est une partie de la norme MPEG-4 spécifiant un format conteneur pour encapsuler des données de type multimédia (audio ou vidéo essentiellement). L'extension de nom de fichier généralement associée à ce format est « .mp4 » (d'où le nom « MP4 »). L'extension « .m4a », bien que non spécifiée dans la norme, est également utilisée, généralement pour des fichiers ne contenant que du contenu de type audio. Les formats audio correspondant étant le AAC (Advanced Audio Coding) ou le ALAC (Apple Lossless).
Free Lossless Audio Codec(FLAC) est un codec libre de compression audio sans perte développé par Xiph.org. Il obtient un taux de compression d'environ 50 % par rapport à des données PCM non-compressées. Son caractère sans perte le rend adapté pour l'archivage de données audio. Le développement de FLAC a commencé en 2000 en tant que projet indépendant par Josh Coalson. La version 1.0 est publiée le 20 juillet 2001. Le , FLAC rejoint Xiph.org, rejoignant ainsi la collection de formats audio libres soutenus par la fondation, comprenant notamment le conteneur Ogg et les codecs Vorbis, Theora et Speex.
Comparison of audio coding formatsThe following tables compare general and technical information for a variety of audio coding formats. For listening tests comparing the perceived audio quality of audio formats and codecs, see the article Codec listening test. The 'Music' category is merely a guideline on commercialized uses of a particular format, not a technical assessment of its capabilities. For example, MP3 and AAC dominate the personal audio market in terms of market share, though many other formats are comparably well suited to fill this role from a purely technical standpoint.
RealPlayerRealPlayer est un lecteur multimédia édité par RealNetworks. Il fonctionne grâce à un moteur à source ouverte (« open source ») appelé Helix. La première version de RealPlayer a été introduite en et nommée RealAudio Player, c'était l'un des premiers lecteurs capables de lecture en continu (« streaming ») sur Internet. La Version 6 de RealPlayer a été appelée RealPlayer G2 ; la version 9 est appelée RealOne Player. Il existe des versions « basiques » gratuites, ainsi que des versions payantes avec des fonctionnalités supplémentaires.
Video coding formatA video coding format (or sometimes video compression format) is a content representation format for storage or transmission of digital video content (such as in a data file or bitstream). It typically uses a standardized video compression algorithm, most commonly based on discrete cosine transform (DCT) coding and motion compensation. A specific software, firmware, or hardware implementation capable of compression or decompression to/from a specific video coding format is called a video codec.
De facto standardA de facto standard is a custom or convention that has achieved a dominant position by public acceptance or market forces (for example, by early entrance to the market). De facto is a Latin phrase (literally "in fact"), here meaning "in practice but not necessarily ordained by law" or "in practice or actuality, but not officially established".
Speech codingSpeech coding is an application of data compression to digital audio signals containing speech. Speech coding uses speech-specific parameter estimation using audio signal processing techniques to model the speech signal, combined with generic data compression algorithms to represent the resulting modeled parameters in a compact bitstream. Common applications of speech coding are mobile telephony and voice over IP (VoIP).
Modulation par impulsions et codageLa modulation par impulsions et codage ou MIC (en anglais : pulse-code modulation), généralement abrégé en PCM est une représentation numérique d'un signal électrique résultant d'un processus de numérisation. Le signal est d'abord échantillonné, puis chaque échantillon est quantifié indépendamment des autres échantillons, et chacune des valeurs quantifiées est convertie en un code numérique. Le traitement indépendant de chaque échantillon implique qu'il n'y a ni chiffrement, ni compression de données.
Advanced Audio CodingAdvanced Audio Coding (AAC, « encodage audio avancé ») est un algorithme de compression audio avec perte de données ayant pour but d’offrir un meilleur rapport qualité sur débit binaire que le format plus ancien MPEG-1/2 Audio Layer 3, plus connu sous le nom de MP3. Pour ces qualités, il est choisi par différentes entreprises dont Apple ou RealNetworks. La RNT (Radio numérique terrestre utilise le système de radio diffusion DAB+ (version améliorée du DAB, Digital Audio Broadcasting) qui intègre une version avancée du codec AAC : HE-AAC version 2, aussi appelé eAAC+, et défini dans la norme MPEG-4 Part 3.
Modified discrete cosine transformThe modified discrete cosine transform (MDCT) is a transform based on the type-IV discrete cosine transform (DCT-IV), with the additional property of being lapped: it is designed to be performed on consecutive blocks of a larger dataset, where subsequent blocks are overlapped so that the last half of one block coincides with the first half of the next block. This overlapping, in addition to the energy-compaction qualities of the DCT, makes the MDCT especially attractive for signal compression applications, since it helps to avoid artifacts stemming from the block boundaries.
Transform codingTransform coding is a type of data compression for "natural" data like audio signals or photographic s. The transformation is typically lossless (perfectly reversible) on its own but is used to enable better (more targeted) quantization, which then results in a lower quality copy of the original input (lossy compression). In transform coding, knowledge of the application is used to choose information to discard, thereby lowering its bandwidth. The remaining information can then be compressed via a variety of methods.
MP3Le MPEG-1 Audio Layer ou MPEG-2 Audio Layer , plus connu sous son abréviation de MP3, est la spécification audio des standards MPEG-1 et MPEG-2. Il s'agit d'un format de compression audio avec perte permettant une réduction importante de la taille du flux de données audio, tout en conservant une qualité de restitution couramment jugée acceptable, donnant le choix du débit selon le compromis taille-qualité souhaité. C'est aussi l'un des formats de musique numérique les plus répandus. L'extension de nom de fichier est .
Son numérique (musique)thumb|Échantillonnage (en gris) d'un signal analogique (en rouge). L'arrivée de l'informatique et du stockage d'information sous forme numérique a entraîné une véritable révolution dans le domaine musical. Cette révolution a commencé avec le CD audio, puis avec la compression des fichiers audios, puis les lecteurs dits MP3 et continue de nos jours avec l'intégration de la composante numérique dans le monde de la Hi-Fi et dans les lecteurs multimédias. Il y a pour le grand public plusieurs sources possibles pour obtenir de la musique sous forme numérique.
PsychoacoustiqueLa psychoacoustique est la branche de la psychophysique qui étudie les rapports entre les perceptions auditives de l'être humain et les sons qui parviennent à ses oreilles. Elle fait appel à l'acoustique, qui étudie la nature et les propriétés des ondes sonores, à la physiologie de l'audition, qui examine dans quelle mesure elles se transforment en influx nerveux, à la psychologie et aux sciences cognitives. Elle emploie les méthodes de la psychologie expérimentale.
OggOgg est le nom du principal projet de la fondation Xiph.org dont le but est de proposer des formats et codecs multimédias ouverts, libres et dégagés de tout brevet. C’est aussi le nom du format de fichier conteneur proposé par ce même projet. L’extension .ogg est une des extensions possibles pour les fichiers au format Ogg. Par abus de langage, on appelle couramment « fichier Ogg » un fichier audio au format Ogg contenant des données audio compressées en Vorbis, l’un des codecs du projet Ogg. La fondation Xiph.