Звуковые форматы и их характеристика

Содержание

Цифровой аудиоформат — формат представления звуковых данных, используемый при цифровой звукозаписи, а также для дальнейшего хранения записанного материала на компьютере и других электронных носителях информации, так называемых звуковых носителях.

Аудиофайл (файл, содержащий звукозапись) — компьютерный файл, состоящий из информации об амплитуде и частоте звука, сохранённой для дальнейшего воспроизведения на компьютере или проигрывателе.

Содержание

Разновидности цифровых аудиоформатов [ править | править код ]

Существуют различные понятия звукового формата.

Формат представления звуковых данных в цифровом виде зависит от способа квантования аналогово-цифровым преобразователем (АЦП). В звукотехнике в настоящее время наиболее распространены два вида квантования:

Зачастую разрядность квантования и частоту дискретизации указывают для различных звуковых устройств записи и воспроизведения как формат представления цифрового звука (24 бита/192 кГц; 16 бит/48 кГц).

Формат файла определяет структуру и особенности представления звуковых данных при хранении на запоминающем устройстве ПК. Для устранения избыточности аудиоданных используются аудиокодеки, при помощи которых производится сжатие аудиоданных. Выделяют три группы звуковых форматов файлов:

  • аудиоформаты без сжатия, такие как WAV, AIFF
  • аудиоформаты со сжатием без потерь (APE, FLAC)
  • аудиоформаты со сжатием с потерями (MP3, Ogg)

Особняком стоят модульные музыкальные форматы файлов. Созданные синтетически или из семплов заранее записанных живых инструментов, они в основном служат для создания современной электронной музыки (MOD). Также сюда можно отнести формат MIDI, который не является звукозаписью, но с помощью секвенсора позволяет записывать и воспроизводить музыку, используя определённый набор команд в текстовом виде.

Форматы носителей цифрового звука применяют как для массового распространения звуковых записей (CD, SACD), так и в профессиональной звукозаписи (DAT, минидиск).

Для систем пространственного звучания также можно выделить форматы звука, в основном являющиеся звуковым многоканальным сопровождением к кинофильмам. Такие системы имеют целые семейства форматов от двух крупных конкурирующих компаний — Digital Theater Systems Inc. (DTS) и Dolby Laboratories Inc. (Dolby Digital).

Также форматом называют количество каналов в системах многоканального звука (5.1; 7.1). Изначально такая система была разработана для кинотеатров, но впоследствии была расширена для систем домашнего кинотеатра.

Некоторые виды цифрового звука в сравнении [ править | править код ]

12:1 с потерями

11:1 с потерями

Название формата Разрядность, бит Частота дискретизации, кГц Число каналов Скорость потока данных с диска, кбит/с Степень и тип сжатия
CD 16 44,1 2 1411,2 1:1 без потерь
Dolby Digital (AC3) 16-24 48 6 до 640
DTS 20-24 48; 96 до 8 до 1536 3:1 с потерями
DVD-Audio 16; 20; 24 44,1; 48; 88,2; 96 6 6912 1:1 без потерь
DVD-Audio 16; 20; 24 176,4; 192 2 4608 1:1 без потерь
MP3 16-24 до 48 2 до 320
AAC 16-24 до 96 до 48 до 512 с потерями
AAC+ (SBR) 16-24 до 48 2 до 320 с потерями
Ogg Vorbis до 32 до 192 до 255 до 500 с потерями
WMA до 24 до 96 до 2 до 768 2:1, есть версия без потерь

Таблица сравнения [ править | править код ]

Возможности FLAC WavPack TAK Monkey’s Audio OptimFROG ALAC WMA Shorten LA TTA MPEG-4 ALS MPEG-4 SLS Real Lossless
Кодирование быстро очень быстро очень быстро быстро медленно быстро средне очень быстро очень медленно быстро средне медленно медленно
Декодирование очень быстро быстро очень быстро средне медленно быстро быстро очень быстро медленно быстро быстро медленно очень быстро
Сжатие* 55,7 % 55,7 % 53,9 % 53,7 % 53,2 % 56,7 % 57,1 % 60,9 % 52,1 % 55,3 % 55,1 % ? 55,4 %
Гибкость** очень хорошо очень хорошо очень хорошо очень хорошо очень хорошо плохо плохо плохо средне плохо очень хорошо плохо плохо
Обработка ошибок да да да нет да да нет нет да да да
Поиск да да да да да да да да да да да да да
Теги Vorbis tags ID3/APE APEv2 (exp.) ID3/APE ID3/APE iTunes ASF нет ID3v1 ID3 да да собственные
Аппаратная поддержка очень хорошо ограниченно нет ограниченно нет хорошо ограниченно ограниченно нет ограниченно нет нет нет
Программная поддержка очень хорошо хорошо средне хорошо средне средне хорошо очень хорошо плохо средне плохо плохо плохо
Гибрид/lossy (без потерь) нет да нет нет да нет нет нет нет нет нет да нет
ReplayGain да да да нет да отчасти нет нет нет да да да нет
RIFF-чанки да да да да нет да да нет
Потоковое воспроизведение да да да нет да да да нет нет да да да
Поддержка Pipe да да да да да да да да да нет нет
Открытый исходный код да да нет да нет да нет да нет да да да нет
Многоканальность да да да нет нет да да нет нет да да да нет
Высокое разрешение да да да да да да да нет нет да да да нет
Поддержка ОС Кроссплатформенный Кроссплатформенный Win/Linux Wine Кроссплатформенный Win/Mac/Linux Кроссплатформенный Win/Mac Кроссплатформенный Win/Linux Кроссплатформенный Кроссплатформенный Кроссплатформенный Win/Mac/Linux
  • Коэффициент сжатия вычисляется как отношение размера после сжатия к размеру до сжатия, умноженное на 100 %. Таким образом, чем меньше значение, тем лучше.

Указанные в таблице скорости кодирования и декодирования, а также коэффициент сжатия, получаются при использовании стандартных настроек кодировщика.

  • Под гибкостью понимается число доступных пользователю вариантов кодирования (быстро/слабое сжатие, медленно/сильное сжатие и все промежуточные варианты).

Список цифровых аудиоформатов [ править | править код ]

  • AA
  • AAC
  • AC3 (Dolby Digital)
  • ADX
  • AHX
  • AIFF
  • APE
  • ASF
  • AU[en] (SND)
  • AUD
  • DMF
  • DTS
  • DXD
  • FLAC
  • MMF (Yamaha SMAF)
  • MOD
  • MP1
  • MP2
  • MP3
  • MP4
  • MPC
  • Ogg Vorbis
  • Opus
  • RA
  • TTA
  • VOC
  • VOX[en]
  • VQF
  • WAV
  • WMA
  • XM

Кодирование без потерь [ править | править код ]

Форматы без сжатия [ править | править код ]

  • AIFF
  • AU
  • CDDA — формат, используемый в аудио-CD
  • DSD — формат, используемый в SACD
  • DXD — качество цифровой звукозаписи DXD по многим параметрам превосходит не только другие ИКМ-форматы, но и DSD.
  • IFF-8SVX — Interchange File Format
  • IFF-16SV
  • RAW — необработанные («сырые») замеры без какого-либо заголовка или синхронизации
  • WAV — Microsoft Wave (Waveform audio format); разработан совместно с IBM

Форматы со сжатием звука без потерь [ править | править код ]

  • FLAC (.flac) — свободный кодек из проекта Ogg
  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression (LPAC; .pac)
  • Apple Lossless (.m4a)
  • Monkey’s Audio (.ape)
  • OptimFROG (.ofr) [1]
  • RKAU (.rka) [2]
  • Shorten (.shn)
  • TTA — True Audio, свободный кодек
  • TAK (.tak) — Tom’s lossless Audio Kompressor
  • WavPack (.wv)
  • Windows Media Audio 9 Lossless (.wma)
  • ADX — формат звука с максимальным битрейтом 1 Гбит/с
  • PXD (.pxd) — формат компании PXD Media. Один из первых аудиокодеков без потерь (1997). Используется в музыкальных конструкторах EJAY и других.

Кодирование с потерями [ править | править код ]

  • MP2 — MPEG-1/2 Layer 2 (Musicam)
  • MP3 — MPEG-1/2/2.5 Layer 3
  • Vorbis — проект Ogg, свободный, похож по принципам на MP3
  • Speex — проект Ogg, свободный, сжатие голоса, низкий битрейт
  • Opus — проект Ogg, свободный, передача звука по сети; основан на технологиях кодеков CELT и SILK.
  • GSM-FR — GSM Full Rate, изначально для сотовых телефонов
  • G.723.1 — один из базовых кодеков речевой IP-телефони
  • G.729 — эффективный узкополосный речевой кодек IP-телефони
  • Windows Media Audio (WMA)
  • AAC (.m4a, .mp4, .m4p, .aac) — Advanced Audio Coding, часто в контейнере MPEG-4
  • Musepack — Musepack (MPC)
  • TwinVQ — Yamaha TwinVQ (VQF)
  • RealAudio (RA, RM)
  • OTS Audio File — похож на MP3
  • SWA — Macromedia Shockwave Audio; сжатие как в MP3 с дополнительными заголовками для Macromedia Director[3]
Читайте также:  Как закрыть программу если она не закрывается

Другие форматы [ править | править код ]

  • GYM — лог чипа GenesisYM2612
  • IMF ( >BGM ) для игр серии Creatures[en] , начиная с Creatures 2[4]
  • MOD — модули Soundtracker и Protracker для семплов и мелодии
  • MusicXML
  • NSF (NES music)
  • NIFF
  • ORG (Organya) — формат, придуманный разработчиками игры Cave Story
  • PSF — PlayStation sound format
  • PTB (Power Tab Editortab)
  • S3M — модуль ScreamTracker 3, чуть больше эффектов и отдельной колонкой громкости
  • SPC — звуковой формат Super Nintendo Entertainment System
  • STF — файл проекта StudioFactory, содержит все необходимые патчи, семплы, треки и установки для воспроизведения файла
  • SYN — файл проекта SynFactory, содержит все необходимые патчи, семплы, треки и установки для воспроизведения файла
  • VGM (V > Форматы плейлистов [ править | править код ]

Существуют как общепринятые (стандартные) форматы плейлистов, так и разработанные для конкретного медиаплеера. Однако нередко форматы второго типа становятся популярными и стандартными.

Аудио-форматы — это разновидности файлов, предназначенные для хранения цифровых аудиоданных в компьютерной системе. Битовая компоновка аудиоданных (за исключением метаданных) называется форматом кодирования аудио и может быть несжатой или сжатой. Сжатие используется для того, чтобы уменьшить размер файла, что часто сочетается с потерей качества звука. Звук также может быть сырым битовым потоком в формате кодирования аудио, но обычно он встраивается в формат аудиоданных с определенным слоем хранения.

Что они собой представляют?

Аудиофайл — это набор информации, который состоит из данных о частоте и амплитуде звука, сохраненный для последующих воспроизведений.

Аудио-форматы могут играть роль контейнера для необработанных данных, а также использовать аудиокодеки. Зачастую эти понятия смешивают и путают.

Кодек выполняет кодирование и декодирование необработанных аудиоданных, в то время как эти закодированные данные обычно хранятся в файле-контейнере. Несмотря на то что большинство форматов звуковых файлов поддерживают только один тип данных кодирования аудио (созданных с помощью аудиокодера), формат мультимедийного контейнера (например, Matroska или AVI) может поддерживать несколько типов аудио- и видеоданных.

Разновидности по объему и качеству

Форматы аудио-файлов могут быть выделены в следующие группы:

1. Несжатые – такие как WAV, AIFF, AU или необработанные PCM без заголовков.

2. Форматы со сжатием без потерь – к примеру, FLAC, AudioMonkey’s (расширение файла .ape), WavPack (расширение файла .wv), TTA, ATRAC AdvancedLossless, ALAC (расширение имени файла .m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA без потерь) и Shorten (SHN).

3. Форматы с компрессией с потерями качества – например, Opus, MP3, Vorbis, Musepack, AAC, ATRAC и Windows Media Audio Lossy (сжатые WMA).

Основной тип

Одним из основных несжатых аудиоформатов является LPCM. По своей сути он представляет собой разновидность PCM и подобен Digital Audio (формат аудио CD-дисков). Он является разновидностью, наиболее широко используемой низкоуровневыми API и цифроаналоговыми преобразователями. Несмотря на то что LPCM может храниться на компьютере в виде необработанного звукового формата, он обычно находится в WAV-файле в Windows или в .aiff на macOS.

WAV и AIFF

Цифровой аудиоформат AIFF основан на формате файла обмена (IFF), а WAV — на аналогичной разновидности файла обмена ресурсами (RIFF). WAV и AIFF предназначены для хранения широкого спектра аудиоформатов как без потерь качества, так и с потерями. Они просто добавляют небольшой заголовок, содержащий метаданные, перед звуковой составляющей, чтобы обозначить формат аудио (например, LPCM с конкретной частотой дискретизации, битовой глубиной, порядковыми номерами и количеством каналов). Поскольку WAV и AIFF широко поддерживаются и могут хранить LPCM, они являются подходящими файловыми форматами для хранения и архивирования оригинальной записи.

Новое поколение

BWF (Broadcast Wave Format) — это стандартный аудиоформат, созданный Европейским радиовещательным союзом в качестве преемника WAV. Он имеет массу улучшений, в числе которых возможность хранить более надежные метаданные в файле. Это основной формат записи, используемый во многих профессиональных рабочих станциях в телевизионной и киноиндустрии. Файлы BWF включают в себя стандартизированную метку времени, которая позволяет легко синхронизировать звук с отдельным элементом изображения. Автономные многодорожечные рекордеры AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton, и TASCAM всегда используют BWF как предпочтительный формат.

Аудиоформаты со сжатием и без

Такая разновидность сохраняет данные в меньшем объеме без потери информации. Исходные данные при этом могут быть воссозданы из такой версии.

Несжатые аудио-форматы кодируют звук и тишину с одинаковым количеством битов в единицу времени. Кодирование минуты абсолютной тишины создает файл такого же размера, как и минуты музыки. Однако в сжатом формате музыка будет занимать меньший файл, чем оригинальная запись, а тишина почти не будет занимать места.

Форматы аудио-файлов такого типа включают в себя FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Они обеспечивают коэффициент сжатия около 2:1 (то есть файлы занимают половину пространства PCM). Разработка в форматах сжатия без потерь направлена ​​на сокращение времени обработки при сохранении хорошего качества звука.

Сжатый аудиоформат с потерями

Это позволяет еще больше уменьшить размер файла, удалив часть аудиоинформации и упростив данные. Это, конечно же, приводит к тому, что качество аудио-форматов становится значительно хуже. При этом используются различные методы (чаще путем использования психоакустики), чтобы удалить части звука, которые наименее влияют на воспринимаемое качество, и минимизировать количество слышимого шума, добавленного во время процесса сжатия. Популярный MP3-формат, пожалуй, выступает самым известным примером. Кроме того, AAC, который можно найти в iTunesMusicStore, также широко распространен. Большинство форматов предлагают разный диапазон степеней сжатия, обычно измеряемый в битовой скорости. Чем ниже скорость, тем меньше файл, и тем значительнее потеря качества.

Какие форматы известны в настоящее время?

.3GP — формат мультимедийного контейнера, который может содержать собственные форматы AMR, AMR-WB или AMR-WB+, а также некоторые открытые разновидности.

.AAC (Advanced Audio Coding) — основан на стандартах MPEG-2 и MPEG-4. Файлы AAC обычно представляют собой контейнеры ADTS или ADIF.

.AAX (Audible.com) — формат аудиокниги, который представляет собой файл M4B с изменяемым битрейтом (обеспечивающий высокое качество), зашифрованный с помощью DRM. MPB содержит AAC- или ALAC-кодированный звук в контейнере MPEG-4.

.AIFF — стандартный формат аудиофайла, используемый Apple. Его можно считать эквивалентом WAV.

.AMR (AMR-NB) – тип аудио, используемый в основном для записи речи.

.APE (Ashland Monkey’s) – формат аудио со сжатием без потери качества.

.M4A — аудио в MPEG-4, используемый Apple для незащищенной музыки, загруженной из iTunes Music Store. Аудио в файле M4A обычно кодируется AAC, хотя ALAC также может использоваться без потерь качества.

.M4P — Apple-версия AAC с патентованным управлением цифровыми правами, разработанная Apple для использования в музыке, загруженной из iTunes Music Store.

.MMF– вид аудио от Samsung, используемый в мелодии звонка. Он был разработан Yamaha и представляет собой формат мультимедийных данных.

.MP3 -формат MPEG Layer III Audio. Это самый распространенный вид звукового файла, используемый сегодня. Также он известен как MPEG-1 или MPEG-2 и представляет собой своеобразный формат аудиокодирования для цифрового звука. Он использует форму сжатия данных с потерями для кодирования информации с применением неточных приближений и отбрасывания частичных данных. Все это выполняется с целью уменьшения размеров файлов, как правило, в 10 раз, по сравнению с компакт-диском. При этом сохраняется качество звука, сравнимое с несжатым. По сравнению с цифровым аудиокачеством CD, качество сжатия MP3 обычно достигает 75-95 % по уменьшению размера. Таким образом, файлы этот типа составляют от 1/4 до 1/20 размера исходного цифрового аудиопотока. Это важно для обеспечения передачи и хранения файлов, особенно в наши дни, когда обмен информацией распространен очень широко. Основой для такого сравнения является формат цифрового аудио CD, который требует 1411200 бит/с. Обычно используемой настройкой кодирования MP3 является CBR 128 кбит/с, в результате получается файл размером 1/11 (= 9 %) от размера исходного файла качества CD, то есть с 91 % сжатием.

Читайте также:  Для чего нужна мобильная точка доступа

Сжатие MP3 с потерей работает, уменьшая (или приближая) точность некоторых частей непрерывного звука, которые считаются недоступными для слухового разрешения большинства людей. Этот метод обычно называют перцепционным кодированием или «психоакустикой». Он использует психоакустические модели для отбрасывания или уменьшения точности компонентов, менее слышимых для человеческого слуха, а затем записывает оставшуюся информацию эффективным образом.

.MPC (ранее известный как MPEGplus, MPEG+ или MP+) — представляет собой аудиокодек с открытым исходным кодом, специально оптимизированный для прозрачного сжатия стерео/аудио с битрейтом 160-180 Кбит/с.

Формат .OGG, .OGA, MOGG — свободный открытый контейнерный тип, поддерживающий множество других видов, самым популярным из которых является аудиоформат Vorbis. Он предлагает сжатие, подобное MP3, но менее популярное. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) является многоканальным или многодорожечным файловым форматом OGG.

.WAV — стандартный формат файла звукового файла, используемый в основном на ПК с ОС Windows. Обычно используется для хранения несжатых (PCM) звуковых файлов качества CD, что означает, что они могут быть большими по размеру — около 10 МБ в минуту. Эти файлы могут также содержать данные, закодированные с помощью различных кодеков, для уменьшения размера (например, перевода в формат GSM или MP3). WAV-файлы используют структуру RIFF. Этот формат наиболее хорошо сохраняет качество файлов.

.WMA — формат Microsoft Windows Media Audio. Разработан с возможностями управления цифровыми правами (DRM) для защиты от копирования. Ранее был распространен так же широко, как формат OGG или MP3.

.WV — формат, созданный для видео в формате HTML5.

Для аудиокниг

.AOT Audible.com — контейнер аудиокниги с низким битрейтом с DRM, содержащий аудио, закодированное как MP3 или ACELP-речевой кодек.

.M4B — расширение аудиокниги/подкаста с кодировкой AAC или ALAC в контейнере MPEG-4. Оба формата могут содержать метаданные, включая маркеры глав, изображения и гиперссылки. Кроме того, M4B допускает «закладки» (запоминание последнего места прослушивания), в то время как M4A этого не делает.

Разработанные для определенной цели

.ACT — это сжатый аудиоформат ADPCM до 8 кбит/с. В нем происходит запись с большинства китайских MP3- и MP4-плееров и диктофонов.

.AU — стандартный формат аудиофайла, используемый Sun, Unix и Java. Аудио в файлах AU может быть в виде PCM или же сжатым с помощью кодеков μ-law, a-law или G729.

.AWB (AMR-WB) — аудио, используемое в основном для речи, аналогично спецификации ITU-T G.722.2.

.DCT – его использует программное обеспечение NCH. Это формат переменных кодеков, предназначенных для диктовки. Он имеет информацию заголовка диктовки и может быть зашифрован (как того требуют медицинские законы конфиденциальности). Можно также сказать, что это проприетарный формат программного обеспечения NCH.

.DSS — файлы Olympus DSS являются собственными форматами Olympus. Это довольно старый и плохой кодек. GSM или MP3, как правило, предпочтительнее, если их позволяет использовать рекордер. Это дает возможность хранить дополнительные данные в заголовке файла.

.DVF — это собственный формат Sony для сжатых голосовых файлов, обычно используемый диктофонами этой компании.

.GSM — разработанный для использования в телефонии в Европе. Это лучший аудио-формат для качественного звучания голоса по телефону. Хороший компромисс между размером и качеством файла. Также стоит отметить, что WAV-файлы иногда могут быть закодированы с помощью кодека GSM.

.MSV — собственный формат Sony для сжатых голосовых файлов Memory Stick.

Интернет-форматы

.FLAC — формат файла для Free Lossless Audio Codec, кодек сжатия аудио без потерь качества.

.IKLAX – это многодорожечный цифровой аудиоформат, позволяющий выполнять различные действия с музыкальными данными, например, при размешивании и компоновке томов.

.IVS — проприетарная версия с Digital Rights Management, разработанная компанией 3D Solar UK Ltd для использования в музыке, загружаемой из музыкального магазина Tronme, а также для интерактивной музыки и видеоплеера.

.OPUS (Internet Engineering Task Force) — формат сжатия аудиоданных с потерями качества, разработанный рабочей группой Internet Engineering Task Force (IETF) и созданный специально для интерактивных приложений реального времени через интернет. Представлен в качестве открытого типа, стандартизованного с помощью RFC 6716, его эталонная реализация предоставляется в соответствии с лицензией BSD на 3 раздела.

.RA, .RM — формат Real Audio, предназначенный для потоковой передачи звука через интернет. При этом .RA позволяет хранить файлы в автономном режиме на компьютере со всеми аудиоданными, содержащимися в самом файле. Программы для аудио-форматов этого типа в настоящее время считаются устаревшими.

Наиболее редкие

.RAW — необработанный файл может содержать аудио в любом формате, но обычно используется с аудиоданными PCM. Он используется редко, за исключением технических испытаний.

.SLN – утвержденный линейный формат PCM, используемый Asterisk. До версии v.10, стандартными типами аудио были 16-битные Signed Linea.

.Vox- чаще всего использует кодек Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Подобно другим форматам ADPCM, он сжимает данные до 4 бит. Файлы формата Vox подобны волновым файлам, за исключением того, что они не содержат информации о самом файле, поэтому форматы воспроизведения аудио могут отличаться. Для этого понадобится сначала указать частоту дискретизации кодека и количество каналов.

Как правило, сегодня термином «аудио» обозначается все, что связано со звуком, будь то воспроизведение, обработка, сведение, мастеринг или прослушивание записей. Но мало кто знает, что аудио-форматы со времени своего возникновения постоянно претерпевали множество существенных изменений то в лучшую, то в худшую сторону. Беда в том, что по сравнению с начальными форматами, создатели новых форматов пытались улучшить качество звука, а это неизменно сказывалось на размере воспроизводимого файла. Уменьшение размера, наоборот, приводило к потере качества. Но так было не всегда.

Первый формат аудио в компьютерных играх

Самое первое упоминание о компьютерном звуке пошло от создания примитивных на тот момент игр, в которых саунд воспроизводился посредством системного динамика. Но как ни старались разработчики такого ПО (программного обеспечения), нужного качества, совместимого с бобинными или кассетными магнитофонами или проигрывателями виниловых пластинок, добиться так и не удалось.

Именно поэтому многие производители занялись поиском решения, как поменять формат аудио, чтобы звук был натуральным. Откровенно говоря, это и привело к дальнейшей конкуренции, которую мы имеем сейчас. Это касается не только воспроизводимого материала, но также и студийного звука, «живых» выступлений, качества или настройки основных параметров с точки зрения знаний физики, акустики и т. д.

Появление формата WAV

Считается, что первое полноценное качество аудио-форматов было связано с появлением стандарта и расширения файлов .wav (такое сокращение было образовано от английского слова «волна» или wave). Как раз-таки он и стал тем первенцем, который мог обрабатываться в компьютерных программах на профессиональном уровне.

Такие файлы уже имели свои характеристики: частоту дискретизации, глубину звука, битрейт и многое другое. Такой звук был совместим даже с тем, что можно было получить после обработки обычного звукового CD с помощью определенных инструментов типа обычного эквалайзера. Но размер был явно неоправданным. К примеру, трехминутный трек мог занимать от 20 до 50 Мб.

CD-диски

Формат аудио CD, точнее, расширение .cda, появилось практически в то же время.

В отличие от «волновых» файлов, сохраненных на винчестере, редактированию он не поддается. Его сегодня можно открыть в программе обработки звука, изменить формат аудио-перекодированием и сохранить в любом другом месте, кроме CD-диска.

Кодек MP3

С появлением кодека LAME MP3 Encoder музыкальная индустрия пережила настоящий шок, ведь «весили» такие файлы в десятки раз меньше, чем тот же файл WAV. Даже пятиминутная композиция при максимальном сжатии редко превышает размер в 5-7 Мб. Согласитесь, существенный прорыв, не говоря уже о том, что такие файлы позволяли не только корректировать вышеуказанные характеристики, но и некоторые дополнительные параметры в виде ID3-тегов, в которых содержалась информация, скажем, об исполнителе, названии альбома и треков, дате выпуска.

Читайте также:  Как открыть порты для стим

Форматы аудио-файлов такого типа стали наиболее популярными. Посмотрите, практически весь интернет заполнен именно этим универсальным форматом. В целом же, можно сказать, что формат аудио в MP3 стал настоящей революцией в звуке. Он остается одним из самых популярных и наиболее востребованных до сих пор, несмотря на то, что ему на смену идут и другие разновидности аудио. Но об этом несколько позже.

Файлы AIFF

Аудио-форматы имеют еще одну разновидность. Так называемый формат .aiff изначально был создан для применения на компьютерных системах Macintosh.

Только намного позднее произошла трансформация, которая предопределила совместимость звуковых форматов с их использование на платформах, различающихся между собой операционных систем.

Формат OGG

Музыка в формате аудио .ogg тоже встречается достаточно часто. Этот стандарт был разработан компанией Vorbis. Однако стоит заметить, что он имеет ряд существенных недостатков. Во-первых, это неоправданная нагрузка на системные ресурсы компьютера, несмотря на минимальный размер. Во-вторых, использование собственных кодеков и декодеров, которые система автоматически может и не устанавливать. К примеру, при работе в программе FL Studio Producer Edition (или XXL) в версиях ниже 9.x.x имелась папка с установочным файлом в формате .inf, который нужно было активировать для инсталляции после установки основного приложения вручную (иначе пресеты в таком формате просто не проигрывались).

Тем не менее сейчас аудио-форматы такого типа встречаются, а сам звук выглядит очень неплохим.

Стандарт AMR

Что касается этого формата, он, пожалуй, относится к самым низкопробным. Его возникновение связано с появлением первых неуклюжих мобильных телефонов, которые все еще не могли устанавливать на звонок мелодии в формате .mp3.

AMR тогда еще мог заменить натуральный звук с известной долей потери качества. Но это качество не идет ни в какое сравнение с тем, что предлагается более «продвинутыми» форматами.

Как ни странно, MIDI тоже можно отнести к тому, что принято называть «аудио-форматы». Хоть и принято считать (а многие, собственно, так и думают до сих пор), что система MIDI это всего лишь набор команд, с этим можно поспорить. Расшифровка аббревиатуры MIDI – это Musical Instrument Digital Interface. Собственно, это система записи и редактирования неких данных типа нажатия клавиш, высоты тона, темпа, тональности, эффектов и т. д.

Тем не менее существуют файлы с расширением .mid или .midi, которые совершенно просто воспроизводятся в современных секвенсорах или студийных программах звукозаписи, используя стандартный набор звуков формата GM (General MIDI), GS (что то же самое) от компании Roland или XG (Extended MIDI) от корпорации Yamaha. В первых двух наборах присутствует 128 стандартных звуков, не считая эффектов, в третьем – почти втрое больше.

Теперь мы подходим к одному из самых современных и уникальных форматов современности. Музыка в формате аудио FLAC сегодня получает все большее распространение. Связано это с качеством, на которое истинные меломаны обращают внимание, прежде всего.

Если разобраться, этот формат был создан на основе уже известного MP3. Вот только если ранее использовалось распределение на отдельные треки, в этом формате такого нет (до поры, до времени). Структура представляет собой один или два файла, один из которых является информационным. Воспроизвести такой формат могут только специализированные программные аудиоплееры. Самым известным можно назвать AIMP. Только в том случае, когда открывается основной файл, возникает и список дорожек, записанных в основном контейнере. В таком проигрывателе переключение между треками производится точно так же, как и в любом другом. Зато нет вероятности случайного удаления той или иной композиции (как уже говорилось, информация о них содержится в едином файле).

Совместимость форматов

Естественно, все форматы аудио сегодня совместимы между собой. Иными словами, любой стандартный домашний DVD-плеер или программный проигрыватель справится с этим без труда. То же самое относится и к программам обработки звука. Полупрофессиональные и профессиональные программы распознают все форматы, известные на сегодняшний день (даже несмотря на специфику операционных систем). Аудиоредакторы, секвенсоры, дополнительные модули типа VST, RTAS (для систем Windows) или AU (для Mac OS X) способны работать с такими форматами в так называемом кросс-платформенном режиме.

Преобразование форматов

Изменить аудио можно несколькими способами. К примеру, можно открыть «родной» формат, а сохранить файл в другом. Можно поступить еще проще. Для этого существуют специальные конверторы. В них можно просто загрузить из списка желаемый файл начального формата, а затем просто выбрать конечный. Как говорится, всего-то ничего.

Обработка качества звука

Другое дело, когда вопрос касается изменения некоторых частотных исходного файла. Тут без специализированных программных пакетов не обойтись. Именно с их помощью и можно изменить качество аудиофайлов. При этом можно поменять не только стандартную частоту дискретизации 44100 Гц, увеличив ее, скажем, до 96000 Гц, но и произвести настройку глубины от тех же 16 до 24 или 32 бит. И это мы уже не говорим о том, что можно настроить еще и битрейт, то есть, пропускную воспроизводимую способность, выраженную в килобитах в секунду. Стандартным значением считается 128 кбит/сек. Битрейт можно менять по своему усмотрению, однако наилучшее качество звука достигается на отметке 320 кбит/сек. Конечно, не каждый человек способен уловить разницу между стандартным звучанием и максимально выставленными характеристиками. Тем не менее, стоит один раз попробовать воспроизвести аудиотрек с разными данными на хорошей аппаратуре. Вот тут разница себя не заставит ждать.

Более того, кроме всех этих параметров, можно редактировать и многое другое. Чего только стоит использование программных эквалайзеров, лимитеров, компрессоров, кроссоверов, нормалайзеров, де-эссеров и т. д. и т. п. Каждый такой модуль позволяет настроить звук, как говорится, «под себя». И абсолютно все форматы, известные на сегодняшний день, программами такого типа и можно обрабатывать.

Итоговое сравнение

Попробуем сделать некое сравнение между используемыми форматами (хотя это еще далеко не все, что есть в мире звука).

Итак! Формат WAV хоть и «тяжеловесен», все равно может использоваться в качестве промежуточных файлов при последующем конвертировании в некоторых аудиореакторах. Форматы аудио-файлов такого типа чаще всего присутствуют при сохранении открытых проектов или при записи живых инструментов в студии. Понятно, что секвенсор потом обработает входящую информацию в виде звукового потока. А потом поменять формат аудио-файла или сохранить его в виде пресета или дорожки можно будет как угодно.

Форматы типа аудиодисков сегодня тоже неактуальны. Если взять в расчет AIFF или OGG, их лучше использовать в виртуальных студиях. О формате AMR вообще говорить не приходится. MIDI пригодится только музыкантам, знающим в этом толк.

Как считается, сегодня лучший аудио-формат — это все-таки FLAC. По мнению многих специалистов и музыкантов, он является не просто самым «продвинутым», но и даже революционным по сравнению с тем, что существовало или существует на сегодняшний день.

Однако стоит отметить, что и MP3 со счетов сбрасывать нельзя, ведь практически весь кодированный звук на тех же DVD-дисках или в MKV-файлах имеет именно этот формат. Разница только в версии кодека и декодера. Но и индустрия звука и видео в своем развитии на месте не стоит. Весьма вероятно, что мы скоро увидим и еще что-то новое.