Рассмотрим самые распространенные аудио форматы (большинство из приведённых в списке - с потерей качества):
AAC (англ. Advanced Audio Coding) — формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).
На 2005 год распространён существенно меньше, чем MP3 и другие альтернативные решения.
AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.
Рассмотрим самые распространенные аудио форматы
(большинство из приведённых в списке с потерей качества):
AAC (англ. Advanced Audio Coding) — формат аудиофайла с
меньшей потерей качества при кодировании, чем MP3 при
одинаковых размерах. Формат также позволяет сжимать без
потери качества исходника (профиль ALAC AAC).
На 2005 год распространён существенно меньше, чем MP3 и
другие альтернативные решения.
AAC (Advanced Audio Coding) изначально создавался как
преемник MP3 с улучшенным качеством кодирования. Формат
AAC, официально известный как ISO/IEC 138187, вышел в свет
в 1997 как новая, седьмая, часть семьи MPEG2. Существует
также формат AAC, известный как MPEG4 Часть 3.
Apple AIFF Этот тип файлов является стандартным для
систем Apple Macintosh и систем обработки звука, построенных
на его основе. Apple AIFF расшифровывается как Audio
Interchange File Format формат файла обмена звуком, он в
чемто схож с WAV. Его особенностью является то, что он
позволяет размещать вместе со звуковой волной
дополнительную информацию, в частности, самплы WaveTable
(примеры звучания инструментов вместе с параметрамисинтезатора), что улучшает качество итогового результата.
Хотя в настоящее время компьютеры Apple способны
воспроизводить файлы практически любых форматов, в том
числе и МР3.
ATRAC (Adaptive TRansform Acoustic Coding акустическое
кодирование адаптивным преобразованием) базируется на
стереофоническом звуковом формате с 16разрядным
квантованием и частотой дискретизации 44.1 кГц. При сжатии
каждый кадр делится на 52 частотные полосы, результирующая
скорость потока 292 кбит/с (сжатие 1:5). Применяется в
системе MiniDisk.
FLAC (англ. Free Lossless Audio Codec — свободный
аудиокодек без потерь) — популярный свободный кодек для
сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis,
MP3 и AAC, не удаляет никакой информации из аудиопотока и
подходит как для ежедневного прослушивания, так и для
архивирования аудиоколлекции. На сегодня формат FLAC
поддерживается многими аудиоприложениями.
Существуют модификации FLAC кодера: Improved FLAC
encoder и Flake.
29 января 2003 г. Xiphophorus (сейчас называется Xiph.OrgFoundation) анонсировали включение формата FLAC в
линейку своих продуктов, таких, как Ogg Vorbis, Theora и
Speex.
FLAC является членом семейства кодеков, разрабатываемых
Xiph.Org. К слову, в него же входит известный ogg vorbis – один
из лучших lossyалгоритмов сжатия музыки. В качестве
контейнера для аудиоданных используется, разумеется, OGG
(файлы с расширением .ogg) и ещё один opensource контейнер
– Matroska (файлы с расширением .mka).
Сразу стоит отметить полную открытость как формата, так и
алгоритма FLAC. Они не патентованы, поэтому могут
совершенно безвозмездно использоваться в любых программах.
Именно этим обусловлена широкая поддержка FLAC в
проигрывателях – любой серьёзный плеер имеет плагин для
FLAC. Кроме этого существуют аппаратные mp3плееры с
поддержкой кодека FLAC. Полный список программ,
работающих с FLAC можно посмотреть здесь.
Программакодировщик FLAC скомпилирована для
большинства используемых платформ, так что проблем с
совместимостью на альтернативных Windows операционных
системах возникнуть не должно.FLAC поддерживает теги собственного формата “FlacTags”.
Есть возможность кодирования многоканального звука –
серьёзное преимущество по сравнению с Monkey’s Audio.
Формат поддерживает любые частоты семплирования в
диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4х (!)
до 32х бит.
Считается, что в сравнении с остальными losslessкодеками
FLAC наиболее эффективно расходует ресурсы системы при
раскодировании (воспроизведении) аудио. К сожалению, это
достигается за счёт значительного повышения времени
кодирования (сжатия).
Сайт FLAC регулярно обновляется, выходят новые версии
кодека. Вообще, по активности развития FLAC безусловно
лидирует. Вполне возможно, что в будущем это сделает его
основным форматом. Что ж, посмотрим…
Кодек и его исходные коды на C можно скачать с сайта
https://flac.sourceforge.net/ . Плагин для Winamp качаем с
https://www.winamp.com/plugins/details.php?id=131643.
FLAC является оптимальным выбором для хранения музыки в
высоком качестве.
Аппаратно поддерживается во многих устройствах.MIDI (англ. Musical Instrument Digital Interface —
цифровой интерфейс музыкальных инструментов) —
стандарт на аппаратуру и программное обеспечение,
позволяющее воспроизводить (и записывать) музыку путем
выполнения/записи специальных команд, а также формат
файлов, содержащих такие команды. Воспроизводящее
устройство или программа называется синтезатором
(секвенсором) MIDI и фактически является автоматическим
музыкальным инструментом.
В отличие от других форматов, хранит не оцифрованный звук, а
наборы команд (проигрываемые ноты, ссылки на
проигрываемые инструменты, значения изменяемых параметров
звука), которые могут воспроизводиться поразному в
зависимости от устройства воспроизведения. Удобство
формата MIDI как формата представления данных позволяет
реализовывать устройства, производящие автоматическую
аранжировку по заданным аккордам, а также приложения 3D
визуализации звука. Кроме того, такие файлы, как правило,
имеют на несколько порядков меньший размер, чем
оцифрованный звук сравнимого качества.
Monkey’s Audio — популярный формат кодирования
цифрового звука без потерь. Распространяется бесплатно
вместе с открытым исходным кодом и набором программногообеспечения для кодирования и воспроизведения, а также
плагинами к популярным плеерам. Файлы Monkey’s Audio
используют следующие расширения: .ape для хранения аудио
и .apl для хранения метаданных. Несмотря на открытый
исходный код, Monkey's Audio не является свободным, так как
его лицензия накладывает значительные ограничения на
использование.
Аудиофайлы, сжатые кодеком Monkey’s Audio, имеют
расширение ‘APE’ – как видите, обезьяны присутствуют не
только в логотипе или названии (от английского ape обезьяна,
примат).
Средний битрейт в аудиофайле составляет 600700 кбит/с;
сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 4050
% в зависимости от жанра музыки: если классические или
джазовые произведения сжимаются самым лучшим образом, то
композиции в стиле trashmetal или чтото подобное
«электронно шумовое» покажет наихудший результат. Для
кодеков с потерями при приемлемом качестве сжатие
составляет около 80 %.
Существуют четыре степени сжатия. Максимальная компрессия
может показаться единственно верным решением, даже
несмотря на довольно большое время сжатия. Однако нужно
учитывать ещё и расход ресурсов системы, воспроизводящейфайл, – для максимально сжатого файла он относительно
высок.
Формат .APE обеспечивает поддержку тегов для поиска
композиций в музыкальной коллекции. Ещё одним плюсом
является проверка целостности файла при раскодировании.
Поддерживается восстановление оригинального wavфайла из
сжатого .APE.
Monkey’s Audio имеет графический фронтэнд под Windows,
иначе говоря удобную оконную программу для управления
процессом кодирования. Остальные кодеки требуют
использования командной строки или фронтэндов сторонних
разработчиков. Самое приятное, что фронтэнд Monkey’s Audio
можно использовать и с другими кодеками – Rkau, Wavpack,
Shorten и даже lossyкодеками mp3 и ogg vorbis.
Немного о недостатках. Кодек Monkey’s Audio существует
только под Windows. Однако на сайте написано, что «версии
под Mac и Linux уже разрабатываются». К слову сказать, сам
сайт не обновлялся достаточно давно, что не является хорошим
признаком. Также отсутствует какаялибо поддержка среди
производителей аппаратных плееров.
Отсутствие кросплатформенности кодека для многих является
самым серьёзным минусом Monkey’s Audio. Но шаги поисправлению этого недостатка уже делаются. Стоит упомянуть
проект JMAC ( https://sourceforge.net/projects/jmac/ ) по
переработке исходных кодов Monkey’s Audio под язык Java.
Это позволит использовать кодек на любой ОС без
необходимости внесения изменений в исходники и
перекомпиляции.
Кодек является бесплатным. Исходные коды открыты с
некоторыми ограничениями. Скачать можно с официального
сайта https://www.monkeysaudio.com . Плагин для Winamp
берём по ссылке: https://www.winamp.com/plugins/details.php?
id=138099.
MP3 (формат кодирования звуковой дорожки MPEG) —
лицензируемый формат файла для хранения аудио
информации.
Самый популярный формат сжатия на сегодняшний день – это
МР3. Формат МР3 (MPEG Layer 3) был разработан, после ряда
промежуточных форматов, институтом Фраунхофера в
Германии. Вообще то, формат .МР3 основан на обмане
человеческого уха. После некоторых исследований выяснилось,
что человеческому слуху свойственно адаптироваться к
появлению новых звуков, что выражается в повышении порога
слышимости. Поэтому одни звуки способны маскировать (тоесть, делать субъективно неслышимыми) другие. Вот и в этом
формате часть звуков, которые, как считает соответствующая
теория, делаются неслышимыми, просто убираются из общего
звучания. После чего получившийся «полуфабрикат»
кодируется по методу Хоффмана. Обязательно следует
учитывать то, что в формате МР3 программы, сжимающие звук
из оригинального, не являются стандартизированными, то есть
каждый грамотный программист может реализовать свою схему
сжатия. А стандартам подчиняются только декодеры, что
приводит к тому, что качество воспроизведения формата МР3
далеко не всегда зависит от плеера, проигрывающего этот файл.
В связи с разными способностями и пристрастиями
реализаторов различных кодеров, одни из них лучше
справляются с симфонической музыкой, другие с роком и
металлом, третьи с рэпом и рэйвом и так далее.
JointStereo, являющийся одной из особенностей МР3, означает,
что вместо кодирования стерео как двух независимых каналов
производится кодирование т.н. центрального канала и разницы,
отличающей его от исходных стереоканалов. Довольно много
составляющих звука в стереоканалах одинаковы, и их
кодирование в общем канале позволяет высвободить
дополнительную полосу для более подробного кодирования
разницы, что приводит к некоторому улучшению качества.
Обязательно следует упомянуть и о Variable Bit Rate, или
VBR. Это означает, что кодер изменяет степень сжатия «налету», в зависимости от характера звука. Такой подход
приводит к уменьшению итогового размера файла или, при
увеличении требований к качеству, при том же размере файла
позволяет добиться лучшего звучания.
MP3 Pro Появившийся в 2001 году кодек MP3 Pro был создан
компанией Coding Technologies совместно с Thomson
Multimedia. В его основе лежит МР3, и в результате он
получился полностью совместимым с MP3 назад и лишь
частично вперед. В нем используется технология SBR (Spectral
Band Replication), за счет чего кодек обеспечивает хорошее
качество на низких битрейтах. Однако качество кодирования на
средних и высоких скоростях передачи данных уступает
качеству почти всех других кодеков. В итоге MP3 Pro
применяется больше для трансляций в интернете и
демонстраций фрагментов новых музыкальных композиций.
Аудио стандарт MPEG4 не требует единственного или
малого набора высокоэффективных схем компрессии, а скорее
сложный набор для выполнения широкого круга операций от
кодирования низкокачественной речи до высококачественного
аудио и синтезирования музыки.
Семейство алгоритмов аудио кодирования MPEG4 охватывает
диапазон от кодирования низкокачественной речи (до 2 кБит/с)
до высококачественного аудио (от 64 кБит/с на канал и выше).OGG Vorbis
Vorbis — свободный формат сжатия звука с потерями,
официально появившийся летом 2002 года. Психоакустическая
модель, используемая в Vorbis, по принципам действия близка к
МР3 и подобным, однако математическая обработка и
практическая реализация этой модели существенно отличаются,
что позволило авторам объявить свой формат совершенно
независимым от всех предшественников. Для хранения
аудиоданных в формате Vorbis чаще всего применяется
медиаконтейнер Ogg, такой файл обычно имеет расширение
.ogg и называется двойным именем Ogg Vorbis.
На 2006 год распространён существенно меньше, чем MP3. По
всевозможным оценкам является вторым по популярности
форматом компрессии звука с потерями. Широко используется
в компьютерных играх и в файлообменных сетях для передачи
музыкальных произведений.
Vorbis применяет более качественную психоакустическую
модель, чем его конкуренты, дающую лучшую чёткость
воспроизведения при равной плотности потока.
Формат не ограничивает пользователя только двумяаудиоканалами (стерео — левый и правый). Он поддерживает
до 255 отдельных каналов с частотой дискретизации до 192 кГц
и разрядностью до 32 бит (чего не позволяет ни один другой
формат сжатия с потерями), поэтому Vorbis великолепно
подходит для кодирования 6канального звука DVDAudio.
К тому же, формат Vorbis — «sample accurate». Это
гарантирует, что звуковые данные перед кодированием и после
декодирования не будут иметь смещений, дополнительных или
потерянных сэмплов. Это легко оценить, когда вы кодируете
nonstop музыку (когда один трек постепенно переходит в
другой) — в итоге сохранится целостность звука.
Формат изначально разрабатывался с возможностью потокового
вещания. Это даёт формату достаточно полезный побочный
эффект — в одном файле можно хранить несколько
композиций с собственными тегами. При загрузке такого файла
в плеер должны отобразиться все композиции, будто их
загрузили из нескольких различных файлов.
Формат имеет гибкую систему тегов. Заголовок тегов легко
расширяется и позволяет включать тексты любой длины и
сложности (например, текст песни), перемежающиеся
изображениями (например, фотография обложки альбома).
Текстовые теги хранятся в UTF8, что позволяет писать на
нескольких языках одновременно и исключает возможныепроблемы с кодировками.
Ogg Vorbis по умолчанию использует переменный битрейт, при
этом значения последнего не ограничены какимито жёсткими
значениями, и он может варьироваться даже на 1 kbps. При этом
стоит заметить, что форматом жёстко не ограничен
максимальный битрейт, и при максимальных настройках
кодирования он может варьировать от 400 kbps до 700 kbps.
Такой же гибкостью обладает частота дискретизации —
пользователям предоставляется любой выбор в пределах от 2
кГц до 192 кГц.
Vorbis был разработан сообществом «Xiphophorus» для того,
чтобы заменить все платные запатентованные аудио форматы.
Несмотря на то что это самый молодой формат из всех
конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех
известных платформах (Microsoft Windows, GNU/Linux,
MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а
также большое количество аппаратных реализаций.
Популярность на сегодняшний день значительно превосходит
все альтернативные решения.
RAW Да, это не только формат изображения, в котором
пишут фотографии некоторые цифровые камеры. На самомделе, RAW является т.н. «чистой оцифровкой», в которой не
содержится заголовка и находится лишь последовательность
отсчетов звуковой волны. Обычно оцифровка хранится в 16
разрядном формате.
Shorten
Shorten – один из первых появившихся losslessкодеков. Долгое
время проект "спал сладким сном". Однако, в 2007 году, он
снова начал развиваться. Взять кодек можно с
https://www.etree.org/shnutils/shorten/
ТАК (T)om’s verlustfreier (A)udio(k)ompressor аудиокодек,
формат сжатия цифрового звука без потерь. Отличается
высокой степенью сжатия и скоростью кодирования и
декодирования. Распространяется бесплатно вместе набором
программного обеспечения для кодирования и
воспроизведения, а также плагинами к популярным плеерам:
Winamp, foobar2000 и др.
Разработчик — Thomas Becker, Германия.
Относительно новый кодек. Первая финальная версия 1.0 была
опубликована 26 января 2007 года.Формат продолжает активно развиваться (последня версия
1.0.3) и в настоящее время, согласно проводимому опросу на
форуме hydrogenaudio.org, входит в число трех наиболее
популярных форматов аудиосжатия без потерь (после Flac и
WavPack).
TTA (True Audio) Напоследок о самом интересном. TTA
разрабатывается командой наших соотечественников. И, надо
сказать, результат их работы впечатляет. Обо всём по порядку.
Кодек является ещё довольно молодым, но несмотря на это
содержит все необходимые возможности. Не будем в очередной
раз перечислять их, отметим лишь, что формату не хватает
лишь поддержки трансляции аудио через сеть.
Формат открыт, равно как и исходные коды программы
кодировщика. Существуют скомпилированные версии под Mac
и Linux. Проблем с совместимостью при воспроизведении также
возникнуть не должно, ибо уже существуют плагины для всех
популярных проигрывателей, а также DirectShow фильтры для
Windows Media Player. Есть плагин для Adobe Audition, что
немаловажно для музыкантов. За последние 4 года даже
появилась аппаратная поддержка в плеерах!
WAV Он является основным аудио форматом для многих имногих систем воспроизведения цифрового звука и
используется как стандартный формат звуковых файлов в
персональных компьютерах. К тому же, он имеет солидный
набор спецификаций, изрядно пополнившийся за последнее
время. Его полное название Microsoft RIFF/WAVE Resource
Interchange File Format/Wave формат файлов передачи
ресурсов/волновая форма, и создан он был инженерами
Microsoft и Intel. В свою очередь, WAV расшифровывается как
Waveform Audio File Format.
WavPack (расширение .WV)
WavPack также включает уникальный «гибридный» режим,
который предоставляет все преимущества сжатия без потерь с
дополнительным бонусом: вместо создания одного файла, в
этом режиме создается относительно небольшой файл высокого
качества с потерей (.wv), который может проигрываться сам по
себе, а также файл «коррекции» (.wvc), который (в комбинации
с предыдущим .wv) позволяет полностью восстановить
оригинал. Для некоторых пользователей это означает, что им
никогда не придётся выбирать между сжатием без потерь и с
потерей качества.
Формат имеет очень хорошую поддержку в проигрывателях.
Помимо, разумеется, плагина для Winamp с официальногосайта кодека https://www.wavpack.com можно закачать плагины
для Adobe Audition (!) и Nero Burning Rom. Есть отличный
плагин для XMMS – аналога Winamp для Linux. Кроме того
существует проект по разработке DirectShow фильтров для
WavPack – это позволит использовать формат в любой
Windowsпрограмме, в том числе и Windows Media Player.
Скачать последнюю версию можно отсюда. Для WavPack
существует фронтэнд от сторонних разработчиков. Его качаем
тут.
С технической точки зрения также придраться не к чему.
Поддерживается многоканальный звук, 32битное разрешение
аудиопотока, частота семплирования – до 192 кГц (!).
Формат, как и исходные коды программы для сжатия являются
открытыми. К большому сожалению кодер скомпилирован лишь
для платформы Windows, однако всегда остаётся возможность
самостоятельно перекомпилировать доступные исходные коды
для своей операционной системы.
Сайт, как и сам кодек регулярно обновляются, что не может не
радовать.
Windows Media Audio (WMA) — лицензируемый формат
файла, разработанный компанией Microsoft для хранения итрансляции аудиоинформации.
Номинально формат WMA характеризуется хорошей
способностью сжатия, что позволяет ему «обходить» формат
MP3 и конкурировать по параметрам с форматами Ogg Vorbis и
AAC. Но как было показано независимыми тестами, а также при
субъективной оценке качество форматов все таки не является
однозначно эквивалетным, а преимущество даже перед MP3
однозначным, как это утверждается компанией Microsoft.
WMA Lossless
Кодек является частью комплекта Windows Media Audio. Он
бесплатный, однако формат, равно как и программа для
кодирования являются закрытыми. Разумеется, версия
существует только для платформы Windows.
В принципе, WMA Lossless подеерживает все необходимые
функции: теги, высокие частоты семплирования,
многоканальный звук (включая 7.1), трансляцию аудио через
сеть и т.д. Кроме того, встроенная поддержка декодера в
Windows Media Player избавляет пользователя от
необходимости скачивать чтолибо из Интернета для
воспроизведения музыкального файла.