Полезные музыкальные статьи: Основные понятия звукотехники

  • Занимательные материалы
  • docx
  • 30.04.2018
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

В некотором смысле, звукотехника - это наука об искажениях, с которыми ведется непрерывная борьба на всех участках звукового пути. Все искажения можно условно подразделить на линейные и нелинейные. Первые влияют только на уровень и форму сигнала, изменяя их, вторые же добавляют в сигнал посторонние продукты, которых не было в изначальном входном сигнале. К нелинейным искажениям относятся THD (Total Harmonic Distortion) - гармонические (и субгармонические) искажения, IMD (Intermodulation distortion) - интермодуляционные искажения(комбинационные, разностная и суммарная частоты), самые заметные на слух, динамические (клиппинг, "ступенька", перемодуляция). К линейным - амплитудно-частотные (искажения АЧХ, то есть неравномерность), фазово-частотные (ФЧХ), временные, пространственные (например, связанные с направленностью), переходные (искажения переходных процессов).
Иконка файла материала 47.docx

 

Основные понятия звукотехники

Справочные данныеСтатьи о музыке » Полезные музыкальные статьи

Основные понятия звукотехники (Термины в звукотехнике)


В некотором смысле, звукотехника - это наука об искажениях, с которыми ведется непрерывная борьба на всех участках звукового пути. Все искажения можно условно подразделить на линейные и нелинейные. Первые влияют только на уровень и форму сигнала, изменяя их, вторые же добавляют в сигнал посторонние продукты, которых не было в изначальном входном сигнале. 

К нелинейным искажениям относятся THD (Total Harmonic Distortion) - гармонические (и субгармонические) искажения, IMD (Intermodulation distortion) - интермодуляционные искажения(комбинационные, разностная и суммарная частоты), самые заметные на слух, динамические (клиппинг, "ступенька", перемодуляция). 

К линейным - амплитудно-частотные (искажения АЧХ, то есть неравномерность), фазово-частотные (ФЧХ), временныепространственные (например, связанные с направленностью), переходные (искажения переходных процессов). 

АЧХ - амплитудно-частотная характеристика - зависимость, выраженная графически, между постоянным уровнем входного сигнала и уровнем выходного на рабочей полосе частот. Весьма интересная (и хитрая) характеристика, которая обычно неплоха на декларируемых номинальных уровнях входного сигнала, хотя в случае изменения (понижения) этого уровня часто разъезжается по швам. То есть при уровне -20 dB (в 10 раз меньше), прежде относительно линейная характеристика усилителя (владельцы советских амплиферов обычно очень гордятся этими характеристиками), например 20-20.000 гц по среднеоктавному уровню -0,2 dB при входном сигнале 1v для УМЗЧ или 0,25v для полного/предварительного усилителя, становится совсем нелинейной и может сохраняться в данной полосе частот уже при отклонении в -5 dB. dB - децибел, в данном случае общепринятая единица относительной логарифмической шкалы при сравнении уровней сигналов. Относительно честно эта характеристика используется у производителей качественных магнитных лент, которые приводят замеры АЧХ на уровнях насыщения магнитной ленты (0 dB) и на уровне -20 dB, более информативном и наиболее статистически вероятном на реальном музыкальном сигнале. 

Неравномерность АЧХ в полосе частот 100-8000 гц в АС категории Hi-Fi (High Fidelity - высокая верность звучания, изрядно затасканный термин) должна составлять не более 4 dB на октаву. А в студийных АС (мониторах) не более 1dB. 
Эффективно воспроизводимый диапазон частот - диапазон, в пределах которого уровень звукового давления снижается на заданную величину по отношению к уровню, усредненному в некоторой полосе частот. В международном стандарте МЭК 581-7, определяющем минимальные требования к АС категории Hi-Fi, он составляет 50-12500 гц по уровню -8 dB по отношению к уровню звукового давления, усредненному в полосе 100-8000 гц. 
По стандарту СТ СЭВ 1356-78, диапазон воспроизводимых частот, на нижней и верхней границах которого наблюдается снижение уровня звукового давления, также должен быть не уже 50-12500 гц. Отклонение частотных характеристик АС, совместно используемых в стереофонической аппаратуре, не должно превышать 3 дБ в полосе частот 250-8000 гц при усреднении характеристик в каждой октаве. 

В случае акустических систем еще присутствует такая характеристика, как направленность. Каждый динамик имеет свою характеристику направленности. Обычно акустическая мощность нелинейно убывает при отклонении от центральной оси динамика (это не совсем так, часто присутствует лепестковая структура характеристики, где боковые лепестки, конечно, слабее основного), причем на разных частотах по разному. На низких частотах уменьшение акустической мощности при отклонении от оси динамика меньше, а в случае сабвуферов направленностью обычно вообще пренебрегают. Слушатель далеко не всегда не находится точно напротив акустической системы, и, при смещении слушателя в сторону, меняется уровень различных частот. В первую очередь потери заметны в области высших звуковых частот. В многополосных АС использование узконаправленных твитеров (ВЧ-динамиков) может кардинально ухудшить звуковую картину при смещении слушателя на небольшое расстояние в сторону от оси. Акустические системы, имеющие хорошую АЧХ по оси, но узкую характеристику направленности, особенно с выраженной зависимостью ее ширины от частоты сигнала, звучат утомительно, жестко, стереообраз неустойчив и смещается в зависимости от распределения частот в сигнале. Очень острая характеристика направленности присуща планарным акустическим системам на базе электростатиков и изодинамических систем, что делает их весьма чувствительными к расположению относительно слушателя. 

По существующим стандартам отклонение АЧХ от среднего значения под углами +- 20-30° по горизонтали или +- 5-10° по вертикали не должно превышать +- 4dB. 

Часто встречается неправильное понимание термина "эффективная полоса частот" звукового тракта, когда говорят о том, что хотя верхняя среднестатистическая частота, улавливаемая человеческим слухом, имеет значение, равное 20.000 гц, но для усилителя необходимы еще более высокие частоты, так как с этим связывают такие понятия, как скорость нарастания сигнала и необходимость слышать обертона и гармоники верхних составляющих исходного сигнала. Тогда стоит понять, что из себя представляют гармоники. 

Любой сигнал несинусоидальной формы всегда можно представить в виде одновременно воспроизводимого набора синусоидальных частот различных амплитуд и длительностей. Именно любой, сколь угодно сложной формы. Это называется разложением на гармоники, приведением к гармоническому ряду. Строго говоря, разложение на гармоники подразумевает разложение сигнала на набор кратных друг другу частот, а самая нижняя синусоида называется основной, первой гармоникой. Остальные гармоники называются по номерам, в соответствии с множителем кратности частоты, то есть вторая, третья и так далее. 

Так вот, та верхняя синусоидальная частота, которую мы слышим, предположительно является частотой 20 Кгц (реально часто 16-18Кгц и снижается с возрастом). И, даже если сигнал с частотой 20 Кгц будет представлять собой не синусоиду, то он все равно будет иметь основную гармонику частотой 20 Кгц, и именно ее мы и услышим, потеряв верхние гармоники. Слух здесь уже не заметит разницы между синусоидой 20 Кгц и сигналом несинусоидальной формы 20 Кгц, но с основной гармоникой с таким же уровнем. А скорость нарастания сигнала (еще один аргумент людей, ратующих за максимально высокие крайние верхние частоты усилителей, лежащие в ультразвуковой области или выше) может ограничивать синусоиду только в том случае, если эта характеристика имеет фазовый наклон меньше 45 градусов (самый крутой участок синусоиды в точке пересечения с нулем). Это значит, что для правильного воспроизведения необходима вполне конечная величина, и если это величина постоянная вне зависимости от частот, то она критична только в области самых высоких частот, обычно лежащих за пределами звукового диапазона. Она определяется способностью плеч каскадов усилителя быстро открываться и запираться, а также способностью схемы питания максимально быстро выдать необходимый ток в нагрузку. Наиболее критичными звеньями в данном аспекте являются блок питания и цепи выходных каскадов. 

Коэффициент гармонических искажений (TDH, Total Harmonic Distortion) - как уже понятно из текста выше, обозначает вес дополнительных гармоник в исходно синусоидальном сигнале одной частоты после прохождения его через искажающий тракт. Данный коэффициент вычисляется как квадратный корень отношения суммы мощности всех гармоник, кроме основной, к мощности полезного сигнала. Иногда, для упрощения измерений, используется уровень только третьей гармоники, что не обязательно отражает общий уровень гармонических искажений. Следует заметить, что это не совсем корректно, так как заметность высших гармоник возрастает с их номером (кроме того, нечетные гармоники наиболее неприятны на слух, в отличие от четных). То есть, частота тона, отстоящего дальше по полосе частот от основного, более заметна на его фоне. Естественно, в пределах звуковой полосы частот, что объясняет и меньшую заметность гармонических искажений частот в верхней части звукового диапазона, за пределами восприятия слуховым аппаратом. Что касается большей заметности гармоник с большим номером, то было бы правильнее давать им большие весовые коэффициенты при сравнениях устройств, тогда можно понять, почему искажения усилителя с общим уровнем 0,08 % иногда заметнее 3% искажений акустики. Дело в том, что акустические системы имеют в рабочем диапазоне мощностей монотонный спад рисунка искажений, когда уровень гармоники с большим номером падает быстрее увеличения ее заметности, и, фактически, уровень уже 5-й - 7-й гармоники пренебрежимо мал. Аналогичная ситуация наблюдается при сравнении характеристик лампы с характеристиками биполярного транзистора. Высокие вторая (и третья) гармоники у лампы (пентода) компенсируются практически полным отсутствием 5 - 7-й и выше гармоник, тогда как у биполярного транзистора распределение уровней гармоник носит хаотичный характер, и гармоники с высоким порядком имеют уровни часто выше нижних. Понятно, что если замерять третью гармонику, лампа наверняка проиграет, но если замерять по взвешенным коэффициентам хотя бы до 10 - 15-й гармоники, то картина кардинально меняется. Понятно, что у ламповых схем часто присутствует хотя бы выходной трансформатор (лишний источник своих, специфических искажений), а у транзисторов минусом служит нестабильность моментальных термических характеристик, но это уже отдельная история. 

Коэффициент интермодуляционных искажений, (InterModulation Distortion, IMD) - это относительный вес появляющихся перекрестных паразитных модуляций основных тонов после прохождения через схему. Субъективно более заметная характеристика, нежели гармонические искажения, по величинам близка. 

В акустических системах категории Hi-Fi, согласно МЭК 581-7, рекомендуемый коэффициент нелинейных искажений должен быть не более 2% в области частот до 1000 гц, 1% выше 1000 гц. 
По стандарту СТ СЭВ суммарный коэффициент гармоник в АС не должен превышать 3 дБ в диапазоне частот 250-2000 гц при плавном уменьшении до 1% на частотах от 1 до 2 кгц, и быть не более 1% в полосе 2-8 кгц (отдельные пики значений, выходящие за указанные пределы, не учитываются, если их число не превышает 3, а ширина, в допустимых пределах, составляет не более 1/3 октавы) 

Номинальная и паспортная мощность громкоговорителя. Номинальной мощностью громкоговорителя называют ту подводимую к нему электрическую мощность, при которой нелинейные искажения не превышают значения, установленного для громкоговорителя данного типа, а паспортной - мощность, на которой громкоговоритель способен длительное время работать, не испытывая необратимых механических и тепловых повреждений. Очевидно, что первая величина всегда меньше второй. 

Номинальная и максимальная мощность усилителя. Первая величина по смыслу совпадает с определением у АС, то есть это мощность, ограниченная заданной (номинальной) величиной искажений. Вторая величина отличается только количественно, она ограничена уже более высоким уровнем искажений, обычно 10%, и, конечно, тоже всегда выше первой величины (усилителей с номинальным уровнем искажений 10% я пока не встречал). 

Соотношение сигнал/шум (SNR, Signal to Noise Ratio). Бывает взвешенный (измеряемый в соответствии с кривой чувствительности человеческого слуха) и невзвешенный, (как есть). Если данные были получены при измерениях по взвешенной кривой, рядом со значением указывается A-weighting (измерения по сетке А). В современной технике величина достаточно низкая, чтобы на ней не зацикливаться. 
Одно из немногих мест, где она имеет достаточный вес, это магнитная запись. Для борьбы с этим дополнительно могут использоваться шумоподавители двух видов: 
Первые - класса "динамический фильтр", DNR (использующие эффект маскирования низкоуровневого шума большим полезным сигналом), "обрезающие" (уменьшающие) шумы при суммарном входном сигнале ниже определенного уровня. Они обычно используются на верхних звуковых частотах, как более заметных по шуму. В упрощенном виде работу DNR можно описать так - часть схемы отслеживает уровень на входе, при достижении некоторого нижнего порогового значения входного сигнала переключает управляемый фильтр, который уменьшает уровень усиления. Как правило, избирательность действия частотозависима (в соответствии с особенностями чувствительности слуха к частотному спектру). DNR позволяют несколько уменьшить шумы исходного сигнала (а не носителя, как во втором примере), работают только при воспроизведении и, очевидно, меняют и искажают исходный сигнал. Полезные низкоуровневые составляющие, находящиеся ниже порога срабатывания, например, "хвосты" (послезвучия) громких сигналов, попросту грубо отсекаются, что побуждает разработчиков вводить дополнительную задержку на выключение фильтра. 
Вторые - компандерные шумоподавители (используемые зеркально, при записи-воспроизведении), при записи на ленту компрессирующие сигнал, при воспроизведении экспандирующие его по обратной зависимости, обычно используют один и тот же ключевой элемент для зеркальности характеристик. Разработчик - лаборатория "Dolby". Позволяют уменьшить шумы ленты, теоретически не воздействуя на исходный сигнал. 
Если недостатки динамических фильтров очевидны (дискретность срабатывания, особенно заметная при подаче сильного НЧ-сигнала на вход пороговой схемы, пропускание шумов при входном сигнале выше порогового значения, неизбежные искажения на малых уровнях громкости, инерционность работы, несовпадение порогов и времени включения и отключения фильтра, где-то аналогично понятию "петля гистерезиса"), то ко вторым я отношусь скептически по другим, менее известным причинам. Известно, что система магнитная головка-лента обладает своей, не совсем линейной АЧХ и динамической характеристикой (как при записи, так и при воспроизведении). Также свой вклад в динамические, амплитудно-частотные и фазово-частотные искажения вносят входной контур предыскажений при воспроизведении, частотокорректирующие УВ и УЗ, выходной фильтр-пробка. Уход характеристик сигнала, записанного даже на идеальной ленте, в идеальном тракте составляет ~ 20% в течение недели после записи, меняются динамические и частотные характеристики, проявляется копир-эффект. Получается, что идентичность входной и выходной динамических характеристик, необходимую для правильной работы компандера, реализовать на ленте просто невозможно, а значит сигнал, прошедший через компандерную схему, будет однозначно искажен. Где-то растянут, где-то сжат на динамической характеристике, да еще и по разному на разных частотах. Не секрет, что работа компандеров еще и частотозависима, то есть используются выделенные частотные каналы обработки, а более продвинутые варианты работают еще и на разных динамических уровнях, что в целом усугубляет общую картину динамических искажений. К сожалению, здесь присутствует парадокс - компандерная система, как раз предназначенная для борьбы с шумом носителя и только носителя, не в состоянии обеспечить (в течение некоторого отрезка времени) точную передачу сигнала из-за несовершенства (нестабильности) характеристик самого носителя. 


Соотношение сигнал/фон. Последнее время несколько подзабытая, так как в явном виде (в виде постоянного гула) встречается редко, разве только при неисправностях БП. Характеристика, описывающая появление на выходе усилителя сигналов с посторонним происхождением и явно выраженной постоянной частотой. Например, появление частоты 50 гц промышленной сети переменного тока, проникающей через некачественные НЧ фильтры силовых источников питания усилителя, или появляющаяся в виде наводок. Тогда низкочастотные составляющие полезного сигнала (вблизи частот, кратных 50 гц) оказываются промодулированными пульсациями выпрямителя. То есть возникают биения, более заметные на максимальной громкости. На слух это выражается в большей жесткости низкочастотных составляющих. Лечится более качественным источником питания или (!) введением глубокой ООС на НЧ в звуковом тракте. Причем второй способ в большей части недорогих схем выбирают чаще, так как это гораздо дешевле, хотя и вносит уже временные компенсационные искажения, не менее заметные на слух. 


ФЧХ - фазово-частотная характеристика (субхарактеристика временных). Одна из наиболее "забытых" характеристик, которая со времен середины столетия мало улучшилась в ряде систем, а где-то даже ухудшилась. Фазово-частотные искажения встречаются во всех звеньях тракта: в цепях передачи сигнала, в усилителях, в колонках... Сначала стоит вспомнить один из основных принципов психоакустики - в случае двух различных звуковых сигналов с равной интенсивностью для слуха, приходящих к слушателю с небольшой задержкой одного относительно другого, слушатель скорее отреагирует на первый из них, проигнорировав второй, хотя абсолютная взвешенная громкость их будет равна. Данный факт используется при кодировании (а именно сжатии с потерями) в формате MP3, используется в технологии A3D, практически во всех звуковых технологиях, использующих психоакустические методы. 
Сигнал, прошедший через звенья звукового тракта, включающего в себя не только электронику, но и акустические системы, претерпевает задержки во времени, разные на разных звуковых частотах. Задержки очень немаленькие, выражающиеся в относительном, фазовом выражении в величинах, близким к единицам пи по ширине рабочей полосы частот. То есть, сигналы низкой звуковой частоты и высокой звуковой частоты могут быть сдвинуты друг от друга по времени на период верхней частоты, что существенно отражается на восприятии и точности звуковой картины. Кроме того, данный параметр мало стандартизован, почему в бытовой ширпотребной звуковой технике часто не оптимизируется, не декларируется (впрочем, не декларируется и даже в очень дорогой технике), хотя очень важен для субъективного восприятия. Это вам не сотые-тысячные доли процента в случае искажений! Надо понимать, что музыкальный сигнал является комплексным (не абстрактная синусоида), то есть здесь нужно не просто передать мощность, как по сетям электропитания 220v, а важна и синхронность разных частотных составляющих музыки. 


Как видно из вышеизложенного, часто во многих аспектах звукопередачи для измерений используется какой-то срез характеристик при фиксированной третьей величине, что приводит к однобокой оценке звена звукового тракта. Да и слишком много факторов, одновременно влияющих на звук, к тому же разделить их друг от друга намного сложнее, чем, скажем, в видео. Именно поэтому опытные меломаны так часто продекларированным измерениям характеристик устройств предпочитают непосредственное прослушивание, как более верный способ получить представление об объекте. На возможное возражение, что этот способ субъективен, можно ответить тем, что и уши, и вкусы у всех слушателей разные. Хотя лучшая оценка звена тракта - то, что он никак не влияет на звук и не видоизменяет музыкальный сигнал. С другой стороны, студийная техника часто звучит бледно, пресно, чересчур ровно и правильно, тогда как какой-нибудь дорогой однотактный ламповый усилитель по отношению к сигналу ведет себя как эксайтер, добавляя гармоники в широком спектре, делая звук более домашним, теплым, приятно окрашенным (как покоробит кого-то это выражение!), щедро политым соусом из свойственных ему искажений, но зато не имеющий компрессии на малых уровнях громкости, как в любом двухтактном усилителе (кроме класса А), и следовательно, высокую линейность динамического диапазона. Поэтому выбор звеньев системы - дело сугубо индивидуальное, каждый сам выбирает то, что ему слушать, и что нравится именно ему. 


 

 

 

О восприятии звука и музыки

Статьи о музыке » Полезные музыкальные статьи

О восприятии звука и музыки (Восприятие и сжатие звука)

Простые методы сжатия



Традиционные методы сжатия без потерь (Huffman, LZW, итд.) обычно плохо применимы для сжатия аудио информации (по тем же причинам что и при сжатии визуальной информации). 

Ниже перечислены некоторые методы сжатия с потерями:

  • Сжатие тишины(пауз) - определяет периоды "тишины", работает аналогично run-length кодированию.
  • ADPCM - Adaptive Differential Pulse Code Modulation (в русскоязычной литературе применяется термин адаптивная дельта-импульсно-кодовая модуляция (АДИКМ).

Например, стандарт CCITT G.721 -- от 16 до 32 Kbits/sec: 
Кодирование разницы между двумя или более последовательными отсчетами; затем разница квантуется --> при квантовании часть информации теряется. Квантование адаптивно (меняет параметры в зависимости от сигнала), в результате меньшее количество бит необходимо для достижения лучшего SNR. Необходимо предсказывать как звук изменится --> сложно

 

  • Apple разработал собстенную систему названную ACE/MACE. Сжатие с потерями, пытается предсказать, каково будет значение следующего отсчета. Сжатие порядка 2:1.
  • Linear Predictive Coding (LPC) - пытается описать сигнал с помощью "речевой модели" и передает параметры модели --> звучит как компьютерно синтезированная речь, 2.4 kbits/sec.
  • Code Excited Linear Predictor (CELP) - тоже самое что и LPC, однако дополнительно передает ошибку квантования (используя предопределенный набор "кодовых слов") --> телефонное качество при 4.8 kbits/sec.

Методы сжатия, основанные на психоакустике



Представители: MPEG layers 2, MPEG layer 3 (MP3), AAC (Advanced audio coding), TwinVQ, Ogg Vorbis, и др. 

Алгоритм кодека использующего психоакустику обычно состоит из следующих шагов:

  • Обсчет психоакустической модели (маскирования).
  • Разделение сигнала на частотные подполосы (FFT, DCT/MDCT, FilterBanks, и т.д.).
  • Квантование сигнала в подполосах в соответствии с результатами психоакустической модели. Возможно использование одного квантового уровня. сразу для нескольких входных значений (векторное квантование - Vector Quantization) - TwinVQ.

Некоторые факты о восприятии звука

  • Частотный спектр воспринимаемый человеком (примерно) от 20 Hz до 20 kHz, наибольшая чувствительность в диапазоне от 2 до 4 KHz.
  • Динамический диапазон (от самых тихих воспринимаемых звуков до самых громких) около 96 dB (более чем 1 к 30000 по линейной шкале).
  • Общеизвестно, что человек в состоянии различить изменение частоты на 0.3% на частоте порядка 1kHz.
  • Если два сигнала различаются менее чем на 1дб по амплитуде - они трудноразличимы. Разрешение по амплитуде зависит от частоты и наибольшая чувствительность наблюдается в диапазоне от 2 до 4 KHz.
  • Пространственное разрешение (способность к локализации источника звука) - до 1 градуса.
  • Звуки различной частоты распространяются в воздухе с разной скоростью. В результате высокочастотная часть спектра от источника находящегося на удалении от слушателя несколько запаздывает.
  • Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms.
  • Некоторые исследования показывают, что человек в состоянии ощущать частоты выше 20kHz. С возрастом частотный диапазон сужается.



Речь 

  • Частотный спектр, несущий информацию в человеческой речи: от 500 Hz до 2 kHz

 Низкие частоты - басы и гласные 
Высокие частоты - согласные

  • Лучшее сжатие речи достигается с использованием параметрических кодеров (LPC, CELP, и пр.), пытающихся представить речь как набор параметров некоторой речевой модели. Кодеки общего назначения (MPEG и др.), как правило, дают худшее сжатие.




Устройство уха 


О восприятии звука и музыки (Восприятие и сжатие звука) 

В общем случае ухо - нелинейная система и не может быть точно описано с помощью только линейных элементов (таких как фильтры и линии задержки). Как побочный результат нелинейности может проявляться, например, следующий эффект: при подаче двух тонов с частотой 1000 и 1200Hz может также быть слышен третий тон с частотой 800Hz. Однако в интересующем нас диапазоне амплитуд нелинейность достаточно слаба и ей обычно пренебрегают. 

Строение



Ухо состоит из трех частей: ушной раковины (также называемой внешним ухом), среднего уха и внутреннего уха - улитки. Проходя через различные части уха звук претерпевает изменения. 

  • Одна из функций внешнего уха (ушной раковины) - улучшение локализации источника звука в пространстве. Благодаря ее несимметричной форме АЧХ сигналов приходящих из разных точек пространства изменяется по разному. Ушная раковина может влиять лишь на сигналы с длинной волны, сопоставимой с размерами уха (>3kHz). Внешний ушной канал резонирует на частоте около 2kHz , что дает повышенную чувствительность в данном диапазоне.
  • Среднее ухо выполняет роль гидравлического усилителя. Так как в улитке находится жидкость а снаружи - воздух, то необходимо согласование сопротивления среды. Среднее ухо также защищает от низкочастотных звуков чрезмерной амплитуды.
  • Внутреннее ухо - улитка. В развернутом виде будет представлять из себя трубочку, с постепенно уменьшающимся к одному из концов диаметром. Улитка выполняет роль частотного анализатора. Внутри улитки находятся до 4000 нервных окончаний. Различные области улитки входят в резонанс при подаче сигнала определенной частоты.


Восприятие в зависимости от частоты 

  • Так как нейрон может возбуждаться не чаще чем 500 раз в секунду, то для получения информации о более высоких частотах слуховой аппарат человека прибегает к некоторым "ухищрениям":

 На частотах до 500 Hz --> колебания непосредственно переходят в нервные импульсы. 
Примерно до 1.5кГц проблема решается подключением одновременно до 3 нейронов к одному нервному окончанию. Нейроны в данном случае возбуждаются последовательно, один за другим и, соответственно, помогают улучшить частотное разрешение в 3 раза. 
На более высоких частотах регистрируется лишь амплитуда сигнала. 

  • Таким образом бинауральный слух, играющий большую роль в локализации источника звука, лучше всего развит на частотах меньших 1.5кГц. Выше этой частоты источником информации о местоположении служит лишь разница амплитуд сигнала для левого и правого уха. Это делает возможным применение при кодировании режимов Joint Stereo - запоминается либо информация для суммы правого и левого каналов и их разница, со значительно меньшей точностью (Mid/Side coding), либо вообще запоминается лишь амплитуда сигнала (Intensity coding).


Психоакустика 

Критические полосы (Critical Bands) 

  • Человеческая система восприятия звука имеет ограниченное, зависящее от частоты разрешение. Равномерное, с точки зрения восприятия человеком измерение частоты может быть выражено в единицах ширины Критических Полос. 
    Их ширина менее 100 Hz для нижних слышимых частот, и более 4 kHz для наиболее высоких. Весь частотный диапазон может быть разделен на 25 критических полос.
  • Новый отсчет частоты был назван барк (bark, after Barkhausen):

 1 Барк = ширина одной критической полосы 
Для частот < 500 Hz, может быть рассчитан по формуле: частота / 100 Барк, 
Для частот > 500 Hz: 9 + 4log2(частота / 1000) Барк. 


Чувствительность человеческого уха в зависимости от частоты 

  • Эксперимент: Слушатель в тихой комнате. Повышаем громкость тона частотой 1 kHz до уровня когда он становится слышимым. Изменяя частоту тона получим: 

О восприятии звука и музыки (Восприятие и сжатие звука)

 


Частотное(параллельное) маскирование 

Вопрос: Взаимодействуют ли звуковые рецепторы друг с другом ? 

  • Эксперимент: Воспроизводим тон частотой 1 kHz (маскирующий сигнал), с фиксированной громкостью (60 dB). Воспроизводим тестовый (маскируемый) тон с различной громкостью (скажем с частотой 1.1 kHz), и повышаем его уровень до тех пор пока он не становится слышимым.
  • Изменяем частоту тестового тона и рисуем границу слышимости: 

О восприятии звука и музыки (Восприятие и сжатие звука)

 

  • Повторяем эксперимент для различных частот маскирующего сигнала: 

О восприятии звука и музыки (Восприятие и сжатие звука)

 

  • Частотное маскирование с частотной шкалой выраженной в Барках: 


О восприятии звука и музыки (Восприятие и сжатие звука)




Временное(последовательное) маскирование 

 
Если мы слышим громкий звук, который внезапно прекращается, требуется некоторое время чтобы услышать более тихий тон.

 

Эксперимент: Воспроизводим 1 kHz маскирующий тон на уровне 60 dB, и тестовый тон с частотой 1.1 kHz на уровне 40 dB. Тестовый тон не слышен (он замаскирован). 

Отключаем маскирующий тон, затем, после небольшой задержки отключаем тестовый тон. 

Уменьшаем время задержки до тех пор пока тестовый тон еще слышен (например 5 ms). 

Повторяем используя различную громкость тестового тона и получаем: 


О восприятии звука и музыки (Восприятие и сжатие звука) 





Общий эффект от частотного и временного маскирования: 


О восприятии звука и музыки (Восприятие и сжатие звука) 

 

Транзиентные сигналы


Представленная выше теория маскирования верна в случае рассмотрения квазистационарных, медленно меняющихся по амплитуде и частотным характеристикам сигналов. В случае же рассмотрения сигналов с резко меняющимися параметрами (транзиентные сигналы) она неприменима. 

Ухо в данном случае невозможно описать с помощью линейной системы. Теоретически обоснованных подходов для описания восприятия в данном случае автору не известно. Можно описать лишь несколько хорошо известных эффектов проявляющихся при кодировании данных сигналов:

  • Пре-эхо (pre-echo, ringing). Возникает перед резкими увеличениями амплитуды сигнала (атаками). При кодировании с недостаточным временным разрешением (и выделением недостаточного количества бит при квантовании) часть сигнала предшествующая атаке существенно искажается шумом квантования. Так как существует эффект пре-маскирования, то некоторое искажение допустимо, однако оно должно быть достаточно коротким по времени. Некоторые исследования показывают, что время пре-маскирования уменьшается с увеличением частоты сигнала.
  • Речевой сигнал. Голосовые участки речевого сигнала являются по своей природе часто идущими атаками с быстрым затуханием (pitched signals):




О восприятии звука и музыки (Восприятие и сжатие звука) 

Стандартная психоакустическая модель маскирования сигналов в данном случае выдает завышенные пороги слышимости (из-за недостаточного временного разрешения) и, как результат, становится слышимым шум квантования.

 





Audio Compression - с этой странички переведен раздел психоакустика. 

Human audio perception: masking - более подробное описание эффектов маскирования. 

GSM 6.10 описание и исходники GSM кодека. 

Каталог ссылок на различные ресурсы по MPEG аудио. 

SQAM Sound Quality Assesment Material - критический аудио-материал. Использовался при тестировании MPEG кодеров, при сжатии проявляется большее количество искажений, чем при использовании обычных записей. 

 

 

 

 

 


ЖИЗНЕННЫЕ ПРАВИЛА ДЛЯ МУЗЫКАНТОВ

Советы музыкантамСтатьи о музыке » Полезные музыкальные статьи

ЖИЗНЕННЫЕ ПРАВИЛА ДЛЯ МУЗЫКАНТОВ (ПРАВИЛА ДЛЯ МУЗЫКАНТОВ)



Развитие слуха - это самое важное. Старайся с юных лет распознавать тоны и лады. Колокол, стекольная рама, кукушка, - прислушайся, какие звуки они издают. 

Играй усердно гаммы и другие упражнения для пальцев. Но есть много людей, которые полагают, что этим все и достигается, которые до глубокой старости ежедневно проводят многие часы за техническими упражнениями. Это приблизительно то же самое, что ежедневно читать азбуку вслух и стараться делать это все быстрее и быстрее. Употребляй свое время с большей пользой. 

Изобрели так называемую "немую клавиатуру"; попробуй немного поиграть на ней, чтобы убедиться в ее полной непригодности. Немые не могут научить говорить. 

Играй ритмично! Игра некоторых виртуозов похожа на походку пьяного. Не бери с них примера! 

Изучи как можно раньше основные законы гармонии. 

Не бойся слов: теория, гармония, контрапункт и т. п.; они встретят тебя приветливо, если ты поступишь так же. 

Никогда не колоти по клавишам! Играй со смыслом и не останавливайся на половине пьесы. 

Тянуть и спешить - одинаково большие ошибки. 

Старайся играть легкие пьесы хорошо и выразительно; это лучше, чем посредственно исполнять трудные. 

Всегда проявляй заботу о чистоте настройки твоего инструмента. 

Необходимо, чтобы пьесой овладели не только пальцы, ты должен уметь также напевать ее про себя без помощи инструмента. Обостряй свое воображение настолько, чтобы ты мог удержать в памяти не одну лишь мелодию, но также и сопровождающую ее гармонию. 

Даже если ты не обладаешь хорошим голосом, старайся петь с листа без помощи инструмента; таким образом, ты разовьешь свой слух. Если же у тебя красивый голос, не медли ни минуты и развивай его; рассматривай это как прекраснейший дар, которым тебя наделило небо. 

Играй всегда так, как будто тебя слушает великий художник. Когда ты играешь, не беспокойся о том, кто тебя слушает. 

Если тебе предложат сыграть с листа незнакомое сочинение, то сначала пробеги его предварительно глазами, в полном его объеме. 

Если ты выполнил свою повседневную музыкальную работу и чувствуешь усталость, не принуждай себя к дальнейшему труду. Лучше отдыхать, чем работать без охоты и бодрости. 

Когда будешь постарше, не играй модных сочинений. Время дорого. Надо иметь сто человеческих жизней, чтобы познакомиться только со всем хорошим, что существует на свете. 

На сладостях, печенье и конфетах из ребенка никогда не вырастить здорового человека. Духовная пища так же, как и телесная, должна быть простой и здоровой. Великие мастера достаточно позаботились о такой пище; ее и придерживайтесь. 

Весь хлам пассажей имеет преходящее значение; техника обладает ценностью только там, где она служит высшим целям. 

Не распространяй плохих сочинений; старайся всячески преграждать им путь к известности. 

Ты не должен ни играть плохие сочинения, ни слушать их, если только тебя к этому не принуждают. 

Не стремись к блеску исполнения. Старайся, чтобы музыка произвела то впечатление, которое имел в виду автор; большего не надо; все, что сверх этого, - искажение. 

Считай безобразием что-либо менять в сочинениях хороших композиторов, пропускать или, чего доброго, присочинять к ним новомодные украшения. Это величайшее оскорбление, какое ты можешь нанести искусству. 

Выбирая пьесы для работы, советуйся со старшими; ты этим сбережешь себе много времени. 

Постепенно знакомься с сочинениями известных композиторов. 

Не обольщайся успехом, который часто завоевывают так называемые большие виртуозы. 

Одобрение художников пусть будет для тебя ценнее признания целой толпы. 

Все модное выходит из моды; если ты будешь гнаться за модой, то, состарившись, будешь никому не внушающим уважения франтом. 

Много играть в обществе скорее вредно, чем полезно. 

Но никогда не упускай возможности участвовать в совместной игре в дуэтах, трио и т. п. Это сделает твою игру полной жизни, осмысленной. Чаще аккомпанируй певцам. 

Если бы все хотели играть первую скрипку, нельзя было бы составить оркестра. Уважай поэтому каждого музыканта на его месте. 

Люби свой инструмент, но в своем тщеславии не считай его высшим и единственным. Помни, что существуют другие и столь же прекрасные. Помни и о существовании певцов; не забудь, что самое высокое в музыке находит свое выражение в хоре и оркестре. 

Когда подрастешь, общайся больше с партитурами, чем с виртуозами. 

Играй усердно фуги больших мастеров, особенно И. С. Баха. "Хорошо темперированный клавир" должен быть твоим хлебом насущным. Тогда ты безусловно станешь основательным музыкантом. 

Ищи среди своих товарищей таких, которые знают больше, чем ты. 

Отдыхай от своих музыкальных занятий, усердно читая поэтов. Броди почаще в поле и в лесу. 

У певцов и певиц можно многому научиться, но и не во всем доверяй им. 

Много людей живет на свете. Будь скромен! Ты еще не изобрел и не придумал ничего такого, чего до тебя уже не придумали и не изобрели другие. А если бы тебе это и удалось, то считай свое открытие общим достоянием. 

Изучение истории музыки, подкрепляемое живым слушанием образцовых произведений различных эпох, скорее всего, излечит тебя от самомнения и тщеславия. 

Исследование Тибо "О чистоте стиля в музыке" - прекрасная книга. Когда ты станешь старше, читай ее. 

Если ты проходишь мимо церкви и слышишь, что в ней играют на органе, войди и слушай. Если тебе посчастливится самому сесть на органную скамью, то испытай свои маленькие руки на клавишах этого инструмента и удивляйся могуществу нашего искусства. 

Не упускай случая поупражняться на органе; нет инструмента, который так же быстро мстил бы за неряшливость и грязь в сочинении и в исполнении. 

Пой усердно в хоре, особенно средние голоса. Это сделает из тебя хорошего музыканта. 

Но что, значит, быть музыкальным? Ты не музыкален, если, боязливо уставившись глазами в ноты, с трудом доигрываешь свою пьесу; ты не музыкален, если в случае, когда кто-нибудь нечаянно перевернет тебе сразу две страницы, - остановишься и не сможешь продолжать. Но ты музыкант, если в новой пьесе приблизительно догадываешься, что будет дальше, а в знакомой уже знаешь это наизусть, - словом, когда музыка у тебя не только в пальцах, но и в голове, и в сердце. 

Но как стать музыкальным? Милое дитя, главное острый слух, быстрая восприимчивость -- дается, как и все, свыше. Но способности можно развивать и совершенствовать. Ты не станешь музыкальным, если, отшельнически уединяясь, целыми днями будешь заниматься техническими упражнениями; ты приблизишься к цели, если будешь поддерживать живое, многостороннее общение с музыкантами, и, в частности, если будешь постоянно иметь дело с хором и оркестром. 

Изучай с юных лет пределы и свойства человеческого голоса в его четырех видах; особенно прислушивайся к голосам в хоре; выясни, в каких регистрах они обладают наибольшей силой, в каких им доступны выражения мягкости и нежности. 

Прислушайся внимательно ко всем народным песням; это целая сокровищница прекраснейших мелодий, они откроют тебе глаза на характер различных народов. 

Практикуйся с раннего возраста в чтении старых ключей. Иначе для тебя останутся недоступными многие сокровища прошлого. 

Как можно раньше примечай звук и характер различных инструментов, старайся запечатлеть в своем слухе их своеобразную звуковую окраску. 

Никогда не упускай случая послушать хорошую оперу. 

Высоко чти старое, но и новое встречай с открытым, горячим сердцем. Не относись с предубеждением к незнакомым тебе именам. 

Не суди о сочинении, прослушав его один раз: то, что тебе понравится в первый момент, не всегда самое лучшее. Мастера требуют глубокого изучения. Многое станет тебе ясным лишь в зрелом возрасте. 

В суждениях о музыке различай, принадлежит ли произведение к области профессионального искусства или создано только для дилетантского развлечения; первые отстаивай, по поводу других не гневайся! 

"Мелодия" -- боевой клич дилетантов, и действительно, музыка без мелодии --не музыка. Пойми, однако, что они имеют в виду: они признают лишь мелодию, легко воспринимаемую, ритмически привлекательную. Но ведь есть и другие, иного склада, и где бы ты ни раскрыл Баха, Моцарта, Бетховена, на тебя глядит тысяча мелодий различных видов; убогое же однообразие, особенно типичное для новых итальянских оперных мелодий, надо надеяться, скоро наскучит. 

Если ты подбираешь на фортепиано маленькие мелодии, это, конечно, очень мило, но если они являются сами, а не за инструментом, то радуйся еще больше - значит, в тебе пробуждается внутреннее музыкальное сознание... Пальцы должны делать то, чего хочет голова, но не наоборот. 

Когда ты начнешь сочинять, проделай все мысленно. Только когда пьеса совершенно готова, попробуй сыграть ее. Если твоя музыка вылилась из души, если ты ее прочувствовал, - она так же подействует и на других. 

Если небо одарило тебя живой фантазией, то в часы уединения ты будешь, как зачарованный, сидеть за инструментом, пытаясь в гармониях излить свое внутреннее я, и тем таинственнее ты будешь чувствовать себя как бы вовлеченным в магический круг, чем менее ясным будет для тебя еще в это время царство гармонии. Это будут самые счастливые часы твоей юности. 

Берегись, однако, слишком часто отдаваться влечению таланта, который соблазняет тебя тратить силы и время на создание как бы призрачных образов. Овладение формой, сила ясного воплощения придут к тебе только вместе с нотными знаками. Итак, больше сочиняй, чем фантазируй. 

Как можно раньше познакомься с дирижированием. Почаще наблюдай хороших дирижеров; вместе с ними можешь потихоньку дирижировать. Это принесет тебе ясность. 

Внимательно наблюдай жизнь, а также знакомься с другими искусствами и с науками. Законы нравственные те же, что и законы искусства. Старанием и прилежанием ты всегда достигнешь более высокого. 

Из фунта металла, стоящего несколько грошей, можно сделать тысячи часовых пружин, ценность которых увеличится в сотни тысяч раз. Фунт, полученный тобой от Бога, используй добросовестно. 

Без энтузиазма в искусстве не создается ничего настоящего. 

Искусство не предназначено для того, чтобы наживать богатство. Совершенствуй себя как артист, остальное придет само собой. 

Лишь тогда, когда станет тебе вполне ясной форма, тебе ясным станет и содержание. Быть может, только гений понимает гения до конца. 

Кто-то утверждал, что хороший музыкант должен уметь представить себе впервые услышанное даже сложное оркестровое произведение в виде партитуры. Это высшее совершенство, какое себе можно представить. 

Ученью нет конца. 

 

 

 

 

 

 

 

Компьютер в роли синтезатора

Статьи о музыке » Полезные музыкальные статьи

Компьютер в роли синтезатора (Компьютер в роли синтезатора, или кое-что о MIDI-клавиатурах...)




Давным-давно, когда музыкальные синтезаторы были аналоговыми, клавиатура, основная часть устройства, представляла собой в буквальном смысле набор контактов, электрически связанных с генератором звука. При замыкании одного из контактов ток проходил через соответствующий переменный резистор, который, в свою очередь, был "настроен" на определенную ноту. Такая конструкция являлась исключительно самодостаточной и не предполагала абсолютно никакого варианта взаимодействия с "внешним миром". 

Количество моделей синтезаторов все увеличивалось, и производители решили собраться за "круглым столом", дабы договориться о способе обеспечения некоего "взаимодействия" между ними. Появились специальные разъемы для обеспечения возможности, к примеру, воспроизводить звуки с одного синтезатора, играя на клавиатуре другого. Однако до настоящего "симбиоза" было еще далеко. Возможности подобного метода управления были ограничены, да и синтезатор быстро выходил из строя, если на него подавалось неправильное управляющее напряжение, тем более, что большинство приборов того времени имело разное значение и полярность. 

И вот наконец наступила эра цифровой техники. Синтезаторы, сохранив аналоговую звукогенерирующую часть, обрели удобное цифровое управление, появилась возможность отделить все управляющие средства, в том числе и клавиатуру, от генератора. Проще говоря, теперь клавиатура не имела электрической связи с генератором звука, а просто посылала ей цифровой управляющий сигнал при замыкании контакта. 

Вот тогда и появилась необходимость в создании единого стандарта, который был впоследствии назван MIDI (Musical Instrument Digital Interface — Цифровой интерфейс музыкальных инструментов) и решил в буквальном смысле все проблемы. Теперь можно было подключать друг к другу любые синтезаторы, покупать секвенсор (прибор, способный запоминать и озвучивать определенное количество нот), не заботясь о том, подойдет ли он к данной модели синтезатора, обмениваться мелодиями и так далее. 

Но самое главное — генератор звука окончательно отделился от клавиатуры, и оба они стали абсолютно независимыми устройствами. 

Вот тогда-то и появились первые бесклавишные синтезаторы и первые миди-клавиатуры, которые можно было подключать к нескольким синтезаторам и управлять ими всеми с помощью одной клавиатуры, что позволяло одновременно экономить место и средства. Ну зачем вам пять клавиатур, когда вполне можно обойтись одной? 

Кстати, клавиатуру принято называть также MIDI-контроллером; этим подчеркивается, что она выполняет чисто "управленческие" функции. И, между прочим, MIDI-контроллер совсем не обязательно должен иметь вид фортепианных клавиш. Бывают контроллеры в виде гитары, баяна или, например, флейты. 

Однако, давайте пока остановимся на миди-клавиатурах так называемого "фортепианного" типа. 
Для начала хочу рассказать вам о некоторых преимуществах миди-клавиатур перед клавишными синтезаторами: 

Цена 

Как вы сами понимаете, отдельная клавиатура стоит несравнимо дешевле, чем синтезатор с аналогичной клавиатурой. Если бюджет вашей домашней студии невелик, и вы хотите ограничиться одной звуковой платой с набором соответствующего программного обеспечения, то вариант с миди-клавиатурой будет для вас более выгодным приобретением. Четырехоктавную клавиатуру с полноразмерными клавишами можно приобрести по цене, не превышающей полторы сотни долларов. За синтезатор наверняка придется заплатить дороже, если только это не детская модель с маленькими клавишами и вообще без MIDI-интерфейса. 

Качество 

Поскольку клавиши — практически единственная значимая деталь миди-клавиатуры, производители, как правило, сосредотачивают внимание именно на клавишной механике. В результате даже дешевые MIDI-контроллеры могут превосходить в этом отношении довольно дорогие синтезаторы. 

Универсальность 

Может случиться так, что вам понравится звучание одного синтезатора и клавиатура другого. К примеру, синтезатор Korg X5 звучит просто превосходно, но его клавиатура не выдерживает никакой критики. Что делать? Берем отдельно звуковой модуль Korg X5DR и подбираем подходящую клавиатуру. В варианте же с компьютером все еще проще. Главное — подобрать соответствующий софт. 

Простота 

Подключить к компьютеру миди-клавиатуру гораздо проще, чем синтезатор, который нужно будет дополнительно настраивать. Более того: разные синтезаторы и настраиваются по-разному, и даже специалист не всегда может быть в курсе настроек именно вашей модели. Да и работать с миди-клавиатурой значительно проще. 

"Моральная" долговечность 

Со временем любая электронная аппаратура подвергается моральному устареванию. Может оказаться так, что звуки, от которых год назад вы были в восторге, сегодня окажутся для вас уже не такими приятными. А ведь продать клавишный синтезатор не так просто, ведь его механические части могут слегка износиться. А вот сам синтезаторный блок проапгрейдить намного легче. Кроме того, не придется расставаться с клавиатурой, к которой вы наверняка уже привыкли. 

В общем, как видите, плюсов — огромное множество. 

Для большей объективности позволю себе упомянуть и о некоторых недостатках миди-клавиатур: если синтезатор у вас только один, то клавишная модель, скорее всего, займет меньше места, чем комбинация клавиатура + модуль. В тех случаях, когда вы переносите свой аппарат с места на место или используете его в концертных выступлениях, полноценный синтезатор, конечно же, удобнее. И, наконец, клавишные синтезаторы, как правило, имеют больше органов управления, в том числе и для работы в режиме реального времени. 
Однако, если учесть, что данная статья предназначена для тех, кто собирается создавать и редактировать музыку исключительно на компьютере, то все вышеперечисленное не имеет особого значения, поскольку практически для любых моделей синтезаторов существуют специальные управляющие компьютерные программы, с помощью которых можно производить все необходимые действия на большом цветном экране. 

И еще: не подумайте, что, подключив миди-клавиатуру к компьютеру и нажав на любую из клавиш, вы сразу же услышите "музыку". Для этого необходимо запустить секвенсор — программу, которая, по сути, является своеобразным промежуточным звеном между миди-клавиатурой и источником звука и осуществляет управление выбранным источником звука посредством миди-сообщений, получаемых с миди-клавиатуры. В том или ином виде секвенсоры содержат многие программы: от профессиональных пакетов обработки звука до простейших виртуальных синтезаторов. Наиболее полные реализации секвенсоров содержат такие профессиональные пакеты, как Cakewalk Pro Audio и Steinberg Cubase. 

Итак, любая миди-клавиатура до недавнего времени подключалась к компьютеру с помощью 15-контактного разъема для подключения джойстика (гейм-порта). Для подключения к нему MIDI-устройства используется соответствующий кабель, который обычно идет в комплекте с любой мультимедийной (но не профессиональной!) миди-клавиатурой. 

Самое главное различие в миди-клавиатурах — это количество октав. Их бывает три, четыре, пять, шесть с половиной и семь с половиной (полнооктавные). Если вы не имеете музыкального образования по классу клавишного инструмента, то покупать больше шести октав не имеет смысла, так как пользоваться всеми клавишами одновременно вы вряд ли будете. Трехоктавные инструменты наоборот имеют слишком малое количество клавиш, да и стоимость трехоктавной клавиатуры ненамного ниже аналогичной четырехоктавной. 

Если же вы владеете игрой на фортепиано, то в такой ситуации рекомендуется приобрести 7,5-октавную клавиатуру, по количеству клавиш в точности повторяющую фортепианную
Существуют клавиатуры двух типов: со стандартными клавишами (полноразмерные, full-sized keys) и уменьшенными (mini keys). Первые, естественно, дороже. Здесь трудно что-то посоветовать: выбирайте что нравится. Однако НИ В КОЕМ СЛУЧАЕ не вздумайте учить ребенка игре на фортепиано на маленькой клавиатуре! Это все равно, что обучать его чтению на русском языке исключительно в "транслите" (латинскими буквами). Представляете, чему он "научится"? 

Принято различать три типа механики клавиатур: синтезаторную (synth action), фортепианную (piano action) и молоточковую (hammer action). Кроме того, внутри каждого типа выделяют несколько степеней нагрузки клавиш: невзвешенные клавиши (non-weighted), полувзвешенные (semi-weighted) и взвешенные (weighted). 

Отличие у них в том, что в полувзвешенной клавиатуре клавиши отходят после нажатия при помощи обычных пружин, взвешенная имеет противовесы, из-за чего нажатие становится более похожим на фортепианную клавиатуру. Ну, и молоточковая — полностью имитирует фортепианную динамику клавиш и практически идеально имитирует клавиатуру обычного пианино. 

В итоге, если вы не имеете базового образования игры на фортепиано, то берите взвешенную или полувзвешенную, если иначе — фортепианную клавиатуру. 

И, наконец, рекомендую вам обязательно приобретать миди-клавиатуру, которая чувствительна к скорости/силе нажатия. Ведь никому не надо объяснять, что чем сильнее удар по клавише фортепиано, тем громче звук. Клавиатуры, способные передавать динамику нажатия, обычно называют активными. 

Раньше подобными функциями обладали лишь довольно дорогие синтезаторы вроде Ensoniq TS10, а теперь поддержка скорости/силы нажатия перестала быть экзотикой и практически не увеличивает конечную стоимость клавиатуры. 

Кроме клавиш, в миди-клавиатурах зачастую предусмотрены некоторые дополнительные функции и органы управления, необязательные, но их наличие почти никогда не будет лишним. Такими фишками являются колеса Pitch Bend и Modulation. Колесо Pitch плавно поднимает или опускает звучание ноты на определенное значение (обычно на 1,5-2 тона). Данный эффект часто используется, скажем, при имитации гитарных "подтяжек". 

Колесо же Modulation заставляет звук вибрировать с определенной частотой. Сила вибрации и разница в значении определяются тем, насколько сильно вы повернули колесо. Данная функция дает возможность имитировать "легкую расстройку" фортепиано или дрожание гитарной струны. 

Некоторые клавиатуры допускают сдвиг на любое количество полутонов, что очень помогает в том случае, если музыкальное произведение, которое вам предстоит исполнить, написано в "неудобной" для вас тональности. С такой клавиатурой вы можете играть все что угодно, например, в до-мажоре. Обычно транспонировать можно и непосредственно в синтезаторе и/или компьютере, но с контроллера это делать немного проще. Но учтите, что при сдвиге области игры вниз или вверх не только добавляется одна новая октава, но также пропадает одна старая. 

Кроме того, почти все более или менее уважающие себя клавиатуры оснащены разъемами для подключения педалей. Если вы представляете себе фортепианные педали и их функции, то объяснять, зачем они нужны в миди-клавиатуре, думаю, не требуется. 

Все то, что я перечислил выше — это лишь основные функции миди-клавиатур, но есть также и другие, не менее интересные. Среди таких функций стоит обратить внимание на возможность разделения на зоны (присвоить разным частям клавиатуры разные инструменты), кнопки управления секвенсором (возможность управлять компьютером прямо с midi-клавиатуры) и наличие дополнительных контроллеров (дополнительные кнопки или колеса). 

Вообще перечислять "навороты", которыми могут оснащаться современные миди-клавиатуры, можно бесконечно. Это тема отдельной статьи. Именно поэтому я не буду этого делать, а просто приведу в качестве примера описание двух относительно недорогих, но вполне серьезных моделей миди-клавиатур, предназначенных для полупрофессионального и домашнего использования. 





M-AUDIO USB Keystation 61 

MIDI-клавиатуры серии USB от компании MIDIman совершили своеобразный переворот в области использования MIDI-технологий. Возможность подключения миди-клавиатуры к компьютеру напрямую через порт USB без обязательного наличия отдельного MIDI-интерфейса позволяет значительно более комфортно ее эксплуатировать. Единственное, что от вас требуется, это установить входящее в комплект программное обеспечение, и все! 

Активная клавиатура MIDIman USB Keystation 61 является несколько более серьезным и внешне симпатичным аппаратом, чем рассмотренный выше CMK-149. 

Стильный полупрозрачный корпус, довольно приличное количество дополнительных функций и органов управления... Плюс к этому пять, а не четыре октавы и возможность подключения через порт USB. Впрочем, давайте по порядку... 

В коробке, кроме самой клавиатуры, я обнаружил также блок питания, тонкую книжку с английской инструкцией, USB-кабель для подключения к компьютеру и один компакт-диск с драйверами и программами для создания и редактирования музыки. Подключение прошло довольно гладко. Клавиатура запиталась прямо от порта USB и не потребовала никаких дополнительных источников питания, так что сетевой адаптер я просто отложил в сторону. 
Справа сверху клавиатура, помимо уже знакомых и ставших уже традиционными колесик Pitch Bend и Modulation, имеет ползунковый слайдер для ввода данных (Data Entry). На задней панели корпуса вы найдете разъемы для подключения педали Sustain, MIDI Out и разъем USB интерфейса. Кроме того, там же имеются переключатель режима питания (USB/DC 9V/ battery) и вход для штекера блока питания. 

В качестве дополнительных функций Keystation 61 включает в себя все основные "умения" продвинутых миди-клавиатур: сдвиг на октаву, транспозицию, переключение программ, переключение номеров MIDI-каналов и банков, разбиение клавиатуры на зоны и, что особенно порадовало, наличие цифровой индикации. 

Кроме того, несколько центральных клавиш могут на некоторое время превратиться в переключатели нескольких основных звуковых эффектов вроде хоруса, реверберации и т.д. 
Все клавиши, способные активировать те или иные дополнительные функции, подписаны, и запутаться в них достаточно трудно. Кроме того, более быстрое переназначение режимов иногда помогает производить слайдер Data Entry. Ну, а собственно переключение клавиатуры из штатного состояния в режим переключения функций осуществляется непосредственно с клавиатуры по нажатию кнопки MIDI/Select. 

Красивая, компактная (90х21х7.5 см), относительно недорогая и очень функциональная миди-клавиатура. 

 

 

Музыканту: Частоты, которые полезно помнить

Справочные данныеСтатьи о музыке » Полезные музыкальные статьи

Музыканту: Частоты, которые полезно помнить (Памятка для музыканта о частотах)

 

СЕТЬ



Сеть (питание) шумит на частоте 50 Гц (и умножается). Для устранения этого надо убрать частоты 50 и 100 Гц при помощи параметрического эквалайзера, ширина полосы которого достаточно узка. Тогда это не повлияет заметно на общий звук, но устранит шумы сети. Графический эквалайзер (треть октавы) тоже применим в этой ситуации, но остальными типами эквалайзеров лучше для этого не пользоваться, так как они имеют слишком широкую (зону влияния) и регулировка может серьезно изменить звук 6ac-гитары. 

БАС-ГИТАРА



Нижние частоты бас-гитары и бас-барабана лежат в области 40 Гц и менее. Чтобы придать этим звукам мощь (атаку), регулируйте частоту 80 Гц. Многие современные микрофоны, разработанные для бас-барабана, имеют небольшой пик на этой частоте, что позволяет добится хорошего, густого звука. 

При обработке звука некоторых бас-гитар необходимо убрать некоторое количество нижней середины (опять же - не переусердствуйте, иначе получите тонкий нечитаемый бас). Так же, часто необходимо поднять усиление в диапазоне около 2000 герц (значительно больше, чем вам кажется, когда вы находитесь в режиме 
"Соло"). Иногда хорошо бывает поднять "низ" около 40 герц для придания звуку плотной основы. 

ЭЛЕКТРО-ГИТАРА



Нижняя частота электрогитары - 80 Гц. Для устранения бочковатости надо вырезать частоту 200 Гц; для устранения неприятного резкого призвука - ослабить в районе 1 кГц. В любом случае, sweep эквалайзер надо настраивать на слух. Чтобы добиться высокого резкого звука, используйте фильтр плавного нарастания и спада (hi shelving control). Можно также поэкспериментировать с bell equaliser (6 кГц - 10 кГц). Чтобы "добавить яду", сделать "жалящим" звучание рок-гитары, просмотрите область от 1.5 кГц до 4 кГц, найдите нужную частоту и убирайте ее до тех пор, пока атака не станет такой, как нужно. 

Эквализация гитары 

Обычно при обработке звука гитары бывает необходимо лишь украсить его "поднятием" усиления в диапазоне от 3000 до 6000 герц и слегка опустить бубнящие 300 герц. 

АКУСТИЧЕСКАЯ ГИТАРА



Основная проблема с акустическими гитарами, как правило состоит в том, что они звучат бочковато (из-за неподходящих микрофонов, положения микрофона, акустических характеристик помещения - или просто из-за того, что инструмент плохой). Для исправления этого недостатка можно использовать sweep equaliser: 
область "вредной" частоты обычно находится между 200 Гц и 500 Гц; ее надо вырезать. Усиление в области нижней середины скорее всего сделает звук резким, поэтому всегда лучше применять верхний фильтр плавного нарастания и спада, если требуется придать звуку гитары особую яркость. 

ВОКАЛ



Вокал также занимает большую часть частотного диапазона, при этом область 2-4 кГц регулируется для улучшения артикуляции. Стремитесь по возможности избегать большого усиления, так как естественное звучание голоса может быть потеряно. Пользуйтесь верхним фильтром плавного спада и нарастания для придания голосу яркости, если нужно; bell equaliser здесь вряд ли применим. 

Эквализация вокала 

Все голоса отличаются чрезвычайно. Принято не эквализировать вокал при записи по той простой причине, что в будущем будет сложно найти то же самое положение регуляторов при необходимости переписать фрагмент. Это прекрасно потому, что, в любом случае, голоса не эквализируют сильно - наше ухо наиболее чувствительно к звукам, лежащим в СЧ диапазоне, а именно там и находится АЧХ голоса. 
Кроме того, наше ухо очень чувствительно к естественности звучания голоса, голос должен звучать лучше любого звука в мире, поэтому, важно эквализировать вокал как можно скупее - лишь немного убрать 300 герц, и так же немного 3000 - 4000 герц. Подъем АЧХ исходного сигнала в области верхней середины обусловлен не только гармонической структурой, присущей звуку, но, может быть и следствием 
применения при записи дешевого или просто плохого микрофона. Так же полезно использовать ВЧ фильтр с частотой среза 60 герц, что бы избавиться от любых низкочастотных шумов и призвуков. 

УДАРНЫЕ



Эквализация большого барабана 

Звукорежиссеры часто пытаются получить один из трех типов барабанного звука: 
1. "Мертвый глухой стук", характерный для барабанов с одним заглушенным пластиком и тяжелым предметом (кирпич, мешок с песком, основание микрофонной стойки) на корпусе или внутри него, Резонансный звон, получаемый от барабана с двумя пластиками с небольшим отверстием в переднем, "Унылый бум" от барабана с двумя пластиками без отверстий в них, характерный для рэпа, хип-хопа и техно. 
Первые два типа имеют обычно избыток "мутной нижней середины" в районе 300 Hz - вплоть до 10 дБ - и подъем на несколько дБ верхне-средней части АЧХ (5000 - 6000 Hz). Третий тип тоже имеет небольшой избыток "мути" на 300 герцах и значительный подъем АЧХ в нижней части диапазона (от 40 до 100 герц). Можно слегка придавить и "верха", уменьшив тем самым нежелательную атаку звука. 

Эквализация малого барабана 

Звук малого барабана обычно имеет подъем в районе около 5000 - 6000 Hz , и, иногда, небольшой подъем в области 60 - 100 герц позволяющий тонкому барабану звучать "жирнее". Иногда следует "прибрать" усиление на 300 герцах и уменьшить "шлепок" на частотах от 800 до 1000 герц для придания звуку барабана "округлости". 

Эквализация хай-хэта 

Прежде всего, необходимо убрать все, находящееся в нижней и средней части диапазона, что бы избавиться от "мусора", создаваемого бочкой. Если в вашем распоряжении есть фильтр ВЧ, вы можете использовать его, установив значение частоты среза в районе 300 - 700 герц, причем, это не отменяет использование эквалайзера для подавления "мусора" от ударной установки в целом. 
Иногда неплохо добавить суперверха для получения чистого и яркого тембра и уменьшить уровень СЧ в диапазоне от 1000 до 4000 герц. Не забывайте при этом то, что было сказано о полосе пропускания фильтра СЧ - если вы выберете слишком широкую полосу подавления, результатом будет "унылый" шипящий звук. 

Эквализация бас-гитары 

При обработке звука некоторых бас-гитар необходимо убрать некоторое количество нижней середины (опять же - не переусердствуйте, иначе получите тонкий нечитаемый бас). Так же, часто необходимо поднять усиление в диапазоне около 2000 герц (значительно больше, чем вам кажется, когда вы находитесь в режиме 
"Соло"). Иногда хорошо бывает поднять "низ" около 40 герц для придания звуку плотной основы. 

ОБРАБОТКА



Delay 

Самый простой способ определить необходимое время задержки - это подмешать delay к звуку любого инструмента, играющего постоянный паттерн (например, малый барабан), что бы легко услышать соответствие времени задержки темпу исполняемого произведения. Как только вы найдете искомое, можете быть уверены, что все кратные ему значения вам тоже подойдут. Задержка более 100 миллисекунд привносит в произведение легкий романтический шарм и используется преимущественно в медленных песнях с румовым объемом. 
Delay занимает так много места в миксе, что иногда его включают только в конце строки - именно там, где для него есть место и где он может быть слышен. Вы часто могли слышать задержку 60 - 100 миллисекунд, обычно называемую "слэпом" на фонограммах многих артистов, например, Элвиса Пресли. Этот эффект может быть весьма полезен в случаях, когда "тонкий" звук инструмента (особенно голоса) необходимо сделать полнее, или если необходимо скрыть несовершенную вокальную технику. Фактически, слэп может похоронить несовершенство интонирования практически любого инструмента. С другой стороны, слэп может сделать вокал менее персонифицированным. Если ваш вокалист обладает невероятным голосом - избегайте 
задержки, дайте его голосу сиять в атмосфере лишь легкой реверберации. Delay в диапазоне от 30 до 60 миллисекунд обычно называют "удвоение", поскольку он создает эффект, будто бы партия на инструменте была исполнено дважды. "Битлз" использовали удвоение регулярно - для увеличения кажущегося количества 
исполнителей и инструментов. Задержка в диапазоне от 1 до 30 миллисекунд используется для уплотнения обрабатываемого сигнала. Уши и мозг не в состоянии уловить разницу между прямым и отраженным сигналом в случае, когда время задержки менее 30 миллисекунд - в этом случае мы слышим один звук, но как бы 
более плотный. Помимо реверберации, удвоение - один из самых используемых эффектов в студии - возможно, потому, что вообще не воспринимается, как эффект. 
Если вы поместите исходный сигнал в один стереоканал, а задержанный менее, чем на 30 миллисекунд - во второй, получается звук, "растянутый" между динамиками. 

Реверберация 

Реверберация - по сути - многократная задержка. Звук после своего рождения путешествует по стенам комнаты в темпе улитки - около 770 миль в час. Он отражается от стен, пола и потолка и возвращается к нам как сотни маленьких задержек. Все эти задержанные звуки собираются вместе, что бы дать нам тот звук, который мы называем реверберацией. 
Одно основное правило при работе с ревербератором - это установить такое время реверберации, например, на малом барабане, что бы эхо затухало ДО следующего удара в большой барабан. Если соблюдать это правило, звук большого барабана останется чистым и плотным. Это означает, что чем выше темп песни, тем меньше должно быть время реверберации. Хотя, конечно, это правило вполне может нарушаться. 

Компрессор-лимитер 

Звуки часто в той или иной степени компрессируются - это зависит от динамического диапазона исходного звука. Например, почти все акустические инструменты компрессируются в большинстве случаев, а вокал или бас-гитара компрессируются всегда. Многие звукорежиссеры компрессируют звук большого барабана, но если барабанщик действительно хорош и прекрасно управляет громкостью каждого удара, компрессией вполне можно пренебречь. 
Многие инструменты компрессируются только тогда, когда помещаются в микс. Например, крайне редко фортепиано компрессируют само по себе - обычно, это делают, помещая его в микс (особенно, "заполненный" микс). Вышесказанное справедливо и для акустической гитары. Фактически, чем заполненней микс, тем 
больше звуков и отдельных нот компрессировано. Общий уровень компрессии микса более значим, чем уровень компрессии любого из компонентов микса. Однако, независимо от того, каким методом добиваются необходимой глубины компрессии, разные стили музыки требуют индивидуального подхода. 
Например, поп-музыка имеет значительно больший общий уровень компрессии, чем кантри или панк. Это можно услышать, как своего рода "глянец" (который иногда вызван перемодуляцией). По показаниям индикаторов кассетной деки можно оценить уровень общей компрессии музыкального материала. Чем "ленивее" двигаются индикаторы, тем сильнее компрессирован микс. Так что выбор правильного значения 
общей компрессии - за вами, слушайте музыку, сравнивайте, и выбирайте свои собственные значения компрессии в соответствии со своим вкусом. 

МИКС



Когда музыканты жалуются, что смикшированная песня не звучит так, как им бы хотелось (но не знают, почему), часто причиной этого является неправильный уровень громкости какого-то инструмента, помещенного в микс. В этом случае звукорежиссер начинает заново эквализировать треки, изменять применяемые эффекты, что бы удовлетворить группу, хотя реальная причина недовольства 
музыкантов вполне может быть заключена в том, что ритм-гитара звучит слишком громко по отношению к вокалу или неправильно выбран баланс между большим барабаном и бас-гитарой. 
В некоторых случаях, общая громкость микса может изменяться. При этом лучше не использовать мастер-фейдера - исключая, может быть, fade-in в начале микса и fade-out в конце. Плавное появление звука в начале песни создает очень красивую и гладкую динамику произведения в целом. "Битлз" использовали этот прием в "Eight Days a Week.". Мне даже приходилось слышать песни, где общая громкость плавно уменьшается в конце, потом снова возрастает до максимума, после чего снова уменьшается и возрастает опять. Не менее круто слушается эффект, когда общая громкость изменяется в середине песни. Такое изменение общей динамики может быть очень эффективным. 
Вы можете делать и более тонкие динамические нюансы, незначительно изменяя общую громкость микса или отдельных инструментов в разных местах. Например, можно поднять громкость гитары в припеве или поднять уровень малого барабана с эффектом в паузах лидирующей партии. Или в проигрыше в конце песни немного поднимите уровень бас-гитары и большого барабана. Такие маленькие, казалось бы, изменения баланса вполне могут придать дополнительное обаяние для вашего микса. 

Панорамирование 

Если вы правильно используете панорамирование, вы вполне способны получить прозрачный микс с ясно слышимыми инструментами. Но если вы считаете, что какие-либо правила - не для вас, что ж, можете творить. Иногда необычное панорамирование может положительно повлиять на драматургию вашего микса. 
Рассмотрим типичное размещение некоторых инструментов в панораме микса. Но помните - не мешайте самой музыке диктовать свое панорамирование. 
Очень редко случается, когда большой барабан расположен где-нибудь, кроме как в самом центре панорамы, прямо между динамиками. Когда звук размещен в центре между динамиками, вы, вместо одного заставляете оба динамика работать на вас, облегчая тем самым их задачу в передаче плотных звуков - таких, как большой 
барабан или бас-гитара. В случае с большим барабаном это имеет смысл и потому, что он обычно расположен посередине ударной установки. 
Но в случае, когда звучит ударная установка с двумя большими барабанами (double-kick), при их панорамировании может возникнуть интересная дилемма. В зависимости от того, как часто играет второй большой барабан, оба барабана слегка панорамируют - в левый и правый канал. Некоторые звукорежиссеры первый барабан оставляют в центре, а панорамируют только второй. Глубокое панорамирование двух барабанов по каналом обычно не применяется, хотя иногда и к этому можно подойти творчески. 
Малый барабан тоже чаще всего размещают в центре, хотя некоторые звукорежиссеры предпочитают смещать панораму чуть в сторону - особенно при записи джазовой музыки. Но в случае, если звучание малого барабана плотное и сильное, с большим количеством реверберации, предпочтительнее, все же оставить его в центре. Хай-хэт в большенстве случаев помещают со смещением 45 градусов в любую из сторон - это естественное его положение в ударной установке. Однако, если ваш микс заполнен или необходим дополнительный пространственный эффект, допустимо поместить хай-хэт в один из каналов полностью. В музыке хаус или хип-хоп хай-хэт часто не только полностью панорамирован в одну сторону, но и перемещается по панораме в течение песни. Известны случаи, хай-хэт помещен в один канал, а delay от него - во второй. 
Для пущего "кайфа" томы располагают полностью слева и справа, хотя иногда можно поместить их ближе друг к другу - так, как они расположены в барабанной установке. Флор том обычно помещают глубоко сбоку, однако, он вполне может оказаться в центре, по той же причине, почему в центр помещаются большой барабан и бас-гитара - они обладают мощным звуком и привлекают к себе много внимания. 
При записи джазовой музыки бас может располагаться не только в центре, но и быть панорамирован в одну из сторон. 
Почти всегда против правил размещение лидирующего вокала где-либо еще, кроме центра. Если вокал прописан двумя микрофонами, спет дважды или обработан каким-либо эффектом со стереозвучанием, голосовые каналы размещают слева направо - в диапазоне между 11:00 и 01:00. Панорамирование бэк-вокальных треков всегда зависит от вокальной аранжировки. Когда у вас есть только одна партия бэков, вы не можете поместить ее в центре, так как там уже присутствует основной голос. 
Глубокое панорамирование бэк-вокала в одну из сторон тоже является ошибкой, потому что делает ваш мих несбалансированным. 
Солирующее фортепиано обычно записывается стереопарой и панорамируется. Низкие стринги панорамируются налево, высокие - направо - именно так они расположены на фортепианной клавиатуре. Это, вероятно, самое строгое правило панорамирования. Вам лучше застрелить пианиста до записи, чем поместить высокие звуки фортепиано в левый канал! J 
Панорамирование гитар основано на тех же принципах. Часто оно продиктовано необходимостью размещения в миксе "чего нибудь еще" - для уплотнения. В этом случае можно уплотнить звук гитары, стереофонизировав его. Духовые и стринги тоже лучше стереофонизировать. Для этого можно использовать при записи несколько микрофонов, или записать их партию дважды, на разные треки. На худой конец, можно использовать временную задержку. В случае, когда микс достаточно заполнен, эти инструменты не следует максимально разводить по панораме - вполне достаточно будет "частичного стерео" или даже моно. Эффекты, как задержка, флэнжер, хорус фэйзер, гармонайзер, ревербератор могут быть панорамированы независимо от инструментов, от которых эти эффекты произведены. 

И что же в перспективе? 

Все миксы в мире созданы при помощи всего четырех инструментов - громкость, эквализация, панорамирование и эффекты. Все, что вы делаете с ними - это их подбор. Фокус в том, что бы, использовать оборудование для улучшения, подчеркивания, оттенения, создания драматургии, или просто для того, что бы не мешать музыке жить своей жизнью - независимо от стиля самой музыки. И путь создания этого балланса только один - искусство сведения. Как музыканты изучают искусство создания музыки, так и звукорежиссеры должны изучать технологию и имеющееся оборудование, что бы владеть искусством звукозаписи. Разные люди по разному представляют себе, что такое "искусство". Однако, вы сами для себя должны уяснить, что же это такое. И только тогда начинайте творить его! 

 

 

 

Разнообразие цифровых форматов

Справочные данныеСтатьи о музыке » Полезные музыкальные статьи

Разнообразие цифровых форматов (Разнообразие цифровых аудио форматов)


Рассмотрим самые распространенные аудио форматы (большинство из приведённых в списке - с потерей качества): 

AAC (англ. Advanced Audio Coding) — формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC). 

На 2005 год распространён существенно меньше, чем MP3 и другие альтернативные решения. 

AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3. 

Apple AIFF - Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3. 

ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе MiniDisk. 

FLAC (англ. Free Lossless Audio Codec — свободный аудиокодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. 

Существуют модификации FLAC кодера: Improved FLAC encoder и Flake. 

29 января 2003 г. Xiphophorus (сейчас называется Xiph.Org Foundation) анонсировали включение формата FLAC в линейку своих продуктов, таких, как Ogg Vorbis, Theora и Speex. 

FLAC является членом семейства кодеков, разрабатываемых Xiph.Org. К слову, в него же входит известный ogg vorbis – один из лучших lossy-алгоритмов сжатия музыки. В качестве контейнера для аудиоданных используется, разумеется, OGG (файлы с расширением .ogg) и ещё один open-source контейнер – Matroska (файлы с расширением .mka). 

Сразу стоит отметить полную открытость как формата, так и алгоритма FLAC. Они не патентованы, поэтому могут совершенно безвозмездно использоваться в любых программах. Именно этим обусловлена широкая поддержка FLAC в проигрывателях – любой серьёзный плеер имеет плагин для FLAC. Кроме этого существуют аппаратные mp3-плееры с поддержкой кодека FLAC. Полный список программ, работающих с FLAC можно посмотреть здесь. 

Программа-кодировщик FLAC скомпилирована для большинства используемых платформ, так что проблем с совместимостью на альтернативных Windows операционных системах возникнуть не должно. 

FLAC поддерживает теги собственного формата “FlacTags”. Есть возможность кодирования многоканального звука – серьёзное преимущество по сравнению с Monkey’s Audio. Формат поддерживает любые частоты семплирования в диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4-х (!) до 32-х бит. 

Считается, что в сравнении с остальными lossless-кодеками FLAC наиболее эффективно расходует ресурсы системы при раскодировании (воспроизведении) аудио. К сожалению, это достигается за счёт значительного повышения времени кодирования (сжатия). 

Сайт FLAC регулярно обновляется, выходят новые версии кодека. Вообще, по активности развития FLAC безусловно лидирует. Вполне возможно, что в будущем это сделает его основным форматом. Что ж, посмотрим… 

Кодек и его исходные коды на C можно скачать с сайта http://flac.sourceforge.net/ . Плагин для Winamp качаем с http://www.winamp.com/plugins/details.php?id=131643. 

FLAC является оптимальным выбором для хранения музыки в высоком качестве. 

Аппаратно поддерживается во многих устройствах. 

MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов)— стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом. 
В отличие от других форматов, хранит не оцифрованный звук, а наборы команд (проигрываемые ноты, ссылки на проигрываемые инструменты, значения изменяемых параметров звука), которые могут воспроизводиться по-разному в зависимости от устройства воспроизведения. Удобство формата MIDI как формата представления данных позволяет реализовывать устройства, производящие автоматическую аранжировку по заданным аккордам, а также приложения 3D-визуализации звука. Кроме того, такие файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук сравнимого качества. 

Monkey’s Audio — популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и .apl для хранения метаданных. Несмотря на открытый исходный код, Monkey's Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование. 

Аудиофайлы, сжатые кодеком Monkey’s Audio, имеют расширение ‘APE’ – как видите, обезьяны присутствуют не только в логотипе или названии (от английского ape - обезьяна, примат). 

Средний битрейт в аудиофайле составляет 600-700 кбит/с; сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 40-50 % в зависимости от жанра музыки: если классические или джазовые произведения сжимаются самым лучшим образом, то композиции в стиле trash-metal или что-то подобное «электронно шумовое» покажет наихудший результат. Для кодеков с потерями при приемлемом качестве сжатие составляет около 80 %. 

Существуют четыре степени сжатия. Максимальная компрессия может показаться единственно верным решением, даже несмотря на довольно большое время сжатия. Однако нужно учитывать ещё и расход ресурсов системы, воспроизводящей файл, – для максимально сжатого файла он относительно высок. 

Формат .APE обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции. Ещё одним плюсом является проверка целостности файла при раскодировании. Поддерживается восстановление оригинального wav-файла из сжатого .APE. 

Monkey’s Audio имеет графический фронтэнд под Windows, иначе говоря удобную оконную программу для управления процессом кодирования. Остальные кодеки требуют использования командной строки или фронтэндов сторонних разработчиков. Самое приятное, что фронтэнд Monkey’s Audio можно использовать и с другими кодеками – Rkau, Wavpack, Shorten и даже lossy-кодеками mp3 и ogg vorbis. 

Немного о недостатках. Кодек Monkey’s Audio существует только под Windows. Однако на сайте написано, что «версии под Mac и Linux уже разрабатываются». К слову сказать, сам сайт не обновлялся достаточно давно, что не является хорошим признаком. Также отсутствует какая-либо поддержка среди производителей аппаратных плееров. 

Отсутствие кросплатформенности кодека для многих является самым серьёзным минусом Monkey’s Audio. Но шаги по исправлению этого недостатка уже делаются. Стоит упомянуть проект JMAC ( http://sourceforge.net/projects/jmac/ ) по переработке исходных кодов Monkey’s Audio под язык Java. Это позволит использовать кодек на любой ОС без необходимости внесения изменений в исходники и перекомпиляции. 

Кодек является бесплатным. Исходные коды открыты с некоторыми ограничениями. Скачать можно с официального сайта http://www.monkeysaudio.com . Плагин для Winamp берём по ссылке: http://www.winamp.com/plugins/details.php?id=138099. 

MP3 - (формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации. 

Самый популярный формат сжатия на сегодняшний день – это МР3. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат .МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее. 
JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества. 
Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания. 

MP3 Pro - Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций. 

Аудио стандарт MPEG-4 не требует единственного или малого набора высокоэффективных схем компрессии, а скорее сложный набор для выполнения широкого круга операций от кодирования низкокачественной речи до высококачественного аудио и синтезирования музыки. 
Семейство алгоритмов аудио кодирования MPEG-4 охватывает диапазон от кодирования низкокачественной речи (до 2 кБит/с) до высококачественного аудио (от 64 кБит/с на канал и выше). 

OGG Vorbis 

Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к МР3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение .ogg и называется двойным именем Ogg Vorbis. 

На 2006 год распространён существенно меньше, чем MP3. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений. 

Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, дающую лучшую чёткость воспроизведения при равной плотности потока. 

Формат не ограничивает пользователя только двумя аудиоканалами (стерео — левый и правый). Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio. 

К тому же, формат Vorbis — «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно переходит в другой) — в итоге сохранится целостность звука. 

Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов. 

Формат имеет гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками. 

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц. 

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Microsoft Windows, GNU/Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения. 


RAW - Да, это не только формат изображения, в котором пишут фотографии некоторые цифровые камеры. На самом деле, RAW является т.н. «чистой оцифровкой», в которой не содержится заголовка и находится лишь последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном формате. 

Shorten 

Shorten – один из первых появившихся lossless-кодеков. Долгое время проект "спал сладким сном". Однако, в 2007 году, он снова начал развиваться. Взять кодек можно с http://www.etree.org/shnutils/shorten/ 

ТАК - (T)om’s verlustfreier (A)udio(k)ompressor - аудиокодек, формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования. Распространяется бесплатно вместе набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам: Winamp, foobar2000 и др. 

Разработчик — Thomas Becker, Германия. 

Относительно новый кодек. Первая финальная версия 1.0 была опубликована 26 января 2007 года. 

Формат продолжает активно развиваться (последня версия 1.0.3) и в настоящее время, согласно проводимому опросу на форуме hydrogenaudio.org, входит в число трех наиболее популярных форматов аудиосжатия без потерь (после Flac и WavPack). 

TTA (True Audio) - Напоследок о самом интересном. TTA разрабатывается командой наших соотечественников. И, надо сказать, результат их работы впечатляет. Обо всём по порядку. 

Кодек является ещё довольно молодым, но несмотря на это содержит все необходимые возможности. Не будем в очередной раз перечислять их, отметим лишь, что формату не хватает лишь поддержки трансляции аудио через сеть. 

Формат открыт, равно как и исходные коды программы-кодировщика. Существуют скомпилированные версии под Mac и Linux. Проблем с совместимостью при воспроизведении также возникнуть не должно, ибо уже существуют плагины для всех популярных проигрывателей, а также DirectShow фильтры для Windows Media Player. Есть плагин для Adobe Audition, что немаловажно для музыкантов. За последние 4 года даже появилась аппаратная поддержка в плеерах! 

WAV - Он является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format. 

WavPack (расширение .WV) 

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл «коррекции» (.wvc), который (в комбинации с предыдущим .wv) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества. 

Формат имеет очень хорошую поддержку в проигрывателях. Помимо, разумеется, плагина для Winamp с официального сайта кодека http://www.wavpack.com можно закачать плагины для Adobe Audition (!) и Nero Burning Rom. Есть отличный плагин для XMMS – аналога Winamp для Linux. Кроме того существует проект по разработке DirectShow фильтров для WavPack – это позволит использовать формат в любой Windows-программе, в том числе и Windows Media Player. Скачать последнюю версию можно отсюда. Для WavPack существует фронтэнд от сторонних разработчиков. Его качаем тут. 

С технической точки зрения также придраться не к чему. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота семплирования – до 192 кГц (!). 

Формат, как и исходные коды программы для сжатия являются открытыми. К большому сожалению кодер скомпилирован лишь для платформы Windows, однако всегда остаётся возможность самостоятельно перекомпилировать доступные исходные коды для своей операционной системы. 

Сайт, как и сам кодек регулярно обновляются, что не может не радовать. 

Windows Media Audio (WMA) — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации. 
Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. 

WMA Lossless 

Кодек является частью комплекта Windows Media Audio. Он бесплатный, однако формат, равно как и программа для кодирования являются закрытыми. Разумеется, версия существует только для платформы Windows. 

В принципе, WMA Lossless подеерживает все необходимые функции: теги, высокие частоты семплирования, многоканальный звук (включая 7.1), трансляцию аудио через сеть и т.д. Кроме того, встроенная поддержка декодера в Windows Media Player избавляет пользователя от необходимости скачивать что-либо из Интернета для воспроизведения музыкального файла. 

 


 

Скачано с www.znanio.ru