В статье в формате вопросов и ответов представлена важная информация для начинающих музыкантов о свойствах звука, параметрах звукового тракта, методах синтеза и обработки звука, о миди-синтезаторах и т.д.
Для чего применяется создание и обработка звука?
Создание (синтез) звука в основном преследует две цели: имитация различных естественных звуков (шум ветра и дождя, звук шагов, пение птиц и т.п.), а также акустических музыкальных инструментов (имитационный синтез), и получение принципиально новых звуков, не встречающихся в природе (чистый синтез). Обработка звука обычно направлена на получение новых звуков из уже существующих (например, «голос робота»), либо придание им дополнительных качеств или устранение существующих (например, добавление эффекта хора, удаление шума или щелчков). Каждый из методов синтеза и обработки имеет свою математическую и алгоритмическую модель, что позволяет любой из них реализовать на компьютере; однако, многие методы, будучи реализованы точно, требуют слишком большого объема вычислений, отчего их обычно реализуют с какой-либо степенью допущения.
Создание и
обработка звука
Статьи о музыке » Всё о
звуке » Работа со звуком
В статье в формате вопросов и
ответов представлена важная
информация для начинающих
музыкантов о свойствах звука,
параметрах звукового тракта,
методах синтеза и обработки
звука, о мидисинтезаторах и
т.д.
Для чего применяется создание
и обработка звука?
Создание (синтез) звука в
основном преследует две цели:
имитация различныхестественных звуков (шум ветра и
дождя, звук шагов, пение птиц и
т.п.), а также акустических
музыкальных инструментов
(имитационный синтез), и
получение принципиально новых
звуков, не встречающихся в
природе (чистый синтез).
Обработка звука обычно
направлена на получение новых
звуков из уже существующих
(например, «голос робота»), либо
придание им дополнительных
качеств или устранение
существующих (например,
добавление эффекта хора,
удаление шума или щелчков).
Каждый из методов синтеза и
обработки имеет свою
математическую и
алгоритмическую модель, что
позволяет любой из них
реализовать на компьютере;
однако, многие методы, будучи
реализованы точно, требуют
слишком большого объема
вычислений, отчего их обычно
реализуют с какойлибо степенью
допущения.Каковы основные свойства
звука?
Чаще всего в звуке
рассматривается амплитуда и
спектральный состав звукового
колебания, а также их изменение
во времени.
Амплитуда (amplitude)
определяет максимальную
интенсивность колебаний —
громкость (volume) или силу
звука. На осциллограмме
амплитуда представляется
размахом сигнала — наибольшим
и наименьшим относительно
среднего значения уровнями.
Спектральный состав определяет
окраску или тембр звука (timbre).
Любое периодическое колебание
может быть представлено рядом
Фурье — суммой конечного числа
синусоидальных колебаний
(чистых тонов). Спектр звука
представляет собой график
интенсивностей (амплитуд) этихчастотных составляющих,
обозначаемых обычно в виде
вертикальных линий
соответствующей высоты. Спектр
чистого тона имеет только одну
линию, соответстующую его
частоте; спектр любого другого
колебания имеет более одной
линии. Если на спектре звука
имеется достаточно острый пик,
то такой звук воспринимается на
слух как тон соответствующей
высоты, а остальные
составляющие определяют его
окраску; в противном случае звук
воспринимается как
одновременное звучание
нескольких тонов или шум.
Частотные составляющие,
кратные основной частоте тона,
называются гармониками
(harmonics) или обертонами;
гармоники нумеруются, начиная с
самого основного тона (первая
гармоника), а обертоны — с
первой кратной составляющей
(первый обертон — вторая
гармоника и т.д.).Изза особенностей слухового
восприятия высота звука
определяется больше по его
спектральному составу, нежели
по самому основному тону.
Например, субъективная высота
большинства спектрально богатых
низкочастотных звуков
практически не меняется даже
при полном удалении из них
основного тона, который в
слуховом аппарате
восстанавливается по разностным
частотам первых обертонов.
Изменение амплитуды во времени
называется амплитудной
огибающей (envelope) звука — на
амплитудном графике она как бы
огибает график колебания, а
график получается как бы
вписанным в огибающую. Любой
природный звук имеет
огибающую примерно такого
вида:Цифрами обозначены фазы
развития звука, принятые в
акустике:
1 — атака (attack) — начальная
фаза, подъем
2 — остановка (hold) — короткая
стабилизация после подъема
3 — спад (decay) — фаза
перехода звука в установившееся
состояние
4 — удержание (sustain) — фаза
«поддержки»
5 — затухание (release) —
послезвучание
Фаза поддержки имеет место
лишь в том случае, когда
вызвавшее появление звука
воздействие остается постоянным
в течение какогото времени
(например, движение пилы по
металлу или поток воздуха в
духовом инструменте).
Аналогично, имеется понятие
спектральной огибающей —
трехмерный график измененияспектра (и соответственно —
тембра) во времени.
Кроме периодических колебаний
— тонов — рассматриваются
также непериодические
колебания — шумы. Для шума
характерно более или менее
равномерное распределение
интенсивности по спектру, без
явно выраженных пиков или
спадов. В основном различается
два вида шума: белый и розовый.
Белый шум имеет равномерную
спектральную плотность и в
чистом виде в природных звуках
не встречается, однако часто
встречается в электронных
приборах; плотность розового
шума спадает с ростом частоты
(1/f) — это характеристика шума
дождя, прибоя, ветра и прочих
неярко выраженных природных
шумов. Иногда рассматривается
также коричневый шум с
плотностью 1/f^2, быстро
спадающей с ростом частоты —
характеристика, близкая к звукамударного происхождения (гром,
обвал).
Что такое децибел?
Это относительная
логарифмическая единица
измерения величин, связанных с
интенсивностью звука (мощности,
амплитуды, напряжения или тока
сигнала, усиления/ ослабления и
т.п.). Чувствительность слуха
носит логарифмический характер
— нарастание интенсивности в
виде степенной функции
воспринимается на слух как
линейное увеличение громкости,
поэтому в ряде случаев удобее
пользоваться логарифмическими,
а не линейными единицами.
Десятичный логарифм отношения
некоторой величины к ее
эталонному значению — lg (X/Xэ)
— называется белом (Б), а его
десятая часть — lg (X/Xэ) / 10 —
децибелом (дБ). Измерение в
децибелах удобно еще и тем, что
человеческое ухо различает
относительное изменениеинтенсивности примерно на 1 дБ.
При измерениях абсолютной
интенсивности звука (Вт/кв.м.) за
эталонное значение принимается
уровень порога слышимости для
синусоидального сигнала с
частотой 1 кГц — 10 в степени
12 (10E12) Вт/кв.м. При этом
порог слышимости определяется
интенсивностью 0 дБ, а
интенсивность, при которой
начинаются болевые ощущения
(болевой порог) — около 140 дБ.
Интенсивность тихого шепота —
около 35 дБ, громкого голоса —
около 95 дБ, forte fortissimo (fff)
оркестра — около 100 дБ,
оркестрового тутти (звучания
всех инструментов) — около 120
дБ.
При измерениях величин, с
которыми интенсивность связана
квадратичной зависимостью —
напряжения, тока и звукового
давления — в выражении для
децибела множитель 10 меняется
на 20 (двойка выносится излогарифма отношения
квадратов).
При измерениях относительных
величин за эталонный уровень
принимается какоелибо значение
величины. Например, при оценке
усиления за него принимается
единичное усиление (пропускание
сигнала без изменения), равно 0
дБ. При этом 60 дБ
соответствует усилению в 1000
раз (60 = 20 lg 1000), а 20 дБ —
ослаблению в 10 раз. Для
описания характеристик
усилителей и фильтров
применяется также единица
«децибел на октаву» (дБ/окт),
показывающая изменение
усиления при изменении частоты
в два раза.
Какие параметры
характеризуют звуковой тракт?
Звуковым трактом называют
любое устройство,
осуществляющее передачу и/или
преобразование звука. Звуковойтракт характеризуется
следующими параметрами: —
номинальный входной и выходной
уровень (Input/Output Level) —
величина сигнала на входе и
выходе тракта, до которого он
сохраняет указанные параметры.
Указывается в вольтах и обычно
принимается за 0 дБ.
максимальный входной и
выходной уровень —
величина сигнала, до которой
тракт сохраняет
работоспособность. Уровни
сигналов от номинального до
максимального всегда имеют
ненулевой положительный
уровень.
коэффициент усиления —
отношение величины
выходного сигнала ко
входному. Указывается в
разах, процентах или
децибелах.
диапазон частот (Frequency
Response) — частотный
интервал, в котором трактсохраняет свои основные
характеристики. Нуль
подразумевает постоянный
ток.
форма амплитудно
частотной
характеристики (АЧХ) —
график зависимости
амплитуды сигнала на выходе
от его частоты при
неизменной амплитуде
сигнала на входе. Тракты с
горизонтальной внутри
частотного диапазона АЧХ
называют частотно
независимыми.
неравномерность АЧХ —
отклонения графика от
заданной формы.
Указывается в процентах или
децибелах.
уровень шума (Noise Level)
— величина шума
относительно номинального
уровня сигнала. Указывается
в децибелах и всегда имеет
отрицательное значение.Другое название —
соотношение сигнал/шум
(Signal to Noise Ratio, SNR),
которое имеет такое же
положительное значение.
Иногда указывется уровень
шума, приведенный ко входу
— в предположении, что весь
шум поступает только на
вход, а сам тракт
собственного шума не имеет.
коэффициент
гармоник (Total Harmonic
Distortion, THD) — величина
побочных гармонических
составляющих, вносимых
нелинейностью тракта.
Указывается в процентах от
величины сигнала; в ряде
случаев указывается для
различных гармоник (на слух
наибольшие искажения
вносят нечетные гармоники
высших порядков).
уровень
интермодуляционнх
искажений (InterModulationDistortion, IMD) —
относительный уровень
паразитных частотных
компонент, порожденных
взаимной модуляцией
полезных компонент сигнала.
Указывается в процентах от
величины сигнала.
переходное
затухание (Stereo Crosstalk)
— степень ослабления
сигнала при его
проникновении в соседний
стереоканал. Указывается в
децибелах.
динамический
диапазон (Dynamic Range) —
диапазон наибольшего и
наименьшего уровней
сигнала, внутри которых
сохраняются основные
характеристики тракта.
Снизу обычно ограничен
уровнем шума, сверху —
номинальным уровнем,
поэтому часто равенсоотношению сигнал/шум,
однако нелинейность тракта в
ряде случаев не позволяет
выдержать параметры в этих
областях, а это сужает
динамический диапазон.
Какие частотные
характеристики имеет
музыкальный звукоряд?
В основе всех звукорядов лежит
понятие октавы —
звуковысотного диапазона,
частоты крайних звуков которого
различаются вдвое. Музыкальный
звукоряд разбивает октаву на ряд
ступеней (в европейской системе
— двенадцать), которые в любой
октаве имеют одинаковое
название и смысл.
Различаются два основных
музыкальных звукоряда —
натуральный и хроматический.
Натуральный строится изобертонов базового звука,
сведенных в одну октаву,
хроматический основан на
равномерном делении октавы на
двенадцать ступеней.
Соотношения частот
натурального звукоряда
представляют собой
рациональные дроби, что
соседние ступени хроматического
отличаются в корень 12 степени
из двойки — примерно в 1.059
раза. Опорным звуком принято
считать ноту Ля первой октавы —
440 Гц.
Использование натурального
звукоряда позволяет получить
более слитные (консонасные)
созвучия, однако
неравномерность его ступеней
затрудняет транспонирование
музыки на интервалы, не кратные
октаве. Хроматический звукоряд
не дает таких слитных созвучий,
однако изза равномерности
ступеней получил
преимущественное
распространение.Какие методы используются
для синтеза звука?
1. Аддитивный (additive).
Основан на утверждении Фурье о
том, что любое периодическое
колебание можно представить в
виде суммы чистых тонов
(синусоидальных колебаний с
различными частотами и
амплитудами). Для этого нужен
набор из нескольких
синусоидальных генераторов с
независимым управлением,
выходные сигналы которых
суммируются для получения
результирующего сигнала. На
этом методе основан принцип
создания звука в духовом органе.
Достоинства метода: позволяет
получить любой периодический
звук, и процесс синтеза хорошо
предсказуем (изменение
настройки одного из генераторов
не влияет на остальную часть
спектра звука). Основной
недостаток — для звуковсложной структуры могут
потребоваться сотни генераторов,
что достаточно сложно и дорого
реализовать. Для снижения
стоимости реализации вместо
набора отдельных генераторов
(реальных или математических)
применяется обратное
преобразование Фурье.
2. Разностный (subtractive).
Идеологически противоположен
первому. В основу положена
генерация звукового сигнала с
богатым спектром (множеством
частотных составляющих) с
последующей фильтрацией
(выделением одних составляющих
и ослаблением других) — по
этому принципу работает речевой
аппарат человека. В качестве
исходных сигналов обычно
используются меандр
(прямоугольный, square), с
переменной скважностью
(отношением всего периода к
положительному полупериоду),
пилообразный (saw) — прямой и
обратный, и треугольный(triangle), а также различные виды
шумов (случайных
непериодических колебаний).
Основным органом синтеза в этом
методе служат управляемые
фильтры: резонансный
(полосовой) — с изменяемым
положением и шириной полосы
пропускания (band) и фильтр
нижних частот (ФНЧ) с
изменямой частотой среза
(cutoff). Для каждого фильтра
также регулируется добротность
(Q) — крутизна подъема или
спада на резонансной частоте.
Достоинства метода —
относительно простая реализация
и довольно широкий диапазон
синтезируемых звуков. На этом
методе построено множество
студийных и концертных
синтезаторов (типичный
представитель — Moog).
Недостаток — для синтеза звуков
со сложным спектром требуется
большое количество управляемых
фильтров, которые достаточно
сложны и дороги.3. Частотномодуляционный
(frequency modulation — FM). В
основу положена взаимная
модуляция по частоте между
несколькими синусоидальными
генераторами. Каждый из таких
генераторов, снабженный
собственными формирователем
амплитудной огибающей,
амплитудным и частотным
вибрато, именуетчся оператором.
Различные способы соединения
нескольких операторов, когда
сигналы с выходов одних
управляют работой других,
называются алгоритмами синтеза.
Алгоритм может включать один
или больше операторов,
соединенных последовательно,
параллельно, последовательно
параллельно, с обратными
связями и в прочих сочетаниях —
все это дает практически
бесконечное множество
возможных звуков.
Благодаря простоте цифровой
реализации, метод получилширокое распространение в
студийной и концертной практике
(типичный представитель класса
синтезаторов — Yamaha DX).
Однако практическое
использование этого метода
достаточно сложно изза того, что
бОльшая часть звуков,
получаемых с его помощью,
представляет собой
шумоподобные колебания, и
достаточно лишь слегка изменить
настройку одного из генераторов,
чтобы чистый тембр превратился
в шум. Однако метод дает
широкие возможности по синтезу
разного рода ударных звуков, а
также — различных звуковых
эффектов, недостижимых в
других методах разумной
сложности.
4. Самплерный (sample —
выборка). В этом методе
записывается реальное звучание
(сампл), которое затем в нужный
момент воспроизводится. Для
получения звуков разной высоты
воспроизведение ускоряется илизамедляется; при неизменной
скорости выборки применяется
расчет промежуточных значений
отсчетов (интерполяция). Чтобы
тембр звука при сдвиге высоты не
менялся слишком сильно,
используется несколько записей
звучания через определенные
интервалы (обычно — через одну
две октавы). В ранних
самплерных синтезаторах звуки в
буквальном смысле записывались
на магнитофон, в современных
применяется цифровая запись
звука.
Метод позволяет получить сколь
угодно точное подобие звучания
реального инструмента, однако
для этого требуются достаточно
большие объемы памяти. С
другой стороны, запись звучит
естественно только при тех же
параметрах, при которых она
была сделана — при попытке,
например, придать ей другую
амплитудную огибающую
естественность резко падает.Для уменьшения требуемого
объема памяти применяется
зацикливание сампла (looping). В
этом случае записывается только
короткое время звучания
инструмента, затем в нем
выделяется средняя фаза с
установившимся (sustained)
звуком, которая при
воспроизведении повторяется до
тех пор, пока включена нота
(нажата клавиша), а после
отпускания воспроизводится
концевая фаза.
На самом деле этот метод нельзя
с полным правом называть
синтезом — это скорее метод
записивоспроизведения. Однако
в современных синтезаторах на
его основе воспроизводимый звук
можно подвергать различной
обработке — модуляции,
фильтрованию, добавлению новых
гармоник, звуковых эффектов, в
результате чего звук может
приобретать совершенно новый
тембр, иногда совсем непохожий
на первоначальный. По сути,получается комбинация трех
основных методов синтеза, где в
качестве основного сигнала
используется исходное звучание.
Типичный представитель этого
класса синтезаторов — Emu
Proteus.
5. Табличноволновой (wave
table). Разновидность
самплерного метода, когда
записывается не все звучание
целиком, а его отдельные фазы —
атака, начальное затухание,
средняя фаза и концевое
затухание, что позволяет резко
снизить объем памяти, требуемый
для хранения самплов. Эти фазы
записываются на различных
частотах и при различных
условиях (мягкий или резкий
удар по клавише рояля, различное
положение губ и языка при игре
на саксофоне и т.п.), в результате
чего получается семейство
звучаний одного инструмента.
При воспроизведении эти фазы
нужным образом составляются,что дает возможность при
относительно небольшом объеме
самплов получить достаточно
широкий спектр различных
звучаний инструмента, а главное
— заметно усилить
выразительность звучания,
выбирая, например, в зависимости
от силы удара по клавише
синтезатора не только нужную
амплитудную огибающую, как
делает любой синтезатор, но и
нужную фазу атаки.
Основная проблема этого метода
— в сложности сопряжения
различных фаз друг с другом,
чтобы переходы не
воспринимались на слух и
звучание было цельным и
непрерывным. Поэтому
синтезаторы этого класса
достаточно редки и дороги.
Этот метод также используется в
в синтезаторах звуковых карт
персональных компьютеров,
однако его возможности там
сильно урезаны. В частности,почти нигде не применяют
составление звука из нескольких
фаз, сводя метод к простому
самплерному, хотя почти везде
есть возможность параллельного
воспроизведения более одного
сампла внутри одной ноты.
6. Метод физического
моделирования (physical
modelling). Состоит в
моделировании физических
процессов, определяющих
звучание реального инструмента
на основе его заданных
параметров (например, для
скрипки — порода дерева, состав
лака, геометрические размеры,
материал струн и смычка и т.п.).
В связи с крайней сложностью
точного моделирования даже
простых инструментов и
огромным объемом вычислений
метод пока развивается медленно,
на уровне студийных и
экспериментальных образцов
синтезаторов. Ожидается, что с
момента своего достаточного
развития он заменит известныеметоды синтеза звучаний
акустических инструментов,
оставив им только задачу синтеза
не встречающихся в природе
тембров.
7. (Alexander Grigoriev)
WaveGuide технология, активно
pазpабатываемая в Стэнфоpдcком
Унивеpcитете и пpименяемая yже
в неcкольких пpомышленных
моделях электpонных pоялей,
напpимеp, фиpмы Baldwin.
Пpедcтавляет cобой
pазновидноcть физичеcкого
моделиpования, пpи котоpой
моделиpyетcя pаcпpоcтpанение
колебаний, пpедcтавленных
диcкpетными отcчетами, по
cтpyне (одномеpное
моделиpование) и по pезонанcным
повеpхноcтям (двyмеpное
моделиpование) или в объемном
pезонатоpе (тpехмеpное). Пpи
этом появляетcя возможноcть
моделиpовать также нелинейные
эффекты, напpимеp yдаp
молоточка и каcание cтpyны
демпфеpом, а также взаимнyюcвязь cтpyн и cвязь
гоpизонтальной и веpтикальной
мод.
Какие методы используются
для обработки звука?
1. Монтаж. Состоит в вырезании
из записи одних участков, вставке
других, их замене, размножении и
т.п. Называется также
редактированием. Все
современные звуко и
видеозаписи в той или иной мере
подвергаются монтажу.
2. Амплитудные
преобразования. Выполняются
при помощи различных действий
над амплитудой сигнала, которые
в конечном счете сводятся к
умножению значений самплов на
постоянный коэффициент
(усиление/ослабление) или
изменяющуюся во времени
функциюмодулятор
(амплитудная модуляция).
Частным случаем амплитудноймодуляции является
формирование огибающей для
придания стационарному
звучанию развития во времени.
Амплитудные преобразования
выполняются последовательно с
отдельными самплами, поэтому
они просты в реализации и не
требуют большого объема
вычислений.
3. Частотные (спектральные)
преобразования. Выполняются
над частотными составляющими
звука. Если использовать
спектральное разложение —
форму представления звука, в
которой по горизонтали
отсчитываются частоты, а по
вертикали — интенсивности
составляющих этих частот, то
многие частотные преобразования
становятся похожими на
амплитудные преобразованиям
над спектром. Например,
фильтрация — усиление или
ослабление определенных полос
частот — сводится к наложениюна спектр соответствующей
амплитудной огибающей. Однако
частотную модуляцию таким
образом представить нельзя —
она выглядит, как смещение всего
спектра или его отдельных
участков во времени по
определенному закону.
Для реализации частотных
преобразований обычно
применяется спектральное
разложение по методу Фурье,
которое требует значительных
ресурсов. Однако имеется
алгоритм быстрого
преобразования Фурье (БПФ,
FFT), который делается в
целочисленной арифметике и
позволяет уже на младших
моделях 486 разворачивать в
реальном времени спектр сигнала
среднего качества. При частотных
преобразованиях, кроме этого,
требуется обработка и
последующая свертка, поэтому
фильтрация в реальном времени
пока не реализуется на
процессорах общего назначения.