УДК 5.10.3

Улучшение динамических характеристик музыкальной фонограммы. Методы борьбы с перекомпрессией

Таранов Дмитрий Дмитриевич – кандидат технических наук, главный звукорежиссер Ансамбля Донских Казаков им. А. Квасова.

Аннотация: В данной статье предлагаются критерии выбора и настройки компрессоров аудиосигнала с целью улучшения динамических характеристики фонограммы и борьбы с перекомпрессией. Приводится методика выбора типа компрессии для различных видов аудиосигналов. Также рассматриваются подходы к настройке различных компрессоров в зависимости от целей и задач обработки данных сигналов в контексте избежания перекомпрессии. Предлагаемая методика применима при обработке как музыкальных, так и прочих аудиосигналов в разнообразных сферах их применения.

Ключевые слова: звукорежиссура, компрессия, перекомпрессия, временная характеристика, динамическая обработка, цифровая обработка сигналов.

Динамические характеристики являются основополагающим элементом оценки фонограммы по таким критериям как музыкальный баланс, прозрачность и даже исполнение. В контексте сведения музыкальных фонограмм динамика имеет прямое отношение к варьированию уровня громкости как отдельных инструментов и голосов, использованных в аранжировке, так и фонограммы в целом. В этом вопросе особенное значение имеет понятие динамического диапазона, характеризующее разницу между наименьшим и наибольшим значением амплитуды отдельных сигналов в фонограмме, а также самой фонограммы. Для удобства уровни звука, равно как и динамические вариации, принято изменять в децибелах (дБ), которые зачастую воспринимается неопытными звукорежиссерами как некоторая абсолютная единица измерения громкости, и именно на данном этапе начинается накопление ошибок сведения, ведущих к перекомпрессии. Использования шкалы дБ – логарифмический способ описания отношения двух величин, при этом их абсолютные единицы измерения совершенно не важны. Предположим, что у нас есть два громкоговорителя, первый воспроизводит звук с мощностью P1, а другой воспроизводит тот же самый звуковой сигнал, но с мощностью P2, при прочих равных условиях (расстояние, частота и т.д.). Используя шкалу дБ разница в уровне громкости между ними определяется как f1, т.е. значение громкости в дБ показывает не абсолютное значение громкости того или иного акустического сигнала, а разницу уровня данного сигнала с некоторым опорным его значением в логарифмическом масштабе. Непонимание сути измерения уровней сигналов является первым шагом к перекомпрессии, частным случаем которой является чрезмерное злоупотребление компрессией, т.е. слишком большое значение сжатия динамического диапазона сигнала посредством применения компрессора. Однако, у данного явления имеется большее количество причин, и бороться с ними следует далеко не только методом количественного уменьшения уровня сжатия сигнала; например, сигнал электрогитары с большим количеством нелинейных искажений (т.н. «гейна») подвергается перекомпрессии уже при значении сжатия в 2-3 дБ. Очевидно, что такое значение сжатия нельзя назвать большим, однако явление перекомпрессии наблюдается в данном случае совершенно отчетливо. Для понимания его сущности следует абстрагироваться от исторически первоначальной сферы применения компрессии – физического сокращения динамического диапазона. С одной стороны, действительно, исторически суть компрессии заключалась в ограничении динамического диапазона фонограммы с целью воспроизвести ее через акустическую систему, не обладающую большим динамическим диапазоном. В отличие от человеческого слуха, имеющего большой динамический диапазон – порядка 140 дБ от слухового до болевого порога – динамический диапазон даже современной звукозаписывающей и звуковоспроизводящей аппаратуры имеет гораздо более скромные показатели. Разумеется, данный фактор был более актуален в 30-е годы прошлого столетия, в период зарождения динамических приборов обработки как отдельного типа звукоорабатывающих приборов. Однако, эволюция звукорежиссуры как дисциплины привела к расширению сфер применения компрессии, и для понимания сути перекомпрессии стоит изначально обратиться к таким понятиям как макро- и микродинамика аудиосигнала, а также к анатомии временной огибающей аудиосигнала. Также стоит уделить внимание типам измерителей уровня, которые задействуются при измерении динамических характеристик данного сигнала.

Типы измерителей уровня сигнала

В контексте современной звукорежиссуры принято выделять два основных типа измерителей уровня сигнала: пиковый и среднеквадратический. Однако, стоит упомянуть еще один тип: VU-метр. Применение любых измерителей уровня так или иначе преследует одну цель: непосредственное измерение уровня сигнала, что очевидно из названия прибора, однако, у каждого из них варьируются временные характеристики (т.н. «баллистика»), что выражается в том насколько быстро тот или иной измеритель реагирует на изменение уровня сигнала (громкости). По аналогии с компрессорами, можно провести параллель между данным свойством измерителей уровня и атакой компрессора – т.е. временем реагирования на входной сигнал. Продолжая данную аналогию, время, которое требуется индикатору измерителя тождественно времени релиза компрессора.

Пиковые измерители уровня показывают мгновенное значение сигнала в данный конкретный момент времени. Такими измерителями уровня, например, являются встроенные в практически любой современный секвенсор. Эти измерители по принципу своей работы мгновенно реагируют на сигнал и улавливают все быстрые переходные процессы, что может быть информативно в случае с инструментами с ярко выраженными транзиентами, например, с ударными или перкуссией. Также подобные приборы способны точнее отображать клиппирование сигнала ввиду большой скорости своей работы.

RMS- (root mean square) измерители уровня представляют собой инструмент измерения среднеквадратического уровня сигнала в пределах заданного временного окна. Отображаемое значение является усредненным значением аудиосигнала на заданном временном отрезке, вычисляемым через простое выражение f2, где T1 и T2 представляют временные отсчеты, в пределах которых ведется измерение. Размер временного окна выбирается пользователем при постериорном анализе (предпочтительно), либо он может быть предустановлен алгоритмом измерителя уровня для работы в реальном времени, что, разумеется, является менее точным способом измерения среднеквадратического значения уровня сигнала на длительных временных отрезках.

 Компромиссным решением между пиковыми и RMS-измерителями уровня сигнала являются VU-метры, по факту предоставляющие собой RMS-измерители уровня с достаточно небольшим временным окном – порядка 300 мс. Относительно небольшое время реагирования позволяет более быстрым переходным процессам пройти, прежде чем VU-метр отреагирует на сигнал и покажет его значение. Благодаря этим характеристикам VU-метр с одной стороны отображает достаточно точное значение при измерении общего уровня музыкального материала, а с другой стороны его инертность позволяет расценивать его показания как громкостные в переделах небольшого временного окна. Изначально, технически он и был разработан как своего рода измеритель громкости, а не как измеритель пиковых значений сигнала.

Понятия макро- и микродинамики в контексте компрессии

Макродинамика учитывает значительные громкостные перепады во временной характеристике инструмента, голоса или целой фонограммы. Технически, понятие макродинамики в равной степени имеет отношение как к композитору или исполнителю, так и к звукорежиссеру. Характеризуется данное понятие значительными изменениями динамического диапазона в пределах заданного временного окна данного аудиосигнала. В строго музыкальной сфере изменения макродинамики сигнала, как правило, маркируется динамическими обозначениями: forte (f) – громко, сильно, piano (p) – тихо, слабо, mezzo forte (mf) – умеренно громко и т.д. В сфере звукорежиссуры воспринимать макродинамику стоит сходным образом: это глобальное изменение динамических характеристик сигнала в сторону увеличения или уменьшения в пределах большого временного окна.

Микродинамика характеризуется в первую очередь варьированием транзиентов (атак) аудиосигнала в пределах заданной макродинамики. Например, в эстрадной композиции в переделах аналогичных ее частей (условных припевов) макродинамика акустического малого барабана, записанного посредством микрофона в процессе непосредственного исполнения партии музыкантом, с наибольшей долей вероятности меняться не будет, однако это совершенно не означает что атаки малого барабана будут совершенно одинаковыми, более того, данное наблюдение применимо и по отношению к абсолютному большинству современных сэмплерных библиотек акустических инструментов (далеко не только ударных), т.к. они включают в себя алгоритмы рандомизации (последовательного воспроизведения различных сэмплов в переделах заданной макродинамики) и даже физического моделирования. На рис.1 показана временная характеристики малого барабана, полученного из барабанного сэмплера Steven Slate Drums 5.5 при значении velocity каждого удара в 100 единиц.

1

Рисунок 1. Временная характеристика четырех идентично триггированных ударов малого барабана из SSD 5.5.

Как видно из рисунка, форма атак всех четырех ударов малого барабана при сходной амплитуде отличается. Из данного наблюдения можно сделать следующий вывод: макродинамика в первую очередь характеризуется понятием динамического диапазона аудиосигнала, в то время как для оценки микродинамики гораздо важнее крест-фактор, представляющий собой разницу между пиковым и RMS-уровнями сигнала. Учитывая данную закономерность логично предположить, что основной причиной перекомпресии является не столько большое значение сжатия сигнала, сколько нивелирование разницы между атаками соседних громких транзиентов инструмента или голоса.

Исходя из этой закономерности стоит выделить следующие критерии борьбы с перекомпрессией, исключая очевидный критерий варьирования порога сжатия:

  1. Тип применяемого компрессора
  2. Настройки огибающей сжатия
  3. Настройка параметра ratio
  4. Настройка колена компрессии

Выбор типа применяемого компрессора.

Поскольку компрессор – это усилитель с переменным коэффициентом усиления, который меняется в зависимости от уровня входного сигнала, основные отличия между разными типами компрессии заключаются в первую очередь в характере работы цепи ослабления входного сигнала. Часть цепи, отвечающая за ослабление входного сигнала, называется GRC (Gain Reduction Controller – контроллер изменения уровня), и основываясь на схемотехнических решениях, которые определяют поведение компрессора в этой конкретной схемотехнической части принято разделять следующие типы компрессоров:

  • FET;
  • Оптические;
  • Variable-MU;
  • VCA.

Максимально важно априорно выбрать тип требуемого компрессора для последующего его применения на соответствующем источнике звукового сигнала, в противном случае характер работы компрессора может негативным образом сказаться на микродинамике компрессируемого сигнала, вызвав таким образом перекомпрессию даже при небольших значениях сжатия.

FET-компрессоры известны своим быстрым временем реагирования на изменение параметров входного сигнала, а также внесением значительного количества нелинейных искажений (транзисторной сатурации), в этой связи они лучше всего подходят для динамичных сигналов с умеренным или малым содержанием НЧ-составляющей. К примеру, максимальное время атаки одного из наиболее распространенных FET-компрессоров – 1176 от Universal Audio – составляет 800 мкс, однако при этом частая ошибка его применения – использование его на инструментах, содержащих большое количество НЧ-составляющих, таких как большой барабан или контрабас. На примере контрабаса, при стандартном строе самая низкая нота, которую способен воспроизвести данный инструмент – ми контроктавы – 41 Гц, и несмотря на то, что формантная область начинается у контрабаса несколько выше – примерно от 70 Гц, более низкий частотный диапазон также участвует в темброформирвании контрабаса. При этом период звуковой волны на частоте 41 Гц – порядка 24,39 мс, что значительно превышает максимальное время атаки 1176, как и всех FET-компрессоров, а следовательно данный тип компрессии не будет иметь возможности в полной мере отрабатывать микродинамику контрабаса, как и многих других инструментов, тембр которых тяготеет к НЧ-составляющей и практически мгновенно приведет к перекомпрессии. Безусловно, максимальное время атаки 1176 ощущается несколько больше, чем примерно 1 мс, однако, в данном случае разница длины волны более чем на порядок делает невозможным применение данного типа компрессии на подобного рода инструментах, что наглядно показано на рис.2, на котором изображены два идентичных фрагмента исполнения контрабаса (сыгранная пиццикато нота ми контроктавы) без компрессии и с применением плагина 1176LN RevE от Universal Audio с максимальным значением атаки, минимальным значением релиза, ratio 4:1 и сжатием на 4 дБ.

2

Рисунок 2. Необработанный сигнал контрабаса (слева) и идентичный сигнал после обработки Universal Audio 1176 (справа).

На рисунке отчетливо видна перекомпрессия в виде нивелированной атаки контрабаса, притом, что компрессию в 4 дБ крайне сложно назвать экстремальной.

Оптические компрессоры известны использованием физического источника света и фоторезистора для изменения уровня выходного напряжения в случае использования физических приборов. Наиболее частыми в эмпирической оценке характеристики работы оптических компрессоров являются две ошибки: во-первых, зачастую их называют «ламповыми компрессорами», в данном случае очевидна путаница в понятиях «лампа накаливания» и «радиолампа», не имеющих друг с другом практически ничего общего, т.к. лампа накаливания – источник света, а радиолампа – усилительный элемент. Например, известные компрессоры Teletronix LA-2A и LA-3A, выпускаемые компанией Universal Audio, оба являются оптическими компрессорами, однако LA-2A имеет ламповую топологию, а LA-3A – транзисторную. Во-вторых, зачастую имеет место непонимание принципа работы физического источника света в оптических компрессорах. Неверным является то предположение что поскольку скорость света очень велика, то и скорость реакции оптического компрессора на входной сигнал будет столь же большой. Однако на практике, даже если эмпирически представить, как загорается или погасает лампа накаливания становится очевидно, что переходный период у нее крайне велик, следовательно, и фоторезистор, который освещается лампой, будет иметь большее время срабатывания. Учитывая вышесказанное, в большей степени при обработке аудиоматериала стоит обращать внимание на время релиза оптического компрессора, т.к. медленное время его атаки, очевидно, делает его непригодным для обработки сигналов, фронт волны которых меняется слишком быстро, например, динамичных вокалов, интенсивных перкуссивных партий и т.д. Однако, например, у вышеупомянутого LA-2A время релиза может длиться до 15 с (данный параметр варьируется, т.к. LA-2A является программно-зависимым компрессором), что исключает его применение на чрезмерно динамичном музыкальном материале с часто варьирующимися транзиентами, т.к. компрессор ввиду своего длинного релиза не будет успевать их отрабатывать. Также отдельно стоит упомянуть такую особенность оптических компрессоров как наличие подстроечного резистора, отсекающего НЧ-составляющую сигнала, попадающего в цепь детектора компрессора. Таким образом компрессор реагирует на сигнал, не учитывая НЧ-фронт волны, приходящий в него, при этом компрессируя весь диапазон частот входного сигнала, что также крайне положительно сказывается на борьбе с перекомпрессией, как показано на рис.3.

3

Рисунок 3. LA-2A применительно к большому барабану с различными положениями подстроечного резистора: крайним правым (слева) и крайним левым (справа).

На рисунке изображены два идентичных сэмпла большого барабана, первый из которых обработан плагином LA-2A Gray от Universal Audio с крайним правым положением подстроечного резистора, а второй, соответственно, – с крайним левым. Уровень сжатия сигнала в обоих случаях составляет 4 дБ. Из рисунка очевидно, что атака во втором случае выглядит гораздо более естественно, что также положительно сказывается на борьбе с перекомпрессией сигнала. Стоит также отметить, что несмотря на то, что подстроечный резистор – схемотехническое решение, впервые появившееся в оптических компрессорах, на сегодняшний день его можно видеть в огромном количестве компрессоров всевозможных видов и топологий.

Variable-MU-компрессоры исторически являются первыми компрессорами в истории обработки аудиосигналов, и понимание этого факта – ключ к сфере применения данного типа компрессоров. Исторически этот тип компрессоров использовался строго для ограничения динамического диапазона сигнала по причинам, упомянутым выше. В этой связи Variable-MU-компрессоры при общем сокращении динамического диапазона минимальным образом аудиально вмешиваются в огибающую сигнала, что делает их наиболее прозрачными с точки зрения непосредственной компрессии, в связи с чем их применение даже в режиме достаточно большого сжатия не приводит к потере микродинамики. Однако, поскольку гибкой работы с огибающей сигнала данный тип компрессии не производит, ему несвойственно существенное выделение транзиентов сигнала, зато ввиду своей топологии (очевидно, что Variable-MU-компрессоры используют качестве усилительных элементов радиолампы) данный тип компрессоров вносит характерные нелинейные искажения в компрессируемый сигнал. К примеру, один из классических Variable-MU-компрессоров Fairchild 670 содержит 20 радиоламп, что, разумеется, сказывается на тембральной окраске исходного сигнала. В итоге, сфера применения Variable-MU-компрессоров в первую очередь касается использования их на подгруппах, включая мастер-шину, если стилистика обрабатываемого аудиоматериала располагает к подобному характеру компрессии, а также на динамичных источниках звукового сигнала зачастую для существенной, однако при этом незаметной компрессии с минимальной вероятностью перекомпрессии и в первом, и во втором случае.

VCA расшифровывается как Voltage Controlled Amplifier (усилитель, управляемый напряжением), то есть, технически, все компрессоры за исключением оптических попадают под категорию VCA. Однако, с течением времени стало принято называть VCA определенный тип компрессоров, которые используют т.н. интегрированную цепь, или IC, которая представляет собой готовое схемотехническое решение в виде микросхемы, в которую уже вшита цепь транзисторов, например, как небезызвестная THAT Corp 2180 VCA IC. Поскольку количество искажений, вносимое в обрабатываемый сигнал VCA-компрессорами, минимально, а вариативность настроек параметров крайне велика, наибольшее влияние на критерий перекомпрессии при использовании данного типа компрессоров оказывают именно настройки компрессии, в частности, настройки огибающей.

Настройки огибающей сжатия

Из раздела статьи, посвященному FET-компрессии, очевидно, что слишком малое время атаки негативно сказывается на возможности перекомпрессии, из чего можно сделать вывод что время атаки следует выбирать тождественно длине транзиентов исходного аудиосигнала, что достигается либо выбором типа компрессии, либо настройкой параметра атаки (чаще всего это актуально для VCA-компрессоров). Однако, с настройкой времени релиза ситуация обстоит несколько сложнее. Время релиза – это время, которое требуется сигналу для перехода из сжатого или ослабленного состояния обратно в исходный несжатый сигнал. Время релиза, как правило, ощутимо больше, чем время атаки, обычно от 40-60 мс до 2-5 с, в зависимости от обрабатываемого сигнала. Нормальный режим работы компрессора заключается в том, чтобы установить относительно короткое время восстановления без создания эффекта «пампинга», который вызывается циклической активацией и деактивацией сжатия, что, разумеется, сказывается на перекомпрессии. На рис.4 показываются 4 идентичных удара по малому барабану с различными настройками огибающей компрессии.

4

Рисунок 4. Временная характеристика идентичных сэмплов малого барабана, обработанных VCA-компрессором с различными настройками огибающей.

В качестве компрессора в данном эксперименте был использован VCA-компрессор FG-401 от Slate Digital с ratio 4:1 и уровнем сжатия 6 дБ. Сэмплы расположены в следующем порядке слева направо: несжатый сигнал, минимальная атака – минимальный релиз, минимальная атака – максимальный релиз, максимальная атака – максимальный релиз. Из данного эксперимента очевидно, что даже такой простой сигнал как удар малого барабана крайне чувствителен к настройкам огибающей, в частности, к значению релиза. В данном случае учитывая, что для оценки микродинамики важен крест-фактор, наиболее правильным будет настраивать время релиза компрессора по показаниям VU-метра, который наиболее тождественен громкостным характеристикам обрабатываемого сигнала. Цель настройки релиза в таком случае – возвращение стрелки VU-метра в изначальное положение до попадания в цепь обработки компрессора следующего громкого транзиента. Данная методика настройки релиза позволяет с большой степенью вероятности избежать перекомпрессии.

Настройка параметра Ratio и колена сжатия

Как известно, параметр ratio показывает множитель ослабления сигнала, превышающего пороговое значение, установленное в компрессоре. В этой связи чем больше значение данного параметра – тем больше крест-фактор аудиосигнала и тем выше вероятность перекомпрессии, однако в пределах значений ratio от 1,5:1 до 4:1 данная закономерность не является ярко выраженной. Значительное стремление к перекомпрессии наблюдается при увеличении данного параметра от 5:1 до ∞:1, однако, даже в случае сравнительно больших значений ratio эффект перекомпрессии нивелируется формой колена компрессии, жесткость которого исчисляется параметром span, который измеряется в дБ и считается как проекция кривизны колена на горизонтальную ось графика компрессии, т.е. на ось уровня входного сигнала (см. рис.5). Чем больше параметр span – тем мягче колено, и тем ниже риск перекомпрессии при обработке аудиосигнала.

5

Рисунок 5. Различные значения параметра ratio при жестком и мягком колене сжатия.

Стоит отметить, что далеко не все компрессоры на рынке предлагают варьируемый параметр жесткости колена сжатия, однако, данный параметр можно учитывать при выборе типа компрессии, либо конкретного компрессора. Например, FET-компрессоры отличаются исключительно жестким коленом сжатия, а Variable-MU-компрессоры – напротив, мягким.

Данная статья опирается как на теоретические основы звукорежиссуры, так и на практическую их реализацию. Описанные в статье критерии выбора и настройки компрессоров позволяют значительно улучшить динамические характеристики фонограммы и с большой степенью вероятности избежать перекомпрессии при обработке аудиоматериала.

Список литературы

  1. Katz, B., Mastering Audio, the Art and Science // Focal Press. – 2007. – 336 p.
  2. Fletcher, H., Munson, W.A., 3. Loudness, Its Definition, Measurement and Calculation // J. Acoust. Soc. – 1933. – 5(2), pp. 820-108.
  3. Skovenborg, E., Measures of Microdynamics [электронный ресурс] // 2014. – Режим доступа: http://www.aes.org/e-lib/browse.cfm?elib=17464 – Загл. с экрана. – Яз. англ.
  4. Toulson, E.R., Campbell, W., The life and death of dynamic range: who decides how loud? // The Art of Record Production Conference, Cardiff, Wales. – 2009.
  5. Rossing, T. D. The Science of Sound. Second Edition // Addison-Wesley Publishing Company, Inc. – 1990. ­– 686 p.
  6. McNally, G. W., Dynamic Range Control of Digital Audio Signals // J. Audio Eng. Soc. – 1984. – vol. 32(5). – pp.316-327.
  7. Stikvoort E. F., Digital Dynamic Range Compressor for Audio // J. Audio Eng. Soc. – 1986. – vol. 34(1/2). – pp.3-9
  8. Le Bagousse, S., Paquier, M., Colomes, C, Categorization of Sound Attributes for Audio Quality Assessment // J. Audio Eng. Soc. – 2014. – 62(11). – pp. 736-747.
  9. Joshua, J., Secrets Of The Mix Engineers: Jaycen Joshua [электронный ресурс] // 2010. – Режим доступа: http://www.soundonsound.com/sos/aug10/articles/it-0810.htm – Загл. с экрана. – Яз. англ.
  10. Dove, S., Handbook for sound engineers // Boston: Focal Press – 2008. – 1780 p.

Интересная статья? Поделись ей с другими: