Параметры цифрового звука

ebtracksanim

ebtracksanim

Биты, герцы... Что скрывается за этими понятиями? При разработке стандарта аудио компакт дисков были приняты значения 44 кГц, 16 бит. Почему именно столько? В чем причина выбора, а также — почему предпринимаются попытки повысить эти значения до, скажем, 96 кГц и 24 или даже до 32х битов...

Разберемся сначала с разрешением сэмплирования — то есть с битностью. Так уж получается, что выбирать приходится между числами 16, 24 и 32. Промежуточные значения были бы, конечно, удобнее в смысле звука, но слишком неприятны для использования в цифровой технике.

За что отвечает этот параметр?
В двух словах — за динамический диапазон.

Диапазон одновременно воспроизводимых громкостей — от максимальной амплитуды (0 дБ) до той наименьшей, которую позволяет передать разрешение, например — примерно -93 дБ для 16 битного аудио. Как не странно, это сильно связано с уровнем шумов фонограммы. В принципе, для, к примеру, 16 битного аудио вполне возможна передача сигналов мощностью и в -120 дБ, однако эти сигналы будет затруднительно применять на практике из-за такого фундаментального понятия как шум дискретизации. Дело в том, что при взятии цифровых значений мы все время ошибаемся, округляя реальное аналоговое значение до ближайшего возможного цифрового. Самая маленькая возможная ошибка — нулевая, максимально же мы ошибаемся на половину последнего разряда (бита, далее термин младший бит будет сокращаться до МБ). Эта ошибка дает нам так называемый шум дискретизации — случайное несоответствие оцифрованного сигнала оригиналу. Этот шум носит постоянный характер и имеет максимальную амплитуду равную 0.5МБ. Это можно рассматривать как случайные значения, подмешанные в цифровой сигнал. Иногда это называется шум округления или квантования.

normfreqres0to50khz

normfreqres0to50khz

Остановимся подробнее на том, что понимается под мощностью сигналов, измеряемой в битах. Самый сильный сигнал в цифровой обработке звука принято принимать за 0 дБ, это соответствует всем битам, поставленным в 1. Если старший бит (далее СБ) обнулить, получившееся цифровое значение будет в два раза меньше, что соответствует потере уровня на 6 дБ. Никакими другими битами кроме СБ нельзя добиться уровня выше -6 дБ. Соответственно — старший бит как бы отвечает за наличие уровня сигнала от -6 до 0 дБ, поэтому СБ — это бит 0 дБ. Предыдущий бит отвечает за уровень -6 дБ, ну а самый младший, таким образом — за уровень (число_бит-1) * 6 дБ. В случае 16 битного звука, МБ соответствует уровень в -90 дБ. Когда мы говорим 0.5МБ, мы имеем в виду не -90/2, а половину шага до следующего бита — то есть еще на 3 дБ ниже, -93 дБ.

Возвращаемся к выбору разрешения оцифровки. Как уже было сказано, оцифровка вносит шум на уровне 0.5МБ, это говорит о том, что запись, оцифрованная в 16 бит, постоянно шумит на -93 дБ. Она может передавать сигналы и тише, но шум все равно остается на уровне -93 дБ. По этому признаку и определяется динамический диапазон цифрового звука — там, где соотношение сигнал/шум переходит в шум/сигнал (шумов больше, чем полезного сигнала), находится граница этого диапазона снизу. Таким образом, главный критерий оцифровки — сколько шума мы можем себе позволить в восстановленном сигнале? Ответ на этот вопрос зависит отчасти от того, сколько шума было в исходной фонограмме. Важный вывод — если мы оцифровываем нечто с уровнем шумов -80 дБ — нет совершенно никаких причин цифровать это в более чем 16 бит, так как, с одной стороны, шумы -93 дБ добавляют очень мало к уже имеющимся огромным (сравнительно) шумам -80 дБ, а с другой стороны — тише чем -80 дБ в самой фонограмме уже начинается шум/сигнал, и оцифровывать и предавать такой сигнал просто не нужно.

Теоретически это единственный критерий выбора разрешения оцифровки. Больше мы не вносим совершенно никаких искажений или неточностей. Практика, как не странно, почти полностью повторяет теорию. Этим и руководствовались те люди, которые выбирали разрешение 16 бит для аудио компакт дисков. Шум -93 дБ — довольно хорошее условие, которое почти точно соответствует условиям нашего восприятия: разница между болевым порогом (140 дБ) и обычным шумовым фоном в городе (30-50 дБ) составляет как раз около сотни дБ, и если учесть, что на уровне громкости, приносящем боль, музыку не слушают — что еще несколько сужает диапазон — получается, что реальные шумы помещения или даже аппаратуры получаются гораздо сильнее шумов дискретизации. Если мы можем расслышать уровень под -90 дБ в цифровой записи — мы услышим и воспримем шумы дискретизации, иначе — мы просто никогда не определим, оцифрованное это аудио или живое. Никакой другой разницы в смысле динамического диапазона просто нет. Но в принципе, человек может осмысленно слышать в диапазоне 120 дБ, и было бы неплохо сохранить весь этот диапазон, с чем 16 бит, казалось бы, не справляются.

Но это только на первый взгляд: с помощью специальной техники, называемой shaped dithering, можно изменить частотный спектр шумов дискретизации, почти полностью вынести их в область более 7-15 кГц. Мы как бы меняем разрешение по частоте (отказываемся от воспроизведения тихих высоких частот) на дополнительный динамический диапазон в оставшемся отрезке частот. В сочетании с особенностями нашего слуха — наша чувствительность к выкидываемой области высоких частот на десятки дБ ниже чем в основной области (2-4 кГц) — это делает возможным относительно бесшумную передачу полезных сигналов дополнительно еще на 10-20 дБ тише, чем -93 дБ — таким образом, динамический диапазон 16 битного звука для человека составляет около 110 дБ. Да и вообще — одновременно человек просто не может слышать звуки на 110 дБ тише чем только что услышанный громкий звук. Ухо, как и глаз, подстраивается под громкость окружающей действительности, поэтому одновременный диапазон нашего слуха составляет и совсем сравнительно мало — около 80 дБ. Поговорим о dithring-е подробнее после обсуждения частотных аспектов.

Для компакт дисков выбрана частота дискретизации 44100 Гц. Бытует мнение, что это означает, что воспроизводятся все частоты до 22.05 кГц, однако это не совсем так. Однозначно можно сказать лишь то, что частот выше 22.05 кГц в оцифрованном сигнале нет. Реальная же картина воспроизведения оцифрованного звука всегда зависит от конкретной техники и всегда не настолько идеальна, как хотелось бы, и как соответствует теории. Все зависит от конкретного ЦАПа.

Разберемся сначала, что нам хотелось бы получить. Человек среднего возраста (скорее молодой) может чувствовать звуки от 10 Гц до 20 кГц, осмысленно слышать — от 30 Гц до 16 кГц. Звуки выше и ниже воспринимаются, но не составляют акустических ощущений. Звуки выше 16 кГц ощущаются как раздражающий неприятный фактор — давление на голову, боль, особо громкие звуки приносят такой резкий дискомфорт, что хочется покинуть помещение. Неприятные ощущения настолько сильны, что на этом основано действие охранных устройств — несколько минут очень громкого звука высокой частоты сведут с ума кого угодно, и воровать что либо в такой обстановке становится решительно невозможно. Звуки ниже 30 — 40 Гц при достаточной амплитуде воспринимаются как вибрация, исходящая от объектов (колонок). Вернее будет даже сказать так — просто вибрация. Человек акустически почти не определяет пространственное положение настолько низких звуков, поэтому в ход уже идут другие органы чувств — осязательные, мы чувствуем такие звуки телом.

2 комментария to “Параметры цифрового звука”

  1. Картинки — просто умора.

  2. Да будут еще круче современем,сайт в разработке.

Leave a Reply