Практические соображения
На практике непрерывный сигнал дискретизируется с помощью аналого-цифровой преобразователь (ADC), устройство с различными физическими ограничениями. Это приводит к отклонениям от теоретически совершенной реконструкции, которые в совокупности называются искажение.
Могут возникать различные типы искажений, в том числе:
- Сглаживание. Некоторая степень наложения спектров неизбежна, потому что только теоретические, бесконечно длинные функции не могут иметь частотного содержания выше частоты Найквиста. Могут быть сделаны наложения произвольно маленький используя достаточно большой порядок сглаживания фильтра.
- является результатом того факта, что выборка получается как среднее по времени в пределах области выборки, а не просто равняется значению сигнала в момент выборки . В конденсатор-основан образец и держать В цепи ошибки диафрагмы вносятся несколькими механизмами. Например, конденсатор не может мгновенно отслеживать входной сигнал, а конденсатор не может быть мгновенно изолирован от входного сигнала.
- Джиттер или отклонение от точных интервалов времени выборки.
- Шум, включая шум термодатчика, аналоговая схема шум и др.
- Скорость нарастания предельная ошибка, вызванная невозможностью достаточно быстрого изменения входного значения АЦП.
- Квантование как следствие конечной точности слов, которые представляют преобразованные значения.
- Ошибка из-за другой нелинейный эффекты преобразования входного напряжения в преобразованное выходное значение (в дополнение к эффектам квантования).
Хотя использование передискретизация может полностью устранить ошибку апертуры и наложение спектров за счет их смещения за пределы полосы пропускания, этот метод практически невозможно использовать на частотах выше нескольких ГГц и может быть чрезмерно дорогим на гораздо более низких частотах. Более того, хотя передискретизация может уменьшить ошибку квантования и нелинейность, она не может полностью их устранить. Следовательно, практические АЦП на звуковых частотах обычно не демонстрируют наложения спектров, ошибку апертуры и не ограничиваются ошибкой квантования. Вместо этого преобладает аналоговый шум. На ВЧ- и СВЧ-частотах, где передискретизация нецелесообразна, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут быть значительными ограничениями.
Джиттер, шум и квантование часто анализируются путем моделирования как случайные ошибки, добавленные к значениям выборки. Эффекты интегрирования и удержания нулевого порядка можно анализировать как форму фильтрация нижних частот. Нелинейность АЦП или ЦАП анализируется путем замены идеального линейная функция картографирование с предложенным нелинейная функция.
Кодирование звука.
Компьютер является мощнейшим устройством для обработки различных типов информации, в том числе и звуковой. Но аналоговый звук непригоден для обработки на компьютере, его необходимо преобразовать в цифровой. Для этого используются специальные устройства — аналого-цифровые преобразователи или АЦП. В компьютере роль АЦП выполняет звуковая карта. Каким же образом АЦП преобразует сигнал из аналогового в цифровой вид? Давайте разберемся.
Пусть у нас есть источник звука с частотой 440Гц, пусть это будет гитара. Сначала звук нужно превратить в электрический сигнал. Для этого используем микрофон. На выходе микрофона мы получим электрический сигнал с частотой 440Гц. Графически он выглядит таким образом:
Следующая задача — преобразовать этот сигнал в цифровой вид, то есть в последовательность цифр. Для этого используется временная дискретизация — аналоговый звуковой сигнал разбивается на отдельные маленькие временные участки и для каждого такого участка устанавливается определенная величина интенсивности звука, которая зависит от амплитуды. Другими словами через какие-то промежутки времени мы измеряем уровень аналогового сигнала. Количество таких измерений за одну секунду называется частотой дискретизации. Частота дискретизации измеряется в Герцах. Соответственно, если мы будет измерять наш сигнал 100 раз в секунду, то частота дискретизации будет равна 100Гц.
Вот примеры некоторых используемых частот дискретизации звука:
- 8 000 Гц — телефон, достаточно для речи;
- 11 025 Гц;
- 16 000 Гц;
- 22 050 Гц — радио;
- 32 000 Гц;
- 44 100 Гц — используется в Audio CD;
- 48 000 Гц — DVD, DAT;
- 96 000 Гц — DVD-Audio (MLP 5.1);
- 192 000 Гц — DVD-Audio (MLP 2.0);
- 2 822 400 Гц — SACD, процесс однобитной дельта-сигма модуляции, известный как DSD — Direct Stream Digital, совместно разработан компаниями Sony и Philips;
- 5,644,800 Гц — DSD с удвоенной частотой дискретизации, однобитный Direct Stream Digital с частотой дискретизации вдвое больше, чем у SACD. Используется в некоторых профессиональных устройствах записи DSD.
Современные звуковые карты способны оцифровывать звук с частотой дискретизации 96Кгц и даже 192 кГц.
В итоге наш аналоговый сигнал превратится в цифровой, а график станет уже не гладким, а ступенчатым, дискретным:
Глубина кодирования звука — это количество возможных уровней сигнала. Другими словами глубина кодирования это точность измерения сигнала. Глубина кодирования измеряется в битах. Например, если количество возможных уровней сигнала равно 255, то глубина кодирования такого звука 8 бит. 16-битный звук уже позволяет работать с 65536 уровнями сигнала. Современные звуковые карты обеспечивают глубину кодирования в 16 и даже 24 бита, а это возможность кодирования 65536 и 16 777 216 различных уровней громкости соответственно.
Зная глубину кодирования, можно легко узнать количество уровней сигнала цифрового звука. Для этого используем формулу:
N=2i,
где N — количество уровней сигнала, а i — глубина кодирования.
Например, мы знаем, что глубина кодирования звука 16 бит. Значит количество уровней цифрового сигнала равно 216=65536.
Чтобы определить глубину кодирования если известно количество возможных уровней применяют эту же формулу. Например, если известно, что сигнал имеет 256 уровней сигнала, то глубина кодирования составит 8 бит, так как 28=256.
Как понятно из данного вышеприведенного рисунка, чем чаще мы будем измерять уровень сигнала, т.е. чем выше частота дискретизации и чем точнее мы будем его измерять, тем более график цифрового сигнала будет похож на аналоговый график, соответственно, тем выше качество цифрового звука мы получим. И тем больший объем будет иметь файл.
Кроме того, мы рассматривали монофонический (одноканальный) звук, если же звук стереофонический, то размер файла увеличивается в 2 раза, так как он содержит 2 канала.
Кодирование звуковой информации
Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.
Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).
Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны |
Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).
Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица «децибел» (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.
Таблица 5.1. Громкость звука | |||||||||||||
|
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 1.2).
Рис. 1.2. Временная дискретизация звука |
Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую диалогового сигнала.
Частота дискретизации звука — это количество измерений громкости звука за одну секунду.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.
Глубина кодирования звука. Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.
Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2I = 216 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):
16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.
Последнее изменение: Tuesday, 11 November 2014, 12:57
Как это влияет на изображение?
Конечно, повторяющиеся и регулярные структуры линий достаточно редко можно встретить на снимках различных природных объектов — их присутствие часто ограничивается снимками разнообразных искусственных сооружений, таких как здания и прочее. Однако в любом случае глубина дискретизации может быть внушительной, поэтому этого эффекта всегда стоит избегать, занимаясь съемкой любых объектов.
При этом стоит отметить тот факт, что качество изображений может быть абсолютно разным даже в том случае, если они имеют одинаковое количество пикселей. Ведь, помимо всего прочего, разница между снимками может заключаться также в том, каким именно образом они были получены. К примеру, в одном случае снимок может быть несколько смягчен путем пропуска его через низкочастотный фильтр для получения промежуточных значений пикселей перед тем, как уменьшить размер, в то время как другое изображение может просто уменьшаться в размере, не внося в него при этом никаких дополнительных изменений и не получая промежуточных значений на границах объектов, где наблюдаются слишком резкие изменения яркости.
1.1 Дискретизация
Дискретизация — преобразование непрерывной функции в дискретную. Используется в гибридных вычислительных системах и цифровых устройствах при импульсно-кодовой модуляции сигналов в системах передачи данных. При передаче изображения используют для преобразования непрерывного аналогового сигнала в дискретный или дискретно-непрерывный сигнал. Обратный процесс называется восстановлением. При дискретизации только по времени, непрерывный аналоговый сигнал заменяется последовательностью отсчётов, величина которых может быть равна значению сигнала в данный момент времени. Возможность точного воспроизведения такого представления зависит от интервала времени между отсчётами Δt. Согласно теореме Котельникова:
где
Алгоритмы передискретизации
Наиболее просты алгоритмы изменения частоты дискретизации в целое число раз. При уменьшении частоты дискретизации в N раз частота Найквиста (половина частоты дискретизации) становится в N раз ниже, т.е. частотный диапазон сужается. Поэтому для предотвращения наложения спектра (алиасинга) применяют НЧ-фильтр, подавляющий все частотные составляющие выше будущей частоты Найквиста. После фильтрации отсчеты сигнала прореживаются в N раз. При этой операции спектр сигнала ниже новой частоты Найквиста остается неискаженным.
Для увеличения частоты дискретизации в M раз сигнал сначала интерполируется («разбавляется») нулями. Это сохраняет неизменным спектр сигнала ниже частоты Найквиста, но создает копии спектра выше частоты Найквиста. После этого возникшие копии спектра отфильтровываются НЧ-фильтром.
Понятно, что параметры алгоритма определяются свойствами НЧ-фильтра. Гладкость АЧХ и ФЧХ фильтра в полосе пропускания обеспечивает неискаженную передачу сигнала в допустимом частотном диапазоне. Степень подавления в полосе подавления определяет, насколько будут подавлены помехи, не укладывающиеся в допустимый частотный диапазон при уменьшении частоты дискретизации, или насколько будут подавлены возникшие копии спектра при увеличении частоты. Переходная полоса фильтра покажет поведение фильтра вблизи частоты Найквиста (для Audio-CD — вблизи 22 кГц). Форма импульсной характеристики фильтра покажет осцилляции, которые фильтр вносит в сигнал во временной области. В реальных фильтрах эти параметры взаимосвязаны (см. «Цифровые эквалайзеры», «Звукорежиссер» 8/2006). Например, для улучшения параметров частотной характеристики приходится использовать фильтры с более длинным импульсным откликом и большим количеством пульсаций во временной области.
Для передискретизации сигнала в нецелое число раз (например, из 96 кГц в 44,1 кГц) можно скомбинировать повышение и понижение частоты дискретизации в целое число раз (например, 44100 = =96000?M/N = 96000?147/320). Поскольку НЧ-фильтрация выполняется после повышения частоты дискретизации в M раз, но до понижения ее в N раз, то две фильтрации можно совместить в одну, установив частоту среза фильтра на минимум из двух необходимых частот среза. Отметим, что фильтр в данном случае работает над сигналом с повышенной в M раз частотой дискретизации.
Специальные алгоритмы полифазной фильтрации позволяют избежать явного вычисления такого промежуточного сигнала, сокращая число операций. Они сразу вычисляют отсчеты выходного сигнала как взвешенную сумму окружающих отсчетов входного сигнала и подмножества коэффициентов фильтра. При этом число операций почти не зависит от величин M и N, а зависит лишь от порядка интерполяции, то есть от числа взвешиваемых отсчетов входного сигнала.
Большинство конвертеров частоты дискретизации работают именно по принципу полифазной фильтрации, а в качестве фильтра используется НЧ-фильтр с линейной фазой.
Комплексная выборка
Комплексная выборка ( I / Q-выборка ) — это одновременная выборка двух разных, но связанных сигналов, в результате чего образуются пары выборок, которые впоследствии обрабатываются как комплексные числа . Когда одна форма волны,s^(t),{\ displaystyle, {\ hat {s}} (т),} это преобразование Гильберта другого сигнала,s(t),{\ Displaystyle, s (т), \,} комплексная функция, sa(t)≜s(t)+i⋅s^(t),{\ Displaystyle s_ {а} (т) \ треугольник s (т) + я \ cdot {\ шляпа {s}} (т),} называется аналитическим сигналом , преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае частота Найквиста для сигнала без частот ≥ B может быть уменьшена до B (комплексных отсчетов в секунду) вместо 2 B (реальных отсчетов в секунду). Более очевидно, что эквивалентная форма волны основной полосы частот , sa(t)⋅e−i2πB2t,{\ displaystyle s_ {a} (t) \ cdot e ^ {- i2 \ pi {\ frac {B} {2}} t},} также имеет коэффициент Найквиста B , потому что все его ненулевое частотное содержание сдвинуто в интервал [-B / 2, B / 2).
Хотя комплексные выборки могут быть получены, как описано выше, они также создаются путем манипулирования выборками действительного сигнала. Например, эквивалентная форма волны основной полосы частот может быть создана без явного вычисленияs^(t),{\ displaystyle {\ hat {s}} (т),} путем обработки последовательности продуктов,s(nT)⋅e−i2πB2Tn,{\ displaystyle, \ left ,} через цифровой фильтр нижних частот с частотой среза B / 2. Вычисление только каждой второй выборки выходной последовательности снижает частоту дискретизации соразмерно уменьшенной частоте Найквиста. В результате получается вдвое меньше комплексных выборок, чем в исходном количестве реальных выборок. Информация не теряется, и при необходимости можно восстановить исходную форму сигнала s (t).
Формат CD и родственные ему форматы Flac – динамический диапазон
Рассмотрим для начала любимый формат CD и родственные ему форматы Flac. Динамический диапазон рассчитывается очень просто — он равен 6дБ на 1 бит информации, при импульсно кодовой модуляции использующейся в этих форматах. Для компакт диска динамический диапазон таким образом равен 16бит х 6дБ = 96дБ. Соответственно величина ошибки квантования равна величине младшего разряда и для 16бит динамического диапазона цифровой (теоретический) шум квантования составит -96дБ. Мы разобрали квантование по амплитуде и это еще не все характеристики цифрового аудио.
С нижними частотами все в порядке. Проблемы возникают при оцифровке высоких частот. Дело в том что период максимальной (по теореме Котельникова-Шеннона или известная как «частота Найквиста») частоты 22050Гц, будет записан всего двумя цифрами. Это и есть частота дискретизации которая равна для компакт диска 44100Гц. Если сравнить количество информации доступное для записи максимальной частоты 22050Гц и минимальной для CD частоты в 20Гц, на ум приходит очень важный и простой вывод — различные частоты записываются с разным качеством.
Чтобы посчитать величину шума дискретизации подойдет формула от оценки шума квантования. Предварительно нужно знать величину периода (целое число) искомой частоты и расчитать требуемое количество бит кодирующих фазу частоты. Ниже представлена таблица где приведены частоты с уменьшением на октаву, плюс самая низкая частота (кодируемая, как мы помним с избытком качества), далее следует величина периода, минимальная 2р, здесь и далее указывается число единиц информации кодирующих один период частоты и разрядность в битах необходимая для кодирования одного периода при этой частоте дискретизации (ограничением для количества бит на фазу является как раз частота дискретизации). В конце приводится то что нам нужно — величина (теоретическая) фазового шума (ошибка дискретизации) для определенной частоты:
CD 44100 Hz 16bit
- 22050 Hz 2p(1b) -6дБ
- 11025 Hz 4p(2b) -12дБ
- 5512 Hz 8p(3b) -18дБ
- 2756 Hz 16p(4b) -24дБ
- 20 Hz 2205p(11b) -66дБ
Итак, значения шума дискретизации прямо сказать обескураживающие =). Недаром эти характеристики производители аппаратуры не указывают вообще.
Дискретизация звука
Дискретизация звука – это фильтрация звуковой волны перед тем, как она будет сохранена в звуковой файл. Другими словами, в конечном файле будет не точная копия звуковой волны, а только приблизительная. С одной стороны, дискретизация звука обеспечивает определенное снижение объема сохраняемого файла, но с другой есть масса звуковых колебаний, которые не обязательно сохранять на жестком диске.
Такая фильтрация звука называется «частота дискретизации». При этом стоит отметить, что на самом деле только в природе присутствует звук без этого эффекта, хоть и немногие об этом знают. Частота дискретизации – это наложение определенной сетки на звуковую волну, а также запись только определенных ключевых элементов.
Производить запись полностью всей звуковой волны было бы достаточно сложно. Именно по этой причине гораздо чаще можно встретить такую ситуацию, когда производилась двухканальная звукозапись с частотой дискретизации 44.1 kHz. Последняя выбирается наиболее часто, так как это самый оптимальный параметр.
В принципе, рассматривая звуковую обработку, нужно уделить особенное внимание таким параметрам, как глубина кодирования и частота дискретизации, ведь чем эти показатели выше, тем больше цифровой сигнал будет соответствовать аналоговому