IPB

Здравствуйте, гость ( Вход | Регистрация )

 
Ответить в данную темуНачать новую тему
Блеск И Нищета Теоремы Котельникова. Взгляд С Обратной Стороны Или Двойные Грабли От Sony
Mycroft Holmes
сообщение 3.2.2015, 18:05
Сообщение #1


Активный участник
***

Группа: Главные администраторы
Сообщений: 3702
Регистрация: 21.9.2008
Из: Москва
Пользователь №: 2



Блеск и нищета теоремы Котельникова. Взгляд с обратной стороны или двойные грабли от SONY

взято с: http://3vuk.ru/showpost.php?p=1924&postcount=2
картинки не буду переводить сюда, так что лучше сразу идти на сайт оригинала

Блеск и нищета теоремы Котельникова. Взгляд с обратной стороны или двойные грабли от SONY.
Ай да Sony, ай да сучьи дети!
И это самое мягкое выражение в их адрес

Данная статья нисколько не перечеркивает предыдущую статью, написанную несколько лет назад. Только дополняет ее. Позволяет взглянуть на ту же самую проблему под другим углом – с точки зрения музыкальных сигналов. Предыдущую можно перечитать, если интересно, там изложен взгляд со стороны самой теоремы Котельникова. В текущих рассуждениях придется сначала опустить некоторые «очень важные мелочи», но ниже они будут рассмотрены.

Теорема Котельникова, требует от нас использовать все отсчеты, входящие в сигнал. Ранее я рассчитал, что для формата 16/44 хватит окна sinc(x) около 44100 отсчетов (по полсекунды в обе стороны). Каждый следующий отбрасываемый нами будет меньше, чем единица младшего разряда в выбранном формате.
Предположим, что у нас есть ЦАП, восстанавливающий сигнал строго по теореме, использующий окно в 1с (44100 отсчетов). Надеюсь, придумал самый удачный пример для рассмотрения: оцифрованная пластинка. На ней щелчок от соринки. Такой процесс точно никак не связан с фонограммой. Наш «правильный» ЦАП отработает его следующим образом:
1. начнет вносить искажения в сигнал за полсекунды до того, как щелчок появился,
2. воспроизведет щелчок
3. будет продолжать вносить искажения еще полсекунды после окончания.

С точки зрения логики – логики в этих действиях нет никаких. Т.е. совершенно не понятно, зачем из-за огреха, даже не относящегося к фонограмме, мы должны испортить целую секунду звучания.
Теперь перенесем эту ситуацию внутрь фонограммы. Например, упал пюпитр. Ситуация будет точно такая же. Алгоритм не изменится. Если тут с пониманием нормально, поехали дальше. Необходимо понять, что звук есть только сейчас, одномоментно. И тот звук, который «сейчас» никак не влияет на фонограмму «раньше» и на фонограмму «после». Попробуем рассмотреть вариант с барабаном. Сам удар происходит во вполне определенное время. Если его записывать на аналог, то факт наличия удара в данное время не требует от нас вносить предискажения, начиная за полсекудны до него и еще полсекунды после. А использование «правильного» восстановления из цифры такие требования к нам предъявляет.

Что же может наш «правильный», «Котельниковский» ЦАП? Он может «суперточно» восстановить сигнал, удовлетворяющий условиям теоремы. Намного лучше, чем реальные ЦАП.

Давайте рассмотрим такой пример. Генерируем звуковой файл. Внутри 2с. тишины 20с. синус 22кГц, и еще 2с тишины.
Выглядит это примерно так:



Прогоняем его через реальный ЦАП. Получаем следующее:
1. Почти 2с тишины
2. Короткий «фейд в плюс»
3. 20с непонятно чего
4. Короткий «фейд в минус»
5. Почти 2с тишины

«Непонятно чего» выглядит вот так:



Прогоняем через наш, «суперправильный», Котельниковский и получаем следующее.
1. 1.5с тишины
2. 0.5с предискажений «фейд в плюс»
3. 0.5с «тыква превращается в карету» - процесс перехода от «некачественного» к нормальному синусу.
4. 19с чистого, идеального синуса 22кГц
5. то же, что и пункт 3, но в обратном направлении
6. то же, что и пункт 2, но в обратном направлении
7. 1.5с тишины.


Вернемся к рисунку со сгенерированным нами сигналом, и честно сознаемся, что он не удовлетворяет условиям теоремы Котельникова в точках перехода от тишины к синусу и обратно.



«Правильно» оцифрованный чистый синус 1кГц должен выглядеть примерно так:




Крупнее:




Следующий «очень неудобный» пример – сгенерированный меандр. Берем СаундФорж7 и генерируем меандр не самой большой амплитуды, чтобы был запас у алгоритмов ЦФ. (За что люблю СаундФорж7, так это за то, что ни про Котельникова, ни про Шеннона с Найквистом он ничего не знает). Получили меандр 1кГц, где переход из –U в +U происходит за один отсчет. Вот так это будет выглядеть в SF7.



Вот так он выглядит в Аудишн



Теперь из 96кГц преобразуем в 44кГц и увидим…



Меандр теперь правильный с точки зрения т. Котельникова. Лишние частоты, не удовлетворяющие условиям теоремы обрезаны. А меандр «почти честно» складывается из суммы синусоид. Которых у нас аж 22 гармоники. Хорошо видно, что перед переходом из одного состояния в другое есть некие «предискажения», продолжающиеся и после перехода. Этих искажений будет меньше, если взять бОльшее число гармоник. В пределе мы таки получим настоящий меандр, «неотличимый от аналогового». Вопрос только один. Какую брать частоту дискретизации? Для меандра 1кГц можно в 44кГц запихнуть 22 гармоники, а для меандра 10кГц – всего одну гармонику. Посмотрите еще раз внимательно на «правильный синус 1кГц», и на последние картинки. Это у нас первые грабли, которые продиктованы условиями т. Котельникова. Компания SONY о них широко не распространялась, когда пропихивала формат СД.

Поехали дальше. Возвращаемся к большооооому барабану. Изображение сигнала утрировано, для лучшего понимания смысла.



Вот такой сигнал является импульсным (апериодическим), следовательно, спектр его бесконечен. Т.е. для правильного сохранения и воспроизведения требуется бесконечная частота дискретизации. Абсолютно не важно, какой мы в данном случае возьмем микрофон с полосой 5кГц, 20кГц или 100кГц. Характер сигнала не изменится – он так и останется апериодическим. Спектр его останется бесконечным.
Вот Вам и вторые грабли от компании SONY. С одной стороны в массовое сознание интегрировано «знание»: если микрофон не может записывать частоты выше 20кГц, значит частоты в 44кГц хватает с запасом. А на самом деле – эти две частоты никак не связаны. Тут уже можно кричать: «Ай да SONY, {cenzored} {cenzored} {cenzored} {cenzored} {cenzored}, вот!»
Еще раз отмечу. Исходный сигнал с барабана мы снимаем микрофоном с полосой 5кГц, но спектр получается бесконечным. Чем выше частота дискретизации (ЧД) – тем точнее мы этот сигнал сумеем сохранить. И все полученные «микродобавки» от высокой ЧД – лишь уточнения к нашему непериодическому НЧ сигналу, сохранение его правильной формы. Для любителей понижать ЧД сразу отмечу, что энергия, которую мы отбрасываем при понижении ЧД небольшая, но для слухового восприятия значение она имеет. Измерять ее «в граммах» смысла нет, т.к. по отношению к оставшемуся спектру вес энергии мизЕрен, но и «весовые категории» в части «точности» - разные.

Вернемся к обозрению «правильного» и «неправильного» сигнала по Котельникову. «Правильные» сигналы не могут появиться внезапно. Каждый из них должен иметь некоторую зону «фейда» - несколько периодов, когда из нулевого состояния он «раскачивается» до нужной амплитуды. А из этого следует, что у сигналов не может быть острой «атаки». К каждой атаке при восстановлении будет добавлено «предзвучание», и переход от состояния «звука нет» к «звук есть» должен быть мягкий, с подготовкой слуха к восприятию атаки (чуть натянуто, но об этом ниже).

Опираясь на рассуждения выше, можно сказать, что у дискретного представления сигналов есть некоторые «музыкальные предпочтения». Первое, что приходит на ум – органные записи. У данного инструмента способ звукоизвлечения «очень удобный» для дискретных сигналов. По крайней мере, это касается язычковых труб органа. Возможно, в группу «любимых» попадут все смычковые при игре смычком (для проверки надо посмотреть), дальше – думайте сами.

Теперь сравним работу реального и идеального ЦАП



Давайте уже посмотрим живьем, как эти самые реальные ЦАП работают.
Сначала просто «неправильный меандр», про который писал выше. На эстакаде CS4398.



Крупнее:



А теперь я взял меандр из примера выше, но изменил его. В каждом переходе от –U к +U добавлен еще отсчет «0», имитируя ограниченность нашего микрофона частотой 20кГц. Теперь переход выглядит так: «-U» - «0» - «+U» и обратно так же. В Аудишине он выглядит теперь так:



На эстакаде снова CS4398. Примечателен он тем, что «пытается быть похожим на идеальный ЦАП». А картиночка получается вот такая:



Как я и говорил, перед фронтом идут предискажения, теперь относительно небольшие по амплитуде. И после фронта есть искажения. В увеличенном масштабе выглядит это так:



Возьмем для проверки другой ЦАП. Алгоритм работы у него другой, и картинка тоже другая:



Увеличено:



Что сказать про этот ЦАП? «Ай, молодца!» Никаких предискажений. Четко видна точка «0», и быстро устанавливающийся процесс после перехода. На реальных музыкальных сигналах он выглядит намного предпочтительнее, чем тот же CS4398. Сейчас бы гимн спеть этому ЦАП, да оду написать, в которой подробно рассказать об его великолепии, величии и блестящей работе с музыкальными сигналами… Ох я и интриган…. Второй ЦАП – это AC97 – встроенный на материнской плате звук.

Еще раз поговорим о предискажениях и «подготовке слуха». Рассматривать будем меандр. Перерегулирование в случае меандра у нас около 30% от амплитуды сигнала. Частота большая – 44кГц. Акустика точно нам воспроизвести такое не сможет, но, как порядочная, проинтегрирует. Какой-то звук на выходе так или иначе будет присутствовать. Причем из всех динамиков, независимо от верхней граничной частоты каждого.

Чтобы Вы не пытались «живьем ловить блох» в рассматриваемом примере, приведу другой пример, более жизненный. Заряд конденсаторов цепей питания в электронной схеме приводит к выбросу тока на очень короткое время. (Там же есть еще куча неприятных процессов). Если не принимать специальных мер по снижению наводок от цепей питания, то эти выбросы тока будут и на выходе прибора. В очень линейных схемах форма импульса тока не меняется, и он остается очень коротким, не размазывается. Ширину импульса не измерял, основную частоту не считал, но она значительно выше 44кГц по фронту (спад более мягкий) и выше, чем может воспроизводить акустика. Пиковая амплитуда этого импульса (по RMAA) порядка -70... -80дБ (FS). Для нормальных уровней громкости в нашей аппаратуре этот импульс не слышно. Однако, если громкость добавлять, то…. Мы будем отчетливо слышать 50Гц (или 100?), которые воспроизводят динамики в акустической системе. Такая же ситуация и с наушниками.

Про «предискажения» знают и разработчики ЦАП. Что они рекомендуют? А рекомендуют они «душить и душить» этих гадов аж четвертым порядком фильтра и выше. Забудьте про Бесселя. Бессель тут «не в теме». В хорошем случае это Баттерворт , а еще круче Чебышев, а дальше эллиптические фильтры. Иначе «душить» не получится. Нужна большая крутизна. На процесс «душения» - всего-то одна октава. А когда мы этот сигнал «жестко задушим» - забудьте о линейной фазе, забудьте о микронных, неслышимых уху фазовых искажениях. Тот же Бессель должен дать нам меньший сдвиг фазы, по сравнению с любым другим, причем, линейный сдвиг, соответствующий обыкновенной задержке форманты сигнала. («Разбег» фазы любого конкретного фильтра надо сравнивать именно с Бесселем). На выходе при использовании рекомендованных производителем фильтров будет «совсем другой» звук. И причина – именно фазовые искажения, которые появляются при ГВЗ<>const.

Если хотите, можно теперь поностальгировать о «старых добрых мультибитниках». Причем, именно о старых, где нет передискретизации внутри микросхемы, нет внутри ЦФ. Наверное, можно и из современных мультибит что-то подобрать достойное, аскетичное....
В другой статье я нарисовал «картину маслом» про то, как идеально может работать мультибитник вообще без фильтрации на выходе. Но эта картина идеальна только до первой нелинейности в тракте, причем не важно, на какой частоте эта нелинейность имеет место быть. Она запросто перетащит зеркалку хоть с 10МГц обратно, в звуковой диапазон. А разработчики такого безфильтрового ЦАП «хапнут горя» с этой самой зеркалкой по полной программе.
Можно пуститься и в другие размышления-рассуждения, но пора остановиться и сделать выводы.

1. Почти все музыкальные сигналы не удовлетворяют требованиям теоремы Котельникова. Сигнал любой частоты (чистый тон) по Котельникову не может возникнуть внезапно.
2. Точность сохранения и воспроизведения непериодических сигналов (с бесконечным спектром) – сюда попадут все атаки (периоды возбуждения с нуля до стационарного состояния), все ударные инструменты и многие другие – зависит только от выбранной частоты дискретизации. Рекомендую вспомнить передовой немецкий(?) опыт 30х-40х годов по ручному удалению фазы атаки из записи и предъявлению остатков музыкантам, которые не могли узнать свои инструменты.
3. Чем больше в музыкальном сигнале "нестационарностей", тем выше нужна частота дискретизации для корректного сохранения и воспроизведения.
4. Об этом уже несколько раз говорил мельком – перестаньте «жить и восстанавливать» по Котельникову, возьмите АЦП-ЦАП с достаточной для слуха частотой и «живите» в масштабе двух отсчетов – «тот, который сейчас» и «тот, куда надо переместиться». Этот вариант в наибольшей степени соответствует музыкальным сигналам.


2010.07.10 Новиков К


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
ntktvf
сообщение 5.2.2015, 10:34
Сообщение #2


Активный участник
***

Группа: Пользователи
Сообщений: 85
Регистрация: 23.3.2012
Из: Кореновск
Пользователь №: 78670



Цитата
Об этом уже несколько раз говорил мельком – перестаньте «жить и восстанавливать» по Котельникову, возьмите АЦП-ЦАП с достаточной для слуха частотой и «живите» в масштабе двух отсчетов – «тот, который сейчас» и «тот, куда надо переместиться». Этот вариант в наибольшей степени соответствует музыкальным сигналам.


Это намёк на dsd и SACD?


--------------------
MyST PortDAC 1862 + HiFiMan HE-4
aleXmod#128 + IzoEM-3V
Перейти в начало страницы
 
+Цитировать сообщение
Mycroft Holmes
сообщение 5.2.2015, 13:44
Сообщение #3


Активный участник
***

Группа: Главные администраторы
Сообщений: 3702
Регистрация: 21.9.2008
Из: Москва
Пользователь №: 2



что-то я в статье намековна SACD и DSD даже близко не заметил


--------------------
Перейти в начало страницы
 
+Цитировать сообщение
ntktvf
сообщение 5.2.2015, 17:27
Сообщение #4


Активный участник
***

Группа: Пользователи
Сообщений: 85
Регистрация: 23.3.2012
Из: Кореновск
Пользователь №: 78670



Так то да, но фраза
Цитата
«живите» в масштабе двух отсчетов – «тот, который сейчас» и «тот, куда надо переместиться»

почему-то навела на мысль именно о DSD…
Ну и на мгновение захотелось вообще перейти на винил:)


--------------------
MyST PortDAC 1862 + HiFiMan HE-4
aleXmod#128 + IzoEM-3V
Перейти в начало страницы
 
+Цитировать сообщение

Ответить в данную темуНачать новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



Текстовая версия Сейчас: 25.4.2024, 4:45