Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 2

http://xiph.org/~xiphmont/demo/neil-young.html
  • Перевод


Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.

[Первая часть]

Частота 192 КГц считается вредной


Музыкальные цифровые файлы с частотой 192 КГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.

И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.



График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33к Гц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.

Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.

Есть несколько способов избежать дополнительных искажений:
  1. Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.
  2. Усилители и преобразователи, спроектированные для воспроизведения более широкого спектра частот так, чтобы ультразвук не вызывал слышимых нелинейных искажений. Из-за дополнительных затрат и сложности исполнения, дополнительный частотный диапазон будет уменьшать качество воспроизведения в слышимой части спектра.
  3. Качественно спроектированные динамики и усилители, которые совсем не воспроизводят ультразвук.
  4. Для начала можно не кодировать такой широкий диапазон частот. Вы не можете (и не должны) слышать ультразвуковые нелинейные искажения в слышимой полосе частот, если в ней нет ультразвуковой составляющей.

Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.

Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.

Тесты для измерения нелинейных искажений:
  • Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) [5-секундный WAV] [30-секундный FLAC]
  • Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) [10-секундный WAV]
  • Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) [10-секундный WAV]
  • Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) [10-секундный WAV] (оригинальная версия нарезки) (16 бит / 44.1 кГц WAV)

Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.

В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.

Недопонимание процесса дискретизации


Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.



Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).

Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.

По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.



Это только так выглядит. Эти убеждения неверны!

Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.

Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.

С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.

Избыточная дискретизация


Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].

Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.



На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).

Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.

Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.

ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.

16 бит против 24 бит


Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?

16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.

Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.

Примечания к Части 2

6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.

7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.

8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.

[Третья часть]

Аудиомания 164,07
Лидер рынка качественных решений для музыки и кино
Поделиться публикацией
Комментарии 96
  • +2
    Классный пост, спасибо! Хотя я и совсем не интересуюсь темой звука, прочитала прямо на одном дыхании.
    • +1
      Ага, тут как раз народ ждал второй части – сделали, опубликовали :)
    • 0
      Если я не ошибаюсь, исходник 24\192 получается на достаточнохорошем оборудовании.
      И если на счет избыточности 192 Khz я согласен, то я категорически не согласен с тем, что следует хранить такую музыку в 16\44.1.
      Все-таки при ресемплинге на мой взгляд логичнее использовать частоту 48 KHz.

      Соответственно музыку полученная с CD должна храниться в 16\44.1 и только. Иначе любой ресемплинг приведет к потере информации.
      Музыку же полученную с исходника 24/192 стоит хранить в формате 24/48 или 16/48.
      • +2
        Почему именно 48КГц? Если вы считаете, что некратность частоты вызывает сильные искажения, вы ошибаетесь.
        • 0
          Проблема передискретизации с 44.1 на 48 и обратно, а также кратных им частот, давно решена с помощью цифровых фильтров с такой точностью, что не то что человеческое ухо — а даже чувствительный прибор не заметит искажений.
        • +6
          То есть в первой статье автор писал, что разницы между 44.1 и 92 человек не услышит, а во второй статье пишет, что услышит из-за интермодуляционных искажений. Так услышит или нет? Если услышит, почему не записать в том виде, которое допускает прослушивание как хочешь, а дальше человек пусть сам решает, накладывать ему фильтр, отсекающий ультразвук, или нет? Может ему нравится именно тот эффект, который создает ультразвук на его уши, ведь в живом исполнении ультразвук присутствует?

          >Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна
          >С математикой не поспоришь, но в чем же сложности?
          Вот это реально бесит. Теорема говорит о теоретическом восстановлении бесконечного синусоидального сигнала. Потому что если у нас есть бесконечность во времени, мы легко можем взять любой самый кривой сигнал и выяснить, какая у него на самом деле амплитуда и фаза.
          В реальном мире происходит вот что:
          jsfiddle.net/txbj9cfd/
          Сигналы около частоты сэмплирования не по-детски колбасит по амплитуде — и ТЕОРЕТИЧЕСКИ можно сказать, каким был оригинальный сигнал, но на практике никакой ЦАП это делать не будет — это просто невозможно за конечное время. И такая хрень происходит задолго до половины частоты сэмплирования — можно поэксперементировать с цифрами. С чего автор взял, что компетентен говорить фразы типа «С математикой не поспоришь» — не понятно.
          • +1
            О как раз хотел похожую картинку нарисовать, а тут уже все есть.
            • 0
              Если под «живым исполнением» понимать полное отсутствие всяких посредников в процессе передачи звука, то там ультразвука не услышать — потому что там интермодуляционным искажениям просто неоткуда взяться.

              Если же «живым исполнением» считать тот звук, который выходит из динамиков на концерте — то тут для воспроизведения всех искажений понадобится не только исходник в 192КГц, но и полная копия той звуковой системы — потому что другие динамики дадут другие искажения.

              Но можно поступить проще: можно поставить микрофон уже после динамиков — и записать звук от них вместе со всеми искажениями в формате 48 КГц. Только так не делают почему-то… Может, потому что эти искажения никому не нужны?
              • 0
                А нам и не надо в точности восстановить исходный сигнал — задача восстановить его наиболее близко к исходному.
                • 0
                  Более того, нам даже нет нужды восстанавливать его близко к исходному — ухо все равно раскладывает звук по частотам, так что сигнал, где некоторые частоты будут сдвинуты по фазе, все равно будет услышан полностью идентично исходному.
                  • +1
                    Искажения фазы драматически влияют на стерео картину.
                    • +1
                      Это если искажать фазу сигнала одного канала относительно другого.
                      Если искажения будут идентичными для обоих каналов, то разница в фазах сохранится и мозг ничего не заметит — ухо ему просто не предоставит такую информацию.
                      • 0
                        Сигналы в стерео каналах по определению разные, соответсвенно и искажаться будут по разному и разница в фазах не сохранится.
                  • +5
                    При чем тут нужна или не нужна. Написан бред:
                    >Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут_захвачены_идеально_и_полностью, и бесконечно высокая частота дискретизации для этого не нужна
                    >С математикой не поспоришь, но в чем же сложности?
                    Причем бред написан еще с таким понтом типа «с математикой не поспоришь, сосунки», и написан уже во второй статье подряд.
                    И все, адвокатом автора работать не нужно.
                  • +1
                    >В реальном мире происходит вот что
                    Ну вот еще один. Гражданин, посмотрите видео, на которое есть ссылка в статье: xiph.org/video/vid2.shtml Там наглядно показывается как «расколбашенный» цифровой сигнал становится на выходе синусоидой, идентичной исходной. Вам еще раз говорят, МАТЕМАТИЧЕСКИ доказано, что сигнал восстанавливается идеально при использовании sinc интерполяции.
                    >Теорема говорит о теоретическом восстановлении бесконечного синусоидального сигнала
                    Вы бы хоть прочитали формулировку теоремки-то, прежде чем говорить. Там говорится "«любую функцию F(t)...". А на практике не удастся восстановить только длины волн длиннее самой записи, т.е. например, цифровая запись длиной 10 секунд содержит частоты аж до 0,1Гц (Частоту 0 не считаем). Вам оно надо?
                    • 0
                      Впаривать про МАТЕМАТИЧЕСКИ доказано будешь вместе с автором на лекциях по чудо-фильтрам Петрика. Математика — наука точная. Не «ну слушай чувак, ушами же не слышно, позолоти ручку», не «вам оно надо, подрихтуешь, как новенькая будет», не «и бросайте заниматься DSP, гражданин, а регистрация у вас есть, почему не в армии», а точная наука. В наперстки играть не надо. Заявил «Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью» — отвечай за слова, не пацан что ли. Вот 22050 мы захватить не можем. А 22049,9999999 будет? Через год? А 22049,99? А 22049? А 22040?
                      Каждый раз одно и то же, только оппоненты меняются: нет бы не выпендриваться и написать «восстанавливается с достаточной точностью при частотах достаточно ниже f_nq — и нам в принципе пофиг — из-за неидеальности крутизны фильтра перед АЦП мы такие частоты и не оцифруем в любом случае», нет, начинается эта хрень про МАТЕМАТИЧЕСКИ доказано, абра-кадабра, именем Докинза. Стоит ли говорить, что идеальной sinc-интерполяции тоже не бывает, потому что sinc, внезапно, тоже бесконечный во времени сигнал, и свертка с ним занимает бесконечное время, причем как в будущее, так и в прошлое? Но нет — «МАТЕМАТИЧЕСКИ доказано, что сигнал восстанавливается идеально при использовании sinc интерполяции». Может вам комнату пропылесосить нашими отличными пылесосами? М-А-Т-Е-М-А-Т-И-Ч-Е-С-К-И.

                      По моему примеру. Мне надо было вот так сделать — jsfiddle.net/zad08hj0/9/?
                      Я так не сделал, потому что на таком графике ничего не понятно. Я сделал две вещи — вывел синусоиду с частотой 22040 (f_s/2 — 10) и далее поделил частоту дискретизации на 40, чтобы быстрее считалось и в 150 точек влезло больше. Усё — затратил не больше нескольких минут вместе с поиском примера highchart.js. Предельно наглядно — на моем графике видно, что сигналы, близкие к f_nq начинают амплитудно модулироваться с частотой (f_nq — f_сигнала) и отсюда проблемы — если сигналы очень близки, то модуляция становится очень медленной.
                      При этом, если подумать, понятно, что эта модуляция возникает из-за неотфильтрованного f_nq — то есть волны, которой в итоговом сигнале не должно быть, и по Котельникову мы смело можем это отфильтровать, но чем ближе f_сигнала к f_nq, тем сложнее этот сигнал отфильтровать — нужен фильтр все более и более высокого порядка, со все более и более сильной крутизной. Если у нас есть бесконечное время, конечно, и мы можем свернуть сигнал с бесконечным sinc (у которого Фурье-спектр — прямоугольник, если что) — то нет вопросов. Но в реальности — нет. Собственно, DrSmile примерно об этом написал еще вчера (что для адекватной работы требуется буфер не менее 0.5 мс) — и я никак это не прокомментировал, потому что он прав, но он почему-то не заявлял о том, что «100% математическая фирма, не Китай, покупай быстрее».
                      Если кому-то не очевидно, что не бывает так, что 22050 не работает, а 22049,99(9) работает (о чем говорит теорема собственно, 0 меньше f меньше f_s со строгими неравенствами), то очень жаль, но могу дать эвристическое правило: в реальном мире не бывает строгих неравенств, и любая математика начинает работать с некоторым переходом.
                      • +2
                        >Впаривать про МАТЕМАТИЧЕСКИ доказано будешь вместе с автором на лекциях по чудо-фильтрам Петрика…
                        У кого-то бомбануло.
                        Так, дорогуша, давай разберем по частям тобою написанное:
                        >В реальном мире происходит вот что:
                        >jsfiddle.net/txbj9cfd/
                        >Сигналы около частоты сэмплирования не по-детски колбасит по амплитуде… И такая хрень происходит ЗАДОЛГО ДО ПОЛОВИНЫ ЧАСТОТЫ СЭМПЛИРОВАНИЯ

                        -Дал пример, на котором у него «колбасит» цифровой сигнал, при этом не показал, что он отлично восстанавливается. Это же ложь, прямо как Первом Канале.
                        -Сказал «задолго до частоты найквиста», хотя на практике в записях длиной пару минут можно было бы восстановить сигнал, полагаю, ажно до 22049 Гц. Ну если бы сигнал был квантован с достаточной точность, конечно. Но никому такая точность не нужна, конечно.
                        -Поливает Автора говном, якобы он врет. А чего с учителями школьными не ругаешься? Они тоже не все рассказывают, а иногда даже привирают. Всегда есть нюансы, только толку о них рассказывать? Это не лекция в университете. И совсем не повод беситься.

                        >Вот это реально бесит. Теорема говорит о теоретическом восстановлении бесконечного синусоидального сигнала. Потому что если у нас есть бесконечность во времени, мы легко можем взять любой самый кривой сигнал и выяснить, какая у него на самом деле амплитуда и фаза.
                        Тебя бесит его неточность, а сам исковеркал теорему до неузнаваемости:
                        -Еще раз скажу, что функция может быть произвольной, не обязательно синус
                        -Она еще и не обязана быть периодической, что сразу исключает возможность «выяснить амплитуду и фазу» в общем случае.

                        Да, я согласен, что на практике математические идеалы недостижимы. Но отличие практики от теории не такое существенное, чтобы брызгаться слюнями.
                        • 0
                          >У кого-то бомбануло.
                          Угу, я затраллен.
                          >Дал пример, на котором у него «колбасит» цифровой сигнал, при этом не показал, что он отлично восстанавливается.
                          Я написал «теоретически можно восстановить, но на практике никакой ЦАП это делать не будет» и умыл руки.
                          Это полуаутистический спор, который не стоит выеденного яйца — но я, тем не менее, прав. Можно, конечно, в конце поста приписывать, что «Да, я согласен, что соснул, но ты какашка со слюнями», но я-то вообще особо спорить и не хотел. Дал фиддл — играйся, но ты все равно не доволен.
                          >Сказал «задолго до частоты найквиста»
                          В отличие от «математиков», я считаю ошибкой употреблять бинарные термины типа «идеально» и «точно». Разрешение FIR-фильтра для типичного буфера (ниже упоминают 0.5 мс) можешь сам посчитать (можешь?) — и это действительно «задолго» для меня. Если для тебя нет — не вопрос. Если ты по-прежнему считаешь, что это «идеально» — ну это не мои проблемы.
                          >хотя на практике в записях длиной пару минут можно было бы восстановить сигнал, полагаю, ажно до 22049 Гц.
                          Чтобы отфильтровать 22049, нужно разрешение фильтра порядка 1 Гц. То есть порядка секунды времени на 44100. Не две минуты, но все равно много — это такой размер буфера, что ты после нажатия кнопки play будешь ждать секунду, чтобы послушать музыку. Две минуты — вообще нереально, это уже не ЦАП будет, а целый компьютер.
                          И никто этого делать не будет.
                          Внимание, вопрос — почему автор этого видео остановился на 20 кГц?
                          >Поливает Автора говном, якобы он врет.
                          Он постоянно занимается подтасовками, чтобы доказать свою правоту, этим он мне несимпатичен. Но врет… Я сам знаю как написать здоровый текст без косяков в изложении — никак. Тем более тут еще и перевод. Это ерунда, что доказывает то, что я не стал писать ему гневное письмо, а просто трындю на гиктаймзе. И трындел бы меньше — но тем оказалась горячей почему-то.
                          >Еще раз скажу, что функция может быть произвольной, не обязательно синус
                          Синус, сумма синусов — это не принципиально. Важно, чтобы люди понимали, что это работает только в случае бесконечных сигналов с бесконечной точностью по амплитуде.

                          Остальное буду писать в личку.
                          • +1
                            В общем, чтобы остановить спор, резюмирую:
                            В настоящее время обычно не сохраняют частоты в упор до частоты найквиста, потому что восстановить будет «дорого».
                            Если приспичит, восстановить сигнал можно с требуемой, точностью, лишь бы длины записи хватило.
                    • 0
                      Смотрите сюда: jsfiddle.net/zad08hj0/1/
                      Я взял ваш код и из этого «говна» восстановил исходную синусоиду почти идеально.
                      • 0
                        Идеально не получится, т.к. у куска синусоиды бесконечный спектр на границах, что не укладывается в требования теоремы :-)
                      • 0
                        А вот сигнальчик посложнее: jsfiddle.net/zad08hj0/2/
                        В самом начале синий восстановленный сигнал отличается от исходного зеленого из-за отсутствия информации о прошлом, но очень быстро становится от него неотличим.
                        • 0
                          Немного «подрефакторил» и добавил zoom, уменьшил толщину линий: jsfiddle.net/zad08hj0/7/

                          Жалко, КДПВ не могу прикрепить…
                          • 0
                            Спасибо за труды. Действительно выглядит суперски. Больше часа игрался. :-) Поэкспериментировал — алгоритм очень хорошо восстанавливает сигнал даже в случае вибрато (когда сигнал в интервале не постоянной формы, а с изменяющейся частотой или амплитудой). При очень сильных вариациях, конечно, отклонения от исходного сигнала нарастают, но если учитывать, что они заметны только при частоте, близкой к предельной, то вряд ли это существенно скажется на звучании.
                            Спасибо! Вы меня переубедили.
                        • 0
                          Теорема говорит о теоретическом восстановлении бесконечного синусоидального сигнала

                          При восстановлении конечных сигналов искажения будут проявляться на конечном расстоянии от начала и конца записи. Это расстояние составляет доли секунды.
                        • +2
                          Это ответ к комментарию #comment_8265138

                          Человек услышит несовершенство реального оборудования, работающего в непредусмотренных режимах, а не разницу между 44.1 и 96, причём при 96 и наличии ультразвука искажений будет больше. При идеальном оборудовании разницы между 44.1 и 96 не будет никакой.

                          Около частоты семлирования колбасит кривую визуализацию. На выходе ЦАП почему-то всё отлично — можете лично проверить осциллографом на любом сигнале.

                          По поводу реального мира и идеальных условий: в реальном мире можно с любой конечной точностью приблизиться к идеальным условиям, и бесконечной точности не требуется, т.к. точность ушей ограничена.
                          • 0
                            Давайте двигаться от предельной точки: У вас на входе частота ровно Fs/2 и все отсчеты попали в нули. Услышите что-то? Совершенно законно, что нет, и Котельников с Найквистом всем об этом явно говорят.

                            Продолжаем мысленный эксперимент: Уменьшаем частоту сигнала на d << Fs. На одну тысячную, скажем. Теперь согласно К. и Н. вы имеете возможность восстановить сигнал — но только если пронаблюдаете за ним достаточное время и сигнал все это время будет неизменен. Если же сигнал закончился раньше — вы увидите лишь обрезок одной из реализаций сэмплирования, которая не отразит реального сигнала. На картинке ниже показан пример кусочка синусоидального сигнала, амплитуда которого изначально была равна 1.
                            • 0
                              Хотите бесконечный по времени периодический сигнал, чтобы как в теореме, — зациклите мысленно любой конечный звуковой файл, если так любите мысленные эксперименты :-)

                              И какая-же будет максимальная погрешность при корректном восстановлении, если длительность типичного реального звукового файла измеряется в секундах как минимум?
                              • 0
                                Дело не в длине файла, а в длине конкретного синала. Еще раз хочется подчеркнуть, теорема К. справедлива для статического типа сигналов, которые продолжаются бесконечно долго. В примере выше показан кратковременный сигнал (частотой близкой к Fs/2). Как вы можете видеть, он, по сути был сожран — от его амплитуды осталась 1/100. И никак вы его не восстановите обратно цапом.
                                • 0
                                  Мысленно зацикленный звуковой файл является статическим и бесконечно долгим. Не вижу никакого смысла в вашем примере с суперкоратковременным сигналом с частотой, близкой к предельной, ибо для восстановления формы сигнала из реального звукового файла с такими короткими фрагментами работать не требуется.

                                  Ниже уже написали, что при частоте дискретизации 44.1 кГц и при максимальной частоте сигнала 20 кГц (запас в 2 кГц), потребуется фрагмент всего 0.5 мс для корректного восстановления.
                                • 0
                                  Зацикливать некорректно — в общем случае переход между концом и началом не будет гладким. Это допустимо только для случая, когда все гармоники (точнее, их длины волн) укладываются целое число раз в рассматриваемый фрагмент.
                                  • 0
                                    От щелчка на границе не спасут ни огромная частота дискретизаци, ни применение полностью аналоговой техники. Поэтому на границах делают плавное нарастание и плавное затухание.
                                • 0
                                  Я прошу прощения, но мне кажется, что на картике, указанной Вами, ну никак не синусоидальный сигнал. Модулированный синус — это может быть. Но если разложить, например, X*sin(X) в ряд Фурье, то получим нечто, совершенно отличающееся от обычного синуса, не так ли?
                                  • +7
                                    Это именно что чистый синус, просэмплированный частотой чуть выше, чем две частоты сигнала.
                                    Примерно вот так, если приблизить
                                    • 0
                                      Эта картинка гораздо понятнее, спасибо!
                                      Тем не менее, поднятая Вами проблема проявляет всего лишь (как уже упомянуто в других ответах) вопрос минимальной длительности фрагмента кодирования.
                                      В частности, по конкретно этой картинке, где частота сигнала 4/25 (0.160), а частота семплирования 1/3 (0.333, что действительно немного больше 0.320), достаточно интервала длительностью 1/(0.333-0.320)/2=75/2 (действительно, на моменте 75 мы зацикливаемся и опять начинаем все с нуля, но половину этого времени отсчеты просто повторяются с отрицательным знаком), чтобы полностью восстановить указанный синус. Ну а частота семплирования 44кГц требует 0.5мс для кодирования всего диапазона до 20кГц.
                                      • –1
                                        Опять откуда-то берутся эти 20 кГц. Автор утверждает что 22050 не работает, а 22049,9999 — уже работает — математика же, что есть бред, произнесенный с умным лицом.
                                  • 0
                                    На картинке ниже показан пример кусочка синусоидального сигнала, амплитуда которого изначально была равна 1.


                                    Вы неверно восстанавливаете сигнал :). Линейная интерполяция попросту очень плохой способ восстановления сигнала, для «честного» сравнения нужно взять БПФ от Вашей выборки, затем дополнить его большим количеством нулей в высоких частотах и развернуть обратным БПФ сигнал обратно. Как более наглядный вариант — следует использовать en.wikipedia.org/wiki/Lanczos_resampling
                                  • 0
                                    Кое в чем товарищ megalol прав: разница между максимально достижимой частотой и частотой Найквиста (в идеальном случае) порядка обратного времени задержки на устройстве декодирования. В случае 44.1кГц есть запас в 2кГц — т. е. задержка составит порядка 0.5мс, для 48кГц — 0.25мс.
                                    • +3
                                      Если я слушаю винил, я слушаю непосредственно то, что выдает аналоговая аппаратура, и когда я слушаю виниловый рип, я хочу слышать то же самое. Как будто я пришел домой к автору рипа и подключил к его аппаратуре свои колонки. А не дополнительные интерполяционные фильтры.
                                      С современной музыкой еще проще — если электронный музыкант работает в 96 или 192, пусть и релизит так же. Я, например, в 48 работаю — жалко процессорной мощности, хотя многие эффекты в 96 звучат лучше из-за уменьшенного алиасинга. Тот же FM-синтез.
                                      Оригинал должен быть наименее отредактированным. Потому что, если я захочу, я всегда включу ресэмплинг в 44100, а вот наоборот никогда не получится. Это та же банальная вещь, как фотограф, продающий многомегапиксельный исходник, даже если работу будут использовать на айфоне. Музыка должна быть доступна в том качестве, в котором работал музыкант. А так как большинство нелинейных эффектов чувствует себя намного лучше при передискретизации — то соответственно и 96/192 вполне нужный формат.

                                      По поводу 'На выходе ЦАП почему-то всё отлично — можете лично проверить осциллографом на любом сигнале. ' — в теореме речь вообще-то об АЦП, не знаю, стоит ли продолжать, или нет. То, что в аналоге можно представить любой цифровой сигнал — это никакая теорема не нужна, на то он и аналог. А визуализация нормальная, просто нужно понимать головой, что она визуализирует.

                                      По поводу «точность ушей ограничена» — это блин в первую часть. Основное уродство в том, что в первой части автор утверждает, что уши разницу не слышат, а во второй — что слышны отзвуки вредного ультразвука.
                                      • +1
                                        Господи, и еще он занимается DSP *facepalm*
                                        >в первой части автор утверждает, что уши разницу не слышат, а во второй — что слышны отзвуки вредного ультразвука
                                        Уши ультразвук не услышат. Услышат они индуцированные искажения в слышимом диапазоне, вызванные несовершенством воспроизводящей аппаратуры. Через мои дешевые колонки, например, очень хорошо их слышно, а в хороших наушниках — очень тихо и только на максимальной громкости. Чего тут не понятно?
                                        • 0
                                          Мне вот непонятно почему один и тот же wav файл, на одних и тех же колонках на одной и той же громкости, воспроизведённый WinAMP'ом даёт эти самые «искажения», а при воспроизведении в Audition таковых не даёт? Вернее принципиально я догадываюсь что дело в драйверах посредством которых обе программы общаются с операционкой, но вот многие такие вещи не учитывают и от того получают неверные результаты.

                                          Собственно, и из-за этого я тоже склонен согласиться с megalol — автор статьи просто очень умело подтасовывает результаты, вот и всё.

                                          Я даже не поднимаю другие вопросы, которые у меня возникли при прочтении цикла статей. Просто потому что не хочется мне срач разводить. Всё же статейка не плохая, но не идеальная.
                                    • 0
                                      Я так думаю, что не просто так эти форматы студийными обозвали: для некоторых аудиоэффектов и преобразований неплохо было бы иметь запас в плане точности и в плане частоты дискретизации.
                                      Простейший пример: если замедлить запись 24/192 в два раза, то получится уже 24/96, а если 16/44, то будет уже 16/22.
                                      • 0
                                        Если правильно делать интерполяцию в эффектах, то можно и при при частоте дискретизации 44100 обрабатывать. Думаю так не делают из-за того, что оверсемплингом проблема решается проще, чем постоянным точным вычислением, какое значение принимает сигнал где-то между отсчётами.
                                        • 0
                                          «постоянным точным вычислением, какое значение принимает сигнал где-то между отсчётами» и есть оверсэмплинг, мыслитель. И так часто делают, что внутри прибора 96 или 192, а наружу выдается 48000. Только, естественно, это хуже, так как в цепочке эффектов постоянно делается ап- и даун- сэмплинг.
                                          • 0
                                            При оверсемплинге с 48000 до 192000 точно вычисляются только 3 фиксированных точки между отсчётами. А между ними делают интерполяцию попроще.
                                            • 0
                                              Интерполяция по-другому называется апсэмплинг. Просто по определению. А даунсэмплинг называется децимацией. Поэтому фраза «Если правильно делать интерполяцию в эффектах, то можно и при при частоте дискретизации 44100 обрабатывать» то же самое, что и «Если правильно делать апсэмплинг в эффектах, то можно и при при частоте дискретизации 44100 обрабатывать».
                                              Вы под интерполяцией имеете в виду что-то вроде «посчитать промежуточное значение, использовать и тут же его выкинуть», но принципиальной роли это не играет.
                                              • +1
                                                Из википедии:

                                                При децимации из исходной последовательности отсчетов

                                                a0, a1, a2, …

                                                берется каждый N-й отсчет (N — целое число):

                                                a0, aN, a2N, …; N > 1

                                                остальные отсчеты отбрасываются.

                                                Так что вы говорите ЧУШЬ. Децимация — это очень частный случай даунсемплинга. И бросайте заниматься DSP, потому что у Вас с такими знаниями будет получаться очень ХРЕНОВЫЕ DSP.
                                      • –1
                                        Неубедительно.
                                        • +2
                                          Вообще, очень удивительно, что разработчик популярных форматов (то есть человек просто обязан быть в теме) рожает такую водянистую, невнятную, неубедительную статью. Много общих слов, много натяжек, мало конкретики. Я-то думал, что вот сейчас придет гуру и всё так по полочкам разложит, что все застынут в немом восхищении. А тут кисель.
                                          • 0
                                            Вот это и странно. Оказывается столько специалистов есть, но хороших звуковых форматов почему-то мало. Может всем специалиастам противна сама мысль сжатия объемов звуковых файлов?
                                            • 0
                                              Количество звуковых форматов вполне нормальное.
                                              Кстати, количество форматов изображений или архивов, выдержавших проверку временем, тоже относительно невелико.
                                              Если копнуть историю, их окажется в разы больше.
                                        • 0
                                          Аргументы не очень убедительны.

                                          Во-первых, у сигнала есть не только частота, но и форма. В простейшем случае это синусоида, пила, прямоугольник или треугольник. Хотя бывают и более сложные случаи. Если у нас частота дискретизации 40 кГц, а частота сигнала 20 кГц, то сигнал любой формы будет выглядеть как последовательность минимального значения сигнала и максимального. То есть они будут идентичны. ЦАП воспроизведёт в зависимости от своих выходных фильтров синусоиду или прямоугольник, хотя исходно там могло быть что-то другое. Только если на один период будет приходиться несколько замеров получится однозначно определить форму сигнала. Возможно, человек не может услышать разницу между пилой и синусоидой на 20 кГц (да и не все вообще могут слышать эту частоту), однако говорить, что искажений не будет нельзя.

                                          Во-вторых, насчёт 24 бит вообще нет ни одного аргумента. «16 бит не покрывает весь слуховой диапазон, однако очевидно, что нет смысла делать 24 бита ЦАП». Кому очевидно? Мне нет. Хотя я не исключаю вероятности того, что 16 бит действительно достаточно для воспроизведения, хотелось бы увидеть аргументы, а не констатацию мнения автора. Про частоты хотя бы были рассуждения.
                                          • +3
                                            Форму периодическую сигнала дают обертоны — они имеют частоту кратно выше, чем основной тон. Если частота прямоугольного сигнала 20 кГц, то он разлагается в бесконечный ряд фурье как sin(20 кГц) + sin(40 кГц)/2 + sin(60 кГц) / 3…
                                            И все, кроме основного тона в 20 кГц, лежит выше требуемой частоты. Поэтому, что все, что выше 20 кГц невозможно передать при частоте дискретизации 44100, поэтому о прямоугольнике тут речи идти не может. На выходе, соответственно, тоже будет синусоида — ультразвук в 40 кГц человек не услышит.

                                            А про 24 бита не может не быть аргументов, потому что их нет. 16 бит небольшой динамический диапазон.
                                            • 0
                                              16 бит достаточно будет для воспроизведения если не поднимать уровень громкости на выходе до болевого порога. Вы ведь не часто слушаете музыку с таким перепадом громкости? Нормальный уровень громкости, безопасный для уха — это 60Дб, этот диапазон покрывается 16-ю битами с лихвой. Повысить дискретность может потребоваться только для прослушивания изначально записанных тихих композиций, которые требуется усилить цифровым методом. Часто такое бывает в диктофонах, когда при записи на 16бит активно используется только младшие 8 из-за изначально тихого источника. Вот там 24 бита были бы очень кстати.
                                              • 0
                                                На самом деле, динамический диапазон на средних и, особенно, низких частотах гораздо больше этих 16 бит (dithering). Соответственно, качественный преобразователь увеличивает динамический диапазон ценой высокочастотного шума. Даже были предложения формата однобитного (!) звука с мегагерцовой частотой дискретизации.
                                                • +1
                                                  SACD имеет частоту 2,8224МГц
                                                  • 0
                                                    уже второй раз вижу упоминание об этом формате, но почему-то никто его еще не сравнил с предлагаемым, мне лично нравится идея такого кодирования: все биты равнозначны, воспроизводить можно просто сглаживая, из минусов вроде только сложности обработки
                                                    некотоые плюсы из википедии:
                                                    сигнал имеет замечательные характеристики: динамический диапазон более 120 дБ, частотная характеристика от 0 до 100 кГц
                                                    Подобная запись устраняет необходимость процессов децимации и интерполяции для аналогового ввода-вывода
                                              • 0
                                                Для сигнала частотой 20кГц и формой отличной от синусоиды спектр выходит за пределы 20кгц — на самом деле это сумма из нескольких синусоид.
                                                • 0
                                                  32 бита, кстати, используется для промежуточных расчетов, т.к. там используются числа с плавающей точкой, что упрощает расчеты и позволяет избежать большей потери точности.
                                                  • +2
                                                    Бедный Монти.
                                                    Статью написал — «неубедительно».
                                                    Снял видео с наглядной демонстрацией, что никаких ступенек АЦ-ЦА преобразование не добавляет — всё равно находятся «золотые уши», которые «колебания между битами» и «нестабильность осциллятора» распознают.
                                                    Что дальше? Разрабатывать передачу голографических данных?
                                                    • +1
                                                      Любители 192000 Гц потратили кучу времени на поиск и скачивание контента с такой частотой дискретизации, а потом радовались офигенной детальности. А тут кто-то берёт и нагло утверждает, что это всего лишь самовнушение, и в реальности никакой детальности не прибавляется. Психика любителей 192000 Гц уходит в защиту и высасывает из пальца любые аргументы, чтобы настроение не портилось :-)
                                                      • 0
                                                        Не так. Кто-то берет и пафосно давит авторитетом теорем, смысла которых не понимает. Когда прижимают к стенке — начинает вилять, про «разницу все равно не услышишь», «психоакустические эффекты» и т.д. Специалист про психоакустике — так и объясняй, а Найквиста не трожь, раз не понимаешь о чем там шла речь.
                                                        • 0
                                                          В каком месте его к стенке прижали?
                                                        • 0
                                                          Я вообще не являюсь аудиофилом — в качестве плеера использую телефон или ноутбук, в качестве наушников — затычки за несколько десятков долларов. Я понятия не имею в психоакустике и прочем, но имею некоторые познания в электронике. И я всего лишь указал, что:

                                                          1) Теорема Найквиста обещает сохранение частоты, но не формы сигнала. Если сигнал не является синусоидальным, то большая частота дискретизации позволит лучше передать его форму. Заметит ли разницу человек? Не знаю, но осциллографом её точно можно будет заметить. Как верно мне возразили — сигнал сложной формы на самом деле состоит из нескольких частот. И то, что придаёт ему такую форму, окажется в ультразвуковом диапазоне. Получается, что человек не сможет отличить синус 20 кГц от прямоугольника. Или сможет?

                                                          2) Про 24-битные ЦАП не было приведено ни одного аргумента против. Только указано, что 24-битные АЦП делать смысл есть, а 24-битные ЦАП — нет. Просто мнение без аргументов. Я не утверждаю, что человек увидит разницу между 16 и 24 битами, но утверждаю, что в статье это не доказано. Человек может не верить в бога, однако если он адекватен, то согласится, что фраза «Ололо, бога нет, веруны идиоты» не убедительное доказательство атеизма, нужна аргументация получше.
                                                          • +1
                                                            >Теорема Найквиста обещает сохранение частоты, но не формы сигнала.
                                                            Ошибаетесь. Обещает сохранение формы в том числе. При условии, что там нет частот выше найквиста. Если не сохраняет — значит там были частоты выше.

                                                            >Про 24-битные ЦАП не было приведено ни одного аргумента против.
                                                            Если вы откроете оригинал, то увидите аргументы. Будет третья часть перевода, по всей видимости.
                                                            А вообще в этой второй части есть ссылка на видео, где говорится и о битности тоже.
                                                    • 0
                                                      Мы не знаем, какие генно-модифицированные меломаны будут слушать нашу музыку в XXII веке, так что оригинал всё равно надо хранить в максимальном качестве.
                                                      • 0
                                                        Мы не знаем, какие глаза будут смотреть на документы в XXII веке, поэтому надо сканировать все документы в ИК и УФ диапазонах.
                                                        • 0
                                                          От документа не требуется естественность внешнего вида.
                                                          • 0
                                                            От музыки — тоже. Ладно бы это были звуки естественного происхождения, где возможны самые разные частоты — но мы же говорим о музыке. О звуках искуственного происхождения, которые издаются музыкантами при помощи несовершенных инструментов в соответствии с их собственным восприятием этих звуков. А современные музыканты высоких частот не слышат и даже не знают, какая какофония может в их музыке на тех частотах твориться.

                                                            Тут наоборот надо тогда уж, запретить хранить высокие частоты в современной музыке, чтобы мутанты из XXII не услышали того, что никто слышать не должен :)
                                                            • +1
                                                              Они и так это могут сделать. Даунсэмплинг — это билет в один конец. Почему-то никого не удивляет, что изображения хранят в повышенном качестве — много для чего, но для звуков это страшный грех. Почему? У автора два аргумента: «ультразвуковая составляющая никогда не является достоинством» и «Ни одна из этих причин не имеет отношения к воспроизведению звука». Короче вкусовщина, которая завернута в воду а-ля «обработка сигналов для самых маленьких».
                                                              • 0
                                                                Изображения, в отличие от музыки, можно масштабировать. Повышенное число точек на дюйм — это попросту запас для увеличения.

                                                                Но какой смысл растягивать музыку во времени? Фигня же получится в итоге.
                                                                • 0
                                                                  Опять «какой смысл» и «фигня». Вот и вся наука.
                                                                  Диджеи постоянно замедляют музыку для создания сета. И для ускорения, кстати, лишние дискреты не повердят. Кто-то может захотеть засэмплировать трэк (стиль dj screw и витчхаус основаны на сильном замедлении). Кому-то просто нравится звучание с ультразвуком — если эти люди отличают в слепом тесте (например, из-за нелинейных искажений — не суть, отличают же, и _им_ нравится), врубать мессианство и говорить, что «тебе это не нужно» — нельзя. When Levee Breaks у Led Zeppelin замедлен, например — и я хочу замедлить другие их треки и послушать, как они звучат. Мне очень нравятся ранние Prodigy, замедленные в полтора раза, когда детально слышен каждый брейк и звучит он как в фанке. Слышали джангл, звучащий, как хип-хоп? Мало у кого какие запросы — может и генно-модифицированные меломаны или пришельцы с альфы Кентавра. Лишние 10 мегабайт по-моему вообще не вопрос сейчас, что мне требовалось писать так много всего, с чем сталкивался лично я. Рипаешь винил — рипай так, как слушаешь сам, а еще лучше — без фонокорректора. Продаешь музыку — в том виде, в котором сделал музыкант. Вот и вся наука.
                                                                  • 0
                                                                    Продаешь музыку — в том виде, в котором сделал музыкант.
                                                                    Музыкант сделал исключительно ту часть звука, которая в слышимом диапазоне. Ее и надо записывать и продавать.
                                                                    • 0
                                                                      Вот его — www.youtube.com/watch?v=_QUcPq0FauU как релизить будем? Там по ссылке глухой пианист. Ну это экстремально, но вот я выше 18 кГц не слышу — мне все в 38000 релизить? А мой отец выше 12 не слышит — строителем работает, с его музыкой как быть, 26000 герц и ни герцем меньше? А индивидуальную восприимчивость уха музыканта тоже нужно воспроизводить?
                                                                      Музыка творится в голове у слушателя. Больше нигде ее не существует. И чем больше у слушателя возможностей — тем лучше. Я бы музыку вообще по дорожкам релизил. Чтобы вместо эквалайзера, если, допустим, человек хочется увеличить бас, он мог бы просто сделать громче дорожку с бас-гитарой. Но это — мечты (причем большей частью антикопирастические — трекерная музыка такое может с начала своего существования), а передискретизация — ничего не стоящая реальность.
                                                                      «Если в слышимом диапазоне — то это и правда уродует запись. Если далеко за пределами — то там только мусор.» — это личное мнение. Если так хочется, никто не запрещает провести индивидуальное тестирования слуха, выяснить предельную слышимую частоту и перекодировать коллекцию так, чтобы никаких неслышимых частот там не было. Год рождения 1990 — значит 20 кГц скорее всего вы не слышите, поэтому 44100 вам противопоказана, вперед избавляться от мусора. К 40 годам придется еще раз перекодировать — еще на 20% хуже. Но это ваши заморочки, мессианство тут устраивать не нужно.
                                                              • 0
                                                                не слышат и даже не знают, какая какофония может в их музыке на тех частотах твориться.
                                                                Может твориться, а может и не твориться. По той же логике некоторые звукорежиссёры очищают запись от шумов при переиздании. Им кажется, что они избавляются от какофонии, но для многих меломанов высокие частоты инструментов гораздо важнее, чем шумы; для них запись оказывается изуродованной.
                                                                • –1
                                                                  Высокие — это какие? Если в слышимом диапазоне — то это и правда уродует запись. Если далеко за пределами — то там только мусор.
                                                                  • 0
                                                                    Откуда вы знаете? Думаю, там такие же гармоники, и такой же вклад акустики помещения, дающий эффект присутствия. А если и нет — то не страшно, всегда можно отремастерить.
                                                              • +1
                                                                Ок, тогда речь про картины. Почему не сканируют картины, захватывая ИК и УФ? Их тоже глаз не видит, но они же есть. Они же влияют на атмосферу. Надо сделать два отдельных канала в jpg — для ик и уф.
                                                                • 0
                                                                  Потому что это очень дорого.
                                                                  • 0
                                                                    Запись с хорошим качеством тоже не дешевле обычной.
                                                                    • 0
                                                                      Нет, это бесплатно — АЦП в любом случае работает при передискретизации. Аналог с фото — это «зачем нам raw, всегда можно настроить баланс белого на фотоаппарате и снимать в jpeg».
                                                                      • +1
                                                                        Продолжая аналогию — снимая в raw все время, мы отказываемся от шумоподавления, автоматической коррекции искажений объектива, автоматического HDR, и прочих плюшек, которые улучшают фотографии в большинстве случаев, правда, в остатке мешая тем, кому это точно не надо. А еще тратим кучу места зря, ради хранения информации, которой большинство людей не пользуется, и не будет пользоваться, и тратим процессорные ресурсы на кодировку и декодировку этого всего.
                                                                        Но вообще аналогия уплыла не туда.
                                                                        • 0
                                                                          Я, в отличие от оппонентов, не утверждаю, что кому-то надо что-то делать _все_ время. Даже если трек в таком качестве понадобится 0,01% слушателей, в чем проблема его в таком качестве держать? Пусть остальные качают mp3 192 kbps — и я буду в их числе, я из тех дундуков, что не слышит разницы между 192 и 320 на мониторах за тысячу долларов.

                                                                          А от всего перечисленныего мы не отказываемся, мы отказываемся от необратимых изменений — то есть всегда можем поменять алгоритм шумоподавления, например. То же и с АЦП — вырезание ультразвука является необратимым изменением.
                                                                          • 0
                                                                            Лучше потратить место на что-то более полезное, чем ультразвук: хранить несколько звуковых каналов, несколько вариантов мастеринга для разных ситуаций и т.п.
                                                                            • 0
                                                                              Я так и представляю, как чел в студии за несколько тысяч долларов сохраняет результат в 44100, чтобы сэкономить место.
                                                                              А по поводу «разных каналов» — квадрофония не взлетела (дорого), а разные инструментальные треки, ниже писал: не дадут релизить копирасты — в таком случае очень легко своровать, допустим, партию баса. С разным мастерингом — можно предложить индустрии, нормальная идея.
                                                          • 0
                                                            Знакомый звуковик лет десять назад на эту тему сказал, что не видит разницы и не использует в работе 96, 192 и т.д. килогерц. Видимо знал, что внутри железа оно все обрабатывается на более высоких частотах.
                                                            • 0
                                                              Динамик, предназначенный только для воспроизведения ультразвука, усилитель и разделитель спектра сигнала, чтобы разделить и независимо воспроизводить ультразвук, который вы не можете слышать, чтобы он не влиял на другие звуки.


                                                              почему в таком случае просто не разделить сигнал и не воспроизводить ультразвук если он не слышен…
                                                              • 0
                                                                Как-то неточно переведено, смысл исказился:
                                                                >The ultrasonics are a liability during playback.
                                                                >а во время воспроизведения возникают ультразвуковые волны

                                                                Надо было перевести как-то так:
                                                                >ультразвук является проблемой во время воспроизведения.
                                                                • 0
                                                                  А по-моему, вопрос не так уж и актуален. Многие современные артисты пишутся нынче на 24 бита, продавая треки через веб, и это уже становится нормой. Как раньше считалось нормальным писаться на CD и кассеты одновременно. Сейчас посмотрел на маркет — ни тебе карманных CD-плееров, ни кассетных плееров. Они вымерли как вид, но именно характеристики этих стандартов ограничивали движение к более высокому качеству звука: у кассет изначально из-за низкой скорости движения ленты, у дисков — за счет жестких параметров стандарта. Ведь уже 40 лет с лишним лет прошло, а до сих пор много где в потребительской электронике не установлены идеальные, как говорится в статье и каментах, ЦАПы на 16/44,1, их характеристик, как правило, лишь достаточно для более-менее приличного звучания.
                                                                  Уходя с компакт-кассет с переписями винилов, сделанными еще в советские времена, на компакт-диски, я очень сильно раздразился качеству звучания альбомов 1973 и 1975 годов у Pink Floyd. Оно было вообще другим, весьма отличалось от того, что я слушал раньше. Я надеялся, что я придуриваюсь, но никак не мог себя пересилить. Другие записи, к примеру, при этом звучали абсолютно приемлемо. В 2003 году выходит переиздание на SACD, я с ним ознакамливаюсь, и прекращаю плеваться: вот он, этот долгожданный идеал. Не надо собирать винил, он тяжелый, и требует кучи дополнительного ухода, даже когда стоит на полке. И мне на такой идеал абсолютно не жалко места на жестком диске. А потом задаешься вопросом, а что, если провернуть эту ситуацию с другими альбомами? А вдруг я должен плеваться, хотя и не плююсь? И понеслась: виниловый рип от фирмы «Мелодия» в высоком разрешении звучит лучше, чем в переиздание 16/44,1? Да, забираю. Переиздание артиста на блю-рее? Звучит хорошо, забираю. И так — до бесконечности. И тут появляются синезубая гарнитура и мобила, с памятью на 32 гига. И ты понимаешь, что все твои HD-коллекции хороши только там, где места навалом, мобиле все равно это все декодировать до какого-то неясно приличного уровня. Долго и муторно ты конвертируешь их в ogg q8 16/44,1, сверяешь на мобиле через гарнитуру — нет разницы, включаешь на колонки с SoC, установленного на мобиле — есть разница, и притом существенная. Конвертируешь на q10 — фух, вроде как прилично, в общественном месте, где никто никого и ничего не слушает, подойдет. И места, вроде как достаточно, и самому не надо давить в себе жабу на покупку SD-карты.
                                                                  Мораль: формат, высокого разрешения, безусловно, нужен, но и инфраструктура к нему также необходима, иначе мы совсем не услышим различий, какие бы слуховые раковины у нас ни были. А уж какой он там, этот формат, что из себя представляет, 24 бита ли, 32 ли, если оно звучит лучше стандартного в 16/44,1, значит, и брать надо тот, который звучит лучше. Ну не будет никогда идеального ЦАПа у нас на 16/44.1, и, слава инженерам, что нашелся другой способ добиться более лучшего качества звука за меньшие деньги. А уж что слушать — всегда найдется.
                                                                  • +2
                                                                    1. Другое звучание издание на CD не имеет никакого отношения к формату Audio CD. Звук был сознательно испорчен при ремастеринге. Гуглите по словам Loudness war. На виниловых, SACD и блурейных переизданиях так звук не поганили, т.к. другая целевая аудитория.

                                                                    2. Родная частота ЦАП в мобильных устройствах — 48000 Гц (за исключением мп3 плееров, предназначенных именно для музыки). При проигрывании на мобильном устройстве файла с частотой 44100 Гц происходит преобразование в 48000 в реальном времени. И чтобы сильно не грузить процессор и не сажать батарею, происходит это с помощью линейной интерполяции, что вносит искажения, существенно влияющие на восприятие. Надо было конвертировать в 48000 Гц.

                                                                    3. Современный ЦАП 16/44.1 на самом деле работает на в несколько раз больших частотах. Данные 44100 Гц преобразуются, например в 176400 Гц. Потом происходит цифровая фильтрация, затем аналоговая. В результате получается то же самое, что было бы, если данные изначально были с частотой 176400 Гц. Слава инженерам, что нашёлся способ улучшить характеристики ЦАП без необходимости хранить файлы с частотой дисретизации больше 44100 Гц.
                                                                    • 0
                                                                      Что же это за ЦАПы? Покажите их.
                                                                      • 0
                                                                        Даже бюджетный PCM2704 работает по этому принципу. Подробности можете посмотреть в даташите на эту микросхему.
                                                                  • 0
                                                                    А вот и третья часть, коллеги.
                                                                    • 0
                                                                      Звук 30 кГц + звук 33 кГц (24 бит / 96 кГц) тишина
                                                                      Мелодии 26 кГц – 48 кГц (24 бит / 96 кГц) — что то едва заметное на максимальной громкости. честно сказать я боялся его слушать на макс громкости. Какие то всьу всьу всьу всьу всьу, но вот что то мне подсказывает что в какой либо композиции я их все равно не услышу так как это было реально очень громко. В коментариях как раз где то написали про схожесть зрачка и уха догадайтесь в чем. А потом может быть поиграюсь с записью этой дорожки на линейный вход воспроизводящей звуковой карты, что бы сравнить громкость сигнала с сигналом громкостью -0Дб воспроизведенному до этого. Но это если не поленюсь.
                                                                      Мелодии 26 кГц – 96 кГц (24 бит / 192 кГц) — тут я уже ничего не слышу
                                                                      Нарезка из песен, приведенных к 24 кГц (24 бит / 96 кГц WAV) тишина
                                                                      У меня подозрения на счет услышанного во втором фрагменте, что виноват кривой Pulseaudio. В винду перезагружаться лень.
                                                                      Наушники Seinhiser HD180, звук Asus Xonar DG (CMI8786)

                                                                      Тут статья навеяла о кривом ремастере на CD Metallica Death Magnetic. У меня, простите, бомбануло после прослушивания некоторых треков. Кстати ответ вот в этом комментарии чуть выше.
                                                                      • 0
                                                                        Повезло. Ибо у меня полный ахтунг на всех 4-х файлах. Там записи представлены на частотах выше 20кГц — при малейшей неидеальности аналогового тракта звуковой карты от ЦАП до наушников будет слышен звук в диапазоне 0...20кГц из-за интермодуляционных искажений.

                                                                        Во втором файле — две постоянно меняющиеся частоты в указанном диапазоне.
                                                                        • 0
                                                                          У барабанной перепонки есть немалая инертность. Чтобы заметно раскачать её ультразвуком нужно гораздо больше энергии, чем на слышимых частотах (возьмите в руки гантелю и медленно качайте её — это не сложно, но если вы будете качать её чаще, то для той же амплитуды колебаний потребуется прикладывать больше усилий, в какой-то момент необходимое усилие окажется за гранью ваших возможностей). Сомневаюсь, что обычная бытовая аппаратура сможет нанести вред вне слышимого диапазона.

                                                                          А ещё добавить сюда, что динамику тоже приходится тяжело на высоких частотах. ЦАП звуковой карты и усилитель колонок оптимизированы для воспроизведения сигналов на частотах до 20 кГц, на более высоких может упасть (возможно, даже сильно) их мощность и КПД.

                                                                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                        Самое читаемое