Как стать автором
Обновить
154.13

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

Исследование звука: удаление шумов

Уровень сложности Сложный
Время на прочтение 12 мин
Количество просмотров 2.4K

Обработка звука - это процесс исследования динамической/статической звуковой дорожки при помощи применения определенного набора линейных и нелинейных алгоритмов с целью получения необходимой информации. 

Алгоритмы динамической обработки звука работают с потоковым аудио, когда статически обрабатывают уже готовую звуковую дорожку.

Данный процесс происходит с использованием компьютерных программ и зачастую сопровождается трудными техническими вычислениями, которые ложатся на вычислительные мощности компьютера или на отдельные его комплектующие части. 

Процесс исследования и обработки звука так или иначе присутствует в разных сферах профессиональной деятельности, будь то голосовые помощники, встроенные в мобильные устройства или любые другие устройства, индустрия профессионального бизнес-сообщества для фиксирования необходимой информации  или же специальные службы, использующие самые современные технологии для расследования преступлений. 

Если мы говорим о задаче обработки звука, то чаще всего имеем в виду применение к звуковой дорожке определенного набора стандартных и собственных алгоритмов, которые позволяют получить определенный срез информации о дорожке или же получить новую трансформированную аудио дорожку.

Цель данной работы – исследовать алгоритмы удаления посторонних шумов из аудио дорожки.

Такое программное обеспечение будет полезно для автоматических субтитров во время онлайн-конференций, логирования бизнес-встреч, работы с глухонемыми и слабослышащими.

Читать далее
Всего голосов 7: ↑6 и ↓1 +5
Комментарии 0

Цифровая музыка на микрокомпьютерах (часть 1/2)

Уровень сложности Простой
Время на прочтение 25 мин
Количество просмотров 9.1K

Сегодня, когда любой школьник имеет возможность сочинять модные биты на своём домашнем компьютере или смартфоне, идея применения компьютерных устройств для создания музыки никого не удивляет. Кажется, что эти технологии с нами уже очень давно. Однако, массовому пользователю возможность составления мелодий из фрагментов реалистичных звуков на компьютере стала доступна лишь немногим больше четверти века назад. Поговорим о том, как это устроено, о первых шагах цифровых музыкальных редакторов в дома обычных людей, и о неожиданной запинке, приключившейся на этом пути в странах запаздывающего технического прогресса.
Читать дальше →
Всего голосов 118: ↑117 и ↓1 +116
Комментарии 76

Зачем выступы на мембране наушников ТДС-15?

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 4.5K

Зачем на мембране изодинамических наушников ТДС-15 такие странные выступы?

Речь вот об этих выступах на фото:

Читать далее
Всего голосов 15: ↑13 и ↓2 +11
Комментарии 35

Как устроены функции Мультирум и Стереопара на устройствах Sber

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 2.5K

В феврале 2023 года на части устройств SberDevices мы анонсировали поддержку двух новых режимов работы — Мультирум и Стереопара.

Мультирум позволяет прослушивать музыку на нескольких устройствах различного типа одновременно. Например, колонка SberBoom может находиться в спальне, а SberPortal — в гостиной, и в таком режиме музыка на этих устройствах будет играть синхронно. Стереопара отличается от Мультирума тем, что в Cтереопаре могут участвовать только две одинаковые колонки, при этом устройства, воспроизводя звук так же синхронно, делят его на каналы — левый и правый (каждое устройство проигрывает свой канал), в зависимости от выбранных пользователем настроек.

От этапа идеи до выхода в продакшн прошел примерно год, после чего уже столько же времени вышеупомянутые фичи используются нашими пользователями. За это время мы провели ряд исследований. Было много попыток исправить различные баги, большинство из которых увенчались успехом, также случались и тупиковые ветви направления развития.

В этой статье мы с коллегами @kpvf2dи @Alergenхотим поделиться и, возможно, обсудить некоторые проблемы и их решения.

Читать далее
Всего голосов 24: ↑24 и ↓0 +24
Комментарии 3

Истории

DOD 250 — самый простой гитарный овердрайв

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 6.7K


Привет, Хабр! Сегодня мы соберём любимый перегруз Ингви Малмстина и узнаем, почему педали овердрайва были и остаются настолько необходимым дополнением к ламповым усилителям, как винтажным, так и модерновым.
Посмотрим и послушаем
Всего голосов 43: ↑42 и ↓1 +41
Комментарии 9

Озвучка игры: Что такое аудио-вижен и в чем его ценность для разработчика игры

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 874

В контексте разработки видеоигр термин "вижен" (Vision) часто используется для обозначения общего видения или концепции. Это может включать в себя общую идею игры, ее стиль, основные цели и особенности, которые разработчики стремятся воплотить. Вижен-документ в разработке игр может включать в себя описание геймплея, художественного стиля, сюжетных элементов, целевой аудитории, а также другие ключевые моменты, которые определяют общую концепцию игры.

Этот документ служит своеобразным руководством для команды разработчиков, предоставляя им ясное понимание того, какой должна стать игра в результате разработки. Он помогает установить общую направленность и цели проекта, обеспечивая единство в работе всех участников команды.

Если такой документ является основополагающим для разработки любой игры, то почему бы его не использовать при разработке аудио? На самом деле, это довольно распространенный опыт среди опытных разработчиков игр, так как создание аудио-вижена дает нам несколько серьезных преимуществ о которых я расскажу далее.

Таким образом, мы можем дать для аудио-вижена более точное определение - это документ, который соединяет концепцию звучания игры с ее общим видением. В этом документе описываются стиль и атмосфера звучания, а также взаимодействие звуковых элементов с ключевыми механиками. Аудио-вижен определяет основные черты саунд-дизайна, выделяет важные моменты геймплея, где звук играет решающую роль, и обеспечивает согласованность аудиоэлементов с общей концепцией игры.

Эта статья позволит разработчикам игр понять, как аудио-вижен может стать ключом к созданию более эффективного подхода к процессу разработки аудио и предоставлению игрокам более цельного и уникального игрового опыта.

Читать далее
Всего голосов 2: ↑1 и ↓1 0
Комментарии 2

Алгебра музыкального текста

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 4K

Пшеничников С.Б., Сотникова Т.В.

Нотный текст можно  представить с помощью правильной координатизации матричными единицами подобно описанию вербальных текстов и других знаковых последовательностей. В дальнейшем может стать возможным математическое распознавание и создание музыкального смысла с предметным обоснованием промежуточных вычислений (в отличие от AI).

У звука имеется четыре свойства: высота, длительность, громкость и тембр. Тембр пока не рассматривается. Словарь алгебры музыкальных текстов строится на основе нотной раскладки для фортепиано и современной нотной нотации.

Длительность здесь для краткости первого изложения учитывается как «абсолютная». «Относительная» не рассматривается, хотя интервалы очень хорошо изучены и их признаки потребуются для категоризации композиторов.

Сложность музыкального текста для применения математики объясняется стремлением упростить чтение музыкантами нотных знаков на стане из пяти линий и минимизации использования нижних и верхних добавочных линий.

Для применения алгебры текста к музыкальным знаковым последовательностям нет необходимости использования нотоносца из пяти линий. То, что полезно и привычно для музыкантов, - для применения алгебры невыносимо вредно. Целесообразным представляется использование нотоносца-«нитка» - это нотный стан из одной линии.  В этом случае нотный текст становится похож на вербальный текст.

Для решения задачи требуется найти преобразование канонического нотного текста в «нитку». И как всегда для нового применения алгебры необходима правильная координатизация предметной области. В данной случае каждому используемому нотному знаку  и символу современной нотной нотации требуется поставить в соответствие свой порядковый номер (натуральное число).

Читать далее
Всего голосов 7: ↑5 и ↓2 +3
Комментарии 5

Поделка в стиле 2000-х — блютус-колонка с пультом, MP3, ЧМ-радио и эффектами

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 9.6K


Привет, Хабр! Какие подводные камни таит в себе копеечный китайский модуль с этой фотографии, и как их преодолеть? Как сделать усилитель дешёвых компьютерных колонок менее чувствительным к помехам по питанию?

Как устроен расширитель стереобазы, он же «Surround sound» или «трёхмерный звук»? Как заставить маленькую моноблочную стереосистему звучать ещё объёмнее при помощи цифровых линий задержки?

Обо всём этом расскажет мой маленький проект, начавшийся десять лет назад и не законченный до сих пор.
Поделка работает и звучит, но я продолжаю её совершенствовать.
Всего голосов 56: ↑55 и ↓1 +54
Комментарии 7

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 74K

Улучшение Том и Джерри из 480p в 1440p

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране.

Мур-мур-мур
Всего голосов 397: ↑392 и ↓5 +387
Комментарии 193

Иммерсивный звук из стереосистемы с бинауральным форматом

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 2.6K

В этой статье я хочу рассказать о новом способе получения иммерсивного звука, при помощи стереосистемы и бинаурального формата.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 10

Собираем электрогитару из конструктора

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 14K


Привет, Хабр! Что может быть лучшим новогодним подарком для гитариста, чем электрогитара, которую он собрал сам? Конечно, многие предпочли бы престижный инструмент, усилитель или эффект от известного производителя.

И они были бы правы, потому что мир музыки и искусства вообще — это мир субъективных чувств, которые воплощаются в виде аудиовизуальных произведений. И результат напрямую зависит не только от объективного качества инструментов, но и от тех эмоций, которые они вызывают у творческого человека.

Лично мне нравится не только играть на гитаре, но и мастерить, а также украшать свои поделки. Поэтому у меня теперь есть самодельная гитара, о процессе изготовления которой я подробно расскажу.
Читать дальше →
Всего голосов 84: ↑83 и ↓1 +82
Комментарии 33

Видео — это вам не фото: о чём нужно знать разработчикам видеостриминговых сервисов

Время на прочтение 12 мин
Количество просмотров 5.6K

В видеостриминге есть два типа инженеров: разработчики, которые создают сервисы потокового вещания, и инженеры, которые делают контент. Два этих множества практически не пересекаются — в результате не все айтишники понимают, насколько легко может пострадать качество видео во время его обработки.

Привет, меня зовут Антон Кортунов, я техлид Yandex Infrastructure. В 2017 году мы запустили новый для Яндекса проект — платформу потокового видео Яндекс Эфир. Сам проект закрылся, но на основе платформы работают Кинопоиск, видеокарточки товаров в Яндекс Маркете, Реклама и множество других сервисов.

Как разработчик тогда я столкнулся с чудным дивным миром телевидения и кино, и понял, что видео — не просто последовательность кадров на фоне звуковой дорожки. Под катом расскажу о тонкостях, о которых я узнал от видеоинженеров за последние 5 лет.

Читать далее
Всего голосов 39: ↑38 и ↓1 +37
Комментарии 12

Планарные наушники — высота магнитов

Уровень сложности Средний
Время на прочтение 3 мин
Количество просмотров 2.8K

Данное решение используются в наушниках Snorry с самого начала их появления в 2017 году.
Также оно применялось в так называемых Снорри-модах разных изодинамических наушников по крайней мере с 2014 года и было запатентовано в 2015 году.
Похоже, настало время объяснить подробнее, как именно это работает.

В типичной современной (и не очень) изодинамике, используются магниты, где ширина меньше их высоты, или в лучшем случае они равны.

Читать далее
Всего голосов 3: ↑2 и ↓1 +1
Комментарии 7

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн

Разбор примера BLE Audio от Nordic Semiconductor (или переходник I2S->BLE-Audio)

Уровень сложности Средний
Время на прочтение 16 мин
Количество просмотров 1.9K

Обзор технологии беспроводной передачи данных BLE 5.3.
Представлен разбор примера Ble Audio от Nordic Semiconductor для микроконтроллера nRF5340. Это пример передачи звука по Bluetooth 5.3.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 2

Свободная музыка со словами, созданная нейронными сетями в «Бесконечном нейронном радио»

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 7.2K

Привет, поклонники музыки! Думали ли вы о том, что наступит день, когда нейронные сети начнут генерировать музыкальные композиции в различных жанрах, начиная от Heavy Metal и заканчивая 80-ми? Недавно я выпустил большой апдейт для своего проекта с открытым исходным кодом «Нейронное радио», где музыка и подкасты созданы нейронными сетями. Однако в первых релизах музыка была без слов, и, мягко говоря, слабая. Но сегодня все изменилось. Качество музыки улучшилось, и появилась музыка со словами и голосами под жанры.

Послушать подробнее
Всего голосов 25: ↑24 и ↓1 +23
Комментарии 22

А что если обучать нейросети через речь, а не текст?

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 4.8K

Устная речь человека — уникальная по своей сложности система коммуникации. Ещё не изучено полностью, как язык работает на уровне человеческого мозга. Но мы знаем, как его осваивают дети, и с появлением технологий глубокого обучения (deep learning) мы впервые можем смоделировать этот процесс. Мы можем создать самообучаемую модель генеративного ИИ, которая изучает язык через звуки, а не текст. В этом посте мы чуть подробней рассмотрим этот подход к нейросетям, его целесообразность и перспективы.

Читать далее
Всего голосов 27: ↑24 и ↓3 +21
Комментарии 6

Приёмник с чередованием во времени

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 12K

Пока весь мир развлекается с нейросетями и высокими технологиями, я решил исполнить студенческую мечту — собрать радио (а то как сапожник без сапог).

Во время курса по радиосигналам (по их приему и обработке) в моей голове представлялось это всё как конструктор, и я не видел в этом ничего сложного. По крайней мере, все модели, построенные в Mathcad и MATLAB, давали обнадеживающие результаты, но хотелось это всё проверить на практике и в качестве результата не увидеть первоначально промодулированную идеальную синусоиду, а услышать незнакомый аудиосигнал.

Читать далее
Всего голосов 64: ↑63 и ↓1 +62
Комментарии 28

Почему в планарных наушниках Snorry лучшие технологии?

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 2.9K

Снорри, фазоры, невидимые стелс-магниты и все-все-все…

(тотальный патентный БАТТЛ)

Содержание:

1. Магнитные и акустические свойства магнитных систем планаров и их сравнительная оценка.

2. Краткий обзор и оценка патентов по теме

3. Сравнительная оценка технических решений в патентах

Читать далее
Всего голосов 10: ↑2 и ↓8 -6
Комментарии 17

О ширине токопроводящих дорожек планарных наушников

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 3K

Поводом для написания этой статьи послужили периодически задаваемые вопросы по типу «Почему вы в в мембранах своих планарных (изодинамических) наушников не используете одну широкую дорожку, как (имярек)?», а также дискуссии по особенностям звучания в разных конструкциях.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 10

Как нейронки дают пользователю новый опыт, не выталкивая его из уютной зоны комфорта. Разбираем на примере Яндекс Музыки

Время на прочтение 11 мин
Количество просмотров 4.2K

В пятницу увидел гору уведомлений из всех утюгов. Оказалось, Яндекс Музыка провела ребрендинг и кардинально обновила функционал. При этом есть стойкое ощущение, что несмотря на все обзоры, никто так нормально и не раскрыл самую мякотку этого обновления. В этой статье постараюсь это исправить.

Я пользуюсь Яндекс Музыкой cо времен, когда Дуров еще не придумал Telegram, а Рокстары только-только выпустили пятую GTA. В общем, очень давно.

Поэтому, мне стало интересно, и я полез искать нормальный авторский разбор обновлений. Чтобы сразу все четко, по фактам и с кристаллизацией самой сути. И… не нашел его.

Так что, как говаривал Танос, опять все приходится делать самому.

Читать далее
Всего голосов 13: ↑10 и ↓3 +7
Комментарии 28

Вклад авторов