Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: как улучшить качество WAV файла
Форум разработчиков электроники ELECTRONIX.ru > Сайт и форум > В помощь начинающему > Программирование
another_one
Здравствуйте!

Есть аудио вав файл разговора с трэкера в авто, есть шум от машины или еще чего, вообщем какой то шум, может белый), вопрос как можно программно отфильтровать его, чтобы слышать только речь
Как я понимаю задача не тривиальная и без преобразования фурье сдесь не обойтись, ну а как из разложенного спектра вычленить шум и далее потом все склеить???
megajohn
если задача разовая, то звуковые редакторы с шумодавами не катят ?
https://www.youtube.com/watch?v=DgT5nVdZRwM
Plain
Если SNR<1, то никак. Вообще же, для записи в таких условиях должны применяться микрофонные решётки.
adnega
Цитата(another_one @ Apr 25 2016, 21:16) *
как можно программно отфильтровать его, чтобы слышать только речь

Слышал положительные отзывы об устройстве шумоочистки "Золушка II".
ViKo
Посмотрите спектр, найдите палки от мотора и др. Их и вырежьте режекторными фильтрами. А если шум равномерный, то оставьте только спектр от речи.
jcxz
Цитата(ViKo @ Apr 26 2016, 01:03) *
Посмотрите спектр, найдите палки от мотора и др. Их и вырежьте режекторными фильтрами. А если шум равномерный, то оставьте только спектр от речи.

А с каких пор моторы начали шуметь однотонально?
ViKo
Цитата(jcxz @ Apr 26 2016, 05:47) *
А с каких пор моторы начали шуметь однотонально?

Почему однотонально? Что-то рычит, что-то свистит, что-то ревет. Если это помехи, вырезать их.
Если спектр шире, чем палка, то и фильтр сделать шире.
У меня фотик снимает видео со свистом. Особенность разработки. crying.gif Режу фильтром.
another_one
Цитата(ViKo @ Apr 26 2016, 08:44) *
Почему однотонально? Что-то рычит, что-то свистит, что-то ревет. Если это помехи, вырезать их.
Если спектр шире, чем палка, то и фильтр сделать шире.
У меня фотик снимает видео со свистом. Особенность разработки. crying.gif Режу фильтром.

может кто поделиться как режите фильтром, на Cи?)
И исходникам разложения фурье на си тоже буду благодарен)
mcheb
Попробуйте вейвлет-анализ. На каждом шаге оценивается дисперсия и маленькие гармоники обнуляются. Потом обратное ДВП.
ViKo
На С не режу. Попробуйте avisynth (так, кажется, пишется), Audacity. Я другой прогой обрабатывал, не вспомнил название.
В Audacity можно шум убрать, основываясь на шаблоне шума. Наверное, должно помочь.
another_one
Цитата(ViKo @ Apr 26 2016, 11:06) *
На С не режу. Попробуйте avisynth (так, кажется, пишется), Audacity. Я другой прогой обрабатывал, не вспомнил название.
В Audacity можно шум убрать, основываясь на шаблоне шума. Наверное, должно помочь.

Спасибо , а она WAV файлы разбирает?, кстате если кто знает как разбирать WAV файл, чтобы в цифре было, там же как то закодирована синусоида??
ViKo
Конечно. Скачайте, изучите. Пригодится.
muravei
Читал от белого( не от белочки) sm.gif помогает медианный и скользящего среднего .
ViKo
Цитата(muravei @ Apr 27 2016, 08:27) *
... и скользящего среднего .

Полоса урежется. rolleyes.gif
another_one
Цитата(ViKo @ Apr 27 2016, 10:32) *
Полоса урежется. rolleyes.gif

a sound cleaner II нет ни у кого, кто мог бы поделиться??)
Jenya7
Редактировал как то WAV файлы с MP3 Audio Editor. Там есть куча фильтров.
another_one
Цитата(Jenya7 @ Apr 28 2016, 19:44) *
Редактировал как то WAV файлы с MP3 Audio Editor. Там есть куча фильтров.

хм.., а зачем тогда soundleaner когда есть попсовый буржуй???)....
iiv
Цитата(another_one @ Apr 26 2016, 00:16) *
Есть аудио вав файл разговора с трэкера в авто, есть шум от машины или еще чего, вообщем какой то шум, может белый), вопрос как можно программно отфильтровать его, чтобы слышать только речь
Как я понимаю задача не тривиальная и без преобразования фурье сдесь не обойтись, ну а как из разложенного спектра вычленить шум и далее потом все склеить???

тут преобразование Фурье не спасет...

Если у Вас есть два и больше микрофона, которые как-то в пространстве разнесены, что звук от говорящего на микрофоны приходит с разной интенсивностью, то задача решаема, следад в начале 2000х некий грек Сидриополис, называется три-вей декомпозишн, я как-то пользовал этот метод для прослушки в ресторанах, когда микрофоны на потолке были и надо было из общего шума выделить каждую реплику каждого, сидевшего за столом. Получалось реально клево. На электрониксе я это уже рассказывал, но быстро свои старые посты найти не смог.
Plain
iiv, я про необходимость микрофонной решётки сразу и сказал. Для звуковых редакторов вроде есть соответствующие плагины для подхвата.

Но автор, похоже, решает не абстрактную, а конкретную, разовую и единственную задачу — выудить хоть что-то из некоего, уже записанного, и одноканального, а не многоканального файла, на которого не хватило мешка микрофонов, которыми китайцы торгуют на вес на каждом углу.

Из редакторов, первая рабочая лошадь — Cool Edit, в последствии ставший Adobe Audition версии 1.5 — установщик, страшно сказать, весит немыслимые по нынешним временам 37 МБ.
another_one
Всем большое спасибо за поддержку, попробовал с программой которую рекомендовали в этой ветке, благодаря ей я порезал спектр, но при 4 кГц речи все равно плохо разбирается речь, получается нужно выискивать гармоники и их как-то улисиливать и обрезать гармоники с других частот во всем спектре которые накладываются, но это математически фиг знает как)
Alex11
Если у Вас это один файл и не секретный, пришлите в личку, я попробую Вам помочь. Есть довольно много вариантов, которыми можно воспользоваться.
another_one
Цитата(Plain @ May 2 2016, 23:09) *
iiv, я про необходимость микрофонной решётки сразу и сказал. Для звуковых редакторов вроде есть соответствующие плагины для подхвата.

Но автор, похоже, решает не абстрактную, а конкретную, разовую и единственную задачу — выудить хоть что-то из некоего, уже записанного, и одноканального, а не многоканального файла, на которого не хватило мешка микрофонов, которыми китайцы торгуют на вес на каждом углу.

Из редакторов, первая рабочая лошадь — Cool Edit, в последствии ставший Adobe Audition версии 1.5 — установщик, страшно сказать, весит немыслимые по нынешним временам 37 МБ.

Подскажите пожалуйста а чем решетка обусловлена, ведь она дает определенный узкий спектр каждого микрофона?
Из микрофонов в решетке разве идет синтез?
Alex11
Решетка спектр микрофонов не меняет. Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз и выделяется направление, с которого хочется слышать. Это уменьшает дополнительно шумы, идущие с других направлений.
another_one
Цитата(Alex11 @ May 4 2016, 01:58) *
Решетка спектр микрофонов не меняет. Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз и выделяется направление, с которого хочется слышать. Это уменьшает дополнительно шумы, идущие с других направлений.

ааа, я думал схоже с электромагнитной решеткой, посути это просто перевязанные в резинку микрофоны
Вопрос, как суммировать все синусоиды со всех микрофонов в одну??
Onkel
Цитата(Alex11 @ May 4 2016, 00:58) *
... Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз

это только в случае, если весь шум обусловлен внутренними шумами микрофонов (и тракта до сумматора). Если шум внешний, то никаких корней - только фазированием, и улучшение каждый раз конкретно. От одного шума (от одного источника), если он не под тем же углом виден, можно избавиться двумя микрофонами (в нулевом приближении - в реальности эхо) и т.д., но однозначной функцией тут и не пахнет.
Herz
Цитата(another_one @ May 4 2016, 09:01) *
ааа, я думал схоже с электромагнитной решеткой, посути это просто перевязанные в резинку микрофоны

Что такое "электромагнитной решетка"? От "перевязанных в резинку" микрофонов толку мало. Чем дальше они будут разнесены друг от друга и чем ближе - к источнику полезного звука, тем лучше.
Цитата
Вопрос, как суммировать все синусоиды со всех микрофонов в одну??

Какие там синусоиды? Видели реальный спектр? Даже "чистого" речевого сигнала без шумов?
Задумайтесь, как мозг суммирует звуки с двоих своих "микрофонов". Было бы больше - слышал бы лучше.
Простым "суммированием" здесь не обойтись. Нужна, как минимум, подстройка фазы. А, по-взрослому, DSP: корреляционный анализ и прочие недетские инструменты.
Plain
Цитата(another_one @ May 4 2016, 10:01) *
как суммировать все синусоиды со всех микрофонов в одну?

Там немного посложнее алгебры математика требуется — коррелятор и т.п., так что, в соответствующем разделе форума переспросите.
another_one
Цитата(Plain @ May 4 2016, 14:02) *
Там немного посложнее алгебры математика требуется — коррелятор и т.п., так что, в соответствующем разделе форума переспросите.

Всем большое спасибо, - пошел учить матчасть)...
Onkel
Цитата(Herz @ May 4 2016, 12:51) *
...
Задумайтесь, как мозг суммирует звуки с двоих своих "микрофонов". Было бы больше - слышал бы лучше.
Простым "суммированием" здесь не обойтись. Нужна, как минимум, подстройка фазы. А, по-взрослому, DSP: корреляционный анализ и прочие недетские инструменты.

ухо - множество резонаторов, так что мозг получает оконный фурье- образ. Два фурье- образа вычитаются, давая пространственную картину. Прочих инструментов вроде и нету. Фурье и вычитание.
ViKo
Цитата(Onkel @ May 5 2016, 23:19) *
ухо - множество резонаторов, так что мозг получает оконный фурье- образ. Два фурье- образа вычитаются, давая пространственную картину. Прочих инструментов вроде и нету. Фурье и вычитание.

Мозг забыли. Весьма мощный инструмент. Вот, как вы узнаете знакомый голос в толпе?
Onkel
Цитата(ViKo @ May 6 2016, 08:08) *
Мозг забыли. Весьма мощный инструмент. Вот, как вы узнаете знакомый голос в толпе?

По Фурье образу. "Вычитает" как раз мозг.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.