Форум разработчиков электроники ELECTRONIX.ru > как улучшить качество WAV файла

another_one

Apr 25 2016, 18:16

Здравствуйте!

Есть аудио вав файл разговора с трэкера в авто, есть шум от машины или еще чего, вообщем какой то шум, может белый), вопрос как можно программно отфильтровать его, чтобы слышать только речь
Как я понимаю задача не тривиальная и без преобразования фурье сдесь не обойтись, ну а как из разложенного спектра вычленить шум и далее потом все склеить???

megajohn

Apr 25 2016, 18:23

если задача разовая, то звуковые редакторы с шумодавами не катят ?
https://www.youtube.com/watch?v=DgT5nVdZRwM

Plain

Apr 25 2016, 18:35

Если SNR<1, то никак. Вообще же, для записи в таких условиях должны применяться микрофонные решётки.

adnega

Apr 25 2016, 18:55

Цитата(another_one @ Apr 25 2016, 21:16)

как можно программно отфильтровать его, чтобы слышать только речь

Слышал положительные отзывы об устройстве шумоочистки "Золушка II".

ViKo

Apr 25 2016, 19:03

Посмотрите спектр, найдите палки от мотора и др. Их и вырежьте режекторными фильтрами. А если шум равномерный, то оставьте только спектр от речи.

jcxz

Apr 26 2016, 02:47

Цитата(ViKo @ Apr 26 2016, 01:03)

Посмотрите спектр, найдите палки от мотора и др. Их и вырежьте режекторными фильтрами. А если шум равномерный, то оставьте только спектр от речи.

А с каких пор моторы начали шуметь однотонально?

ViKo

Apr 26 2016, 04:44

Цитата(jcxz @ Apr 26 2016, 05:47)

А с каких пор моторы начали шуметь однотонально?

Почему однотонально? Что-то рычит, что-то свистит, что-то ревет. Если это помехи, вырезать их.
Если спектр шире, чем палка, то и фильтр сделать шире.
У меня фотик снимает видео со свистом. Особенность разработки.

Режу фильтром.

another_one

Apr 26 2016, 06:08

Цитата(ViKo @ Apr 26 2016, 08:44)

Почему однотонально? Что-то рычит, что-то свистит, что-то ревет. Если это помехи, вырезать их.
Если спектр шире, чем палка, то и фильтр сделать шире.
У меня фотик снимает видео со свистом. Особенность разработки.

Режу фильтром.

может кто поделиться как режите фильтром, на Cи?)
И исходникам разложения фурье на си тоже буду благодарен)

mcheb

Apr 26 2016, 06:27

Попробуйте вейвлет-анализ. На каждом шаге оценивается дисперсия и маленькие гармоники обнуляются. Потом обратное ДВП.

ViKo

Apr 26 2016, 07:06

На С не режу. Попробуйте avisynth (так, кажется, пишется), Audacity. Я другой прогой обрабатывал, не вспомнил название.
В Audacity можно шум убрать, основываясь на шаблоне шума. Наверное, должно помочь.

another_one

Apr 26 2016, 07:13

Цитата(ViKo @ Apr 26 2016, 11:06)

На С не режу. Попробуйте avisynth (так, кажется, пишется), Audacity. Я другой прогой обрабатывал, не вспомнил название.
В Audacity можно шум убрать, основываясь на шаблоне шума. Наверное, должно помочь.

Спасибо , а она WAV файлы разбирает?, кстате если кто знает как разбирать WAV файл, чтобы в цифре было, там же как то закодирована синусоида??

ViKo

Apr 26 2016, 07:15

Конечно. Скачайте, изучите. Пригодится.

muravei

Apr 27 2016, 05:27

Читал от белого( не от белочки)

помогает медианный и скользящего среднего .

ViKo

Apr 27 2016, 06:32

Цитата(muravei @ Apr 27 2016, 08:27)

... и скользящего среднего .

Полоса урежется.

another_one

Apr 28 2016, 05:50

Цитата(ViKo @ Apr 27 2016, 10:32)

Полоса урежется.

a sound cleaner II нет ни у кого, кто мог бы поделиться??)

Jenya7

Apr 28 2016, 15:44

Редактировал как то WAV файлы с MP3 Audio Editor. Там есть куча фильтров.

another_one

Apr 29 2016, 06:27

Цитата(Jenya7 @ Apr 28 2016, 19:44)

Редактировал как то WAV файлы с MP3 Audio Editor. Там есть куча фильтров.

хм.., а зачем тогда soundleaner когда есть попсовый буржуй???)....

iiv

May 2 2016, 18:29

Цитата(another_one @ Apr 26 2016, 00:16)

Есть аудио вав файл разговора с трэкера в авто, есть шум от машины или еще чего, вообщем какой то шум, может белый), вопрос как можно программно отфильтровать его, чтобы слышать только речь
Как я понимаю задача не тривиальная и без преобразования фурье сдесь не обойтись, ну а как из разложенного спектра вычленить шум и далее потом все склеить???

тут преобразование Фурье не спасет...

Если у Вас есть два и больше микрофона, которые как-то в пространстве разнесены, что звук от говорящего на микрофоны приходит с разной интенсивностью, то задача решаема, следад в начале 2000х некий грек Сидриополис, называется три-вей декомпозишн, я как-то пользовал этот метод для прослушки в ресторанах, когда микрофоны на потолке были и надо было из общего шума выделить каждую реплику каждого, сидевшего за столом. Получалось реально клево. На электрониксе я это уже рассказывал, но быстро свои старые посты найти не смог.

Plain

May 2 2016, 19:09

iiv, я про необходимость микрофонной решётки сразу и сказал. Для звуковых редакторов вроде есть соответствующие плагины для подхвата.

Но автор, похоже, решает не абстрактную, а конкретную, разовую и единственную задачу — выудить хоть что-то из некоего, уже записанного, и одноканального, а не многоканального файла, на которого не хватило мешка микрофонов, которыми китайцы торгуют на вес на каждом углу.

Из редакторов, первая рабочая лошадь — Cool Edit, в последствии ставший Adobe Audition версии 1.5 — установщик, страшно сказать, весит немыслимые по нынешним временам 37 МБ.

another_one

May 3 2016, 13:13

Всем большое спасибо за поддержку, попробовал с программой которую рекомендовали в этой ветке, благодаря ей я порезал спектр, но при 4 кГц речи все равно плохо разбирается речь, получается нужно выискивать гармоники и их как-то улисиливать и обрезать гармоники с других частот во всем спектре которые накладываются, но это математически фиг знает как)

Alex11

May 3 2016, 15:39

Если у Вас это один файл и не секретный, пришлите в личку, я попробую Вам помочь. Есть довольно много вариантов, которыми можно воспользоваться.

another_one

May 3 2016, 20:22

Цитата(Plain @ May 2 2016, 23:09)

iiv, я про необходимость микрофонной решётки сразу и сказал. Для звуковых редакторов вроде есть соответствующие плагины для подхвата.

Но автор, похоже, решает не абстрактную, а конкретную, разовую и единственную задачу — выудить хоть что-то из некоего, уже записанного, и одноканального, а не многоканального файла, на которого не хватило мешка микрофонов, которыми китайцы торгуют на вес на каждом углу.

Из редакторов, первая рабочая лошадь — Cool Edit, в последствии ставший Adobe Audition версии 1.5 — установщик, страшно сказать, весит немыслимые по нынешним временам 37 МБ.

Подскажите пожалуйста а чем решетка обусловлена, ведь она дает определенный узкий спектр каждого микрофона?
Из микрофонов в решетке разве идет синтез?

Alex11

May 3 2016, 21:58

Решетка спектр микрофонов не меняет. Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз и выделяется направление, с которого хочется слышать. Это уменьшает дополнительно шумы, идущие с других направлений.

another_one

May 4 2016, 07:01

Цитата(Alex11 @ May 4 2016, 01:58)

Решетка спектр микрофонов не меняет. Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз и выделяется направление, с которого хочется слышать. Это уменьшает дополнительно шумы, идущие с других направлений.

ааа, я думал схоже с электромагнитной решеткой, посути это просто перевязанные в резинку микрофоны
Вопрос, как суммировать все синусоиды со всех микрофонов в одну??

Onkel

May 4 2016, 09:30

Цитата(Alex11 @ May 4 2016, 00:58)

... Улучшается сигнал/шум за счет количества микрофонов в корень из их числа раз

это только в случае, если весь шум обусловлен внутренними шумами микрофонов (и тракта до сумматора). Если шум внешний, то никаких корней - только фазированием, и улучшение каждый раз конкретно. От одного шума (от одного источника), если он не под тем же углом виден, можно избавиться двумя микрофонами (в нулевом приближении - в реальности эхо) и т.д., но однозначной функцией тут и не пахнет.

Herz

May 4 2016, 09:51

Цитата(another_one @ May 4 2016, 09:01)

ааа, я думал схоже с электромагнитной решеткой, посути это просто перевязанные в резинку микрофоны

Что такое "электромагнитной решетка"? От "перевязанных в резинку" микрофонов толку мало. Чем дальше они будут разнесены друг от друга и чем ближе - к источнику полезного звука, тем лучше.

Цитата

Вопрос, как суммировать все синусоиды со всех микрофонов в одну??

Какие там синусоиды? Видели реальный спектр? Даже "чистого" речевого сигнала без шумов?
Задумайтесь, как мозг суммирует звуки с двоих своих "микрофонов". Было бы больше - слышал бы лучше.
Простым "суммированием" здесь не обойтись. Нужна, как минимум, подстройка фазы. А, по-взрослому, DSP: корреляционный анализ и прочие недетские инструменты.

Plain

May 4 2016, 10:02

Цитата(another_one @ May 4 2016, 10:01)

как суммировать все синусоиды со всех микрофонов в одну?

Там немного посложнее алгебры математика требуется — коррелятор и т.п., так что, в соответствующем разделе форума переспросите.

another_one

May 5 2016, 05:28

Цитата(Plain @ May 4 2016, 14:02)

Там немного посложнее алгебры математика требуется — коррелятор и т.п., так что, в соответствующем разделе форума переспросите.

Всем большое спасибо, - пошел учить матчасть)...

Onkel

May 5 2016, 20:19

Цитата(Herz @ May 4 2016, 12:51)

...
Задумайтесь, как мозг суммирует звуки с двоих своих "микрофонов". Было бы больше - слышал бы лучше.
Простым "суммированием" здесь не обойтись. Нужна, как минимум, подстройка фазы. А, по-взрослому, DSP: корреляционный анализ и прочие недетские инструменты.

ухо - множество резонаторов, так что мозг получает оконный фурье- образ. Два фурье- образа вычитаются, давая пространственную картину. Прочих инструментов вроде и нету. Фурье и вычитание.

ViKo

May 6 2016, 05:08

Цитата(Onkel @ May 5 2016, 23:19)

ухо - множество резонаторов, так что мозг получает оконный фурье- образ. Два фурье- образа вычитаются, давая пространственную картину. Прочих инструментов вроде и нету. Фурье и вычитание.

Мозг забыли. Весьма мощный инструмент. Вот, как вы узнаете знакомый голос в толпе?

Onkel

May 6 2016, 08:39

Цитата(ViKo @ May 6 2016, 08:08)

Мозг забыли. Весьма мощный инструмент. Вот, как вы узнаете знакомый голос в толпе?

По Фурье образу. "Вычитает" как раз мозг.