реклама на сайте
подробности

 
 
4 страниц V  < 1 2 3 4 >  
Reply to this topicStart new topic
> Как сделать "говорилку"?
muravei
сообщение Sep 27 2012, 07:35
Сообщение #31


Гуру
******

Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591



Цитата(Misile_Inc @ Sep 27 2012, 09:57) *
чем конвертировать *.WAV - файл в бинарник с массивом чисел, желательно, с нормированием к диапазону 0 - 255.

Вэйв это и есть бинарник с массивом чисел, а для уменьшения диапазона , думаю, подойдет любой звуковой редактор.
Кстати, тут никто не предлагал однобитовый звук , типа упрощенного дельта-сигма.
Go to the top of the page
 
+Quote Post
toweroff
сообщение Sep 27 2012, 07:55
Сообщение #32


Гуру
******

Группа: Свой
Сообщений: 2 957
Регистрация: 19-09-06
Из: Москва
Пользователь №: 20 514



Цитата(Misile_Inc @ Sep 27 2012, 10:57) *
Подскажите, пожалуйста, чем конвертировать *.WAV - файл в бинарник с массивом чисел, желательно, с нормированием к диапазону 0 - 255.

SoundForge
лет 15 назад нужно было получить то же самое. Конвертил в 8бит/8кГц, а потом сохранял в RAW - вот и бинарник в чистом виде
Go to the top of the page
 
+Quote Post
Misile_Inc
сообщение Sep 27 2012, 07:56
Сообщение #33


Частый гость
**

Группа: Участник
Сообщений: 174
Регистрация: 30-08-11
Из: Санкт-Петербург
Пользователь №: 66 926



Вот здесь есть программка для переделки wav в бинарник или массив шестнадцатеричных чисел, буду ее пробовать: http://www.imeda.nm.ru/
Цитата(muravei @ Sep 27 2012, 11:35) *
Вэйв это и есть бинарник с массивом чисел, а для уменьшения диапазона , думаю, подойдет любой звуковой редактор.
Кстати, тут никто не предлагал однобитовый звук , типа упрощенного дельта-сигма.

Да, но формат файла имеет свои накладные расходы - текстовая информация вначале. Не хотелось бы вручную редактировать или самому писать программу - время дорого.
Тут не просто нужно уменьшить диапазон. wav содержит отрицательные значения, для наших целей все значения должны быть в диапазоне 0-255.
Однобитовый звук? Не слышал, сейчас почитаю.

Цитата(toweroff @ Sep 27 2012, 11:55) *
SoundForge
лет 15 назад нужно было получить то же самое. Конвертил в 8бит/8кГц, а потом сохранял в RAW - вот и бинарник в чистом виде

Спасибо! Но, к сожалению, корпоративная политика запрещает работать с нелицензионным (крякнутым) ПО.

Сообщение отредактировал Misile_Inc - Sep 27 2012, 08:03
Go to the top of the page
 
+Quote Post
toweroff
сообщение Sep 27 2012, 07:56
Сообщение #34


Гуру
******

Группа: Свой
Сообщений: 2 957
Регистрация: 19-09-06
Из: Москва
Пользователь №: 20 514



Цитата(muravei @ Sep 27 2012, 11:35) *
Вэйв это и есть бинарник с массивом чисел,

нет, это контейнер с заголовком
Go to the top of the page
 
+Quote Post
_Pasha
сообщение Sep 27 2012, 09:18
Сообщение #35


;
******

Группа: Участник
Сообщений: 5 646
Регистрация: 1-08-07
Пользователь №: 29 509



Про дельта-модуляцию(ДМ): ДМ с двойным интегрированием лучше для голоса подходит, чем линейная. Там можно частоту дискретизации снизить килогерц до 40.
Go to the top of the page
 
+Quote Post
Misile_Inc
сообщение Sep 27 2012, 10:15
Сообщение #36


Частый гость
**

Группа: Участник
Сообщений: 174
Регистрация: 30-08-11
Из: Санкт-Петербург
Пользователь №: 66 926



Цитата(_Pasha @ Sep 27 2012, 13:18) *
Про дельта-модуляцию(ДМ): ДМ с двойным интегрированием лучше для голоса подходит, чем линейная. Там можно частоту дискретизации снизить килогерц до 40.

То есть, позволяет "сжимать" файл?

Подсчитал, что на каждую секунду голосового сообщения могу выделить 5 кБ флеш.
Таким образом, нужно чем- то сделать файл с частотой дискретизации 5 кГц. Nero и стандартные утилиты Windows позволяют только до 8 опуститься

Сообщение отредактировал Misile_Inc - Sep 27 2012, 10:51
Go to the top of the page
 
+Quote Post
muravei
сообщение Sep 27 2012, 13:16
Сообщение #37


Гуру
******

Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591



Цитата(toweroff @ Sep 27 2012, 10:56) *
нет, это контейнер с заголовком

Дык, вот опосля заголовка, и непрерывно данные , собственно звук.

Редактор http://www.wavosaur.com/?utm_source=about&...aign=executable

Цитата(Misile_Inc @ Sep 27 2012, 10:56) *
Однобитовый звук? Не слышал, сейчас почитаю.

Кто ж его не слышал, но все будут нос воротить.
Просто входной сигнал подается на компаратор , и запоминаются "1" или "0".
Звук вполне нормальный , главное , хорошо фильтровать, а разборчивость зависит от диктора.
Я как-то скачал пару файлов из базы для тренировки распознавателей речи. Так там такие "говоруны" попадались: с 5-го раза разберешь, и то предварительно прочитав фразу.sm.gif
Go to the top of the page
 
+Quote Post
DRUID3
сообщение Sep 27 2012, 13:21
Сообщение #38


山伏
*****

Группа: Свой
Сообщений: 1 827
Регистрация: 3-08-06
Из: Kyyiv
Пользователь №: 19 294



Цитата(muravei @ Sep 27 2012, 16:16) *
Кто ж его не слышал, но все будут нос воротить.

biggrin.gif друзья, вы в самом деле думаете что яйцеголовые ученные такие тупые? И что ваш "однобитный звук"(никто не мог додуматься, да) сожмет что-то круче чем LPC? biggrin.gif Вопрос потянет ли контроллер LPC.


--------------------
Нас помнят пока мы мешаем другим...
//--------------------------------------------------------
Хороший блатной - мертвый...
//--------------------------------------------------------
Нет старик, это те дроиды которых я ищу...
Go to the top of the page
 
+Quote Post
muravei
сообщение Sep 27 2012, 13:53
Сообщение #39


Гуру
******

Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591



Цитата(DRUID3 @ Sep 27 2012, 16:21) *
Вопрос потянет ли контроллер LPC.

Вопрос, а "однобитный звук" потянет счетчик . sm.gif
Go to the top of the page
 
+Quote Post
toweroff
сообщение Sep 27 2012, 15:44
Сообщение #40


Гуру
******

Группа: Свой
Сообщений: 2 957
Регистрация: 19-09-06
Из: Москва
Пользователь №: 20 514



Цитата(muravei @ Sep 27 2012, 17:16) *
Дык, вот опосля заголовка, и непрерывно данные , собственно звук.

там обычно PCM, однако сам контейнер на формат данных никаких ограничений вроде не накладывает
Go to the top of the page
 
+Quote Post
muravei
сообщение Sep 27 2012, 16:56
Сообщение #41


Гуру
******

Группа: Свой
Сообщений: 2 538
Регистрация: 13-08-05
Пользователь №: 7 591



Цитата(toweroff @ Sep 27 2012, 18:44) *
там обычно PCM, однако сам контейнер на формат данных никаких ограничений вроде не накладывает

А надо то что? PCM и есть тупо выборки. Вот ADPCM это уже типа сжатый.
Go to the top of the page
 
+Quote Post
toweroff
сообщение Sep 27 2012, 17:01
Сообщение #42


Гуру
******

Группа: Свой
Сообщений: 2 957
Регистрация: 19-09-06
Из: Москва
Пользователь №: 20 514



Цитата(muravei @ Sep 27 2012, 20:56) *
А надо то что? PCM и есть тупо выборки. Вот ADPCM это уже типа сжатый.

ну так а я о чем? biggrin.gif
чтобы не разбираться, в чем там сжато или нет в контейнере WAV (который еще и "отшелушить" надо от заголовка), сохраняем в RAW, параметры которого (битрейт, разрядность и стерео/моно) мы сами заранее знаем
Go to the top of the page
 
+Quote Post
Mik174
сообщение Sep 28 2012, 04:54
Сообщение #43


Местный
***

Группа: Свой
Сообщений: 357
Регистрация: 6-01-07
Пользователь №: 24 139



Цитата(Misile_Inc @ Feb 28 2012, 16:13) *
Жирновато сразу по нескольким параметрам:габариты микросхемы, стоимость средств программирования и отладки, стоимость микросхемы. Зачем так круто?


Не факт.
Если рассмотреть вариант http://milandr.ru/index.php?mact=Products,...nt01returnid=68
корпус - LQFP64 с шагом 0,5 мм - весьма мелкий
стоимость - 165 рублей, не назвал бы ее заоблачной
Средства программирования - МТ-линк за 2500 рублей - вполне посильная затрата

И при этом встроенный 12 разрядный АЦП с частотой оцифровки до 500 кГц
Встроенный 2-х канальный ЦАП, тоже 12 разрядный
Вычислительной мощность не напрягаясь хватит - 80 МГц тактовая частота, Cortex M3 совместимый
Go to the top of the page
 
+Quote Post
Misile_Inc
сообщение Sep 28 2012, 12:11
Сообщение #44


Частый гость
**

Группа: Участник
Сообщений: 174
Регистрация: 30-08-11
Из: Санкт-Петербург
Пользователь №: 66 926



Цитата(Mik174 @ Sep 28 2012, 08:54) *
Не факт.
Если рассмотреть вариант http://milandr.ru/index.php?mact=Products,...nt01returnid=68
корпус - LQFP64 с шагом 0,5 мм - весьма мелкий
стоимость - 165 рублей, не назвал бы ее заоблачной
Средства программирования - МТ-линк за 2500 рублей - вполне посильная затрата

И при этом встроенный 12 разрядный АЦП с частотой оцифровки до 500 кГц
Встроенный 2-х канальный ЦАП, тоже 12 разрядный
Вычислительной мощность не напрягаясь хватит - 80 МГц тактовая частота, Cortex M3 совместимый

Да, вы правы. В то время упустил из виду, что Миландр начал использовать пластик.
Сейчас проблема выбора архитектуры позади - информатор урезан в функциональности и выполнен на ARM7 фирмы Analog devices через DAC в составе другого прибора.
Проблема сейчас в том, что свободно всего 28 кБ флеш и сюда надо уместить 5 секунд звука + ПО, воспроизводящее звук.

Сообщение отредактировал Misile_Inc - Sep 28 2012, 12:46
Go to the top of the page
 
+Quote Post
alexvu
сообщение Oct 1 2012, 13:49
Сообщение #45


Профессионал
*****

Группа: Свой
Сообщений: 1 172
Регистрация: 14-11-11
Из: Москва
Пользователь №: 68 299



Если звук это речь, то очень хорошо сжимает кодирование GSM. Насчет размера ПО декодера не могу сказать.
Go to the top of the page
 
+Quote Post

4 страниц V  < 1 2 3 4 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 7th July 2025 - 00:29
Рейтинг@Mail.ru


Страница сгенерированна за 0.01496 секунд с 7
ELECTRONIX ©2004-2016