Синтезатор речи - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR

Синтезатор речи

VAHOO Просмотр профиля	Mar 8 2007, 23:56 Сообщение #1
Частый гость Группа: Участник Сообщений: 163 Регистрация: 22-09-05 Пользователь №: 8 834	как можно сделать синтезатор речи скажем на AVR? буду рад лубой информации -------------------- Прошивка это душа микроконтроллера!

5 страниц

« < 2 3 4 5 >

Start new topic

Ответов (45 - 59)

trofim Просмотр профиля	Mar 16 2007, 16:30 Сообщение #46
Группа: Новичок Сообщений: 12 Регистрация: 4-11-04 Пользователь №: 1 039	Вполне приличные синтезаторы речи под DOS на основе драйвера speeck_r.com занимает 42к и sdrv.com - 46k. Т.е. вполне можно втиснуть в AVR, но разобраться как оно работает мозгов не хватает, хотя писал, в свое время, на асме для 88-го.

SasaVitebsk Просмотр профиля	Mar 17 2007, 00:25 Сообщение #47
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(CD_Eater @ Mar 16 2007, 15:01) Насчёт синтеза речи - посмотрите как это сделано в Adobe Acrobat Reader (там в меню есть опция Read Out Loud, читает вслух документ) - препротивнейший звук! Насчёт распознавания - видимо, SasaVitebsk путает распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) с искусственным интеллектом, способным понять произвольную речь (а также поддержать беседу на отвлечённые темы). Вторую задачу, разумеется, никто и не берётся реализовывать, а вот первая вполне реальна, правда, будут частые ложные срабатывания или несрабатывания - это неизбежно, т.к. даже люди не всегда правильно понимают друг друга из-за нечёткой дикции (фефектов фикции). Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. Я считаю, что даже распознавание Цитата фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся.

Doka Просмотр профиля	Mar 17 2007, 13:24 Сообщение #48
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(SasaVitebsk @ Mar 17 2007, 00:25) Я не путаю. Изначально не говорилось о нескольких словах. А говорилось о возможности записи речи в виде текста. Во всяком случае я так понял. Об исскуственном интеллекте я вообще молчу. :biggrin: изначально говорилось об этом: Цитата(VAHOO @ Mar 9 2007, 23:11) мне надо, просто, что бы если я что то сказал, микроконтроллер понял и что то сделал, или ответил, ответит можно через SD CARD или скажем ISD2560, но как распознавать речь? Цитата(SasaVitebsk @ Mar 17 2007, 00:25) Я считаю, что даже распознавание фиксированного набора команд (то есть, примерно десятка заранее заданных слов, как нужно автору ветки) сделать на AVR одному человеку в качестве развлечения - не по силам. Я бы не взялся. ссылка уже приводилась в этом топике: http://instruct1.cit.cornell.edu/courses/e...ndex.html#intro сделано именно на AVR . В таблицах 2-5 приведены вероятности правильного распознавания (результаты эксперимента). Исходники брать там же. И вводите в заблуждение людей.. -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

SasaVitebsk Просмотр профиля	Mar 17 2007, 22:16 Сообщение #49
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Значит это я ввожу в заблуждение людей. И приведенный проект тому подтверждение. Когда на голову человека падает кирпич, то один скажет: боже, почему всё это падает на меня, - вот не везёт второй скажет: вот это повезло - другого бы убило Вы похоже скажете: блин чуть не попало. По-моему приведенный пример - ярчайшее подтверждение моих слов. Это ещё один пример, как потратив год работы можно лажануться. Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. Хотя я бы не дал. Извините, но оттуда копировать просто НЕЧЕГО.

Doka Просмотр профиля	Mar 18 2007, 22:34 Сообщение #50
Electrical Engineer Группа: СуперМодераторы Сообщений: 2 163 Регистрация: 4-10-04 Пользователь №: 778	Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Особенно грамотно подобраны слова! Оно и понятно, так как при таком методе требуются односложные слова. Конечно лучше использовать немецкий язык в данном случае. Там "лево" и "право", "верх" и "низ" сильно отличаются. links, rechts (по произношению различаются не сильнее чем left/right) а вы предлагаете в качестве команд использовать слова вроде: "демобилизация", "идиосинкразия" ? кхм.. Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Ну и самый блеск - это возможность 50% (а в одном случае и 100%) ошибки распознавания в "VOICE RECOGNITION SECURITY SYSTEM". Это просто ПЯТЬ баллов. Приведенная в конце цена - просто закономерная цена всего проекта. в качестве промежуточного результата могли и не такую вероятность получить.. при использовании обучения (см.далее в оригинальной статье) на словаре из 8ми слов получили минимальную вероятность распознавания в 85% (и то только на одном слове - более половины слов определяются с вероятностью в 100%). насчет цены - странно, вы к этому придрались.. это дипломный приект и в качестве справки просто приведена стоимость ВОМ. тут помоему должно быть всё ясно: железо отдельно - исследовательская работа отдельно. Цитата(SasaVitebsk @ Mar 17 2007, 22:16) Извините, но оттуда копировать просто НЕЧЕГО. забыли добавить - "ИМХО". авторы использовали простейший подход - выделение полос фильтрами, однако приводят иные методы - улучшающие точность. да, и главное: как раз такие проекты (и тут скорее не как "проекты-для-копирования" а как "проекты-прецеденты") "когда (хоть и не 1) человек сделал на AVR и добился определенных результатов" и помогают снять ограничивающие убеждения, не позволяющие не только прочувствовать возможность реализации "в прнципе", но и мещающие инженеру быть эффективным (ставить творческие задачи, здраво оценивать трудоемкость, анализировать существующие разработки, штудировать (если придется) стопки литературы) -------------------- Блог iDoka.ru CV linkedin.com/in/iDoka Sources github.com/iDoka Never stop thinking...........................

SasaVitebsk Просмотр профиля	Mar 18 2007, 23:06 Сообщение #51
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Не буду с вами спорить. У нас просто разные взгляды на вещи. Например человеку, который порядочный на 85% после обучения, - я бы деньги не отдал. Но собственно не о том разговор. Этот проект всё равно не подойдёт для начинающего. (А разбирающийся за него сам не возьмётся) Причина проста. Даже перевести его на русский словарь (насколько я понял при беглом просмотре) - это уже не совсем простая операция требующая определённых знаний отнюдь не в программировании. И ещё повторюсь. На вопрос "можно ли?" - отвечу "да" На вопрос "целесообразно ли?" - отвечу "нет". Причина - надо длительные и трудоёмкие исследования.

CD_Eater Просмотр профиля	Mar 18 2007, 23:44 Сообщение #52
Частый гость Группа: Новичок Сообщений: 173 Регистрация: 3-09-04 Из: Moscow Пользователь №: 595	85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость.

SasaVitebsk Просмотр профиля	Mar 19 2007, 15:29 Сообщение #53
Гуру Группа: Свой Сообщений: 2 712 Регистрация: 28-11-05 Из: Беларусь, Витебск, Строителей 18-4-220 Пользователь №: 11 521	Цитата(CD_Eater @ Mar 19 2007, 00:44) 85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Да и люди, порядочные более чем на 85% в наше время - большая редкость. По первому - то сотовый телефон, а то секьюрити. По второму - Вас видимо кто-то обидел. Забавно когда ко мне менты приходят, а я их куда-нибудь пытаюсь перенаправить. Типовая фраза такая: - Саша тебе доверяю, а другим нет. - Почему? - Так кругом же бандиты!!! Не знаю вокруг меня "отличные люди". Всё таки порядочный человек на 85% - это уже непорядочный. К тому же после обучения.

DUB00035 Просмотр профиля	Dec 30 2012, 15:26 Сообщение #54
Группа: Новичок Сообщений: 6 Регистрация: 30-12-12 Пользователь №: 75 024	Оптимизация Синтезатора Речи ---возможно кого-либо заинтересует: http://www.youtube.com/watch?feature=endsc...p;v=vkEMMDzO_5s

alexf Просмотр профиля	Jan 1 2013, 01:56 Сообщение #55
Местный Группа: Свой Сообщений: 420 Регистрация: 22-12-04 Пользователь №: 1 608	Цитата(CD_Eater @ Mar 18 2007, 15:44) 85% - хорошая вероятность. Особенно если учесть, что в существующих сотовых телефонах голосовой набор (говоришь имя - набирается номер) работает примерно с такой же эффективностью Видимо сил-но зависит от системы. Голосовым набором я пользую только за рулем и там участвует встроенный BT, но цифры распознаются на 100%. Естественно все работает не на AVR Что касается произвольного текста, то даже лучшие программы типа Dragon Dictate на много-гигагерцовых PC и полном словаре под рукой далеки от 100%.

perfect Просмотр профиля	Jan 1 2013, 08:17 Сообщение #56
Знающий Группа: Участник Сообщений: 565 Регистрация: 13-03-10 Пользователь №: 55 932	Вообще не в теме, но думаю что если распознающий не понимает говорящего, то говорящему нужно снизойти до распознающего. Простейший расппознающий, я думаю, где-то на двоичном уровне, что-то вроде морзянки, RC5 протокола для телевизоров или DiSEqC Ну, ничё не поделааешь, говорящему придётся издавать пачки звуков-пауз из очень ограниченного лексикона.

ARV Просмотр профиля	Jan 1 2013, 09:03 Сообщение #57
Профессионал Группа: Свой Сообщений: 1 143 Регистрация: 30-09-08 Из: Новочеркасск Пользователь №: 40 581	а в андроиде встроено распознавание - в моих попытках все мои слова, сказанные спокойно по одному слову, распознаются на 100%. насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы, но факт говорит сам за себя - отдельные слова распознаются отлично и безошибочно. что касается распознавания на AVR, то с определенными ограничениями мне эта задача представляется решаемой, т.к. были прецеденты на PIC, а PIC не далеко от AVR ушел, и даже скорее отстает в плане производительности: http://www.530.ru/electronics/projects.php?do=p124 -------------------- Я бы взял частями... но мне надо сразу.

perfect Просмотр профиля	Jan 1 2013, 09:21 Сообщение #58
Знающий Группа: Участник Сообщений: 565 Регистрация: 13-03-10 Пользователь №: 55 932	Цитата(ARV @ Jan 1 2013, 13:03) насколько я понял, это все делается через интернет, т.е. для распознавания наверняка подключены колоссальные ресурсы Колоссальные ресурсы можно представить и как колоссальные людские ресурсы

LexaK Просмотр профиля	Jan 10 2013, 06:41 Сообщение #59
Частый гость Группа: Свой Сообщений: 118 Регистрация: 3-12-06 Из: Новороссийск Пользователь №: 23 082	Все придумано до нас. Чипы RSC-4128 фирмы Sensory. Подробно тут

hd44780 Просмотр профиля	Jan 10 2013, 11:48 Сообщение #60
Профессионал Группа: Свой Сообщений: 1 202 Регистрация: 26-08-05 Из: Донецк, ДНР Пользователь №: 7 980	Цитата(ARV @ Jan 1 2013, 11:03) я понял, это все делается через интернет Скорее всего. Вот тут - http://habrahabr.ru/post/146501/ делают через гугль и Wi-Fi (то бишь, интернет). Это, конечно, далеко не AVR, но, если надо, то и STM32 не жалко . -------------------- Чтобы возить такого пассажира, необходим лимузин другого класса. (с) Мария Эдуарда

« Предыдущая тема · AVR · Следующая тема »

5 страниц

« < 2 3 4 5 >

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 19th July 2025 - 09:31

Страница сгенерированна за 0.01492 секунд с 7
ELECTRONIX ©2004-2016