Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Проблема с русскими шрифтами библиотеки u8glib
Форум разработчиков электроники ELECTRONIX.ru > Сайт и форум > В помощь начинающему > Программирование
sergeus
Здравствуйте.

Никак не могу разобраться с проблемой вывода русского шрифта на дисплей (128*64 ssd1306)

u8g_DrawStr(&u8g, 0, 25, "АБВГДЕЖЗИЙКЛМНОП"); - выводит текст РСТУФХЦЧШЩЪЫЬЄЮЯ
u8g_DrawStr(&u8g, 0, 38, "РСТУФХЦЧШЩЪЫЬЭЮЯ"); - выводит текст абвгдежзийклмноп

Таблица символов этого шрифта (картинкой): http://radiomanoff.at.ua/u8g_font_unifont_0_8.png

Пытался задавать смещение в строковые символы - но понятно, что в Atmel Studio русские шрифты хранятся в UTF-8 или др. кодировке и соотв. требуется два байта для хранения и простым инкрементированием/декрементированием значения символа не обойтись.

Пытался также сам создавать шрифт по данной инструкции (используя bdf2u8g.exe): http://microsin.net/programming/avr/u8glib...s-overview.html - но результат тот же. Опять выводимые символы смещены на 16 символов относительно необходимых.

Выводимые данные храню в строке, типа: char output_s[] = "абвгде АБВГД 123456";

Помогите, пожалуйста, разобраться, как быть со шрифтами.
AHTOXA
Если написать "АБВГДЕЖЗИЙКЛМНОП" в кодировке windows-1251, и перекодировать в кодировку ISO-8859-5, то как раз получится "РСТУФХЦЧШЩЪЫЬЭЮЯ".
Отсюда два вывода:
  1. Тексты у вас не в юникоде, а в обычной виндовой кодировке windows-1251;
  2. эта либа выводит текст в кодировке ISO-8859-5.

Значит, вам надо или сохранять свои тексты в этой кодировке, или перекодировать перед отправкой.
x893
Дебаггером посмотрите, что передается и как рисуется.
sergeus
АНТОХА, спасибо за помощь!

Сделал, как вы советовали и получилось.
Оказывается код у меня написан в windows-1251, а дисплей понимает в ISO-8859-5.

Я в редакторе Notepad++ создаю текст в кодировке ISO-8859-5 и потом перекодирую в windows-1251, т.е. делаю обратную конвертацию.

Не совсем удобно конечно смотреть на кракозябры в компиляторе char text[] = "їаШТХвт"; - но зато на дисплее "Привет".
Ruslan1
Цитата(sergeus @ Sep 12 2016, 13:43) *
Не совсем удобно конечно смотреть на кракозябры в компиляторе char text[] = "їаШТХвт"; - но зато на дисплее "Привет".

Сделайте свой внутренний перекодировщик и всегда вызывайте его перед выводом на экран. Тогда у вас будет понятно что в исходнике и то что нужно при выводе на дисплей.
Метод универсальный и очень удобный. Программист должен думать о программе, а не тратить время на перекодирование текста в кракозяблы.
Если уж идет борьба за вычислительные мощности (хотя в 99% случаев это борьба надуманная и ненужная для функции вывода на экран) - то после отладки перекодируете все тексты в исходнике в выводимые кракозяблы, а функцию конвертера переопределите как пустышку через #define.
sergeus
Руслан, не подскажите, какие-нибудь ссылки, на то как реализовать.
Я нашел только одну статью: http://delphisite.ru/faq/perekodirovanie-i...irovok-v-drugie

Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Ruslan1
Цитата(sergeus @ Sep 12 2016, 14:29) *
Руслан, не подскажите, какие-нибудь ссылки, на то как реализовать.

Перекодировщик символа? Лементарно.
Код
char newtable={}; //тут символы которые выводятся вместо записанных в исходнике, все 256 или сколько их там нужно
в коде:
char decode (char in)
{
return newtable[in];
}


Если строка- то в цикле while ( !='\0') всю строку перебираете по символу.


Открыл приведенную Вами ссылку- по смыслу то же самое что я написал выше, и таблицы уже есть. sm.gif

Цитата(sergeus @ Sep 12 2016, 14:29) *
Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Извините, я не понял вопроса. Почему по 2 байта?
sergeus
Цитата
Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Извините, я не понял вопроса. Почему по 2 байта?


Сама по себе кодировка windows-1251 или ISO-8859-5 как я понимаю требует более одного байта на символ, как происходит "проекция" в однобайтные символы, и как потом отличить, например, записанный китайский иероглиф от русской буквы? Как компилятор и библиотека u8glib понимают, что в строке записан русский символ, а не символ другого языка? Впервые столкнулся с работой со шрифтами, поэтому пока такие простые вопросы.
AHTOXA
Нет, и windows-1251 и ISO-8859-5 - это однобайтовые кодировки. Они обе русские, японских и других символов там нет.
Ruslan1
Цитата(sergeus @ Sep 12 2016, 15:03) *
Сама по себе кодировка windows-1251 или ISO-8859-5 как я понимаю требует более одного байта на символ, как происходит "проекция" в однобайтные символы, и как потом отличить, например, записанный китайский иероглиф от русской буквы? Как компилятор и библиотека u8glib понимают, что в строке записан русский символ, а не символ другого языка? Впервые столкнулся с работой со шрифтами, поэтому пока такие простые вопросы.

Хм, что-то не то Вы прочитали....
это все 8-битовые коды("страницы"), первая же ссылка при гуглении ведет в википедию

Цитата
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии.


Цитата
ISO 8859 — семейство ASCII-совместимых кодовых страниц, разработанное совместными усилиями ISO и IEC. По состоянию на 2006 год это семейство состояло из 15-ти кодовых страниц.


кодировка символов и кодовые страницы- это азы, так сказать. Лучше немного почитать и разобраться, если не сталкивались раньше.
mdmitry
Цитата(Ruslan1 @ Sep 12 2016, 17:30) *
кодировка символов и кодовые страницы- это азы, так сказать. Лучше немного почитать и разобраться, если не сталкивались раньше.

ISO 8859-5 — 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы, это здесь. Речь шла о конкретной странице, а не семействе, которая указана в группе.

Использую такой подход для борьбы с кодировками: проект в Eclipse (debian, utf8). В отдельный файл в виде #define вынесены все строки, отображаемые на дисплее в cp1251 (шрифт), название, например, mystring.h. Этот заголовочный файл не включается в файлы с кодом, там включен не существующий файл mystring_1251.h. При сборке программы в makefile указана как одна из целей mystring_1251.h, получаемая вызовом перекодировщика (например, recode) для mystring.h. Проект собирается с сгенерированным файлом в нужной кодировке.
AHTOXA
Цитата(mdmitry @ Sep 12 2016, 19:05) *
Использую такой подход для борьбы с кодировками: проект в Eclipse (debian, utf8).

Я сделал проще (Eclipse, ubuntu, utf-8): назначил файлу с текстовыми строками нужную кодировку, и всёsm.gif
mdmitry
Цитата(AHTOXA @ Sep 12 2016, 19:42) *
Я сделал проще (Eclipse, ubuntu, utf-8): назначил файлу с текстовыми строками нужную кодировку, и всёsm.gif

Согласен, но если собирать из командной строки (без eclipse) и надо что-то подправить быстро простым (тупым) текстовым редактором, то крокозябры на лицо. rolleyes.gif
sergeus
AHTOXA, Ruslan1, спасибо за помощь! beer.gif
P.S. Ваши советы пригодились - разобрался со всем.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.