реклама на сайте
подробности

 
 
 
Reply to this topicStart new topic
> Проблема с русскими шрифтами библиотеки u8glib
sergeus
сообщение Sep 12 2016, 09:21
Сообщение #1


Частый гость
**

Группа: Участник
Сообщений: 157
Регистрация: 11-12-07
Из: Москва
Пользователь №: 33 174



Здравствуйте.

Никак не могу разобраться с проблемой вывода русского шрифта на дисплей (128*64 ssd1306)

u8g_DrawStr(&u8g, 0, 25, "АБВГДЕЖЗИЙКЛМНОП"); - выводит текст РСТУФХЦЧШЩЪЫЬЄЮЯ
u8g_DrawStr(&u8g, 0, 38, "РСТУФХЦЧШЩЪЫЬЭЮЯ"); - выводит текст абвгдежзийклмноп

Таблица символов этого шрифта (картинкой): http://radiomanoff.at.ua/u8g_font_unifont_0_8.png

Пытался задавать смещение в строковые символы - но понятно, что в Atmel Studio русские шрифты хранятся в UTF-8 или др. кодировке и соотв. требуется два байта для хранения и простым инкрементированием/декрементированием значения символа не обойтись.

Пытался также сам создавать шрифт по данной инструкции (используя bdf2u8g.exe): http://microsin.net/programming/avr/u8glib...s-overview.html - но результат тот же. Опять выводимые символы смещены на 16 символов относительно необходимых.

Выводимые данные храню в строке, типа: char output_s[] = "абвгде АБВГД 123456";

Помогите, пожалуйста, разобраться, как быть со шрифтами.
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Sep 12 2016, 10:12
Сообщение #2


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Если написать "АБВГДЕЖЗИЙКЛМНОП" в кодировке windows-1251, и перекодировать в кодировку ISO-8859-5, то как раз получится "РСТУФХЦЧШЩЪЫЬЭЮЯ".
Отсюда два вывода:
  1. Тексты у вас не в юникоде, а в обычной виндовой кодировке windows-1251;
  2. эта либа выводит текст в кодировке ISO-8859-5.

Значит, вам надо или сохранять свои тексты в этой кодировке, или перекодировать перед отправкой.


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
x893
сообщение Sep 12 2016, 10:17
Сообщение #3


Профессионал
*****

Группа: Свой
Сообщений: 1 333
Регистрация: 27-10-08
Из: Планета Земля
Пользователь №: 41 226



Дебаггером посмотрите, что передается и как рисуется.
Go to the top of the page
 
+Quote Post
sergeus
сообщение Sep 12 2016, 10:43
Сообщение #4


Частый гость
**

Группа: Участник
Сообщений: 157
Регистрация: 11-12-07
Из: Москва
Пользователь №: 33 174



АНТОХА, спасибо за помощь!

Сделал, как вы советовали и получилось.
Оказывается код у меня написан в windows-1251, а дисплей понимает в ISO-8859-5.

Я в редакторе Notepad++ создаю текст в кодировке ISO-8859-5 и потом перекодирую в windows-1251, т.е. делаю обратную конвертацию.

Не совсем удобно конечно смотреть на кракозябры в компиляторе char text[] = "їаШТХвт"; - но зато на дисплее "Привет".
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Sep 12 2016, 11:00
Сообщение #5


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(sergeus @ Sep 12 2016, 13:43) *
Не совсем удобно конечно смотреть на кракозябры в компиляторе char text[] = "їаШТХвт"; - но зато на дисплее "Привет".

Сделайте свой внутренний перекодировщик и всегда вызывайте его перед выводом на экран. Тогда у вас будет понятно что в исходнике и то что нужно при выводе на дисплей.
Метод универсальный и очень удобный. Программист должен думать о программе, а не тратить время на перекодирование текста в кракозяблы.
Если уж идет борьба за вычислительные мощности (хотя в 99% случаев это борьба надуманная и ненужная для функции вывода на экран) - то после отладки перекодируете все тексты в исходнике в выводимые кракозяблы, а функцию конвертера переопределите как пустышку через #define.
Go to the top of the page
 
+Quote Post
sergeus
сообщение Sep 12 2016, 11:29
Сообщение #6


Частый гость
**

Группа: Участник
Сообщений: 157
Регистрация: 11-12-07
Из: Москва
Пользователь №: 33 174



Руслан, не подскажите, какие-нибудь ссылки, на то как реализовать.
Я нашел только одну статью: http://delphisite.ru/faq/perekodirovanie-i...irovok-v-drugie

Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Sep 12 2016, 11:49
Сообщение #7


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(sergeus @ Sep 12 2016, 14:29) *
Руслан, не подскажите, какие-нибудь ссылки, на то как реализовать.

Перекодировщик символа? Лементарно.
Код
char newtable={}; //тут символы которые выводятся вместо записанных в исходнике, все 256 или сколько их там нужно
в коде:
char decode (char in)
{
return newtable[in];
}


Если строка- то в цикле while ( !='\0') всю строку перебираете по символу.


Открыл приведенную Вами ссылку- по смыслу то же самое что я написал выше, и таблицы уже есть. sm.gif

Цитата(sergeus @ Sep 12 2016, 14:29) *
Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Извините, я не понял вопроса. Почему по 2 байта?
Go to the top of the page
 
+Quote Post
sergeus
сообщение Sep 12 2016, 12:03
Сообщение #8


Частый гость
**

Группа: Участник
Сообщений: 157
Регистрация: 11-12-07
Из: Москва
Пользователь №: 33 174



Цитата
Возник еще вопрос, char word[] = "Абвгд";
как физически записывается этот код во флэш память - он занимает сколько байт, верно ли я понимаю, что русские буквы занимают по 2байта (если и английские с русскими то тоже по 2)?

Извините, я не понял вопроса. Почему по 2 байта?


Сама по себе кодировка windows-1251 или ISO-8859-5 как я понимаю требует более одного байта на символ, как происходит "проекция" в однобайтные символы, и как потом отличить, например, записанный китайский иероглиф от русской буквы? Как компилятор и библиотека u8glib понимают, что в строке записан русский символ, а не символ другого языка? Впервые столкнулся с работой со шрифтами, поэтому пока такие простые вопросы.
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Sep 12 2016, 13:22
Сообщение #9


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Нет, и windows-1251 и ISO-8859-5 - это однобайтовые кодировки. Они обе русские, японских и других символов там нет.


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
Ruslan1
сообщение Sep 12 2016, 13:30
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 2 360
Регистрация: 6-03-06
Из: Кишинев
Пользователь №: 15 025



Цитата(sergeus @ Sep 12 2016, 15:03) *
Сама по себе кодировка windows-1251 или ISO-8859-5 как я понимаю требует более одного байта на символ, как происходит "проекция" в однобайтные символы, и как потом отличить, например, записанный китайский иероглиф от русской буквы? Как компилятор и библиотека u8glib понимают, что в строке записан русский символ, а не символ другого языка? Впервые столкнулся с работой со шрифтами, поэтому пока такие простые вопросы.

Хм, что-то не то Вы прочитали....
это все 8-битовые коды("страницы"), первая же ссылка при гуглении ведет в википедию

Цитата
Windows-1251 — набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для русских версий Microsoft Windows до 10-й версии.


Цитата
ISO 8859 — семейство ASCII-совместимых кодовых страниц, разработанное совместными усилиями ISO и IEC. По состоянию на 2006 год это семейство состояло из 15-ти кодовых страниц.


кодировка символов и кодовые страницы- это азы, так сказать. Лучше немного почитать и разобраться, если не сталкивались раньше.
Go to the top of the page
 
+Quote Post
mdmitry
сообщение Sep 12 2016, 14:05
Сообщение #11


Начинающий профессионал
*****

Группа: Свой
Сообщений: 1 215
Регистрация: 25-10-06
Из: СПб
Пользователь №: 21 648



Цитата(Ruslan1 @ Sep 12 2016, 17:30) *
кодировка символов и кодовые страницы- это азы, так сказать. Лучше немного почитать и разобраться, если не сталкивались раньше.

ISO 8859-5 — 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы, это здесь. Речь шла о конкретной странице, а не семействе, которая указана в группе.

Использую такой подход для борьбы с кодировками: проект в Eclipse (debian, utf8). В отдельный файл в виде #define вынесены все строки, отображаемые на дисплее в cp1251 (шрифт), название, например, mystring.h. Этот заголовочный файл не включается в файлы с кодом, там включен не существующий файл mystring_1251.h. При сборке программы в makefile указана как одна из целей mystring_1251.h, получаемая вызовом перекодировщика (например, recode) для mystring.h. Проект собирается с сгенерированным файлом в нужной кодировке.


--------------------
Наука изощряет ум; ученье вострит память. Козьма Прутков
Go to the top of the page
 
+Quote Post
AHTOXA
сообщение Sep 12 2016, 15:42
Сообщение #12


фанат дивана
******

Группа: Свой
Сообщений: 3 387
Регистрация: 9-08-07
Из: Уфа
Пользователь №: 29 684



Цитата(mdmitry @ Sep 12 2016, 19:05) *
Использую такой подход для борьбы с кодировками: проект в Eclipse (debian, utf8).

Я сделал проще (Eclipse, ubuntu, utf-8): назначил файлу с текстовыми строками нужную кодировку, и всёsm.gif


--------------------
Если бы я знал, что такое электричество...
Go to the top of the page
 
+Quote Post
mdmitry
сообщение Sep 12 2016, 16:01
Сообщение #13


Начинающий профессионал
*****

Группа: Свой
Сообщений: 1 215
Регистрация: 25-10-06
Из: СПб
Пользователь №: 21 648



Цитата(AHTOXA @ Sep 12 2016, 19:42) *
Я сделал проще (Eclipse, ubuntu, utf-8): назначил файлу с текстовыми строками нужную кодировку, и всёsm.gif

Согласен, но если собирать из командной строки (без eclipse) и надо что-то подправить быстро простым (тупым) текстовым редактором, то крокозябры на лицо. rolleyes.gif


--------------------
Наука изощряет ум; ученье вострит память. Козьма Прутков
Go to the top of the page
 
+Quote Post
sergeus
сообщение Sep 23 2016, 23:12
Сообщение #14


Частый гость
**

Группа: Участник
Сообщений: 157
Регистрация: 11-12-07
Из: Москва
Пользователь №: 33 174



AHTOXA, Ruslan1, спасибо за помощь! beer.gif
P.S. Ваши советы пригодились - разобрался со всем.
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 27th July 2025 - 18:04
Рейтинг@Mail.ru


Страница сгенерированна за 0.0151 секунд с 7
ELECTRONIX ©2004-2016