Глюк оптимизации WinAVR(GCC) - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Микроконтроллеры (MCs) > AVR

Reply to this topic

Start new topic

Глюк оптимизации WinAVR(GCC), сдвиги << и >>

singlskv Просмотр профиля	Jan 28 2007, 05:05 Сообщение #1
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Вот такой код: Код unsigned char x,y=0x34,z; int main() { x=5; y=y>>5; z=5; return 0; } А это "оптимизированный" выход, опции -O2 или -O1 Код 7: x=5; +00000032: E095 LDI R25,0x05 Load immediate +00000033: 93900062 STS 0x0062,R25 Store direct to data space 8: y=y>>5; +00000035: 91800060 LDS R24,0x0060 Load direct from data space +00000037: 2E09 MOV R0,R25 Copy register +00000038: C001 RJMP PC+0x0002 Relative jump +00000039: 9586 LSR R24 Logical shift right +0000003A: 940A DEC R0 Decrement +0000003B: F7EA BRPL PC-0x02 Branch if plus +0000003C: 93800060 STS 0x0060,R24 Store direct to data space 9: z=5; +0000003E: 93900063 STS 0x0063,R25 Store direct to data space Смотрим на цикл и тихо радуемся Если x!=z то код получается нормальный

WHALE Просмотр профиля	Jan 28 2007, 08:24 Сообщение #2
Знающий Группа: Свой Сообщений: 902 Регистрация: 2-01-06 Из: Краснодар Пользователь №: 12 768	Может,с утра мозги не варят А где криминал?Вроде все нормально -------------------- "Hello, word!" - 17 errors 56 warnings

Abakt Просмотр профиля	Jan 28 2007, 11:37 Сообщение #3
Участник Группа: Новичок Сообщений: 73 Регистрация: 10-01-07 Пользователь №: 24 292	вроде верно все - 5 раз сдвигает в право.

pulsar-17 Просмотр профиля	Jan 28 2007, 11:37 Сообщение #4
Участник Группа: Свой Сообщений: 32 Регистрация: 7-12-04 Из: Московская область Пользователь №: 1 376	Все правильно, оптимизация сработала. В R25 загружается число 5, которое равно количеству сдвигов(загружается в R0: MOV R0, R25) и равно z(запись в память: STS 0x0063, R25).

singlskv Просмотр профиля	Jan 28 2007, 13:32 Сообщение #5
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Цитата(pulsar-17 @ Jan 28 2007, 11:37) Все правильно, оптимизация сработала. В R25 загружается число 5, которое равно количеству сдвигов(загружается в R0: MOV R0, R25) и равно z(запись в память: STS 0x0063, R25). Ну если это оптимизация Если поменять z Код x=5; y=y>>5; z=6; то получим Код 7: x=5; +00000032: E085 LDI R24,0x05 Load immediate +00000033: 93800062 STS 0x0062,R24 Store direct to data space 8: y=y>>5; +00000035: 91800060 LDS R24,0x0060 Load direct from data space +00000037: 9582 SWAP R24 Swap nibbles +00000038: 9586 LSR R24 Logical shift right +00000039: 7087 ANDI R24,0x07 Logical AND with immediate +0000003A: 93800060 STS 0x0060,R24 Store direct to data space 9: z=6; +0000003C: E086 LDI R24,0x06 Load immediate +0000003D: 93800063 STS 0x0063,R24 Store direct to data space 1 Почуствуйте разницу А особенно весело выглядит вот это: Код x=1; y=y>>1; z=1; 7: x=1; +00000032: E091 LDI R25,0x01 Load immediate +00000033: 93900062 STS 0x0062,R25 Store direct to data space 8: y=y>>1; +00000035: 91800060 LDS R24,0x0060 Load direct from data space +00000037: 2E09 MOV R0,R25 Copy register +00000038: C001 RJMP PC+0x0002 Relative jump +00000039: 9586 LSR R24 Logical shift right +0000003A: 940A DEC R0 Decrement +0000003B: F7EA BRPL PC-0x02 Branch if plus +0000003C: 93800060 STS 0x0060,R24 Store direct to data space 9: z=1; +0000003E: 93900063 STS 0x0063,R25 Store direct to data space 1 вместо Код +00000035: 91800060 LDS R24,0x0060 Load direct from data space +000000xx: 9586 LSR R24 Logical shift right +000000xx: 93800060 STS 0x0060,R24 Store direct to data space

WHALE Просмотр профиля	Jan 28 2007, 15:45 Сообщение #6
Знающий Группа: Свой Сообщений: 902 Регистрация: 2-01-06 Из: Краснодар Пользователь №: 12 768	Да,сейчас оптимизатор,мягко говоря,не на высоте. Но в 1 вашем примере я так и не понял,что вам не понравилось?Там вроде все нормально? -------------------- "Hello, word!" - 17 errors 56 warnings

singlskv Просмотр профиля	Jan 28 2007, 16:06 Сообщение #7
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Цитата(WHALE @ Jan 28 2007, 15:45) Да,сейчас оптимизатор,мягко говоря,не на высоте. Но в 1 вашем примере я так и не понял,что вам не понравилось?Там вроде все нормально? Ну, вот это: Код +00000037: 2E09 MOV R0,R25 Copy register +00000038: C001 RJMP PC+0x0002 Relative jump +00000039: 9586 LSR R24 Logical shift right +0000003A: 940A DEC R0 Decrement +0000003B: F7EA BRPL PC-0x02 Branch if plus 10 байт - 25 тактов вместо вот этого: Код +00000037: 9582 SWAP R24 Swap nibbles +00000038: 9586 LSR R24 Logical shift right +00000039: 7087 ANDI R24,0x07 Logical AND with immediate 6 байт - 3 такта

Abakt Просмотр профиля	Jan 28 2007, 16:18 Сообщение #8
Участник Группа: Новичок Сообщений: 73 Регистрация: 10-01-07 Пользователь №: 24 292	котнить сделайте в IAR плиз ! вот так это делает CVAVR ;x=5; LDI R30,LOW(5) MOV R4,R30 ;y=y>>5; MOV R30,R5 SWAP R30 ANDI R30,0xF LSR R30 MOV R5,R30 ;z=5; LDI R30,LOW(5) MOV R6,R30 === одинаково при оптимизации и по скорости и по размеру кода.

singlskv Просмотр профиля	Jan 28 2007, 16:38 Сообщение #9
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Цитата(Abakt @ Jan 28 2007, 16:18) котнить сделайте в IAR плиз ! вот так это делает CVAVR ............. Так делают все компиляторы SWAP LSR ANDI и IAR в том числе а у GCC это именно глюк, который проявляется только если все три константы одинаковые и если например написать так: x=5; z=5; y>>=5; то будет все ОК. Самое противное, что между командами из первого поста можно вставить достаточно много других команд, и если оптимизатору будет хватать регистров, то он подставит цикл

pulsar-17 Просмотр профиля	Jan 31 2007, 21:28 Сообщение #10
Участник Группа: Свой Сообщений: 32 Регистрация: 7-12-04 Из: Московская область Пользователь №: 1 376	На какой версии GCC компилировалось? Вот что делает WinAVR от 22.01.2007 с GCC 4.1.1 (оптимизация - "s"): 000000ca <main>: main(): ca: 95 e0 ldi r25, 0x05 ; 5 cc: 90 93 02 01 sts 0x0102, r25 d0: 80 91 00 01 lds r24, 0x0100 d4: 82 95 swap r24 d6: 86 95 lsr r24 d8: 87 70 andi r24, 0x07 ; 7 da: 80 93 00 01 sts 0x0100, r24 de: 90 93 03 01 sts 0x0103, r25

defunct Просмотр профиля	Apr 3 2008, 10:14 Сообщение #11
кекс Группа: Свой Сообщений: 3 825 Регистрация: 17-12-05 Из: Киев Пользователь №: 12 326	нет тут никакого глюка. и нет смысла проверять оптимизацию на программках из трех строк. хотите чтобы компилятор делал частные случаи - объявляйте константы должным образом (const x = 5). Не должен компилятор генерить swap если количество сдвигов задано переменной.

singlskv Просмотр профиля	Apr 3 2008, 11:32 Сообщение #12
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Цитата(defunct @ Apr 3 2008, 14:14) нет тут никакого глюка. и нет смысла проверять оптимизацию на программках из трех строк. Глюк есть. На трех строках никто и не проверял, это выжимка из реального кода в которой проблема осталась. Цитата Не должен компилятор генерить swap если количество сдвигов задано переменной. да не задано оно переменной, сдвиг на 5 разрядов к переменной x не имеет никакого отношения Было что-то типа такого: Код #include <avr\io.h> unsigned char y=0x34; int main() { ADMUX = (1<<MUX2)\|(1<<MUX0); ............................ y = y >> 5; ............................ TCNT0 = 5; ........................... while (1); } С вот таким результатом компиляции: Код 8: ADMUX = (1<<MUX2)\|(1<<MUX0); +00000032: E095 LDI R25,0x05 Load immediate +00000033: B997 OUT 0x07,R25 Out to I/O location 10: y = y >> 5; +00000034: 91800060 LDS R24,0x0060 Load direct from data space +00000036: 2E09 MOV R0,R25 Copy register +00000037: C001 RJMP PC+0x0002 Relative jump +00000038: 9586 LSR R24 Logical shift right +00000039: 940A DEC R0 Decrement +0000003A: F7EA BRPL PC-0x02 Branch if plus +0000003B: 93800060 STS 0x0060,R24 Store direct to data space 12: TCNT0 = 5; +0000003D: BF92 OUT 0x32,R25 Out to I/O location

defunct Просмотр профиля	Apr 3 2008, 11:47 Сообщение #13
кекс Группа: Свой Сообщений: 3 825 Регистрация: 17-12-05 Из: Киев Пользователь №: 12 326	Цитата(singlskv @ Apr 3 2008, 13:32) Было что-то типа такого: это результат с -Os?

singlskv Просмотр профиля	Apr 3 2008, 11:49 Сообщение #14
дятел Группа: Свой Сообщений: 1 681 Регистрация: 13-05-06 Из: Питер Пользователь №: 17 065	Но от перемены мест слагаемых Код int main() { y = y >> 5; ADMUX = (1<<MUX2)\|(1<<MUX0); TCNT0 = 5; while (1); } все конечно меняется: Код 8: y = y >> 5; +00000032: 91800060 LDS R24,0x0060 Load direct from data space +00000034: 9582 SWAP R24 Swap nibbles +00000035: 9586 LSR R24 Logical shift right +00000036: 7087 ANDI R24,0x07 Logical AND with immediate +00000037: 93800060 STS 0x0060,R24 Store direct to data space 10: ADMUX = (1<<MUX2)\|(1<<MUX0); +00000039: E085 LDI R24,0x05 Load immediate +0000003A: B987 OUT 0x07,R24 Out to I/O location 12: TCNT0 = 5; +0000003B: BF82 OUT 0x32,R24 Out to I/O location Цитата(defunct @ Apr 3 2008, 15:47) это результат с -Os? Последние 2 листинга с -Os на -O2 также

« Предыдущая тема · AVR · Следующая тема »

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 2nd September 2025 - 23:05

Страница сгенерированна за 0.01846 секунд с 7
ELECTRONIX ©2004-2016