Подсчет нулей или единиц - Форум разработчиков электроники ELECTRONIX.ru

реклама на сайте
подробности

Wiki

Wiki

Photo

Forum

Forum

Reviews

Reviews

Help (!)

Help (!)

Правила Форума

Пользователи

Календарь

Личная почта

Панель управления

Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Системы на ПЛИС - System on a Programmable Chip (SoPC)

Подсчет нулей или единиц

Egel Просмотр профиля	May 13 2009, 09:52 Сообщение #1
Частый гость Группа: Свой Сообщений: 162 Регистрация: 28-07-08 Из: Химки Пользователь №: 39 244	Подскажите алгоритм подсчета нулей или единиц в 64 разрядном числе за один такт. И что можно почитать поглубже по поводу создания АЛУ Спасибо огромное заранее

3 страниц

1 2 3 >

Start new topic

Ответов (1 - 32)

Oldring Просмотр профиля	May 13 2009, 10:02 Сообщение #2
Гуру Группа: Свой Сообщений: 3 041 Регистрация: 10-01-05 Из: Москва Пользователь №: 1 874	Цитата(Egel @ May 13 2009, 13:52) Подскажите алгоритм подсчета нулей или единиц в 64 разрядном числе за один такт. И что можно почитать поглубже по поводу создания АЛУ Спасибо огромное заранее Многое зависит от длительности такта и от способностей синтезатора по оптимизации. Напишите простой цикл в процессе с переменной-счетчиком для начала. -------------------- Пишите в личку.

SM Просмотр профиля	May 13 2009, 10:08 Сообщение #3
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	assign temp_a = (in_data & 64'h5555555555555555) + ((in_data >> 1) & 64'h5555555555555555); assign temp_b = (temp_a & 64'h3333333333333333) + ((temp_a >> 2) & 64'h3333333333333333); assign temp_c = (temp_b & 64'h0707070707070707) + ((temp_b >> 4) & 64'h0707070707070707); assign temp_d = (temp_c & 64'h000F000F000F000F) + ((temp_c >> 8) & 64'h000F000F000F000F); assign temp_e = (temp_d & 64'h0000001F0000001F) + ((temp_d >> 16) & 64'h0000001F0000001F); assign temp_f = (temp_e & 64'h000000000000003F) + ((temp_e >> 32) & 64'h000000000000003F); ну явно лишние разряды сумматоров убъет синтезатор, а если хотите, можете и сами. Это подсчет единиц. Как сделать подсчет нулей, думаю сами догадаетесь.

Egel Просмотр профиля	May 13 2009, 10:34 Сообщение #4
Частый гость Группа: Свой Сообщений: 162 Регистрация: 28-07-08 Из: Химки Пользователь №: 39 244	На одном сумматоре вообще абсурдно пытаться сделать??

SM Просмотр профиля	May 13 2009, 10:44 Сообщение #5
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Egel @ May 13 2009, 14:34) На одном сумматоре вообще абсурдно пытаться сделать?? Легко. Если он имеет достаточную разрядность (на вскидку - 183 бита). Заводя его выходы на его же входы по приведенной мной выше схеме. А эффективнее всего это делать на дереве полных сумматоров с использованием их входов переносов, подавая везде на перенос один бит входных данных. Таким образом первый уровень будет принимать 3*N бит данных и состоять из однобитных сумматоров, второй - состоять из двухбитных, и принимать N/2 бит (по кол-ву входов переносов сумматоров), и так далее. Проверено, синтезаторы (Quartus, DC и Synplify) не умеют оптимизировать такую структуру в такое дерево.

des333 Просмотр профиля	May 13 2009, 10:51 Сообщение #6
Профессионал Группа: Свой Сообщений: 1 129 Регистрация: 19-07-08 Из: Санкт-Петербург Пользователь №: 39 079	Цитата(SM @ May 13 2009, 14:08) assign temp_a = (in_data & 64'h5555555555555555) + ((in_data >> 1) & 64'h5555555555555555); assign temp_b = (temp_a & 64'h3333333333333333) + ((temp_a >> 2) & 64'h3333333333333333); assign temp_c = (temp_b & 64'h0707070707070707) + ((temp_b >> 4) & 64'h0707070707070707); assign temp_d = (temp_c & 64'h000F000F000F000F) + ((temp_c >> 8) & 64'h000F000F000F000F); assign temp_e = (temp_d & 64'h0000001F0000001F) + ((temp_d >> 16) & 64'h0000001F0000001F); assign temp_f = (temp_e & 64'h000000000000003F) + ((temp_e >> 32) & 64'h000000000000003F); 119 элементов против 193 следующей реализации: Код always @() begin temp_f = 0; for(int i=0; i<64; i++) if(in_data[i]) temp_f++; end Синтезатор еще далек от идеала Но, зато, судя по времянке быстродействие второго способа не намного хуже, чем первого. Надо бы для проверки в TQA загнать. P.S. Пока проверял - не заметил сообщения выше Сообщение отредактировал des333* - May 13 2009, 10:52 -------------------- Мои публикации на Хабре Моя работа

PeterD Просмотр профиля	May 13 2009, 10:52 Сообщение #7
Участник Группа: Участник Сообщений: 42 Регистрация: 26-10-07 Пользователь №: 31 743	А так? always @(posedge clk) begin one [7:0] = input_number[63] + input_number[62] + input_number[61] +...+input_number[0] zero[7:0] = 8'd64 - (input_number[63] + input_number[62] + input_number[61] +...+input_number[0]) end Сообщение отредактировал PeterD - May 13 2009, 10:54

Egel Просмотр профиля	May 13 2009, 10:56 Сообщение #8
Частый гость Группа: Свой Сообщений: 162 Регистрация: 28-07-08 Из: Химки Пользователь №: 39 244	Но какие частоты будут с 180 разрядным сумматором? Про дерево не совсем понял) Надо все АЛУ сделать на одном сумматоре) Это конечно лучший вариант с поразрядным сложением. мне тоже так больше нравится. Кстати это не есть та схема, о которой вы говорили, SM?

SM Просмотр профиля	May 13 2009, 10:58 Сообщение #9
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Egel @ May 13 2009, 14:52) Но какие частоты будут с 180 разрядным сумматором? Про дерево не совсем понял) Точно те же, как и в остальных схемах. Так как как этот зад раком не крути, а для решения задачи нучно 180 одноразрядных сумматоров (примерное количество, плюс минус от реализации и задействования их переносов). А как их расставить - как один 180-битный, или как 180 однобитных - это вам решать и это сути дела не меняет. Про дерево - для 8 бит так: wire [1:0] stage_0_0, stage_0_1; wire [2:0] stage_1_0; wire [3:0] stage_2_0; assign stage_0_0 = data[0]+data[1]+data[2]; assign stage_0_1 = data[3]+data[4]+data[5]; assign stage_1_0 = stage_0_0 + stage_0_1 + data[6]; assign stage_2_0 = stage_1_0 + data[7]; до 64 бит сами расширяйте, долго и муторно. А цикл generate продумывать мне влом.

Egel Просмотр профиля	May 13 2009, 11:01 Сообщение #10
Частый гость Группа: Свой Сообщений: 162 Регистрация: 28-07-08 Из: Химки Пользователь №: 39 244	Всем огромное спасибо. Очень сильно помогли

SM Просмотр профиля	May 13 2009, 11:03 Сообщение #11
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Egel @ May 13 2009, 14:56) Надо все АЛУ сделать на одном сумматоре) Это сильно завернуто... Из всех букв аббревиатуры АЛУ - останется пожалуй только АУ

des00 Просмотр профиля	May 13 2009, 11:09 Сообщение #12
Вечный ламер Группа: Модераторы Сообщений: 7 248 Регистрация: 18-03-05 Из: Томск Пользователь №: 3 453	Цитата(SM @ May 13 2009, 04:44) Проверено, синтезаторы (Quartus, DC и Synplify) не умеют оптимизировать такую структуру в такое дерево. вот тут проверяли %) http://electronix.ru/forum/index.php?showtopic=59528 -------------------- мои статьи мои публикации мои проекты мое резюме

Postoroniy_V Просмотр профиля	May 13 2009, 13:29 Сообщение #13
МедвеД Инженер I Группа: Свой Сообщений: 816 Регистрация: 21-10-04 Пользователь №: 951	2 Admin ИМХО популярная тема у народа, может того её..пристегнуть? -------------------- Cogito ergo sum

Artem_Petrik Просмотр профиля	May 13 2009, 18:01 Сообщение #14
Местный Группа: Свой Сообщений: 443 Регистрация: 22-07-06 Из: Украина, г. Харьков Пользователь №: 19 006	Цитата(SM @ May 13 2009, 13:44) А эффективнее всего это делать на дереве полных сумматоров с использованием их входов переносов, подавая везде на перенос один бит входных данных. Как раз с полными сумматорами здесь не очень-то получается, по крайней мере на Альтере. Похоже, что есть ограничения на то, откуда можно подавать данные на вход переноса в альтеровской LE. Получается, что если туда подается сигнал не с выхода переноса соседней ячейки, то приходится задействовать еще одну LE. А в этом случае уже более оптимальным получается дерево, имеющее полусумматоры на первом сложении (лучше 2 полусумматора, чем один полный).

SM Просмотр профиля	May 13 2009, 21:12 Сообщение #15
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Artem_Petrik @ May 13 2009, 22:01) Как раз с полными сумматорами здесь не очень-то получается, по крайней мере на Альтере. Вполне возможно. Я не преследовал цели соптимизировать именно на альтеру. Изначально моей целью была среднестатистическая технология, основанная на стандартных ячейках. Если хорошо подумать, можно родить и оптимальный вариант для альтеры, и, возможно, он будет именно таков, как Вы предлагаете.

des00 Просмотр профиля	May 14 2009, 04:01 Сообщение #16
Вечный ламер Группа: Модераторы Сообщений: 7 248 Регистрация: 18-03-05 Из: Томск Пользователь №: 3 453	Цитата(Artem_Petrik @ May 13 2009, 13:01) Как раз с полными сумматорами здесь не очень-то получается, по крайней мере на Альтере. Похоже, что есть ограничения на то, откуда можно подавать данные на вход переноса в альтеровской LE. Получается, что если туда подается сигнал не с выхода переноса соседней ячейки, то приходится задействовать еще одну LE. А в этом случае уже более оптимальным получается дерево, имеющее полусумматоры на первом сложении (лучше 2 полусумматора, чем один полный). а можно пример ? для наглядности пусть будет 64-х битный вектор и сравните результат синтеза с http://electronix.ru/forum/index.php?showt...st&p=549588 вопрос возник не просто так. простой оценочный расчет для альетры схемы на полусуматорах 321 + 162 + 83 + 44 + 25 + 16 = 120 ячеек, схемы на "нечестных" полных сумматорах 162 + 84 + 45 + 26 + 1*7 = 103 ячейки. Сделал как вы предлагаете (если я вас правильно понял) и квартус со мной согласился -------------------- мои статьи мои публикации мои проекты мое резюме

Artem_Petrik Просмотр профиля	May 14 2009, 16:40 Сообщение #17
Местный Группа: Свой Сообщений: 443 Регистрация: 22-07-06 Из: Украина, г. Харьков Пользователь №: 19 006	Цитата(des00 @ May 14 2009, 07:01) вопрос возник не просто так. простой оценочный расчет для альетры схемы на полусуматорах 321 + 162 + 83 + 44 + 25 + 16 = 120 ячеек, схемы на "нечестных" полных сумматорах 162 + 84 + 45 + 26 + 1*7 = 103 ячейки. Да, вы правы, полные сумматоры лучше. Просто показалось что будет лучше на двух LE сложить 4 бита вместо трех, а оказалось, что все не так просто. Виноват, был неправ. Цитата(des00 @ May 14 2009, 07:01) и квартус со мной согласился Ага, так вы с ним заодно!

SM Просмотр профиля	May 14 2009, 18:06 Сообщение #18
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Artem_Petrik @ May 14 2009, 20:40) двух LE сложить 4 бита на двух LE сложить 4 бита низзя, так как это три выхода, т.е. 3 LE, а арифметический режим там вряд-ли будет применим из-за особенностей разводки переносов.

Maverick Просмотр профиля	May 15 2009, 05:01 Сообщение #19
я только учусь... Группа: Модераторы Сообщений: 3 447 Регистрация: 29-01-07 Из: Украина Пользователь №: 24 839	В книге Shevkoplias "Microprocessornye Structury" (стр 479) предлагают такой алгоритм. Вырезка этого алгоритма во вложении Когда-то давно я реализовал на VHDL логический элемент, который считает число единиц во входных данных так (он реализован на сумматорах) Описание портов: data – N разрядный вход add – N разрядный выход Код library IEEE; use IEEE.STD_LOGIC_1164.ALL; use IEEE.STD_LOGIC_ARITH.ALL; use IEEE.STD_LOGIC_UNSIGNED.ALL; entity Vcnt1s is Port ( data : in std_logic_vector(15 downto 0); add : out std_logic_vector(4 downto 0)); end Vcnt1s; architecture Behavioral of Vcnt1s is begin process (data) variable S : std_logic_vector(4 downto 0); begin S := "00000"; for i in 0 to 15 loop if data(i) = '1' then S := S + "00001"; end if; end loop; add <= S; end process; end Behavioral; Прикрепленные файлы Shevkoplias.MicroprocessornyeStructury.pdf ( 45.13 килобайт ) Кол-во скачиваний: 89 -------------------- If it doesn't work in simulation, it won't work on the board. "Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"

SM Просмотр профиля	May 15 2009, 05:41 Сообщение #20
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Maverick @ May 15 2009, 09:01) Вырезка этого алгоритма во вложении Эту схему давал уже des333 где-то в самом начале. Она, пожалуй, самая неэффективная по ресурсам.

Oldring Просмотр профиля	May 15 2009, 10:51 Сообщение #21
Гуру Группа: Свой Сообщений: 3 041 Регистрация: 10-01-05 Из: Москва Пользователь №: 1 874	Цитата(SM @ May 15 2009, 09:41) Она, пожалуй, самая неэффективная по ресурсам. Ваше утверждение неверно. Эта схема самая эффективная по таким ресурсам, как мыслительные усилия и время, затрачиваемые разработчиком на её проектирование с нуля -------------------- Пишите в личку.

SM Просмотр профиля	May 15 2009, 10:53 Сообщение #22
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Oldring @ May 15 2009, 14:51) по таким ресурсам, как мыслительные усилия и время Ну это да, не поспоришь

Leka Просмотр профиля	May 15 2009, 11:11 Сообщение #23
Профессионал Группа: Участник Сообщений: 1 075 Регистрация: 30-09-05 Пользователь №: 9 118	А я поспорю Весь проект написаный в таком стиле, окажется неконкурентноспособным, и пойдет в корзину --> эффективность "по таким ресурсам, как мыслительные усилия и время, затрачиваемые разработчиком" ,окажется равной нулю.

Oldring Просмотр профиля	May 15 2009, 11:18 Сообщение #24
Гуру Группа: Свой Сообщений: 3 041 Регистрация: 10-01-05 Из: Москва Пользователь №: 1 874	Цитата(Leka @ May 15 2009, 15:11) А я поспорю Весь проект написаный в таком стиле, окажется неконкурентноспособным, и пойдет в корзину --> эффективность "по таким ресурсам, как мыслительные усилия и время, затрачиваемые разработчиком" ,окажется равной нулю. Проекты могут пойти в корзину по самым разным причинам. Например, из-за опоздания с выходом на рынок. Поэтому отмеченная Вами зависимость, будучи сильно нелинейным критерием, безусловно, верным в ряде экстремальныхз случаев, требует применения более тонких методов оптимизации ресурсов. То есть проект "может оказаться неконкурентоспособен" но утверждение что "окажется неконкурентоспособен" - неверно. -------------------- Пишите в личку.

sazh Просмотр профиля	May 15 2009, 11:20 Сообщение #25
Гуру Группа: Свой Сообщений: 2 435 Регистрация: 6-10-04 Из: Петербург Пользователь №: 804	Цитата(SM @ May 15 2009, 09:41) Эту схему давал уже des333 где-то в самом начале. Она, пожалуй, самая неэффективная по ресурсам. Что интересно. Показал девушкам - программистам различные реализации полемики http://electronix.ru/forum/index.php?showt...=59528&st=0 Они в Вашу реализацию за раз въехали. Взяли на заметку.

Leka Просмотр профиля	May 15 2009, 11:39 Сообщение #26
Профессионал Группа: Участник Сообщений: 1 075 Регистрация: 30-09-05 Пользователь №: 9 118	Цитата(Oldring @ May 15 2009, 15:18) То есть проект "может оказаться неконкурентоспособен" но утверждение что "окажется неконкурентоспособен" - неверно. Ок.

Maverick Просмотр профиля	May 15 2009, 12:49 Сообщение #27
я только учусь... Группа: Модераторы Сообщений: 3 447 Регистрация: 29-01-07 Из: Украина Пользователь №: 24 839	Цитата(SM @ May 15 2009, 08:41) Эту схему давал уже des333 где-то в самом начале. Она, пожалуй, самая неэффективная по ресурсам. Чтобы спора не было надо бы кому-то просто реализовать по данному алгоритму. Потом произвести сравнение результатов синтеза Можно ссылку на предложенную схему des333, которая реализована по данному алгоритму (я что-то ее не увидел, может плохо смотрел ). -------------------- If it doesn't work in simulation, it won't work on the board. "Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"

SM Просмотр профиля	May 15 2009, 14:13 Сообщение #28
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Maverick @ May 15 2009, 16:49) Чтобы спора не было надо бы кому-то просто реализовать по данному алгоритму. Потом произвести сравнение результатов синтеза Можно ссылку на предложенную схему des333, которая реализована по данному алгоритму (я что-то ее не увидел, может плохо смотрел ). Сообщение №6 в этой ветке. Сразу вместе со сравнением результатов синтеза с вариантом неоптимального дерева.

des333 Просмотр профиля	May 15 2009, 16:05 Сообщение #29
Профессионал Группа: Свой Сообщений: 1 129 Регистрация: 19-07-08 Из: Санкт-Петербург Пользователь №: 39 079	Цитата(SM @ May 15 2009, 09:41) Эту схему давал уже des333 где-то в самом начале. Она, пожалуй, самая неэффективная по ресурсам. Я думаю, Maverick писал про схему, указанную в pdf, а не про тот код, который написан в его посте. Насчет неэффективности согласен, я ее синтезировал именно с целью выявить, насколько "плохую" схему синтезирует Quartus по ресурсоемкости и быстродействию (до анализа в TQA руки никак не дойдут) -------------------- Мои публикации на Хабре Моя работа

SM Просмотр профиля	May 15 2009, 16:21 Сообщение #30
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(des333 @ May 15 2009, 20:05) Я думаю, Maverick писал про схему, указанную в pdf, а не про тот код, который написан в его посте. А, если так, то тогда да, на этой основе никто алгоритма подсчета не предлагал. Я имел в виду именно схему, представленную кодом из поста. Однако в этом алгоритме понадобится на выходе кодер экспоненты (вычисление положения старшей 1), что тоже не сказать, что ресурсов не занимает. Да и эти вот блочки на пересечениях - в лучшем случае 1 блок 1 LUT в арифметическом режиме (или в режиме CASCADE, который был в свое время в ацексах), в худшем - 1 блок 2 LUT, и кол-во блоков пропорционально квадрату разрядности, что не выглядит эффективным.

Maverick Просмотр профиля	May 16 2009, 15:55 Сообщение #31
я только учусь... Группа: Модераторы Сообщений: 3 447 Регистрация: 29-01-07 Из: Украина Пользователь №: 24 839	Цитата(des333 @ May 15 2009, 19:05) Я думаю, Maverick писал про схему, указанную в pdf, а не про тот код, который написан в его посте. Вы правы Именно ее я и имел ввиду Цитата(SM @ May 15 2009, 17:13) Сообщение №6 в этой ветке. Сразу вместе со сравнением результатов синтеза с вариантом неоптимального дерева. Спасибо посмотрел и все таки, реализация не по предложенному мною алгоритму (описанный в pdf файле). PS это только мое мнение -------------------- If it doesn't work in simulation, it won't work on the board. "Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"

SM Просмотр профиля	May 17 2009, 14:12 Сообщение #32
Гуру Группа: Свой Сообщений: 7 946 Регистрация: 25-02-05 Из: Moscow, Russia Пользователь №: 2 881	Цитата(Maverick @ May 16 2009, 19:55) реализация не по предложенному мною алгоритму (описанный в pdf файле). Исходя из текста Вашего поста, я пришел к однозначному выводу, что в pdf предложен тот код, который приведен был в тексте сообщения на VHDL, ну и в pdf даже и заглядывать не стал... Оказывается, был не прав. Сорри.

Maverick Просмотр профиля	May 17 2009, 15:25 Сообщение #33
я только учусь... Группа: Модераторы Сообщений: 3 447 Регистрация: 29-01-07 Из: Украина Пользователь №: 24 839	Цитата(SM @ May 17 2009, 17:12) Исходя из текста Вашего поста, я пришел к однозначному выводу, что в pdf предложен тот код, который приведен был в тексте сообщения на VHDL, ну и в pdf даже и заглядывать не стал... Оказывается, был не прав. Сорри. Извините меня плиз, если что не так сказал , но я скорее привел описание которое обсуждалось, т.е. на сумматорах. В pdf приведен пример реализации с помощью цепочки логики "И" и "ИЛИ", и описания на VHDL его не делал (руки как-то не доходили, хотя хочу это как-то реализовать и посмотреть/сравнить эти реализации). -------------------- If it doesn't work in simulation, it won't work on the board. "Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"

« Предыдущая тема · Системы на ПЛИС - System on a Programmable Chip (SoPC) · Следующая тема »

3 страниц

1 2 3 >

Reply to this topic

Start new topic

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 21st July 2025 - 03:40

Страница сгенерированна за 0.01675 секунд с 7
ELECTRONIX ©2004-2016