реклама на сайте
подробности

 
 
> 100 Ватт - модуль на Kintex UltraScale KU115, Хочу похвастаться
dsmv
сообщение May 26 2018, 22:00
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Здравствуйте,

Хочу поделиться результатами эксперимента проверки FMC132P c Kintex UltraScale KU115 в режиме максимальной мощности.
Достигнута длительная работа (больше часа) при стабильной температуре +78 градусов и потребляемой мощности модуля 105 Вт. ПЛИС потребляет меньше, скорее всего около 85 Вт.
Для проверки разработана прошивка ПЛИС. Вид трассировки - на скриншоте.
В ПЛИС реализованы 35 блоков, каждый из них имеет индивидуальное управление и включает в себя 102 DSP и 34 BRAM. Частота работы - 500 МГц. На вход DSP и BRAM поступает псевдослучайная последовательность, результаты работы каждых двух DSP и двух BRAM сравниваются. Это позволяет выявить одиночные ошибки.
Мощность 105 Вт достигнута при включении 22 блоков. Это 2244 DSP (из 5560) и 784 BRAM. При включении 24 блоков температура достигает +82 градусов и я останавливаю работу.
Все блоки объединены в одну цепочку управления и закреплены в своих областях. Цепочка управления включает 8 сигналов данных и опорный тактовый сигнал 100 МГц. Других сигналов управления нет. Это позволило достаточно экономно управлять всеми блоками. Если кому-нибуть нужны компоненты для реализации цепочки - сообщите, поделюсь.
В ПЛИС также размещены два контроллера DDR4 и контроллер PCI Express. Зелёным и жёлтым цветом выделены два блока из 35.
Первоначальные варианты прошивки разводились примерно за 10 часов, после некоторой оптимизации - за 2.5 часа.
В целом эксперимент показал правильность работы системы питания и системы охлаждения. Теперь можно задуматься об экономии энергии - как надо реализовывать алгоритмы что бы уложиться в 100 Вт.

Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
rloc
сообщение May 26 2018, 23:12
Сообщение #2


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(dsmv @ May 27 2018, 01:00) *
Хочу поделиться результатами эксперимента проверки FMC132P

Кто такой щедрый, что не задумываясь купит XCVU7P-2FLVB2104 ?
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 27 2018, 06:31
Сообщение #3


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Цитата(rloc @ May 27 2018, 02:12) *
Кто такой щедрый, что не задумываясь купит XCVU7P-2FLVB2104 ?


Здесь установлена XCKU115-3FLVB2104
Люди задумываются, но покупают.
Go to the top of the page
 
+Quote Post
rloc
сообщение May 27 2018, 10:23
Сообщение #4


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(dsmv @ May 27 2018, 09:31) *
Здесь установлена XCKU115-3FLVB2104
Люди задумываются, но покупают.

Просветите, для каких задач нужны такие мощности (вычислительные)?
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 27 2018, 10:47
Сообщение #5


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Цитата(rloc @ May 27 2018, 13:23) *
Просветите, для каких задач нужны такие мощности (вычислительные)?

Радиолокационные задачи являются безразмерными.
Go to the top of the page
 
+Quote Post
rloc
сообщение May 27 2018, 11:45
Сообщение #6


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(dsmv @ May 27 2018, 13:47) *
Радиолокационные

Знаком немного. Единственное, что приходит в голову - ФАР, где обработка каждого элемента (может быть несколько тыс.) делается централизовано. Решение таких задач чаще лежит в плоскости грамотного построения распределенной системы вычисления, заодно снижается нагрузка по передачи данных. Оправдать применение объема FLVB2104 крайне сложно.
Go to the top of the page
 
+Quote Post
RobFPGA
сообщение May 27 2018, 14:22
Сообщение #7


Профессионал
*****

Группа: Свой
Сообщений: 1 214
Регистрация: 23-12-04
Пользователь №: 1 643



Приветствую!
Цитата(rloc @ May 27 2018, 14:45) *
... Оправдать применение объема FLVB2104 крайне сложно.

Это вы не видели систем где модулей на таких чипах стоит несколько сотен и на каждом модуле не по одному похожему чипу wacko.gif .

Удачи! Rob.

Go to the top of the page
 
+Quote Post
rloc
сообщение May 27 2018, 14:38
Сообщение #8


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



В госзаказах видел, а там где считают - нет. В первом случае говорить об оправданности применения смысла нет.
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 27 2018, 15:21
Сообщение #9


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Ну например есть очень простая задача сжатия ЛЧМ сигнала методом быстрой свёртки.
А далее простым увеличением количества отсчётов можно дойти до предела на любой ПЛИС.
Go to the top of the page
 
+Quote Post
rloc
сообщение May 27 2018, 16:01
Сообщение #10


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Согласен, на конкретных примерах легче разобраться. Читал ваши статьи или ваших коллег на хабре по БПФ. Как помню, пишите сами, со своей арифметикой. Вкратце, можете описать тип алгоритма? Ресурсы на один блок вычисления для определенного произведения полосы на кол-во отсчетов? По R22 с увеличением отсчетов при широких полосах (допустим выше 100 МГц) быстрее заканчивается внутренняя память, а внешнюю не удается эффективно использовать из-за малой ширины.
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 27 2018, 16:21
Сообщение #11


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Про БПФ пишет Александр Капитанов.

Вот например картинка как ложатся БПФ и ОБПФ размером 64К в ПЛИС Virtex 7 VX1140. В этой ПЛИС 3360 DSP, т.е. она меньше чем KU115 в которой 5560 DSP. Но масштабы сравнимые.
А вот теперь увеличиваем размер БПФ и ОБПФ до 256К. Это уже займёт больше половины ПЛИС. Это при том, что мы используем собственный формат с плавающей точкой размером 23 бита.
Если FFT от Xilinx с плавающей точкой 32 бита, то скорее всего вообще не поместиться.
Здесь используется классические алгоритмы БПФ и ОБПФ с прореживанием по частоте и по времени. А также совершенно классическое представление числа с плавающей точкой. Вот только размеры мантиссы и экспоненты подобраны так, что они оптимально ложились на архитектуру DSP блока Xilinx. Подробнее - на Хабрахабр:
Реализация узла БПФ с плавающей точкой на ПЛИС
Custom floating point format on FPGA


Go to the top of the page
 
+Quote Post
rloc
сообщение May 27 2018, 20:50
Сообщение #12


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(dsmv @ May 27 2018, 19:21) *
Вот например картинка как ложатся БПФ и ОБПФ размером 64К в ПЛИС Virtex 7 VX1140. В этой ПЛИС 3360 DSP, т.е. она меньше чем KU115 в которой 5560 DSP. Но масштабы сравнимые.
А вот теперь увеличиваем размер БПФ и ОБПФ до 256К. Это уже займёт больше половины ПЛИС.

По картинке не очень понятно, какой объем. В оптимальном случае, для R4 увеличение вычислительных ресурсов составит log4(256k)/log4(64k)=9/8 = 12.5 % (по умножениям), по памяти соответственно в 4 раза. Но данных по памяти нет, выводов по ресурсам сделать нельзя.
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 27 2018, 20:59
Сообщение #13


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Цитата(rloc @ May 27 2018, 23:50) *
По картинке не очень понятно, какой объем. В оптимальном случае, для R4 увеличение вычислительных ресурсов составит log4(256k)/log4(64k)=9/8 = 12.5 % (по умножениям), по памяти соответственно в 4 раза. Но данных по памяти нет, выводов по ресурсам сделать нельзя.

Это не для режима pipeline. В этом режиме нарастание идёт практически линейное. Посмотрите таблицу в разделе "Общий объём ресурсов" https://habr.com/post/322728/
Используется Radix-2
Go to the top of the page
 
+Quote Post
blackfin
сообщение May 28 2018, 04:52
Сообщение #14


Гуру
******

Группа: Свой
Сообщений: 3 106
Регистрация: 18-04-05
Пользователь №: 4 261



Цитата(dsmv @ May 27 2018, 23:59) *
Используется Radix-2

Учитывая ёмкость современных ПЛИС и скорость современных АЦП и ЦАП, чистый Radix-2 сейчас вряд ли кому будет интересен. wink.gif
Go to the top of the page
 
+Quote Post
dsmv
сообщение May 28 2018, 05:14
Сообщение #15


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Цитата(blackfin @ May 28 2018, 07:52) *
Учитывая ёмкость современных ПЛИС и скорость современных АЦП и ЦАП, чистый Radix-2 сейчас вряд ли кому интересен. wink.gif

Абсолютно верно. Есть возможность сделать Radix-4 и Radix-8. А также повысить точность и сделать 32-х битную плавающую точку, но не в формате IEEE.
Как только появиться необходимость - это будет сделано.

Цитата
Как и ожидалось, память закончится раньше, а с оптимизированным алгоритмом R4 или R22 DSP48 потребуется еще меньше. Пока не вижу смысла использовать ПЛИС с большим кол-вом DSP48.


Скорее всего раньше закончиться резерв по мощности или по возможности охлаждения. Вот сейчас работает 40% DSP и это предел по возможности охлаждения. Если чуть-чуть улучшить радиатор, то будет предел по мощности. А возможность подведения большой мощности определяется в первую очередь размером корпуса и количеством контактов питания.
Go to the top of the page
 
+Quote Post
rloc
сообщение May 28 2018, 12:19
Сообщение #16


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(dsmv @ May 28 2018, 08:14) *
Скорее всего раньше закончиться резерв по мощности или по возможности охлаждения. Вот сейчас работает 40% DSP и это предел по возможности охлаждения. Если чуть-чуть улучшить радиатор, то будет предел по мощности. А возможность подведения большой мощности определяется в первую очередь размером корпуса и количеством контактов питания.

Дмитрий, переход на другие алгоритмы преобразования позволит раза в 2 снизить мощность, не только за счет уменьшения DSP, но и меньших внутрикристальных пересылок, коммутаций, обращений к памяти. Не согласен с подводимой мощностью. У вас питание подводится с одной стороны, что по результатам симуляции чаще приводит к неравномерному распределению токов по выводам, а фактически это эквивалентно меньшему корпусу. Эффективность танталовых конденсаторов при больших пульсациях тока близка к 0, пусть даже мультианодных. И все работает, как видим. Статическое потребление неиспользуемых DSP тоже не маленькое.
Для задач FFT стоимость FMC132P избыточна раз в 10.
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- dsmv   100 Ватт - модуль на Kintex UltraScale KU115   May 26 2018, 22:00
|- - blackfin   Цитата(rloc @ May 27 2018, 02:12) Кто так...   May 27 2018, 06:03
|||- - blackfin   Цитата(rloc @ May 27 2018, 14:45) Знаком ...   May 27 2018, 12:03
||||- - rloc   Цитата(blackfin @ May 27 2018, 15:03) А е...   May 27 2018, 13:53
|||- - blackfin   Цитата(dsmv @ May 27 2018, 19:21) Вот нап...   May 27 2018, 16:35
||||- - dsmv   Цитата(blackfin @ May 27 2018, 19:35) У X...   May 27 2018, 16:42
||||- - blackfin   Цитата(dsmv @ May 27 2018, 19:42) У нас -...   May 27 2018, 16:44
||||- - dsmv   И хочу ещё раз напомнить, библиотека БПФ выложена ...   May 27 2018, 16:48
|||- - rloc   Цитата(dsmv @ May 27 2018, 23:59) Это не ...   May 27 2018, 21:44
||||- - RobFPGA   Приветствую! Цитата(rloc @ May 28 2018, 0...   May 27 2018, 22:09
||||- - rloc   Цитата(RobFPGA @ May 28 2018, 01:09) у ме...   May 27 2018, 22:27
|||- - blackfin   Цитата(dsmv @ May 28 2018, 08:14) Абсолют...   May 28 2018, 05:17
||||- - dsmv   Цитата(rloc @ May 28 2018, 15:19) Для зад...   May 28 2018, 13:45
|||- - Tpeck   Цитата(dsmv @ May 28 2018, 08:14) Скорее ...   May 28 2018, 13:22
||- - syoma   Цитата(rloc @ May 27 2018, 12:23) Просвет...   May 28 2018, 09:12
|- - Flood   Цитата(rloc @ May 27 2018, 02:12) Кто так...   May 28 2018, 06:19
|- - blackfin   Цитата(Flood @ May 28 2018, 09:19) Как Ki...   May 28 2018, 06:22
|- - efg   Цитата(blackfin @ May 28 2018, 09:22) А м...   May 28 2018, 08:19
- - blackfin   Цитата(dsmv @ May 27 2018, 01:00) Мощност...   May 27 2018, 06:38
|- - dsmv   Цитата(blackfin @ May 27 2018, 09:38) Так...   May 27 2018, 06:51
- - blackfin   Цитата(dsmv @ May 27 2018, 09:51) Разведе...   May 27 2018, 07:00
|- - dsmv   Цитата(blackfin @ May 27 2018, 10:00) OK....   May 27 2018, 07:34
- - Volkov   Цитата(dsmv @ May 27 2018, 01:00) В целом...   May 27 2018, 18:00
|- - dsmv   Цитата(Volkov @ May 27 2018, 21:00) Круто...   May 27 2018, 18:54
- - x736C   Про локацию не могу ничего сказать, но общее сообр...   May 27 2018, 22:59
- - jojo   из платы на KU115 можно выжать 150-200 Вт на разъё...   May 28 2018, 14:10
|- - dsmv   Цитата(jojo @ May 28 2018, 17:10) из плат...   May 28 2018, 14:15
|- - blackfin   Цитата(dsmv @ May 28 2018, 17:15) В корпу...   May 28 2018, 14:52
|- - Flood   Цитата(dsmv @ May 28 2018, 17:15) В корпу...   May 28 2018, 18:06
- - jojo   А есть такие данные, что именно сгорит? Я думаю, м...   May 28 2018, 14:25
- - Plain   Уже третья страница, а о чём тема... Ежели надо, б...   May 28 2018, 15:23
|- - jojo   Цитата(Plain @ May 28 2018, 19:23) Уже тр...   May 29 2018, 01:22
|- - blackfin   Цитата(jojo @ May 29 2018, 04:22) Теперь ...   May 29 2018, 02:14
|- - jojo   Цитата(blackfin @ May 29 2018, 06:14) В U...   May 29 2018, 02:40
|- - dsmv   Мы не нашли ссылку на первоисточник знания про 1A ...   May 29 2018, 13:31
- - iosifk   Цитата(dsmv @ May 27 2018, 01:00) Хочу по...   May 28 2018, 18:21


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 24th July 2025 - 21:03
Рейтинг@Mail.ru


Страница сгенерированна за 0.01594 секунд с 7
ELECTRONIX ©2004-2016