реклама на сайте
подробности

 
 
 
Reply to this topicStart new topic
> Откуда такая производительность у UltraScale+., Сравнивая по IP ядрам Xilinx
Tpeck
сообщение Nov 16 2016, 10:45
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 307
Регистрация: 14-03-06
Пользователь №: 15 243



Добрый день.
Посмотрел производительность Kintex UltraScale по сравнению с Virtex 7, Virtex 6 на примере FFT, RS, Viterbi.
Оказался он производительнее, вроде так и должно быть (Slice другие, 20 nm и т. д.), но потом посмтрел на Ultra Scale + и обомлел.
______________________|FFT (8192, Str, Unscale)____|____ReedSolomon (CCSDS)_____|____DecoderViterbi
Virtex 6, МГц____________|______290 (V 7.1) ________|__________266 _____________|______316
Virtex 7, МГц____________|______281_______________|__________265 ____________|______ 303
Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358
Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

Kintex UltraScale+ RS ATSC так вообще 1019 МГц. 8-)
Это что за волшебство?
UltraScale+ действительно такой хороший или для него приведены абстрактные МГц в вакууме?
Проясните пожалуйста.

https://www.xilinx.com/support/documentatio...on/ru/xfft.html
https://www.xilinx.com/support/documentatio...rs-encoder.html
https://www.xilinx.com/support/documentatio...ru/viterbi.html
Go to the top of the page
 
+Quote Post
jojo
сообщение Nov 16 2016, 12:25
Сообщение #2


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



За 1019 не поручусь, но

>Kintex UltraScale+, МГц_|______571_______________|__________494 _____________|______538

вообще обычное дело даже для не-UltraScale.

Если CLB будет на 1 ГГц, то почему нет.
Go to the top of the page
 
+Quote Post
Tpeck
сообщение Nov 16 2016, 12:45
Сообщение #3


Местный
***

Группа: Свой
Сообщений: 307
Регистрация: 14-03-06
Пользователь №: 15 243



Цитата(jojo @ Nov 16 2016, 15:25) *
вообще обычное дело даже для не-UltraScale.


Вы не так поняли. Это частоты для конкрентных IP блоков, а для не UltrScale они тоже приведены.
Go to the top of the page
 
+Quote Post
jojo
сообщение Nov 16 2016, 14:41
Сообщение #4


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...
Go to the top of the page
 
+Quote Post
dm.pogrebnoy
сообщение Nov 16 2016, 16:46
Сообщение #5


Знающий
****

Группа: Свой
Сообщений: 747
Регистрация: 11-04-07
Пользователь №: 26 933



Цитата(jojo @ Nov 16 2016, 17:41) *
Для не UltraScale частоты низкие, потому что код внутри IP трешовый. Мало этапов у конвейера. Больше этапов - больше частота...

Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.


--------------------
Go to the top of the page
 
+Quote Post
Bad0512
сообщение Nov 17 2016, 02:00
Сообщение #6


Знающий
****

Группа: Свой
Сообщений: 802
Регистрация: 11-05-07
Из: Томск
Пользователь №: 27 650



Цитата(dm.pogrebnoy @ Nov 16 2016, 23:46) *
Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.

Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.
Go to the top of the page
 
+Quote Post
Vascom
сообщение Nov 17 2016, 07:59
Сообщение #7


Местный
***

Группа: Свой
Сообщений: 232
Регистрация: 2-08-07
Из: Москва
Пользователь №: 29 534



Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.
Go to the top of the page
 
+Quote Post
rloc
сообщение Nov 17 2016, 08:00
Сообщение #8


Узкополосный широкополосник
******

Группа: Свой
Сообщений: 2 316
Регистрация: 13-12-04
Из: Moscow
Пользователь №: 1 462



Цитата(Bad0512 @ Nov 17 2016, 05:00) *
Там внутри корки могут быть различия для разных семейств, поэтому и собирается эта корка по-разному, о чём нам какбэ намекает различное количество ресурса для одной и той же корки при разных типах ПЛИС.


Возьмем для сравнения
Код
xcku13p     ffve900     -1     kup_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     571     5803     10605     3582     40     3     63     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_fixed     1     8192     pipelined_streaming_io     false     fixed_point     24     24     unscaled     convergent_rounding     natural_order     false     aclk     303     5873     10605     3595     40     3     63     PRODUCTION 1.23 09-23-2016

Код
xcku13p     ffve900     -1     kup_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     440     7103     11818     4716     45     3     97     ADVANCE 1.05 07-08-2016
xcku115     flva1517     -1     ku_1_testmeasurement_stream_float     1     8192     pipelined_streaming_io     false     floating_point     32     24             natural_order     false     aclk     303     7154     11818     4750     45     3     97     PRODUCTION 1.23 09-23-2016


Не сильно по ресурсам отличаются, в пределах разброса оптимизации, а по скорости разница существенная - 571 МГц вместо 303 МГц, или 440 МГц вместо 303 МГц. При этом в скорости отдельно взятых примитивов такой разницы не видно. Может причина кроется в увеличении ресурсов роутинга? Предположим добавили триггеры на межсоединениях, как у Альтеры.

Go to the top of the page
 
+Quote Post
blackfin
сообщение Nov 17 2016, 08:11
Сообщение #9


Гуру
******

Группа: Свой
Сообщений: 3 106
Регистрация: 18-04-05
Пользователь №: 4 261



Цитата(Vascom @ Nov 17 2016, 10:59) *
Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.

Innovations at 16nm: UltraScale+ Family.
Go to the top of the page
 
+Quote Post
Tpeck
сообщение Nov 17 2016, 09:00
Сообщение #10


Местный
***

Группа: Свой
Сообщений: 307
Регистрация: 14-03-06
Пользователь №: 15 243



Цитата(Vascom @ Nov 17 2016, 10:59) *
Так они же на 11нм техпроцессе, вроде, - вот и растёт быстродействие и объём.


16 нм. Уменьшили на 20%, а скорость более 50%?
Virtex 6 - 40 nm
Virtex 7 - 26 nm.
Уменьшили на на 35%, а где прирост скорости?
Go to the top of the page
 
+Quote Post
Vascom
сообщение Nov 17 2016, 09:53
Сообщение #11


Местный
***

Группа: Свой
Сообщений: 232
Регистрация: 2-08-07
Из: Москва
Пользователь №: 29 534



Значит на 16нм, лень смотреть точно было.
Видимо откладывали прирост до выхода UltraScale+.
Go to the top of the page
 
+Quote Post
Maverick
сообщение Nov 17 2016, 10:38
Сообщение #12


я только учусь...
******

Группа: Модераторы
Сообщений: 3 447
Регистрация: 29-01-07
Из: Украина
Пользователь №: 24 839



там кроме перехода на 16нм еще
Цитата
UltraScale™ architecture-based All Programmable FPGAs, 3D ICs and SoCs



--------------------
If it doesn't work in simulation, it won't work on the board.

"Ты живешь в своих поступках, а не в теле. Ты — это твои действия, и нет другого тебя" Антуан де Сент-Экзюпери повесть "Маленький принц"
Go to the top of the page
 
+Quote Post
Tpeck
сообщение Nov 17 2016, 12:19
Сообщение #13


Местный
***

Группа: Свой
Сообщений: 307
Регистрация: 14-03-06
Пользователь №: 15 243



Цитата(Maverick @ Nov 17 2016, 13:38) *
там кроме перехода на 16нм еще

3D есть даже в Virtex 7 и в кристаллах Kintex UltraScale для которых приведены рабочии частота.
Это не объясняет столь колоссальный отрыв UltraScale+, от UltraScale.

https://www.xilinx.com/products/silicon-devices/3dic.html
Go to the top of the page
 
+Quote Post
jks
сообщение Nov 17 2016, 12:41
Сообщение #14


Местный
***

Группа: Свой
Сообщений: 249
Регистрация: 3-04-11
Из: .
Пользователь №: 64 084



16nm - Finfet TSMC 16FF+
20nm+ - Planar

У FinFet сопротивление канала и утечки меньше.

http://www.tsmc.com/english/dedicatedFound...nology/16nm.htm
http://www.tsmc.com/english/dedicatedFound...nology/20nm.htm
http://www.tsmc.com/english/dedicatedFound...nology/28nm.htm
Go to the top of the page
 
+Quote Post
jojo
сообщение Nov 17 2016, 13:31
Сообщение #15


Знающий
****

Группа: Свой
Сообщений: 574
Регистрация: 9-10-04
Из: FPGA-city
Пользователь №: 827



Цитата(dm.pogrebnoy @ Nov 16 2016, 19:46) *
Есть какие-нибудь, хоть косвенные подтверждения этому? Там в принципе одна и та же версия корки должна быть для сравнения использована, да и можно самому попробовать проверить одно ядро на разных семействах. Цифры интересные.


Kintex UltraScale, МГц ____|______303_______________|__________347 _____________|______358

Частоты около 300 означают, что оптимизации проекта в целом никакого внимания не уделялось.
Кто собирал, как собирал, из чего ... и что хотел сказать этим автор.


Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 18th July 2025 - 19:53
Рейтинг@Mail.ru


Страница сгенерированна за 0.01472 секунд с 7
ELECTRONIX ©2004-2016