Форум разработчиков электроники ELECTRONIX.ru > Принять и ПАРАЛЛЕЛЬНО распарсить поток 10Гбит/с. Как решаются такие задачи?

twix

Jan 3 2018, 18:52

Цитата(Студент заборстроительного @ Jan 3 2018, 17:40)

Вот опять "снова здорова"...

Ну на самом деле информации у Вас уже достаточно чтобы самому двигать дальше. Trade off у вас такой. С одной стороны данные идут потоком 10гиг в секунду,
с другой стороны чем больше байт приходится на один модуль и чем больше модулей, тем больше у модуля времени до того, как вывалится новая порция данных.
Из чего можно смело строить архитектуру. Сложность алгоритма вам известна,скорость вычисления тоже, следовательно время затрачиваемое блоком на обработку известно.
Вот это время и будет той самой константой, в течение которой данные не должны обновляться.

Пример расчета. Скажем время алгоритма T, число байт B, число модулей N = T*1e10/(B*8)
В цифрах, пускай алгоритм занимает T = 2мкс, число байт B = 256.
N = 2e-6*1e10/(256*8) = 2e-6*1e10/2e3 = 1e-6*1e10*1e-3 = 10 модулей... хи хи.

Что такое 2 мкс, для сравнения Microblaze имеет производительность 400MIPS на Kintex,
то есть за 2мкс он выполнит 800 команд.

Студент заборстроительного

Jan 3 2018, 19:05

Цитата(Александр77 @ Jan 3 2018, 21:51)

Теперь у Вас появились микроконтроллеры, которые Вы хотите запихнуть в ПЛИС

А что такого? Это было очевидно с самого начала.
И потом.
Я читал в интернете, что сейчас любой даже подросток-ПЛИСовод сможет реализовать в ПЛИС кучу параллельно работающих микроконтроллеров. Что это задача даже не мидл-уровня. А ниже.

Почему Вас так поразило, что каждый "узел" ПЛИС - будет микроконтроллером?

Не понимаю

Или это для Вас ПРИНЦИПИАЛЬНО важно, чем будет узел?

Цитата(Александр77 @ Jan 3 2018, 21:51)

рисуйте структуру своей гипотетической системы

Вот она

Цитата(Александр77 @ Jan 3 2018, 21:51)

расставляйте времена

Расставил

Цитата(Студент заборстроительного @ Jan 3 2018, 15:41)

Допустим каждый из тысячи узел ПЛИС просто каждые 10 мкс считывает байт за байтом инфу из своего дампа (64 байта) памяти 10G приемника, делает операцию XOR с некоей константой и записывает в память 10G передатчика.
Приемник и передатчик никак не синхронизируются между собой и с узлами. Узлы в ПЛИС также работают совершенно независимо от других узлов, 10G-приемника и 10G-передатчика
Каждый просто ТУПО делает свою работу не взирая на то, в каком состоянии находятся данные.

krux

Jan 3 2018, 19:08

https://www.youtube.com/watch?v=4zLfCnGVeL4

Александр77

Jan 3 2018, 19:14

Цитата(Студент заборстроительного @ Jan 3 2018, 22:05)

Или это для Вас ПРИНЦИПИАЛЬНО важно, чем будет узел?

Лично для меня - не принципиально, так как я не исполнитель. Для Вас должно быть принципиально.
Очень много зависит от того, что за "микроконтроллер" Вы попытаетесь создать в количестве 1000 штук в одной ПЛИС.
Если это будет Ваш конечный автомат, занимающий 300 ЛЭ - да не вопрос - ищите ПЛИС.
А если стандартный ниос\микроблейз тут есть большущие сомнения в количестве реализуемых микроконтроллеров.

jojo

Jan 3 2018, 19:36

Цитата(Александр77 @ Jan 3 2018, 22:14)

Лично для меня - не принципиально, так как я не исполнитель. Для Вас должно быть принципиально.
Очень много зависит от того, что за "микроконтроллер" Вы попытаетесь создать в количестве 1000 штук в одной ПЛИС.
Если это будет Ваш конечный автомат, занимающий 300 ЛЭ - да не вопрос - ищите ПЛИС.
А если стандартный ниос\микроблейз тут есть большущие сомнения в количестве реализуемых микроконтроллеров.

Microblaze MCS несколько сотен можно размножить на частоте 200 MHz в 325t. В крупной Плис тысячу.
Троллю желаю расширить кругозор, скучно стало читать.

Plain

Jan 3 2018, 21:31

Для не совсем осведомлённых не помешает добавить в тему малость юмора — со слов её автора, произнесённых ранее, он занимается разработкой особо ответственных бескомпромиссных узлов, что конкретно здесь надо понимать так, что такая лакомая для грызунов кварцевая нитка 10 Гб на самом деле 1000-кратно же резервирована бронированными окольными путями, а ПЛИС, про которую он сейчас говорит в единственном числе, на самом деле тоже того же плана шкафы, которыми утыкан населённый пункт дислокации всего этого добра по его окраинам.

Студент заборстроительного

Jan 4 2018, 10:55

Цитата(Александр77 @ Jan 3 2018, 22:14)

Лично для меня - не принципиально, так как я не исполнитель. Для Вас должно быть принципиально.
Очень много зависит от того, что за "микроконтроллер" Вы попытаетесь создать в количестве 1000 штук в одной ПЛИС.
Если это будет Ваш конечный автомат, занимающий 300 ЛЭ - да не вопрос - ищите ПЛИС.
А если стандартный ниос\микроблейз тут есть большущие сомнения в количестве реализуемых микроконтроллеров.

Т.е. в принципе задача в указанной мной формулировке решаема и описанная мной архитектура вполне реализуема и весь вопрос только в том, хватит ли в ПЛИС вентилей для создания 1000 малюсеньких микроконтроллеров.
Понятно.
Спасибо за ответ

Цитата(jojo @ Jan 3 2018, 22:36)

Microblaze MCS несколько сотен можно размножить на частоте 200 MHz в 325t. В крупной Плис тысячу.

Понял.
Задача 100% решаема

Цитата(Plain @ Jan 4 2018, 00:31)

Для не совсем осведомлённых не помешает добавить в тему малость юмора — со слов её автора, произнесённых ранее, он занимается разработкой особо ответственных бескомпромиссных узлов, что конкретно здесь надо понимать так, что такая лакомая для грызунов кварцевая нитка 10 Гб на самом деле 1000-кратно же резервирована бронированными окольными путями, а ПЛИС, про которую он сейчас говорит в единственном числе, на самом деле тоже того же плана шкафы, которыми утыкан населённый пункт дислокации всего этого добра по его окраинам.

Вы правы. Указанная в заголовке темы задача - только первый этап более крупной задачи.
И "кварцевых ниток" не надо 1000. Достаточно будет 3-х.

syoma

Jan 4 2018, 18:23

Цитата

Ну вот смотрите. Каждые 1.6мкс приходит новый пакет, содержащий 25 дампов состояния объёмом 64 байта каждый.
И какие дампы будут обновлены заранее неизвестно.
И скорость реакции заранее неизвестна. Она зависит от того, что пришло.
Т.е. от состояния устройства. Поэтому какие-то дампы требуют НЕМЕДЛЕННОЙ реакции, а для каких-то и задержка 320 мкс приемлима

Скорость реакции в ПЛИС фиксирована. Какая скорость реакции вам нужна?

Цитата

Допустим каждый из тысячи узел ПЛИС просто каждые 10 мкс считывает байт за байтом инфу из своего дампа (64 байта) памяти 10G приемника, делает операцию XOR с некоей константой и записывает в память 10G передатчика.
Приемник и передатчик никак не синхронизируются между собой и с узлами. Узлы в ПЛИС также работают совершенно независимо от других узлов, 10G-приемника и 10G-передатчика
Каждый просто ТУПО делает свою работу не взирая на то, в каком состоянии находятся данные.

Как уже выше написали, обработчик, который "считывает байт за байтом инфу из своего дампа (64 байта) памяти 10G приемника, делает операцию XOR с некоей константой и записывает в память 10G передатчика" в современной ПЛИС может выполниться за 1 такт на 156Мгц. Т.е за 10мкс такой обработчик может обработать 1560 дампов - это больше, чем всего устройств в вашей системе.

Студент заборстроительного

Jan 4 2018, 21:13

Цитата(syoma @ Jan 4 2018, 21:23)

Скорость реакции в ПЛИС фиксирована.

То есть как?
В ПЛИС-ах не бывает "IF...THEN..ELSE"?
А как же тогда в них делают микроконтроллеры, работающие по программе?
Что-то не сходится

Цитата(syoma @ Jan 4 2018, 21:23)

Как уже выше написали, обработчик, который "считывает байт за байтом инфу из своего дампа (64 байта) памяти 10G приемника, делает операцию XOR с некоей константой и записывает в память 10G передатчика" в современной ПЛИС может выполниться за 1 такт на 156Мгц.

Ну так пример с XOR это просто гипотетический пример для тестирования самой возможности реализации такой архитектуры.
Реально же узлы будут состоять не только из логических вентилей, но и из триггеров.
И алгоритм такой, что за 1 такт ("одним чохом") весь дамп не обработаешь. Нужно байт за байтом. С запоминанием промежуточных результатов.

И потом. Каким образом 64 считывания из памяти выполняться за 1 такт?
Вы меня разыгрываете?

jojo

Jan 5 2018, 04:36

Цитата(Студент заборстроительного @ Jan 5 2018, 00:13)

Вы меня разыгрываете?

Что за алгоритм-та, формУла какая в ём?

syoma

Jan 5 2018, 09:48

Цитата(Студент заборстроительного @ Jan 4 2018, 23:13)

То есть как?
В ПЛИС-ах не бывает "IF...THEN..ELSE"?
А как же тогда в них делают микроконтроллеры, работающие по программе?
Что-то не сходится

Если вы хотите сделать If...then быстро на ПЛИС, то это будет сделано на логике. Т.е вы будете реализовывать путь логики THEN и путь логики ELSE и все это будет занимать ресурсы ПЛИС. А IF - это всего лишь ключ после этих двух путей, который будет выбирать результат из одного из них и подавать на выход схемы. Таким образом, если все это будет работать синхронно, реакция этой схемы будет равна реакции самого медленного пути.

Цитата

Ну так пример с XOR это просто гипотетический пример для тестирования самой возможности реализации такой архитектуры.
Реально же узлы будут состоять не только из логических вентилей, но и из триггеров.
И алгоритм такой, что за 1 такт ("одним чохом") весь дамп не обработаешь. Нужно байт за байтом. С запоминанием промежуточных результатов.

Вам уже писали, что в ПЛИС есть понятие конвеерной обработки - так как алгоритм одинаков для всех блоков. Выше я написал, как делается IF...then - оно тоже легко конвееризируется. Запоминание промежуточных результатов и автоматов состояний тоже прекрасно ложится на конвейер. Даже если обработка будет занимать 64 такта, если ваш обработчик будет сделан так, что ему можно будет "вскармливать" новый дамп каждый такт - а это в принципе не сложно, то он все равно за 10мкс сможет обработать 1560 дампов + 64 такта.

Цитата

И потом. Каким образом 64 считывания из памяти выполняться за 1 такт?
Вы меня разыгрываете?

Dustributed Memory - есть и такой блок в ПЛИС

Александр77

Jan 5 2018, 10:27

Цитата(jojo @ Jan 5 2018, 07:36)

Что за алгоритм-та, формУла какая в ём?

Вы не первый, кто задается этим вопросом. Но ТС тертый калач - новую хау не открывает.

yuri.job

Jan 6 2018, 18:30

я стесняюсь спросить, а собственно зачем в плисе делать 1000 непонятных параллельных обработчиков хз чего, что пытается принять, распарсить, изменить, обернуть и наконец отправить надат е.фрейм на скорости 10Г? это фетиш какой-то новомодный или я чего то решительно не понимаю.

тау

Jan 6 2018, 19:15

Цитата(yuri.job @ Jan 6 2018, 22:30)

я стесняюсь спросить, а собственно зачем в плисе делать 1000 непонятных параллельных обработчиков хз чего, что пытается принять, распарсить, изменить, обернуть и наконец отправить надат е.фрейм на скорости 10Г? это фетиш какой-то новомодный или я чего то решительно не понимаю.

сама задача ТС 10G-->1000mcu--->10G смысла не имеет вообще. Это не фетиш или что-то реальное а просто надуманный повод потроллить и получить удовольствие от процесса.

jojo

Jan 6 2018, 19:36

Цитата(тау @ Jan 6 2018, 23:15)

сама задача ТС 10G-->1000mcu--->10G смысла не имеет вообще. Это не фетиш или что-то реальное а просто надуманный повод потроллить и получить удовольствие от процесса.

Это мог бы быть high frequency trading.
Или майнинг, если на DSP блоках.
Но увы, не тот случАй.

new123

Jan 12 2018, 09:55

Я не все дочитал и на чем остановились.
Я бы взял двух портовую сетевую карту с bypass решением.
В один порт бы принимал, во второй отправлял.
На круг 1 пакет можно провернуть примерно за 3мксек. Сильно зависит от проца, шины и самое главное размера пакета. Так задача решится гораздо проще, быстрее
На плис вы сможете выиграть примерно до 1000нс по прикидкам, все зависит от размера сетевого пакета и его данных

Студент заборстроительного

Jan 13 2018, 10:23

Цитата(yuri.job @ Jan 6 2018, 21:30)

я стесняюсь спросить, а собственно зачем в плисе делать 1000 непонятных параллельных обработчиков хз чего, что пытается принять, распарсить, изменить, обернуть и наконец отправить надат е.фрейм на скорости 10Г? это фетиш какой-то новомодный или я чего то решительно не понимаю.

"не читал, но осуждаю"© ?
Я понимаю, Вы всю тему не асилили. Прочтите хотя бы последнюю страницу. В частности, сообщение, где говорится про "3 нити".
"Зачем и почему" на страницах темы уже обсуждалось и не раз.
Повторять специально для тех, что в танке, я не собираюсь

haker_fox

Jan 15 2018, 04:27

Студент заборстроительного, ИМХО, со времени начала топика (31 вроде как), по сегодняшний день вы уже могли более менее разобраться в теме самостоятельно. Хотя бы для того, чтобы написать внятное тз.

Ах да, вы же заняты высокими материями и вам некогда заниматься тем, что не связано с АСУТП. Ну тогда продолжайте ещё 30 лет заниматься анони... простите этой темой. Заодно нас развлечёте.

З.Ы. Обращайтесь к модераторам, если хотите. Отвечайте в личке. Но моё мнение: вы либо идиот с кучей комплексов неполноценности, либо действительно в теме АСУТП, и хотите нам показать свою значимость, чтобы мы прониклись вами. Но в любом случае у вас проблемы психологического, плана, батеньки. Вы получаете удовольствие, тролля здесь. Значит в реальной жизни у вас этого удовольствия крайне мало. Займитесь собой. Ибо нам до вас дела нет никакого. Или хотите и дальше выступать в роли шута? Дело ваше...

Kabdim

Jan 15 2018, 09:07

Извините что вмешиваюсь, на это побудила меня ваша подпись. Прошу, занесите студента в список игнорирования и гармония будет восстановлена гораздо более эффективно, чем отправка таких постов.

haker_fox

Jan 15 2018, 15:11

QUOTE (Kabdim @ Jan 15 2018, 17:07)

Извините что вмешиваюсь, на это побудила меня ваша подпись. Прошу, занесите студента в список игнорирования и гармония будет восстановлена гораздо более эффективно, чем отправка таких постов.

Знаете, для меня гармония это не только добрые слова, иногда это скромная попытка обратить внимание человека на его проблемы. Меня он не раздражает т.к. я мало читаю топики с ним... но этот топик меня заинтересовал своей темой. Правда потом я понял, что к теме тут мало что относится. Но также я обратил и внимание на то, что автор топика многократно пытается порисоваться тут. Можно промолчать, а можно и намекнуть

Студент заборстроительного

Jan 15 2018, 16:12

Цитата(haker_fox @ Jan 15 2018, 07:27)

Студент заборстроительного, ИМХО, со времени начала топика (31 вроде как), по сегодняшний день вы уже могли более менее разобраться в теме самостоятельно. Хотя бы для того, чтобы написать внятное тз.

Вы думаете я на работе больше ничем не загружен кроме как этой задачей?
Вы ошибаетесь. В рабочее время мне нЕкогда ей заниматься. Есть куча других задач и проектов.
Поэтому этой темой занимаюсь урывками, в личное время, когда есть свободная минутка другая

Koluchiy

Jan 15 2018, 16:30

Ой, какой срачик я пропустил

.
Честно говоря, лень всё перечитывать.

Но скажу, что судя по корневому посту, задача может по-разному решаться в зависимости от деталей алгоритма обработки каждого датчика.

Аффтору советую нанять себе консультанта-плисовода, чтобы разобрался в этом(этих)алгоритмах, составил и разъяснил варианты реализации на плисах.
И уже в ходе/после таковой консультации написали бы совместно ТЗ.

haker_fox

Jan 16 2018, 00:31

QUOTE (Студент заборстроительного @ Jan 16 2018, 00:12)

Вы ошибаетесь. В рабочее время мне нЕкогда ей заниматься. Есть куча других задач и проектов.

Я не ошибаюсь, ибо

QUOTE (haker_fox @ Jan 15 2018, 12:27)

Ах да, вы же заняты высокими материями и вам некогда заниматься тем, что не связано с АСУТП.

des333

Jan 16 2018, 00:57

Цитата(haker_fox @ Jan 16 2018, 03:31)

Я не ошибаюсь, ибо

К сожалению, Вы всё-таки, ошибаетесь.

В том, что пытаетесь объяснить что-то таким людям, как автор.
Ведь они пишут исключительно для того, чтобы получать внимание, троллить и радоваться.

Если бы инженерное комьюнити игнорировало их темы и комментарии, то через некоторое время им бы стало скучно, и они перестали бы засорять форум.

Maverick

Jan 16 2018, 07:17

Закачиваем разговоры ни о чем...

XVR

Jan 16 2018, 08:01

2ТС - похоже у вас стойкое представление, что FPGA это такой большой сильно программируемый микропроцессор. Это в корне не так! Почитайте наконец какой нибудь букварь по FPFA и перестаньте смешить народ

AVR

Jan 16 2018, 08:28

Цитата(Студент заборстроительного @ Dec 23 2017, 14:12)

А при обработке данных в памяти она должна использоваться ПЛИСиной как набор из 1000 независимых дампов с независимым доступом.
Такое есть в природе?

Нет, разве что встроенные отдельные блоки памяти, может в очень больших ПЛИС такое число найдется. Не могу прочитать всё, но прошу продублировать, в чем заключается "обработка"? Распарсить что? Текстовые логи? И куда результат, или что-то делать в зависимости от результата?
Одно дело процедить регулярный текст, а другое - если что-то сложнее.

Студент заборстроительного

Jan 16 2018, 17:08

Цитата(XVR @ Jan 16 2018, 11:01)

2ТС - похоже у вас стойкое представление, что FPGA это такой большой сильно программируемый микропроцессор.

Нет. У меня представление, что на ПЛИС можно реализовать "сколько хош" мокропроцессоров.
А это как раз то, что мне нужно: очень много параллельно работающие микропроцессоров в одном чипе

Цитата(AVR @ Jan 16 2018, 11:28)

Нет, разве что встроенные отдельные блоки памяти, может в очень больших ПЛИС такое число найдется. Не могу прочитать всё, но прошу продублировать, в чем заключается "обработка"? Распарсить что? Текстовые логи? И куда результат, или что-то делать в зависимости от результата?
Одно дело процедить регулярный текст, а другое - если что-то сложнее.

Вся идея в картинке:

И в который раз повторю "зачем но надо"
Есть тыща устройств. У каждого устройства есть контроллер.
1000 устройств связаны 1000 контроллеров 1000 кабелями
А я хочу сделать так: 1000 устройств 3 кабеля (можно 1, но вдруг оборвётся). А контроллеры загнать в одну ПЛИСину.

Что тут непонятно?

Flip-fl0p

Jan 16 2018, 17:14

Цитата

Что тут непонятно?

Так Вам уже отвечали, что в данной постановке задача решается путем заменой параллельной обработки на последовательную. В итоге имеем, что алгоритм выполняется и выдает данные с стой скоростью которая вам нужна. Но выполняется последовательная обработка, а не параллельная.
Что тут непонятно?

krux

Jan 16 2018, 17:18

Flip-fl0p
let's troll this troll!

blackfin

Jan 16 2018, 17:27

Цитата(krux @ Jan 16 2018, 20:18)

let's troll this troll!

Предлагаете опуститься до уровня ~~имбецила~~ Студента?

Студент заборстроительного

Jan 16 2018, 18:20

Цитата(Flip-fl0p @ Jan 16 2018, 20:14)

заменой параллельной обработки на последовательную.

Я об этом не просил.
Задача в другом

XVR

Jan 17 2018, 13:50

Цитата(Студент заборстроительного @ Jan 16 2018, 20:08)

Нет. У меня представление, что на ПЛИС можно реализовать "сколько хош" мокропроцессоров.
А это как раз то, что мне нужно: очень много параллельно работающие микропроцессоров в одном чипе

У вас неправильное представление. Реализовать можно, но вы получите 1000 весьма посредственных процессоров за космическую сумму. Если вам действительн надо '1000 процесоров' то вам надо смотреть в сторону nVIDIA с CUDA и/или OpenCL

FPGA для этих целей не применяют

blackfin

Jan 17 2018, 14:05

Цитата(XVR @ Jan 17 2018, 16:50)

FPGA для этих целей не применяют

Да вроде как вполне себе применяют: 1680 open-source ISA RISC-V processor cores run on one Virtex UltraScale+ VU9P FPGA.

Если, конечно, есть деньги..

XVR

Jan 17 2018, 14:17

Цитата(blackfin @ Jan 17 2018, 17:05)

Да вроде как вполне себе применяют: 1680 open-source ISA RISC-V processor cores run on one Virtex UltraScale+ VU9P FPGA.

Это как раз 'делают'. Те, кому нужно 'применить' берут готовую GTX 1080 с 3584 ядрами CUDA, запущенными на 1582MHz, а не занимаются построением космических кораблей из золотой жести

Koluchiy

Jan 17 2018, 14:18

Интересно, сколько стоил самый дорогой микроскоп, которым забивали гвозди?

AVR

Jan 17 2018, 14:20

Цитата(Студент заборстроительного @ Jan 16 2018, 20:08)

Есть тыща устройств. У каждого устройства есть контроллер.
1000 устройств связаны 1000 контроллеров 1000 кабелями
А я хочу сделать так: 1000 устройств 3 кабеля (можно 1, но вдруг оборвётся). А контроллеры загнать в одну ПЛИСину.

Это понятно, я бы тоже хотел обработку логов от 1000 устройство по возможности засунуть в что-то одно.
Однако, в свою очередь, что не понятно в моем вопросе? Я четко поинтересовался - насколько сложный лог, что он из себя представляет для парсинга?
Прошу привести пример текстового или бинарного лога (тогда с пояснениями) от одного из таких устройств. Неужели каждое из них жарит поток на 10 мегабит?
Канал понятно что 10G, но какой суммарный поток? Он приближается к предельным 10G?

blackfin

Jan 17 2018, 14:43

Цитата(XVR @ Jan 17 2018, 17:17)

Это как раз 'делают'. Те, кому нужно 'применить' берут готовую GTX 1080 с 3584 ядрами CUDA, запущенными на 1582MHz, а не занимаются построением космических кораблей из золотой жести

Да ладно, не сочиняйте.

Всегда можно придумать задачу неудобную для "процессора из коробки" и удобную для FPGA..

Классический пример - взять 128-битное число и перевернуть в нем все биты в обратном порядке:

msb <-> lsb, msb-1 <-> lsb+1, и тд..

Сколько времени ваша CUDA с 3584 ядрами, запущенными на 1582 MHz будет делать эту операцию?

На FPGA эта операция займет один такт..

Студент заборстроительного

Jan 17 2018, 17:05

Цитата(XVR @ Jan 17 2018, 16:50)

У вас неправильное представление. Реализовать можно, но вы получите 1000 весьма посредственных процессоров

Так мне и надо очень примитивные процессоры.

Цитата(XVR @ Jan 17 2018, 16:50)

вы получите 1000 весьма посредственных процессоров за космическую сумму.

Самая крутая и навароченная ПЛИСина стоит 10000евро. Получается что 1 процессор будет стоить 100 евро. Копейки же

Цитата(XVR @ Jan 17 2018, 16:50)

FPGA для этих целей не применяют

А в интернете я читал, что как раз для этого и нужна плисина. Для распаралеливания обработки.
В этом её назначение и преимущество

Цитата(blackfin @ Jan 17 2018, 17:43)

Да ладно, не сочиняйте.

Всегда можно придумать задачу неудобную для "процессора из коробки" и удобную для FPGA..

Классический пример - взять 128-битное число и перевернуть в нем все биты в обратном порядке:

msb <-> lsb, msb-1 <-> lsb+1, и тд..

Сколько времени ваша CUDA с 3584 ядрами, запущенными на 1582 MHz будет делать эту операцию?

На FPGA эта операция займет один такт..

Вот вот.
Именно это я и имел в виду.
"Врожденная" параллельность ПЛИС

Она меня привлекает и возбуждает

blackfin

Jan 17 2018, 17:16

Цитата(Студент заборстроительного @ Jan 17 2018, 20:05)

Самая крутая и навароченная ПЛИСина стоит 10000 евро. Получается что 1 процессор будет стоить 100 евро. Копейки же

Кто вам такую глупость сказал?

XCVU440-3FLGA2892E - Unit Price: 76571 $

likeasm

Jan 17 2018, 19:27

Цитата(blackfin @ Jan 17 2018, 20:16)

Кто вам такую глупость сказал?

XCVU440-3FLGA2892E - Unit Price: 76571 $

Блин туда же можно запихнуть 10000 Picoblaze и распарсить уже 100Gbit на 10000 устройств.

Golikov A.

Jan 17 2018, 19:34

А зачем вы спорите то?

Kintex UltraScale
Block RAM Blocks
KU060 KU085 KU095 KU115
1,080 1,620 1,680 2,160
они 2 портовые, по 1 или 2 кБайта

ставим 1000 таких блоков. На один порт к каждому блоку вешаем модуль обработки (можно процессор). Другим портом все блоки цепляем к одному маку. Шина данных общая, адреса муксятся. Мак сможет во все блоки писать по очереди (как принимает данные), контроллеры одновременно забирать данные (параллельно).

Решение реализуемо, и не очень сложное.

Все! решение есть - тема исчерпана. Не надо его отговаривать, если человеку контроллер за 100 евро копейки, то зачем с ним спорить то?

zombi

Jan 17 2018, 21:10

Цитата(Студент заборстроительного @ Jan 17 2018, 21:05)

...10000евро. Получается что 1 процессор будет стоить 100 евро

10000 / 1000 = 100 Жесть

AVR

Jan 18 2018, 06:53

Цитата(Студент заборстроительного @ Jan 17 2018, 20:05)

Так мне и надо очень примитивные процессоры

Я просил пример лога от прибора, и что необходимо произвести с данными.
Реальные данные не обязательно, можно из головы придумать адреса, значения и поля.
Беспредметный разговор получается.

Цитата(Golikov A. @ Jan 17 2018, 22:34)

Решение реализуемо, и не очень сложное

Полностью согласен - всё реализуемо. Но автор темы морочит нам голову тем, что не предоставляет пример лога от одного прибора и что необходимо произвести. Какого уровня сложности парсинг - вот от этого и зависит - влезет ли это в оч большую ПЛИС.

XVR

Jan 18 2018, 07:23

Цитата(Студент заборстроительного @ Jan 17 2018, 20:05)

А в интернете я читал, что как раз для этого и нужна плисина. Для распаралеливания обработки.

Угу, но не путём построения 100500 процессоров. Распарралеленная обработка делается в голом железе, без всяких процессоров.

Цитата(blackfin @ Jan 17 2018, 17:43)

Всегда можно придумать задачу неудобную для "процессора из коробки" и удобную для FPGA..

Разумеется, иначе FPGA и не было бы

Цитата

Классический пример - взять 128-битное число и перевернуть в нем все биты в обратном порядке:

Для этого процессор не нужен

Цитата

Сколько времени ваша CUDA с 3584 ядрами, запущенными на 1582 MHz будет делать эту операцию?

На CUDA это делать смысла нет.

ТС вполне четко сформулировал - "хочу 1000 процессоров в FPGA". Именно этого делать смысла нет, для этого нужно брать CUDA
А для разворота 128 битного вектора - FPGA

one_eight_seven

Jan 18 2018, 07:26

Цитата

Вот вот.
Именно это я и имел в виду.
"Врожденная" параллельность ПЛИС beer.gif Она меня привлекает и возбуждает

Шутка была в том, что приведенная задача решается за 0 тактов 128 проводками.

Студент заборстроительного

Jan 18 2018, 20:35

Цитата(AVR @ Jan 18 2018, 09:53)

Я просил пример лога от прибора, и что необходимо произвести с данными.

Мы вроде с Вами пока не заключали контракт

Александр77

Jan 19 2018, 01:53

Цитата(AVR @ Jan 18 2018, 09:53)

Я просил пример лога от прибора, и что необходимо произвести с данными.
Реальные данные не обязательно, можно из головы придумать адреса, значения и поля.
Беспредметный разговор получается.

Если бы Вы почитали предыдущие страницы - Вам не пришлось бы делать это открытие - ибо уже говорилось.
Вообще просьба к модераторам, закройте пожалуйста тему, по причине толчии воды в ступе на протяжении 10 страниц.

AVR

Jan 19 2018, 07:11

Цитата(Александр77 @ Jan 19 2018, 04:53)

Если бы Вы почитали предыдущие страницы - Вам не пришлось бы делать это открытие - ибо уже говорилось

Зачем мне впустую тратить время? Если так - автор мог бы дать ссылку на пост, делов то.

Цитата(Студент заборстроительного @ Jan 18 2018, 23:35)

Мы вроде с Вами пока не заключали контракт

Зачем же грубить? Можно просто дать ссылку на пост с деталями, тема большая. Лучше иметь документ с наброском ТЗ.
Я от чистого сердца пытался уточнить детали, чтобы что-то подсказать и помочь.

Предлагаю другим пользователям форума участвовать в дискуссиях с господином Студентом З только после заключения контракта.
На этом всё.

Александр77

Jan 19 2018, 07:24

Цитата(AVR @ Jan 19 2018, 10:11)

Зачем мне впустую тратить время? Если так - автор мог бы дать ссылку на пост, делов то.

С Вашего позволения приведу одну из цитат

Цитата(Студент заборстроительного @ Dec 30 2017, 19:03)

Вы зря стараетесь меня "выудить" у меня детали ноу-хау нашей системы управления и "развести", чтобы я забесплатно устроил Вам ликбез по современным АСУТП. Хотя у меня ест чем возразить и дополнить по каждому из перечисленных Вами пунктов. Но я "калач тёртый". И на "слабо рассказать?" не ведусь

Надеюсь станет ясно с кем имеем дело.
И еще один момент, все что ТС представляет в виде структуры, за него сделал Flip-Fl0p, сам он палец о палец не ударил.
И прочитав предыдущие посты, Вы бы не стали тратить время на уточнения.