Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: PicaRISC
Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Системы на ПЛИС - System on a Programmable Chip (SoPC)
Adv
Появился новый потоковый процессор для ALTERA - PicaRISC. Скорость обработки - до 100ГГц.
Если кто не верит, так я не виноват - информацию прилагаю....
des00
Цитата(Adv @ Oct 24 2008, 01:41) *
Появился новый потоковый процессор для ALTERA - PicaRISC. Скорость обработки - до 100ГГц.
Если кто не верит, так я не виноват - информацию прилагаю....


скока скока ?? 100 Гига герц ? это что тактовая ? эквивалентная тактовая или гига мипсы ? можно поподробнее. а то кроме частот в 200МГц в презентации я не увидел ничего другого.
Adv
Цитата(des00 @ Oct 24 2008, 18:33) *
скока скока ?? 100 Гига герц ? это что тактовая ? эквивалентная тактовая или гига мипсы ? можно поподробнее. а то кроме частот в 200МГц в презентации я не увидел ничего другого.


Не тактовая. Но - всё равно - пардон господа - это частота обработки (возможно, я что-то не понимаю сам... грешен, простите...) НО:

Multi-threaded soft processor scalable from 10 Mbps to 100 Gbps multi-threaded (4-way/8-way/16-way)
area and power optimized


это страница 12 презентации.

Просто в догонку - в Европе пока не распостроняется. Только в Штатах. Говорят - тут нет специалистов для его поддержки (!!!) но, будут, со временем...
taurus
Слайд посмотрел и так и не понял а за счет чего достигаются такие цифры?
Adv
Цитата(taurus @ Oct 24 2008, 21:11) *
до 100ГГц чего??
Я с трудом представляю как сигналы с такой частотой, а соответсвенно длиной волны в 3 мм, если не ошибся на вскидку, будут проходить по несчастным полупроводниковым структурам ПЛИС.
В слайде увидел самую большую максимальную частоту 400 МГЦ для EP2SXXC3.


Данных, разумеется. Пример обработки 40 Gbps - на странице 19 презентации:

TPU Scalability for 40Gbps Full Duplex Traffic

Цитата(taurus @ Oct 24 2008, 21:11) *
Слайд посмотрел и так и не понял а за счет чего достигаются такие цифры?


По-моему за счёт этого в том числе:

Shared resources
Ternery content addressable memory (TCAM)
Table memories


стр 19 (всё таже...)
des00
Цитата(Adv @ Oct 24 2008, 12:20) *
Multi-threaded soft processor scalable from 10 Mbps to 100 Gbps multi-threaded (4-way/8-way/16-way)
area and power optimized


ну гигабиты и гигагерцы это все таки две большие разницы %)) тот же гигабит это либо 1 бит на 1 ГГц, либо 8 бит на 125МГц. А сделав шину на 32 бита можно вообще 31.25 МГц медленно курить такой поток(кодирование/декодирование например) %)).
Adv
Цитата(des00 @ Oct 25 2008, 05:13) *
ну гигабиты и гигагерцы это все таки две большие разницы %)) тот же гигабит это либо 1 бит на 1 ГГц, либо 8 бит на 125МГц. А сделав шину на 32 бита можно вообще 31.25 МГц медленно курить такой поток(кодирование/декодирование например) %)).


Разумеется! НО именно обработка предполагается БЫСТРАЯ:

Packet Processing Principle

стр 7 презентации. Кто обрабатывал Header в SONET/SDH знает, какой это геморрой, особенно если много каналов и потоки уровня , например, STM4 или STM16. До сих пор это решалось аппаратно (насколько мне известно - только аппаратно, другое не успевало). А насчёт "медленно курить" STM4 ......

В догонку - это ядро предназначено в основном для нового поколения STRATIX IV GT (там 10Gb трансиверы) и встала во весь рост проблема обработки потоков. Например, приложения типа Ethernet over SONET/SDH , только с обработкой и перенаправлением.

Ещё в догонку - так ПРЕДПОЛАГАЕТСЯ. Поимеем ядро (хоть кто-то из известных мне людей) - попробуем. Может, и не так всё гладко...
des00
Цитата(Adv @ Oct 24 2008, 23:56) *
Разумеется! НО именно обработка предполагается БЫСТРАЯ:


Т.е. я правильно понял, для вас критерий быстроты обработки именно тактовая частота? а не производительность(скорость обрабатываемого потока) ?

Всегда считал что критерий производительности это "частота*разрядность данных". Например кодер на 30МГц по 8 бит за такт(240 Мб/с), будет более производительный чем кодер на 100МГц по 2 бита за такт (200 Мб/с). А развести его на 30 МГц будет проще, пусть даже ценой излишнего объема.

А насчет ядра, покурил внимательнее, dataflow процессор как dataflow процессор. Подобных архитектур в последнее время предложено много. Плюсы именно фпгашного решения в возможности конфигурации различных внешних task ов(почти то же самое что сложная CISC команда).

Не понравилось что треды квазипаралельные, с разделением по времени (PicaRISC Multithreading Example).

Хотелось бы ISA посмотреть ну и 8/16/32 битный datapath классика.

Цитата
В догонку - это ядро предназначено в основном для нового поколения STRATIX IV GT (там 10Gb трансиверы) и встала во весь рост проблема обработки потоков.


хотел бы отметить даже в этом случае никто на битовом уровне не работает. Используют десериализатор и работают на уровнях 4/6/7/8/10 бит.
Adv
Цитата(des00 @ Oct 26 2008, 09:38) *
Т.е. я правильно понял, для вас критерий быстроты обработки именно тактовая частота? а не производительность(скорость обрабатываемого потока) ?

Всегда считал что критерий производительности это "частота*разрядность данных". Например кодер на 30МГц по 8 бит за такт(240 Мб/с), будет более производительный чем кодер на 100МГц по 2 бита за такт (200 Мб/с). А развести его на 30 МГц будет проще, пусть даже ценой излишнего объема.

А насчет ядра, покурил внимательнее, dataflow процессор как dataflow процессор. Подобных архитектур в последнее время предложено много. Плюсы именно фпгашного решения в возможности конфигурации различных внешних task ов(почти то же самое что сложная CISC команда).

Не понравилось что треды квазипаралельные, с разделением по времени (PicaRISC Multithreading Example).

Хотелось бы ISA посмотреть ну и 8/16/32 битный datapath классика.
хотел бы отметить даже в этом случае никто на битовом уровне не работает. Используют десериализатор и работают на уровнях 4/6/7/8/10 бит.



Есть "гад" такой - стаффинг (биты стаффинга) .В зависимости от типа синхронизации надо применять и битовую обработку... к сожалению. И, подчёркиваю, это не только для потока STM4, есть ещё STM16/64 и проч.

Des00, вы правы , да и в презентации всё распаралеливается в 4\8\16 и проч. И всё это решалось аппаратно (хотя бы с помощью PMSierra, как пример), тот же стаффинг, НО-
при наличии в матрице трансиверов не ....фильтикультяпно (другого слова как-то не подберу) цеплять ещё чип используя его , ну, процентов на 5 (чип ног на 896, например). ЗА МАТРИЦУ желательно не выходить. Тогда всё действительно красиво. И эта презентация - как раз про эти возможности.
При обработке потока STM4 и выделении контейнеров низкого уровня (например, VC12) даже 64 разрядной шины (всё , что сейчас скажу - относится только к системе на кристалле) не хватает чтобы дать процессору (опять же - в кристалле, NIOS , например) время для полноценной обработки. Причём такие задачи как правило должны решаться при условии 100% достоверности получаемых\передаваемых данных. А поток-то - синхронный..... Да, есть другие ядра (тот же Power PC, например) но это - более экзотика, чем практика, хотя могу и ошибаться.
Это первая проба привлечь к такой обработке процессор и заставить его делать то, что раньше решали только аппаратно, по-моему.
Извиняюсь за многословие
С уважением Adv.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Invision Power Board © 2001-2025 Invision Power Services, Inc.