Форум разработчиков электроники ELECTRONIX.ru

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: что-то новое ?

Форум разработчиков электроники ELECTRONIX.ru > Программируемая логика ПЛИС (FPGA,CPLD, PLD) > Системы на ПЛИС - System on a Programmable Chip (SoPC)

Страницы: 1, 2

Soflover

Apr 17 2012, 16:41

Сегодня был на выставке Новая Электроника. Видел их стенд. Никаких образцов не представлено. Ни на ПЛИС, ни в живую. Сидят два чувака под малосодержательными плакатами и рассказывают про то, какая это офигительная идея распараллеливать процессы на аппаратном уровне. Подробнее интересоваться не стал.

Wic

Apr 18 2012, 05:44

О любых революционных изделиях можно говорить долго. Если они так уже крутые, пусть начинают раздавать самплы, среды для их программирования, а там уже умельцы потестят и отпишутся на форумах, в блогах и т.д. И вот по отзывам от пользователей можно будет реально судить или это действительно что то ценное, или очередная тупиковая ветка эволюции.

Мур

Apr 18 2012, 05:47

И где обещанное?...
http://www.new-electronics.info/programm

Postoroniy_V

Apr 18 2012, 06:14

Цитата(Leka @ Apr 17 2012, 15:40)

.......
микрокоманды и операнды ассоциативно извлекаются по явно указанным в полях номерам, и исполняются.

В итоге "мультиклеточная" архитектура многократно проигрывает обычной, по тактам, объему кода, площади кристалла. Если я неправильно понял "мультиклеточную" архитектуру - объясните мне понятно. (По поводу клока - он есть, см "даташит").

1) по тактам я не понял почему
2) по обьёму кода, да но не многократно, я бы сказал 20-30%
3) площадь кристала, х.з. как сравнить. и я бы сравнивал 4 клеточный с 4-х ядрённым мипсом,
предлагаю разобраться как следует.
-----------------------
target: z=SUM[(ai+bi)*ci-(ai-bi)*di]
тоесть на С так
for(int z=0,i=0;i<10;i++)
z=z+(a[i]+b[i])*c[i] - (a[i]-b[i])*d[i])

triads:
1)sum_ab=a+b
2)sub_ab=a-b
3)mult_abc=1*c
4)mult_abd=2*d
5)sub34=3-4
6)target=target+sub34

Код

(tag_2, <=0) i
(tag_1, <=0) target

(tag0, read [a+tag_2])
(tag1, read [b+tag_2])
(tag2, read [c+tag_2])
(tag3, read [d+tag_2])
-- вероятно эти таг0-3 можно было бы заменить на некую команду (tags0,1,2,3 read [a+tag_2<<2]). х.з.

(tag4, tag0+tag1)
(tag5, tag0-tag1)
(tag6, tag2*tag4)
(tag7, tag3*tag5)

(tag8, tag6-tag7)
(tag_1, tag_1 + tag8)
(tag10, store tag_1 to target adr)
(tag_2, tag_2 +1)-

(tag_2, tag_2 EQU 10)
(tag11,jmpNZ tag_2, adr to tag0)

пояснения + упрощения
1)адреса команд не указаны, есть привязка к tag-у, тоесть это ассоциация как команды так и результата после выполнeния команды(для простоты tag это регистр

).
2)показаны только 1 стадия конвейра exec
3)все стадии конвейра - 1 такт
4)все данные в cache (cache hit rate=1)

в данном и невероятно простом примере видно что ускорение выполнения может быть не более чем в 4 раза и выводы:
1) стадия fetch должна быть сделана следующим образом(чтобы было "4х" ускорение):
- либо широкий порт инструкций в "4 раза шире"
- либо в "4 раза быстрее"
2)если каждая клетка это очень примитивный (одно лишь АЛУ) cpu, то автомат "дирижирующий" этим ансамблем видиться очень не простым.
3) и действительно в случае отказа 1 клетки, катастрофы не случится, пока есть хотя бы 1 работающая.
4) для случая 16 клеток ускорение расти не будет, будет тем же что и для 4-х клеток (для данного примера)
5) из п4 следует что для 16 клеток, возможно(?) выполение в параллель ещё какого то кода(справится ли fetch?)
6) тоесть данный алгоритм _не заточен_ для выполнения на 16 клетках, и следовательно нельзя говорить о "естественном" параллелизме

вообщем этот мультиклет что-то вроде systolic array cpu
http://web.cecs.pdx.edu/~mperkows/temp/May...-Processors.pdf

з.ы. 4х - это конечно же фейк(л) ещё тот, попробуйте временную диаграмму нарисовать, так там и будет видно что закон амдала обойти не получится

Poluektovich

Apr 18 2012, 07:54

Цитата(Мур @ Apr 18 2012, 09:47)

И где обещанное?...
http://www.new-electronics.info/programm

Семинаров они не устраивают. Там есть стенд с представителями и распечатанными даташитами.

Uuftc

Apr 18 2012, 10:30

Цитата(DSIoffe @ Apr 11 2012, 17:20)

А что, москвичи, кому не влом - загляните, пожалуйста, узнайте: есть ли оно живьём, а не на FPGA? И здесь расскажите.

Рассказываю:
Живьем - нет. Говорят, что будут в июне месяце. Новой информации (более той, что есть на сайте) - нет. К сожалению я так и не дождался появления технического специалиста, чтобы попытать его на предмет особенностей архитектуры. На вопрос - где взять документацию, достаточную для написания компилятора - получил ответ, что в открытом доступе пока нет и не ясно, когда будет и будет-ли вообще. Говорят про войну и космос - но радиационно стойких пока нет и, как я понял, работа в этом направлении еще не начата.... Усиленно пытаюсь найти аргументы за - пока не нахожу

З.Ы. Пригласил их на наш форум, думаю, многое станет ясно, когда появится представитель. Или не появится...

З.З.Ы. Меня терзают смутные сомнения (с)

Leka

Apr 18 2012, 14:18

Цитата(Postoroniy_V @ Apr 18 2012, 10:14)

предлагаю разобраться как следует

Цитата

1) по тактам я не понял почему

Цитата

2) по обьёму кода, да но не многократно, я бы сказал 20-30%

Непонятна разрядность микрокоманды, если 64 разряда, то уже в 2 раза больше (как минимум)

Цитата

3) площадь кристала, х.з. как сравнить. и я бы сравнивал 4 клеточный с 4-х ядрённым мипсом

Идеология Multiclet: компилируем код на ЯВУ в очень мелкие инструкции, аппаратно параллелим их, и получаем "превосходство" в MIPS и MIPS/W. Пример: "a=b+c;" компилируем в "rd b; rd c; add; wr a;", параллельно выполняем их на 100МГц, и получаем дутые 400MIPS. Так что сравнивать надо с обычным 1-ядерным процем (или с DSP, в зависимости от архитектурных примочек вроде индексных регистров и проч.) Ассоциативная адресация, буфера, и проч - отнимает площадь, ничего не давая взамен.

Цитата

(tag_2, <=0) i

В "даташите" упоминаются индексные регистры, чтобы их использовать - надо как-то проинициализировать и установить необходимые флаги.

Цитата

(tag0, read [a+tag_2])

если использовать специальные индексные регистры для косвенной адресации, тогда и сравнивать будем с DSP-процессором. А если сравнивать с универсальным( ai=a+i; ai=*ai ), то индексное чтение надо делить на несколько микрокоманд:
(tag00, read a)
(tag01, tag00+tag_2)
(tag02, read [tag01]) (?)

Ввод специальных DSP-примочек в "мультиклеточную" архитектуру уже настораживает - зачем это, если можно просто нарастить число клеток, сохранив чистоту концепции?

Цитата

и действительно в случае отказа 1 клетки, катастрофы не случится, пока есть хотя бы 1 работающая

У каждой клетки своя независимая память команд, в случае отказа весь этот код пропадает --> катастрофа.

Цитата

вообщем этот мультиклет что-то вроде systolic array cpu

Имхо, совсем не похоже, тк systolic... - просто явно описываемый и программируемый длинный конвейер.

Postoroniy_V

Apr 19 2012, 01:32

Цитата(Leka @ Apr 18 2012, 23:18)

Если правильно понял, у мультиклета даже регистровые переменные надо загружать отдельными инструкциями, отсюда заметный проигрыш на коротких цепочках вычислений. А на длинных - пусть паритет, тогда в среднем - проигрыш.

Непонятна разрядность микрокоманды, если 64 разряда, то уже в 2 раза больше (как минимум)

Идеология Multiclet: компилируем код на ЯВУ в очень мелкие инструкции, аппаратно параллелим их, и получаем "превосходство" в MIPS и MIPS/W. Пример: "a=b+c;" компилируем в "rd b; rd c; add; wr a;", параллельно выполняем их на 100МГц, и получаем дутые 400MIPS. Так что сравнивать надо с обычным 1-ядерным процем (или с DSP, в зависимости от архитектурных примочек вроде индексных регистров и проч.) Ассоциативная адресация, буфера, и проч - отнимает площадь, ничего не давая взамен.

В "даташите" упоминаются индексные регистры, чтобы их использовать - надо как-то проинициализировать и установить необходимые флаги.

если использовать специальные индексные регистры для косвенной адресации, тогда и сравнивать будем с DSP-процессором. А если сравнивать с универсальным( ai=a+i; ai=*ai ), то индексное чтение надо делить на несколько микрокоманд:
(tag00, read a)
(tag01, tag00+tag_2)
(tag02, read [tag01]) (?)

Ввод специальных DSP-примочек в "мультиклеточную" архитектуру уже настораживает - зачем это, если можно просто нарастить число клеток, сохранив чистоту концепции?

У каждой клетки своя независимая память команд, в случае отказа весь этот код пропадает --> катастрофа.

Имхо, совсем не похоже, тк systolic... - просто явно описываемый и программируемый длинный конвейер.

1)время выполнения будет тем же на коротких инструкциях(если конечно условия исполнения "клеточного" те что описал выше). так что это просто мысли о вариациях, а не выводы после ознакомления с "документацией"
2)у z80 есть индексная адресация, вывод - он DSP!

и можно с з80 сравнивать.
3)"У каждой клетки своя независимая память команд" это как это? ведь там речь про "естественный" параллелизм, тоесть я понял это так - память инструкций общая и каждая клетка выгребает оттуда инструкцию и выполняет её. если одна клетка вышла из строя, то нет никакой проблемы, нужно перезапустить ту операцию на которой она сдохла. тут про накладные расходы и тот модуль, который это контроллирует непонятки. тем более что в "документации" говорится о децентрализованном управлении
4)в systolic есть связи сосед-сосед, в клеточном - клетки соединены неявно через коммутационнцю среду каждая-скаждой.

блин,короче, граждане изобретатели клеточного процессора! будьте так любезны - выложите на обозрение вменяемую документацию!

з.ы. надо попробовать "клеточный" заиплементировать на досуге

Uuftc

Apr 19 2012, 04:38

А меня вот еще интересует вопрос - а как может обстоять дело с условными переходами в такой архитектуре ?
Имхо - это может быть весьма слабым местом.

MrYuran

Apr 19 2012, 05:05

Цитата(Uuftc @ Apr 19 2012, 08:38)

А в чем проблема? Начать обрабатывать параллельно обе ветви, а потом ненужную отбросить.

Postoroniy_V

Apr 19 2012, 05:09

Цитата(Uuftc @ Apr 19 2012, 13:38)

я бы это сделал так

Код

(tag_12, tag_2 EQU 10) -> ( tag12 = tag_2 XOR 10)
(tag11,jmpNZ tag_12, adr to tag0) ->(pc = (NZ_tag_12)? pc+1:adr_to_tag0

и этот самый PC скорей всего вне клетки.
тут вопрос как реализовать стадии instruction fetch(IF)+ instruction decode(ID). и скорей всего есть некий буфер с декодированными командами(от ID).
а load store unit(LSU) вообще вынести за рамки "клетки". ну и слабым местом будет эти самые стадии IF+ID.
как это всё сделано в оригинале, можно только гадать.
например так

Код

(tag13, tag_pc_next )  -> ( tag13= tag_pc_next)
(tag14, adr_to_tag0)  -> ( tag14= adr_to_tag0_loop)
.....
adr_to_tag0_loop:
....
(tag12, tag_2 EQU 10)  -> ( tag12 = tag_2 XOR 10)
(tag15, tag_12==0?tag13:tag14)
(tag16, pc = tag15)
tag_pc_next:
...

Leka

Apr 19 2012, 06:12

Цитата(Postoroniy_V @ Apr 19 2012, 05:32)

2)у z80 есть индексная адресация, вывод - он DSP!

и можно с з80 сравнивать.

Применительно к DSP имеются в виду специальные блоки генерации адреса, они и у "мультиклета" заявлены.

Цитата

3)"У каждой клетки своя независимая память команд" это как это? ведь там речь про "естественный" параллелизм, тоесть я понял это так - память инструкций общая и каждая клетка выгребает оттуда инструкцию и выполняет её.

Где-то в описаниях даже подчеркнуто, память инструкции каждой клетки - строго индивидуальная.

Цитата

блин,короче, граждане изобретатели клеточного процессора! будьте так любезны - выложите на обозрение вменяемую документацию!

Им некогда - более важными делами заняты, поиском много интересного о генеральном директоре мультиклета находится.

MrYuran

Apr 19 2012, 06:22

Цитата(Leka @ Apr 19 2012, 10:12)

поиском много интересного о генеральном директоре мультиклета находится.

Такая уж у генеральных судьба...

Leka

Apr 19 2012, 06:28

Роснано, кстати, мультиклету фигу показало.

DSIoffe

Apr 19 2012, 07:09

Цитата("Uuftc")

Рассказываю:
Живьем - нет.

Спасибо. Занятно получается.

Postoroniy_V

Apr 19 2012, 07:19

Цитата(Leka @ Apr 19 2012, 15:28)

Роснано, кстати, мультиклету фигу показало.

http://it-eburg.com/text/article/uralskie_...ovykh_processo/

Цитата

И чем все закончилось?

— Проекту немного не хватило до успешного завершения. Было вложено несколько миллионов долларов и в принципе уже можно было продавать техническое описание продукта, но датчане хотели обязательно выпускать свой кристалл, а это уже совершенно другие деньги.

однако... 2007 год. едритмадрит другие несколько миллионов на то чтобы выпустить на fpga

Uuftc

Apr 19 2012, 11:54

Цитата(MrYuran @ Apr 19 2012, 09:05)

А в чем проблема? Начать обрабатывать параллельно обе ветви, а потом ненужную отбросить.

Поясню свои сомнения:
Сперва про плюсы - если в обычной архитектуре возможно применить две стратегии - пихать в конвеер прямую ветку исполнения или ветку перехода, то в мультиклеточной появляется третья возможная - начать исполнение обеих веток.
Но, для принятия решения о переходе надо уметь анализировать не один набор флагов, а флаги произвольной клетки, что сложнее. И еще, при большом кол-ве клеток, теоретически ветвление может быть не одно - надо помнить порядок. Получается некий монстрик

_Pasha

Apr 19 2012, 12:09

Цитата(Uuftc @ Apr 19 2012, 14:54)

то в мультиклеточной появляется третья возможная - начать исполнение обеих веток.

Тут такое... псевдомашина оказалась уровнем выше, чем надо. Будет ниже - таких вопросов не возникнет, зато будут претензии ко времени компиляции/линковки вследствие комбинаторности оного процесса. Что выбираем-с?

tegumay

Apr 19 2012, 19:21

по поводу архитектуры я луше просто промолчу.(а что в совковое время таких своих_мульти_клетов было наделано для примений)
систему надо рассматривать в комплексе, голый чип никого не волнует.
я сомневаюсь что кто-то в здравом уме захочет расхлебывать чужие грабли.
а начинать продавать, то чего еще нет, это по нашему.

ЗЫ на данном форуме сидят люди(я полагаю), которых интересует начинка, а не обертка.
единственное, что интересно, так это потребление сего чуда(если оно реально столько жрет)
а насчет асинхронных вычислений - волшебное слово - спецфакторы

ЗЫ2 кол-во мкВт\Мипс у них отнюдь не рекордное.

Postoroniy_V

Apr 20 2012, 01:17

Цитата(_Pasha @ Apr 19 2012, 21:09)

clang+llvm уже готовый фронтенд(поддержка автоматом c,c++,object-c object-c++). работаeт это быстрее чем гцц.(хотя код медленее получается)
разработчикам клеточного нужно только свой бекэнд написать, а это как говориться ещё 5 лет разработки и более другие нескольо миллионнов долларов
с выхлопом в виде пары пдф и док файлов.

ArtemDement

Apr 22 2012, 11:19

Цитата(tegumay @ Apr 19 2012, 23:21)

кол-во мкВт\Мипс у них отнюдь не рекордное.

Не просветите меня, у кого рекордное ?

Postoroniy_V

Jul 1 2012, 04:56

Первая партия мультиклеточных процессоров произведена в России
http://vz.ru/news/2012/6/29/586102.html

Soflover

Jul 1 2012, 10:34

Цитата(Postoroniy_V @ Jul 1 2012, 08:56)

Первая партия мультиклеточных процессоров произведена в России
http://vz.ru/news/2012/6/29/586102.html

Что-то непонятно. Как это работает?
http://community.sk.ru/press/b/weblog/arch...v-prodazhu.aspx

Где память?
http://community.sk.ru/cfs-file.ashx/__key...044B043904_.png

Это такой хитрый микроконтроллер получился?
И вот это планируется для космических применений??

Как-то сомнительно это все...

MrYuran

Jul 2 2012, 04:47

Цитата(Soflover @ Jul 1 2012, 14:34)

Как-то сомнительно это все...

Под заметкой тоже куча авторитетных каментов а-ля "распил, Чубайс, миллиарды бюджета".
А на самом деле люди на собственные средства разработали новую архитектуру (принципиально новую), и только на заключительном этапе воспользовались дополнительными возможностями, которые дает Сколково.

Soflover

Jul 2 2012, 08:37

Цитата(MrYuran @ Jul 2 2012, 08:47)

Спасибо, что считаете мое мнение авторитетным.

Только я не утверждаю, что это распил, и про Рыжего тоже ничего не сказал.

Я просто привел ссылку и сказал, что как-то сомнительно вот такое применять в космической технике. Если у Вас другое мнение и, главное, есть хорошие аргументы, то изложите их здесь пожалуйста.

ArtemDement

Jul 2 2012, 15:50

Цитата(Soflover @ Jul 1 2012, 14:34)

Это такой хитрый микроконтроллер получился?
И вот это планируется для космических применений??

Как-то сомнительно это все...

Вы не единственный сомнивающийся.

MrYuran

Jul 3 2012, 04:54

Возможно, что все доводы строятся исходя из традиционных представлений.
А в итоге может получиться, "на инжекторной машине зимой не заведешься, потому что подсоса нет".

spectr

Jul 3 2012, 05:46

Загрузка с внешней флэшки, малое количество памяти, изначально макетирование велось на плисках...
Не отпускает ощущение что это перемаркированный HardCopy или его аналог другого производителя.
Хотя в этом, по большому счету, нет ничего предосудительного.

Wic

Jul 3 2012, 06:58

Выпустили партию FPGA-шек под своим названием. Теперь осталось показать SDK и реальные возможности их клеток, естественно, относительно существующих процессоров. Вот майкрософт то планшет тоже выпустила, даже вин8 на него зашила, а пользоваться никому не дает. Подозрительно всё это. Так, что ждем реальных результатов.

BarsMonster

Jul 3 2012, 08:16

Цитата(Wic @ Jul 3 2012, 09:58)

Реальные возможности - 400 MIPS, серийные российские процессоры побыстрее будут.
Основная проблема с мультиклетом - невозможность легко масштабировать архитектуру.

Soflover

Jul 3 2012, 10:35

Цитата(BarsMonster @ Jul 3 2012, 11:16)

Реальные возможности - 400 MIPS, серийные российские процессоры побыстрее будут.

и, наверное, это пиковая производительность. Реально, наверное, еще меньше.

P.S.: спасибо за хорошую статью на Хабре.

Wic

Jul 4 2012, 03:42

Цитата(BarsMonster @ Jul 3 2012, 15:16)

Реальные возможности - 400 MIPS.

Вы уже под них программировали или это заявление разработчиков?

BarsMonster

Jul 4 2012, 10:30

Цитата(Wic @ Jul 4 2012, 06:42)

Вы уже под них программировали или это заявление разработчиков?

Это мое мнение на основе анализа всей доступной документации.
Это пиковая производительность, при 100% загрузке всех клеток (что на не-DSP коде малореализуемо).

sqrt

Jul 4 2012, 15:08

Судя по спецификациям на младшую модель MCp 0402100104, похоже на правду. Другое дело, что не всем эти мипсы сдались, а вот потребление весьма актуально. В общем, надо дождаться полной документации, си-компилятора, допиленных чипов и самому пощупать.

Postoroniy_V

Jul 6 2012, 08:41

на хабре есть ещё одна статья
http://habrahabr.ru/post/146865/
особо интересны камменты, а не сама статья конечно же

MrYuran

Jul 6 2012, 11:38

Цитата(BarsMonster @ Jul 4 2012, 14:30)

a = (b+c)*(d+e);

1кл: b+с
2кл: d+e
3,4кл. могут выполнять следующие инструкции, не связанные потоком данных с текущим выражением.
По результатам исполнения любая из свободных клеток выполняет умножение промежуточных результатов, остальные выполняют следующие инструкции.

Цитата

на хабре есть ещё одна статья

Спасибо.
Теперь каждый желающий может поиграться с ассемблером в симуляторе и разложить по тактам

sqrt

Jul 7 2012, 06:08

Цитата(MrYuran @ Jul 6 2012, 15:38)

Теперь каждый желающий может поиграться с ассемблером в симуляторе и разложить по тактам

Не могу найти на их сайте симулятор (потактовую модель процессора). Где он лежит?

P.S. Н-да, версия ассемблера 0.1-beta обнадеживает, спасибо что не альфа )

Torpeda

Jul 10 2012, 09:18

Цитата(MrYuran @ Jul 6 2012, 14:38)

Теперь каждый желающий может поиграться с ассемблером в симуляторе и разложить по тактам

Заинтересовало сие чудо и меня...
Кроме прикольной архитектуры обратил я внимание на такие вещи:

1) "С" компилятора чё-то негде скачать, а есть только асемблер. ОС тоже нету.
Похоже и не скоро будут, т.к. архитектура не клеется со всеми наработками для традиционных процесоров (тут GCC переделкой не обойтись)....
Поправте если не прав...

2) Розработчик утверждает что:
"Откомпилированная программа может быть выполнена на любом количестве клеток. При этом возможно динамическое изменение их количества, что обеспечивает реализацию методологии постепенной деградации процессора при отказах его клеток."

Возникае вопрос:
реализована-ли в имеющихся ядрах система проверки работоспособности клетки (self checking), её автоматическое "блокирование" и таким образом переход выполнения откомпилированной программы на меньшем количестве клеток?
Или надо вручную перепрошивать ПЗУ, перелинковать откомпиленую программу и.т.п.

Чем это лутше традиционных процесоров?

3) Розработчик утверждает что:
" увеличение производительности и сокращение энергопотребления в несколько раз (см. характеристики), так как позволяет реализовать эффективный вычислительный процесс;"

Возникае вопрос:
На сколько % уменьшают потребление "архитектурные клеточные навороты" и на сколько - простой gated clock?
Мне кажется это соотношение где-то 5 к 95 соответственно. Есть ли смысл на энергопотреблении заострять внимание?

Где хотя-бы результаты Power симуляций с VCD с gated clock и без, а также симуляции аналогичной по MIPS традиционной архитектуры и клеточной без gated clock в обоих и на одной технологии?
А-то приведённые данные как-то сомнительны (сравнили пароход с паровозом: MCc0401100000 vs TMS320 ... ибо неизвестно что внутри TMS и какой в нём был критерий оптимизации)

4) Также интересно сравнить традиционный процессор и клеточный при тех-же MIPS по величине тактовой частоты и количеству тригеров....
Не могу утверждать, но кажеться мне у клеточного тригеров (и площадь) куда больше....
Не проще ли достичь MIPS простым ускорением, а не архитектурным усложнением?
----------
Написал не злорадства ради, а технической объективности для....
Без предъявления процессора который на рынке лутше других - доказать свою крутость сложно....

BarsMonster

Jul 12 2012, 22:33

Цитата(Torpeda @ Jul 10 2012, 12:18)

Заинтересовало сие чудо и меня...
Кроме прикольной архитектуры обратил я внимание на такие вещи:

1) С компилятор пишут, на хабре есть статья человека который пишет. До релиза еще не близко.

2) По информации разработчиков, в текущей процессоре никакой отказоустойчивости нет. Может быть гепотетически реализовано в будущих процессорах.

4) На 180нм тут всего 100Мгц. Классические процы на 180нм действительно намного намного быстрее.

zzzzzzzz

Jul 13 2012, 06:24

Цитата(BarsMonster @ Jul 13 2012, 01:33)

... 4) На 180нм тут всего 100Мгц. Классические процы на 180нм действительно намного намного быстрее.

Да, действительно так. Большие модули (если всё сделано оптимально) можно раскрутить до 1 ГГц, маленькие - до (3-4) ГГц. А если сделать схему на CML - то и до (7-8) ГГц.
А 100 МГц лишает смысла задачу ускорения расчётов увеличением параллелизма. ПМСМ, слишком много восторгов на ровном месте.
Чип можно считать удачным если он востребован и активно продается. Желаю команде удачи, конечно. Но, это больше похоже на детскую болезнь "слепи свой проц". О сколько их лежит на обочине!

Canis Dirus

Dec 13 2012, 09:33

А тем временем разработчики разродились отладочной платой. Первым 100 покупателям обещают скидки (цена в пять килорублей, вместо шести с половиной).

BarsMonster

Dec 27 2012, 09:39

Отладочная плата у меня есть, буду ковырять на днях.

MrYuran

Dec 27 2012, 10:21

Цитата(BarsMonster @ Dec 27 2012, 13:39)

Отладочная плата у меня есть, буду ковырять на днях.

Ждем восторженных отзывов

Наподобие такого

Цитата

Надеюсь, этот объёмный (уж простите, короче не вышло) текст поможет мне разделить с кем-нибудь то удовольствие, которое я получаю работая с этим процессором.

BarsMonster

Dec 27 2012, 10:34

Цитата(MrYuran @ Dec 27 2012, 13:21)

Ждем восторженных отзывов

Наподобие такого

Мой первый отзыв тут уже упоминали, и он не был восторженным, но сейчас будет уже с цифрами.

alman

Dec 29 2012, 08:44

Бегло пробежался по обсуждению и не увидел ссылки на документ, описывающий систему команд.

Вот этот документ: http://multiclet.com/docs/PO/Manual_Soft.pdf

Для распараллеливания используется абстракция "Параграф", границы которого устанавливаются специальным битом в команде.

Банальный пример, на котором можно получить выигрыш, например формула из школьного учебника геометрии:

X и Y можно считать параллельно. Разработчики утверждают, что их процессор является процессором общего назначения, но у меня сомнения по этому поводу.

MrYuran

Dec 29 2012, 09:15

Цитата(alman @ Dec 29 2012, 12:44)

Разработчики утверждают, что их процессор является процессором общего назначения, но у меня сомнения по этому поводу.

Общего назначения для специальных применений

BarsMonster

Jan 8 2013, 09:59

http://habrahabr.ru/post/165043/ - Мультиклет: практическое использование и производительность

BarsMonster

Jan 26 2013, 22:04

Цитата(BarsMonster @ Jan 8 2013, 11:59)

http://habrahabr.ru/post/165043/ - Мультиклет: практическое использование и производительность

Фотография кристалла Мультиклета

ArtemDement

Jan 27 2013, 13:16

BarsMonster, это Ваш проект ?

Цитата

ПЕРВЫЕ ДЕТАЛИ О ПРОЕКТЕ СОЗДАНИЯ МИКРОКОНТРОЛЛЕРОВ
Завершено предварительное исследование рынка и конкурирующих продуктов – теперь мы можем больше рассказать о наших будущих микроконтроллерах:

АРХИТЕКТУРА
Наша цель – разработать и прогнать на реальных задачах несколько десятков вариантов ядер микроконтроллеров, чтобы выбрать из них 3 наиболее удачных ядра для следующих линий:

Сверхкомпактное 32-битное ядро с большей плотностью кода по сравнению с Thumb2 и минимальной стоимостью.
«Классическое» ядро с производительностью >1.5 DMIPS/Mhz и повышенной плотностью кода.
Высокопроизводительное конвейеризованное суперскалярное ядро, также предназначенное для микроконтроллеров и систем на кристалле.
Все ядра совместимы на уровне исходного кода.

ПЕРИФЕРИЯ
Одна из целей для контроллеров среднего и высокого уровня – «откусить» часть задач, которые в настоящее время решаются младшими FPGA. Это может быть достигнуто или реконфигурируемой FPGA-подобной периферийной прослойкой, конфигурируемой на подмножестве Verilog, или уникальными периферийными модулями конфигурируемые классическим образом – через регистры. Сейчас мы рассматриваем оба подхода.

СРЕДСТВА РАЗРАБОТКИ
Все ядра будут поддерживаться бесплатной open-source средой разработки на основе LLVM и Eclipse, без каких либо ограничений на размер кода.

BarsMonster

Jan 27 2013, 13:31

Цитата(ArtemDement @ Jan 27 2013, 16:16)

BarsMonster, это Ваш проект ?

Да, но это пока нельзя назвать проектом в полном смысле этого слова.
В ближайшие 1.5 года обсуждать будет нечего.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.