реклама на сайте
подробности

 
 
> Плавающая ядерность
Anticitizen1
сообщение Mar 24 2010, 05:49
Сообщение #1


Участник
*

Группа: Участник
Сообщений: 21
Регистрация: 24-03-10
Пользователь №: 56 166



Начал проект по разработке схемы с плавающей ядерностью то есть ядра - из стандартных блоков вычслений распадаются на ядра с более мелкими разрядами и наоборот.Это своего рода аналог VLIW процессора но с архитектурой плавающей ядерности. Ядра процессора управляемые специальными дескрипторами в специальных сегментах кода будут распадаться на множество мелких ядер (меньшая разрядность и меньшее число блоков процессора) и собираться в большие ядра с большой разрядностью и полным набором блоков работы с памятью и вычислениями. Данный процессор сможет входить в режим графических вычислений без использования видеокарт и прочего графического оборудования.Предполагается исследование возможности ускоренной обработке зависимых частей программ путем слияния отдельных блоков ядер- формирования общих переносов к примеру .

Данный проект нацелен на проблему простоя вентилей у многоядерных процессоров и процессоров с VLIW архитетурой.

Мы предполагаем использование Ultra Sparc T2 как базовый - заложенная многопоточность позволит несколько у простить задачу.Но есть проблема "резки" управляющих сигналов и меж разрядых переносов в вычислениях.В Ultra Sparc резать придется FPU.Мы бы хотели помножить блоки и потом вставить между ними управляющие ядерностью сигналы.С памятью таких проблем меньше так она в целом более симетричная.

АЛУ режется вообще без проблем но АЛУ считается устаревшим.Хотелось бы узнать мнение.Помимо резки проблемы будут и с симуляцией так как слияния и разделения надо учесть во всех возможных комбинациях.Поэтому и стремлюсь не нарушить симметрию элементов.


Пример вычислений где такая ядерность нужна:
происходит взрыв и программа моделирует поведениен множества незавиимых/зависимых процессов.Ядра разбиваются на множество низкоразрядных.В следующий момент взрыв передается на плиту и потребуется вычисление большого среднего значения большого числа частиц воздействия на объект- ядра собираются и разрядность вырастает.Возможные иные комбинации в случае зависмых множественных процессов.

В дальнейшем хотим пустить по 65 нм процессу.Сейчас моделирование типа Cadence Virtuoso позволяет до 45 нм вообще с RTL сразу под сканер идти вроде как.

Сообщение отредактировал Anticitizen1 - Mar 24 2010, 06:42
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
zzzzzzzz
сообщение Mar 24 2010, 13:15
Сообщение #2


Профессионал
*****

Группа: Свой
Сообщений: 1 724
Регистрация: 1-05-05
Из: Нью Крыжопыль
Пользователь №: 4 641



Это что, у Вас хобби такое, реконфигурируемые многоядерники сочинять?
Если это ОКР, то д.б. конкретное ТЗ.
Если Вы только сочиняете ТЗ, то успели ли задать себе вопросы типа "нахрена все это нужно?" и "кто за это готов заплатить?"
Если не успели, то поспешите, - ответы нынче суровые бывают... smile.gif

И вообще, в чем, собственно, вопрос?

Сорри, напомнило классическое "мы тут подумали немного и собрались Интелов с Паккардами порвать на куски..." smile.gif
Go to the top of the page
 
+Quote Post
Anticitizen1
сообщение Mar 25 2010, 06:33
Сообщение #3


Участник
*

Группа: Участник
Сообщений: 21
Регистрация: 24-03-10
Пользователь №: 56 166



Цитата(zzzzzzzz @ Mar 24 2010, 19:15) *
Это что, у Вас хобби такое, реконфигурируемые многоядерники сочинять?
Если это ОКР, то д.б. конкретное ТЗ.
Если Вы только сочиняете ТЗ, то успели ли задать себе вопросы типа "нахрена все это нужно?" и "кто за это готов заплатить?"
Если не успели, то поспешите, - ответы нынче суровые бывают... smile.gif

И вообще, в чем, собственно, вопрос?

Сорри, напомнило классическое "мы тут подумали немного и собрались Интелов с Паккардами порвать на куски..." smile.gif


Вы под реконфигурацией что понимаете переключение как у FPGA programmable interconnect ? Если так то не верно управление сигналом вызывает деление на ядра как например сигнал переключения с логич операций на арифметические.Да это задание которое взял в рамках одного проекта.Но пока не знаем JAVA процессор может лучше но он как то сырым кажется.ULTRA SPARC лучше отлажен хотя огромное число разных блоков и сложный слишком процессор.Да я не только сочиняю довольно много подбирал архитектур для этого.Я не интелы рвать собираюсь а архитектуру апробировать для портативок.
Идея зародилась с техники программирования.
Ну представте себе комп игру - где много разных событий приходится обрабатывать - логические переходы, подсчет большого числа парралельных явлений событий.Чем больше процесссов тем больше потоков обработки надо но при меньшей разрядности. Кодирование большого числа событий происходящих в перспективе можно осуществить меншей разрядностью.

Цитата(dvladim @ Mar 25 2010, 02:06) *
И не лишне будет подумать о том, как компилить подо все вот это?
Второе: не проще ли будет такое сделать в духе Intel Larrabee - на маленьких, но гордых процессорах? Кстати, все к этому и идет.

PS. На словах, "происходит взрыв", ушки сделали стойку. smile.gif


Да взрыв это просто наглядный пример для того что бы показать необходимость увеличения числа потоков.Ну не взрыв а например другой многопоточный процесс с взаимозавиимыми и нет явлениями - да сколько угодно.Я вообще рань на ассемблере писал еще задавался такими вопросами.Насволько можно оптимально вентили использовать.

Цитата(BarsMonster @ Mar 25 2010, 05:47) *
Эх, мечты, мечты...

Если оставить в стороне вопрос производительности, для того чтобы изделие было конкурентно-способным, нужно
1) Поддержка софта - как минимум GCC+работоспособный Linux+основной софт. Для разваливающихся процессоров вы GCC допиливать будете годами.
2) Тираж. Нет, даже ТИРАЖ. Чем ниже тираж - тем выше стоимость 1 чипа. Вы сможете продавать 10млн чипов в год при цене 300$ штука? Кто вам сделает это на 65нм по нормальной цене (при которой вы сможете хоть как-то конкурировать с банальными i7)?



Larabee делать не нужно, уже есть серийные супер-дешевые GPU для таких целей. 3 терафлопа за 400$ - это вам не шубу в трусы заправлять :-)

1)Про софт я понимаю.Но вы перепрыгнули через стадии до софта еще надо довести.Я думал посоветуют как резать чтобы на этапах симуляции не затрять.Софт не должен в небеса улететь если не сильно с архитектурой изголяться.Я повторяю в рамках одного элементарного разбиения-адресация , основные наборы инструкций для всех видов операций теже , регистры общего пользования и специализированные остантся теми же дополнительные адреса добявятся и инструкции( сигналы) разбиений- как же это по вашему должно поменять софт - сильно или нет?Здесь будут проблемы с оборудованием серьезные
2) банальный i7?Да прямо уж банальный)).Помимо интел есть много других архитетур.Я хочу архитектуру опробовать а не с интел бороться.Помимо интел есть и куча других архитектур.Мы предполагаем для портативных устройств делать.


3) Проблемы будут с такой вещью как инструкции условного перехода- если прыжки делать в одно и тоже "устройство" а разрядность не рассчитать.

4)Другая проблема. Излишня вентильная загруженность - 10-20 %.американцы разгоняли ядро бьщееся на 2 или 3(проект 2003-2004 годов) и получили рост в 2 и 3 раза то мне кажется вещь себя оправдывает.Более того могу предположить что рост производительности должен быть пропорционален числу разбиений.


Не... "банальность i7" здоровао сказано.))))

Сообщение отредактировал Anticitizen1 - Mar 25 2010, 06:58
Go to the top of the page
 
+Quote Post
BarsMonster
сообщение Mar 25 2010, 07:16
Сообщение #4


Местный
***

Группа: Свой
Сообщений: 479
Регистрация: 8-03-10
Из: Россия, Москва
Пользователь №: 55 849



Цитата(Anticitizen1 @ Mar 25 2010, 08:33) *
Не... "банальность i7" здоровао сказано.))))


Банальность i7 в том, что его себестоимость производства порядка 50$(а то и меньше), тиражи семизначные, а производительность на SIMD инструкциях - до 160 млрд вещественных операций в секунду. Собственно, это ваше разделение там в некотором роде и реализовано - в одном SSE блоке можно делать или 2 64-х битных операции, или 4 32-х битных, и т.д.

Теперь вы говорите про портативные устройства - причем тут тогда симуляция взрывов?
В большинстве портативных устройств стоят процессоры даже без FPU - это же не спроста.

ИМХО производителям портативных устройств продать что-то не-ARM совместимое невозможно, пусть оно и будет в 2 раза быстрее и 2 раза дешевле. Стоимость внедрения отличается на порядки. А с АРМом - склепали платку, накатили стандартный софт - и можно китайцам отдавать на штамповку.


--------------------
Потроха микросхем: zeptobars.ru
Go to the top of the page
 
+Quote Post
yes
сообщение Mar 25 2010, 10:50
Сообщение #5


Гуру
******

Группа: Свой
Сообщений: 2 198
Регистрация: 23-12-04
Пользователь №: 1 640



а чем эта идея лучше/отличается от SIMD (векторной обработки) - всяческих MMX/SSE AltiVec NEON и т.д. ?

кажется, что "разбивания" ядер возможно только на уровне датапасов - то есть в инструкции указывается как трактовать ну например 256 разрядное слово - 32 байта ... 4 дабла

ну а исполнения потоков (идея SPARC T1/T2) чтоб ядра не простаивали - в теории выглядит хорошо, а на практике не встречал (последняя станция с 1.5ГГц Sparc IIIi, которую "трогал" вживую, тормозила безбожно)
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- Anticitizen1   Плавающая ядерность   Mar 24 2010, 05:49
||- - Anticitizen1   Цитата(yes @ Mar 25 2010, 17:50) а чем эт...   Mar 30 2010, 05:55
||- - yes   Цитата(Anticitizen1 @ Mar 30 2010, 09:55)...   Mar 30 2010, 08:47
||- - Anticitizen1   Цитата(yes @ Mar 30 2010, 15:47) не знаю,...   Mar 31 2010, 04:22
|- - Anticitizen1   Цитата(BarsMonster @ Mar 25 2010, 13:16) ...   Mar 25 2010, 11:57
- - dvladim   И не лишне будет подумать о том, как компилить под...   Mar 24 2010, 20:06
- - BarsMonster   Эх, мечты, мечты... Если оставить в стороне вопро...   Mar 24 2010, 23:47
- - BarsMonster   ЦитатаДело в опимизации - при низком потреблении н...   Mar 26 2010, 00:13
|- - Anticitizen1   Цитата(BarsMonster @ Mar 26 2010, 06:13) ...   Mar 26 2010, 04:32
- - BarsMonster   Вобщем, не стану разводить тут троллоло :-) Если б...   Mar 26 2010, 05:39
|- - Anticitizen1   Цитата(BarsMonster @ Mar 26 2010, 12:39) ...   Mar 29 2010, 06:38
|- - Dmel   Цитата(Anticitizen1 @ Mar 29 2010, 10:38)...   Mar 29 2010, 07:23
|- - Anticitizen1   Цитата(Dmel @ Mar 29 2010, 14:23) А сколь...   Mar 29 2010, 08:47
- - zzzzzzzz   Блин, какой же хренью люди мучают свои слабые мозг...   Mar 26 2010, 08:50
|- - Anticitizen1   Цитата(zzzzzzzz @ Mar 26 2010, 14:50) Бли...   Mar 26 2010, 10:43
|- - zzzzzzzz   Цитата(Anticitizen1 @ Mar 26 2010, 13:43)...   Mar 27 2010, 09:17
- - dvladim   Цитата(Anticitizen1 @ Mar 26 2010, 13:43)...   Mar 26 2010, 19:03
|- - Anticitizen1   Цитата(dvladim @ Mar 27 2010, 01:03) Судя...   Mar 28 2010, 04:00
- - Behemoth13   граждане форумчане я извиняюсь за флуд, но мне каж...   Mar 27 2010, 22:18
- - zzzzzzzz   Удачи Вам, господин Петрик! Хоть это и бессм...   Mar 28 2010, 09:21
|- - Anticitizen1   Цитата(zzzzzzzz @ Mar 28 2010, 16:21) Уда...   Mar 29 2010, 04:10
- - Anticitizen1   И все что ли?Приехал.................   Mar 30 2010, 03:20
- - Anticitizen1   Сразу памятку решил сделать. Не тратьте лучше вре...   Mar 31 2010, 06:10
- - baumanets   Anticitizen1 твою идеологию понял. В таких навёрну...   Mar 31 2010, 09:13
|- - Anticitizen1   Цитата(baumanets @ Mar 31 2010, 16:13) An...   Mar 31 2010, 10:09
- - Anticitizen1   Вот есть форум где пара хороших тредов http://ru...   Mar 31 2010, 11:22


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 20th June 2025 - 00:57
Рейтинг@Mail.ru


Страница сгенерированна за 0.01446 секунд с 7
ELECTRONIX ©2004-2016