реклама на сайте
подробности

 
 
2 страниц V   1 2 >  
Reply to this topicStart new topic
> Можно ли прикрутить к Кортесу-М АМДшную графическую карту?
iiv
сообщение Oct 21 2016, 18:16
Сообщение #1


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Добрый день,

наткнулся на AMD Adelaar и захотелось мне его прикрутить к моему агрегату - места катастрофически мало, изменяя корпус в 37мм могу влезть. Вопрос в том, можно ли как-то кормить последовательностями программных ядер и данных этот Аделаар из чего-то микроконтроллерного, например, Cortex-M7. Программировать на OpenCL умею, более того, ключевая часть решалки, которая работает у меня в аппарате уже давно мной портированна на OpenCL.

На Аделааре пик 768ГФлопс на одинарной точности, у меня обычно решалки дают 40% от пика, то есть думаю, что 300ГФлопс на одинарной, и 60ГФлопс на двойной я тут получу (двойная как две одинарные, но сдвинутые на мантиссу, родная двойная на аделааре совсем медленная).

То есть как я понимаю, мне надо имплементировать PCIe, чтобы общаться с этой картой.

Вдруг кто знает легко ли, и если не сильно заморочно, с чего начать?

PS: понятно, что идеально для меня было бы купить вообще процессор с графическим ускорителем, но в габариты 40мм, а лучше меньше, я ну ни как не влезу...

Спасибо!

ИИВ
Go to the top of the page
 
+Quote Post
SII
сообщение Oct 22 2016, 13:53
Сообщение #2


Знающий
****

Группа: Свой
Сообщений: 549
Регистрация: 13-07-10
Из: Солнечногорск-7
Пользователь №: 58 414



PCIe программно реализовать не удастся, она должна быть реализована аппаратно. Сомневаюсь, что в природе имеются Кортексы-М со встроенным мостом на PCIe. Таковые встречаются в некоторых Кортексах-А, например, во фрискейловских i.MX6, но там и графический ускоритель встроенный имеется.
Go to the top of the page
 
+Quote Post
AVI-crak
сообщение Oct 22 2016, 15:26
Сообщение #3


Частый гость
**

Группа: Участник
Сообщений: 182
Регистрация: 16-10-15
Пользователь №: 88 894



Цитата(iiv @ Oct 22 2016, 01:16) *
корпус в 37мм

Туда не влезет блок питания и радиатор, чтобы отвести 37 ват тепла.


SII - Это новая железяка, рекламируют как могут.
Go to the top of the page
 
+Quote Post
iiv
сообщение Oct 22 2016, 15:59
Сообщение #4


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



2SII спасибо, да, предвидел, что PCIe может быть такой проблемой, большой A9 кортекс не хотелось бы ставить, конечно можно плиску поставить но гемора будет неподецки.

Цитата(AVI-crak @ Oct 22 2016, 21:26) *
Туда не влезет блок питания и радиатор, чтобы отвести 37 ват тепла.

у меня штатно в железке есть водяное охлаждение.

Цитата(AVI-crak @ Oct 22 2016, 21:26) *
SII - Это новая железяка, рекламируют как могут.

если февраль 2014 года - это новая, тогда ой... Кроме того, я работаю в фирме, которая является официальным консультантом нвидии, наверное вы понимаете, что рекламировать своих злейших конкурентов очень не хорошо sm.gif
Go to the top of the page
 
+Quote Post
AVI-crak
сообщение Oct 22 2016, 17:02
Сообщение #5


Частый гость
**

Группа: Участник
Сообщений: 182
Регистрация: 16-10-15
Пользователь №: 88 894



Вы хотите установить большой жидкостный ракетный ускоритель на свой велосипед... Оно может-быть и будет двигаться, но исключительно по прямой.
Cortex-M7 и даже А9 - бесконечно слабые камни для такой графической карты. И проблема в том что они не в состоянии нагрузить полезной нагрузкой такой ускоритель.

Естественно, можно написать очень маленький рекурсивный код - который повесит абсолютно любую машину, но смысла в этом мало.
Go to the top of the page
 
+Quote Post
iiv
сообщение Oct 22 2016, 17:48
Сообщение #6


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(AVI-crak @ Oct 22 2016, 22:02) *
Вы хотите установить большой жидкостный ракетный ускоритель на свой велосипед...

не такой уж он и ракетный, жалкие 768ГФлопс на сингле - это несказанно мало по современным меркам, у меня на столе стоят 23ТФлопса и почти не греются sm.gif

Также, как я писал, структура алгоритмов мне позволяет проводить вычисления с такого рода картами. Мне надо на каждом шаге скармливать около 100кбайт данных с моей переферии на карту, и запускать последовательно несколько программ-ядер (они сейчас около 20кбайт суммарной длины), и наружу забирать несколько чисел, и так примерно 10-20 раз в секунду, то есть даже хилый М4 должен потянуть трафик.

Посему давайте оставим алгоритмические аспекты мне самому на растерзание, они разумны и проходимы, мне хочется понять как разумно все это реализовать в железе.

ЗЫ: в общем-то меня даже E6460 может устроить, он, кстати еще меньше, но еле-еле, поэтому хотелось иметь производительности чуток с запасом и я на Аделаар ориентируюсь. Удивительно, что АМДшник до сих пор ничего нового с февраля 2014 года не выпустил.
Go to the top of the page
 
+Quote Post
AVR
сообщение Oct 22 2016, 18:06
Сообщение #7


фанат Linux'а
*****

Группа: Свой
Сообщений: 1 353
Регистрация: 23-10-05
Из: SPB.RU
Пользователь №: 10 008



Прошу прощения, это что не шутка???
Да, есть ARM процессоры, обладающие PCIe интерфейсом, для которых есть драйвера для ОС Linux, и скорее всего именно для AMD удастся подобное. Ключевой момент в поддержке ОС Linux и именно аппаратном PCIe.

Но... Cortex-M??? Без порта PCIe, без полновесной ОС, поверх которых драйвера? Вы себе представляете уровень сложности этого?


Цитата(iiv @ Oct 22 2016, 18:59) *
большой A9 кортекс не хотелось бы ставить, конечно можно плиску поставить но гемора будет неподецки.
Серьезно??? Такой вариант даже в шутку нельзя писать. Хотя, потратив 5 лет, ПЛИС с PCIe можно было бы заставить стать хостом, а затем натянуть AMDшные драйвера с OpenCL поверх Linux. Да узнайте что вообще с драйверами для не-x86 у AMD, этот экзотический AMD Adelaar вообще на ARM полетит?


--------------------
Go to the top of the page
 
+Quote Post
iiv
сообщение Oct 22 2016, 18:14
Сообщение #8


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(AVR @ Oct 22 2016, 22:59) *
Прошу прощения, это что не шутка???

я как раз именно без оси хотел, чтобы проще реал-тайм иметь. Вот и пытаюсь оценить проходимо ли железное кодирование от какого-то кортекса на очень простые операции по PCIe.

Цитата(AVR @ Oct 22 2016, 23:06) *
Серьезно??? Такой вариант даже в шутку нельзя писать. Хотя, потратив 5 лет, ПЛИС с PCIe можно было бы заставить стать хостом, а затем натянуть AMDшные драйвера с OpenCL поверх Linux

необходимый функционал OpenCL умещается в операциях 1. копирования по памяти, 2. старте ядер и 3. ожидании синхронизации. Сами ядра OpenCL ессно можно компилить на чем-то более удобоваримом. Тем более, как я понимаю, там есть вероятность поддержки AMDшного ROCm, что может сильно упростить жизнь.
Go to the top of the page
 
+Quote Post
AVR
сообщение Oct 22 2016, 19:34
Сообщение #9


фанат Linux'а
*****

Группа: Свой
Сообщений: 1 353
Регистрация: 23-10-05
Из: SPB.RU
Пользователь №: 10 008



Прошу прощения, но вижу жестокую недооценку автором темы сложности того что он хочет.
Всё не так как в фильме "железный человек", где в пещере хоп хоп и готов реактор. Можно примотать скотчем кортекс-м и эту видеокарту... Можно, разрешаю sm.gif

Начиная с аппаратного интерфейса PCIe, заканчивая открытыми драйверами OpenCL...


--------------------
Go to the top of the page
 
+Quote Post
_pv
сообщение Oct 22 2016, 19:45
Сообщение #10


Гуру
******

Группа: Свой
Сообщений: 2 563
Регистрация: 8-04-05
Из: Nsk
Пользователь №: 3 954



к stm32 какой-то radeon вроде подключали через i2c sm.gif
http://hackaday.com/2012/10/08/stm32-drivi...cie-video-card/
а там ещё и jtag должен быть. для мегабайта в секунду наверное хватит. и без PCIe.
Go to the top of the page
 
+Quote Post
krux
сообщение Oct 22 2016, 19:53
Сообщение #11


Профессионал
*****

Группа: Свой
Сообщений: 1 700
Регистрация: 2-07-12
Из: дефолт-сити
Пользователь №: 72 596



PCIe - эволюция компьютерной шины PCI.
в её спецификации заложено что это шина, а не точка-точка, что нужно проводить энумераию, распределение ресурсов (диапазоны памяти, IRQ) и много других вещей, которые без операционной системы немыслимы.
ни один производитель сейчас не выпустит проц с PCIe, не обеспечив соответствующей поддержки со стороны операционки.
То есть если у проца торчит PCIe - то у него гарантированно будет операционка с поддержкой PCIe.
далее, допустим вы решили врукопашную запустить bare-metal PCIe скажем, на уровне "без операционки", и даже смогли написать поддержку всех стандартных операций по шине PCIe. Далее возникает вопрос поддержки конкретной железки, с которой вы собираетесь работать - т.е. вам нужна карта регистров AMD-шной железки, алгоритм загрузки-выгрузки данных в неё (это всё нужно будет каким-то образом получить от производителя),, далее, нужно будет написать функции по поддержке работы с OpenCL.
итого стек "ваши функции std PCIe"-"ваши функции AMD-карты"-"ваши функции OpenCL" - это всё должен быть ваш код. боюсь, что вам 3 лет на это всё не хватит.

Цитата
1. копирования по памяти, 2. старте ядер и 3. ожидании синхронизации.

ой.
если бы всё было так просто как вы об этом пишете, то эта ниша уже была бы занята - уже были бы выпущены "AMD-карты OpenCL со встроенным процессором" и вам не пришлось бы ничего выдумывать.


--------------------
провоцируем неудовлетворенных провокаторов с удовольствием.
Go to the top of the page
 
+Quote Post
Den64
сообщение Oct 22 2016, 20:26
Сообщение #12


Знающий
****

Группа: Свой
Сообщений: 584
Регистрация: 22-11-07
Из: Курская область
Пользователь №: 32 571



Цитата(iiv @ Oct 22 2016, 20:48) *
не такой уж он и ракетный, жалкие 768ГФлопс на сингле - это несказанно мало по современным меркам, у меня на столе стоят 23ТФлопса и почти не греются sm.gif

23Тфлопса? Полный коробок процессоров на столе стоят?

Цитата(iiv @ Oct 22 2016, 18:59) *
... Кроме того, я работаю в фирме, которая является официальным консультантом нвидии, ...

Топовый графический ускоритель "нвидии" GeForce GTX 1080 TDP 180W 8 ТФЛОПС
Go to the top of the page
 
+Quote Post
iiv
сообщение Oct 22 2016, 22:12
Сообщение #13


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



2 _pv - огромное спасибо за наводку!

Цитата(Den64 @ Oct 23 2016, 01:26) *
Топовый графический ускоритель "нвидии" GeForce GTX 1080 TDP 180W 8 ТФЛОПС

сейчас вроде Tesla P40 из оных самая шустрая, 11ТФлопсов.
А мои 23терафлопса состоят из двух R9 295x2 (по 11терафлопсов) и еще один терефлопс в четырех 16 ядерных оптеронах. Да, стоят и не греются, но я же не уточнял, что с водяным охлаждением sm.gif я конечно понимаю, что выглядит колхозненько, но мне же считаться надо, а не светодиодами мигать.
Go to the top of the page
 
+Quote Post
AVR
сообщение Oct 24 2016, 08:56
Сообщение #14


фанат Linux'а
*****

Группа: Свой
Сообщений: 1 353
Регистрация: 23-10-05
Из: SPB.RU
Пользователь №: 10 008



Цитата(iiv @ Oct 23 2016, 01:12) *
2 _pv - огромное спасибо за наводку!
По ссылке результат на уровне мифов и легенд. К тому же речь только лишь о выводе изображения, или там можно задействовать и что-то более сложное типа OpenCL? Сомневаюсь.


--------------------
Go to the top of the page
 
+Quote Post
RusikOk
сообщение Feb 9 2017, 13:06
Сообщение #15


Участник
*

Группа: Участник
Сообщений: 46
Регистрация: 14-01-12
Пользователь №: 69 438



вопрос к автору. что Вы такое там считаете на тех картах? аж интересно стало
Go to the top of the page
 
+Quote Post

2 страниц V   1 2 >
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 13th August 2025 - 21:35
Рейтинг@Mail.ru


Страница сгенерированна за 0.015 секунд с 7
ELECTRONIX ©2004-2016