реклама на сайте
подробности

 
 
> Какая производительность на плавающей точку у AllWinner A10?, Сколько пик, и сколько достигается?
iiv
сообщение May 15 2013, 17:30
Сообщение #1


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Всем привет,

недавно в руки попала платка с оллвинером pcduino.com - многое сразу понравилось, как-то удобно что и компилишся и работаешь на одной и той же платформе и все интерфейсы под рукой есть и драйверы худо бедно почти без танцев с бубном заработали.

Есть правда вопрос по производительности процессора на плавающей точке. У меня есть несколько тестов, которые позволяют измерить достигаемую производительность с учетом того, что данных мало (все в регистрах и пайплайнится хорошо), данных чуть больше и все в кешу, данных много и они линейно или случайным образом индексируются в общей памяти.

К сожалению, результаты меня огорчили.

Я смог получить около 60МФлоп/с на регистрах, 20МФлоп/с (линейный доступ) 2МФлоп/с (случайный доступ) при работе с общей памятью. Разницы одинарная или двойная точность почти не видно, есть, но не в два раза, а примерно в 20-30%. Сильно настораживает, что на регистрах получается только 60МФлоп/с, хотя Джек Донгарра в своем докладе прошлой осенью писал, что де оллвинеры почти ГФлоп/с показывают.

Перепробовал кучу опций компиляции, похоже, что -Ofast без ничего другого показывает самые лучшие результаты, пробовал и неон включать, и vf*v3 но только хуже стало.

В связи с этим, возникают вопросы

1. какой реально достижимый пик на этом процессоре на плавающей точке,
2. может ли кто-то поделиться правильными опциями компиляции и примером в несколько строк где бы серьезно больше 60МФлоп/с получалось бы?

Спасибо

ИИВ
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
DASM
сообщение May 15 2013, 18:46
Сообщение #2


Гуру
******

Группа: Свой
Сообщений: 3 644
Регистрация: 28-05-05
Пользователь №: 5 493



60 mflops это мало?? Это же не DSP.Почему Вы решили что будет больше?

Хотите — могу завтра на omap44 прогнать, только код теста дайте.
Ааа, понял.. Это же результаты Gpu соопроцессора.. Вот тут что то сравнивали, правда я не понял как это запускать Сам только начал с сопроцессорами разбираться тут тесты ГПУ
Go to the top of the page
 
+Quote Post
iiv
сообщение May 16 2013, 08:01
Сообщение #3


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Спасибо всем за отклики!

Цитата(DASM @ May 16 2013, 00:46) *
60 mflops это мало?? Это же не DSP.Почему Вы решили что будет больше?


Да, так как, например, мой лаптоп показывает под 100ГФлопс на одинарной и 50ГФлоп/с на двойной точности, и от таблеточного железа хочется хотя бы гигафлоп.

Вот здесь говорят, что на однопроцессорном 3-ем omapе можно получить гигафлоп на одинарной и 50МФлоп/с на двойной точности.

Цитата(DASM @ May 16 2013, 00:46) *
Хотите — могу завтра на omap44 прогнать, только код теста дайте.


тест собственно там же, только надо вначале поставить ATLAS и с ним скомпилить маленький тест, правда установка атласа у меня на аоллвинере заняла больше дня, и, во время инсталляции, желательно на железке ничего не делать, поэтому повторить может оказаться довольно сложно.

Цитата(DASM @ May 16 2013, 00:46) *
Ааа, понял.. Это же результаты Gpu соопроцессора.. Вот тут что то сравнивали, правда я не понял как это запускать Сам только начал с сопроцессорами разбираться тут тесты ГПУ


неее, боюсть, на ГПУ можно еще на порядок больше получить.

Про то, что надо и неон и вфпв3 включать видел и уже пробовал, пока это результаты не улучшало, похоже, ГНУ компилер сам это знает, если -Ofast написать.
Go to the top of the page
 
+Quote Post



Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 22nd July 2025 - 01:35
Рейтинг@Mail.ru


Страница сгенерированна за 0.0138 секунд с 7
ELECTRONIX ©2004-2016