реклама на сайте
подробности

 
 
2 страниц V  < 1 2  
Reply to this topicStart new topic
> Скорость обмена по PCI-Express, Хочу поделится достижениями
bav
сообщение Jun 24 2009, 13:31
Сообщение #16


Знающий
****

Группа: Свой
Сообщений: 693
Регистрация: 21-06-05
Из: Санкт-Петербург
Пользователь №: 6 184



Цитата
Процессор в этом обмене вообще не задействуется.

в обмене через DMA процессор не задействован по определению. но, если проц в это время считывает данные с памяти, то пропускная способность падает - причем, виноват не сам PCIe, а пропускная способность самой памяти.
Цитата
Пропускная способность памяти на порядок превосходит скорость обмена по PCI-Express

ну да, особенно если стоят две платы с CUDA, плюс плата ввода-вывода данных и запущен процесс обработки...

попробую другими словами: если комп не загруже обработкой, т.е. память свободна, то скорости обмена получаются близкие к заявленным.
Go to the top of the page
 
+Quote Post
dsmv
сообщение Jun 25 2009, 06:36
Сообщение #17


Местный
***

Группа: Свой
Сообщений: 451
Регистрация: 6-09-05
Из: Москва
Пользователь №: 8 284



Цитата(bav @ Jun 24 2009, 17:31) *
в обмене через DMA процессор не задействован по определению. но, если проц в это время считывает данные с памяти, то пропускная способность падает - причем, виноват не сам PCIe, а пропускная способность самой памяти.

ну да, особенно если стоят две платы с CUDA, плюс плата ввода-вывода данных и запущен процесс обработки...

попробую другими словами: если комп не загруже обработкой, т.е. память свободна, то скорости обмена получаются близкие к заявленным.


Две CUDA это круто.
Но если посчитать:
Скорость обмена CUDA по PCI-Express 2.0 x16 - 4.5 ГБайта/с
Две CUDA + ADP201x1 = 4.5 *2 + 1.4 = 10.4 ГБайта/с
Это почти полная пропускная способноть DDR3 - 1066

В такой системе конечно встанет вопрос об оптимизации процессов вычисления и ввода-вывода. Но если до таких цифр не доходить, то поток в 1.4 Гбайта/с на процессе обработки и доступе процессора к памяти не сказывается. Кстати у нас решалась задача ввода данных и обработки в реальном времени на процессоре и CUDA. Исходный поток 500 МБайт/с, процессор и CUDA могли обработать только одну четвёртую часть от него.

Насчёт CUDA есть ещё мысль, хочется напрямую передавать поток данных с ADP201x1 в CUDA, минуя память, а с неё уже результат. Но до этого ещё не дошли.
Go to the top of the page
 
+Quote Post
bav
сообщение Jun 30 2009, 10:26
Сообщение #18


Знающий
****

Группа: Свой
Сообщений: 693
Регистрация: 21-06-05
Из: Санкт-Петербург
Пользователь №: 6 184



Цитата
В такой системе конечно встанет вопрос об оптимизации процессов вычисления и ввода-вывода.

вот над этим и страдает наш программист smile.gif
а пробускная способность PCIe в основном соответствует спецификации и приведенным данным. однин раз столкнулся когда пакеты терялись (плата подключалась через самодельный удлинитель), тогда скорость упала почти вдвое.
Цитата
Насчёт CUDA есть ещё мысль, хочется напрямую передавать поток данных с ADP201x1 в CUDA, минуя память, а с неё уже результат. Но до этого ещё не дошли.

у нас такаяже мечта... причем хотелось бы вообще без компа.
Go to the top of the page
 
+Quote Post
Bios71
сообщение Jul 7 2009, 06:26
Сообщение #19


Частый гость
**

Группа: Участник
Сообщений: 78
Регистрация: 21-02-08
Из: Мюнхен
Пользователь №: 35 249



Цитата(dsmv @ Jun 23 2009, 12:27) *
Насколько я понимаю, параметр PAYLOAD должен быть одинаковым во всей цепочке. Его настраивает BIOS в момент обнаружения устройств. Пока я встречал только компьютеры у которых PAYLOAD=128 и 256.
У PEX8648 какой может быть PAYLOAD ? Если она и может поддерживать больше чем 128 а компьютер поддерживает только 128, то и работать будет только 128. А вообще говоря в PCI-Express заложен огромный потенциал. Если они когда-нибуть увеличат его до 4096, то и скорость резко возрастёт.


У меня в итоге всё делится на 128 байт для команды Write Memory.


БИОС настраивает исходя из даташита - а он пишет:

20.1.25 DCAP—Device Capabilities Register
(PCI Express—D28:F0/F1/F2/F3/F4/F5)
Address Offset: 44h–47h Attribute: RO

Bit[2:0] Max Payload Size Supported (MPS) — RO. Indicates the maximum payload size
supported is 128B.

т.е. ICH8/9 поддерживает PCIe X1/X4 ТОЛЬКО 128


--------------------
я не волшебник, я только учусь ...
Go to the top of the page
 
+Quote Post

2 страниц V  < 1 2
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 7th July 2025 - 23:41
Рейтинг@Mail.ru


Страница сгенерированна за 0.01345 секунд с 7
ELECTRONIX ©2004-2016