|
Какие САПР СВЧ поддерживают рассчеты на игровых картах? |
|
|
|
Feb 24 2017, 00:10
|
Знающий
   
Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667

|
архитектура Tesla=Cuda ATI=OpenCL
в графических картах есть два типа вычислительных ядер, 32 и 64 битные(двойной точности). Вторых в несколько раз меньше чем первых, за исключением карт Titan и самих Tesla как продукта, где соотношение single:double доходит до 2:1. Если речь о тесли как продукте, то сейчас она как и 1080 имеет итерацию "Pascal".
1080 сделан на итерации чипа GP104, как и Tesla P4 "One Pascal SM on the GP100 combines 64 single-precision (FP32) shader processors and also 32 double-precision (FP64) " SM=Streaming Multiprocessor. В Тесле их вроде бы 60, т.е. нас интересуют 1920 64-разрядных исполнительных блока. А в 1080 - не ясно. Но суюдя по всему, GFLOPs увеличены примерно пропорциональны частоте. Т.о. судя по всему, проме драйверов и объема памяти, 1080 практически идентичен Тесле P4.
Но есть одно но. Хорошо параллелятся и считаются на дискретных бордах только тайм-домейн методы. Для начала потому что ни меньше памяти занимают и легче разбиваются на домены. Полноволновые методы по моему никто серьезно еще на ускорителях не решал. Т.о. HFSS, в котором Transient поддерживаешь конечно ускорители, по основному своему FEM солверу отпадает, т.к. в нем задача может занимать и 60 и 100 гигабайт за раз, в зависимости от материалов и сложности модели. Остальные наверняка надо узнавать у производителя, какой солвер вам нужен и какой поддерживает.
|
|
|
|
|
Feb 25 2017, 20:13
|

Профессионал
    
Группа: Свой
Сообщений: 1 092
Регистрация: 22-12-04
Из: Москва
Пользователь №: 1 623

|
Цитата(ikolmakov @ Feb 24 2017, 00:17)  Притащили мне ASUS GeForce GTX 1080 с целью ускорить расчеты :-) Но я посмотрел по основным программам (MWO, HFSS, FEKO...) и увидел только разговор про Tesla. А CUDA на простых картах кто-то поддерживает? Можно посмотреть САПР Empire XPU. Очень быстро считает большие объекты, по сравнению с теми же MWO, HFSS... Ей нужен CPU Intel, желательно i7, чем больше ядер, тем выше скорость. А тип графической карты не так важен. Сравнивали недавно по точности расчетов с другими САПР - результаты очень близкие, при скорости вычислений в разы более высокой.
--------------------
На правах рекламы: Для тех, кому нужна современная профессиональная и недорогая САПР печатных плат, взамен P-CAD! Продлена промо-акция: 19.9 тысяч рублей за годовую сетевую лицензию OrCAD Standard! В лицензию входит схемный редактор OrCAD Capture, базовый редактор печатных плат на базе Allegro PCB Editor, с возможностью работы с дифференциальными парами со статическим контролем фазы, редактор правил и ограничений, 3D-просмотр со STEP-моделями, расчет импеданса, работа с микроотверстиями, и импорт-экспорт производственных файлов. Прилагается импорт проектов из P-CAD2006. Все, что нужно для трассировки типовых многослойных плат - всего за 19.9 тыс.рублей в год! Подробности: https://www.pcbsoft.ru/orcad-za-19900
|
|
|
|
|
Feb 27 2017, 00:00
|
Знающий
   
Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667

|
Цитата(khach @ Feb 26 2017, 04:54)  Хакать надо NVIDIa карты для для использования их в качестве ускорителя. http://www.eevblog.com/forum/chat/hacking-...l-counterparts/только там где тупой софт проверяет DevID. Это не вина nVidia, а вина разработчиков софта. CUDA-C компилится под любой современный ускоритель nVidia. Иначе бы многие игры стояли в сторонке и поглядывали на AMD/ATI. Традиционно, nVidia "хакают" не для CUDA, а для 3D графики Quadro. Quadro заточены на отображение проволок в CAD и на повышенное качество отрисовки, в ущерб производительности. Короче, другие оптимизации дров, да и сами дрова отдельные. Во времена Riva GeForce 3, 4 чипы Quadro были идентичны игровым, только с лочками по DevID. Сейчас в игровых чипах пережигают аппаратно доступ к специализированных блокам используемым в CAD-ах, в.т.ч. антиалаясные проволоки и пр. Но iD все еще сменить можно. Как софтово(с глюками, но и возможностью откатить) так и перепайкой резисторов.
Сообщение отредактировал Hale - Feb 27 2017, 00:06
|
|
|
|
|
Feb 27 2017, 02:21
|
Знающий
   
Группа: Свой
Сообщений: 918
Регистрация: 20-09-06
Пользователь №: 20 539

|
Так собственно вопрос, который всех волнует: кому-то удалось "перековать" игровую карту(пусть NVIDIA) таким образом, чтобы эффективно использовать ее в качестве ускорителя расчетов? Применительно к CST, HFSS(только транзиент вроде?), ADS (там есть галочка...), MWO или Sonnet (они умеют в это вообще?). Читая http://www.eevblog.com я так и не понял что поменялось после замены ID GTX980 на теслу...
|
|
|
|
|
Feb 27 2017, 06:45
|
Частый гость
 
Группа: Участник
Сообщений: 101
Регистрация: 5-02-14
Пользователь №: 80 355

|
CUDA поддерживает Savant. Метод расчета - трассировка лучей. Видеокарты это хорошо умеют делать. Пробовал использовать Ge Force 650 ti, работало. Сейчас Savant в составе Ansys Electromagnetics. Удобно использовать для быстрого анализа мест установки антенн.
Информация из справки:
GPU Hardware
The Savant GPU plug-in requires an NVIDIA GPU. Most recent NVIDIA GPUs (manufactured in the last three years) work well, with the best performance typically coming from the higher-end GTX, Quadro and Tesla cards. NVIDIA GPUs are produced for many different types of computers, including laptops, desktops and compute servers. The GPUs are also produced for many different market segments. This section provides an overview of many key concepts that are helpful to understand.
Please contact us if you have specific questions or would like us to recommend the best GPU to use with Savant for your application and budget.
NVIDIA GPU product lines
NVIDIA markets workstation GPUs in three different product lines. They market mobile GPUs in two different product lines.
GeForce or GTX: the consumer, desktop product line, focused on maximizing graphics-throughput for home users. These cards work well the Savant GPU plug-in. To maximize graphics refresh rates, the GeForce cards run at faster clock rates than other product lines. This leads to somewhat higher speed-up in Savant, but also produces more heat and may lead to higher error rates. As a result, NVIDIA recommends using Tesla cards for GPU compute servers. Sample GeForce model numbers include: GTX 670, 680, 750Ti, 770, 780, Titan, 960, 970, 980.
Tesla: the GPU compute server product line. Tesla GPUs run at slightly slower clocks to produce less heat and higher reliability. They also utilize ECC ram to detect and correct hardware memory errors. Tesla GPUs typically cost 3x to 4x more than comparable GeForce cards. Sample Tesla model numbers are K10, K20, K40. The Maxwell architecture is now available in the Tesla product line with models M40 and M60 but has not been tested with Savant. Pascal GPUs are available in the Tesla product line with models P4, P40, and P100 but have not been tested with Savant.
Quadro: the high-end visualization product line. These cards have the same GPU hardware as GTX and Tesla cards but are marketed to professional users. These cards tend to be more expensive than the GTX product line. They can work well with Savant GPU but the added cost of the Quadro may not translate to extra acceleration in Savant. A GTX card with the same internal hardware may provide the same level of acceleration at a lower price. Some Quadro cards have low numbers of processing cores and may not provide much speedup. Mobile GPUs
NVIDIA sells mobile versions of GeForce and Quadro GPUs. The mobile versions typically have similar model numbers as the desktop versions, with an 'M' added to the model number. The mobile versions tend to have fewer cores and run at slower clock speeds, compromises that are necessary to reduce power consumption and heat. Savant GPU works well on recent mobile GPUs, but because of the hardware restrictions, it is not expected to achieve the same level of acceleration as it does on desktops and servers. Speed-ups of 8x to 15x are more typical for Savant GPU on mobile GPUs.
GPU architecture
There are different generations of GPU architecture. These are analogous to the CPU generations such as Pentium III, Pentium IV and most recently, Core I7. The NVIDIA GPU architectures from newest to oldest are Pascal, Maxwell, Kepler, and Fermi. Savant GPU performs well on all of them, but the best performance generally comes from the newer architectures. Savant GPU may run on GPUs from older architectures but may not perform well due to hardware limitations of those older GPUs.
Pascal: the current generation of NVIDIA GPU processor. Pascal processors generally have faster processing (GFLOPS/sec) and more memory than previous generations. Pascal also has much higher memory bandwidth (GB/sec) on the Tesla product line. Pascal GPUs are very new for Savant 18.0. Savant has not been tested on Pascal but should be compatible.
Maxwell: the previous generation of NVIDIA GPU processor. Maxwell processors generally contain more GPU cores, larger cache and other memory, and improved instruction scheduling compared to Kepler GPUs. Specifics vary by individual models. Maxwell processors are found on GeForce GTX 750xx, some GeForce GTX 8xxM (mobile) models, and GeForce GTX 9xx models. Some GeForce model series contain a mixture of Maxwell and Kepler GPUs, so it is important to check the particular model to be sure it has the desired GPU architecture.
Kepler: a previous generation of NVIDIA GPU processor. Contains 2x to 5x more GPU cores than Fermi (the exact core count depends on on the model). Kepler processors are found in GeForce 6xx models, Tesla K10, K20 and K40 models, and Quadro K2000 through K5000. Savant began to provide support for Kepler GPUs in Savant 3.0 and fully supports Kepler since Savant 4.0. Our tests show that Savant GPU performs electromagnetic calculations very well on Kepler GPUs.
Fermi: the generation of NVIDIA GPU processor prior to Kepler. Contains up to 512 compute cores and increased memory bandwidth. Savant GPU performs very well on Fermi GPUs. Fermi processors are found in GeForce 4xx and 5xx models, Tesla 20x0 models and Quadro 600, 2000, 4000, 5000 and 6000.
|
|
|
|
|
Feb 27 2017, 07:53
|
Знающий
   
Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667

|
Цитата(Pir0texnik @ Feb 27 2017, 05:21)  Так собственно вопрос, который всех волнует: кому-то удалось "перековать" игровую карту(пусть NVIDIA) таким образом, чтобы эффективно использовать ее в качестве ускорителя расчетов? Применительно к CST, HFSS(только транзиент вроде?), ADS (там есть галочка...), MWO или Sonnet (они умеют в это вообще?). Читая http://www.eevblog.com я так и не понял что поменялось после замены ID GTX980 на теслу... Я еще ни разу не слышал, чтобы софт, способный считать через CUDA не жрал игровые карты nVidia. Еще раз - наличие Tesla, Quadro, или GTX с точки зрения CUDA не имеет никакой разницы. С аппаратной точки зрения есть разница в объеме памяти и в ограничении 64-битных исполнительных унитов на младших версиях карт. Старшие GTX/Quadto/Tesla отличаются частотами(в пользу GTX) и памятью (в пользу Tesla). То что CG софт типа 3DS Max выводит не очень хорошую картинку в АППАРАТНЫЙ(!) preview на неперекованных картах, это факт, для этого его и перековывают (причем, на поколениях карт GS перековка не помогала ничем, кроме возможности поставить специализированные дрова без оптимизаций. Квадровые инструкции были выжжены лазером). Но тут еще штука - для этого эффекта мониторы нужны порядка 1600 строк. На мониторах низкого разрешения, напротив, размазанные антиалаясные линии Quadro выглядят хуже "рваной паутины" выдаваемой на GTX. Но к CUDA это отношения не имеет! Если я не ошибаюсь, до того как маркетологи приняли туманную расшифровку "Compute Unified Device Architecture", существовала достаточно понятная "Common Unit Data Access". По поводу софта. CUDA поддерживается в Matlab, но через прокладки, которые сжирают больше 50% теоретического прироста. Существует nVidia cuBLAS библиотека не совместимая с оригинальным BLAS, но реализующая некоторые его функции, для желающих покодить. Поскольку никто кодить не хочет, также была попытка сделать прокладку симулирующую настоящий BLAS и вызывающую cuBlas, либо нормальный Blas по необходимости. Но попытка была реализована только для линуксов, также с серьезными потерями производительности. Есть статья по акселерации в Octave с известной долей корпоративного преувеличения результатов. https://devblogs.nvidia.com/parallelforall/...ion-gnu-octave/Под Windows реализации нет, кроме упомянутого нестандартного cuBLAS
Сообщение отредактировал Hale - Feb 27 2017, 07:54
|
|
|
|
|
Feb 27 2017, 17:16
|
Знающий
   
Группа: Свой
Сообщений: 565
Регистрация: 22-02-13
Пользователь №: 75 748

|
Цитата(PCBtech @ Feb 25 2017, 23:13)  Можно посмотреть САПР Empire XPU. Интересный пакет. Впервые слышу спасибо. А есть где-нибудь подробное описание организации вычислительного процесса? Это коммерческая тайна, но всё-таки вдруг где-то написано. Пока непонятно, за счет чего такой выигрыш по сравнению с GPU... Читаю здесь: http://media.wix.com/ugd/cc9e5f_f1b100a1d1...50966de696a.pdfUPD.: Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет?
|
|
|
|
|
Feb 27 2017, 23:46
|
Знающий
   
Группа: Свой
Сообщений: 918
Регистрация: 20-09-06
Пользователь №: 20 539

|
Цитата(Grizzzly @ Feb 27 2017, 20:16)  Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет? Ну так они все используют Intel MKL, которое на все случаи жизни. C AMD Core Math Library (ACML) видимо все не так однозначно... Кто девушку кормит, то ее и танцует и не надо конспирологии.
|
|
|
|
|
Feb 28 2017, 02:22
|
Знающий
   
Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667

|
Цитата(Grizzzly @ Feb 27 2017, 20:16)  Пока непонятно, за счет чего такой выигрыш по сравнению с GPU... За счет I/O и случайного доступа к памяти. У GPU сравнительно ограниченные возможности, заточенные на векторное вычисление. Как только в схеме сбой - для смены задачи приходится прокачивать и преекладывать огромные объемы памяти. Если программа аккуратно написана СПЦИАЛЬНО для векторных регистров CPU, то она может и на CPU гоняться с переменным успехом за GPU младшего и среднего сегментов. Intel 10 лет вел разработки своего лучевого рендерера для графики под CPU. Хотя проект и провалился, но родил промежуточный тип ускорителей Xeon Phi, которые гораздо более гибкие чем GPU в программировании и I/O. Цитата(Grizzzly @ Feb 27 2017, 20:16)  Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет? Никто ни о чем не договаривался. Все задокументированно и предоставлено разработчикам. И нет никакого смысла начинать писать под изначально ущербную платформу. AMD просто отстал и заигрался... при этом у AMD нет такого ресурса как у интела, когда они занимались дурью с NetBurst и Rambus
Сообщение отредактировал Hale - Feb 28 2017, 02:41
|
|
|
|
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0
|
|
|