реклама на сайте
подробности

 
 
> Какие САПР СВЧ поддерживают рассчеты на игровых картах?
ikolmakov
сообщение Feb 23 2017, 21:17
Сообщение #1


Местный
***

Группа: Свой
Сообщений: 353
Регистрация: 29-05-06
Из: С.-Петербург
Пользователь №: 17 541



Притащили мне ASUS GeForce GTX 1080 с целью ускорить расчеты :-) Но я посмотрел по основным программам (MWO, HFSS, FEKO...) и увидел только разговор про Tesla. А CUDA на простых картах кто-то поддерживает?
Go to the top of the page
 
+Quote Post
 
Start new topic
Ответов
Hale
сообщение Mar 1 2017, 00:45
Сообщение #2


Знающий
****

Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667



Цитата
CERN для своих серверов выбирают AMD

потому что 1)цели другие. Как серверы они очень даже неплохие. Но для расчетов, особенно на FPU - полный провал в производительности. 2)Дешевле 3) Лобби.

Есть еще одно соображение. У AMD FPU размазывает (нойз-шейпинг типа) ошибку FSIN, немножко уравнивая ее по диапазонам значений. Intel делает более грубые округления при деноминации больших аргументов, что приводит к более грубым "ступенькам" дисбалансам на графике ошибок.
http://notabs.org/fpuaccuracy/scatterplots/scatterplots.htm
Для ученых CERN это может быть существенно, например, чтобы не видеть нелинейные фракталы в спектрах там где их нет. Для нас, электромагнитных инженеров, это несущественно. Гораздо существенней скорость переваривания больших массивов данных.

Цитата
Спорный вопрос.

Чего там спорного. 1 FPU на два ядра, да и тот тормозной. Плюс проблемы с переходами между C-состояниями питания ядер.

Третий в мире по производительности сервер тоже на AMD
Это все брехня. Это как китайцы сделали второй в мире суперкомпьютер по производительности, который складывать и умножать массивы по немкольку мегабайт может. Но если сложить все RISC ядра, то очень быстро.
Мораль: девять баб за месяц ребенка не родят.
Большинство солверов до сих пор упирается в производительность однопоточных процедур. Может что-то что ученые ЦЕРНА пишут и параллелится лучше, но они это еще не продают в форме продкта. Кроме того, еще раз, x86 архитектура на научных суперкомпьютерах не используется. Не пользуется популярностью и SMT распараллеливание. Все эти x86/x64 бегемоты - чисто утилитарные датацентры.

Интересный пакет. Впервые слышу спасибо.
я с ними пообщался.
Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты.
- Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно.
- Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках.
- До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку.
Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант.
OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше.

Сообщение отредактировал Hale - Mar 1 2017, 00:53
Go to the top of the page
 
+Quote Post
PCBtech
сообщение Mar 1 2017, 12:38
Сообщение #3


Профессионал
*****

Группа: Свой
Сообщений: 1 092
Регистрация: 22-12-04
Из: Москва
Пользователь №: 1 623



Цитата(Hale @ Mar 1 2017, 03:45) *
Интересный пакет. Впервые слышу спасибо.
я с ними пообщался.
Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты.
- Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно.
- Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках.
- До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку.
Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант.
OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше.


Речь про разработчиков Empire XPU, правильно?
Интересно, как Вы ловко их смешали с грязью.
"Ущербный солвер", "ленивые программисты", "тупой кубический меш", "из пушки по воробьям", "тупиковый вариант". "OpenEMS совершенно бесплатно... и даже где-то лучше". Ууххх...

Я понимаю, что это форум, свободное общение, но может, будем как-то более аргументированно выступать?

По существу дела:
я лично знаю людей, которые использовали для своих СВЧ-расчетов CST, а потом перешли на Empire XPU - банально именно из-за существенно более высокой скорости вычислений, при той же точности.
И им не нужны никакие нелинейности, неоднородный меш, упрощение в протяженных однородных участках, тетраэдральная разбивка и прочие вкусности и красивости. Зачем, если и без этого алгоритм "молотит" со страшной скоростью на всех ядрах и кешах Интеловского процессора, и задействует всю доступную память компьютера очень эффективно?
Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать.

Я еще раз повторю - Empire XPU интересен тем людям, кому нужна высокая скорость вычислений и хорошая точность.

Кстати, те мои знакомые хотят сейчас попробовать мульти-процессорную лицензию, говорят, что в версии Empire 7.5 начиная от 3х серверов якобы получается еще более существенное ускорение для больших объектов и систем.

Другие коллеги недавно пробовали Empire на планарных объектах и расчете антенн, тоже мне говорили, что поражены скоростью моделирования (на обычном компьютере без ускорителей).

Ну и вообще - чем обзывать людей, лучше бы попробовали систему на практике и дали бы свои практические впечатления, на конкретных примерах. Нет ничего проще - вот ссылка для запроса демки на месяц:

http://www.empire.de/page45.html&sid=a...8a71b7f2807cd4f

Да, и там есть импорт из других САПР и из ODB++, так что можно посравнивать на конкретике.


--------------------
На правах рекламы:
Для тех, кому нужна современная профессиональная и недорогая САПР печатных плат, взамен P-CAD!

Продлена промо-акция: 19.9 тысяч рублей за годовую сетевую лицензию OrCAD Standard!
В лицензию входит схемный редактор OrCAD Capture, базовый редактор печатных плат на базе Allegro PCB Editor,
с возможностью работы с дифференциальными парами со статическим контролем фазы,
редактор правил и ограничений, 3D-просмотр со STEP-моделями, расчет импеданса, работа с микроотверстиями,
и импорт-экспорт производственных файлов. Прилагается импорт проектов из P-CAD2006.
Все, что нужно для трассировки типовых многослойных плат - всего за 19.9 тыс.рублей в год!

Подробности:
https://www.pcbsoft.ru/orcad-za-19900
Go to the top of the page
 
+Quote Post
Hale
сообщение Mar 2 2017, 04:45
Сообщение #4


Знающий
****

Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667



Цитата(PCBtech @ Mar 1 2017, 15:38) *
И им не нужны никакие нелинейности, н

А комплексно-анизотропный тензор проницаемости нужен. И я считают это позором инженерного программирования, что спустя 90 лет после первого описания метода, и 60 лет после работ Сула и Волкера до сих пор ферриты можно посчтать только в FEM (HFSS) или "на бумажке" (в Матлабе).

От бесконечных заявок на конференциях и выставках FDTD меня честно уже тошнит. Как дети малые. "Мы не будем делать сложные вещи, мы лучше сделаем то что все на 3 курсе проходят чуть быстрее и зарядим цену как за полноценный продукт".И все хотят за это бабло. Квадратное уравнение решить - давайте бабло.
Да, это ловкие умелые, но все те же coding monkey.
Из их ответа я точно, на 145% понял, что эти ребята не заинетресованы в улучшении функциональности софта и даже не предлагают "подождать", или инвестировать в будущее. Им просто по фигу - "мы быстрее всех", боьше ничего не надо.
На вопрос, а сколько задачка будет занимать в памяти.... аой а 5 гигабайт без оверхеда.. Дааа?? И очень быстро вы 5 гигабайт будете перекладывать? Если задача не решается до обеденого преерыва, то честно говоря пофигу, решится она завтра, или послезавтра. Есть полно может и не такого быстрого, но более перспективного софта. Есть даже бесплатный софт с аналогичными возможностями.
Цитата
сейчас попробовать мульти-процессорную лицензию

я от этого особенно фигею. Довольно ординарный софт, единственная фича которого - скорость вычислений, поставляется без мультипроцессорного пакета лицензий по умолчанию.

Цитата
Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать.

тетраэдральный меш хорош тем, что он в разы, на порядки экономичнее кубического, при обводке непрямоугольных контуров, и по той же причине выдает большую точность. Он же позволяет аккуратно ввести неоднородную плотность узлов, для еще большего сокращения работы.
Слабость ортогонального сеточного меша FDTD в том что он не может быть физически применим к сколько-нибудь объемным задачам, а следовательно и ограничен в диапазоне частот, т.к. при приближении к оптике - ни один суперкомпьютер не способен всосать в себя эти данные и тем более перкладывать из домена в домен при разбиении. Удел FDTD - плоские узкие полоски при прогоне дискретных элементов. Чуть расширить, или углубить задачу, и 80% времени тратится на пустопорожние вычисления там, где ничего нет и быть не может.

Цитата(iiv @ Mar 1 2017, 23:10) *
Чтобы считаться на ГПУ, надо, чтобы данные сидели там, но и надо, чтоб большая часть алгоритма тоже там крутилась

Совершенно точно. А поскольку обхъемы задач выходят далеко за 3 Гб, пересылка по PCIe - приводит только к замедлению. Кроме того полноволновые методы вообще хрен решишь.

Господа, вы в курсе, что четырехядерный i7 4ГГц на задачках около 8-12 Гб в HFSS(FEM) частенько обгоняет 8x2 процессорный Xeon 3.4ГГц.
А знаете почему? А из-за того что часть данных, часто попадает в область ответственности CPU1, в результате чего CPU0 вынужден лезть без срезаний пути через оба внутрипроцессорных кольца и QPI. Ну и гораздо меньшая латентность безрегистровой памяти (в принципе, на GPU верхнего диапазона она еще быстрее, но ее хронически мало)

Цитата
И часто происходит так, что софтвер с кудой есть, но поддерживает только 1-2 карты/чипа, ибо на остальных ГПУ он как черепашка ниньзя - вроде и ГПУ, но и ползает как оно самое.

тут дело не в ГПУ, а в маркетинге. Как я сказал, Невидь из-за игроманов прячет свои спеки и хрен поймешь, где Даблпресижн вычислительных блоков больше, в GTX 780, или в 970. Ну, пока не начнешь писать свой код, там все станет ясно.
По хорошему, для вычислений в куда (именно с приростом производительности) годятся только карты x70Ti, x80, x90/Titan и их одночиповые аналоги Quadro/Tesla. При этом у GTX клоки раза в два выше.

Цитата(Pir0texnik @ Mar 2 2017, 03:02) *
Кстати, так а КУДА разве не для того, что бы не сильно зависеть от аппаратной конфигурации?..

ага. толко у нее там 12 разных версий, не с полной совместимстью. Куда жила, а процессорные архитектуры менялись. Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД

Сообщение отредактировал Hale - Mar 2 2017, 06:41
Go to the top of the page
 
+Quote Post
iiv
сообщение Mar 2 2017, 16:02
Сообщение #5


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(Hale @ Mar 2 2017, 09:45) *
Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД


я бы конкретизировал так: если к тебе, как специалисту по куде пришел заказчик с просьбой перетащить его софт на куду и ускорить, или то же самое с АМДшником, то при прочих равных я закладываю примерно в 3 больше времени на разработку софта для АМДшника, чем на КУДУ.

В то же время, если у тебя есть четкий и понятный алгоритм для распараллеливания, и есть бюджет, из которого будет оплачиваться железо и свое время в виде зарплаты самому себе, то почти всегда в выигрыше АМДшник, так как у АМДшника есть достаточно удобные и успешные модели карт, на которых все будет работать, и реально в разы быстрее, чем на Нвидишных камнях за те же деньги.
Go to the top of the page
 
+Quote Post

Сообщений в этой теме
- ikolmakov   Какие САПР СВЧ поддерживают рассчеты на игровых картах?   Feb 23 2017, 21:17
- - Hale   архитектура Tesla=Cuda ATI=OpenCL в графических к...   Feb 24 2017, 00:10
- - PCBtech   Цитата(ikolmakov @ Feb 24 2017, 00:17) Пр...   Feb 25 2017, 20:13
|- - Grizzzly   Цитата(PCBtech @ Feb 25 2017, 23:13) Можн...   Feb 27 2017, 17:16
|- - Pir0texnik   Цитата(Grizzzly @ Feb 27 2017, 20:16) Пол...   Feb 27 2017, 23:46
|- - Hale   Цитата(Grizzzly @ Feb 27 2017, 20:16) Пок...   Feb 28 2017, 02:22
||- - Grizzzly   Цитата(Hale @ Feb 28 2017, 05:22) И нет н...   Feb 28 2017, 08:17
|- - PCBtech   Цитата(Grizzzly @ Feb 27 2017, 20:16) Инт...   Feb 28 2017, 09:26
|- - Grizzzly   Цитата(PCBtech @ Feb 28 2017, 12:26) Вот ...   Feb 28 2017, 09:29
- - khach   Хакать надо NVIDIa карты для для использования и...   Feb 26 2017, 00:54
|- - Hale   Цитата(khach @ Feb 26 2017, 04:54) Хакать...   Feb 27 2017, 00:00
- - Pir0texnik   Так собственно вопрос, который всех волнует: кому-...   Feb 27 2017, 02:21
|- - Hale   Цитата(Pir0texnik @ Feb 27 2017, 05:21) Т...   Feb 27 2017, 07:53
|- - Pir0texnik   Цитата(Hale @ Feb 27 2017, 10:53) Я еще н...   Feb 27 2017, 08:38
|- - Hale   Цитата(Pir0texnik @ Feb 27 2017, 11:38) А...   Feb 28 2017, 00:59
- - DmitryHF   CUDA поддерживает Savant. Метод расчета - трассиро...   Feb 27 2017, 06:45
- - ikolmakov   Да.. Жалко что по делу почти никто так и не высказ...   Feb 27 2017, 20:31
- - Pir0texnik   Тогда я не понимаю почему CST пишет именно, что ем...   Feb 28 2017, 07:00
|- - Grizzzly   Цитата(Hale @ Mar 1 2017, 03:45) Огромно...   Mar 1 2017, 09:33
- - iiv   Ну йопэрэсэтэ, вы сами-то хоть раз (хоть кто-то из...   Mar 1 2017, 20:10
- - Pir0texnik   Анекдот вспомнил про "... ты так слона не про...   Mar 2 2017, 00:02
- - Hale   совершенно точно.   Mar 2 2017, 23:50


Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 31st July 2025 - 06:58
Рейтинг@Mail.ru


Страница сгенерированна за 0.01444 секунд с 7
ELECTRONIX ©2004-2016