реклама на сайте
подробности

 
 
2 страниц V  < 1 2  
Reply to this topicStart new topic
> Какие САПР СВЧ поддерживают рассчеты на игровых картах?
Grizzzly
сообщение Feb 28 2017, 08:17
Сообщение #16


Знающий
****

Группа: Свой
Сообщений: 565
Регистрация: 22-02-13
Пользователь №: 75 748



Цитата(Hale @ Feb 28 2017, 05:22) *
И нет никакого смысла начинать писать под изначально ущербную платформу. AMD просто отстал и заигрался...

Спорный вопрос. CERN для своих серверов выбирают AMD: http://www.hardwareluxx.com/index.php/news...h-32-cores.html
Третий в мире по производительности сервер тоже на AMD: https://www.top500.org/lists/2016/11/
Для многопоточных вычислений как раз AMD интереснее смотрится. Если все делают софт с использованием Intel MKL, то, разумеется, Intel на порядок смотрится выигрышнее.
В эти состоялся выпуск новой линейки AMD Ryzen, которая в чем-то даже превосходит Intel'овские процессоры. Дома у меня Intel, на работе AMD. Для конкретных задач - свой процессор. Поэтому я бы не стал так принижать AMD.
Go to the top of the page
 
+Quote Post
PCBtech
сообщение Feb 28 2017, 09:26
Сообщение #17


Профессионал
*****

Группа: Свой
Сообщений: 1 092
Регистрация: 22-12-04
Из: Москва
Пользователь №: 1 623



Цитата(Grizzzly @ Feb 27 2017, 20:16) *
Интересный пакет. Впервые слышу спасибо. А есть где-нибудь подробное описание организации вычислительного процесса? Это коммерческая тайна, но всё-таки вдруг где-то написано. Пока непонятно, за счет чего такой выигрыш по сравнению с GPU...
Читаю здесь: http://media.wix.com/ugd/cc9e5f_f1b100a1d1...50966de696a.pdf

UPD.:
Получается, что софт сугубо под Intel. То есть они как-то договорились с Intel и получили все сведения о тонкостях работы кэшей, конвейеров и т.д. Я правильно понимаю, что на AMD работать не будет?


Вот тут есть рекомендации по железу для оптимальной скорости моделирования:

http://www.empire.de/page4.html

Hardware recommendations:

• Intel Core i5, i7, Xeon
• 4 GB RAM or more
• Graphic card “OpenGL certified” (1280*1024 Pixel or more )
• Nvidia GTX 750 or better
• ATI Raedon HD77xx or better
• Hard disk space 3 GB
• Three button wheel mouse


PC recommendations:

Workstation (eg. Dell Studio XPS 8100):
•64bit Quad Core, Intel Core i7
•At least 3 Memory Modules

Multi CPU Workstation (eg. Dell Precision T7500):
•64bit Quad Core, Intel Xeon Series 5600
•At least 3 Memory Modules

LAPTOP (e.g. Dell Precision M2400 or M6500):
•Intel Core2 Duo, or Intel Core i7 Quadcore
•2 Memory Modules


--------------------
На правах рекламы:
Для тех, кому нужна современная профессиональная и недорогая САПР печатных плат, взамен P-CAD!

Продлена промо-акция: 19.9 тысяч рублей за годовую сетевую лицензию OrCAD Standard!
В лицензию входит схемный редактор OrCAD Capture, базовый редактор печатных плат на базе Allegro PCB Editor,
с возможностью работы с дифференциальными парами со статическим контролем фазы,
редактор правил и ограничений, 3D-просмотр со STEP-моделями, расчет импеданса, работа с микроотверстиями,
и импорт-экспорт производственных файлов. Прилагается импорт проектов из P-CAD2006.
Все, что нужно для трассировки типовых многослойных плат - всего за 19.9 тыс.рублей в год!

Подробности:
https://www.pcbsoft.ru/orcad-za-19900
Go to the top of the page
 
+Quote Post
Grizzzly
сообщение Feb 28 2017, 09:29
Сообщение #18


Знающий
****

Группа: Свой
Сообщений: 565
Регистрация: 22-02-13
Пользователь №: 75 748



Цитата(PCBtech @ Feb 28 2017, 12:26) *
Вот тут есть рекомендации по железу для оптимальной скорости моделирования:

Спасибо.
Go to the top of the page
 
+Quote Post
Hale
сообщение Mar 1 2017, 00:45
Сообщение #19


Знающий
****

Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667



Цитата
CERN для своих серверов выбирают AMD

потому что 1)цели другие. Как серверы они очень даже неплохие. Но для расчетов, особенно на FPU - полный провал в производительности. 2)Дешевле 3) Лобби.

Есть еще одно соображение. У AMD FPU размазывает (нойз-шейпинг типа) ошибку FSIN, немножко уравнивая ее по диапазонам значений. Intel делает более грубые округления при деноминации больших аргументов, что приводит к более грубым "ступенькам" дисбалансам на графике ошибок.
http://notabs.org/fpuaccuracy/scatterplots/scatterplots.htm
Для ученых CERN это может быть существенно, например, чтобы не видеть нелинейные фракталы в спектрах там где их нет. Для нас, электромагнитных инженеров, это несущественно. Гораздо существенней скорость переваривания больших массивов данных.

Цитата
Спорный вопрос.

Чего там спорного. 1 FPU на два ядра, да и тот тормозной. Плюс проблемы с переходами между C-состояниями питания ядер.

Третий в мире по производительности сервер тоже на AMD
Это все брехня. Это как китайцы сделали второй в мире суперкомпьютер по производительности, который складывать и умножать массивы по немкольку мегабайт может. Но если сложить все RISC ядра, то очень быстро.
Мораль: девять баб за месяц ребенка не родят.
Большинство солверов до сих пор упирается в производительность однопоточных процедур. Может что-то что ученые ЦЕРНА пишут и параллелится лучше, но они это еще не продают в форме продкта. Кроме того, еще раз, x86 архитектура на научных суперкомпьютерах не используется. Не пользуется популярностью и SMT распараллеливание. Все эти x86/x64 бегемоты - чисто утилитарные датацентры.

Интересный пакет. Впервые слышу спасибо.
я с ними пообщался.
Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты.
- Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно.
- Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках.
- До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку.
Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант.
OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше.

Сообщение отредактировал Hale - Mar 1 2017, 00:53
Go to the top of the page
 
+Quote Post
Grizzzly
сообщение Mar 1 2017, 09:33
Сообщение #20


Знающий
****

Группа: Свой
Сообщений: 565
Регистрация: 22-02-13
Пользователь №: 75 748



Цитата(Hale @ Mar 1 2017, 03:45) *

Огромное спасибо за подробный ответ! С такими формулировками и объяснениями согласен.
Go to the top of the page
 
+Quote Post
PCBtech
сообщение Mar 1 2017, 12:38
Сообщение #21


Профессионал
*****

Группа: Свой
Сообщений: 1 092
Регистрация: 22-12-04
Из: Москва
Пользователь №: 1 623



Цитата(Hale @ Mar 1 2017, 03:45) *
Интересный пакет. Впервые слышу спасибо.
я с ними пообщался.
Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты.
- Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно.
- Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках.
- До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку.
Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант.
OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше.


Речь про разработчиков Empire XPU, правильно?
Интересно, как Вы ловко их смешали с грязью.
"Ущербный солвер", "ленивые программисты", "тупой кубический меш", "из пушки по воробьям", "тупиковый вариант". "OpenEMS совершенно бесплатно... и даже где-то лучше". Ууххх...

Я понимаю, что это форум, свободное общение, но может, будем как-то более аргументированно выступать?

По существу дела:
я лично знаю людей, которые использовали для своих СВЧ-расчетов CST, а потом перешли на Empire XPU - банально именно из-за существенно более высокой скорости вычислений, при той же точности.
И им не нужны никакие нелинейности, неоднородный меш, упрощение в протяженных однородных участках, тетраэдральная разбивка и прочие вкусности и красивости. Зачем, если и без этого алгоритм "молотит" со страшной скоростью на всех ядрах и кешах Интеловского процессора, и задействует всю доступную память компьютера очень эффективно?
Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать.

Я еще раз повторю - Empire XPU интересен тем людям, кому нужна высокая скорость вычислений и хорошая точность.

Кстати, те мои знакомые хотят сейчас попробовать мульти-процессорную лицензию, говорят, что в версии Empire 7.5 начиная от 3х серверов якобы получается еще более существенное ускорение для больших объектов и систем.

Другие коллеги недавно пробовали Empire на планарных объектах и расчете антенн, тоже мне говорили, что поражены скоростью моделирования (на обычном компьютере без ускорителей).

Ну и вообще - чем обзывать людей, лучше бы попробовали систему на практике и дали бы свои практические впечатления, на конкретных примерах. Нет ничего проще - вот ссылка для запроса демки на месяц:

http://www.empire.de/page45.html&sid=a...8a71b7f2807cd4f

Да, и там есть импорт из других САПР и из ODB++, так что можно посравнивать на конкретике.


--------------------
На правах рекламы:
Для тех, кому нужна современная профессиональная и недорогая САПР печатных плат, взамен P-CAD!

Продлена промо-акция: 19.9 тысяч рублей за годовую сетевую лицензию OrCAD Standard!
В лицензию входит схемный редактор OrCAD Capture, базовый редактор печатных плат на базе Allegro PCB Editor,
с возможностью работы с дифференциальными парами со статическим контролем фазы,
редактор правил и ограничений, 3D-просмотр со STEP-моделями, расчет импеданса, работа с микроотверстиями,
и импорт-экспорт производственных файлов. Прилагается импорт проектов из P-CAD2006.
Все, что нужно для трассировки типовых многослойных плат - всего за 19.9 тыс.рублей в год!

Подробности:
https://www.pcbsoft.ru/orcad-za-19900
Go to the top of the page
 
+Quote Post
iiv
сообщение Mar 1 2017, 20:10
Сообщение #22


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Ну йопэрэсэтэ, вы сами-то хоть раз (хоть кто-то из форума) программировал и оптимизировал пакеты линейной алгебры на CUDA/OpenCL? Точно нет? Ну так и чеж говорить, что "почему он не поддерживает".

Да потому, что замучаешся.

Чтобы считаться на ГПУ, надо, чтобы данные сидели там, но и надо, чтоб большая часть алгоритма тоже там крутилась.

Вот Вы попробуйте, имея огромный массив в обычной оперативной памяти его отсортировать на ГПУ, и чтоб получилось быстрее, чем в оперативной. Да хоть на тесле, да хоть на перетесле! А? Нет? Кишка тонка? Руки не их того места? Или аппаратно не получится?

Во!!!

Не всякая задача хорошо ложится на ГПУ, а если и ложиться, то ГПУ программерам вподляк поддерживать все архитектуры, который Нвидия наплодила как кроликов.

И часто происходит так, что софтвер с кудой есть, но поддерживает только 1-2 карты/чипа, ибо на остальных ГПУ он как черепашка ниньзя - вроде и ГПУ, но и ползает как оно самое.

Да и АМДшник со своим Ронмом и ОпенЦэЭлем не лучше себя ведет.

С уважением

Официальный представитель-консультант по CUDA по Германии
Go to the top of the page
 
+Quote Post
Pir0texnik
сообщение Mar 2 2017, 00:02
Сообщение #23


Знающий
****

Группа: Свой
Сообщений: 918
Регистрация: 20-09-06
Пользователь №: 20 539



Анекдот вспомнил про "... ты так слона не продашь"...
А в целом очень из инженеров свч "хоть раз программировал и оптимизировал пакеты линейной алгебры на CUDA/OpenCL?". Было бы удивительно если наоборот.

Кстати, так а КУДА разве не для того, что бы не сильно зависеть от аппаратной конфигурации?..
Go to the top of the page
 
+Quote Post
Hale
сообщение Mar 2 2017, 04:45
Сообщение #24


Знающий
****

Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667



Цитата(PCBtech @ Mar 1 2017, 15:38) *
И им не нужны никакие нелинейности, н

А комплексно-анизотропный тензор проницаемости нужен. И я считают это позором инженерного программирования, что спустя 90 лет после первого описания метода, и 60 лет после работ Сула и Волкера до сих пор ферриты можно посчтать только в FEM (HFSS) или "на бумажке" (в Матлабе).

От бесконечных заявок на конференциях и выставках FDTD меня честно уже тошнит. Как дети малые. "Мы не будем делать сложные вещи, мы лучше сделаем то что все на 3 курсе проходят чуть быстрее и зарядим цену как за полноценный продукт".И все хотят за это бабло. Квадратное уравнение решить - давайте бабло.
Да, это ловкие умелые, но все те же coding monkey.
Из их ответа я точно, на 145% понял, что эти ребята не заинетресованы в улучшении функциональности софта и даже не предлагают "подождать", или инвестировать в будущее. Им просто по фигу - "мы быстрее всех", боьше ничего не надо.
На вопрос, а сколько задачка будет занимать в памяти.... аой а 5 гигабайт без оверхеда.. Дааа?? И очень быстро вы 5 гигабайт будете перекладывать? Если задача не решается до обеденого преерыва, то честно говоря пофигу, решится она завтра, или послезавтра. Есть полно может и не такого быстрого, но более перспективного софта. Есть даже бесплатный софт с аналогичными возможностями.
Цитата
сейчас попробовать мульти-процессорную лицензию

я от этого особенно фигею. Довольно ординарный софт, единственная фича которого - скорость вычислений, поставляется без мультипроцессорного пакета лицензий по умолчанию.

Цитата
Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать.

тетраэдральный меш хорош тем, что он в разы, на порядки экономичнее кубического, при обводке непрямоугольных контуров, и по той же причине выдает большую точность. Он же позволяет аккуратно ввести неоднородную плотность узлов, для еще большего сокращения работы.
Слабость ортогонального сеточного меша FDTD в том что он не может быть физически применим к сколько-нибудь объемным задачам, а следовательно и ограничен в диапазоне частот, т.к. при приближении к оптике - ни один суперкомпьютер не способен всосать в себя эти данные и тем более перкладывать из домена в домен при разбиении. Удел FDTD - плоские узкие полоски при прогоне дискретных элементов. Чуть расширить, или углубить задачу, и 80% времени тратится на пустопорожние вычисления там, где ничего нет и быть не может.

Цитата(iiv @ Mar 1 2017, 23:10) *
Чтобы считаться на ГПУ, надо, чтобы данные сидели там, но и надо, чтоб большая часть алгоритма тоже там крутилась

Совершенно точно. А поскольку обхъемы задач выходят далеко за 3 Гб, пересылка по PCIe - приводит только к замедлению. Кроме того полноволновые методы вообще хрен решишь.

Господа, вы в курсе, что четырехядерный i7 4ГГц на задачках около 8-12 Гб в HFSS(FEM) частенько обгоняет 8x2 процессорный Xeon 3.4ГГц.
А знаете почему? А из-за того что часть данных, часто попадает в область ответственности CPU1, в результате чего CPU0 вынужден лезть без срезаний пути через оба внутрипроцессорных кольца и QPI. Ну и гораздо меньшая латентность безрегистровой памяти (в принципе, на GPU верхнего диапазона она еще быстрее, но ее хронически мало)

Цитата
И часто происходит так, что софтвер с кудой есть, но поддерживает только 1-2 карты/чипа, ибо на остальных ГПУ он как черепашка ниньзя - вроде и ГПУ, но и ползает как оно самое.

тут дело не в ГПУ, а в маркетинге. Как я сказал, Невидь из-за игроманов прячет свои спеки и хрен поймешь, где Даблпресижн вычислительных блоков больше, в GTX 780, или в 970. Ну, пока не начнешь писать свой код, там все станет ясно.
По хорошему, для вычислений в куда (именно с приростом производительности) годятся только карты x70Ti, x80, x90/Titan и их одночиповые аналоги Quadro/Tesla. При этом у GTX клоки раза в два выше.

Цитата(Pir0texnik @ Mar 2 2017, 03:02) *
Кстати, так а КУДА разве не для того, что бы не сильно зависеть от аппаратной конфигурации?..

ага. толко у нее там 12 разных версий, не с полной совместимстью. Куда жила, а процессорные архитектуры менялись. Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД

Сообщение отредактировал Hale - Mar 2 2017, 06:41
Go to the top of the page
 
+Quote Post
iiv
сообщение Mar 2 2017, 16:02
Сообщение #25


вопрошающий
*****

Группа: Свой
Сообщений: 1 726
Регистрация: 24-01-11
Пользователь №: 62 436



Цитата(Hale @ Mar 2 2017, 09:45) *
Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД


я бы конкретизировал так: если к тебе, как специалисту по куде пришел заказчик с просьбой перетащить его софт на куду и ускорить, или то же самое с АМДшником, то при прочих равных я закладываю примерно в 3 больше времени на разработку софта для АМДшника, чем на КУДУ.

В то же время, если у тебя есть четкий и понятный алгоритм для распараллеливания, и есть бюджет, из которого будет оплачиваться железо и свое время в виде зарплаты самому себе, то почти всегда в выигрыше АМДшник, так как у АМДшника есть достаточно удобные и успешные модели карт, на которых все будет работать, и реально в разы быстрее, чем на Нвидишных камнях за те же деньги.
Go to the top of the page
 
+Quote Post
Hale
сообщение Mar 2 2017, 23:50
Сообщение #26


Знающий
****

Группа: Свой
Сообщений: 735
Регистрация: 11-10-11
Пользователь №: 67 667



совершенно точно.
Go to the top of the page
 
+Quote Post

2 страниц V  < 1 2
Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 


RSS Текстовая версия Сейчас: 19th June 2025 - 07:05
Рейтинг@Mail.ru


Страница сгенерированна за 0.01457 секунд с 7
ELECTRONIX ©2004-2016