Какие САПР СВЧ поддерживают рассчеты на игровых картах? - Форум разработчиков электроники ELECTRONIX.ru

Какие САПР СВЧ поддерживают рассчеты на игровых картах?

ikolmakov Просмотр профиля	Feb 23 2017, 21:17 Сообщение #1
Местный Группа: Свой Сообщений: 353 Регистрация: 29-05-06 Из: С.-Петербург Пользователь №: 17 541	Притащили мне ASUS GeForce GTX 1080 с целью ускорить расчеты :-) Но я посмотрел по основным программам (MWO, HFSS, FEKO...) и увидел только разговор про Tesla. А CUDA на простых картах кто-то поддерживает?

Ответов

Hale Просмотр профиля	Mar 1 2017, 00:45 Сообщение #2
Знающий Группа: Свой Сообщений: 735 Регистрация: 11-10-11 Пользователь №: 67 667	Цитата CERN для своих серверов выбирают AMD потому что 1)цели другие. Как серверы они очень даже неплохие. Но для расчетов, особенно на FPU - полный провал в производительности. 2)Дешевле 3) Лобби. Есть еще одно соображение. У AMD FPU размазывает (нойз-шейпинг типа) ошибку FSIN, немножко уравнивая ее по диапазонам значений. Intel делает более грубые округления при деноминации больших аргументов, что приводит к более грубым "ступенькам" дисбалансам на графике ошибок. http://notabs.org/fpuaccuracy/scatterplots/scatterplots.htm Для ученых CERN это может быть существенно, например, чтобы не видеть нелинейные фракталы в спектрах там где их нет. Для нас, электромагнитных инженеров, это несущественно. Гораздо существенней скорость переваривания больших массивов данных. Цитата Спорный вопрос. Чего там спорного. 1 FPU на два ядра, да и тот тормозной. Плюс проблемы с переходами между C-состояниями питания ядер. Третий в мире по производительности сервер тоже на AMD Это все брехня. Это как китайцы сделали второй в мире суперкомпьютер по производительности, который складывать и умножать массивы по немкольку мегабайт может. Но если сложить все RISC ядра, то очень быстро. Мораль: девять баб за месяц ребенка не родят. Большинство солверов до сих пор упирается в производительность однопоточных процедур. Может что-то что ученые ЦЕРНА пишут и параллелится лучше, но они это еще не продают в форме продкта. Кроме того, еще раз, x86 архитектура на научных суперкомпьютерах не используется. Не пользуется популярностью и SMT распараллеливание. Все эти x86/x64 бегемоты - чисто утилитарные датацентры. Интересный пакет. Впервые слышу спасибо. я с ними пообщался. Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты. - Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно. - Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках. - До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку. Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант. OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше. Сообщение отредактировал Hale - Mar 1 2017, 00:53

PCBtech Просмотр профиля	Mar 1 2017, 12:38 Сообщение #3
Профессионал Группа: Свой Сообщений: 1 092 Регистрация: 22-12-04 Из: Москва Пользователь №: 1 623	Цитата(Hale @ Mar 1 2017, 03:45) Интересный пакет. Впервые слышу спасибо. я с ними пообщался. Пустышка. Изначально ущербный солвер потому что разработчики - не физики, а ленивые программисты. - Они свято верят, например, что гиротропия и нелинейность в FDTD не считается. Хотя у меня знакомый еще аспирантом прекрасно решал НУШ с комплексными значениями через FDTD для распространения волн, в матлабе конечно. - Методу уже лет 90, они до сих пор не намерены реализовывать неоднородный меш и упрощение в протяженныз однородных участках. - До сих пор тупой кубический меш, никакого намека на аккуратную тетраэдральную разбивку. Так что ничего интересного не ждите. Просто умелые программеры хорошо оптимизировали чей-то простейший алгоритм. Получилось "из пушки по воробьям". Тупиковый вариант. OpenEMS предлагает это бесплатно, с намного меньшей производительностью и большими усилиями конечно. Но совершенно бесплатно. И даже где-то лучше. Речь про разработчиков Empire XPU, правильно? Интересно, как Вы ловко их смешали с грязью. "Ущербный солвер", "ленивые программисты", "тупой кубический меш", "из пушки по воробьям", "тупиковый вариант". "OpenEMS совершенно бесплатно... и даже где-то лучше". Ууххх... Я понимаю, что это форум, свободное общение, но может, будем как-то более аргументированно выступать? По существу дела: я лично знаю людей, которые использовали для своих СВЧ-расчетов CST, а потом перешли на Empire XPU - банально именно из-за существенно более высокой скорости вычислений, при той же точности. И им не нужны никакие нелинейности, неоднородный меш, упрощение в протяженных однородных участках, тетраэдральная разбивка и прочие вкусности и красивости. Зачем, если и без этого алгоритм "молотит" со страшной скоростью на всех ядрах и кешах Интеловского процессора, и задействует всю доступную память компьютера очень эффективно? Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать. Я еще раз повторю - Empire XPU интересен тем людям, кому нужна высокая скорость вычислений и хорошая точность. Кстати, те мои знакомые хотят сейчас попробовать мульти-процессорную лицензию, говорят, что в версии Empire 7.5 начиная от 3х серверов якобы получается еще более существенное ускорение для больших объектов и систем. Другие коллеги недавно пробовали Empire на планарных объектах и расчете антенн, тоже мне говорили, что поражены скоростью моделирования (на обычном компьютере без ускорителей). Ну и вообще - чем обзывать людей, лучше бы попробовали систему на практике и дали бы свои практические впечатления, на конкретных примерах. Нет ничего проще - вот ссылка для запроса демки на месяц: http://www.empire.de/page45.html&sid=a...8a71b7f2807cd4f Да, и там есть импорт из других САПР и из ODB++, так что можно посравнивать на конкретике. -------------------- На правах рекламы: Для тех, кому нужна современная профессиональная и недорогая САПР печатных плат, взамен P-CAD! Продлена промо-акция: 19.9 тысяч рублей за годовую сетевую лицензию OrCAD Standard! В лицензию входит схемный редактор OrCAD Capture, базовый редактор печатных плат на базе Allegro PCB Editor, с возможностью работы с дифференциальными парами со статическим контролем фазы, редактор правил и ограничений, 3D-просмотр со STEP-моделями, расчет импеданса, работа с микроотверстиями, и импорт-экспорт производственных файлов. Прилагается импорт проектов из P-CAD2006. Все, что нужно для трассировки типовых многослойных плат - всего за 19.9 тыс.рублей в год! Подробности: https://www.pcbsoft.ru/orcad-za-19900

Hale Просмотр профиля	Mar 2 2017, 04:45 Сообщение #4
Знающий Группа: Свой Сообщений: 735 Регистрация: 11-10-11 Пользователь №: 67 667	Цитата(PCBtech @ Mar 1 2017, 15:38) И им не нужны никакие нелинейности, н А комплексно-анизотропный тензор проницаемости нужен. И я считают это позором инженерного программирования, что спустя 90 лет после первого описания метода, и 60 лет после работ Сула и Волкера до сих пор ферриты можно посчтать только в FEM (HFSS) или "на бумажке" (в Матлабе). От бесконечных заявок на конференциях и выставках FDTD меня честно уже тошнит. Как дети малые. "Мы не будем делать сложные вещи, мы лучше сделаем то что все на 3 курсе проходят чуть быстрее и зарядим цену как за полноценный продукт".И все хотят за это бабло. Квадратное уравнение решить - давайте бабло. Да, это ловкие умелые, но все те же coding monkey. Из их ответа я точно, на 145% понял, что эти ребята не заинетресованы в улучшении функциональности софта и даже не предлагают "подождать", или инвестировать в будущее. Им просто по фигу - "мы быстрее всех", боьше ничего не надо. На вопрос, а сколько задачка будет занимать в памяти.... аой а 5 гигабайт без оверхеда.. Дааа?? И очень быстро вы 5 гигабайт будете перекладывать? Если задача не решается до обеденого преерыва, то честно говоря пофигу, решится она завтра, или послезавтра. Есть полно может и не такого быстрого, но более перспективного софта. Есть даже бесплатный софт с аналогичными возможностями. Цитата сейчас попробовать мульти-процессорную лицензию я от этого особенно фигею. Довольно ординарный софт, единственная фича которого - скорость вычислений, поставляется без мультипроцессорного пакета лицензий по умолчанию. Цитата Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать. тетраэдральный меш хорош тем, что он в разы, на порядки экономичнее кубического, при обводке непрямоугольных контуров, и по той же причине выдает большую точность. Он же позволяет аккуратно ввести неоднородную плотность узлов, для еще большего сокращения работы. Слабость ортогонального сеточного меша FDTD в том что он не может быть физически применим к сколько-нибудь объемным задачам, а следовательно и ограничен в диапазоне частот, т.к. при приближении к оптике - ни один суперкомпьютер не способен всосать в себя эти данные и тем более перкладывать из домена в домен при разбиении. Удел FDTD - плоские узкие полоски при прогоне дискретных элементов. Чуть расширить, или углубить задачу, и 80% времени тратится на пустопорожние вычисления там, где ничего нет и быть не может. Цитата(iiv @ Mar 1 2017, 23:10) Чтобы считаться на ГПУ, надо, чтобы данные сидели там, но и надо, чтоб большая часть алгоритма тоже там крутилась Совершенно точно. А поскольку обхъемы задач выходят далеко за 3 Гб, пересылка по PCIe - приводит только к замедлению. Кроме того полноволновые методы вообще хрен решишь. Господа, вы в курсе, что четырехядерный i7 4ГГц на задачках около 8-12 Гб в HFSS(FEM) частенько обгоняет 8x2 процессорный Xeon 3.4ГГц. А знаете почему? А из-за того что часть данных, часто попадает в область ответственности CPU1, в результате чего CPU0 вынужден лезть без срезаний пути через оба внутрипроцессорных кольца и QPI. Ну и гораздо меньшая латентность безрегистровой памяти (в принципе, на GPU верхнего диапазона она еще быстрее, но ее хронически мало) Цитата И часто происходит так, что софтвер с кудой есть, но поддерживает только 1-2 карты/чипа, ибо на остальных ГПУ он как черепашка ниньзя - вроде и ГПУ, но и ползает как оно самое. тут дело не в ГПУ, а в маркетинге. Как я сказал, Невидь из-за игроманов прячет свои спеки и хрен поймешь, где Даблпресижн вычислительных блоков больше, в GTX 780, или в 970. Ну, пока не начнешь писать свой код, там все станет ясно. По хорошему, для вычислений в куда (именно с приростом производительности) годятся только карты x70Ti, x80, x90/Titan и их одночиповые аналоги Quadro/Tesla. При этом у GTX клоки раза в два выше. Цитата(Pir0texnik @ Mar 2 2017, 03:02) Кстати, так а КУДА разве не для того, что бы не сильно зависеть от аппаратной конфигурации?.. ага. толко у нее там 12 разных версий, не с полной совместимстью. Куда жила, а процессорные архитектуры менялись. Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД Сообщение отредактировал Hale - Mar 2 2017, 06:41

iiv Просмотр профиля	Mar 2 2017, 16:02 Сообщение #5
вопрошающий Группа: Свой Сообщений: 1 726 Регистрация: 24-01-11 Пользователь №: 62 436	Цитата(Hale @ Mar 2 2017, 09:45) Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД я бы конкретизировал так: если к тебе, как специалисту по куде пришел заказчик с просьбой перетащить его софт на куду и ускорить, или то же самое с АМДшником, то при прочих равных я закладываю примерно в 3 больше времени на разработку софта для АМДшника, чем на КУДУ. В то же время, если у тебя есть четкий и понятный алгоритм для распараллеливания, и есть бюджет, из которого будет оплачиваться железо и свое время в виде зарплаты самому себе, то почти всегда в выигрыше АМДшник, так как у АМДшника есть достаточно удобные и успешные модели карт, на которых все будет работать, и реально в разы быстрее, чем на Нвидишных камнях за те же деньги.

Сообщений в этой теме

ikolmakov Какие САПР СВЧ поддерживают рассчеты на игровых картах? Feb 23 2017, 21:17

Hale архитектура Tesla=Cuda ATI=OpenCL в графических к... Feb 24 2017, 00:10

PCBtech Цитата(ikolmakov @ Feb 24 2017, 00:17) Пр... Feb 25 2017, 20:13

Grizzzly Цитата(PCBtech @ Feb 25 2017, 23:13) Можн... Feb 27 2017, 17:16

Pir0texnik Цитата(Grizzzly @ Feb 27 2017, 20:16) Пол... Feb 27 2017, 23:46

Hale Цитата(Grizzzly @ Feb 27 2017, 20:16) Пок... Feb 28 2017, 02:22

Grizzzly Цитата(Hale @ Feb 28 2017, 05:22) И нет н... Feb 28 2017, 08:17

PCBtech Цитата(Grizzzly @ Feb 27 2017, 20:16) Инт... Feb 28 2017, 09:26

Grizzzly Цитата(PCBtech @ Feb 28 2017, 12:26) Вот ... Feb 28 2017, 09:29

khach Хакать надо NVIDIa карты для для использования и... Feb 26 2017, 00:54

Hale Цитата(khach @ Feb 26 2017, 04:54) Хакать... Feb 27 2017, 00:00

Pir0texnik Так собственно вопрос, который всех волнует: кому-... Feb 27 2017, 02:21

Hale Цитата(Pir0texnik @ Feb 27 2017, 05:21) Т... Feb 27 2017, 07:53

Pir0texnik Цитата(Hale @ Feb 27 2017, 10:53) Я еще н... Feb 27 2017, 08:38

Hale Цитата(Pir0texnik @ Feb 27 2017, 11:38) А... Feb 28 2017, 00:59

DmitryHF CUDA поддерживает Savant. Метод расчета - трассиро... Feb 27 2017, 06:45

ikolmakov Да.. Жалко что по делу почти никто так и не высказ... Feb 27 2017, 20:31

Pir0texnik Тогда я не понимаю почему CST пишет именно, что ем... Feb 28 2017, 07:00

Hale ЦитатаCERN для своих серверов выбирают AMD потому ... Mar 1 2017, 00:45

Grizzzly Цитата(Hale @ Mar 1 2017, 03:45) Огромно... Mar 1 2017, 09:33

PCBtech Цитата(Hale @ Mar 1 2017, 03:45) Интересн... Mar 1 2017, 12:38

Hale Цитата(PCBtech @ Mar 1 2017, 15:38) И им ... Mar 2 2017, 04:45

iiv Цитата(Hale @ Mar 2 2017, 09:45) Ну, по к... Mar 2 2017, 16:02

iiv Ну йопэрэсэтэ, вы сами-то хоть раз (хоть кто-то из... Mar 1 2017, 20:10

Pir0texnik Анекдот вспомнил про "... ты так слона не про... Mar 2 2017, 00:02

Hale совершенно точно. Mar 2 2017, 23:50

« Предыдущая тема · Rf & Microwave Design · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0