Цитата(PCBtech @ Mar 1 2017, 15:38)

И им не нужны никакие нелинейности, н
А комплексно-анизотропный тензор проницаемости нужен. И я считают это позором инженерного программирования, что спустя 90 лет после первого описания метода, и 60 лет после работ Сула и Волкера до сих пор ферриты можно посчтать только в FEM (HFSS) или "на бумажке" (в Матлабе).
От бесконечных заявок на конференциях и выставках FDTD меня честно уже тошнит. Как дети малые. "Мы не будем делать сложные вещи, мы лучше сделаем то что все на 3 курсе проходят чуть быстрее и зарядим цену как за полноценный продукт".И все хотят за это бабло. Квадратное уравнение решить - давайте бабло.
Да, это ловкие умелые, но все те же coding monkey.
Из их ответа я точно, на 145% понял, что эти ребята не заинетресованы в улучшении функциональности софта и даже не предлагают "подождать", или инвестировать в будущее. Им просто по фигу - "мы быстрее всех", боьше ничего не надо.
На вопрос, а сколько задачка будет занимать в памяти.... аой а 5 гигабайт без оверхеда.. Дааа?? И очень быстро вы 5 гигабайт будете перекладывать? Если задача не решается до обеденого преерыва, то честно говоря пофигу, решится она завтра, или послезавтра. Есть полно может и не такого быстрого, но более перспективного софта. Есть даже бесплатный софт с аналогичными возможностями.
Цитата
сейчас попробовать мульти-процессорную лицензию
я от этого особенно фигею. Довольно ординарный софт, единственная фича которого - скорость вычислений, поставляется без мультипроцессорного пакета лицензий по умолчанию.
Цитата
Вы попробуйте-ка ваш тетраэдральный меш на графическом ускорителе применить для большой СВЧ-системы. Застрелитесь, пока он будет из памяти в кеш и обратно данные переливать.
тетраэдральный меш хорош тем, что он в разы, на порядки экономичнее кубического, при обводке непрямоугольных контуров, и по той же причине выдает большую точность. Он же позволяет аккуратно ввести неоднородную плотность узлов, для еще большего сокращения работы.
Слабость ортогонального сеточного меша FDTD в том что он не может быть физически применим к сколько-нибудь объемным задачам, а следовательно и ограничен в диапазоне частот, т.к. при приближении к оптике - ни один суперкомпьютер не способен всосать в себя эти данные и тем более перкладывать из домена в домен при разбиении. Удел FDTD - плоские узкие полоски при прогоне дискретных элементов. Чуть расширить, или углубить задачу, и 80% времени тратится на пустопорожние вычисления там, где ничего нет и быть не может.
Цитата(iiv @ Mar 1 2017, 23:10)

Чтобы считаться на ГПУ, надо, чтобы данные сидели там, но и надо, чтоб большая часть алгоритма тоже там крутилась
Совершенно точно. А поскольку обхъемы задач выходят далеко за 3 Гб, пересылка по PCIe - приводит только к замедлению. Кроме того полноволновые методы вообще хрен решишь.
Господа, вы в курсе, что четырехядерный i7 4ГГц на задачках около 8-12 Гб в HFSS(FEM) частенько обгоняет 8x2 процессорный Xeon 3.4ГГц.
А знаете почему? А из-за того что часть данных, часто попадает в область ответственности CPU1, в результате чего CPU0 вынужден лезть без срезаний пути через оба внутрипроцессорных кольца и QPI. Ну и гораздо меньшая латентность безрегистровой памяти (в принципе, на GPU верхнего диапазона она еще быстрее, но ее хронически мало)
Цитата
И часто происходит так, что софтвер с кудой есть, но поддерживает только 1-2 карты/чипа, ибо на остальных ГПУ он как черепашка ниньзя - вроде и ГПУ, но и ползает как оно самое.
тут дело не в ГПУ, а в маркетинге. Как я сказал, Невидь из-за игроманов прячет свои спеки и хрен поймешь, где Даблпресижн вычислительных блоков больше, в GTX 780, или в 970. Ну, пока не начнешь писать свой код, там все станет ясно.
По хорошему, для вычислений в куда (именно с приростом производительности) годятся только карты x70Ti, x80, x90/Titan и их одночиповые аналоги Quadro/Tesla. При этом у GTX клоки раза в два выше.
Цитата(Pir0texnik @ Mar 2 2017, 03:02)

Кстати, так а КУДА разве не для того, что бы не сильно зависеть от аппаратной конфигурации?..
ага. толко у нее там 12 разных версий, не с полной совместимстью. Куда жила, а процессорные архитектуры менялись. Ну, по крайней мере кто на ней пишут, говорят что намного проще пишется чем под АМД