Dmitry Leonov (leonov) wrote,
Dmitry Leonov
leonov

шайтан-код

Исторически сложилось, что наш комплекс моделирования состоит из двух основных кусков - расчетный модуль, ядро которого восходит ко временам СМок, и относительно свежее междумордие со всякими рюшками и свистелками. Схемы крупные, время обсчета приличного трансгаза могло измеряться минутами даже на свежих процессорах, ну а до полного перетряхивания под современную архитектуру руки, разумеется, не доходили.

И все ж в какой-то момент решили поиграть с явным узким местом в виде решения героической СЛАУ, которое ну явно должно хорошо параллелиться (привет Гауссу, хоть и не по той причине, что сейчас у всех на слуху). Прицелились на ACML, где все по-взрослому, highly-tuned BLAS kernels, higher performance than standard LAPACK implementations, оптимизация под SSE2/SSE3 и т.п. Думали - будет выигрыш в десятки процентов, тогда ну его нафиг, будет в пару-тройку раз - отлично, берем.

Получили выигрыш в 30-40 раз.

Но это еще не конец, и весь рассказ вовсе не о крутизне АМДшной библиотеки. Допереварю сегодняшние результаты и продолжу.
Subscribe

  • яблочнопереключальное

    Продолжая обживаться на маке, не перестаю удивляться либо отсутствию, либо совершенно альтернативной логике реализации самых элементарных и привычных…

  • яблочноденежное

    Странное какое-то ценообразование на Маках. Один и тот же Elmedia Player в AppStore за PRO-версию хочет 1150 рублей, и ставить потом можно на все…

  • ГПБ vs TV

    Газпромбанк на днях обновил своё приложение, после чего словил кучу единиц в AppStore и Google Play за попытку принудить к удалению TV, поскольку «с…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 0 comments