Сравниваем персональные компьютеры (ORCA version)
Re: Сравниваем персональные компьютеры (ORCA version)
Orca 5.0.4, OpenMPI 4.1.2, AMD Ryzen Threadripper PRO 5975WX, 512Gb, SSD, nprocs=32 -- 3:52.239
Когда начинает изменять память, практики заводят записную книжку, а романтики садятся писать мемуары.
Re: Сравниваем персональные компьютеры (ORCA version)
Привет. Я ни разу не химик. Но принёс вот вам результат "бенчмарка"
ORCA 5.0.4, openmpi 4.1.2.
2*XEON E5-2680 v4 (14x2.4 GHz)
nprocs 28: 0:09:10
ORCA 5.0.4, openmpi 4.1.2.
2*XEON E5-2680 v4 (14x2.4 GHz)
nprocs 28: 0:09:10
Код: Выделить всё
Timings for individual modules:
Sum of individual times ... 548.913 sec (= 9.149 min)
GTO integral calculation ... 2.251 sec (= 0.038 min) 0.4 %
SCF iterations ... 546.662 sec (= 9.111 min) 99.6 %
****ORCA TERMINATED NORMALLY****
TOTAL RUN TIME: 0 days 0 hours 9 minutes 10 seconds 381 msec
Re: Сравниваем персональные компьютеры (ORCA version)
Вышла ORCA 6, а значит, можно начинать тестировать ее.
ORCA 6.0.0 + OpenMPI 4.1.6
AMD Ryzen 9 7950X3D / nprocs 16 / 128 gb / RAID 0 из двух NVMe: 5:35
ORCA 5.0.4 + OpenMPI 4.1.1
AMD Ryzen 9 7950X3D / nprocs 16 / 128 gb / RAID 0 из двух NVMe: 5:59
ORCA 6.0.0 + OpenMPI 4.1.6
AMD Ryzen 9 7950X3D / nprocs 16 / 128 gb / RAID 0 из двух NVMe: 5:35
ORCA 5.0.4 + OpenMPI 4.1.1
AMD Ryzen 9 7950X3D / nprocs 16 / 128 gb / RAID 0 из двух NVMe: 5:59
Re: Сравниваем персональные компьютеры (ORCA version)
ORCA 6.0.0 + OpenMPI 4.1.6
Intel Core i9-13900 / nprocs 24 / 192 gb / RAID 0 из двух NVMe: 10:42
ORCA 5.0.4 + OpenMPI 4.1.1
Intel Core i9-13900 / nprocs 24 / 192 gb / RAID 0 из двух NVMe: 10:30
Intel Core i9-13900 / nprocs 24 / 192 gb / RAID 0 из двух NVMe: 10:42
ORCA 5.0.4 + OpenMPI 4.1.1
Intel Core i9-13900 / nprocs 24 / 192 gb / RAID 0 из двух NVMe: 10:30
Re: Сравниваем персональные компьютеры (ORCA version)
Похоже, ORCA 6 и ORCA 5 особой разницы нет.
Еще интересно. У меня на схожей конфигурации было
ORCA 5.0.3, Linux, openmpi-4.1.2, AMD Ryzen 9 5950X, 16x3400MHz/64 Gb DDR4/M.2 SSD 00:07:33
Т.е. заметно медленнее. И интересно, что повлияло. Наверное, не размер памяти и диски, т.к. этот тест полностью помещается и в 64 Gb. Думаю, что суффикс 3D у процессора, хотя, может быть, память быстрее.
Re: Сравниваем персональные компьютеры (ORCA version)
В соседней теме утверждалось, что
Интересно, что за звери такие. Я попросил проверить их на этом тесте, но пока ответа нет.Yellow21chem писал(а): ↑Вт июл 30, 2024 10:53 pmIntel i9 14970kf и i9 13970kf ... дают очень хороший прирост производительности по сравнению с используемым мною ранее процессорами AMD Ryzen 9 5950X.
-
endlesslake
- Сообщения: 209
- Зарегистрирован: Чт авг 09, 2012 9:13 pm
Re: Сравниваем персональные компьютеры (ORCA version)
интересно.
а nprocs 8 и прибить процессы к быстрым ядрам не пробовали?
Re: Сравниваем персональные компьютеры (ORCA version)
Конкретно на этом тесте - нет, но изрядно считал DLPNO-CCSD(T) на 8 (изредка 4 или 6) ядрах, и он всегда проигрывал Ryzen 9 7950X3D, даже с учетом большей памяти на ядро.endlesslake писал(а): ↑Ср авг 14, 2024 6:23 pmинтересно.
а nprocs 8 и прибить процессы к быстрым ядрам не пробовали?
Re: Сравниваем персональные компьютеры (ORCA version)
ORCA 5.0.4, Linux, openmpi-4.1.2, Intel i7-11700K 3.60GHz (8 Cores) 15:25
Чуть медленнее, чем у AMD Ryzen 9 5950 на 8 ядрах (14:00) и заметно медленнее, чем у AMD Ryzen 9 7950
Чуть медленнее, чем у AMD Ryzen 9 5950 на 8 ядрах (14:00) и заметно медленнее, чем у AMD Ryzen 9 7950
-
endlesslake
- Сообщения: 209
- Зарегистрирован: Чт авг 09, 2012 9:13 pm
Re: Сравниваем персональные компьютеры (ORCA version)
ORCA 6.0.1, Linux, openmpi-4.1.6, AMD Ryzen 9 9950X ~5.0 GHz (nprocs 16), 64Gb ECC DDR5 6000, SSD: 4:05
Re: Сравниваем персональные компьютеры (ORCA version)
Замечено, что 6-я орка побыстрее, чем 5-я, иногда значительно, особенно когда SCF плохо сходится. Предыдущие результаты в основном на 5-й. Поэтому тест на 6-й версии может оказаться некорректным. Для сравнения прогнал его на одном и том же компе с разными версиями орки.
ORCA 6.0.1, Linux, openmpi-4.1.2, AMD Ryzen 9 5950X, 16x3400MHz/64 Gb DDR4/M.2 SSD 00:06:58
Результаты близки. Можно считать, что в первом приближении данный тест годится для всех версий орки (от 4 до 6).
Re: Сравниваем персональные компьютеры (ORCA version)
не та тема
Не красота спасёт мир, а транквилизаторы.
Re: Сравниваем персональные компьютеры (ORCA version)
Коллеги, я тоже не особо квантовый химик, так, "примкнувший к ним Шепилов". Есть разные машины для расчётов, для начала "бытовая", 36 яде
ORCA 6.1.0, Open MPI repo revision: v4.1.2,
18 потоков: 13 мин 6 сек
12 потоков: 17 мин 58 сек
больше потоков не запускаются из-за глюков OpenMP (ORCA почему-то использует только половину доступных).
Рабочая машина на кластере
ORCA 6.1.0, openmpi5/5.0.7
16 потоков: 10 minutes 28 seconds
18 потоков: 9 minutes 34 seconds
24 потока: 7 minutes 48 seconds
32 потока: 6 minutes 43 seconds
Всё вышеперечисленное запускалось напрямую, без mpirun, так как система вроде небольшая.
Код: Выделить всё
$ head /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 63
model name : Intel(R) Xeon(R) CPU E5-2696 v3 @ 2.30GHz
stepping : 2
microcode : 0x49
cpu MHz : 2793.510
cache size : 46080 KB18 потоков: 13 мин 6 сек
12 потоков: 17 мин 58 сек
больше потоков не запускаются из-за глюков OpenMP (ORCA почему-то использует только половину доступных).
Рабочая машина на кластере
Код: Выделить всё
processor : 0
vendor_id : AuthenticAMD
cpu family : 23
model : 49
model name : AMD EPYC 7452 32-Core Processor
stepping : 0
microcode : 0x830107c
cpu MHz : 2350.000
cache size : 512 KB
physical id : 0
16 потоков: 10 minutes 28 seconds
18 потоков: 9 minutes 34 seconds
24 потока: 7 minutes 48 seconds
32 потока: 6 minutes 43 seconds
Всё вышеперечисленное запускалось напрямую, без mpirun, так как система вроде небольшая.
Re: Сравниваем персональные компьютеры (ORCA version)
сообщение повторно отправилось
Re: Сравниваем персональные компьютеры (ORCA version)
что за любовь а эпикам? или вы спецом ядра ограничивали?
Не красота спасёт мир, а транквилизаторы.
Re: Сравниваем персональные компьютеры (ORCA version)
Какие закупили в ЦКП, такими и пользуемся. Про ядра вопрос не понял, но видимо вы спрашиваете почему ставил меньше потоков чем возможно (там на машине 128 потоков). Можно, конечно, занять всё доступное, но во-первых лимит на планировщике Slurm есть и хочется запускать и другие задачи тоже. Во-вторых, прирост всё скромнее после 32 потоков, выигрыш будет минимальный или его нет.что за любовь а эпикам? или вы спецом ядра ограничивали?
Вот другая машина, Intel, вроде должна быть пободрее (и на практике в Q-Chem себя показывает куда лучше), но заметной разницы я не вижу.
Open MPI: 3.1.5 (NVidia HPC)
Код: Выделить всё
processor : 0
vendor_id : GenuineIntel
cpu family : 6
model : 106
model name : Intel(R) Xeon(R) Gold 6336Y CPU @ 2.40GHz
stepping : 6
microcode : 0xd0003e7
cpu MHz : 2400.000
cache size : 36864 KB
physical id : 0
Re: Сравниваем персональные компьютеры (ORCA version)
Не красота спасёт мир, а транквилизаторы.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей