Оптимальный базис для DLPNO-CCSD(T)

вопросы строения молекул и квантовой химии
Ответить
Uncle4enni
Сообщения: 27
Зарегистрирован: Ср авг 31, 2016 6:04 pm

Оптимальный базис для DLPNO-CCSD(T)

Сообщение Uncle4enni » Ср июл 30, 2025 5:28 pm

Я не совсем в теме, подскажите пожалуйста какое семейство базисных наборов лучще взять для расчетов енергии методом DLPNO-CCSD(T) (возможно для апроксимации к CBS)
Пока смотрю на классические базисы семейства CC, но так же посматриваю на семейства def2.
Что посоветуете для расчетов по схеме DLPNO-CCSD(T)/CBS-???//B3LYP-(BJ)/def2-TZVP ?

Аватара пользователя
amge
Сообщения: 2046
Зарегистрирован: Вт июл 31, 2007 11:42 am

Re: Оптимальный базис для DLPNO-CCSD(T)

Сообщение amge » Вт авг 05, 2025 1:29 pm

В орке для CBS (ключевое слово Extrapolate) по умолчанию используется семейство базисов cc-pVnZ. Возможно, это и неплохой вариант, раз умолчаемый. Но не факт.

alex7851
Сообщения: 116
Зарегистрирован: Сб сен 04, 2010 11:22 pm

Re: Оптимальный базис для DLPNO-CCSD(T)

Сообщение alex7851 » Ср авг 06, 2025 10:24 pm

1) Экстраполяцию к CBS стоит делать всегда, т.к. корреляционные методы сходятся медленно и базис TZ-качества имеет существенную ошибку (в отличие от DFT, где TZ уже можно считать сошедшимся, а QZ - перебором).
2) DZ-базисы не стоит использовать вообще, в т.ч. (за неимением лучших вариантов) для CBS(2/3). То есть CBS(3/4) - первый разумный и, зачастую, единственный реализуемый вариант. Исключения могут быть для core-valence корреляции или для методов старше CCSD(T) (CCSDT(Q)...), но для последнего нет DLPNO-вариантов.
3) Насчет типа базисного набора. Это вопрос сложнее и спорнее. Если говорить строго, то именно cc-pVnZ разрабатывались для этих целей. Обычно считается, что aug-cc-pVnZ будет еще лучше для CBS вне зависимости от того, нужна ли аугментация в связи с наличием анионов или слабых взаимодействий. aug-cc-pVnZ реально дороже и есть еще полумера - "календарные" базисные наборы типа jul-, jun-, may-cc-pVnZ которые в целом поддерживают философию correlation-consistent, но я не встречал для них специально оптимизированных экспонент для экстраполяции или тестов (честно говоря, и не видел, чтобы их экстраполировали, хотя теор. запрета не должно быть).
Базисы Попла использовать не надо никогда.
Базисы типа def2- (по возможности берите def2-TZVPP и def2-QZVPP тогда) в принципе можно использовать. Строгие бенчмарки (например для спин-кроссовера как сложной задачи), которые я видел, говорят о том, что результаты будут чуть хуже cc-pVnZ, но для обычных целей (если вы не делаете сами строгий бенчмарк в JCTC), в целом, приемлемые. По моему опыту, этот вариант значительно легковеснее, отчасти за счет формально меньшего числа базисных функций, отчасти - за счет наличия оптимизированных вспомогательных базисов /J /JK /C типа.
Это обычные варианты, есть еще pc-, ano-...
4) Учтите, что последние версии орки включают по умолчанию корреляцию 3s3p-электронов для первого переходного ряда, поэтому для таких систем по хорошему нужен подобающий базис типа cc-pwCVnZ. def2 для этой цели не оптимизировались.
5) Насчет как экстраполировать, вариантов несколько, я экстраполирую отдельно SCF и отдельно корреляционную части с помощью экспонент, взятых из литературы, например, из [10.1021/ct100396y]. Корр. часть спадает пропорционально X^-b, где X - кардинальное число базисного набора, а b в теории равно 3 (и это так для очень больших X), но для малых X = 2, 3, 4 гораздо лучше работают специально оптимизированные b. Опять же, насколько я помню, если использовать автоматическую процедуру орки, она возьмет экспоненты из статьи выше (неудивительно, т.к. это статья автора орки) соответствующие типа базиса, но если у вас какой-то свой особый случай, нужно проследить что конкретно орка сделает и по какой формуле.

Uncle4enni
Сообщения: 27
Зарегистрирован: Ср авг 31, 2016 6:04 pm

Re: Оптимальный базис для DLPNO-CCSD(T)

Сообщение Uncle4enni » Пт авг 08, 2025 6:22 am

На моем железе, для интересующих систем (элементы 2 периода) получается.
Закрытая система DLPNO-CCSD(T1)/ def2-QZVPP около суток
Закрытая система DLPNO-CCSD(T1)/ CBS(2,3-def2) около 2 часов, энергия ниже чем с QZ
Закрытая система DLPNO-CCSD(T1)/ CBS(3,4-def2) около суток , но самая низкая энергия.
Все эти вариатны по времени еще приемлемы.
Для открытых систем расчет увеличивается более чем в 5-8 раз и реально подъемным становится только DLPNO-CCSD(T1) CBS (2,3-def2) в течении 1-2 дней, сколько времени уйдет на CBS(3,4-def2) даже боюсь представить.
Повезло, что сами по себе интересующие реакции можно отнести к гомодесмическим или даже супергомодесмическим реакциям, поэтому b3lyp (bj)/def2-TZVP отличается от DLPNO-CCSD(T1) CBS(2,3-def2) не более чем на 0.5 ккал.
Может быть стараться в CBS(3,4-def2) смысла нет?

alex7851
Сообщения: 116
Зарегистрирован: Сб сен 04, 2010 11:22 pm

Re: Оптимальный базис для DLPNO-CCSD(T)

Сообщение alex7851 » Пт авг 08, 2025 9:33 am

Если говорить с практической стороны, то можно ожидать критики от рецензента насчет CBS(2/3), от которой придется как-то отбиваться. Вопрос еще в том, сколько у вас систем в одной статье: есть разница, нужно считать 2-3 системы 5-8 суток или 30-40 по 5-8 суток. Что можно сделать:
1) Можно CCSD и (T) компоненты экстраполировать отдельно, первую как CBS(3/4), вторую как CBS(2/3), это будет лучше чем все как CBS(2/3). Т.к. чем выше усечение coupled-cluster оператора, тем быстрее сходимость по базису.
2) Можно упереться и сделать честные CBS(3/4) для одной реакции с наименьшими системами и сравнить CBS(2/3) с ней, посмотреть на ошибку. Если честные CBS(3/4) все еще напряжны, можно взять несуществующие в реальности аналогичные упрощенные системы (фенил заменить на метил и так далее) и сделать такой тест на них.
3) Еще иногда все считают в DLPNO-CCSD(T0) и добавляют коррекцию относительно T1. Например,
DLPNO-CCSD(T1)/CBS(3/4) ~= DLPNO-CCSD(T0)/CBS(3/4) + [ DLPNO-CCSD(T1)/CBS(2/3) - DLPNO-CCSD(T0)/CBS(2/3) ]
4) Немного напрягает, что расчет для открытых увеличивается в 5-8 раз - на моей практике это обычно 3-4 раза. Хотя может это и особенность систем. Если в целом говорить,бутылочным горлышком может являться память, а также запись-чтение с диска (если железо ваше, можете подумать о переходе на SSD или параллельный RAID). Еще DLPNO-CCSD(T) плохо масштабируется где-то после 8 ядер, поэтому если у вас серверный проц с 40 ядрами, скорее всего, уменьшить их до 20 и увеличить память на ядро в 2 раза даст выигрыш. К сожалению, плохо масштабируется CCSD, а (T) масштабируется почти линейно, но нельзя указать разное число ядер для этих двух компонент.

Uncle4enni
Сообщения: 27
Зарегистрирован: Ср авг 31, 2016 6:04 pm

Re: Оптимальный базис для DLPNO-CCSD(T)

Сообщение Uncle4enni » Пт авг 08, 2025 12:51 pm

Судя по всему на открытой оболочке основное время съедает (T1) коррекция. У меня выходт так, что по времени DLPNO-CCSD(T1)/CBS(2,3-def2) по времени лишь в два раза быстрее чем DLPNO-CCSD(T0)/CBS(3,4-СС).
Т.е. для Т0 на cc-pVQZ [Total Time for computing (T) ... 25513.437 sec]
и Т1 на def2-TZVP [Total Time for computing (T) ... 26696.500 sec]
Получается если отказаться от Т1 коррекции в пользу Т0, то можно и потянуть CBS(3,4)

Ответить

Вернуться в «квантовая химия и моделирование»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей