Базисный набор U500

вопросы строения молекул и квантовой химии
Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Базисный набор U500

Сообщение Droog_Andrey » Чт дек 29, 2011 11:50 pm

Идея создать универсальный набор базисных функций назрела достаточно давно.

Дело в том, что с ростом атомного номера усложняется структура электронного облака, и если на каждый максимум каждой орбитали взять хотя бы по три гауссиана и добавить немного поляризационных функций, то для какого-нибудь золота такой набор легко перевалит за 500 функций (а для урана и того больше).

Число функций можно уменьшить, собирая гауссианы в "стопки" либо используя псевдопотенциалы, но это в любом случае снижает точность расчёта, сужает область применимости базиса и требует оптимизации базиса для каждого элемента в отдельности.

Можно, однако, пойти с другой стороны: задать достаточно густую сетку экспонент и просто присвоить каждому элементу какой-то диапазон гауссианов. Таким образом, в ходе оптимизации волновой функции гауссианы сами рассуются по орбиталям наиболее выгодным для данной системы образом, а одинаковость экспонент в разных атомах позволит сократить число арифметических операций при подсчёте интегралов. Именно так поступили авторы семейства базисных наборов UGBS, уже обсуждавшихся на этом форуме:
viewtopic.php?f=71&t=77611

Но можно пойти ещё дальше: давать каждому атому в точности один и тот же универсальный базисный набор. Разумеется, в этом случае некоторые функции (какие именно - зависит от задачи) будут слабо задействованы, но это не беда, т.к. функции с низкими коэффициентами можно включать в процедуру сходимости лишь на финальных итерациях. Одинаковость базисного набора даст больше возможностей оптимизации кода, позволит сравнивать между собой результаты расчётов для изоэлектронных структур с разными ядрами и т.д.

В предлагаемом базисном наборе U500 сетка экспонент задана просто степенями двойки с единичным шагом, что также в какой-то степени способствует ускорению расчёта. Вот эти диапазоны экспонент для базисных функций разной симметрии:

s: 227 ... 2-9
p: 226 ... 2-9
d: 217 ... 2-6
f: 212 ... 2-4
g: 24 ... 2-3
h: 21 ... 2-2

Получается базис 37s 36p 24d 17f 8g 4h ёмкостью 500 базисных функций, который обеспечивает высокую точность практически для всех задач. Вот он в формате Gaussian:
http://www.primefan.ru/stuff/chem/u500.txt

При необходимости его можно дополнить диффузным набором 4s 3p 2d 1f 1g 1h (всего 50 функций):
http://www.primefan.ru/stuff/chem/u500+.txt
Последний раз редактировалось Droog_Andrey Ср янв 25, 2012 4:08 am, всего редактировалось 6 раз.
2^74207281-1 is prime!

КВГ
Сообщения: 136
Зарегистрирован: Пт сен 07, 2007 4:24 pm

Re: Базисный набор U500

Сообщение КВГ » Вт янв 03, 2012 4:49 pm

Интересно! Но ведь это надо уговорить разработчиков переделать код? Тесты бы поглядеть на скорость счета.
А вообще, лично меня, с моими комплексами металлов 4-6 подгрупп, это очень интересует (базисы с псевдопотенциалами меня не устраивают, к сожалению)! Хорошо бы вам как-то продвинуться в практическом плане.
КВГ

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Вт янв 03, 2012 11:58 pm

Попробуйте поработать с таким базисом. Можно в явном виде в Гауссиан засунуть, можно в Гамесс. Уверяю Вас, ничего хорошего не выйдет. Гамесс (по моему опыту) скорее всего обругается на линейную зависимость базиса, придется с ней долго бороться (см. где-то на форуме), а потом окажется, что все ухищрения не помогают и базис надо "прореживать". Я уж молчу о том, во что превратится молекула H2O с базисом в 1500 функций.
А вообще, например, Д. Лайков придумал вполне систематическую систему генерации базисов, в т.ч. релятивистских -- базисы L семейства. Читаем в приаттаченной статье. Конечно, он не единственный, есть и другие системы. Но эта система реализована в Природе, ею вовсю пользуются.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

КВГ
Сообщения: 136
Зарегистрирован: Пт сен 07, 2007 4:24 pm

Re: Базисный набор U500

Сообщение КВГ » Ср янв 04, 2012 2:06 pm

sanya1024 писал(а): Я уж молчу о том, во что превратится молекула H2O с базисом в 1500 функций.
Сорри, а во что она превратится? В C2H5OH может :) ?
sanya1024 писал(а): А вообще, например, Д. Лайков придумал вполне систематическую систему генерации базисов, в т.ч. релятивистских -- базисы L семейства. Читаем в приаттаченной статье. Конечно, он не единственный, есть и другие системы. Но эта система реализована в Природе, ею вовсю пользуются.
Спасибо за статью! наконец-то прочитаю, откуда взялись L-базисы.
Вам, Sanya1024, хорошо - вы в Линухе считаете, а я в винде. Вот если бы многоуважаемый Лайков услышал глухие стенания некоторых юзеров, недавно спустившихся с пальмы, и изладил версию Природы для параллельного счета под виндой (точнее, под Server 2008, но это, насколько я понимаю, не существенно)... Мне много не надо - достаточно распараллеленной версии для одной ноды.
С прошедшим Новым Годом!
КВГ

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Ср янв 04, 2012 3:43 pm

КВГ писал(а): Сорри, а во что она превратится? В C2H5OH может :) ?
Э, такие фокусы нам не под силу :) это не к нам :)

Я хотела сказать, что если уж брать задачу на 1500 функций, то это должна быть какая-то интересная с практической точки зрения система: какой-нибудь здоровенный кластер, или хромофор, или хим. реакция какая-то. А просто посчитать молекулу воды, чтобы убедиться, что бОльшая часть экспонент даст нулевые вклады -- кому оно надо? один раз сделали, убедились в том, что и так ясно, и дальше пошли. А реально интересная система в таком базисе раздуется до полной невозможности.
КВГ писал(а):Спасибо за статью! наконец-то прочитаю, откуда взялись L-базисы.
Вам, Sanya1024, хорошо - вы в Линухе считаете, а я в винде. Вот если бы многоуважаемый Лайков услышал глухие стенания некоторых юзеров, недавно спустившихся с пальмы, и изладил версию Природы для параллельного счета под виндой (точнее, под Server 2008, но это, насколько я понимаю, не существенно)... Мне много не надо - достаточно распараллеленной версии для одной ноды.
Не, Диму просить бесполезно. Он редко делает, что его просят. Насчет параллельной виндовской версии мы его просили очень долго, но оказалось проще поставить линух. Постоянно под ним работать (офис, молекулярные вьюеры и прочее) -- нет уж, а наладить там все только для счета оказалось вполне под силу.
КВГ писал(а):С прошедшим Новым Годом!
Спасибо!
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

КВГ
Сообщения: 136
Зарегистрирован: Пт сен 07, 2007 4:24 pm

Re: Базисный набор U500

Сообщение КВГ » Чт янв 05, 2012 3:34 pm

sanya1024 писал(а): Не, Диму просить бесполезно. Он редко делает, что его просят. Насчет параллельной виндовской версии мы его просили очень долго, но оказалось проще поставить линух
Может подойти с другой стороны? Мол, природа не терпит пустоты или что природа должна эволюционировать, генерировать новые виды, классы, семейства и т.п. - в общем, Priroda должна быть, как минимум, не хуже матери-природы в этом отношении :wink: ...
КВГ

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Пт янв 06, 2012 7:00 am

Ну вообще-то этот базис не предназначен для анализа стандартных систем вроде молекулы воды. Он хорош для маленьких, но нестандартных систем.

Я ещё буду дорабатывать этот базис какое-то время, а потом напишу краткий обзор с конкретными примерами.
2^74207281-1 is prime!

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Пт янв 06, 2012 3:35 pm

Droog_Andrey писал(а):стандартных систем вроде молекулы воды
:)
А как насчет стандартной системы в виде комплекса с 4 органическими лигандами и тяжелым металлом внутри? :) Вполне себе стандартная система :) Или маленького такого комплекса в виде куска поверхности (~100 атомов) с адсорбатом (еще 50 атомов)? или фрагмента белка?

Мне кажется, что "маленькие, но нестандартные системы" ничем принципиально не отличаются от стандартных, кроме предоставляемых возможностей. Ядра и электроны -- те же самые, законы их взаимодействия тоже не поменялись. Зачем изобретать велосипед? Игра с базисами -- пустое дело, просто надо использовать подходящие методы, благо размер задачи позволяет почти все.
Если "нестандартность" частицы состоит в нетривиальной открытой оболочке -- используем CASSCF, идеально для этого пригодный. Если там существенный ван-дер-Ваальс -- используем MP4 или CCSD(T). Если релятивизм -- пробуем все возможные полноэлектронные релятивистские подходы. Что еще можно придумать совсем уж нестандартного? давайте примеры :) Самое сложное, пожалуй -- найти надежные эксп. данные, чтоб было с чем сверяться.
КВГ писал(а):Может подойти с другой стороны? Мол, природа не терпит пустоты или что природа должна эволюционировать, генерировать новые виды, классы, семейства и т.п. - в общем, Priroda должна быть, как минимум, не хуже матери-природы в этом отношении :wink: ...
Дима как раз пошел развивать Природу в сторону пригодности для больших биомолекул. Но направление выбрал своеобразное, некая "новая полуэмпирика", я писала об этом. Сам Дима сейчас считает что-то очень биологическое, на фейсбуке картинки выкладывает. А я бы предпочла приладить Природу к мол. динамике или Монте-Карло -- очень уж она для этого подходит.
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

Аватара пользователя
amge
Сообщения: 2021
Зарегистрирован: Вт июл 31, 2007 11:42 am

Re: Базисный набор U500

Сообщение amge » Пт янв 06, 2012 6:50 pm

Мне кажется, под маленькими, но нестандартными системами Droog_Andrey имеет в виду прежде всего простейшие соединения сверхтяжелых элементов. Например, исследовать химию элементов "островка стабильности". Поскольку про эти элементы ничего не известно, то создать для каждого из них свой базис, подогнанный под свойства если не соединений элемента, то хотя бы его атома, нет возможности, нужно использовать универсальный базис, заведомо подходящий для всего. Это, по видимому, топикстартер и предлагает. И разумеется, его базис не имеет никакого смысла использовать для обычной химии. Но для таких тяжелых элементов, как правильно заметила sanya1024, необходимо учитывать релятивизм.

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Сб янв 07, 2012 12:31 am

А.В. Зайцевский, чьи статьи я уже рекомендовала, давно и успешно этим занимается. Возможно, топикстартер придумает еще одну альтернативу -- тогда это интересно. Но для тяжелых элементов без релятивизма никуда, а пока о релятивизме речь еще не шла.
Кстати, видимо, все-таки один набор функций для всех атомов -- плохая идея именно потому, что "сами по себе" веса отдельных гауссиан под релятивизм не подстроятся, особенно если гамильтониан взят нерелятивистский (а зачем нам такой, если мы тяжелые атомы изучаем?). Для легких, средних и тяжелых атомов нужно подгонять базисы по отдельности (либо неким систематическим образом).
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Сб янв 07, 2012 7:54 am

sanya1024 писал(а)::)
А как насчет стандартной системы в виде комплекса с 4 органическими лигандами и тяжелым металлом внутри? :) Вполне себе стандартная система :) Или маленького такого комплекса в виде куска поверхности (~100 атомов) с адсорбатом (еще 50 атомов)? или фрагмента белка?

Мне кажется, что "маленькие, но нестандартные системы" ничем принципиально не отличаются от стандартных, кроме предоставляемых возможностей. Ядра и электроны -- те же самые, законы их взаимодействия тоже не поменялись. Зачем изобретать велосипед? Игра с базисами -- пустое дело, просто надо использовать подходящие методы, благо размер задачи позволяет почти все.
Если "нестандартность" частицы состоит в нетривиальной открытой оболочке -- используем CASSCF, идеально для этого пригодный. Если там существенный ван-дер-Ваальс -- используем MP4 или CCSD(T). Если релятивизм -- пробуем все возможные полноэлектронные релятивистские подходы. Что еще можно придумать совсем уж нестандартного? давайте примеры :) Самое сложное, пожалуй -- найти надежные эксп. данные, чтоб было с чем сверяться.
Многабукав не по теме.

Сказал же: будут вам примеры. Потерпите.

P.S. Чуть изменил состав базиса и отредактировал первое сообщение темы.
2^74207281-1 is prime!

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Пн янв 09, 2012 5:12 am

sanya1024 писал(а):Мне кажется, что "маленькие, но нестандартные системы" ничем принципиально не отличаются от стандартных
Это только кажется. В каком, например, базисе Вы бы считали сродство к электрону частицы PtH? Или всевозможные энергии ионизации атома кальция? Или длину связи в молекуле Sg2? Или энергию всевозможных водородоподобных ионов вплоть до U91+?

Увы, не так уж и мало задач, под которые стандартные базисы не подходят.
sanya1024 писал(а):А вообще, например, Д. Лайков придумал вполне систематическую систему генерации базисов
Там используется, по сути, аналогичная исходная сетка экспонент, только втрое более густая.
sanya1024 писал(а):во что превратится молекула H2O с базисом в 1500 функций
Фишка в том, что функции во всех атомах одинаковые, т.е., в общем-то, у нас в любой молекуле 500 функций. Только они дублируются в разных атомах. При должной оптимизации расчёт в универсальном базисе окажется быстрее для достаточно больших систем, которые Вы упоминали (фрагменты белка, громоздкая металлорганика и т.д.), так что за универсальными базисами будущее :-)
2^74207281-1 is prime!

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Пн янв 09, 2012 3:37 pm

Droog_Andrey писал(а):В каком, например, базисе Вы бы считали сродство к электрону частицы PtH?
Вот инпут для комплекса Ir Природой:

Код: Выделить всё

$system
 mem=512
 disk=8
 path=/scratch/sasha/
$end
$control
 task=optimize
 basis=basis4.in
 four=1
 print=bonds+charges-internals
$end
$molecule
 charge=0
 multip=1
 cartesian
 set=L2
77       0.004646740     -0.002714736     -0.006735323
6        0.853553930     -1.834338136      0.043974637
6        1.448540790     -2.208591796      1.288067057
6        2.063427240     -3.463478736      1.458707197
6        2.104919740     -4.373961246      0.411197947
6        1.526714930     -4.027468236     -0.817486763
6        0.915129560     -2.787005506     -0.993275843
6        1.389584450     -1.210377276      2.349172537
9        2.514764070     -3.733064316      2.415673247
1        2.582228050     -5.345362196      0.544835767
9        1.555017280     -4.736842766     -1.647677603
1        0.476659230     -2.545760846     -1.962285943
6        1.931359770     -1.348953826      3.638551047
6        1.818791210     -0.319891256      4.562929257
6        1.162379000      0.857477624      4.190451427
6        0.646587710      0.946044904      2.904964077
7        0.742846350     -0.052026496      2.003843227
1        2.446738580     -2.270195996      3.905058817
1        2.241979210     -0.428636956      5.562064077
1        1.055822280      1.696512104      4.876516067
1        0.134691440      1.844581194      2.561175557
6       -0.761088510     -0.190628796     -1.865798403
6       -2.071454570     -0.755216476     -1.943401433
6       -2.722598360     -0.929967066     -3.179288853
6       -2.099230480     -0.553325326     -4.361459183
6       -0.814005740      0.002917804     -4.308105923
6       -0.163682490      0.179990404     -3.087683613
6       -2.673516650     -1.146498116     -0.674448973
9       -3.723450910     -1.364390596     -3.220964753
1       -2.604751640     -0.689992076     -5.318053793
9       -0.315148280      0.301500774     -5.232886493
1        0.837291310      0.612919304     -3.079364853
6       -3.935034720     -1.744712726     -0.513423923
6       -4.397317680     -2.081501726      0.751083117
6       -3.587438000     -1.820567766      1.860962187
6       -2.349226000     -1.230386006      1.649115127
7       -1.896217970     -0.891194676      0.425525237
1       -4.545738260     -1.947815046     -1.391560423
1       -5.375489040     -2.547738786      0.873512817
1       -3.901399940     -2.074088506      2.872479847
1       -1.675792590     -1.014551896      2.478279737
8        1.676490760      0.975153534     -0.578354393
6        1.574084920      2.399317354     -0.634667053
8        2.671156940      3.199190124     -1.006958603
6        0.270050000      2.958799724     -0.299536143
6       -0.067383060      4.323014614     -0.315574553
6       -1.350908800      4.733870774      0.015902577
6       -2.303406460      3.769998974      0.361623097
6       -1.921287350      2.435699664      0.360403477
7       -0.674445750      2.028373614      0.049113087
1        0.686621300      5.056307354     -0.596810453
1       -1.611224340      5.792728744      0.000437237
1       -3.325815920      4.041027054      0.620918817
1       -2.627017190      1.644608994      0.612850547
$end
$optimize
 tolerance=1e-5
 steps=450
$end
$scf
 iterations=100
$end
$grid
 accuracy=1e-9
$end
 
Из выдачи: Dimension of wavefunction basis 1443 Dimension of auxiliary basis 3749 Hamiltonian: scalar-relativistic

Сама выдача в аттаче (считалась давно, на 8 ядрах). Тут проблема не в базисе, а в функционале. Если базис L2 не удовлетворяет, можно и L3 взять. На 32 ядрах -- реально посчитать.
Или всевозможные энергии ионизации атома кальция?
А тут не в базис надо играть, а в Full CI. Базис взять приличный, но без фанатизма. А для пущей точности -- релятивистский гамильтониан, потому что атом уже не самый легкий.
Или длину связи в молекуле Sg2? Или энергию всевозможных водородоподобных ионов вплоть до U91+?
А это к Зайцевскому. Но по-любому тут без релятивистского гамильтониана никуда.
Увы, не так уж и мало задач, под которые стандартные базисы не подходят.
Чаще оказывается, что собака зарыта скорее в использованном приближении (функционал, уровень учета корреляции), а базис далеко не на первом месте.

Короче, Ваши супер-базисы, видимо, сначала надо тестировать на чем-то очень маленьком и легком, но в Full CI, чтобы свести к минимуму ошибки от неучета корреляции. Потом делать то же самое для атомов потяжелее, но хотя бы со скалярно-релятивистским гамильтонианом, чтобы учесть и релятивизм, и корреляцию. Как-то так...
Там используется, по сути, аналогичная исходная сетка экспонент, только втрое более густая.
Только там не 500 функций на атом получается, как Вы видели. И не 500 функций на всю молекулу.
Фишка в том, что функции во всех атомах одинаковые, т.е., в общем-то, у нас в любой молекуле 500 функций. Только они дублируются в разных атомах. При должной оптимизации расчёт в универсальном базисе окажется быстрее для достаточно больших систем, которые Вы упоминали (фрагменты белка, громоздкая металлорганика и т.д.), так что за универсальными базисами будущее :-)
Примеры в студию! ждем-с :)
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Пн янв 09, 2012 8:28 pm

sanya1024 писал(а):
Droog_Andrey писал(а):В каком, например, базисе Вы бы считали сродство к электрону частицы PtH?
Вот инпут для комплекса Ir Природой
Причём здесь он?
sanya1024 писал(а):
Или всевозможные энергии ионизации атома кальция?
А тут не в базис надо играть, а в Full CI. Базис взять приличный, но без фанатизма.
CCSD(T,Full) здесь более чем достаточно. А базис - ну попробуйте разные и посмотрите, что получится :-)
sanya1024 писал(а):
Или длину связи в молекуле Sg2? Или энергию всевозможных водородоподобных ионов вплоть до U91+?
А это к Зайцевскому.
А зачем Зайцевский, если есть U500?

В общем, я предпочитаю универсальный базис, всё просто и понятно, а не метания по разным методам, базисам и частным случаям, результаты которых потом не будет смысла сравнивать между собой.
sanya1024 писал(а):Чаще оказывается, что собака зарыта скорее в использованном приближении (функционал, уровень учета корреляции), а базис далеко не на первом месте.
Это в более стандартных задачах.
sanya1024 писал(а):Короче, Ваши супер-базисы, видимо, сначала надо тестировать на чем-то очень маленьком и легком, но в Full CI, чтобы свести к минимуму ошибки от неучета корреляции. Потом делать то же самое для атомов потяжелее, но хотя бы со скалярно-релятивистским гамильтонианом, чтобы учесть и релятивизм, и корреляцию. Как-то так...
Примерно так этот базис и разрабатывался.
sanya1024 писал(а):Только там не 500 функций на атом получается, как Вы видели. И не 500 функций на всю молекулу.
Это уже в итоге. А для расчёта исходных функций использовался именно универсальный базис, аналогичный моему.
sanya1024 писал(а):Примеры в студию!
Примеры экономии времени, увы, не предоставлю, т.к. код Гауссиана не перепишу. Но алгоритмическая сложность здесь падает, и для достаточно больших систем уменьшение показателя степени перекроет увеличение константы.
2^74207281-1 is prime!

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Вт янв 10, 2012 1:25 am

Droog_Andrey писал(а):
sanya1024 писал(а):
Droog_Andrey писал(а):В каком, например, базисе Вы бы считали сродство к электрону частицы PtH?
Вот инпут для комплекса Ir Природой
Причём здесь он?
Pt 78, Ir 77, с вычислительной точки зрения никакой разницы. Но моя задачка явно покрупнее гидрида :) я просто привела пример молекулы с тяжелым атомом в базисе L2, чтобы было понятно, сколько там функций.
sanya1024 писал(а):
Или всевозможные энергии ионизации атома кальция?
А тут не в базис надо играть, а в Full CI. Базис взять приличный, но без фанатизма.
CCSD(T,Full) здесь более чем достаточно. А базис - ну попробуйте разные и посмотрите, что получится :-)
Вот что выдернулось из описания базиса ANO-RCC для Ca:

Код: Выделить всё

 ************************************************************************
 * Ca Calcium atom                                                      *
 * Relativistic Contraction based on CASSCF/CASPT2 using the            *
 * Douglas-Kroll Hamiltonian.                                           *
 * Active space 4s and 4p orbitals. 3p correlated in CASPT2             *
 * Basic primitive: 19s,14p - from  Knut Faegri                         *
 * Augmented: 1s with exponent 0.40x lowest exponent                    *
 *            2p with exponent 0.40x lowest exponent                    *
 *            6d three for 3p correlation and three for 4s              *
 *               CASPT2 optimized. The last of these was added          *
 *               after the atomic the contraction was made              *
 *            4f two for 3p and two for 4s exp. (4/3) times basic 3d    *
 *            2g with exponent 1.25 times f (added 081118)              *
 *                                                                      *
 *Note: the 3d 1,3,5 correlates the 3p, as does the first 4f.           *
 *                                                                      *
 * Contraction: State      Field  Method  Weight                        *
 *              Ca(1S,s2)  0.000  CASPT2  1/6                           *
 *              Ca(3P,sp)  0.000  CASPT2  1/6                           *
 *              Ca+(2S,s)  0.000  CASPT2  1/6                           *
 *              Ca2        0.000  CASPT2  1/2                           *
 *                                                                      *
 * Contraction range: 5s2p - 9s8p6d4f2g                                 *
 * Results(eV)                                                          *
 * Contraction      CASPT2(Ca,1S)    IP     3P                          *
 * DZ: 5s3p        -199.9517166393  5.860  1.888                        *
 * DZP:6s3p2d      -200.0441429964  5.908  1.802                        *
 * TZP:7s4p2d      -200.1181307334  5.965  1.875                        *
 * QZ2P:8s5p4d2f   -200.1519023980  6.015  1.853                        *
 * large:10s9p5d2f -200.1622124207  6.026  1.861                        *
 * Primitive:      -200.1623358166  6.026  1.852                        *
 * Expt.                            6.111  1.892                        *
 *                                                                      *
 * The Ca dimer: CASPT2 results with 4s,4p,5s,5p active (2el/16 orb)    *
 * with and without counterpoise correction (CP).                       *
 * Contraction: 9s8p5d2f                                                *
 * 3p correlated at the CASPT2 level, no level shift, Focktype=G1       *
 *                                                                      *
 * Method:    CAS(no CP) CAS(with CP) PT2(no CP) PT2(with CP)   Expt.   *
 * Re(A)         4.480      4.486       4.435        4.449     4.275    *
 * De(eV)        0.093      0.091       0.114        0.109      0.13    *
 * D0(eV)        0.089      0.088       0.110        0.106              *
 * dG(1/2)(cm-1) 54.80      54.38       54.29        53.27              *
 * Comment: The primitive basis set gives Re=4.535 A, De=0.083 eV.      *
 *          (only 4s,4p active)                                         *
 ************************************************************************
Пробовать и проверять ничего не пришлось. Обратите внимание на расчеты IP и 3P при разной схеме контрактации одних и тех же экспонент. Выигрыш идет просто за счет вариационной свободы. Правда, расчет в полностью расконтрактированном базисе все равно не дотягивает до эксп. значения -- потому что метод был всего лишь CASPT2 (релятивизм учтен, Douglas-Kroll Hamiltonian). Т.е., за счет одного базиса при слабом методе много не вытянешь. Нужно взять сильный метод (т.е., вносящий погрешность во много раз меньшую, чем базис) -- и тестировать базисы на нем. Просто мне кажется (тут могу ошибаться), что Full CI расчет для атома Ca сделать легче с вычислительной точки зрения (параллельность, например), чем CC расчет.
А зачем Зайцевский, если есть U500?
Ну хотя бы для сравнения. Он этими вещами занимается, в его статьях можно данные нарыть.
Я просто предлагаю Вам работать не в отрыве от мировой науки, а посматривать, что в этой области делают другие. И если Вы предложили что-то новое, то сравнить с результатами далеких коллег :)
В общем, я предпочитаю универсальный базис, всё просто и понятно, а не метания по разным методам, базисам и частным случаям, результаты которых потом не будет смысла сравнивать между собой.
А вот это Вы зря: сравнивать надо всегда. Если знать примерную иерархию подходов, то сравнить завсегда можно.
sanya1024 писал(а):Чаще оказывается, что собака зарыта скорее в использованном приближении (функционал, уровень учета корреляции), а базис далеко не на первом месте.
Это в более стандартных задачах.
См. пример с атомом Ca.

Но вообще-то Вы ступаете на скользкий путь :) Если пример привожу я, вы всегда можете сказать: ну, это стандартная задача, а мои задачи такие нестандартные, что там и базисы нужны другие, и методы, и основное уравнение тоже другое, не Шредингера и даже не Дирака. Но надеюсь, Вы до таких аргументов не докатитесь :) а то еще сошлют в антихимию :)
sanya1024 писал(а):Короче, Ваши супер-базисы, видимо, сначала надо тестировать на чем-то очень маленьком и легком, но в Full CI, чтобы свести к минимуму ошибки от неучета корреляции. Потом делать то же самое для атомов потяжелее, но хотя бы со скалярно-релятивистским гамильтонианом, чтобы учесть и релятивизм, и корреляцию. Как-то так...
Примерно так этот базис и разрабатывался.
Ну отлично :)
sanya1024 писал(а):Только там не 500 функций на атом получается, как Вы видели. И не 500 функций на всю молекулу.
Это уже в итоге. А для расчёта исходных функций использовался именно универсальный базис, аналогичный моему.
Стоп. Тогда еще раз.
Для начала берем 500 гауссовых экспонент на атом -- для всех атомов одинаковые, выбранные по каким-то заданным Вами критериям (каким?).
Потом базис каким-то образом оптимизируется, и от 500 для каждого атома остаются, скажем, 20-30-100 гауссовых экспонент. Причем у каждого атома этот набор более-менее индивидуальный. Так?
Но поскольку наборы сильно пересекаются (а у атомов одного периода и вовсе могут совпадать -- так?), то вычислительная экономия достигается за счет большого кол-ва одинаковых функций. Так?
sanya1024 писал(а):Примеры в студию!
Примеры экономии времени, увы, не предоставлю, т.к. код Гауссиана не перепишу. Но алгоритмическая сложность здесь падает, и для достаточно больших систем уменьшение показателя степени перекроет увеличение константы.
Код Гауссиана -- нет, а у американского Гамесса код открытый, можно и переписать. И если что-то замечательное получится, то сможете предложить Гордону и Ко. Или наоборот, сделать свою собственную ветку Гамесса, как это получилось с PCGAMESS/FireFly.
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Вт янв 10, 2012 8:05 am

sanya1024 писал(а):Pt 78, Ir 77, с вычислительной точки зрения никакой разницы.
Это кажется :-)
sanya1024 писал(а):Вот что выдернулось из описания базиса ANO-RCC для Ca:
Ну и где там 20 потенциалов ионизации кальция? А сродство к электрону?
sanya1024 писал(а):Т.е., за счет одного базиса при слабом методе много не вытянешь.
А практика показывает, что порой и DFT достаточно.
sanya1024 писал(а):Я просто предлагаю Вам работать не в отрыве от мировой науки, а посматривать, что в этой области делают другие. И если Вы предложили что-то новое, то сравнить с результатами далеких коллег :)
В общем-то, с этой целью я и создал тут эту ветку. Пробуйте и сравнивайте :-) А то Вы пока критикуете теоретически только :-)
sanya1024 писал(а):Но поскольку наборы сильно пересекаются (а у атомов одного периода и вовсе могут совпадать -- так?), то вычислительная экономия достигается за счет большого кол-ва одинаковых функций. Так?
Конечно, при совпадении некоторых экспонент экономия достигается, но она не столь велика, как в случае идентичности базисов.
sanya1024 писал(а):у американского Гамесса код открытый, можно и переписать.
И у Гамесса не перепишу. Времени нету :-)

Поймите, я ведь вовсе не рекламирую применение U500 где попало. В настоящее время он нужен не так часто. Например, этот базис подойдёт, если нужна высокая точность расчёта окружения какого-нибудь тяжёлого атома. Он же подойдёт для расчёта потенциалов глубокой ионизации разных атомов и сравнения результатов между собой. Подойдёт для тех атомов, для которых создано мало базисов - церий, например. Если Вы сравните U500 с базисом ANO, то увидите, насколько выше точность в U500. Потом, каждая из 500 базисных функций состоит всего из одного гауссиана, поэтому расчёт будет быстрее, чем с 500 "обычных" функций. В конце концов, реализовали же в Гауссиане базис UGBS, а ведь U500 по сравнению с ним заметно лучше :-)

Ну а профит от оптимизации с учётом универсальности базиса будет наблюдаться для очень больших систем из сотен или даже тысяч различных атомов, в т.ч. тяжёлых. Задачи такого масштаба будут решабельны лет через десять, наверное, а появляются они, скажем, при моделировании неорганических аналогов биологических систем.
2^74207281-1 is prime!

starless

Re: Базисный набор U500

Сообщение starless » Вт янв 10, 2012 2:25 pm

Droog_Andrey писал(а):Задачи такого масштаба будут решабельны лет через десять
На чём основано такое предположение? Где затык? К концу года интел обещает майки, собрать на них кластер -- и вперёд и с песней.

Аватара пользователя
sanya1024
Сообщения: 1668
Зарегистрирован: Чт янв 20, 2011 3:24 pm

Re: Базисный набор U500

Сообщение sanya1024 » Вт янв 10, 2012 3:18 pm

Droog_Andrey писал(а):
sanya1024 писал(а):Pt 78, Ir 77, с вычислительной точки зрения никакой разницы.
Это кажется :-)
Не буду спорить, у каждого элемента есть свои тонкости.
sanya1024 писал(а):Вот что выдернулось из описания базиса ANO-RCC для Ca:
Ну и где там 20 потенциалов ионизации кальция? А сродство к электрону?
IP -- это потенциал ионизации. Первый. К-рый, как видите, не очень-то успешно воспроизводится на уровне CASPT2, как ни извращайся с базисом (а Вы видели сам базис ANO-RCC? сколько в нем гауссиан?) 3P -- первая энергия возбуждения (усредненная по 3 подуровням состояния 3P). Сродство к электрону хорошо посчитать еще сложнее.
Данные NIST для сравнения: http://physics.nist.gov/cgi-bin/ASD/energy1.pl и http://webbook.nist.gov/cgi/cbook.cgi?I ... Energetics
sanya1024 писал(а):Т.е., за счет одного базиса при слабом методе много не вытянешь.
А практика показывает, что порой и DFT достаточно.
В большинстве случаев это компенсация ошибок. Либо требуется "химическая точность", для к-рой ошибки метода DFT несущественны. Но тут дело вкуса: либо добиваться удачной компенсации ошибок в простом методе (без гарантии, что в нестандартном случае не получится бессмыслица), либо использовать иерархию подходов, учитывающих по степени важности разные эффекты.
sanya1024 писал(а):Я просто предлагаю Вам работать не в отрыве от мировой науки, а посматривать, что в этой области делают другие. И если Вы предложили что-то новое, то сравнить с результатами далеких коллег :)
В общем-то, с этой целью я и создал тут эту ветку. Пробуйте и сравнивайте :-) А то Вы пока критикуете теоретически только :-)
Ну так я теоретик :) А работа теоретика как раз и состоит в том, чтобы, увидев грабли, сказать: это грабли, не наступайте. А настоящий практик, наверное, убеждается, что это грабли, только получив по лбу, иначе он не практик :)
Конечно, при совпадении некоторых экспонент экономия достигается, но она не столь велика, как в случае идентичности базисов.
Но основной принцип устройства Ваших базисов я правильно поняла? Похоже, все-таки неправильно. Потому что по Вашей ссылке я вижу один набор -- общий для всех атомов. Это означает, что при попытке засунуть его в расчет для воды мы действительно получим матрицу 1500х1500 (да, там будут большие одинаковые блоки). Дальше, в процессе самосогласования мы получим в матрице огромное количество нулей (ну, почти нулей), потому что бОльшая часть этих экспонент в молекуле H2O не нужна. И хотя квантовохимические программы приспособлены работать с такими матрицами, эта может оказаться программе не по зубам.

Подготовить инпут для FireFly оказалось делом не 5 минут. Теперь можно тестировать:

Код: Выделить всё

 $CONTRL SCFTYP=RHF MAXIT=200 itol=40 icut=12 inttyp=hondo  
  ICHARG=0 MULT=1 RUNTYP=ENERGY
  fstint=.t. gencon=.t. d5=.t. 
  COORD=UNIQUE EXETYP=run $END
 $SYSTEM TIMLIM=360000 MWORDS=200 $END
 $SCF DIRSCF=.TRUE. soscf=.f. $END
 $DATA
 H2O
C1
OXYGEN      8.0     -1.182293022         0.000000000        -2.211853375
S  1
1  134217728.00000000000  1.0
S  1
1   67108864.00000000000  1.0
S  1
1   33554432.00000000000  1.0
S  1
1   16777216.00000000000  1.0
S  1
1    8388608.00000000000  1.0
S  1
1    4194304.00000000000  1.0
S  1
1    2097152.00000000000  1.0
S  1
1    1048576.00000000000  1.0
S  1
1     524288.00000000000  1.0
S  1
1     262144.00000000000  1.0
S  1
1     131072.00000000000  1.0
S  1
1      65536.00000000000  1.0
S  1
1      32768.00000000000  1.0
S  1
1      16384.00000000000  1.0
S  1
1       8192.00000000000  1.0
S  1
1       4096.00000000000  1.0
S  1
1       2048.00000000000  1.0
S  1
1       1024.00000000000  1.0
S  1
1        512.00000000000  1.0
S  1
1        256.00000000000  1.0
S  1
1        128.00000000000  1.0
S  1
1         64.00000000000  1.0
S  1
1         32.00000000000  1.0
S  1
1         16.00000000000  1.0
S  1
1          8.00000000000  1.0
S  1
1          4.00000000000  1.0
S  1
1          2.00000000000  1.0
S  1
1          1.00000000000  1.0
S  1
1          0.50000000000  1.0
S  1
1          0.25000000000  1.0
S  1
1          0.12500000000  1.0
S  1
1          0.06250000000  1.0
S  1
1          0.03125000000  1.0
S  1
1          0.01562500000  1.0
S  1
1          0.00781250000  1.0
S  1
1          0.00390625000  1.0
S  1
1          0.00195312500  1.0
S  1
1          0.00097656250  1.0
S  1
1          0.00048828125  1.0
P  1
1   33554432.00000000000  1.0
P  1
1   16777216.00000000000  1.0
P  1
1    8388608.00000000000  1.0
P  1
1    4194304.00000000000  1.0
P  1
1    2097152.00000000000  1.0
P  1
1    1048576.00000000000  1.0
P  1
1     524288.00000000000  1.0
P  1
1     262144.00000000000  1.0
P  1
1     131072.00000000000  1.0
P  1
1      65536.00000000000  1.0
P  1
1      32768.00000000000  1.0
P  1
1      16384.00000000000  1.0
P  1
1       8192.00000000000  1.0
P  1
1       4096.00000000000  1.0
P  1
1       2048.00000000000  1.0
P  1
1       1024.00000000000  1.0
P  1
1        512.00000000000  1.0
P  1
1        256.00000000000  1.0
P  1
1        128.00000000000  1.0
P  1
1         64.00000000000  1.0
P  1
1         32.00000000000  1.0
P  1
1         16.00000000000  1.0
P  1
1          8.00000000000  1.0
P  1
1          4.00000000000  1.0
P  1
1          2.00000000000  1.0
P  1
1          1.00000000000  1.0
P  1
1          0.50000000000  1.0
P  1
1          0.25000000000  1.0
P  1
1          0.12500000000  1.0
P  1
1          0.06250000000  1.0
P  1
1          0.03125000000  1.0
P  1
1          0.01562500000  1.0
P  1
1          0.00781250000  1.0
P  1
1          0.00390625000  1.0
P  1
1          0.00195312500  1.0
P  1
1          0.00097656250  1.0
P  1
1          0.00048828125  1.0
D  1
1     131072.0000000  1.0
D  1
1      65536.0000000  1.0
D  1
1      32768.0000000  1.0
D  1
1      16384.0000000  1.0
D  1
1       8192.0000000  1.0
D  1
1       4096.0000000  1.0
D  1
1       2048.0000000  1.0
D  1
1       1024.0000000  1.0
D  1
1        512.0000000  1.0
D  1
1        256.0000000  1.0
D  1
1        128.0000000  1.0
D  1
1         64.0000000  1.0
D  1
1         32.0000000  1.0
D  1
1         16.0000000  1.0
D  1
1          8.0000000  1.0
D  1
1          4.0000000  1.0
D  1
1          2.0000000  1.0
D  1
1          1.0000000  1.0
D  1
1          0.5000000  1.0
D  1
1          0.2500000  1.0
D  1
1          0.1250000  1.0
D  1
1          0.0625000  1.0
D  1
1          0.0312500  1.0
D  1
1          0.0156250  1.0
D  1
1          0.0078125  1.0
F  1
1       4096.00000  1.0
F  1
1       2048.00000  1.0
F  1
1       1024.00000  1.0
F  1
1        512.00000  1.0
F  1
1        256.00000  1.0
F  1
1        128.00000  1.0
F  1
1         64.00000  1.0
F  1
1         32.00000  1.0
F  1
1         16.00000  1.0
F  1
1          8.00000  1.0
F  1
1          4.00000  1.0
F  1
1          2.00000  1.0
F  1
1          1.00000  1.0
F  1
1          0.50000  1.0
F  1
1          0.25000  1.0
F  1
1          0.12500  1.0
F  1
1          0.06250  1.0
F  1
1          0.03125  1.0
G  1
1         64.0000  1.0
G  1
1         32.0000  1.0
G  1
1         16.0000  1.0
G  1
1          8.0000  1.0
G  1
1          4.0000  1.0
G  1
1          2.0000  1.0
G  1
1          1.0000  1.0
G  1
1          0.5000  1.0
G  1
1          0.2500  1.0
G  1
1          0.1250  1.0
G  1
1          0.0625  1.0

HYDROGEN    1.0     -1.182293022         0.759337000        -1.615810375
S  1
1  134217728.00000000000  1.0
S  1
1   67108864.00000000000  1.0
S  1
1   33554432.00000000000  1.0
S  1
1   16777216.00000000000  1.0
S  1
1    8388608.00000000000  1.0
S  1
1    4194304.00000000000  1.0
S  1
1    2097152.00000000000  1.0
S  1
1    1048576.00000000000  1.0
S  1
1     524288.00000000000  1.0
S  1
1     262144.00000000000  1.0
S  1
1     131072.00000000000  1.0
S  1
1      65536.00000000000  1.0
S  1
1      32768.00000000000  1.0
S  1
1      16384.00000000000  1.0
S  1
1       8192.00000000000  1.0
S  1
1       4096.00000000000  1.0
S  1
1       2048.00000000000  1.0
S  1
1       1024.00000000000  1.0
S  1
1        512.00000000000  1.0
S  1
1        256.00000000000  1.0
S  1
1        128.00000000000  1.0
S  1
1         64.00000000000  1.0
S  1
1         32.00000000000  1.0
S  1
1         16.00000000000  1.0
S  1
1          8.00000000000  1.0
S  1
1          4.00000000000  1.0
S  1
1          2.00000000000  1.0
S  1
1          1.00000000000  1.0
S  1
1          0.50000000000  1.0
S  1
1          0.25000000000  1.0
S  1
1          0.12500000000  1.0
S  1
1          0.06250000000  1.0
S  1
1          0.03125000000  1.0
S  1
1          0.01562500000  1.0
S  1
1          0.00781250000  1.0
S  1
1          0.00390625000  1.0
S  1
1          0.00195312500  1.0
S  1
1          0.00097656250  1.0
S  1
1          0.00048828125  1.0
P  1
1   33554432.00000000000  1.0
P  1
1   16777216.00000000000  1.0
P  1
1    8388608.00000000000  1.0
P  1
1    4194304.00000000000  1.0
P  1
1    2097152.00000000000  1.0
P  1
1    1048576.00000000000  1.0
P  1
1     524288.00000000000  1.0
P  1
1     262144.00000000000  1.0
P  1
1     131072.00000000000  1.0
P  1
1      65536.00000000000  1.0
P  1
1      32768.00000000000  1.0
P  1
1      16384.00000000000  1.0
P  1
1       8192.00000000000  1.0
P  1
1       4096.00000000000  1.0
P  1
1       2048.00000000000  1.0
P  1
1       1024.00000000000  1.0
P  1
1        512.00000000000  1.0
P  1
1        256.00000000000  1.0
P  1
1        128.00000000000  1.0
P  1
1         64.00000000000  1.0
P  1
1         32.00000000000  1.0
P  1
1         16.00000000000  1.0
P  1
1          8.00000000000  1.0
P  1
1          4.00000000000  1.0
P  1
1          2.00000000000  1.0
P  1
1          1.00000000000  1.0
P  1
1          0.50000000000  1.0
P  1
1          0.25000000000  1.0
P  1
1          0.12500000000  1.0
P  1
1          0.06250000000  1.0
P  1
1          0.03125000000  1.0
P  1
1          0.01562500000  1.0
P  1
1          0.00781250000  1.0
P  1
1          0.00390625000  1.0
P  1
1          0.00195312500  1.0
P  1
1          0.00097656250  1.0
P  1
1          0.00048828125  1.0
D  1
1     131072.0000000  1.0
D  1
1      65536.0000000  1.0
D  1
1      32768.0000000  1.0
D  1
1      16384.0000000  1.0
D  1
1       8192.0000000  1.0
D  1
1       4096.0000000  1.0
D  1
1       2048.0000000  1.0
D  1
1       1024.0000000  1.0
D  1
1        512.0000000  1.0
D  1
1        256.0000000  1.0
D  1
1        128.0000000  1.0
D  1
1         64.0000000  1.0
D  1
1         32.0000000  1.0
D  1
1         16.0000000  1.0
D  1
1          8.0000000  1.0
D  1
1          4.0000000  1.0
D  1
1          2.0000000  1.0
D  1
1          1.0000000  1.0
D  1
1          0.5000000  1.0
D  1
1          0.2500000  1.0
D  1
1          0.1250000  1.0
D  1
1          0.0625000  1.0
D  1
1          0.0312500  1.0
D  1
1          0.0156250  1.0
D  1
1          0.0078125  1.0
F  1
1       4096.00000  1.0
F  1
1       2048.00000  1.0
F  1
1       1024.00000  1.0
F  1
1        512.00000  1.0
F  1
1        256.00000  1.0
F  1
1        128.00000  1.0
F  1
1         64.00000  1.0
F  1
1         32.00000  1.0
F  1
1         16.00000  1.0
F  1
1          8.00000  1.0
F  1
1          4.00000  1.0
F  1
1          2.00000  1.0
F  1
1          1.00000  1.0
F  1
1          0.50000  1.0
F  1
1          0.25000  1.0
F  1
1          0.12500  1.0
F  1
1          0.06250  1.0
F  1
1          0.03125  1.0
G  1
1         64.0000  1.0
G  1
1         32.0000  1.0
G  1
1         16.0000  1.0
G  1
1          8.0000  1.0
G  1
1          4.0000  1.0
G  1
1          2.0000  1.0
G  1
1          1.0000  1.0
G  1
1          0.5000  1.0
G  1
1          0.2500  1.0
G  1
1          0.1250  1.0
G  1
1          0.0625  1.0

HYDROGEN    1.0     -1.182293022        -0.759337000        -1.615810375
S  1
1  134217728.00000000000  1.0
S  1
1   67108864.00000000000  1.0
S  1
1   33554432.00000000000  1.0
S  1
1   16777216.00000000000  1.0
S  1
1    8388608.00000000000  1.0
S  1
1    4194304.00000000000  1.0
S  1
1    2097152.00000000000  1.0
S  1
1    1048576.00000000000  1.0
S  1
1     524288.00000000000  1.0
S  1
1     262144.00000000000  1.0
S  1
1     131072.00000000000  1.0
S  1
1      65536.00000000000  1.0
S  1
1      32768.00000000000  1.0
S  1
1      16384.00000000000  1.0
S  1
1       8192.00000000000  1.0
S  1
1       4096.00000000000  1.0
S  1
1       2048.00000000000  1.0
S  1
1       1024.00000000000  1.0
S  1
1        512.00000000000  1.0
S  1
1        256.00000000000  1.0
S  1
1        128.00000000000  1.0
S  1
1         64.00000000000  1.0
S  1
1         32.00000000000  1.0
S  1
1         16.00000000000  1.0
S  1
1          8.00000000000  1.0
S  1
1          4.00000000000  1.0
S  1
1          2.00000000000  1.0
S  1
1          1.00000000000  1.0
S  1
1          0.50000000000  1.0
S  1
1          0.25000000000  1.0
S  1
1          0.12500000000  1.0
S  1
1          0.06250000000  1.0
S  1
1          0.03125000000  1.0
S  1
1          0.01562500000  1.0
S  1
1          0.00781250000  1.0
S  1
1          0.00390625000  1.0
S  1
1          0.00195312500  1.0
S  1
1          0.00097656250  1.0
S  1
1          0.00048828125  1.0
P  1
1   33554432.00000000000  1.0
P  1
1   16777216.00000000000  1.0
P  1
1    8388608.00000000000  1.0
P  1
1    4194304.00000000000  1.0
P  1
1    2097152.00000000000  1.0
P  1
1    1048576.00000000000  1.0
P  1
1     524288.00000000000  1.0
P  1
1     262144.00000000000  1.0
P  1
1     131072.00000000000  1.0
P  1
1      65536.00000000000  1.0
P  1
1      32768.00000000000  1.0
P  1
1      16384.00000000000  1.0
P  1
1       8192.00000000000  1.0
P  1
1       4096.00000000000  1.0
P  1
1       2048.00000000000  1.0
P  1
1       1024.00000000000  1.0
P  1
1        512.00000000000  1.0
P  1
1        256.00000000000  1.0
P  1
1        128.00000000000  1.0
P  1
1         64.00000000000  1.0
P  1
1         32.00000000000  1.0
P  1
1         16.00000000000  1.0
P  1
1          8.00000000000  1.0
P  1
1          4.00000000000  1.0
P  1
1          2.00000000000  1.0
P  1
1          1.00000000000  1.0
P  1
1          0.50000000000  1.0
P  1
1          0.25000000000  1.0
P  1
1          0.12500000000  1.0
P  1
1          0.06250000000  1.0
P  1
1          0.03125000000  1.0
P  1
1          0.01562500000  1.0
P  1
1          0.00781250000  1.0
P  1
1          0.00390625000  1.0
P  1
1          0.00195312500  1.0
P  1
1          0.00097656250  1.0
P  1
1          0.00048828125  1.0
D  1
1     131072.0000000  1.0
D  1
1      65536.0000000  1.0
D  1
1      32768.0000000  1.0
D  1
1      16384.0000000  1.0
D  1
1       8192.0000000  1.0
D  1
1       4096.0000000  1.0
D  1
1       2048.0000000  1.0
D  1
1       1024.0000000  1.0
D  1
1        512.0000000  1.0
D  1
1        256.0000000  1.0
D  1
1        128.0000000  1.0
D  1
1         64.0000000  1.0
D  1
1         32.0000000  1.0
D  1
1         16.0000000  1.0
D  1
1          8.0000000  1.0
D  1
1          4.0000000  1.0
D  1
1          2.0000000  1.0
D  1
1          1.0000000  1.0
D  1
1          0.5000000  1.0
D  1
1          0.2500000  1.0
D  1
1          0.1250000  1.0
D  1
1          0.0625000  1.0
D  1
1          0.0312500  1.0
D  1
1          0.0156250  1.0
D  1
1          0.0078125  1.0
F  1
1       4096.00000  1.0
F  1
1       2048.00000  1.0
F  1
1       1024.00000  1.0
F  1
1        512.00000  1.0
F  1
1        256.00000  1.0
F  1
1        128.00000  1.0
F  1
1         64.00000  1.0
F  1
1         32.00000  1.0
F  1
1         16.00000  1.0
F  1
1          8.00000  1.0
F  1
1          4.00000  1.0
F  1
1          2.00000  1.0
F  1
1          1.00000  1.0
F  1
1          0.50000  1.0
F  1
1          0.25000  1.0
F  1
1          0.12500  1.0
F  1
1          0.06250  1.0
F  1
1          0.03125  1.0
G  1
1         64.0000  1.0
G  1
1         32.0000  1.0
G  1
1         16.0000  1.0
G  1
1          8.0000  1.0
G  1
1          4.0000  1.0
G  1
1          2.0000  1.0
G  1
1          1.0000  1.0
G  1
1          0.5000  1.0
G  1
1          0.2500  1.0
G  1
1          0.1250  1.0
G  1
1          0.0625  1.0

 $END
Успела прогнать check, вот результат:

Код: Выделить всё

 *** FATAL ERROR ***
 THE INPUT BASIS SET CONTAINS A LINEAR DEPENDENCE.
 INPUT BASIS DIMENSION=  1935   SALC DIMENSION=  1935
 THE SMALLEST EIGENVALUE OF THE OVERLAP MATRIX IS   1.141046E-12
 THERE ARE   13 EIGENVALUES LESS THAN  1.00E-10
 THE NUMBER OF LINEARLY INDEPENDENT ORBITALS KEPT IS 1922

 IF THERE ARE ANY SMALL EIGENVALUES:
 CHECK YOUR OUTPUT FILE FOR DUPLICATE ATOMIC COORDINATES, OR
 FOR DUPLICATE BASIS FUNCTIONS, OR FOR ZERO CONTRACTIONS
 COEFFICIENTS, IF FOUND, THEN RESUBMIT THIS JOB.  OTHERWISE,
 IF THE LINEAR DEPENDENCE IS A RESULT OF USING MANY DIFFUSE
 BASIS FUNCTIONS, YOU ARE OUT OF LUCK, THE SCF NEVER WILL
 CONVERGE WITH THIS DEGREE OF LINEAR DEPENDENCE

 IF THE SALC SPACE DOES NOT MATCH THE INPUT BASIS DIMENSION:
 CHECK TO BE SURE YOU SCRUPULOUSLY FOLLOWED THE CONVENTION
 FOR AXIS ORIENTATION IN $DATA (ESP. PERPENDICULAR C2 AXES)
 AND THEN RESUBMIT THIS JOB.
Линейная зависимость базиса. И это при настройках itol=40 icut=12 inttyp=hondo. Похоже, не лечится.
И у Гамесса не перепишу. Времени нету :-)
А Вы думаете, у других есть время тестировать Ваши базисы? не обижайтесь, но повар должен первым попробовать свою стряпню.
Поймите, я ведь вовсе не рекламирую применение U500 где попало. В настоящее время он нужен не так часто. Например, этот базис подойдёт, если нужна высокая точность расчёта окружения какого-нибудь тяжёлого атома. Он же подойдёт для расчёта потенциалов глубокой ионизации разных атомов и сравнения результатов между собой. Подойдёт для тех атомов, для которых создано мало базисов - церий, например. Если Вы сравните U500 с базисом ANO, то увидите, насколько выше точность в U500. Потом, каждая из 500 базисных функций состоит всего из одного гауссиана, поэтому расчёт будет быстрее, чем с 500 "обычных" функций. В конце концов, реализовали же в Гауссиане базис UGBS, а ведь U500 по сравнению с ним заметно лучше :-)
Все-таки тестировать надо на стандартных системах, чтобы было с чем сравнивать. Пока, как видите, даже запустить расчет не удается, все упирается в линейную зависимость. Может, Вы по аналогии подготовите примерчик для GAMESS/FireFly? я б его на кластере прогнала.

И еще раз повторю: для тяжелых атомов все ухищрения с базисами имеют смысл только при учете (скалярного) релятивизма. Иначе это толчение воды в ступе и изучение сферических коней в вакууме.
Ну а профит от оптимизации с учётом универсальности базиса будет наблюдаться для очень больших систем из сотен или даже тысяч различных атомов, в т.ч. тяжёлых. Задачи такого масштаба будут решабельны лет через десять, наверное, а появляются они, скажем, при моделировании неорганических аналогов биологических систем.
Поглядим-с :)
Вот и вся моя работа. Стеречь ребят над пропастью во ржи. (Дж. Д. Сэлинджер)

Аватара пользователя
Droog_Andrey
Сообщения: 2670
Зарегистрирован: Сб сен 29, 2007 8:29 pm
Контактная информация:

Re: Базисный набор U500

Сообщение Droog_Andrey » Вт янв 10, 2012 8:23 pm

starless писал(а):На чём основано такое предположение?
На наблюдениях за ростом производительности в течение последних 10 лет.
sanya1024 писал(а):а Вы видели сам базис ANO-RCC? сколько в нем гауссиан?
Обалдеть. Разумеется, видел.
sanya1024 писал(а):Данные NIST для сравнения
Мне хорошо известны экспериментальные данные по ионизации, сродству к электрону, поляризуемости атомов.

Странно как-то Вы ведёте разговор. Я вообще-то не студент, и если говорю о чём-то, то немного разбираюсь в этом. Например, заявления вроде
sanya1024 писал(а):Уверяю Вас, ничего хорошего не выйдет.
я бы делал, лишь убедившись на практике, что ничего хорошего не выйдет.
sanya1024 писал(а):В большинстве случаев это компенсация ошибок.
Посчитайте поляризуемости атомов хотя бы первых трёх периодов и убедитесь в обратном.
sanya1024 писал(а):Ну так я теоретик :) А работа теоретика как раз и состоит в том, чтобы, увидев грабли, сказать: это грабли, не наступайте. А настоящий практик, наверное, убеждается, что это грабли, только получив по лбу, иначе он не практик :)
Ну пока счёт не в Вашу пользу ;-)
sanya1024 писал(а):И хотя квантовохимические программы приспособлены работать с такими матрицами, эта может оказаться программе не по зубам.
Ну так это проблемы программы :-)
sanya1024 писал(а):А Вы думаете, у других есть время тестировать Ваши базисы? не обижайтесь, но повар должен первым попробовать свою стряпню.
Я этот базис уже протестировал достаточно глубоко, и продолжаю это делать по возможности. Я не требую от окружающих выполнять работу тестеров, я просто поделился результатами своей работы, потому что думаю, что здесь найдутся практики, которым этот базисный набор поможет.
sanya1024 писал(а):Может, Вы по аналогии подготовите примерчик для GAMESS/FireFly? я б его на кластере прогнала.
Пока вроде мне хватает гауссиана на домашнем компе. Сейчас вот, например, обсчитывается молекула CUO, где для атомов углерода и кислорода взят базис cc-pVTZ, а для атома урана - U500.
sanya1024 писал(а):И еще раз повторю: для тяжелых атомов все ухищрения с базисами имеют смысл только при учете (скалярного) релятивизма. Иначе это толчение воды в ступе и изучение сферических коней в вакууме.
Зачем столько раз повторять очевидные вещи?
2^74207281-1 is prime!

starless

Re: Базисный набор U500

Сообщение starless » Вт янв 10, 2012 8:33 pm

Droog_Andrey писал(а):
starless писал(а):На чём основано такое предположение?
На наблюдениях за ростом производительности в течение последних 10 лет.
Поподробнее, пожалуйста. Производительность -- далеко не единственная характеристика ЭВМ.
Droog_Andrey писал(а):Я не требую от окружающих выполнять работу тестеров, я просто поделился результатами своей работы, потому что думаю, что здесь найдутся практики, которым этот базисный набор поможет.
Он не поможет практикам, пока его валидация не будет опубликована.

Ответить

Вернуться в «квантовая химия и моделирование»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 7 гостей