Я вас сегодня вопросами замучаю :))
Я вас сегодня вопросами замучаю :))
Итак, еще один:
Предполагается написать ядро поискового скрипта а-ля Яндекс, только для химического сегмента Интернета. Для поиска будет производиться индексация сайтов из каталогов Химического портала.
Внимание, вопрос: какими функциями должен обладать такой скрипт на Ваш взгляд. Какую информацию он должен выдавать в результате поиска?
Предполагается написать ядро поискового скрипта а-ля Яндекс, только для химического сегмента Интернета. Для поиска будет производиться индексация сайтов из каталогов Химического портала.
Внимание, вопрос: какими функциями должен обладать такой скрипт на Ваш взгляд. Какую информацию он должен выдавать в результате поиска?
although we appreciate diversity in our company being conservative we cannot accept any unexpected efforts to reach one's cbrtkm
Какая штука? Коперник - это просто надстройка для метапоиска, разве нет? Я понимал вопрос иначе, а именно: как наладить поиск с использованием химической специфики искомой инфы? Тут так: никак, задача слишком огромна. Химичность скрипта предполагает поиск по брутто-формуле, SMILES-строке, структурной формуле в формате какой-нибудь из популярных рисовалок, параметрам ячейки, ещё какой-нибудь лабуде. Всё это сложно. И всё реализовано, но во-первых, порознь, а во-вторых, в дорогих коммерческих базах данных.
Ну конечно, со структурками и отнесением. Я где-то читал что химики подругому думают им рисуночки страсть как нужны. И занятия математикой им вредны, так же как и политологией и психологией с педагогикой. А военка - вообще смерть для химика.Serge писал(а):а это что такое? имеется в виду база спектров?
я ж серьезно спрашиваю..

Кем предполагается? Яндекс - штука совсем серьёзная. Один бог знает, как искать в инете файлы специальных химических форматов, распознавать их и сравнивать.
Как первый шаг к охимичиванию поискового скрипта, он должен парсить просто текст и выцеплять из него токены, которые похожи на химические названия или химические формулы. Эти складывать отдельно.
Как первый шаг к охимичиванию поискового скрипта, он должен парсить просто текст и выцеплять из него токены, которые похожи на химические названия или химические формулы. Эти складывать отдельно.
Ну в частности да, спектры бывают полезны...
Кстати, третьекурснички, радуйтесь: вот здесь можно быстро и бесплатно идентифицировать ваше соединение:
http://www.aist.go.jp/RIODB/SDBS/sdbs/o ... _frame_sea
Инструкция по пользованию проста: вводите все что известно, нажимаете Query и наслаждаетесь
Есть 1Н и 13С спектры...
Если есть еще вопросы - пишите...
А на счет вопроса... Не знаю, может быть что-нибудь подобное тому, что сделано в E-library...?
Really, I don't know...
Кстати, третьекурснички, радуйтесь: вот здесь можно быстро и бесплатно идентифицировать ваше соединение:
http://www.aist.go.jp/RIODB/SDBS/sdbs/o ... _frame_sea
Инструкция по пользованию проста: вводите все что известно, нажимаете Query и наслаждаетесь

Если есть еще вопросы - пишите...
А на счет вопроса... Не знаю, может быть что-нибудь подобное тому, что сделано в E-library...?
Really, I don't know...
Последний раз редактировалось Lust Вт окт 14, 2003 9:29 pm, всего редактировалось 2 раза.
Lust, оченно забавную сцылку ты прислал. Однако ж, насколько видно, те же ЯМР'ы ограничены там пятью пиками. Довольно жалобно. Отсюда вопрос к присутсвующим. Нельзя ли организовать нечто подобное, только не через веб-интерфейс и с нормальным числом пиков? Ибо это было бы полезно и востребовано. Просто я в программизме не секу ваще.
Те, кто уцелеют, расскажут, как всё было замечательно.
Дело не в третьем курсе, такая прога нужна в принципе, для работы. А спектры, которые дают на третьем курсе в обычных группах не требуют большого приложения мозгов.
Хотя я тут лоханулся не по детски давеча на простейшем спектре




Необходимость преодоления собственного интеллектуального ничтожества есть необходимое и достаточное ограничение в доступе к научной информации
Касаемо поиска... Мне кажется уместным искать по названиям. Возможно, общепринятым (читать как "включая тривиальные, номенклатурные и прочие") Но заковырка вся в том, что названий всяких просто немерено... На мой взгляд, в таком случае проще ссделать поиск по всем словам, но только на химических сайтах.

А ты зайди на сайтик www.sigmaaldrich.com, зарегистрируйся и поищи компаундов - там очень часто дают этого комаунда ЯМР. Вполне можно накачать эталонных спектров. Знаю в ИОХ есть база, но насколько она под РС - не знаю.ИСН писал(а):Мало сечь в программировании, надо иметь под рукой недетскую базу спектров, а её на халяву не даст никто. Если же купить, то (не знаю ситуации конкретно с ЯМР спектрами, но предполагаю так) с ней же продаются средства поиска.
to Матроскин: речь о том, что я не могу представить способа автоматического выдёргивания тривиальных химических названий из текста, так что поиск по ним - то же самое, что поиск по всем вообще словам, как в Яндексе. Химические же формулы могут быть охвачены простым регэксом вроде
/(((H|He|Li|Be|B|C|и так далее все остальные)[0-9]*)+)\s/
to Dima_K: спасибо, зашёл бы, если бы было надо. Но одно дело надёргать руками 20 - 100 эталонных спектров, а другое дело - база на десятки тысяч соединений, так? (Речь исключительно внешнего наблюдателя, ибо я ни малейшего отношения к ЯМР не имею).
/(((H|He|Li|Be|B|C|и так далее все остальные)[0-9]*)+)\s/
to Dima_K: спасибо, зашёл бы, если бы было надо. Но одно дело надёргать руками 20 - 100 эталонных спектров, а другое дело - база на десятки тысяч соединений, так? (Речь исключительно внешнего наблюдателя, ибо я ни малейшего отношения к ЯМР не имею).
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 237 гостей